2016年12月01日 星期四
人类,我想和你谈一谈
语音技术推动人工智能走向产业化
电影《她》剧照

    文·本报记者 刘园园

    未来人与机器之间到底可以多亲密?会像电影《她》中一样,孤单时可以找自己的“萨曼莎”谈谈心、聊聊天吗?或许,这样的未来,正向我们走来。

    作为演讲嘉宾,中国移动通信集团公司副总裁李正茂上台之前有点“纠结”:他准备了一个讲话稿,但犹豫要不要掏出来。

    因为在距他几米远的地方,人工智能系统只要把他的讲话稿扫描一下,就可以用与播音员相媲美的普通话声情并茂地将它念出来。“比我的四川普通话强多了。”为了不被机器人比下去,李正茂决定,还是即兴演讲。

    这是上周国内人工智能企业科大讯飞年度发布会上发生的一幕。可以预见的是,随着人工智能技术的发展,不单是李正茂这样的企业高管,每一个普通人的生活细节都将悄然而变。而这种改变,或许会先从“说话”开始。

    “我”说话像你,还更懂你

    在科幻电影《她》中,感情失意的西奥多恋上了人工智能系统“萨曼莎”。它用沙哑磁性的嗓音随时随地与西奥多谈心聊天,用语言交流填补了西奥多的感情空白。

    如今,这部2013年上映的电影看起来已不再那么“科幻”,因为其中展现的智能语音技术已部分成为现实。

    早在2010年,苹果公司就在其iPhone手机中应用了语音助手Siri。几年来,Siri不断升级换代,只是依然会被人嫌弃声音有点“冷冰冰”。

    为了解决这个问题,据报道,苹果公司专门成立了一个研究团队,他们的主要任务就是让Siri听起来更加“有血有肉”,而不是一个机器人。在这方面,国内企业也取得了不少突破,甚至可以实现让机器人拥有像“萨曼莎”一样个性的声音。

    “以后我们的手机可以应用最新的人工智能技术,给大家带来更好的体验。”在科大讯飞的年度发布会上,人工智能系统用锤子科技CEO罗永浩独特的声线讲起话来,令坐在嘉宾席的罗永浩忍俊不禁,同时也迷惑了不少参会者:刚才说话的到底是不是罗永浩本人啊?

    除了让机器人拥有和人一样的声音,我们更期待机器人能够听懂我们在说什么。而这对人工智能来说,或许只能算一个“小目标”了。

    科大讯飞董事长刘庆峰介绍,在今年的国际语音识别大赛CHiME中,科大讯飞可以在噪音环境下实现97%以上的语音识别率。不但如此,人工智能还可以突破语言的隔阂,将识别出的语音实时翻译成其他语言。“以前国际性的机器翻译大赛,汉译英方面是日本研究机构全球第一,英译汉方面是美国研究机构全球第一,2014年科大讯飞同时拿下了两项第一。”

    “我”的眼中只有你

    继鼠标、键盘、触摸屏之后,智能语音技术的出现让人与机器之间可以通过最自然的“对话”搭起沟通的桥梁。当然,这种“对话”不仅仅发生在人与手机语音助手之间。

    “随着万物互联时代的到来,以语音为主、键盘触摸为辅的人机交互正逐渐成为刚需。”在刘庆峰看来,未来5到10年人工智能会像水和电一样成为人们生活的必需品,深刻改变世界。

    连海底捞餐饮股份有限公司董事长张勇都在考虑,能否借助智能语音交互,让海底捞的服务更加个性化。“比如如果有顾客说出口味要求,可以通过人工智能系统瞬间将这一要求传到系统。”张勇坚信,未来要想让海底捞的口味更加个性化、工作效率更高,“一定离不开人工智能”。

    如果说餐饮业还在探索的话,其他领域的革命已经开始。

    坐在车里,基于语音交互的智能车载系统可以让你动口不动手,通过与汽车“对话”来轻松实现打电话、导航、播放音乐等一系列通讯和娱乐服务。回到家中,只要一句话,智能音箱就可以帮你打开台灯、拉上窗帘、调高空调温度——这不是想象,很快它还可以与电商连接,成为你网购的入口。去银行买理财产品,金融客服机器人可以通过流畅的语音交互为你提供金融产品的购买咨询服务。

    与近距离使用手机相比,各行各业丰富的使用场景为语音交互带来了各种挑战,也促使技术不断迭代升级。过去,人与机器之间的对话只能发生在很近的距离,环境要十分安静,而且多是人向机器吩咐固定的语音指令,词汇上稍有改变,机器人便无法识别。现在情况已经完全不同。以科大讯飞年度发布会展示的智能车载系统“飞鱼”为例,它可在噪音环境下精确地将口语化的地名如“北大”识别为“北京大学”,不需多次唤醒就能与人进行多轮自然对话,而且支持随意打断。

    “最重要的是在交互过程中,实现远场识别、噪音环境下的语音识别、多人对话环境下语音识别。”刘庆峰认为,这些“黑科技”是将语音技术深度融入产业应用的必经之路。

    “我”将走进你的生活

    今年年初,《麻省理工技术评论》杂志曾将语音接口评为“2016年十大突破技术”之一。回顾即将接近尾声的2016年,无论从技术突破还是从产业应用来看,此预言都已成真。

    智能语音技术已成为备受瞩目的“香饽饽”。科大讯飞轮值总裁胡郁介绍,科大讯飞的AIUI人机交互系统目前拥有超过3000家合作伙伴,这些合作厂商已经推出1000多种各式各样的产品,音箱、台灯、机器人、各种家电产品应有尽有。

    不过,正所谓英雄所见略同,这块“香饽饽”已经成为国内外科技巨头共同争抢的市场高地。

    亚马逊在2014年就低调推出了智能音箱Amazon Echo;今年5月,谷歌在其发布会上推出语音智能助手Google Assistant,并在10月推出智能音箱Goole Home;有报道称,三星计划在明年3月推出的Galaxy S8手机中搭载人工智能语音平台Viv,与苹果的Siri竞争。国内企业也铆足了劲,百度总裁张亚勤在接受媒体采访时表示,百度正在研究将人工智能技术应用于医疗领域,提高医患交流效率。

    国际知名市场调研公司发布的报告认为,全球语音市场在未来5年仍将维持显著增长,到2020年全球语音市场规模预计将达到约190亿美元。

    “人工智能产业已迎来第三次发展浪潮,”在刘庆峰看来,中国企业应紧紧抓住这次产业机遇:“因为未来谁掌握了人工智能产业的主导权,谁就将拥有全球话语权。”

    而作为普通人,人们更关心的则是,未来人与机器之间的对话到底可以多亲密?会像电影《她》中一样,孤单时可以找自己的“萨曼莎”谈谈心、聊聊天吗?或许,这样的未来,正向我们走来。

京ICP备06005116