2016年07月25日 星期一
车载智能语音,从点缀到刚需

■今日头条

文·本报记者 刘园园

    开车时也是各种娱乐和信息服务需求最旺盛的时候:想问路、想听歌、想听新闻、想看天气、想搜车票和机票……通常,开车族实现这些需求的方法是“手忙脚乱”:腾出手来戳这戳那,时不时还要急躁地向车里其他人求救——“帮我搜一下!”

    智能语音是避免开车时手忙脚乱的利器,因为你只要动动嘴就可以了。只是很多时候,车载智能语音存在体验不佳问题。“目前绝大多数车载智能语音仍处于命令控制阶段,与人之间的沟通属于机械式交互,而且缺乏实时纠错能力,在抗噪音、抗干扰方面仍有不足。”易观汽车研究总监钱文颖总结说。这些不足带来的结果是,车载智能语音更多时候只能锦上添花,很难在真正急需之时为开车族雪中送炭。

    同时应看到,在《麻省理工技术评论》评出的2016年十大突破性技术中,智能语音占了一席之地,其“突破性”在车载智能语音领域也不断显现。一个很好的例子就是国内智能语音产业领军企业科大讯飞专门为国产汽车品牌奇瑞艾瑞泽5打造的车载信息娱乐系统,名叫小艾。

    小艾最大的亮点就是其语音交互功能。无论何时何地,只要说声“小艾,你好”,系统就立刻被唤醒并处于待命状态。要导航,可以直接对小艾说目的地;要听歌或广播,就告诉小艾想听什么歌或听什么电台;打电话、查天气、查车票或机票信息通通同理——动动嘴就可以。

    同样是动动嘴,对话方式却今非昔比。有自然语言理解技术做支撑,车主与小艾之间的关系已不再是机械式交互。也就是说,只要按平时的说话方式跟小艾讲话,它就能听懂。想听歌时,无论说“播放音乐”还是“我想听歌”或者是“放一首歌”,小艾都能明白意图。它对普通话的识别率接近100%,而且可以听懂16种方言。

    车载环境对智能语音的挑战是噪音比较大,而且对话距离较远,需要强大的抗噪能力和远场识别能力才能克服。小艾应用专门针对车载环境的麦克风阵列降噪技术,开车窗、开空调、高速行驶时,语音正确识别率都在90%以上。只要用与人交谈时的正常音量与它说话,小艾就能高效识别出来。由于运用了语音打断技术,车主还可以随时随地打断小艾,让它取消正在进行的服务,或者吩咐它做其他事情。

    这款车载信息娱乐系统所能提供的语音交互体验,离不开远场识别、智能纠错、多轮交互、方言识别等技术多年来的积累和迭代。科大讯飞执行总裁吴晓如甚至称,小艾可以看作智能语音技术的“风向标”。

    当然,未来还有很多工作要做。比如,目前小艾需要智能语音唤醒才能接收命令,以后或许无需唤醒就能自动识别出哪些话是吩咐它的命令,哪些只是车上人员之间的对话。技术的逐步升级将使车载智能语音为人们带来愈加流畅的体验。“依赖人工智能技术的发展,未来车载信息娱乐系统的智能语音有望逐步实现车主意图跟踪、智能化理解等,任务对话能力将大大提升。”钱文颖说。

    当技术足以戳中“痛点”之时,人们就会意识到其不可或缺。所以,车载智能语音的角色也正悄然发生改变,正如吴晓如所言:“2014年之前我们认为,智能语音在汽车上的应用是一个点缀,现在我们觉得它是一个刚需。”

京ICP备06005116