在2024北京车展上,参观者观看一款新能源汽车的智能车控系统演示。 新华社记者 鞠焕宗摄 |
◎本报记者 都 芃
“关闭车窗、打开空调、降低音乐音量……”在不久前举办的2024(第十八届)北京国际汽车展览会上,有参观者坐进展台上的一辆智能网联汽车,对着智能车机连续发出多个指令。话音刚落,各项指令一一被车辆准确响应。
近年来,我国智能网联汽车产业快速发展,汽车智能化程度不断提升。语音控车正成为汽车产业发展中广泛落地的智能场景。
在本次汽车展览会上,新能源智能网联汽车是绝对主角。不仅多家品牌展出了搭载最新智能成果的新车型,展会也专门开辟出智驾未来展区,集中展示智能网联汽车相关技术成果。
参观体验了多款智能网联汽车后,记者发现,各家品牌车型虽然功能不尽相同,但乘客与汽车之间的交互均围绕语音建立。在语音控车场景下,只需短短一句话,甚至几个词,汽车便可根据乘客指令快速作出相应操作。
本次汽车展览会参展商科大讯飞AI研究院副院长高建清介绍,目前,搭载科大讯飞语音技术的车型可以为海外车主提供对话快速响应、问题回答准确的语音交互服务,已覆盖23个主要语种,搭载车型销往亚洲、欧洲、南美等地的60多个国家和地区。“我们已经与中国汽车‘出海’十强企业中的8家展开合作,助力中国汽车走得更远。”他说。
除了语音控车场景,翻译交流也是智能语音技术应用最广泛的场景之一。在不久前的第四届中国国际消费品博览会上,有外国客商拿着国产品牌翻译机,与在场工作人员你一言我一语地畅聊起来。嘈杂的环境没有影响翻译效果的准确性,不同语言得到了快速、准确的翻译传达,仿佛一名随行翻译就站在身边。
同样借助语音技术实现智能升级的还有会议场景。在数十人参加的会议讨论中,只需拿出智能录音笔,放在会议室一角,每个人的发言均可被精准记录并实现快速转写,甚至还可以一键生成会议总结,大大减少了人工记录工作量。除此以外,智能语音技术的典型应用场景还包括智能家居、智慧教育、手机智能助手等。
多场景广泛应用的背后,是我国智能语音技术近年来的不断突破。语音输入最大的挑战是场景复杂。用户的输入场景情况各异,无处不在的噪声、混响直接影响着语音识别的准确率,进而影响用户的语音交互体验。大模型的发展则给智能语音技术带来了新的前进动力。
高建清介绍,认知大模型的出现,让自然语言处理类任务的上限大幅提升。结合大语言模型更精准的语义理解和更精细的描述能力,各类语音任务也能快速突破效果上限。
“同时,我们也要结合语音属性解耦预训练和语义语音互增强编码等技术,构建起适用于各类场景的语音大模型,让智能语音技术赋能更多场景。”高建清说。