创新故事
◎本报记者 刘 艳
智源大模型研究中心算法工程师赵撼宇一毕业就来到了北京智源人工智能研究院(以下简称智源研究院)。他的一项专利技术,在悟道大模型与OPPO小布助手合作的项目里,起到了关键的助推作用。
赵撼宇说:“在自己的研究成果落地的那一刻,我感到自己的价值得到了认可,为自己能够真正地为行业和社会作出一份贡献而骄傲。”
在和OPPO旗下开放式对话虚拟语音助手小布的合作中,基于悟道大模型开启的“生成式回答系统”,在一定程度上解决了行业共通性的长尾问题。
如今,AI语音技术在智能助手方面有着较为成熟的落地方案,智能家居、智能车载、新闻播报、智能终端等场景应用案例不胜枚举,但许许多多和AI客服“战斗”过的人,都有过恨不得把它从手机里薅出来的体验,乃至于对AI客服的“智力”产生深深的怀疑。
据不完全统计,目前至少有1亿用户的提问,AI语音助手无法回答。尽管现在的智能手机几乎都有语音助手功能,但使用它的人不到5%。
现阶段,“检索式回答”是大多虚拟助手的主要人机交互方式之一,对话内容局限于模型自建库和互联网数据。
这意味着,诸如“长江长还是黄河长”这类问题,如果无法在数据库中找到答案,在搜索引擎等途径也无法查询到的话,虚拟助手就无法做出回答。
从企业侧来说,用户的单个问题体量大且无法穷尽,依据互联网数据回答用户提问命中率低,但自建语料库不仅周期长,人工数据标注成本高,这种整个行业普遍存在的情况因为大模型的加入得到了改善。
智源研究院学术副院长、清华大学教授唐杰介绍,悟道开放平台给出了两套解决方案。
首先,悟道大模型具有强大的小样本学习以及文本的理解与生成能力,可以针对小布助手现有用户已经提出的问题生成回答。
此外,针对用户未来可能问到的问题,悟道大模型结合知识图谱持续学习,形成持续知识预训练模型,进而生成问答语料库。
OPPO数智工程事业部总裁刘海峰介绍,OPPO小布的单条回答建设成本降低了99%。
“希望接下来打造出更加智能的知识型、交互型、聊天式的智能助手,在回答人类提问时能够更开放,风格更多样化。”唐杰说,“当然,人性化的互动目标对模型的自然语言理解和生成提出了更高的要求,目前还没有更好的解决方案,但悟道大模型正在朝着这个方向迈进。”
在大模型铺就的迈向通用人工智能的路径上,AI助手在听、看和感受等方面都获得了长足的进步,变得越发“博学”,功能不多、语音识别不准、语音唤醒困难等种种不智能的表现正在一一消除。