2020年09月01日 星期二
语言与知识技术是AI认知能力的核心
□ 陈 杰

    半个多世纪前,老一辈自然语言处理学者们在一本名为《机器翻译浅说》的书中,畅想了未来跨语言、跨文化的无障碍沟通场景。如今,机器同传、翻译机、跨模态翻译等工具,已融入人们的工作和生活,沟通无国界的梦想正逐步实现。这一切是人工智能技术,特别是语言与知识技术进步所带来的结果。

    随着技术的不断迭代,AI正在向更深层次进化,语言与知识技术的重要性更是愈加凸显。语言与知识技术是人工智能认知能力的核心,以语言和知识为研究对象,让机器像人一样掌握知识、理解语言的自然语言处理技术,对于人工智能发展至关重要。

    当前,国内AI头部们在语言与知识技术方面有什么建树?是否把握住了AI领域的发展趋势呢?从日前召开的百度大脑语言与知识技术峰会上似乎可一探究竟。百度此次发布了语言与知识技术系列产品和数据集共建计划,并一口气推出5款产品的新发布,全面加速AI技术大规模应用。

    用百度CTO王海峰话来说,“在语言与知识技术的布局和发展中,百度始终在注意把握两个趋势,即技术发展趋势和产业发展趋势,并力争引领趋势。”

    这句话对整个国内AI产业也适用,毕竟百度在国内AI领域的领先地位毋庸置疑,由此也可见语言与知识技术对AI产业的重要性。知识图谱是机器认知世界的基础。机器认知能力的突破,越来越依赖对知识和大规模知识图谱的运用。而在知识的加持下,语言理解相关技术的能力不断增强,机器也可以逐渐像人一样不断学习、不断进步。

    在这两方面,百度历经近十年发展,已经构建了完整的语言与知识技术布局,包括知识图谱、语言理解与生成技术,以及上述技术所支持的包含智能搜索、机器翻译、对话系统、智能写作、深度问答等在内的的应用系统。

    据了解,百度打造了世界上最大的多源异构知识图谱,拥有超过50亿实体和5500亿事实,并在不断演进和更新,已应用于各行各业,每日调用次数超过400亿次。不仅如此,针对不同应用场景和知识形态,百度还建立起多样化的知识图谱类型,既有基础的实体知识图谱,也有行业知识图谱、事件图谱、关注点图谱等,以及融合语音、视频、图片的多模态知识图谱。

    当然,复杂知识表示和快速构建技术、知识与深度学习进一步融合、深度融合感知和认知的跨模态语义理解技术、模型可解释性和鲁棒性等等,仍有很多技术难题需要行业企业持续研究和解决。业内专家普遍认为,探索机器“掌握知识、理解语言、拥有智能”,需要学术界和产业界携手,推动语言与知识技术、人工智能技术持续进步,为产业不断升级、社会经济高质量发展作出更大贡献。

京ICP备06005116