◎本报记者 刘 艳
4月1日,中国电子学会主办的第十六届中国电子信息年会在广东省珠海市召开,以“电子新时代·强国新征程”为主题,众多院士、专家学者和企业代表围绕基础研究、前沿技术及应用、青年人才培养等议题展开了学术交流和技术研讨。中国电子学会副理事长、百度首席技术官王海峰出席主论坛并作报告,阐释了大模型技术发展与产业模式。
大模型成人工智能发展热点
人工智能已经成为新一轮科技革命和产业变革的重要驱动力量,具有效果好、泛化性强、研发流程标准化程度高等典型特征的大模型正推动产业应用蓬勃发展,随着大模型快速演进,能理解、有逻辑、会推理、能创作、有情感的大语言模型有望带来人工智能创新的爆发式增长。
王海峰介绍,百度自2019年开始深耕预训练模型研发,经过近4年积累和迭代,文心大模型已经形成了系统性的大模型技术体系,包括自然语言处理、视觉、跨模态、生物计算等大模型,面向行业需求构建的系列行业大模型,以及支撑大模型应用的工具平台,具备知识增强和产业级两大特色。
据了解,文心知识增强大语言模型基于ERNIE及PLATO系列模型研发,是文心大模型家族的新成员,其关键技术包括有监督精调、人类反馈的强化学习、提示等大语言模型都会采用的技术,以及知识增强、检索增强和对话增强等百度已有技术优势的再创新。文心知识增强大语言模型通过知识内化和知识外用两种方式实现知识增强。知识内化,是从大规模知识和无标注数据中,基于语义单元学习,利用知识构造训练数据,将知识学习到模型参数中。知识外用,是引入外部多源异构知识,做知识推理、提示构建等等。文心知识增强大语言模型的检索增强,基于以语义理解与语义匹配为核心技术的新一代搜索架构,通过引入搜索结果,为大模型提供时效性强、准确率高的参考信息,更好地满足用户需求。在对话增强方面,基于对话技术和应用积累,文心知识增强大语言模型具备记忆机制、上下文理解和对话规划能力,实现更好的对话连贯性、合理性和逻辑性。
打通大模型产业化路径
大模型依赖算法、算力和数据的综合支撑,产业化还面临许多挑战,比如,模型体积大,训练难度高;算力规模大,性能要求高;数据规模大,数据质量参差不齐。
对此,王海峰表示,具有算法、算力和数据综合优势的企业,可以将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务。
大模型带来的三大产业机会已经浮现,第一类是新型云计算,云的主流商业模式变为MaaS,模型即服务(ModelasaService);第二类是进行行业模型精调的企业,可以调用通用大模型能力,基于行业知识和经验为客户提供解决方案;第三类是基于大模型底座进行文本生成、图像生成、音频生成、视频生成、数字人、3D等场景相关应用开发的企业,即应用服务提供商。
大模型带来的智能化创新热潮才刚刚开始,它距离AGI(通用人工智能)还有多远?
王海峰认为,正如人造卫星永远不会和月球这样的自然卫星画等号一样,人工智能永远不会直接跟人类的智能完全画等号,人工智能是模拟、延伸和拓展人的智能,最终目的是服务于人类更美好的生活和社会的发展。人工智能的通用性越来越强,部分能力已经达到或超越人的水平,可以认为AGI在一定程度上已经实现了,但比起这个概念本身,人工智能为人类带来的价值才是我们努力的方向。