科技日报讯 (记者华凌)IT市场研究和咨询公司国际数据公司(IDC)最新发布的《AI大模型技术能力评估报告,2023》显示,百度文心大模型3.5拿下12项指标的7个满分,综合评分第一。
据了解,这是IDC首次提出人工智能(AI)大模型技术能力评估框架。参与本次评估的国内主流大模型出自14家厂商。结果显示,百度文心大模型整体竞争力位于领先水平,在模型能力、工具平台、生态布局及行业覆盖上优势明显,并已提前进入商业化落地探索阶段。
据介绍,IDC评估报告围绕产品技术能力、服务生态以及行业应用能力三大维度,考察了大模型的10余项指标,其中“算法模型”和“行业覆盖”成为衡量大模型能力极其重要的两个指标。
在产品技术能力这一维度,“算法模型”指标是大模型能力最为核心的要素,也是决定大模型应用效果的根本所在。突破算法模型技术的瓶颈,研发出具有通用效果优势的大模型底座,才能支撑更广泛的行业覆盖,使各行各业充分享受技术突破带来的红利,破解AI落地门槛高的困境。
在行业应用能力这一维度,应用覆盖的广度是当下大模型厂商最为关注的指标。“行业覆盖”指标通过企业级客户数量和落地行业数,体现了大模型在产业落地上的实力,是大模型效果通用领先性、行业结合能力两方面的综合体现。
百度文心大模型在“算法模型”和“行业覆盖”这两项指标的评估中取得满分,是唯一一个在上述两项指标中均取得满分的产品。
据百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜介绍,百度文心大模型能取得这样的成绩主要得益于三个方面:自研的深度学习平台飞桨有力支撑了大模型的高效训练和推理,让文心大模型3.5最新版本的模型效果提升50%,训练速度提升2倍,推理速度提升30倍;知识增强技术能实现更高的效率、更好的效果、更强的可解释性;在大模型生态方面,百度文心已形成企业、教育、社区三位一体的生态体系。