◎本报记者 王 春
7月6日—8日在上海举办的2023世界人工智能大会上,“大模型”相关话题成为焦点,会上展示的国内外大模型多达30余款。从“作坊式”走向“工业化”新时代,大模型技术正在成为AI领域的主角。
眼下,以ChatGPT为代表的大模型正在引领新一轮全球人工智能技术发展浪潮,大模型不断加速实体经济智能化升级,深度改变行业生产力。中国科学技术信息研究所党委书记、所长,科技部新一代人工智能发展研究中心主任赵志耘在世界人工智能大会“大模型与深度行业智能”创新论坛主旨演讲中表示,大模型技术最大的突破就在于通用性。大模型通过“大数据+大算力+强算法”的路径显著增强了通用性、泛化性,推动人工智能从以专用小模型定制训练为主的“手工作坊时代”,迈入以通用大模型预训练为主的“工业化时代”,迎来新的发展浪潮。
作为本届大会“九大镇馆之宝”之一的百度文心一格,能在用户输入文字描述的30秒以内生成各种风格的精美画作,其“一语成画”的背后,正是文心跨模态大模型技术的支撑。百度技术中台事业群负责人说,跨模态大模型人工智能平台,是人工智能从“作坊式”向“工业化”转型升级的一次重要探索。该大模型是百度自主研发的产业级知识增强大模型,不仅能力领先,而且使用门槛更低,开发者可以更有效率、更低成本地应用。
通用大模型是人类最高智慧“大脑”,工业领域大模型则是“手”和“脚”。华为云7月7日正式发布的盘古大模型3.0,正是为了解决当前人工智能开发者“小作坊”模式应用开发效率较低的问题。“盘古大模型不作诗,只做事。”华为常务董事、华为云CEO张平安表示,目前,基于华为昇腾AI算力,原生研发、适配的大模型已超过30个,占中国大模型近一半数量。华为的盘古大模型已经深耕金融等10余个行业,覆盖400多个业务场景。
与此同时,一批针对生物制药、遥感、气象等垂直领域的专业类大模型,正在发挥其领域纵深优势、不断深化落地。这些模型将成为推动AI产业快速发展的重要力量。
赵志耘介绍,我国高度重视人工智能发展,自2017年发布实施新一代人工智能发展规划以来,部署启动科技创新2030—“新一代人工智能”重大项目、支持建设国家新一代人工智能开放创新平台、鼓励构建产学研创新联合体等,已初步建立起涵盖大模型理论方法和软硬件技术的体系化研发能力,并形成了一批紧跟世界前沿的大模型技术群。“中国大模型技术沿各技术路线迅速发展。在自然语言处理、机器视觉和多模态等领域涌现出盘古、悟道、文心一言、通义千问、星火认知、书生·浦语等多个具有行业影响力的预训练大模型,总体水平紧跟世界前沿。”赵志耘说。
打破应用门槛,解决人工智能“落地难”痛点,大模型技术正在成为“尖刀”,为科学技术和商业生态提供支持。然而,我国大模型目前还处于技术萌芽期,面临智算能力差距较大、基础模型算法自主性不强、缺少高质量训练数据、有组织的工程化能力相对薄弱以及人才资源不足等诸多挑战。对此,赵志耘提出建议:一是加强资源和研发力量统筹,促进大模型有序发展;二是加快基础研究和技术创新,提升学术和开源影响力;三是强化大模型发展中的场景牵引作用,打造大模型标杆项目;四是强化国际合作,积极参与全球人工智能治理。