文章:《推动我国大模型开源创新生态建设的挑战与建议》
期刊:中国科学院院刊,2024年第8期
作者:温馨、张超、郭锐、陈凯华、冯泽、朱其罡
评荐:杨柳春(院刊执行主编)
大模型基础资源门槛高、产业集群效应强、潜在垄断性大等特点,成为国产大模型快速形成行业积累、实现迭代发展与赶超的制约因素。大模型开源创新生态是指具有相同开源理念的多元创新主体,围绕开放数据、开源框架、开源软硬件等数字基础设施,实现价值共创的复杂系统。其旨在以开放、协作、共享的精神,整合大模型创新链各环节基础资源、降低研发门槛,从而激发群体智慧,促进大模型技术持续创新、广泛传播和产业化应用。
通过开源方式降低研发门槛,是美国大模型以往取得领先优势的基础,各国也正在通过开源创新生态发展大模型,我国应积极应对。开源是全球公认的突破科技垄断或制约的有力手段,能帮助汇聚全球开发者智慧,推动大模型技术进步,并激发社会创新活力,加快大模型应用落地。开源创新生态建设是我国人工智能技术和产业发展的突破口,有助于我国企业摆脱对具有封闭知识产权技术的依赖,提升科技话语权、化被动为主动,对促进国产大模型技术迭代与产业化落地、推动潜在国际合作破除垄断壁垒、培育未来产业竞争优势等具有决定性意义。
该文梳理了国际上大模型开源创新生态的成功经验和做法,重点讨论了如何构建稳固完善的上游供应生态、丰富多元的下游应用生态和公开有效的治理协调生态。同时,指出了我国大模型开源创新生态建设面临的诸多挑战,如系统协同政策架构设计缺失、技术能力制约生态形成、数据算力显著限制技术发展、创新主体无序竞争制约整体发展速度、开源支持体系建设水平较低等。
为此,该文指出,应加强顶层设计,坚持系统观念,统筹谋划开源技术生态,以数据、算力和算法为抓手补短板、固底板,推动产学研持续投入大模型开源技术研发。同时,要打造共享的大模型研发基础体系、强化全产业链开源开放体系、完善开源创新治理体系等。
展望未来,我国应充分吸收开源创新生态构建经验,秉持开源开放的理念,构建大模型开源创新生态,推动大模型全产业链的繁荣有序发展。一方面,要处理好打造大模型开源生态过程中政府和市场之间的关系。另一方面,要建立起对开源的合理认知,探索构建符合大模型产业特性的开源治理体系,推动形成涵盖大模型上下游全产业链的健康开源创新生态。