本报记者 张盖伦
12月12日,北京大学—字节跳动“豆包大模型系统软件联合实验室”签约仪式暨“面向大模型的智能化软件技术与生态”学术研讨会在北京大学举行。北京大学计算机学院院长胡振江表示,联合实验室的建立,标志着双方合作走入更深、更精、更密切的新阶段。未来,联合实验室将深入推进大模型系统软件研究,打造人工智能时代坚实可靠的系统软件基础设施。
胡振江指出,智能化时代使资源的有效管理面临重大挑战,对系统软件提出更高要求。联合实验室将聚焦大模型时代智能化软件基础科学和关键技术问题,特别是结合企业真实场景开展研究,加强原创性、引领性、关键性的科技攻关;在人才培养方面,将打造高水平创新人才培养基地,构建产学研协同育人新模式,培养具有扎实理论功底和实践创新能力的复合型人才。
联合实验室主任、北京大学计算机学院教授刘譞哲告诉科技日报记者,大模型发展的核心是做好算力资源管理。这既需要良好的基础设施,也需要把基础设施用好,把用户服务好。
“我常打的一个比方就是,有很强的算力和硬件相当于盖了栋房子;而系统软件相当于物业和保安。有了后者,你才能住得安心。”刘譞哲说,系统软件介于上层应用和底层硬件之间,它好比大模型时代的操作系统,或者大模型中的“滴滴出行”,可以进行算力调度和任务管理。
大模型时代,系统软件的重要性愈加凸显。高校和企业展开合作,也是顺应时代的需要。企业有场景、有课题,高校有基础研究能力和在实践中培养人才的需求——校企合作,是一种共赢。
刘譞哲举了个例子。为了做大模型,企业通常要部署很多GPU(图形处理器)芯片卡,形成GPU集群。一万张卡中,如果有一张卡出现错误,要怎么处理?
“在学校,我们没有这么多卡,只能从理论上推演,不可能亲眼见到‘万里错一’到底是个什么情况。”刘譞哲说,只有到业界,才能看到真实情况,才能进一步分析,卡是怎么坏的,到底是硬件、软件还是网络坏了;坏了要怎么办,采用哪种技术路线更合适……“在解决问题的同时,我们还可以检验和优化已有的理论知识。”刘譞哲说。
很多经验是前人总结的,但在计算机领域,很容易遇到前人没有遇到过的情况。企业提出的是具体问题,但高校科研团队能在具体问题的基础上,找到背后的基础问题。“它可能是老问题的新表现,也可能是一个新问题,解开了它,就创造了新知识。”刘譞哲强调。
以联合实验室为平台与企业长期稳定合作,将进一步促进北京大学系统软件技术科研成果在大模型等人工智能重要场景中的应用转化。北京大学科技开发部副部长郑如青表示,希望打造校企合作的示范样板,推动更多科技创新成果服务经济社会发展。
刘譞哲告诉记者,联合实验室将围绕大模型场景下智能化软件系统关键技术,充分融合双方优势资源,开展关键技术合作攻关,推动成果应用落地转化,形成校企合作良性循环。具体来说,要提高大模型训练的效率,降低大模型训练的故障率;提高大模型推理的吞吐量,降低大模型推理的延迟。
“学术顶天,真研究问题,产生一流成果;系统落地,研究真问题,形成一流影响。同时,练就真功夫,培养一流人才。”刘譞哲这样展望联合实验室的未来。