2023年07月27日 星期四
同等距离PB级数据传输时间由两周缩短至当天
CFFF平台为科研提供超强算力

    ◎本报记者 崔 爽

    以CFFF平台为代表的智算平台作为一种新兴的科研超算架构,将成为科研的重要支撑力量,极大提升科研效率、降低科研成本,加速科学原理发现和技术突破,并有力推动科学大模型的落地。

    7月23日记者获悉,国内高校最大的云上科研智算平台CFFF(Computing for the Future at Fudan)近日在上海复旦大学正式上线。这台为发现和解决复杂科学问题而建的科研“超级计算机”由复旦大学与阿里云、中国电信共同打造,以先进的公共云模式提供超千卡并行智能计算,并支持千亿参数的大模型训练。

    中国科学院院士、复旦大学校长金力表示,在数据和智能技术驱动的“大科学时代”,如何在日新月异的科技创新环境中赢得主动,在关键领域取得创新突破,是时代给予高校的命题。以CFFF平台为代表的智算平台作为一种新兴的科研超算架构,将成为科研的重要支撑力量,极大提升科研效率、降低科研成本,加速科学原理发现和技术突破,并有力推动科学大模型的落地。

    云上传云上算 真正用好科研算力资源

    据了解,CFFF平台由面向多学科融合创新的AI for Science智能计算集群“切问”一号和面向高精尖研究的专用高性能计算集群“近思”一号组成。

    复旦大学“浩清”教授、人工智能创新与产业研究院院长漆远介绍,基于百G高速数据传输网和阿里云的大规模异构算力融合调度技术、分级存储技术、AI与大数据一体化技术,部署在复旦校内的“近思”一号和托管在1500公里外阿里云乌兰察布数据中心的“切问”一号连成了一台真正意义上的“超级计算机”。该平台可被复旦各校区所有实验设备高速接入,实现了异构算力统一管理,计算任务统一调度,满足了不同应用场景下的科学智能研究与应用需求。

    此外,该平台还拥有国内高校最大规模的多级数据冷热分层存储集群,并支持云上高速传输。以往PB级科研数据从复旦大学传到西部数据中心需要两周,如今当天就能完成,实现了“东数西算”。

    金力表示,CFFF平台具有大规模、高能级的特点。它是国内高校中规模最大的超算集群,同时也是国内高校算力第一的异构智算集群,以其为基础的智能计算平台将成为科研的重要支撑力量。

    产学研共创新 研究进入计算驱动时代

    “算力是人工智能学科发展的最基本保障。CFFF平台运行的速度将极大地影响科研效率、科研成本、平台的服务效能,以及未来算法产业化落地的可能性。”金力表示,大量前沿科学攻关领域,包括蛋白质计算、分子动力学、计算物理学、大气海洋地球系统模拟、气候变化综合评估模型模拟等都严重依赖算力资源。

    据悉,CFFF平台从建设的第一天起,就收到了生命科学、大气科学、材料科学等领域的多种研究需求。

    “CFFF平台的上线让我们像拥有了一个‘大科学装置’。实验科学的数据非常多,如果可以通过文献数据找到设计一种材料的最佳路线,不仅将省掉很多时间,也会使我们对物质的认识更加深入。”中国科学院院士、复旦大学化学与材料学院院长赵东元充满期待。在他看来,科研范式已经到了研究复杂体系的新阶段,必然要借助更多工具、不同学科的交叉融合来共同推进科研进展,人工智能就是一个很好的工具。

    目前,CFFF平台上的第一个科研成果已经诞生。复旦大学人工智能创新与产业研究院研究员李昊带领团队发布了45亿参数量的中短期天气预报大模型,预测效果在公开数据集上首次达到业界公认的欧洲中期天气预报中心(ECMWF)集合平均水平,并将预测速度从原来的小时级缩短到3秒内。李昊介绍,这样规模的大模型只用一天就完成了训练,传统的计算平台很难做到。

    这是CFFF平台上孕育出的第一个大模型。金力表示,希望基于CFFF平台建成一批具有世界影响力的科学大模型,例如生命科学大模型、材料科学大模型、大气科学大模型等。未来,平台还将持续扩大其算力规模,并向复旦大学以外的科研机构、高校、医院、高科技企业等开放。

    “高校第一次拥有了和科技巨头一样的研究计算平台,研究真正进入了计算驱动的时代。”中国工程院院士、阿里云创始人王坚表示,这也是产学研协同创新的成果,纵观技术的发展,特别在计算以及通信领域,“高校和企业可以创造出很多很美妙的东西”。

京ICP备06005116