超级计算机是大国综合实力的象征,也是确保国家竞争优势的重要保证。在科学技术飞速发展的今天,超级计算机已成为大国重器之一。
据悉,目前世界排名首位的我国天河二号超级计算机,预计到2015年底峰值速度将升级到每秒10亿亿次以上。而同样由国防科技大学研发,诞生于2009年10月29日的天河一号是我国首台峰值千万亿次的超级计算机。这样,从天河一号的千万亿次到天河二号的十亿亿次,天河系列超级计算机的峰值速度在6年内将提升100倍,提高两个量级。
超级计算的中国道路
在计算机产业发展中,有个著名的摩尔定律,集成电路IC上可容纳的晶体管数目,约每隔18个月便会增加一倍,性能也会提升一倍,这一定律揭示了信息技术进步的速度。但为什么超级计算机的发展速度比摩尔定律还要快这么多呢?带着这一问题,笔者采访了中国计算机学会高性能计算专业委员会秘书长、中科院计算所张云泉研究员。张云泉研究员解释道:超级计算机的性能实际上是10年翻1000倍!而超级计算机之所以有超越摩尔定律的发展速度,是因为超级计算机一方面以计算机技术的摩尔定律为基础提升速度,另一方面又通过采用大量处理器的并行体系架构进行横向扩展,通过并行计算获得更多的性能提升。所以,超级计算机的性能服从于10年翻1000倍的超级定律,其发展完全可以用一日千里来形容。
追根溯源,美国的超级计算机发展,始于上世纪40年代的曼哈顿计划,由于超级计算机在核能、军事、原子弹和生命科学等国家战略命脉上起到的关键推动作用,在美国、日本等国家,超级计算的早期发展也一直是采用举国体制进行投资研制。
如今,超级计算机已成为衡量一国科技综合实力的标志,在诸如天气预报、基因工程、核工业、军事、天体物理模拟、航空航天等高科技领域大展身手。据张云泉研究员介绍:中国超级计算机的发展历程,虽然比美欧日等发达国家短,但从21世纪在国际舞台上惊艳亮相以来,树立了一个又一个里程碑。例如2004年,曙光4000A位列世界十大超级计算机,中国高性能计算机首次进入世界前十;2009年,天河1号在世界上首次采用CPU加GPU的异构加速体系结构设计出千万亿次超级计算机;2010年11月,由国防科大设计的天河1A首次为中国夺得世界TOP500排行榜的第一名;2011年神威蓝光第一次全部采用国产CPU和国产水冷技术研制出千万亿次超级计算机;2013年天河二号又以峰值计算速度每秒5.49亿亿次连续两次夺得世界第一等。
中国近年来在超级计算机领域的连续突破引起了美国的强烈关注。超级计算机领域的大国竞争是双方经济实力、计算机领域科研能力、高性能计算机保有量及其应用水平的综合较量。美国一些高性能计算学术研究机构估计中国在超级计算机领域和美国的差距是10年以上,这是对中国使用商用和国产技术的公开信息评估的结果,但科技创新的发展有时会是指数性的,很难预料。张云泉研究员分析,经过多年的赶超,中国与美国在超级计算机的发展水平上,综合差距应该还在十年以上。其中超级计算机硬件系统的研制水平双方互有伯仲,差距不大甚至中国能够偶尔赶超,但在软件系统设计和应用软件的研制及推广方面的差距则在十年以上。此外,欧洲在超级计算机的应用方面水平很高,但缺乏制造超级计算机设备的的竞争力。日本在超级计算机大国竞赛方面的竞争优势主要体现在应用方面,其超级计算机硬件系统的研制水平在逐渐被中国赶超。
根据世界超级计算机TOP500排行榜和中国高性能计算机TOP100排行榜的数据综合来看,截至2013年11月,国防科大研制的“天河二号”仍是世界上性能最强大的超级计算机。该系统是中国国防科技大学与信息技术制造企业浪潮集团合作的产物。它采用了数万枚英特尔公司的“至强”多核处理器和“至强” Phil众核协处理器及数千颗国产FT-1500多核处理单元,与此同时国防科大还开发了其使用的高速互联网络和麒麟Linux操作系统。
据英特尔公司技术计算高级架构师何万青博士介绍,天河二号超级计算机建造服务于公共事业,在硬件速度上已经是全球第一,在此基础之上,国内的主要研发工作已转移到大规模并行软件的开发和实际应用推广方面。英特尔公司在全球范围内长期支持超级计算机的设计和建设,高性能计算也是其重要的技术高地。在天河一号和天河二号的开发过程中,英特尔中国公司配备了专业团队为用户提供产品技术支持。
正因为超级计算能力已经成为评价一个国家综合国力的标准之一,也是中国自主创新实力的一种展现,因此我国对超级计算的投入也十分巨大,取得了举世瞩目的成果。
超级计算的中国创新
由于从上个世纪80年代开始,美国等西方国家就对中国进口美国的超级计算机,实施一定性能水平的禁运和关键技术的封锁,中国的研发机构不得不依靠自己的研究力量攻坚克难。近年来,我国的中科院计算所、国防科技大学和江南计算技术研究所分别在超级计算的产业化和自主创新方面走出了自己的特色之路。
曙光公司是一家在中科院计算所支持下,以国家863计划重大科研成果为基础组建的国家高新技术企业。2010年,由曙光公司研发的“星云”高性能计算机以每秒系统峰值达三千万亿次的速度,首次为中国取得了全球第二的成绩,向国人力证了“中国速度”。2014年,曙光公司即将迎来IPO上市的辉煌时刻,走出了一条国产高性能计算技术产业化的成功之路。
国防科技大学经过多年积累在超级计算机的互联网络技术上逐渐拥有了自主知识产权并成功应用在天河1A和天河2号系列超级计算机上,其重要性对超级计算机的体系结构可扩展性设计而言是居于首位的。在计算部分,虽然中央处理器大量采用了英特尔芯片,但其中的FT-1500多核处理单元则为国产。在系统集成与散热制冷以及系统软件等方面,天河二号基本使用了自主创新的技术。综上所述,天河二号的自主创新比例已经达到60%以上,有些舆论说中国的超级计算机是美国芯片的大量组装和简单堆叠,这种论调是非常荒谬的。
再以神威蓝光超级计算机为例,该机获得科技部863计划支持,由国家并行计算机工程技术研究中心制造,于2011年9月安装于国家超算济南中心,全部采用自主设计的16核CPU,系统总功耗只有不到1兆瓦 ,这也使得中国成为继美国、日本之后第三个能够采用自主CPU 构建千万亿次超级计算机的国家。此外,神威蓝光的另一个优势是集成度高,噪音低,水冷散热高效,其自主创新的比例高达80%以上。
中国超级计算机的自主创新从集成开始,到系统设计,主板制造,最后再到CPU设计,系统软件设计,自主创新的速度很快。中国的超级计算机不仅是自主创新的产物,也是中国其他战略重点行业进行自主创新的基础设施。超级计算机可用于公共事业,科研平台,其强大的计算能力与信息服务能力是中国创造研发的重大支撑。作为“现代科学技术的大脑”,超级计算机广泛应用于地球气候模拟、宇宙天体研究、基因研究、石油勘探、自然灾害预报等“高、精、尖”的前沿领域,已成为世界各国竞相争夺的科技战略制高点。而即将到来的大数据时代,更是对人类的数据驾驭能力提出了全新的挑战,运用超级计算机解决大数据时代的重大问题迫在眉睫。数据显示,天河一号为汽车装备、石油物探、动漫渲染、生物医药等相关企业带来上亿元效益,辐射区域和行业经济规模近百亿元。
但不可否认,我国在超级计算机的软件开发与应用方面与美欧日等发达国家还存在不小的差距。以至于美国有关机构认为中国的超级计算机目前还主要是一种国家创新成果的展示,对美国的领先地位还不构成真正威胁。他们认为,只有中国的超级计算机应用拿到以“超级计算领域的诺贝尔奖 ”著称的戈登·贝尔奖,才能证明中国的超级计算发展真正具备了与美国抗衡的实力。也只有到那时,美国才会真正拉起警报:中国已经不再是“大而不强”的超级计算大国,而确实成为要赶超美国的超级计算强国了。
美国未真正重视中国在超级计算领域的挑战,主要原因在于超算软件与应用对于超级计算机发展而言,与整个硬件系统的设计制造同等重要。而由于软件需要建模、实验、参数调整等长期的工业及研究积累,我国对此重视不足,以至长期欠账。重硬件、轻软件,重制造、轻应用的结果,造成中国超级计算的科研等应用比较薄弱。
据何万青博士介绍,高性能计算软件在国内的用户分布涵盖了科学院系统、各大学计算机系,各超级计算中心、中石油中石化、气象局和影视新媒体等诸多使用计算集群进行科学计算的单位。但与美国相比,中国国内高性能计算的应用还有很大发展潜力。
天河二号所在的广州超算中心已经与世界领先的基因公司华大基因展开基于基因科学的合作内容,将医疗与基因工程集成化、个性化。华大基因公司的陈钢研究员介绍,生命科学领域的重大科研项目已经离不开大规模的计算资源。他形象地比喻道:我国的超算技术,尤其是硬件技术的发展,取得了举世瞩目的成就,但配套的网络资源,技术支持就显得有些滞后。石油勘探是用车拉着硬盘去超算中心用国外的商业软件跑分析;基因测序是一趟趟地快递硬盘。在美国,亚马逊的云计算服务为客户提供了Direct Connect服务,可以搭建起客户到数据中心的专线连接,用于传输数据。而在国内,由于价格、手续、法规方面的问题,一般的用户要专线接入超算中心还是很麻烦的事情。这就限制了超算在诸如生命科学等诸多大数据领域的应用。
超级计算的中国梦想
据有关专家预测,天河二号的世界第一位置还能保持到今年年底。而紧接着的2015年,预计天河二号的峰值速度将再次升级到10亿亿次以上,那么,10亿亿次以后,中国的超级计算还将走向何处?
张云泉研究员认为:虽然超级计算机的发展速度超越了摩尔定律,但在5年之后也许会遇到技术瓶颈——也就是说,预期到2020年E级超级计算机的诞生可能不得不推迟。E级超级计算机是指每秒可进行百亿亿次数学运算的超级计算机,其运算速度比2015年建成的10亿亿次超算还要快10倍,被全世界公认为超级计算机界的下一顶皇冠。之所以会存在难以克服的障碍,主要是因为美国的科学家对未来E级超级计算机的设计建造设定了新的功耗和成本标准——按照这个标准,E级计算机的整体功耗不能超过20兆瓦,整机预算不能超过两亿美元,而从目前的技术储备来看这是不可能达到的标准。中国虽然还未对E级超级计算机建造设定此类标准,但如果想让制造出来的E级超级计算机获得国际认可,恐怕也不得不遵循这一行规。
有些高性能计算专家则倾向于认为芯片技术的发展是决定性因素,如果处理器不能突破纳米极限,甚至摩尔定律到2015年前后遭遇终止,那么超级计算机的下一步发展就会遇到障碍。但如果芯片技术、计算技术有新的突破点,例如认知计算,神经网络芯片,量子计算的发展有质的飞跃,或者芯片的纳米极限得到有效突破。那么,超级计算机的发展将迎来又一片海阔天空。
如此看来,超级计算的中国梦想,还不仅依赖于中国科研人员与企业界的自主创新,更与国际计算机领域的前沿进展息息相关。E级计算,也是全人类的共同梦想。