“大数据试验场是面向数据科学研究、大数据技术开发而设计的重大科学实验设施,是我国原创、国际无先例,具有‘顶天立地’的属性。”在5月7日举行的第二届数字中国建设峰会网络科技论坛上,中国工程院院士、国家数字交换系统工程技术研究中心主任邬江兴在题为“未来计算与大数据试验场”的报告中如是说。他认为,只有创建规模实验环境,才能够研究实验新算法,才能创新发展新算力,降低应用技术门槛。
自PC、移动通信、互联网诞生以来,每次技术进步所生产的计算机终端以亿万计,每台终端几乎每天都在不停地生产数据信息。如果想将这些数据集中起来处理和分析,则现有技术远不能及,这就是大数据问题产生的根源。随着数字化设备的大规模、持续性生产和使用,大数据问题必然愈演愈烈,而且由于摩尔定律的限制,这类问题很难从根本上得到解决。
邬江兴院士以“黑洞的照片”为例,“这张照片花费了科学家近两年的时间才‘冲洗’完成。过程如此艰辛,一是因为庞大的数据不可能靠网络传输,二是数据同步计算问题不容易解决。整个过程中涉及到数据量之多,难度之大都是前所未有的”。
“计算技术、存储技术、网络通信技术的进步的速度,如何跟上数据增长的速率是亟待解决的问题,一个智慧城市的大脑首先面临的挑战就是城市计算问题。”邬江兴院士认为,未来计算的特征要具备异地分布联合计算能力、数据流计算能力、领域专用软硬件协同计算能力。而达到以上特征需要以下几个条件,如实现高密度、高速率、长寿命、极便宜、超级容量存储,实现存储、传输、交换全链条具有泛在化、全域协同计算,实现场景构建。在此基础上,构建出一个大型开发研究试验平台,即大数据对撞机,包括与之配套的研究试验工具和其他服务设施。可行的做法是让数据增长和计算技术进步交替前行,进步与迭代、突变与颠覆。
“大数据试验场的愿景是建设国家重大科学基础设施,包括服务产业的转型升级和实体经济的发展质量的提升。其目标是支撑科学研究、技术创新、产业创新、创新创业。”据邬江兴院士透露,目前在复旦大学已建成先导技术系统,上海大数据试验场即将启动建设功能转化平台,并正在酝酿建设国家大数据科学基础设施。
“大数据的发展必须脚踏实地。只有从底层做起,才有可能在大数据领域实现并跑、领跑。”邬江兴院士说。