2018年02月14日 星期三
共享数据难?中科院要拆藩篱
本报记者 李大庆

    郭华东的一个PPT里有40张图,都是黄河三角洲的遥感图,从1976年到2015年每年一张。在PPT演示的过程中,40张图按年份连续播放,人们可以清晰地看出黄河三角洲40年变化的轨迹。郭华东说,如果采用传统科学考察方法,这得派出多少科研人员年复一年地去那里工作啊?而通过卫星遥感大数据,黄河三角洲的演变与变化信息轻松可得。

    这就是遥感大数据的力量。

    在12日举行的中科院A类战略性先导科技专项“地球大数据科学工程”启动会上,该专项负责人郭华东院士说,大数据为科学研究带来了新的方法论,大数据正在催生人们用全新的模式实现科学发现,地球大数据正在成为认识地球的新钥匙、知识发现的新引擎、决策支持的新手段。

    启动“地球大数据科学工程”,中科院计划建成代表国家水平和能力的大数据创新平台,建成国际地球大数据科学中心,并深度融合中科院相关领域的数字资源,发挥综合数据的最大效益,改变各自为战的局面。

    一位科学家对“各自为战”深有感触。他到国外参加学术会议,在会上他才知道与他同一系统的另一个研究单位也在做同样的工作,他们之间有相当多的重复性工作。

    中科院院长白春礼在启动会举了一个例子:中科院有多个野外台站,国家一些部门也有多个野外台站,许多大学还有野外台站,“但是他们采用不同的标准,得到的数据不能通用共享。”

    退一步说,即使采用了同一标准,就能共享吗?各部门各单位都打着保密及保护隐私等名义,垄断了数据的使用权。因而国家在数据采集和研究等方面都存在重复投资。

    中科院各个研究所之间在数据共享方面也做得不尽如人意,因而在利用大数据创新方面也存在掣肘。2016年10月21日,在中科院召开的会议上,白春礼提出,针对资源环境和生物等领域的地理信息系统平台建设,部署一个院A类先导专项,建成资源共享的信息系统平台,“专项要突出科学前沿和技术创新;发挥院多学科综合的优势;为中央和地方政府的决策提供科学支持。”

    从某种意义上说,建一个平台在技术层面上并不是最难的,难的是科研人员是否愿意把自己的数据贡献出来。参与地球大数据专项的有中科院的33个研究院所,国内外参加单位共129家,研究人员1200多名,其中正高职称180多人,副高职称230余人,包括院士9人,杰青、优青44人,万人、千人、百人计划90人,国际专家50余名……

    管人远比管技术难得多。

    再难的事中科院也愿意碰一碰,这是中科院实施“知识创新工程”留下的传统。院长白春礼一马当先,亲自担任了这个专项领导小组的组长。这是非常之举,因为在中科院已经实施的19个A类专项中,白春礼没有担任过任何一个专项的领导小组组长,一般是由主管副院长任组长。

    可见中科院为推动地球大数据的创新和共享决心之大。

    与其他专项不同的是,地球大数据专项启动会上,专项的依托单位、项目承担单位的领导也到现场签署了责任书。建设大数据创新平台,各单位领导人人有责。

    中科院的数据主要是科学数据因而数据量并不是很大。目前中科院全院地球大数据资源总量约为38PB(1PB=1024TB)+8000万条记录,已形成了210多个数据库,其中包括生物90个、生态42个、资源34个、环境44个。郭华东透露,对地观测卫星数据每天的新增量约为2.5TB。

    白春礼说,现在世界各国的大数据迅猛发展,全球数据总量每年倍增。“大数据已成为与自然资源、人力资源一样重要的战略资源。”

    中科院是中国科技界的一块“试验田”,它愿意在大数据建设和共享上一拭身手。

    (科技日报北京2月13日电) 

京ICP备06005116