做过科学研究的人都清楚:一篇只有十几页的论文,背后的各种实验数据可能会有成百上千页。这些隐含了科研工作者大量心血的数据,最后的归宿往往都是在科研人员的个人电脑中“沉睡”。
如果把这些数据开放共享,不仅可以提高科研效率,而且可能产生难以预料的社会和经济价值。《中共中央关于制定国民经济和社会发展第十四个五年规划和二〇三五年远景目标的建议》明确提出,将“构建国家科研论文和科技信息高端交流平台”作为强化国家战略科技力量的任务之一。
“但科研数据往往都成为生产者的‘私产’,作为科学研究的重要组成部分,科研数据共享仍是一块难以融化的‘坚冰’。”全国两会期间,全国政协委员、中国科学院院士、《中国科学数据》主编郭华东对科技日报记者坦言。
没有自己的平台就只能依托别人
17世纪第一批科学期刊创建以来,逐渐形成了研究结果公开发表与开放交流机制。然而,受限于当时的媒介及传播技术,以期刊论文为典型代表的研究成果在发表时,作为研究结果证据的数据不得不被精简和极度省略。
近年来,随着信息技术的飞速发展,我们已经具备了把翔实的科学数据公开的技术条件。如今,科学数据走出“深闺”,成为科学研究的亮点和法宝,推动产生新的科学发现成为可能。
对于科学数据公开共享的作用,郭华东解释道,一方面,作为研究成果的证据,数据是重复科学试验、确保研究成果真实可靠的检验基础;另一方面,大数据时代,科学研究正在从模型驱动向数据驱动模式进行转化,许多学科领域的科学发现以数据为基础。同样的数据,采用不同的研究视角或不同的挖掘工具与分析手段,可能会有不同的发现。因此,科学界和出版界日益认识到科学数据开放共享的必要性。
与此同时,作为科研论文的载体,科技期刊为研究成果提供了一个同行交流的平台,直接体现国家科技竞争力。
“这些年,在国家的大力支持下,我国的科技期刊进步非常明显,不少期刊的影响因子提高很快,说明发表在期刊上的论文引起了科学家们的广泛关注,但与西方的一些著名杂志相比,我国科技期刊的影响力还是有差距。”全国政协委员、中国科学院院士、中科院理论物理所所长蔡荣根告诉科技日报记者。
蔡荣根表示,学术期刊不仅仅是学术成果的交流平台,实际上事关我国的学术话语权,我们必须做强自己的科技期刊。
郭华东也认为,我国科技期刊水平需要进一步提高。“虽然这些年国家大力支持科技期刊发展,但我国的科技期刊与国际科技期刊的水平还有相当大的差距。”郭华东说,全球知名的期刊数据库被世界几大出版集团垄断,我国也缺乏被国际上广泛认可的有影响力的期刊数据库。
“目前,期刊论文和科研数据的高端交流平台,都是西方人占据主导地位。如果我国没有自己的高端平台,那就只能依托别人,这就会形成一种虹吸效应,越来越多的优秀论文和数据都会投到国外的平台。”中国科学院计算机网络信息中心研究员、《中国科学数据》常务副主编黎建辉强调。
平台建设是一项战略性和基础性工作
因此,“我国提出构建国家科研论文和科技信息高端交流平台,这个平台建成后,能够为服务国家战略科技布局、强化国家战略科技力量提供信息化基础环境,进而助力创新型国家建设,实现科技自立自强。”郭华东说。
他强调,除了提高研究结果的可检验性和公信力以保障科学的自我修正能力之外,科学数据的开放共享还能为更多的科学研究提供丰富的基础材料,扩展科学研究的范围,扩张科学研究的视角,产生更多的科学知识,以及使它们可以为科研以外的生产活动开发利用,产生难以预料的社会和经济价值。
“我们自主研发的科学数据银行,就是一个论文关联数据存储平台。”黎建辉举例说,这个平台能够为论文关联数据的汇聚、管理、开放、共享提供高效的解决方案,为落实科研诚信、培育共享文化、加快数据流转和促进国际合作提供平台和服务保障。
2020年,科学数据银行被施普林格·自然列为推荐的通用型数据存储库。截至目前,该推荐单元仅有7家存储库,科学数据银行是国内唯一一家。
“有了自己的平台以后,我们的论文支撑数据就可以存放到自己的平台,为我国科学家服务,甚至为全球科学家服务;同时,只有有了平台,中国的科学家才可以参与国际上类似平台相关国际规则的制定,才能发出中国自己的声音。”郭华东说。
蔡荣根表示,总体上说,我国科技期刊的水平还赶不上科学研究的水平。国家重视科研论文和科技信息高端交流平台的建设,是办好科技期刊的第一步,同时也要在经费上给予足够的保障,更重要的是,还要鼓励科研人员把优秀论文投给国内科技期刊,特别是一些大科学工程和重大科学项目产出的重要科技成果。
郭华东认为,国家科研论文和科技信息高端交流平台的建设,是一项战略性和基础性的工作,需要国家长期持久支持。同时,平台也需要通过长期持续的数据积累才能展现出其内在的应用价值。