作为人口大国和制造大国,我国数据产生能力巨大。
党的十八届五中全会将大数据上升为国家战略。在十三届全国人大常委会近日举行的专题讲座上,中国人民解放军军事科学院副院长梅宏在回顾过去几年我国大数据发展现状与未来趋势时总结:“进步长足,基础渐厚;喧嚣已逝,理性回归;成果丰硕,短板仍在;势头强劲,前景光明”。
预计2020年我国数据总量占全球1/5强
随着数字中国建设的推进,各行业数据资源采集、应用能力不断提升,将带来更快更多的数据积累。
梅宏介绍,预计到2020年,我国数据总量有望达到8000EB,占全球数据总量的21%,将成为名列前茅的数据资源大国和全球数据中心。
我国一些互联网公司建成了具有国际领先水平的大数据存储与处理平台,并在移动支付、网络征信、电子商务等应用领域取得国际先进甚至领先的重要进展。随着政务信息化的不断发展,各级政府积累了大量与公众生产生活息息相关的信息系统和数据,并成为最具价值数据的保有者。
在科研投入方面,前期通过国家科技计划在大规模集群计算、服务器、处理器芯片、基础软件等方面系统性部署了研发任务,成绩斐然。“十三五”期间在国家重点研发计划中实施了“云计算和大数据”重点专项。我国已经具备加快技术创新的良好基础。
大数据治理体系尚待构建
“我们也必须清醒地认识到我国在大数据方面仍存在一系列亟待补上的短板。”梅宏首先提到,目前我国尚无真正意义上的数据管理法规,难以满足快速增长的数据管理需求。
推动数据资源共享开放,将有利于打通不同部门和系统的壁垒,促进数据流转,形成覆盖全面的大数据资源,为大数据分析应用奠定基础。
讲座中梅宏提到,我国政府机构和公共部门已经掌握巨大的数据资源,但存在“不愿”“不敢”和“不会”共享开放的问题。
例如:在“最多跑一次”改革中,由于技术人员缺乏,政务业务流程优化不足,涉及部门多、链条长,长期以来多头管理、各自为政等问题,导致很多地区、乡镇的综合性窗口难建立、数据难流动、业务系统难协调。同时,由于办事流程不规范,网上办事大厅指南五花八门,以至于同一个县市办理同一项事件,需要的材料、需要集成的数据在各乡镇的政务审批系统里却各有不同,造成群众不能一次性获得准确的相关信息而需要“跑多次”。
在数据共享与开放的实施过程中,各地还存在片面强调数据物理集中的“一刀切”现象,对已有信息化建设投资保护不足,造成新的浪费。
此外,近年来,数据安全和隐私数据泄露事件频发,凸显大数据发展面临的严峻挑战,融合应用有待深化。
共享开放是大数据资源建设的前提
“大数据是数字经济的关键要素,强大的信息技术产业和全面深度信息化赋能的传统行业无疑是数字经济的基础。”基于自己在大数据领域的研究实践,梅宏建议,大数据治理须从营造大数据产业发展环境的视角予以全面、系统化考虑。
在国家层次,重点要在法律法规层面明确数据的资产地位;在行业层次,重点要在国家相关法律法规框架下,充分考虑本行业中企业的共同利益与长效发展,建立规范行业数据管理的组织机构和数据管控制度;在组织层次,重点要提升企业对数据全生命期的管理能力,保障企业自身的数据安全及客户的数据安全和隐私信息。
“在数据治理体系建设中,数据共享开放是大数据资源建设的前提,在现阶段重要性尤其突出。”梅宏认为,在平衡数据共享开放和隐私保护、数据安全的关系时,还需要强调应用先行、安全并重的原则。