本报记者 王延斌
试想一下,你上网浏览网页、逛淘宝的记录、戴手环的健康数据、摩拜单车骑行位置数据有一天将成为“商品”,也能像房子、汽车一样出售。
“这不是异想天开,而是已经部分实现的现实。”大数据专家、浪潮云服务集团总裁王洪添在接受科技日报记者采访时如此表示。作为刚获批建设的大数据流通与交易技术国家工程实验室主要负责人,在接下来几年里,他和同事们的任务便是解决大数据交易过程中的比如流通不畅、标准不明、数据质量参差不齐等“瓶颈”,并从技术上攻关,为企业和国人创造“新财路”。
超越传统BAT的将是一家大数据公司
“现阶段,个人数据本身目前尚难买卖,但已经有部分机构和企业通过出售大数据报告或其他应用获益。”王洪添说。
记者了解到,2015年4月,由贵阳市国资委间接出资建设的贵阳大数据交易所挂牌运营,成为国内第一家大数据交易所。4个月后,华中地区第一家数据交易所——长江大数据交易中心落户武汉,此后上海、江苏、广东等数据交易服务平台陆续成立。
大数据伴随着人类网络行为而生,它们或来自社交网络,或来自电商网站,或其他来源。有关部门、单位通过采集这些数据可更有针对性地生产和销售。根据2016中国大数据创新应用大会披露的数据,目前我国大数据产业规模可达1500亿元,到2020年将达到8000亿元的规模,实现几何级增长。
王洪添甚至认为,“未来大数据交易将成为像淘宝实物商品交易一样旺盛的行业,超越传统BAT的将是一家大数据公司,而大数据流通与交易技术国家工程实验室的目标便是要建立一个大数据交易平台,上游的数据可以在平台上进行交易,下游企业可以利用平台数据进行数据挖掘。”
“为什么每次你逛完淘宝、京东之后,你搜索的信息在之后时不时弹出在页面上,这是大数据的表现形式之一。”浪潮云服务集团副总裁吴向辉提醒记者,“这里面的问题在于,如果弹出的网页包含着你的名字、身份证号等信息,这些网站就涉嫌违法。”
确立产权是大数据发展的瓶颈之一。“大家都在生产数据,但有产权意识的人并不多。”王洪添表示,“明确产权是大数据标准化的重要部分,比如要明确骑行数据的拥有者应该是摩拜还是用户个人,这就需要首先界定数据是否涉密,同时还要对数据的质量制定标准,哪些价值高,哪些是垃圾信息,这些明确后,市场主体才能对大数据进行交易定价。”
瞄准大数据产权认定标准的缺位,眼下正成为大数据流通与交易技术国家工程实验室的任务之一。“无论共享单车的骑行数据、智能手环的健康数据,还是平时网购的支付数据或其他电子消费数据,虽然都通过智能设备上传给商家免费使用,但未来这些数据有望通过法律形式明确其产权归属——待数据‘私有化’之后,商家需要向个人付费才能使用。”王洪添说。
这个实验室最有条件解决产业化难题
“国家现有的十几家数据交易所像一个集市,人来人往,卖数据的人和买数据的人各取所需。”王洪添认为,这里面有两个问题:
第一,标准不统一。“很多手机里都装有导航APP,它可以记录个人行驶位置和数据,而这些数据对导航厂商是有价值的,这也意味着可以买卖。但如何买卖?怎样定价?有何标准?”
第二,技术问题没解决。现在大数据的两端需求旺盛,中间却卡壳。“这种情况就好像上端炭商希望把煤炭卖出去,下端需求侧希望得到这些炭,但关键问题是现在大部分的炭都埋在地底下,如何挖出来就是个问题。”
“可以说,之前国内十几家数据交易所,大家标准不一,群雄逐鹿,大数据流通与交易技术国家工程实验室最有条件将混乱的标准统一起来。”王洪添说。
大数据的流通和交易过程大体是“数据采集—加工—梳理—卖出去”,王洪添认为简单形容这一过程就像“图书馆到全国各地出版社采集书,运过来需要按照文学、历史、军事、哲学等等分门别类摆放到不同的架子上,然后还要想尽办法销售出去,这个过程每个环节都蕴含着技术难题。”
资金支持是实验室的优势之一,但更关键的是它最有条件调动全国科研资源攻关技术,解决产业化难题。
本报记者了解到,以该实验室为依托,浪潮已经联同上海数据交易中心、中国科技大学、中科院计算所、中国电子技术标准化院、云上贵州大数据产业公司,全力推动社会大数据的网络化共享、集约化整合、协作化开发和高效化利用。