2015年04月01日 星期三
王宏志:用科研力量拴住大数据这匹野马
文·本报记者 段 佳

    ■第二看台

    “在‘大数据时代’这个互联网开放共赢、互联互动的时代,作为从事大数据研究的科研人员,我们的任务是要让研究成果成为拴住大数据这匹‘野马’的重要力量,使大数据更好地为人民的生活和社会的和谐服务。”哈尔滨工业大学计算机科学与技术学院副教授、博士生导师王宏志笑着解释了自己从事的大数据研究工作。

    2012年,《纽约时报》称“大数据”时代已经来临;2013年,有媒体称,这一年是世界的“大数据元年”。而早在2011年,王宏志已经很深地介入了大数据的研究。2011年,他在微软亚洲研究院期间提出的海量图数据的匹配算法,在国际上首次将子图匹配算法扩展到了规模为10亿级别的图上,该算法于2012年发表以来,已被引用超过60次,并已经进入微软亚洲研究院的Trinity系统。

    王宏志长期从事大数据管理算法和系统的研究,主要集中于复杂大数据的管理与计算,以及大数据质量管理方面。在复杂数据管理方面,他提出了一系列XML大数据和大图管理方法,博士论文《XML数据查询处理技术的研究》获得哈尔滨工业大学优秀博士论文和中国计算机学会优秀博士论文。

    梅花香自苦寒来。熟悉王宏志的人都知道,王宏志的成功并非偶然。在孜孜不倦地学习追求和更高境界的学术探究中,王宏志付出了艰苦的努力。但王宏志自己觉得,那些经历都是他人生的宝贵财富,科研的坚实基础。2004年,王宏志作为访问研究助理在新南威尔士大学学习深造;2006年,他又来到新加坡国立大学进行实习交流。经过长期的积累和历练,2008年,他于哈尔滨工业大学计算机软件与理论专业获得博士学位,随后留校任教。这期间,王宏志还作为“铸星计划”访问学者和博士后分别在微软亚洲研究院和美国加州大学欧文分校进行了访问交流。

    “大数据是一把双刃剑,在给人们带来更加丰富的资讯的同时,其质量问题也成为日益凸显的问题,对社会及个人造成一定威胁。”王宏志说,正是看到了大数据“野马”的“个性”,早在几年前,他和他所在的科研团队便开始致力于大数据科研,并取得了系列的成果,也更加坚定了他们拴住大数据这匹“野马”的信心。

    王宏志说,针对大数据质量这一大数据管理中的痛点,国家已经有了足够的重视和科研布局。在国家重点基础研究发展(973)计划和863计划的支持下,王宏志作为技术负责人,带领团队开发了适用于大数据的并行数据清洗系统,用于解决大数据中的多种数据质量问题。围绕该项工作中发现的理论和技术问题,王宏志还作为项目负责人获得了国家自然科学基金的资助。目前,王宏志正承担着“大数据错误检测与修复关键技术的研究”及国家科技支撑计划项目“基于大数据的综合健康服务关键技术研究与应用”。

    王宏志认为,大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。在王宏志看来,大数据科研的目的和结果,最终是为现实工作和生活服务。王宏志说,他正在进行的“基于大数据的综合健康服务关键技术研究”项目,就是要将研究成果应用于“智慧医疗”和“健康服务”这一热点领域。

    王宏志说:“虽然大数据还处于初级阶段,但由于广泛的应用前景,大数据将深刻改变你我的未来。”

京ICP备06005116