2014年中国地震专题新闻的空间分布 |
据不完全统计,七成以上的网页信息中都蕴含有空间位置信息,这些位置信息承载着网页新闻事件所发生的时间、地点,甚至可用以推断事件产生的历史以及事件间的关系。传统的信息搜索引擎以网页列表的形式将搜索结果展示给用户,虽然简洁有序,但缺少时空概念,不够直观。为了突破传统搜索技术的不足,中国科学院地理科学与资源研究所联合南京师范大学、武汉大学、中国科学院遥感与数字地球研究所、中国标准化研究院、首都师范大学等单位开展了泛在空间信息关联更新与面向主题空间数据挖掘分析关键技术的研究,成功实现了地图化专题搜索技术,并研制出相应的原型系统。与传统的搜索引擎相比,地图化专题搜索具有以下几方面的特色与优势。首先是具有针对文本的时空信息解析能力。地图化搜索技术全面融合语义知识,突破了针对中文的地名、时间、空间关系、事件要素等专题信息的抽取技术,可以将网页文本转化为结构化的时空信息。其次,搜索结果实现了专题信息的重构与时空可视化。地图化专题搜索结果不是传统搜索引擎的网页列表,也不是简单的专题信息结构化列表,而是将解析过的时空专题信息映射到地图空间,通过事件重构技术与地图可视化技术,以热点图、密度图、轨迹图等方式还原专题事件的演变过程。第三,实现了空间信息提取的智能化。地图化搜索采用人工智能和数据挖掘技术完成对文本中信息的智能化提取,按照不同的本体结构萃取出了相关的专题信息,实现了新闻事件的历史追溯、综合分析和多重关联。地图化专题搜索关键技术实现了从海量网页中提取专题事件信息,并以动态专题地图的形式对搜索结果进行可视化展示,是地理信息系统领域、自然语言处理领域与智能搜索领域跨界融合的成果,从本质上改变了传统搜索引擎的检索和表达方式,为下一代智能化、图形化、专题化的互联网搜索引擎提供了关键技术积累。目前,地图化专题搜索系统已部署在中国搜索新闻地图平台上,成功应用于网络舆情监控、自然灾害(地震、暴雨、泥石流)评估、流感案例收集等领域,未来在国家重大需求服务以及民用等方面具有广阔的应用前景。