2014年09月17日 星期三
互联网地图是如何产生的?
安吉

    一北京市民在交通高峰期从二里庄开车前往大望路,按常规行驶路线行走,耗时将超过1小时;某天道路发生事故,环路堵死,在“准确”的道路上行驶,耗时未定……很显然,地图的“准”已不仅限于路线无误,还须能实时动态地提醒用户,走一条更快更省时的道路。“准”的极致是实时,实时的基础是动态数据,而利用动态数据则需渗入应用、云端服务、软件、数据等地图产业全层面。凡是“准”的地图,必经四重境界:数据发现、数据采集、数据处理、数据发布。

    数据发现:众里寻他千百度

    大数据的一大悖论是,一款地图产品越成熟,数据发现的难度越高。数据越来越多,面积数据中所需成分越来越小,存精程度成倍增加。十余年,从起步到多年盘踞国内手机市场,高德逐渐形成了多种信息发现方式,包括情报搜集平台LSE、API轨迹分析、卫星影像自动识别、UGC反馈以及浮动车等多种方式。

    在移动互联网时代,高德地图独创国内众包的数据采集形式,主要包括浮动车和UGC反馈。安装了车载GPS定位装置并行驶在城市主干道上的公交汽车和出租车则是主要的浮动车。目前高德在全国拥有几十万辆出租车及几百万辆物流车的行业浮动车数据,发现和反馈道路交通中的实时状况。对于难以通过浮动车采集路况数据信息的城际高速,高德地图则可以通过众包的力量来解决。

    数据采集:千里之行 始于足下

    每个采集员,都在用脚步丈量世界。不管是车辆采集、步行采集、互联网采集,还是企业用户、航空摄影测量及卫星影像、呼叫中心,千里之行都始于足下。目前高德拥有几十辆数据采集车,能够收集电子眼、方向信息、道路名称、车道数、行车标线等道路信息。

    最原始的采集方式是步行采集,工作人员手持PDA和相机前往商厦、学校、商场、银行等场所拍摄照片,再录入到数据采集系统。虽然高德拥有国家甲级导航电子地图测绘资质,但采集员在进行步行采集时仍会面临“轰出门”的遭遇,比如银行,他们甚至误以为采集员是要打劫银行。

    由于新浪微博、阿里巴巴等企业LBS业务均采用高德地图数据,通过这张撒在互联网上的“网”,高德得以收到大量来自用户的反馈——这是基于互联网的采集方式。据了解,每位高德“增值事业部”员工每天能够处理150条左右的报错反馈,每月可处理约2300条报错反馈。

    通过物流公司运输车辆上的GPS导航仪,同样可以发回数据,这是企业用户数据采集。如今有30多万辆物流车在给高德回传数据,使得高德能够及时更新数据,让地图数据更加准确;与此同时,北京有6万辆出租车使用高德导航服务,并传回大量数据。

    租借飞机进行航空摄影测量是采集中最高端的做法,目前市场上提供商用的三维地图主要是卫片(卫星拍摄),其分辨率近50公分。目前高德已经为56个城市绘制了超过7500平方公里的三维模型,精度为厘米级别,通过航拍和实采完成。

    数据处理:千锤万凿出深山

    所有道路数据都是高德采集员一个一个跑出来的。或许,用一些令人叹为观止的数据更能让你感受到这个过程的艰巨。目前,高德累计生产了超过400种道路属性信息、超过7500平方公里三维模型数据、近5000万个POI地标信息,以及近520万公里导航道路数据——可环绕地球赤道达130周之多。

    数据处理可分为导航数据生产和增值数据生产。在导航数据生产中,值得一提的是背景生产。“背景”是指除了道路和建筑之外的山、河、湖、水等“为导航作背景衬托”的物体。增值数据生产包括了运营POI和深度动态信息。所谓运营 POI是指给相关POI信息做专页,比如在地图上集中展示北京的中国银行,这可以帮助POI更直接地展示信息。而深度动态信息,则指详细展示POI点的信息,比如对于一家酒店,不仅仅是导航到这里,而且展示其文字介绍、房价、电话等,同时也展示基于位置的优惠等服务信息。

    数据发布:轻舟已过万重山

    地图的极致是实时更新。每分钟用户正在行驶的道路发生什么变化,会对我的行驶有何影响,这都是需要基于快速的数据迭代才能实现。面向车厂,高德主要月度发布;面向互联网,这种数据迭代已经需要小时级发布;面对移动互联网,甚至能做到以分钟级更新。

    经过众里寻他的“发现”、始于足下的“收集”、千锤万凿的“处理”,等到发布过程,发现轻舟已过万重山——数据分秒流逝,车辆行人分秒流逝。高德发布的数据主要面对车载/前装、无线位置服务、移动导航、互联网位置服务以及政府及企业应用等市场。

    在移动导航领域,用户需要数据够重、产品够轻,尤其是面向消费级的移动App。易观数据显示,截至2014年第二季度,高德地图以33.4%的份额稳居手机地图市场第一,这是高德地图继2011年第四季度超越谷歌地图后,连续十一个季度领跑中国手机地图市场。

京ICP备06005116