面对大数据,仅凭智力与经验对城市动态做出预判和决策,人脑显然力有不逮。人工智能可否帮把手?
郑宇和他的团队,正在试图用“城市计算”回答标题里的问题。
在不久前结束的“AAAI 2017国际人工智能顶级学术会议”上,微软亚洲研究院主管研究员郑宇发表了研究论文《运用时空深度残差网络进行城市人群流动量预测》,这是全球真正把深度学习有效用在时空数据上的第一个研究成果。
促动他开启这项研究的,是2014年新年夜发生在上海的踩踏事件。
深度学习预测城市人流
“上海的踩踏悲剧完全可以通过基于手机数据的城市异常检测来避免。城市计算领域相关的研究已经成熟。是时候加快计算的产业化了。”在2015年的微博中,郑宇这样写到。而今年2月7日,郑宇公布了他发表的基于深度学习的城市人流预测的论文、数据和代码,证明了技术的可行性,兑现了上海踩踏事件后他作出的承诺。
所谓城市计算,指的是计算机科学以城市为背景,将城市规划、交通、能源、环境、社会学和经济等学科融合的新兴领域,这是一个通过不断获取、整合和分析城市中多种异构大数据来解决城市面临的挑战的过程。
郑宇对科技日报记者说:“人流量控制在很多地方都非常需要,比如机场、地铁站等。它能降低事故发生的概率,但预测人类的行为非常困难,要求建立许多相关性,融合许多的数据,传统的方法已难以应对大规模的人流预测。城市计算能帮助城市管理者理解问题的现状、预测未来和考究历史。”
如今,微软和贵阳市政府共同成立的“块数据”实验室,正在通过融合多源数据来解决城市问题。“块数据”实验室的大屏幕上,不间断更新着数据,实时预测着贵阳市被划为“一公里乘一公里的格子”的每个区域有多少辆出租车进出,以此为模型预测整个城市某区域人群流动接下来十几个小时呈现的状态。
出租车是一种人流的表达,地铁刷卡记录、公交车、手机基站信号、微信等其他应用也是一种人流的表达。无论是单独使用还是综合使用,都可以通过该系统模型进行运算并预测,从而使管理者迅速了解每个区域的公共安全状况,及时采取预警措施。
郑宇说:“如果在上海市踩踏事件之前,我们应用了这样的系统,就可以提前给民众发信息,告知他们这里会有多少人进来,提醒注意是否需要提前离开。”
空气监测准如天气预报
利用城市中的一切传感器来感受城市的动态,并利用所得数据进行分析和计算,预测未来空气质量情况,是城市计算为人们带来的又一福利。
郑宇的研究成果之一,就是通过城市计算,实时监测和预测城市某一点位的空气质量指数。据他介绍,空气会受很多因素影响,如气象条件、车流量、建筑密度、土地使用规划、附近有无厂矿或公园等,这些因素直接导致一个城市里各个地方的空气质量差别很大。
因此,要预测一个地方的空气质量,并不能单纯只看这个地方本地的数据,而要考虑到周边地区的空气及其他因素。因此,与传统模拟空气质量不同,大数据预测空气质量依靠的是基于多源数据融合的机器学习方法,不同领域的数据互相叠加,相互补强,从而预测空气质量状况。
“从预测的准确率看,现在已可做到北京未来6个小时的时间范围内达到75%,深圳和广州达到80%。”郑宇表示,未来希望北京48个小时的预测准确率能达到50%。达成这个看似不高的比例并不容易,目前天气预报24小时的准确率只有40%。
据了解,微软在已推出Urban Air系统,通过大数据来监测和预报细粒度空气质量,该服务覆盖了中国的300多个城市,并被中国环境保护部采用。同时,微软也已经和部分其他中国政府机构签约,为不同的城市和地区提供所需的服务,可对京津冀、长三角、珠三角、成渝城市群以及单独的城市进行未来48小时的空气质量预测。
化解大城市的噪音困扰
除了空气污染,噪音对城市的困扰日益严重。郑宇职业生涯中印象最深刻的一件事是作为项目负责人,同纽约大学合作,整合纽约市的地理信息、社交媒体和城市居民的反馈数据来分析城市噪音污染的构成和状况,帮助政府治理城市噪音。
郑宇说:“用传统的方法解决噪音问题非常困难,因为传统技术通过撞击传感器来监测噪音。但噪音是声音上的变化,在时间和空间上的反应非常剧烈,并且可能一瞬即逝。此外,传感器并不能让你知道噪音污染的原因。”
与自然语言分析和图像处理等“单数据单任务”系统相比,城市计算是一个“多数据多任务”的系统,涉及城市感知及数据捕获、数据管理、城市数据分析、服务提供等环节。具体到噪音的监测,郑宇认为需要在100平方米的范围内,甚至更小的区域内装一个传感器,这样算下来整个纽约市可能需要装约100万个传感器,可行性不大。此外,对于噪音的定义和人的感受有着非常紧密的联系。比如,白天人对噪音的容忍程度和夜里会有明显的区别。因此,还需要考虑人的感受。
郑宇给出的解决方法是利用美国人工投诉热线311电话记录的投诉原因和地点,把人变成噪音监测的传感器,既能为噪音给出准确的定义和分析,也能为政府及时提供有效管理建议。此项目得到了前任纽约市市长布隆伯格和前美国能源部副部长的大力支持,积累了跨部门合作和以及数据整合的经验,在世界上最繁华的大都市检验了城市计算的实战效果。
郑宇表示,城市的设置太复杂,牵一发而动全身,深度学习在时空数据上的探索,也还有很多问题待解决和深挖。
“传感器技术的发展和大规模的计算环境的成熟,使人类占有的数据越来越庞大,但我们的目的不是要拥有,而是要解读。”他说。