2019年03月29日 星期五
三位深度学习之父共摘“计算机界的诺贝尔奖”
图灵奖后,深度学习呼唤深度理解
本报记者 刘园园
深度学习领域三位先驱——约书亚·本吉奥、杰弗里·辛顿和雅恩·勒昆荣获2018年图灵奖。图片来自网络

今日视点

    当地时间3月27日,美国计算机学会宣布将2018年图灵奖颁发给深度学习领域三位先驱——约书亚·本吉奥、杰弗里·辛顿和雅恩·勒昆,以褒奖他们推动深度神经网络成为计算机技术的重要组成部分。

    图灵奖素有“计算机界的诺贝尔奖”之称,三位获奖者也都是人工智能领域大名鼎鼎的科学家。本吉奥是蒙特利尔大学教授,辛顿是谷歌公司副总裁、多伦多大学名誉教授,勒昆是纽约大学教授、脸书公司首席人工智能科学家。

    “人工智能目前是所有科学领域中发展最快的学科之一,也是当今社会最为热议的话题之一。”美国计算机学会主席切里·潘凯克说,这很大程度上归功于深度学习领域近年来取得显著进展,而这一领域的基础是由本吉奥、辛顿和勒昆奠定的。

    将单层神经网络拓展成多层

    要解释三位科学家的贡献,首先得说说人工神经网络。

    所谓人工神经网络,是指模仿人的神经机制,在计算机中模拟出一层或多层被称为“神经元”的计算单元,使它们之间通过加权连接而互相影响。通过改变这些节点的加权值,可以改变人工神经网络的计算性能。

    本吉奥、辛顿和勒昆认识到通过搭建多层神经元,形成比较“深”的人工神经网络的重要性,这正是“深度学习”一词的由来之一。

    “三位获奖者确实可称为深度学习领域的奠基人。”中科院自动化所模式识别国家重点实验室研究员宗成庆接受科技日报记者采访时说,早期实现的神经网络是单层的,他们把单层神经网络拓展成多层并付诸应用,在图像识别、语音识别和机器翻译等很多任务上都取得了不错的效果。

    “通过大大提高计算机理解世界的能力,深度神经网络不仅在改变计算机领域,也在改变科学和人类行为所涉及的每一个领域。”谷歌高级副总裁杰夫·迪恩说。

    从不被认可坚持到产业爆发

    上世纪80年代,科学家开始使用人工神经网络模型帮助计算机完成模式识别任务,并模拟人脑的智能。辛顿、本吉奥和勒昆一直把这种思路坚持到本世纪,尽管起初他们的想法不被认可。

    “计算机科学界已认识到这种方法并不离奇,这是好事。”辛顿在接受英国广播公司(BBC)采访时说,多年来大家都觉得人工神经网络不值一提。

    辛顿自上世纪80年代早期就开始倡导机器学习方法,他和其他科学家提出将“人工神经网络”作为机器学习研究的基石。现在,深度学习已在人工智能领域被普遍采纳。

    “很大一部分原因是计算机性能有了根本性提高。”宗成庆告诉科技日报记者,上世纪八九十年代人工智能出现一波热潮,但当时计算机的存储容量、计算能力都十分有限,只能计算单层神经网络。如今计算机性能大大提升,再加上有海量数据支撑,在多层神经网络中训练大规模数据得以快速实现。

    深度学习仍待更大突破

    “深度学习技术目前在计算机领域的应用非常普遍。从应用角度看,这种方法确实可使很多任务的处理取得最优结果。”宗成庆说。

    但在宗成庆看来,已得到广泛采用的深度学习技术未来仍需更大突破。

    抛开其进展不谈,现阶段深度学习技术还无法让计算机像人一样去深度理解语言、语音和图像。比如,智能手机助手看起来口齿伶俐,却并未真正理解我们的话。假如对它说“臭豆腐真香啊”,它的答复会莫名其妙,或者给出怎么理解都不错的答案。

    宗成庆认为,以自然语言理解为例,下一步的方向是让机器在语义、概念上进行推理和计算,而不仅停留在对信号层面的处理。这就涉及很多神经科学、认知科学和计算科学结合的问题。

    与此同时,人工神经网络依然是个“黑箱子”,可解释性比较差。让它将英文翻译成中文,如果出现错误,是哪个环节导致错误依然难以解释。处理特定任务究竟需要几层神经网络才能实现最佳,也没有合理解释,只能依靠经验和实验大量地测试。

    “深度学习技术将经过一段时间的发展逐渐趋于成熟,进入比较平稳的平台期。进一步突破需要对人工神经网络进行较大改进,或者在包括脑科学在内的多学科交叉研究的基础上提出新的模型和方法。”宗成庆说。

    (科技日报北京3月28日电) 

京ICP备06005116