2015年10月27日 星期二
学抓物,练调酒,学习软件做帮手
——机器人学习能力发展新动向
调制鸡尾酒的机器人
机器人巴克斯特

    本报记者  房琳琳  综合外电

    机器人在现代制造业上发挥着不可替代的作用,然而,更安全、更便宜特别是更智能的机器人还是供不应求。

    随着材料科学、计算机科学、大脑科学等领域的快速发展,机器人虽然距离科幻电影中的形象还相去甚远,但随着“学习”能力的不断提升,开发和拓展机器人与现实世界互动的科技实践,却无时不刻震撼着你我的眼球。虽然,每一次学习都只进步了一点点,但正是这“一点点”的进步,终将汇聚成未来的智能世界。

    美国《麻省理工技术评论》10月份以来发布了几篇有关机器人学习能力新动向的文章,或许对机器人发烧友来说,是个有趣的、跟踪最新技术方向的重要参考。

    “自学”抓取多种物品

    一般用途机器人的目标之一,就是与日常生活中的物品以智能的方式互动,但是机器人的抓取能力实在差到令人尴尬。让机器人捡起一个电视遥控器、一瓶水或者一个玩具枪,它都会无休止地去摸索,除非再编制一个让它在特定环境下捡起特定物品的程序。

    这与人类抓取东西的能力形成鲜明对比。一个人类婴儿能够在最混乱和非结构化的环境下,快速学会抓取特定的物品。

    那么,机器人能像婴儿那样通过反复试验和纠错来学习抓握吗?

    如今,卡耐基梅隆大学的里瑞尔·平托和阿波西纳威·敢普塔证明了这种可能性。他们为名为巴克斯特的机器人装载了深度学习功能,让它在堆满了一桌子的日常物品中,像婴儿那样坐在桌子前的高椅上自己学习。

    巴克斯特是一个现代化的两臂工业机器人,被设计成可在工厂车间环境下执行重复性任务。它的每个胳膊都由一个标准的两指平行爪和一个能让机器人看清楚去抓什么的高清摄像头,它还有一个微软Kinect传感器,提供一览无余的视角。

    平托和敢普塔为巴克斯特编程,通过与其他“邻居”隔离的方式单独抓取一个物品,然后在桌子上随机找到一个点,让机器人的两指平行爪旋转一定的角度后直接抓取这个物品。机器人随后会举起胳膊、通过力量传感器来明确抓握是否已经成功,这个过程重复188次,每次转换的角度是10度。

    为了让机器人更好地学习,平托和敢普塔在巴克斯特的桌子前面放了很多物品,并让它独自在那里一呆就是10个小时,中间不许人类干涉。如果机器人将物品掉落在地板上,桌面上还有很多替代的物品可以供其不间断地练习。

    巴克斯特的深度学习方法非常标准,研究人员为它装载了一个常规的神经网络,能够在学习抓握之前具备一些基本的对象识别技能。然而,仍有两个网络层面需要用于随机抓取经验的学习。

    研究团队利用第二个学习层面来改进巴克斯特的技能。在选取了一些基本的物品之后,他们提供给巴克斯特一些新的东西,里面有它见过的,还有对它来说全新的物件。

    超过700个小时后,巴克斯特对150种物品尝试了5万次抓取(包括未成功的抓取)。这些物品包括电视遥控器、很多不同的塑料玩具,还有一些大小类似的物品。这让巴克斯特可以预测出是否能抓取成功的几率达到80%。

    像使巴克斯特这样与世界产生互动的有趣研究将产生重要的影响。关键之处是,巴克斯特像人那样很容易就适应了杂乱的相对没有规矩的环境。更重要的是,抓握物品的技能基本上是靠自学完成的。

    当然了,巴克斯特和它的神经网络要像婴儿那样灵活自如还有很长的路要走。下一步需要学的技能是学习抓握的力度,这样在拿到脆弱的物品时不至于将之毁于一旦。

    可能最终对巴克斯特的测试会是挑战牙膏——将豆粒大小的牙膏挤在牙刷上。毕竟,这是人类从小要学会的很重要的一件事情。

    看视频学会调制鸡尾酒

    工业机器人要执行一个复杂的新任务,需要花上数周时间来重新编程,这让现代制造业生产线的重组变得十分昂贵和缓慢。

    如果机器人能够在胜任新工作之前看着别人先做一遍,整个进程可能会用“突飞猛进”来形容。这是美国马里兰大学执行的一个项目中的“点子”,他们正在教育机器人成为“勤勉的学生”。

    马里兰大学自主性、机器人与认知实验室的杨叶舟(音)说:“我们叫它‘机器人培训学院’。我们请专家给机器人演示一遍任务,并让机器人按照任务的流程完成大部分工作,然后微调一下完成任务。”

    在圣路易斯召开的一次相关会议上,研究人员展示了一个能调制鸡尾酒的机器人,正是用了上述方法完成了调制任务。这个拥有两个工业化机械手臂的家伙来自波士顿一家名为“重新思考机器人”的公司。一个人从几个瓶子中倒出液体后在一个小坛子里混合成一杯饮品,机器人观看了整个过程,复制下所有的动作,关键是,它抓起瓶子的顺序是正确的。

    这需要训练一个计算机系统与特殊的机器人动作相适应。该研究团队最近的一篇论文指出,一个机器人学会选取不同的物品,需要使用两套不同的系统来观看数千遍的教学视频,一个系统是学习如何识别不同的物品,另一个系统是明确不同类型的抓握动作。

    观看数千遍的教学视频可能听起来很费时间,但是学习的过程比重新对机器人编程效率高得多,重要的是,它很容易让机器人“上手”新任务。用于抓握动作的学习系统包含了先进的人工神经网络,这种技术近几年取得了快速发展,现在正如火如荼地被用于开发多种类型的机器人。

    研究人员正在向包括电子商务、汽车制造商在内的几家制造业公司推介它们的学习机器人,看是否能将这个新技术应用于工业生产。这些公司也曾为了拓展机器人工作任务找过工程师重新对机器人编程,但大多数都需要一个半月或者更长的时间才能搞定。杨叶舟说:“用我们的方法至少可以节省一半时间。”

    该项目反映了机器人行业的两大发展趋势,一个是找到机器人学习的新方法,另一个是机器人可最大程度地以人类工作的方式进行操作。

    机器人也用学习软件

    机器人技术的迅速推进,部分原因在于硬件,包括计算机芯片、传感器和执行器的研究进展,但是软件也同样推进了技术进步。例如,开源的机器人操作系统让工程师为机器人增加新的技能变得更容易,这样就不必要都从零开始。

    小孩子在蹒跚学步的时候能快速识别一顿美味或者避免抓住带刺的东西,近日发布的一个软件能让机器人通过经验学习而非编辑程序,也能如此智能。

    先进的机器学习软件,比如Brain OS能够让机器人看到更先进的技能,也能够让机器人学习更为先进的技术经验。

    Brain OS由一家位于美国圣地亚哥的移动芯片制造商高通公司支持的“大脑公司”开发。这样的软件最终让机器人更容易被使用。使用Brain OS的用户不需要编写新的代码或者访问图形用户界面,就能轻松地训练机器人做一些简单的任务,比如朝着特定的物体移动。

    对于机器人来说,在复杂的、不断变换的环境中稳定地工作是非常困难的事情,这就是要将学习能力变成可靠途径的一个重要原因。一些商业化的机器人已经能够进行简单的学习,但是Brain OS软件包含了一系列为机器人学习提供的工具,可以让机器人工程师更容易进入这个软件库,来为机器人获取诸如对象识别、导航和操作任务的程序。

    去年在波士顿举办的机器人会议上,大脑公司展示了这款软件,当时该公司用一个红色原型机器人拼装成一个由两只摄像头做眼睛的赛格威电动平衡车,它把一个对象展示给机器人,然后机器人能够跟随物体,不离不弃。

    Brain OS利用的学习能力包括给能模拟神经元和突触的虚拟网络提供信息,然后提供正面或者反面的反馈,这个过程被称为“监督学习”。近年来这种学习方法因非常有效而备受瞩目。

    大脑公司的执行副总裁托德·希尔顿在一份声明中说,机器学习软件大多数针对学术研究人员而不是工业工程师。“Brain OS通过提供接近原型的、可商业化的机器人应用中央技术框架来解决这个问题”。

    大脑公司还发布了一个由高通公司开发的被称为bStem(脑干的简称)的软件版芯片。该芯片可以用来设计模拟大脑工作的方式,并行存储和处理数据。这样的“神经形态”芯片可以被用来高效运行模拟神经网络,高通公司也是希望将这种技术商业化的公司之一。

京ICP备06005116