2016年10月20日 星期四
机器人道尽人生苦辣? AI还需“深度学习”
文·本报记者 许 茜
图为《Sunspring》剧照

    “这是一部你绝对猜不到结局、脑洞最大的科幻短片!”——这是一位观众对首部人工智能编写的影片《Sunspring》的评语。这部出现在今年6月的伦敦科幻电影节的影片,引起了人们极大的兴趣与关注,因为它的编剧“本杰明”,不是人。

    让人工智能(Artificial Intelligence:AI)编剧,是比会下围棋的谷歌AlphaGo更具挑战的尝试。

    影片的导演奥斯卡·夏普和来自纽约大学人工智能领域的研究者罗斯·古德温把几十部电影剧本输入进AI,让它自己“学习”。几秒钟后,AI就开始“唰唰”地写起剧本,最终他们按照机器人对人性的理解与表达,拍出这部影片。

    面对人工智能咄咄逼人的挑战,人类得以稳坐如山的底线,便是拥有复杂多变的情感。正是“自己都不知道为什么哭”之类毫无理性逻辑可寻的特质,让大部分人坚信机器永远只能扮演仆人的角色。这部非人类作品的出现,让我们不禁嘀咕:未来是可以预测的么?

    这是一道“语文”数学题

    人类编剧往往要经过苦思冥想,等待灵感一现;或是体察生活,将其升华为艺术创作。而编剧本在“小明” (本杰明的昵称)这里,没这么复杂。

    “其实,人工智能编剧就是利用机器学习技术实现语言文本的输出。”浙江传媒学院电子信息学院教授栗青生对科技日报记者说,它与前几年机器写诗的原理类似,不同在于现在使用了最新的人工智能技术,如机器学习、深度机器学习等。而“机器学习”是人工智能的一个分支,侧重于在数据统计分析基础上的行为模式研究。

    那么“小明”是如何学习的呢?“在学习这些剧本时,需要将剧本分为单词、句子及段落等,并作为分析的单元,这个过程被称为剧本的结构化,然后找到期间的关联模式及语义特性。”北京理工大学软件学院数字媒体技术系副教授张龙飞向记者解释。

    “这种关联可以是临近词之间的关联,也可以是上句与下句、上段与下段之间的关联。”从事AI研究的专家赵宇说。

    找到了关联,也就意味“小明”摸到了遣词造句的规律。“利用机器学习的方法,让机器自动分析已有剧本中组词和组句的规律,然后对未知的词句进行预测。”栗青生指出,对人的学习而言,我们常说“见多识广”,其实对机器学习也是一样。每一部剧本都包括有成百上千条的文本台词,而每一句台词中的字词搭配都有一定的规律,知道了这个规律,就可以让机器自动的组织这些台词文本,从而产生新的剧本。

    但,这还是一般意义上的剧本吗?“只能算是基于既有学习材料,根据统计学习预测产生的上下文语义关联性联结,使之形式上成为一个剧本。”赵宇直言不讳。

    从影片中不难看出,AI是憋足了劲往“科幻”上靠。在一个时空模糊的未来世界,注定要有人死去的悬疑背景、略显突兀的三角恋情、男主一言不合就自杀、吐眼球……这一切元素都让AI“硬生生”地融合在一起。其中,大段前言不搭后语的对白、跳脱的情节以及毫无逻辑的剧本结构,让网友看得是一脸懵,直呼“小明,人类真的不知道你在说什么!”

    看来,与其说“小明”编一个剧本,不如说它做了一道“语文”数学题。

    但栗青生却表示,应给予AI的“处女秀”更多包容。“机器的剧本创作现在还处在‘小学生’时代,要充分允许这样的‘小学生’去‘照猫画虎’‘比葫芦画瓢’。”

    那么,在专业剧作者眼中,“小明”的首秀能打几分呢?

    高路是中国传媒大学戏剧影视文学系副教授,同时也是影视编剧,曾撰写过十余部影视作品。在观看完九分多钟的影片后,他向记者坦言:“我不认为这是个电影故事。”

    “一个剧本的标准应该是按照逻辑讲述一件事,塑造人物并传递情感。”高路认为,就影片本身而言,该剧台词缺乏逻辑,看不到人物塑造,感受不到情感传递,甚至看不明白基本的逻辑关系。

    做“无厘头”是高智商的事

    那么,“小明”为什么会把剧本编得这么“雷”呢?答案可能令人笑出声:太守逻辑和规则的AI,学不会人类的“脑残”与“无厘头”。

    在影片中,男二号开场白就是“我要到头骨里去一趟”,显得莫名其妙;而男一号动不动就一句“我不知道你在说什么”,跟前后剧情毫无关系……

    在栗青生看来,“小明”尽管使用了目前最先进的机器学习技术,但还远没达到和人类的剧本创作一样的水平。“毕竟和机器人写新闻相比,机器人写剧本要困难得多。不仅要考虑文本台词的语言表达、还要考虑文本台词的情感表达,同时人物角色、语言环境等也是重要的考虑因素。”

    张龙飞更明确地指出,“雷剧”产生的原因在于,一是由于语义鸿沟,即计算机能看到的东西和人抽象出来的知识之间有或多或少存在区别;二就是学习的量不够。“机器学习都需要大量的、甚至是海量的样本进行学习,几十本的训练是严重不足的。”

    今年年初,击败围棋冠军的AlphaGo学习了大量职业棋手的棋谱,加起来多达3000万步。“但是围棋的规则简洁而确定,因此AlphaGo可以自创棋谱,在左右互搏中不断提高。相对于学习围棋,剧本创作复杂度高出很多量级,因此对学习内容要求的数量更多。”赵宇说。

    如果AI学得不够,还能“将勤补拙”,但是创新能力却是最头疼的。“创作的核心在于创新,而创新某种程度上就是要打破既有规则的约束限制,这无形中增加了机器学习写剧本的难度和复杂度。”赵宇认为,其实一个剧作家的创作不仅仅是通过学习大量剧本得到的,生活中的所见所闻、所听所想,阅读的小说、新闻、随笔、纪实等都可能成为创作的素材,因此要扩充学习内容,必须让机器涉猎剧本以外的各项内容。但由于其杂乱无章,无形中增加了难度。

    匹诺曹的故事尚无结局

    家喻户晓的《匹诺曹的故事》,包含着关于AI的多个隐喻。故事里爱撒谎的木头孩子,最终因为诚实而变为了真人。但在现实世界中,会撒谎的机器人,即便没有获得肉身,已然让我们感到颤栗。

    对“野心勃勃”的科学家来说,AI终有一日会摘掉“雷剧”的帽子。当然,坚持“人性至高”的人,并不会赞同。

    如果想让机器成为一名合格的编剧,其中一个技术瓶颈便是——编剧的创意能力能否被机器所替代。“目前的技术完全可以模仿某个著名编导的编剧风格,并对已有的剧本进行重新编排,但尚未有真正的创新出现。”张龙飞说,另一大问题是可以学习的编剧样本相对匮乏,不太满足海量学习需求。

    “学而不思则罔。”在栗青生眼中,比海量学习更紧迫的是提升机器对文本的理解水平,可是当前AI在语义理解方面还没那么“聪明”。

    “一词多义就是个老大难。”栗青生说,例如,在剧本中经常见到的两句台词“谁打的?”“我打的”,可以理解为“打人”“打字”“打车”和“打电话”等多种语境。此外,同义词辨析更是一道坎。“忠诚”“忠实”“踏实”和“实在”等词有相近的语义,在一定场合可以互相替换,但在用法上又有明显不同。

    要选择哪种意思?现在的AI只能是“傻傻分不清楚”。

    除了这些词语特点外,汉语语法的“时隐时现”更让机器“犯晕”。“有时自然语言必须遵循语法规范,但有时语言又可以突破语法限制,产生新的表示和新的用法。”栗青生说。

    显然,目前的AI编剧还谈不上“合格”,但张龙飞觉得那一天并不远。“或许机器不能成为一个开创性的编剧大师,但应该不会成为一个低于平均水准的编剧。”

    张龙飞透露,目前国内已有团队在研发编剧机器人。“该机器未来也许不仅能胜任编剧,还可评估该剧本的受众群体是哪些人,票房如何,并能根据不同的观众、演出地点、时令等对同一个剧本进行适应性修改,以便满足个性化观众需求等。”

    科学家们信心满满,但高路却觉得“可以成为助手,但无法完全取代人类”。他认为,机器也许能创造出某几种类型的故事,并且辅助人类研究观众的审美喜好,但无法全面替代人脑的艺术感知和情绪表达的能力。“对于AI能否传达人类情感,让观众产生心理共鸣,并展现出哲学高度的主题内涵,我持谨慎的态度。”

京ICP备06005116