2022年06月17日 星期五
该来的终究会来
——关注AI写作(上)

    □ 郑 军

    编着按 随着人工智能(AI)技术的飞速发展,机器写作逐渐进入人们视野。有人对这一新生事物充满期待,也有人对此表示担忧。那么,当前机器写作已经进展到什么阶段?能否瞒天过海代替人类写作?相较于人类写作有何优劣?未来会往什么方向发展?本报将刊发专家文章对当下机器写作相关问题进行深入探讨。

    高考语文考试刚结束,百度公司的数字人“度晓晓”就拿出了自己的答卷,名叫《苦练本手,方能妙手随成》。一时间众人称奇,有的评分老师还给出48分。

    其实,“度晓晓”是一款互动软件,写文章并非主业。百度为它花费的主要精力是制作外形,设计互动手段。即使如此,作为一个附带功能,“度晓晓”仍然能迅速生成一篇读得通的文章。

    那么,AI真的已经发展到代替人类写作吗?是的,完全如此!

    了解AI的朋友都知道“图灵测验”:让测试者在分隔的情况下向被测试者提问,根据对方的回答判断是人还是机器。一旦测试者混淆不清,就意味着机器行为已经能与人类行为混同。按照这个标准,专门用于写文章的程序早在十几年前就暗地里通过了图灵测试。

    想当年,美国麻省理工学院计算机专业三位研究生编出一个“论文自动生成软件”,代号SCIgen。他们给它赋予学术论文规范,让它从词库里随机抽取专业术语,自动生成论文,里面还有图表和引文,很是像模像样。

    他们用SCIgen生成很多“论文”,到处钓鱼。终于在2005年,第九届系统论、控制论与信息论多学科国际会议收录了其中一篇。这3个人并非骗子,而是想以此证明很多学术论文都是形式主义的产品,毫无创见也可以录用。所以文章被收录后,他们立刻公布了真相。

    图灵当年提出“图灵测试”的想法,还附带一个比率为标准。如果测试者对30%的结果判断失误,才可以认为机器通过了图灵测试。据统计,SCIgen生成的论文中,在全球各学术期刊上发表了十几篇。但由于不知道始作俑者究竟生成并投送了多少篇,没法统计成功比例。

    不管怎么样,这已经算是近似地通过了图灵测验。SCIgen虽然是个闹剧,但它说明,在某些有严格规范的文体中,计算机程序已经可以代替人工来创作。“度晓晓”所模仿的高考作文,恰恰属于规范严格的文体,程序能够生成已经不算意外。

    和论文相似,新闻报道也有公式可循,特别是体育赛果,或者股票分析,基本都是套话,只需要把具体结果填进去。最近几年,有些媒体开始用程序创作这些不需要文采,但极需要时效性的新闻。

    问题来了,文学被认为是规范最少的文体,计算机可以写小说吗?现在还没有曝出哪本计算机写的小说在不知情的情况下被出版,不过已经有人在做类似实验。这位专家叫王咏刚,他本身就是科幻作家,以“半轻人”为笔名出版过长篇科幻小说《镜中千年》。

    既有创作实践,又是程序专家,王咏刚便发起了“人机共创写作”实验,向一个程序输入某位作家的作品,让程序熟悉他的文字风格,然后由两者共同写作。小说中有些部分由真人完成,有些部分由程序生成。据称,读者很难分清这两部分,也可以视为变相的图灵实验。

    作家群体普遍对机器写作保持警惕,不过,参加这场实验的科幻作家却持开放态度。陈揪帆认为,这种实验的目标不是生成小说,而是帮助计算机更好地理解人类思想。凌晨则认为,计算机有可能形成自己的文学流派,而非只是模仿人类的创作习惯。

    机器翻译也能间接说明问题。二十年前,有的书商用程序翻译外国小说,结果经常是驴唇不对马嘴。但是最近几年,机器翻译的文章至少能够读通顺。要知道,翻译并非只是在匹配字词,需要一定加工润色。可以认为,翻译软件已经具备了最简单的文学能力。

    作为作家,我也会关注AI能否抢我的饭碗。我估计程序生成的小说可能最先出现在网文领域。网络小说经常“大水漫灌”,篇幅重于质量,非常适合快速的机器水平。甚至,当我向研究人工智能的朋友请教这个问题时,有人怀疑已经有某些网络小说是程序生成的,只是尚未被揭露。

    在科幻作品里,人工智能通常被设定为没有创造力,这个缺陷永远卡在人与AI之间。我对此持怀疑态度,其实,创造力研究恰恰就是目前AI领域的一个重点。总之,该来的早晚会来。我已经有心理准备,如果终于看到一篇公开由AI生成、并且不是用于测试的小说,我会认真学习其中的亮点。

    (作者系中国作协科幻文学委员会委员、科幻作家、中国未来研究会常务理事)

京ICP备06005116