2018年12月03日 星期一
比围棋还复杂的星际争霸,AI怎么玩
本报记者 唐 芳

好机友

    围棋AI华丽落幕,巨头转战星际争霸AI。游戏一直是衡量人工智能水平的重要指标。

    近日,实时战略游戏AI比赛中的重磅竞赛——2018 AIIDE国际星际争霸人工智能竞赛结果出炉。全球27支团队在12台计算机上大战两个星期,每个机器人大约参与了2600场比赛,每两个机器人之间打了100场比赛,总计3万多局车轮战后,前三甲花落韩国三星的SAIDA、美国Facebook的Cherry Pi以及我国中科院自动化研究所的CSE。

    去年,制作Alpha Go的公司谷歌 DeepMind宣布,他们接下来会把星际争霸作为研究平台。同年,Facebook AI实验室也开始研发星际争霸AI。巨头缘何迷上1998年就诞生的经典即时战略游戏——星际争霸?

    硬编码夺魁,但还不敌专业玩家

    星际争霸AI大赛由来已久。2010年起每年举办一次,主办方是纽芬兰纪念大学的大卫·丘吉尔,赞助方是谷歌 DeepMind、Facebook等多家中外知名机构。AI机器人在《星际争霸:母巢之战》游戏中互相厮杀,最终比赛结果按照整体胜率排序。

    季军团队张俊格教授介绍,AIIDE规定,参赛机器人通过BWAPI访问游戏,每个参赛选手无法通过任何途径作弊。比赛开启战争迷雾,尽量接近人与人对战的真实情况。参赛机器人的运行速度不可超时,否则被判为输掉比赛。

    “成为第一个打赢人类职业选手的机器人!”胸怀伟大梦想的韩国三星机器人SAIDA夺魁,该团队尝试过机器学习技术,但最终采用非机器学习的硬编码技术。张俊格介绍,三星公司曾经拥有星际争霸职业战队,在获取专家知识上存在优势,去年通过内部编程竞赛决出最优异员工,今年1月开始打造SAIDA,目标直指世界冠军。

    去年,傲视群雄的独立业余玩家占参赛选手的一半,今年却罕见身影。原来,第二名Cherry Pi背后的机构Facebook AI实验室,聘请了去年竞赛排前几名的若干顶级作者到他们团队。

    中科院自动化所智能系统与工程研究中心开发的CSE获得季军。该中心为自动化所独立建制的科研部门,致力于研究博弈对抗与自主进化智能,包括感知智能与认知决策智能。

    “当前AI玩游戏的主要研究方向是深度强化学习算法。”张俊格表示,这类算法还能用在机器人、自动驾驶领域,“从长远来看,它更是通往通用人工智能的重要基础。”未来逐渐成熟的AI技术,将在制造、金融、物流等诸多行业得到重要应用。

    难度远胜围棋,AI看不清的迷局

    AI玩星际争霸比下围棋复杂在哪儿?简单来说,谷歌DeepMind的阿尔法狗即使在围棋领域战胜世界冠军柯洁,在星际争霸领域也暂时没有任何对外公开的成果。张俊格表示,衡量一个游戏的复杂性主要取决于观测空间、动作空间以及是否能观测到全部信息。“从这个角度,《星际争霸》远超围棋复杂度。”

    观测空间上,星际争霸观测的是整个屏幕中显示游戏内容的区域,以及小地图上的区域,每个像素都是观测空间的一部分,每个像素又蕴含很多信息,如是否在战争迷雾范围内、当前时间点哪个兵种或建筑覆盖了哪个像素。围棋的观测空间只有棋盘361个摆放棋子的位置,每个位置只有黑子、白子、无子三种状态。

    动作空间上,星际争霸的鼠标可在屏幕任意位置点击、框选,并对框选单位执行复杂操作。围棋只能在棋盘上没有棋子的线与线交叉的点上放棋子。

    “由于战争迷雾的存在,玩家无法看到距离己方单位超过一定范围或被障碍物遮挡的场景信息。” 张俊格表示,星际争霸不可以观测到全部信息。玩家视角只有主视角以及小地图上的有限信息,获取全部的信息要点击小地图或编屏、切屏。即使学会这些技巧,依然无法获得某一时刻战场上的全部信息,“信息缺失迫使玩家时常侦查、猜测对手采取了哪种策略。”反观围棋,整个棋盘对棋手双方都是可见的、是全部可观测的。星际争霸是部分可观测的,属于不完全信息博弈。

京ICP备06005116