2017年10月20日 星期五
人工智能与人类智慧还划不上等号

    10月19日,谷歌旗下人工智能研究部门发布了新版AlphaGo软件,这款名为AlphaGo Zero的系统可以通过自我对弈进行学习,它利用了一种名为强化学习的技术。在经过3天的训练后,这套系统已经可以击败AlphaGo Lee,也就是去年击败韩国顶尖棋手李世石的那套系统,而且比分高达100比0。经过40天训练后,它总计运行了大约2900万次自我对弈,使得AlphaGo Zero得以击败AlphaGo Master(今年早些时候击败世界冠军柯洁的系统),比分为89比11。

    这一次,AlphaGo Zero摆脱了人为的大数据,在人类给定的一个规则下,自主发现新知识,并且纠正人类的错误知识,而且是以惊人的速度达到这一点。

    自我学习功能,人类对AI的恐惧莫过于此吧。瞬间,人们对AI的认知似乎要被改写了。

    然而,10月19日国际学术期刊《自然》上的一篇研究论文中显示,AlphaGo Zero能从空白状态学起,在无任何人类输入的条件下,迅速自学围棋。但“无人类经验”和“自我训练”并非AlphaGo Zero最大的亮点,其关键在于采用了新的强化学习的算法,并给该算法带了新的发展。

    上海交通大学软件学院教授陈海波认为,从理论上说,强化学习的算法本来就可以实现自我训练,AlphaGo Zero提供了一个非常好的范例。

    中国科学院自动化研究所王飞跃表示,大家应该理性看待AlphaGo Zero的研究成果。AlphaGo的程序的确越来越简洁、有效。但那种“看了AlphaGo Zero,就认为人类经验没用了,人工智能已经超过人类智力”的观点不正确。真正智能的是AlphaGo Nothing,即人类,为定规则而生。而机器是为执行而造的。

    人类可以缓口气了!

    (科文)

京ICP备06005116