AlphaGo Zero自学成才以100比0战绩击败上代AlphaGo

【TechWeb报道】10月19日消息，据国外媒体报道，谷歌旗下人工智能公司DeepMind新开发的AlphaGo Zero自学成才，以100比0战绩击败上代AlphaGo。

DeepMind在科学期刊《自然》(Nature)发表了相关细节。前代AlphaGo最初通过分析成千上万场优秀棋手间的对决来提升。新开发的AlphaGo Zero则根本不需要人类专长，只要知道游戏规则和目标就可以投入游戏，自学成才。

DeepMind首席执行官杰米斯?哈萨比斯(Demis Hassabis)表示，它学游戏仅仅是通过跟自己玩，从完全的随机玩游戏开始，在玩的过程中，它很快就超过了人类的水平，并以100比0的战绩击败了上一代AlphaGo。

AlphaGo项目负责人戴维?西尔弗(David Silver)补充称：“我们不以任何方式使用人类数据，就可以让它从一块白板创造知识。”

DeepMind开发了一种新的“强化学习”（reinforcement learning）形式来创造AlphaGo Zero，将基于搜索的未来走法模拟与神经网络（neural network）相结合，决定如何出招才能获得最高的获胜概率。

DeepMind正在考虑将开发AlphaGo的技术应用于那些能以类似方式结构化的现实生活问题。哈萨比斯表示，它很有希望应用于预测蛋白质分子形状。这是药物发现中的一个重要问题。其他可能的科学应用包括设计新材料和气候建模。

去年3月，DeepMind开发的AlphaGo以4比1的总比分战胜了韩国职业九段棋手李世石，今年5月，它与排名世界第一的世界围棋冠军柯洁对战，以3比0的总比分获胜。（宋星）