AlphaGo Zero自学成才 以100比0战绩击败上代AlphaGo

AlphaGo Zero自学成才 以100比0战绩击败上代AlphaGo


【TechWeb报道】10月19日消息,据国外媒体报道,谷歌旗下人工智能公司DeepMind新开发的AlphaGo Zero自学成才,以100比0战绩击败上代AlphaGo。

DeepMind在科学期刊《自然》(Nature)发表了相关细节。前代AlphaGo最初通过分析成千上万场优秀棋手间的对决来提升。新开发的AlphaGo Zero则根本不需要人类专长,只要知道游戏规则和目标就可以投入游戏,自学成才。

DeepMind首席执行官杰米斯?哈萨比斯(Demis Hassabis)表示,它学游戏仅仅是通过跟自己玩,从完全的随机玩游戏开始,在玩的过程中,它很快就超过了人类的水平,并以100比0的战绩击败了上一代AlphaGo。

AlphaGo项目负责人戴维?西尔弗(David Silver)补充称:“我们不以任何方式使用人类数据,就可以让它从一块白板创造知识。”

DeepMind开发了一种新的“强化学习”(reinforcement learning)形式来创造AlphaGo Zero,将基于搜索的未来走法模拟与神经网络(neural network)相结合,决定如何出招才能获得最高的获胜概率。

DeepMind正在考虑将开发AlphaGo的技术应用于那些能以类似方式结构化的现实生活问题。哈萨比斯表示,它很有希望应用于预测蛋白质分子形状。这是药物发现中的一个重要问题。其他可能的科学应用包括设计新材料和气候建模。

去年3月,DeepMind开发的AlphaGo以4比1的总比分战胜了韩国职业九段棋手李世石,今年5月,它与排名世界第一的世界围棋冠军柯洁对战,以3比0的总比分获胜。(宋星)