热点：新AlphaGo的突破

10月19日，谷歌旗下DeepMind团队发表了人工智能程序AlphaGo的最新研究成果，最新版本被命名为AlphaGo Zero的人工智能程序水平已经大大提升，超过了之前所有版本的AlphaGo。在与过往版本的AlphaGo对战中，AlphaGo Zero以100:0的成绩战胜了曾经赢下韩国棋手李世石那版AlphaGo。这项研究成果被发表在《自然》杂志上。

今年5月，AlphaGo也曾经以3:0的成绩战胜中国顶级围棋选手柯洁。在这一成果发表后，柯洁感叹：一个纯净、纯粹自我学习的AlphaGo是最强的，对于AlphaGo的自我进步来讲，人类太多余了。柯洁的感叹还不仅来自人与人工智能的差距，而更多的是人工智能可以进一步减少对人类经验的依赖，进行自我学习和探索。

AlphaGo之父、DeepMind联合创始人兼CEO德米斯·哈萨比斯（Demis Hassabis）介绍说：“AlphaGo Zero提高了计算效率，并且没有使用到任何人类围棋数据。”AlphaGo此前的版本，在训练中学习了大量人类围棋比赛的数据，而AlphaGo Zero则在一开始就不接触人类棋谱，研发团队只是让它自由随意地在棋盘上下棋，然后进行自我博弈。也就是说它能穷尽更多的可能性，而不只局限于人类已经走过的路。通俗地说，AlphaGo Zero就是从一张白纸的零基础开始学习，“自学成才”，在3天时间内，进行500万盘的自我博弈，不断掌握招式，最终战胜了人工智能对手。而且随着训练的深入，DeepMind团队发现，AlphaGo Zero还走出了人类过往招式之外的新策略，为围棋这个游戏带来了新的见解。

哈萨比斯说：“最终，我们想要利用它的算法突破，去帮助解决各种紧迫的现实世界问题，如蛋白质折叠或设计新材料。如果我们通过AlphaGo可以在这些问题上取得进展，那么它就有潜力推动人们理解生命，并以积极的方式影响我们的生活。”下围棋并不是AlphaGo的最终目标，DeepMind团队希望能基于AlphaGo来打造通用的、探索人类和宇宙奥秘的工具。

| 周一到周日，每天零点更新，全年无间断 |

Leave a Comment Cancel Reply