热点:新AlphaGo的突破

10月19日,谷歌旗下DeepMind团队发表了人工智能程序AlphaGo的最新研究成果,最新版本被命名为AlphaGo Zero的人工智能程序水平已经大大提升,超过了之前所有版本的AlphaGo。在与过往版本的AlphaGo对战中,AlphaGo Zero以100:0的成绩战胜了曾经赢下韩国棋手李世石那版AlphaGo。这项研究成果被发表在《自然》杂志上。

今年5月,AlphaGo也曾经以3:0的成绩战胜中国顶级围棋选手柯洁。在这一成果发表后,柯洁感叹:一个纯净、纯粹自我学习的AlphaGo是最强的,对于AlphaGo的自我进步来讲,人类太多余了。柯洁的感叹还不仅来自人与人工智能的差距,而更多的是人工智能可以进一步减少对人类经验的依赖,进行自我学习和探索。

AlphaGo之父、DeepMind联合创始人兼CEO德米斯·哈萨比斯(Demis Hassabis)介绍说:“AlphaGo Zero提高了计算效率,并且没有使用到任何人类围棋数据。”AlphaGo此前的版本,在训练中学习了大量人类围棋比赛的数据,而AlphaGo Zero则在一开始就不接触人类棋谱,研发团队只是让它自由随意地在棋盘上下棋,然后进行自我博弈。也就是说它能穷尽更多的可能性,而不只局限于人类已经走过的路。 通俗地说,AlphaGo Zero就是从一张白纸的零基础开始学习,“自学成才”,在3天时间内,进行500万盘的自我博弈,不断掌握招式,最终战胜了人工智能对手。而且随着训练的深入,DeepMind团队发现,AlphaGo Zero还走出了人类过往招式之外的新策略,为围棋这个游戏带来了新的见解。

哈萨比斯说:“最终,我们想要利用它的算法突破,去帮助解决各种紧迫的现实世界问题,如蛋白质折叠或设计新材料。如果我们通过AlphaGo可以在这些问题上取得进展,那么它就有潜力推动人们理解生命,并以积极的方式影响我们的生活。”下围棋并不是AlphaGo的最终目标,DeepMind团队希望能基于AlphaGo来打造通用的、探索人类和宇宙奥秘的工具。

| 周一到周日,每天零点更新,全年无间断 |

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top