Facebook首次開源超級圍棋AI，復現AI高手AlphaZero

作者：時間：2019-02-18 來源：鎂客網

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

　　最近，Facebook的人工智能研究所(以下簡稱FAIR)宣布，他們開源了自研的圍棋AI訓練模型和代碼。這意味著，你可以隨時隨地和Facebook的人工智能下圍棋了，而且此圍棋AI程序重現的是名噪一時的AI高手AlphaZero。

本文引用地址：http://2s4d.com/article/201902/397647.htm

　　去年5月，FAIR發(fā)布了ELF Open GO，ELF OpenGo是FAIR依照DeepMind在《自然》上發(fā)表的和AlphaGo Zero以及AlphaZero相關的論文，做出的開源計算機圍棋程序，也就是說，ELF OpenGo不使用人類棋譜與累積的圍棋知識，僅使用單一類神經網絡從自我對弈中學習。

　　該圍棋AI之前在和韓國棋院的專業(yè)圍棋選手對弈中，都取得不錯的成績。據悉，OpenGo 的最新版本使用2000塊GPU訓練了15天后，在一塊GPU的情況下與4個排名前30的職業(yè)選手進行比賽時，取得了20:0全勝的戰(zhàn)績，可謂是戰(zhàn)無不勝。

　　在這次開源的論文中，FAIR研究人員全面披露了ELF OpenGo的訓練過程，包括取得的是三個突破。

　　一是為ELF OpenGo訓練了一個超人類棋藝的模型，他們在2000個GPU上運行類AlphaZero的訓練軟件9天后，有20個模塊的模型超越了人類水平。

　　二是提供了模型在訓練過程中的行為分析，包括和其他模型的對比、學習速度、學習難度等等。

　　三是通過實施ablation實驗，以研究AlphaZero風格算法的性質，他們發(fā)現對于最終模型而言，對局中加倍rollout水平大約提升200 ELO，AI的發(fā)揮會受到模型容量的限制。

　　最后，此次論文的主要作者為田淵棟，他一直負責Facebook的圍棋AI相關研究，在此前的一篇知乎文章中，他提到：DeepMind不開源也不透露細節(jié)，文章里面一些地方也沒有寫得很清楚。沒有第一手經驗總不是很踏實。所以本著研究目的，我們需要復現一下，先有復現，才有創(chuàng)新，這個是做研究的習慣。而且如果我們去看 ELF OpenGo 的代碼，會發(fā)現其完全適用于其它方向的工作。而圍棋對我們來說，只是一個把算法和平臺做好的手段。在這一點上，花點時間把圍棋做好是值得的。

　　最后，關于ELF OpenGo最新訓練模型的具體數據可以閱讀原文獲取論文鏈接了解。