科技 新浪科技 谷歌DeepMind超進化:國際象棋、圍棋吊打世界冠軍

谷歌DeepMind超進化:國際象棋、圍棋吊打世界冠軍

新浪科技 2018-12-07 09:28

  新浪科技訊 北京時間12月7日早間消息,Alphabet旗下人工智慧部門DeepMind一年前宣布開發了一套名為AlphaZero的系統,它可以教會自己如何掌握國際象棋、日本將棋和中國圍棋,而且都能擊敗世界冠軍。

  雖然DeepMind的說法令人印象深刻,但當時卻未能通過同行評審。不過,DeepMind今天宣布,經過數月的反覆修訂,該公司在AlphaZero上的成果已經被《科學》雜誌接受,並登上該雜誌的首頁。

  「幾年前,我們的AlphaGo以4:1擊敗了18次獲得圍棋世界冠軍的棋手李世石。但對於我們來說,這實際上是構建一個通用學習系統的開始,這個系統可以自己學習不同的遊戲,最終達到超越人類的水平。「AlphaZero的首席研究員大衛·西爾沃(David Silver)對參加蒙特利爾NeurIPS 2018大會的記者說,「AphaZero是這一段旅程的下一步。它從頭開始學習擊敗圍棋、國際象棋和日本將棋的世界冠軍。除了遊戲規則外,它什麼知識都沒有。「

  Silver解釋說,選擇這些遊戲既考慮了它們的複雜性,也考慮了之前針對它們進行人工智慧研究的豐富歷史。

  為此,本周發表的論文描述了DeepMind如何利用深度神經網路實現優於Stockfish、Elmo和 IBM 深藍的遊戲演算法。

  「傳統引擎非常強大並且幾乎沒有明顯的錯誤,但當面對沒有具體和可計算解決方案的位置時,可能會發生漂移。」國際象棋大師馬修·薩德勒(Matthew Sadler)說,「正是在這樣的位置,AlphaZero才能實現『感覺』,『洞察力』或『直覺』。 「

  為了測試經過全面訓練的AlphaZero,除了其前身AlphaGo Zero之外,DeepMind的研究人員還對上述的Stockfish和Elmo遊戲引擎進行了測試。在具有44個處理器內核和4個 谷歌 第一代TPU的單台機器上運行時,AlphaZero都能輕鬆贏得大多數比賽。(樵夫)

支持按個讚↓

我讚過了 繼續看文章!