您的位置:首頁>正文

完爆圍棋、將棋、國際象棋 AlphaZero成新棋王

日前位在英國倫敦的Google Deepmind團隊發表了一篇最新論文, 提出一種全新的強化學習演算法「AlphaZero」, 這也是該團隊繼之前推出了擊敗歷代「AlphaGo」的「AlphaGo Zero」後, 不到50天又再度突破自我。

根據團隊所發表的論文可見, 從零開始的「AlphaZero」, 除了學會基本規則之外, 沒有任何其他的知識, 卻接連取得了多項戰績;包括在4小時內擊敗了有最強國際象棋人工智慧程式之稱的「Stockfish」, 在2小時內擊敗了最強將棋人工智慧程式「Elmo」, 更在8小時內擊敗了曾經大勝南韓棋王李世乭的初代「AlphaGo」, 最後則在34個小時之內, 完勝「AlphaGo Zero」。

經大勝南韓棋王李世乭(前右)的初代「AlphaGo」, 也敗給了「AlphaZero」

論文還指出, 「AlphaZero」就是一種可以從零開始, 通過自我對弈進行強化學習, 並在各種不同的任務上, 達到超越人類水準的新型演算法, 稱作「通用棋類AI」;而DeepMind團隊也表示, 期待未來能夠利用「AlphaZero」來解決重大的醫療問題, 那些人類歷經了數百年都研發不出的重大疾病療法,

靠著這套程式, 將可望在數周甚至數日之內研究出來。

同類文章
Next Article
喜欢就按个赞吧!!!
点击关闭提示