完爆圍棋、將棋、國際象棋 AlphaZero成新棋王

日前位在英國倫敦的Google Deepmind團隊發表了一篇最新論文，提出一種全新的強化學習演算法「AlphaZero」，這也是該團隊繼之前推出了擊敗歷代「AlphaGo」的「AlphaGo Zero」後，不到50天又再度突破自我。

根據團隊所發表的論文可見，從零開始的「AlphaZero」，除了學會基本規則之外，沒有任何其他的知識，卻接連取得了多項戰績；包括在4小時內擊敗了有最強國際象棋人工智慧程式之稱的「Stockfish」，在2小時內擊敗了最強將棋人工智慧程式「Elmo」，更在8小時內擊敗了曾經大勝南韓棋王李世乭的初代「AlphaGo」，最後則在34個小時之內，完勝「AlphaGo Zero」。

經大勝南韓棋王李世乭（前右）的初代「AlphaGo」，也敗給了「AlphaZero」

論文還指出，「AlphaZero」就是一種可以從零開始，通過自我對弈進行強化學習，並在各種不同的任務上，達到超越人類水準的新型演算法，稱作「通用棋類AI」；而DeepMind團隊也表示，期待未來能夠利用「AlphaZero」來解決重大的醫療問題，那些人類歷經了數百年都研發不出的重大疾病療法，

靠著這套程式，將可望在數周甚至數日之內研究出來。