AlphaGo將對陣世界第一圍棋選手柯潔

【財新網】“人機大戰”再次升級，人工智慧AlphaGo將對陣世界排名第一的中國圍棋選手柯潔。 4月10日，中國圍棋協會、Google和浙江省體育局聯合發佈了這一消息。 5月23日－27日，柯潔將和AlphaGo在“中國烏鎮圍棋峰會”上進行三番棋的對弈。

此外，峰會安排了一場配對賽和一場團隊賽。配對賽中，兩位棋手將分別與AlphaGo組隊，棋手將試圖理解AlphaGo的風格，與之合作配合。團隊賽中，五位中國頂尖棋手將組隊合作，建立棋手“神經網路”，聯手對抗AlphaGo。主辦方稱，這一形式將降低心理因素的影響，做出更客觀的判斷。

柯潔半年前得知要對陣的消息，他坦言，

AlphaGo是“來自未來的”，它的很多招法和奇思妙想讓人類棋手感到震撼。柯潔曾與AI（人工智慧）進行測試性的比賽，他指出， “AI有很強的宏觀思維，其招法背後有很大的藍圖。 AI帶來了很多啟發和借鑒，讓我們可以重新思考人類的下法。 ”儘管對手強大，柯潔依然有很強的求勝心，發佈會上，他多次提到將拼盡全力、贏得勝利。

2016年3月，韓國圍棋選手李世石與AlphaGo的對戰以1:4落下帷幕，人類告負。李世石曾稱人類很難戰勝人工智慧圍棋。 2017年1月，神秘棋手“Master”連續擊敗中國圍棋元老聶衛平、古力等頂尖高手，在快棋賽中取得60連勝。 Master的真身就是AlphaGo。

Google方面介紹稱， AlphaGo通過訓練形成了一個策略網路（policy network），將棋盤上的局勢作為輸入資訊，並對所有可行的落子位置生成一個概率分佈。

然後，訓練出一個價值網路（value network）對自我對弈進行預測，以—1（對手的絕對勝利）到1（AlphaGo的絕對勝利）的標準，預測所有可行落子位置的結果。這兩個網路自身都十分強大，而 AlphaGo將這兩種網路整合進基於概率的蒙特卡羅樹搜索（MCTS）中，實現了它真正的優勢。最後，新版的AlphaGo 產生大量自我對弈棋局，為下一代版本提供了訓練資料，此過程循環往復。

在獲取棋局資訊後， AlphaGo 會根據策略網路（policy network）探索哪個位置同時具備高潛在價值和高可能性，進而決定最佳落子位置。在分配的搜索時間結束時，類比過程中被系統最頻繁考察的位置將成為 AlphaGo 的最終選擇。在經過先期的全盤探索和過程中對最佳落子的不斷揣摩後， AlphaGo的搜索演算法就能在其計算能力之上加入近似人類的直覺判斷。

谷歌大中華區總裁石博盟（Scott Beaumont）在發佈會上表示，目前還不能確定與柯潔對陣的AlphaGo將使用哪個版本，但AlphaGo在不斷地學習和進化當中。谷歌方面告訴財新記者，大賽前將對AlphaGo的版本作出進一步的說明和解釋。

提及人工智慧的具體應用，石博盟指出， AlphaGo一直致力於在資訊不完美的情況下作出最好的決策，這一思路可以應用在多個領域，比如減少能源使用、醫療研究等。機器學習也讓Google 翻譯獲得了比過去 10 年中取得的所有進步都更為顯著的提升。穀歌還將在“中國烏鎮圍棋峰會”舉辦一場人工智慧論壇，將分享穀歌對人工智慧的探索、探討人工智慧與機器學習是如何幫助解決一些世界重大難題。

■