AlphaGo下個月再次挑戰人類選手，這一次是柯潔

鈦媒體注：AlphaGo再一次捲土重來，這一次的對手將是柯潔等為代表的中國頂尖棋手！

今天（4月10日），穀歌在中國棋院召開發佈會，宣佈5月23日-27日在烏鎮主辦“中國烏鎮·圍棋峰會”，

屆時AlphaGo將再度與柯潔等為代表的中國頂尖棋手進行圍棋對弈。

除了備受矚目的AlphaGo與世界排名第一的柯潔的三番棋對弈之外，本次峰會還將舉辦配對賽和團隊賽，配對賽中，兩位棋手將分別與AlphaGo組隊，挑戰棋手如何理解AlphaGo獨特風格並與之合作；在團體賽中，將由五位中國頂尖棋手合作，建立棋手“神經網路”，降低心理因素的影響，從而做出更加客觀的判斷。

距離去年AlphaGo 戰勝李世石，已經過去了1年多的時間。在五局三勝制的比賽中， AlphaGo連勝三局提前2輪贏得了比賽，雖然李世石最終贏得了一局比賽，挽回了顏面，但是AlphaGo展現出了無懈可擊的強大，讓人印象深刻。

然而，當時對弈的只是AlphaGo的1.0版本，本次與職業圍棋九段選手柯潔對戰的是AlphaGo的2.0版本，

它採用了新的演算法模型。

而在去年12月29日開始，它還曾經化名Master在圍棋網站上輪番挑戰中日韓圍棋棋手，其中包括了聶衛平、樸廷桓、井山裕太等知名高手，並在1月3日晚間贏了柯潔，最終以60場不敗的戰績結束了非正式的測試。

AlphaGo是谷歌DeepMind團隊開發的一款圍棋人工智慧程式。據DeepMind介紹， 1.0版本的AlphaGo是“深度學習”人類棋譜得出圍棋手數的估值， AlphaGo1.0所走招法其實並沒有脫離人類的理解，而且也是人類棋手曾下過的棋。如果AlphaGo1.0完善到極致，就意味著得出了接近完美的圍棋手數估值函數。

2.0版本AlphaGo利用這個估值函數自我對局和“深度學習”，不再受人類棋譜的局限，下出真正屬於“人工智慧”的圍棋。

AlphaGo主本身主要由以下部分組成：

走棋網路（Policy Network），給定當前局面，預測/採樣下一步的走棋；快速走子（Fast rollout），目標和走棋網路一樣，但在適當犧牲走棋品質的條件下，速度要比走棋網路快1000倍；估值網路（Value Network），給定當前局面，估計是白勝還是黑勝；蒙特卡洛樹搜索（Monte Carlo Tree Search），把以上這三個部分連起來，形成一個完整的系統。

根據AlphaGo研究者DavidSilver的解釋， AlphaGo的策略是圍棋巨大無比的搜索空間壓縮到可控的範圍之內。

在AlphaGo兩種不同的神經網路中， “策略網路”的作用是預測下一步，並用來將搜索範圍縮小至最有可能硬起的那些步驟；“價值網路”則是用來減少搜尋樹的深度，每走一步估算一次獲勝方，而不是搜索所有結束棋局的途徑。

在之前，騰訊AI Lab團隊也推出了自己的圍棋人工智慧“絕藝”，

不但贏得了世界圍棋AI冠軍，也在後續的比賽中戰勝了人類棋手。而根據絕藝團隊的介紹，絕藝的演算法也是基於AlphaGo的策略網路和價值網路兩大核心。

而且，會下圍棋的AlphaGo也只是DeepMind研究的人工智慧專案之一。作為穀歌的頂尖技術團隊，其更大的目標是在智慧助手、醫療和機器人這樣的領域取得進展，另外，儘管AlphaGo只是針對圍棋開發的系統，但其原理可以被應用到現實問題中。（鈦媒體編輯張霖綜合報導）