您的位置:首頁>正文

AlphaGo將對陣世界第一圍棋選手柯潔

【財新網】“人機大戰”再次升級, 人工智慧AlphaGo將對陣世界排名第一的中國圍棋選手柯潔。 4月10日, 中國圍棋協會、Google和浙江省體育局聯合發佈了這一消息。 5月23日-27日, 柯潔將和AlphaGo在“中國烏鎮 圍棋峰會”上進行三番棋的對弈。

此外, 峰會安排了一場配對賽和一場團隊賽。 配對賽中, 兩位棋手將分別與AlphaGo組隊, 棋手將試圖理解AlphaGo的風格, 與之合作配合。 團隊賽中, 五位中國頂尖棋手將組隊合作, 建立棋手“神經網路”, 聯手對抗AlphaGo。 主辦方稱, 這一形式將降低心理因素的影響, 做出更客觀的判斷。

柯潔半年前得知要對陣的消息, 他坦言,

AlphaGo是“來自未來的”, 它的很多招法和奇思妙想讓人類棋手感到震撼。 柯潔曾與AI(人工智慧)進行測試性的比賽, 他指出, “AI有很強的宏觀思維, 其招法背後有很大的藍圖。 AI帶來了很多啟發和借鑒, 讓我們可以重新思考人類的下法。 ”儘管對手強大, 柯潔依然有很強的求勝心, 發佈會上, 他多次提到將拼盡全力、贏得勝利。

2016年3月, 韓國圍棋選手李世石與AlphaGo的對戰以1:4落下帷幕, 人類告負。 李世石曾稱人類很難戰勝人工智慧圍棋。 2017年1月, 神秘棋手“Master”連續擊敗中國圍棋元老聶衛平、古力等頂尖高手, 在快棋賽中取得60連勝。 Master的真身就是AlphaGo。

Google方面介紹稱, AlphaGo通過訓練形成了一個策略網路(policy network), 將棋盤上的局勢作為輸入資訊, 並對所有可行的落子位置生成一個概率分佈。

然後, 訓練出一個價值網路(value network)對自我對弈進行預測, 以—1(對手的絕對勝利)到1(AlphaGo的絕對勝利)的標準, 預測所有可行落子位置的結果。 這兩個網路自身都十分強大, 而 AlphaGo將這兩種網路整合進基於概率的蒙特卡羅樹搜索(MCTS)中, 實現了它真正的優勢。 最後, 新版的AlphaGo 產生大量自我對弈棋局, 為下一代版本提供了訓練資料, 此過程循環往復。

在獲取棋局資訊後, AlphaGo 會根據策略網路(policy network)探索哪個位置同時具備高潛在價值和高可能性, 進而決定最佳落子位置。 在分配的搜索時間結束時, 類比過程中被系統最頻繁考察的位置將成為 AlphaGo 的最終選擇。 在經過先期的全盤探索和過程中對最佳落子的不斷揣摩後, AlphaGo的搜索演算法就能在其計算能力之上加入近似人類的直覺判斷。

谷歌大中華區總裁石博盟(Scott Beaumont)在發佈會上表示, 目前還不能確定與柯潔對陣的AlphaGo將使用哪個版本, 但AlphaGo在不斷地學習和進化當中。 谷歌方面告訴財新記者, 大賽前將對AlphaGo的版本作出進一步的說明和解釋。

提及人工智慧的具體應用, 石博盟指出, AlphaGo一直致力於在資訊不完美的情況下作出最好的決策, 這一思路可以應用在多個領域, 比如減少能源使用、醫療研究等。 機器學習也讓Google 翻譯獲得了比過去 10 年中取得的所有進步都更為顯著的提升。 穀歌還將在“中國烏鎮 圍棋峰會”舉辦一場人工智慧論壇, 將分享穀歌對人工智慧的探索、探討人工智慧與機器學習是如何幫助解決一些世界重大難題。

同類文章
Next Article
喜欢就按个赞吧!!!
点击关闭提示