您的位置:首頁>體育>正文

AlphaGo下個月再次挑戰人類選手,這一次是柯潔

鈦媒體注:AlphaGo再一次捲土重來, 這一次的對手將是柯潔等為代表的中國頂尖棋手!

今天(4月10日), 穀歌在中國棋院召開發佈會, 宣佈5月23日-27日在烏鎮主辦“中國烏鎮·圍棋峰會”,

屆時AlphaGo將再度與柯潔等為代表的中國頂尖棋手進行圍棋對弈。

除了備受矚目的AlphaGo與世界排名第一的柯潔的三番棋對弈之外, 本次峰會還將舉辦配對賽和團隊賽, 配對賽中, 兩位棋手將分別與AlphaGo組隊, 挑戰棋手如何理解AlphaGo獨特風格並與之合作;在團體賽中, 將由五位中國頂尖棋手合作, 建立棋手“神經網路”, 降低心理因素的影響, 從而做出更加客觀的判斷。

距離去年AlphaGo 戰勝李世石, 已經過去了1年多的時間。 在五局三勝制的比賽中, AlphaGo連勝三局提前2輪贏得了比賽, 雖然李世石最終贏得了一局比賽, 挽回了顏面, 但是AlphaGo展現出了無懈可擊的強大, 讓人印象深刻。

然而, 當時對弈的只是AlphaGo的1.0版本, 本次與職業圍棋九段選手柯潔對戰的是AlphaGo的2.0版本,

它採用了新的演算法模型。

而在去年12月29日開始, 它還曾經化名Master在圍棋網站上輪番挑戰中日韓圍棋棋手, 其中包括了聶衛平、樸廷桓、井山裕太等知名高手, 並在1月3日晚間贏了柯潔, 最終以60場不敗的戰績結束了非正式的測試。

AlphaGo是谷歌DeepMind團隊開發的一款圍棋人工智慧程式。 據DeepMind介紹, 1.0版本的AlphaGo是“深度學習”人類棋譜得出圍棋手數的估值, AlphaGo1.0所走招法其實並沒有脫離人類的理解, 而且也是人類棋手曾下過的棋。 如果AlphaGo1.0完善到極致, 就意味著得出了接近完美的圍棋手數估值函數。

2.0版本AlphaGo利用這個估值函數自我對局和“深度學習”, 不再受人類棋譜的局限, 下出真正屬於“人工智慧”的圍棋。

AlphaGo主本身主要由以下部分組成:

走棋網路(Policy Network), 給定當前局面, 預測/採樣下一步的走棋;快速走子(Fast rollout), 目標和走棋網路一樣, 但在適當犧牲走棋品質的條件下, 速度要比走棋網路快1000倍;估值網路(Value Network), 給定當前局面, 估計是白勝還是黑勝;蒙特卡洛樹搜索(Monte Carlo Tree Search), 把以上這三個部分連起來, 形成一個完整的系統。

根據AlphaGo研究者DavidSilver的解釋, AlphaGo的策略是圍棋巨大無比的搜索空間壓縮到可控的範圍之內。

在AlphaGo兩種不同的神經網路中, “策略網路”的作用是預測下一步, 並用來將搜索範圍縮小至最有可能硬起的那些步驟;“價值網路”則是用來減少搜尋樹的深度, 每走一步估算一次獲勝方, 而不是搜索所有結束棋局的途徑。

在之前, 騰訊AI Lab團隊也推出了自己的圍棋人工智慧“絕藝”,

不但贏得了世界圍棋AI冠軍, 也在後續的比賽中戰勝了人類棋手。 而根據絕藝團隊的介紹, 絕藝的演算法也是基於AlphaGo的策略網路和價值網路兩大核心。

而且, 會下圍棋的AlphaGo也只是DeepMind研究的人工智慧專案之一。 作為穀歌的頂尖技術團隊, 其更大的目標是在智慧助手、醫療和機器人這樣的領域取得進展, 另外, 儘管AlphaGo只是針對圍棋開發的系統, 但其原理可以被應用到現實問題中。 (鈦媒體編輯張霖綜合報導)

Next Article
喜欢就按个赞吧!!!
点击关闭提示