只做圍棋選手？NO！AlphaGo志在醫生助手

分類＼體育
時間＼2017-05-23

圍棋一戰，AlphaGo顯示出大局觀遠勝人類，自由且無法捉摸。而這一切，也是人類對人工智慧的期盼——思維的超脫，以及將人力從重複勞動中解放。

《財經》記者劉浩南/文王小/編輯

5月23日午後3點，中國烏鎮圍棋峰會會場附近的空氣鬆弛下來。當前世界圍棋排名第一的中國選手柯潔以四分之一子惜敗于人工智慧阿爾法狗也應該是輸得心服口服。”

AlphaGo2.0：比老版強在哪裡？

每一次AlphaGo與人類棋手的廝殺，都會引發圍棋和人工智慧兩個領域的熱烈討論。

在“人工智慧能否戰勝人類圍棋第一人”的懸念被削弱的當下，歷經一年不斷演算改進的AlphaGo 2.0可能才是比賽的最大看點。

Google公開的資料顯示，改版後的AlphaGo採用了新的機器學習技術，目的是應對圍棋的巨大複雜性。這種新的機器學習技術，基於policy network（策略網路）訓練，同時兼備監督學習技術和強化學習技術的優勢。

研究者通過將棋盤上的局勢作為輸入資訊輸入AlphaGo，得出所有可行的落子位置資料，

並據此生成一個概率分佈。AlphaGo經歷大量的類似訓練後，能自動生成出一個value network（價值網路）用於預測自我對弈的結果，並以 -1（對手的絕對勝利）到1（AlphaGo的絕對勝利）的標準，預測所有可行的落子位置結果。

利用價值網路，AlphaGo能篩選出對棋局價值更高、變化可能性更多樣的落子位置，並在大量的模擬中形成自身的經驗。

這樣的訓練，本質上是AlphaGo不斷自己跟自己下棋，並總結勝利和失敗資料，

然後用海量資料儘量窮盡全部勝利可能的過程。“從已知資訊看，新版的AlphaGo不像舊版一樣使用輸入海量棋譜的方法，而是集中於自我模擬戰局。”劉鋒指出。

AlphaGo的通過更新反覆運算實行進化的能力也不可忽視。據悉，AlphaGo2.0類比的所有訓練資料，都會作為下一代版本提供參考，減少重複運算的可能。因此，與李世石對戰時的AlphaGo已經遠不可與現在的它同日而語，演算時間更長、模式更多樣的AlphaGo3.0、AlphaGo4.在整體戰略視野上會更加強大。

這也與聶衛平、常昊等職業棋手對AlphaGo棋風的評價不謀而合——大局觀遠勝人類，自由且無法捉摸。

而這一切，似乎也是人類對人工智慧的期盼——思維的超脫，以及將人力從重複勞動中解放。

比“戰勝人類”更重要的是，它能用在哪裡？

從Google高調地領著AlphaGo大殺四方開始，輿論對於這只“好學的怪獸”就質疑不斷，特別是對其實際運用的領域、產品化日程討論非常熱烈。

在充分證明自己的“下圍棋”能力後，AlphaGo要怎麼樣證明自己能“幹實事”？從Google的官方消息看，“醫生助手”很可能會是它的下一份工作。

AlphaGo之父哈薩比斯透露， DeepMind正在使用AlphaGo系統的變體來服務其他行業，“其中一種變體應用於醫療行業，蛋白質折疊的問題是我們當下希望著力解決的”。

Google 大中華區總裁石博盟接受媒體採訪時也稱，醫療領域會是AlphaGo的第一個應用點，為醫院提供診斷判定輔助，也會有效推進糖尿病、癌症等疾病的研究進程。

“最接近的領域可能是遊戲系統，比如即時戰略、整體佈局等。然後就很容易運用到軍事領域。”劉鋒認為AlphaGo的應用可能性非常多樣：“此外醫療、教育、天氣預報也有望成為其接下來的運用領域。”

不過想像還是要基於現實，AlphaGo的局限也已經顯露出來。劉鋒總結稱，AlphaGo目前只能在滿足三個條件的場景中運作：“一是有明確運算目標，二是有對抗性，三是有明確清晰的規則。”

也會有效推進糖尿病、癌症等疾病的研究進程。