微信AI圍棋絕殺同門師兄“絕藝”，國產AI圍棋崛起

新智元報導

編輯：克雷格

【新智元導讀】昨天，騰訊AI Lab開發的“絕藝”意外輸給了自家兄弟Phoenix Go。 Phoenix Go是微信翻譯團隊開發的人工智慧圍棋，算是“絕藝”的小弟，

它們兩個都出自騰訊，可謂“同根生”。它基於AlphaGo Zero論文實現，同時做了若干提高訓練效率的創新，並利用微信伺服器的閒時計算資源進行自我對弈。

本自同根生，相煎就是這麼急。

在昨天結束的世界人工智慧圍棋大賽上，騰訊AI Lab開發的“絕藝”意外輸給了Phoenix Go，

屈居第二。

Phoenix Go是微信翻譯團隊開發的人工智慧圍棋，算是“絕藝”的小弟，它們兩個都出自騰訊，可謂“同根生”。

不同的是， Phoenix Go的優勢在於，它基於AlphaGo Zero論文實現，同時做了若干提高訓練效率的創新，並利用微信伺服器的閒時計算資源進行自我對弈。

目前， PhoenixGo已經戰勝過200多位人類棋手，這次戰勝“絕藝”倒是出乎所有人的意外。

認識PhoenixGo：曾被認為是百度、阿裡、Zero養的“金毛”

2018年初， PhoenixGo以Bensondarr等帳號在騰訊野狐圍棋上進行實戰，目前已經戰勝200多位棋手。

在公佈正式身份之前，社區、貼吧等上面關於BensonDarr的猜測眾多。

有的說BensonDarr的首字母縮寫是“BD”，就是百度的狗，也有的注意到BensonDarr從來沒有和絕藝指導下過棋，這很難解釋。正常的話，其它AI應該都是非常渴望挑戰絕藝，因此可能是阿裡的狗。

看到Bensondarr這麼強大，也有人說是Zero。

而Bensondarr換了金毛的頭像後，就被棋友稱為金毛。

這只金毛在野狐圍棋上名氣越來越大，直到世界人工智慧圍棋大賽在今年4月20日公佈參賽陣容時候，它的身份首次公開：就是“絕藝”的自家兄弟PhoenixGo。

PhoenixGo是微信的幾名工程師在開發機器翻譯引擎“之餘”抽空研發的AI程式。

它基於AlphaGo Zero論文實現，同時做了若干提高訓練效率的創新，並利用微信伺服器的閒時計算資源進行自我對弈，緩解了Zero版本對海量資源的苛刻需求。

微信團隊沒有公佈如何基於AlphaGo Zero論文實現，不過去年10月， DeepMind在Nature的一篇論文中，描述了AlphaGo Zero 的技術細節。

AlphaGo Zero完全不依賴於人類資料，因此，這一系統的成功也是朝向人工智慧研究長期以來的目標——創造出在沒有人類輸入的條件下，在最具挑戰性的領域實現超越人類能力的演算法——邁進的一大步。

作者在論文中寫道， AlphaGo Zero 證明了即使在最具挑戰的領域，純強化學習的方法也是完全可行的：不需要人類的樣例或指導，不提供基本規則以外的任何領域知識，

使用強化學習能夠實現超越人類的水準。此外，純強化學習方法只花費額外很少的訓練時間，但相比使用人類資料，實現了更好的漸進性能（asymptotic performance）。

AlphaGo Zero 在其他方面也與之前的版本有所不同：

AlphaGo Zero 只使用圍棋棋盤上的黑子和白子作為輸入，而上一版本的 AlphaGo 的輸入包含了少量人工設計的特徵。

它只使用一個神經網路，而不是兩個。以前版本的 AlphaGo 使用一個“策略網路”（policy network）來選擇下一個落子位置和一個“價值網路”（value network）來預測遊戲的贏家。這些在 AlphaGo Zero 中是聯合進行的，這使得它能夠更有效地進行訓練和評估。

AlphaGo Zero 不使用“走子演算”（rollout）——這是其他圍棋程式使用的快速、隨機遊戲，用來預測哪一方將從當前的棋局中獲勝。相反，它依賴於高品質的神經網路來評估落子位置。

（詳細細節請閱讀新智元文章《【21天完虐Master】AlphaGo Zero橫空出世，DeepMind Nature論文解密不使用人類知識掌握圍棋》）

PhoenixGo對戰絕藝：騰訊自家兄弟的遊戲

在世界人工智慧圍棋大賽半決賽，PhoenixGo和絕藝分別順利擊敗Leela Zero和天算圍棋，令決賽成為騰訊兩兄弟的對決。

28日中午12:30，決賽首局開戰。

八冠王古力九段受邀為棋迷解說。猜到白棋的絕藝一出手就有創新，左下麵對金毛的托扳定式，絕藝沒有採納人類耳熟能詳的打完粘上，而是走出二路倒虎的新手。

隨後的進程，絕藝一直保持著大貼目下白方的後發優勢。不過雙方差距並未拉大。

進入官子，執黑的金毛在下方二路大跳，入侵白空。絕藝出人意料的脫先跑到右上扳角。嗅到機會的PhoenixGo出手狠辣，147淩空一擠，左上一隊白棋突然面臨生死之危。

突然而至的危機，並不會讓AI慌亂。

實戰絕藝順利將大隊人馬完整連回，但是勝負的重點仍在他處。繼續掌控先手的PhoenixGo回到下邊，令白棋目數大幅縮水。絕藝弈出一路“金雞獨立”經典手筋，PhoenixGo177妙手一靠還以顏色。此處戰罷黑棋徹底完成逆轉。

又進行了40手，絕藝中盤認輸。

發球局被破，絕藝的決賽之旅頓生坎坷。

第2局拿到白棋的PhoenixGo發揮出色，始終保持著貼目優勢，弈至159手絕藝強行收下右邊官子，打破局面平衡。

面對絕藝的進擊，PhoenixGo態度同樣強硬，一刀切斷黑棋19子大龍歸路。慘烈的攻殺開始，黑棋大龍幾經輾轉，弈至191手雖能從上邊鑿出縫隙回家，但要付出左上角被吃的代價。

見此情景絕藝團隊主動認輸，比分變為2:0，PhoenixGo已經提前奪冠。

最終，Phoenix Go 2:1擊敗絕藝，贏下本屆AI大賽，智慧圍棋世界冠軍榜上又添新成員。

“星陣”戰勝柯潔，國產AI圍棋崛起

中國作為圍棋的發源地，在AlphaGo誕生後的幾年裡也成為主要的AI圍棋源頭之一。

被同門兄弟擊敗的“絕藝”，是騰訊AI Lab於2016年3月4日開發出的AI圍棋，當年8月絕藝就首次戰勝職業棋手，11月第一次戰勝世界冠軍棋手江維傑（野狐ID若水雲寒）。

2016年11月“絕藝”首次和柯潔交手，成績一勝一負；2017年2月14日以後，絕藝對野狐帽子（世界冠軍和全國冠軍）的勝率，已經能夠穩定在90%以上。不久前，“絕藝”還成為中國圍棋國家隊的訓練工具。

在PhoenixGo戰勝絕藝的同一個賽場上，另一家國產AI圍棋“星陣”戰勝了柯潔。

星陣的前身是清華大學由小川團隊研發的“神算子”，曾在比賽中戰勝世界冠軍孔傑九段。

據“AI前線”報導，由小川曾介紹，星陣也借鑒了AlphaGo的基本架構，但在特徵體系、模型結構、MCTS 演算法架構等方面有所創新，力爭用更少的計算資源和更少的訓練樣本完成模型學習。

現在，AlphaGo已經退休，但是它啟發的無數後來者站在巨人的肩膀上，不斷探索計算的奧秘。

【加入社群】

新智元 AI 技術 + 產業社群招募中，歡迎對 AI 技術 + 產業落地感興趣的同學，加小助手微信號: aiera2015_1 入群；通過審核後我們將邀請進群，加入社群後務必修改群備註（姓名 - 公司 - 職位；專業群審核較嚴，敬請諒解）。