您的位置:首頁>科技>正文

微信AI圍棋絕殺同門師兄“絕藝”,國產AI圍棋崛起

新智元報導

編輯:克雷格

【新智元導讀】昨天, 騰訊AI Lab開發的“絕藝”意外輸給了自家兄弟Phoenix Go。 Phoenix Go是微信翻譯團隊開發的人工智慧圍棋, 算是“絕藝”的小弟,

它們兩個都出自騰訊, 可謂“同根生”。 它基於AlphaGo Zero論文實現, 同時做了若干提高訓練效率的創新, 並利用微信伺服器的閒時計算資源進行自我對弈。

本自同根生, 相煎就是這麼急。

在昨天結束的世界人工智慧圍棋大賽上, 騰訊AI Lab開發的“絕藝”意外輸給了Phoenix Go,

屈居第二。

Phoenix Go是微信翻譯團隊開發的人工智慧圍棋, 算是“絕藝”的小弟, 它們兩個都出自騰訊, 可謂“同根生”。

不同的是, Phoenix Go的優勢在於, 它基於AlphaGo Zero論文實現, 同時做了若干提高訓練效率的創新, 並利用微信伺服器的閒時計算資源進行自我對弈。

目前, PhoenixGo已經戰勝過200多位人類棋手, 這次戰勝“絕藝”倒是出乎所有人的意外。

認識PhoenixGo:曾被認為是百度、阿裡、Zero養的“金毛”

2018年初, PhoenixGo以Bensondarr等帳號在騰訊野狐圍棋上進行實戰, 目前已經戰勝200多位棋手。

在公佈正式身份之前, 社區、貼吧等上面關於BensonDarr的猜測眾多。

有的說BensonDarr的首字母縮寫是“BD”, 就是百度的狗, 也有的注意到BensonDarr從來沒有和絕藝指導下過棋, 這很難解釋。 正常的話, 其它AI應該都是非常渴望挑戰絕藝, 因此可能是阿裡的狗。

看到Bensondarr這麼強大, 也有人說是Zero。

而Bensondarr換了金毛的頭像後, 就被棋友稱為金毛。

這只金毛在野狐圍棋上名氣越來越大, 直到世界人工智慧圍棋大賽在今年4月20日公佈參賽陣容時候, 它的身份首次公開:就是“絕藝”的自家兄弟PhoenixGo。

PhoenixGo是微信的幾名工程師在開發機器翻譯引擎“之餘”抽空研發的AI程式。

它基於AlphaGo Zero論文實現, 同時做了若干提高訓練效率的創新, 並利用微信伺服器的閒時計算資源進行自我對弈, 緩解了Zero版本對海量資源的苛刻需求。

微信團隊沒有公佈如何基於AlphaGo Zero論文實現, 不過去年10月, DeepMind在Nature的一篇論文中, 描述了AlphaGo Zero 的技術細節。

AlphaGo Zero完全不依賴於人類資料, 因此, 這一系統的成功也是朝向人工智慧研究長期以來的目標——創造出在沒有人類輸入的條件下, 在最具挑戰性的領域實現超越人類能力的演算法——邁進的一大步。

作者在論文中寫道, AlphaGo Zero 證明了即使在最具挑戰的領域, 純強化學習的方法也是完全可行的:不需要人類的樣例或指導, 不提供基本規則以外的任何領域知識,

使用強化學習能夠實現超越人類的水準。 此外, 純強化學習方法只花費額外很少的訓練時間, 但相比使用人類資料, 實現了更好的漸進性能(asymptotic performance)。

AlphaGo Zero 在其他方面也與之前的版本有所不同:

AlphaGo Zero 只使用圍棋棋盤上的黑子和白子作為輸入, 而上一版本的 AlphaGo 的輸入包含了少量人工設計的特徵。

它只使用一個神經網路, 而不是兩個。 以前版本的 AlphaGo 使用一個“策略網路”(policy network)來選擇下一個落子位置和一個“價值網路”(value network)來預測遊戲的贏家。 這些在 AlphaGo Zero 中是聯合進行的, 這使得它能夠更有效地進行訓練和評估。

AlphaGo Zero 不使用“走子演算”(rollout)——這是其他圍棋程式使用的快速、隨機遊戲, 用來預測哪一方將從當前的棋局中獲勝。 相反, 它依賴於高品質的神經網路來評估落子位置。

(詳細細節請閱讀新智元文章《【21天完虐Master】AlphaGo Zero橫空出世,DeepMind Nature論文解密不使用人類知識掌握圍棋》)

PhoenixGo對戰絕藝:騰訊自家兄弟的遊戲

在世界人工智慧圍棋大賽半決賽,PhoenixGo和絕藝分別順利擊敗Leela Zero和天算圍棋,令決賽成為騰訊兩兄弟的對決。

28日中午12:30,決賽首局開戰。

八冠王古力九段受邀為棋迷解說。猜到白棋的絕藝一出手就有創新,左下麵對金毛的托扳定式,絕藝沒有採納人類耳熟能詳的打完粘上,而是走出二路倒虎的新手。

隨後的進程,絕藝一直保持著大貼目下白方的後發優勢。不過雙方差距並未拉大。

進入官子,執黑的金毛在下方二路大跳,入侵白空。絕藝出人意料的脫先跑到右上扳角。嗅到機會的PhoenixGo出手狠辣,147淩空一擠,左上一隊白棋突然面臨生死之危。

突然而至的危機,並不會讓AI慌亂。

實戰絕藝順利將大隊人馬完整連回,但是勝負的重點仍在他處。繼續掌控先手的PhoenixGo回到下邊,令白棋目數大幅縮水。絕藝弈出一路“金雞獨立”經典手筋,PhoenixGo177妙手一靠還以顏色。此處戰罷黑棋徹底完成逆轉。

又進行了40手,絕藝中盤認輸。

發球局被破,絕藝的決賽之旅頓生坎坷。

第2局拿到白棋的PhoenixGo發揮出色,始終保持著貼目優勢,弈至159手絕藝強行收下右邊官子,打破局面平衡。

面對絕藝的進擊,PhoenixGo態度同樣強硬,一刀切斷黑棋19子大龍歸路。慘烈的攻殺開始,黑棋大龍幾經輾轉,弈至191手雖能從上邊鑿出縫隙回家,但要付出左上角被吃的代價。

見此情景絕藝團隊主動認輸,比分變為2:0,PhoenixGo已經提前奪冠。

最終,Phoenix Go 2:1擊敗絕藝,贏下本屆AI大賽,智慧圍棋世界冠軍榜上又添新成員。

“星陣”戰勝柯潔,國產AI圍棋崛起

中國作為圍棋的發源地,在AlphaGo誕生後的幾年裡也成為主要的AI圍棋源頭之一。

被同門兄弟擊敗的“絕藝”,是騰訊AI Lab於2016年3月4日開發出的AI圍棋,當年8月絕藝就首次戰勝職業棋手,11月第一次戰勝世界冠軍棋手江維傑(野狐ID若水雲寒)。

2016年11月“絕藝”首次和柯潔交手,成績一勝一負;2017年2月14日以後,絕藝對野狐帽子(世界冠軍和全國冠軍)的勝率,已經能夠穩定在90%以上。不久前,“絕藝”還成為中國圍棋國家隊的訓練工具。

在PhoenixGo戰勝絕藝的同一個賽場上,另一家國產AI圍棋“星陣”戰勝了柯潔。

星陣的前身是清華大學由小川團隊研發的“神算子”,曾在比賽中戰勝世界冠軍孔傑九段。

據“AI前線”報導,由小川曾介紹,星陣也借鑒了AlphaGo的基本架構,但在特徵體系、模型結構、MCTS 演算法架構等方面有所創新,力爭用更少的計算資源和更少的訓練樣本完成模型學習。

現在,AlphaGo已經退休,但是它啟發的無數後來者站在巨人的肩膀上,不斷探索計算的奧秘。

【加入社群】

新智元 AI 技術 + 產業社群招募中,歡迎對 AI 技術 + 產業落地感興趣的同學,加小助手微信號: aiera2015_1 入群;通過審核後我們將邀請進群,加入社群後務必修改群備註(姓名 - 公司 - 職位;專業群審核較嚴,敬請諒解)。

(詳細細節請閱讀新智元文章《【21天完虐Master】AlphaGo Zero橫空出世,DeepMind Nature論文解密不使用人類知識掌握圍棋》)

PhoenixGo對戰絕藝:騰訊自家兄弟的遊戲

在世界人工智慧圍棋大賽半決賽,PhoenixGo和絕藝分別順利擊敗Leela Zero和天算圍棋,令決賽成為騰訊兩兄弟的對決。

28日中午12:30,決賽首局開戰。

八冠王古力九段受邀為棋迷解說。猜到白棋的絕藝一出手就有創新,左下麵對金毛的托扳定式,絕藝沒有採納人類耳熟能詳的打完粘上,而是走出二路倒虎的新手。

隨後的進程,絕藝一直保持著大貼目下白方的後發優勢。不過雙方差距並未拉大。

進入官子,執黑的金毛在下方二路大跳,入侵白空。絕藝出人意料的脫先跑到右上扳角。嗅到機會的PhoenixGo出手狠辣,147淩空一擠,左上一隊白棋突然面臨生死之危。

突然而至的危機,並不會讓AI慌亂。

實戰絕藝順利將大隊人馬完整連回,但是勝負的重點仍在他處。繼續掌控先手的PhoenixGo回到下邊,令白棋目數大幅縮水。絕藝弈出一路“金雞獨立”經典手筋,PhoenixGo177妙手一靠還以顏色。此處戰罷黑棋徹底完成逆轉。

又進行了40手,絕藝中盤認輸。

發球局被破,絕藝的決賽之旅頓生坎坷。

第2局拿到白棋的PhoenixGo發揮出色,始終保持著貼目優勢,弈至159手絕藝強行收下右邊官子,打破局面平衡。

面對絕藝的進擊,PhoenixGo態度同樣強硬,一刀切斷黑棋19子大龍歸路。慘烈的攻殺開始,黑棋大龍幾經輾轉,弈至191手雖能從上邊鑿出縫隙回家,但要付出左上角被吃的代價。

見此情景絕藝團隊主動認輸,比分變為2:0,PhoenixGo已經提前奪冠。

最終,Phoenix Go 2:1擊敗絕藝,贏下本屆AI大賽,智慧圍棋世界冠軍榜上又添新成員。

“星陣”戰勝柯潔,國產AI圍棋崛起

中國作為圍棋的發源地,在AlphaGo誕生後的幾年裡也成為主要的AI圍棋源頭之一。

被同門兄弟擊敗的“絕藝”,是騰訊AI Lab於2016年3月4日開發出的AI圍棋,當年8月絕藝就首次戰勝職業棋手,11月第一次戰勝世界冠軍棋手江維傑(野狐ID若水雲寒)。

2016年11月“絕藝”首次和柯潔交手,成績一勝一負;2017年2月14日以後,絕藝對野狐帽子(世界冠軍和全國冠軍)的勝率,已經能夠穩定在90%以上。不久前,“絕藝”還成為中國圍棋國家隊的訓練工具。

在PhoenixGo戰勝絕藝的同一個賽場上,另一家國產AI圍棋“星陣”戰勝了柯潔。

星陣的前身是清華大學由小川團隊研發的“神算子”,曾在比賽中戰勝世界冠軍孔傑九段。

據“AI前線”報導,由小川曾介紹,星陣也借鑒了AlphaGo的基本架構,但在特徵體系、模型結構、MCTS 演算法架構等方面有所創新,力爭用更少的計算資源和更少的訓練樣本完成模型學習。

現在,AlphaGo已經退休,但是它啟發的無數後來者站在巨人的肩膀上,不斷探索計算的奧秘。

【加入社群】

新智元 AI 技術 + 產業社群招募中,歡迎對 AI 技術 + 產業落地感興趣的同學,加小助手微信號: aiera2015_1 入群;通過審核後我們將邀請進群,加入社群後務必修改群備註(姓名 - 公司 - 職位;專業群審核較嚴,敬請諒解)。

Next Article
喜欢就按个赞吧!!!
点击关闭提示