騰訊“絕藝”全勝戰績奪世界圍棋AI冠軍，曾對柯潔13連勝

3月19日，第10屆日本UEC杯電腦圍棋大賽在日本東京都日本電氣通信大學（UEC）落幕，騰訊人工智慧實驗室（騰訊AI Lab）研發的圍棋人工智慧程式“絕藝”（英文名：FineArt）在最終的決賽中，戰勝了日本“棋手”DeepZenGO，以11戰全勝戰績獲得這次比賽冠軍。

“絕藝”戰勝DeepZenGO

UEC杯始創於2007年，與普通圍棋賽不同，參賽選手不是人類，而是人工智慧，每年在日本舉行，是最具傳統和權威的電腦圍棋大賽。 UEC杯每年邀請各國高水準AI齊聚東京比賽，促進相關學術及科技的交流。日本的DeepZenGo、法國的“瘋石”（Crazy Stone）、美國Facebook公司的“黑暗森林”（Dark Forest）等著名電腦圍棋程式曾先後在UEC杯折桂獲獎。

比賽現場

說到圍棋AI比賽，必定繞不開曾戰勝過人類棋手李世石的AlphaGo。不過，據澎湃新聞瞭解，此次DeepMind公司的AlphaGo團隊與去年一樣，並未選擇參賽。

“絕藝”背後的人工智慧

據騰訊介紹， “絕藝”的名字取自唐代詩人杜牧的送別詩《重送絕句》：“絕藝如君天下少，閒人似我世間無。別後竹窗風雪夜,一燈明暗覆吳圖。 ”為了開發圍棋人工智慧，騰訊人工智慧實驗室組建了一支13人的團隊，花了近一年的時間打造“絕藝”。

“絕藝”現場比賽圖

“很高興絕藝能夠在UEC杯奪冠，這是非常難得的寶貴經驗。絕藝不同於其他實驗室AI，它得益於世界超一流棋手的指導，通過不斷與高手交流及學習，一步步成長起來。我們希望，通過絕藝能夠讓更多人關注、喜愛進而傳承圍棋這一傳統文化。 ”騰訊公司副總裁、騰訊AI Lab負責人姚星在賽後接受媒體採訪時說。

騰訊AI Lab負責人姚星在賽後接受媒體採訪

“絕藝”的研發始於2016年1月。當時姚星在騰訊內部給工程師發了一條消息：有沒有信心做圍棋AI，如果圍棋不行，先做象棋AI也行。

隨後，騰訊人工智慧實驗室高級總監、專家工程師劉永升經過調研，在2016年3月做出了第一個DEMO（測試版）。到2016年3月下旬，騰訊內部圍棋AI正式立項，

項目名稱weigo。不過那時， AlphaGo已經以4：1的成績戰勝了韓國棋手李世石。

關於AlphaGo背後的演算法， Facebook“黑暗森林”圍棋軟體的開發者田淵棟曾介紹過， AlphaGo這個系統主要由四個部分組成：一是走棋網路，給定當前局面，預測/採樣下一步的走棋；二是快速走子，目標和第一步一樣，但在適當犧牲走棋品質的條件下，速度要比第一步快1000倍；三是估值網路，給定當前局面，估計是白勝還是黑勝；四是蒙特卡洛樹搜索，研發者將遊戲中所有的可能性表示成一棵樹，樹的第N層就代表著遊戲中的第N步。樹的node（節點）數是隨著樹的深度成指數增長的，不考慮剪枝，每個node都需要進行估值。把以上這4個部分連起來，形成一個完整的系統。

AlphaGo之後， Crazy Stone、DeepZenGo等紛紛在自己的程式中加入了深度學習模組。騰訊推出的“絕藝”也採用了相似的策略。據騰訊官方介紹，“絕藝”的演算法基於策略網路與價值網路兩大核心，並提升了價值網路的精度。

除了背後演算法相似外，“絕藝”也採取了AlphaGo曾經使用的訓練策略，即學習了大量的人類棋譜，又進行了自我博弈學習，以及通過與人類選手對戰，增加自己的“戰鬥經驗值”。

2016年11月，“絕藝”正式登錄騰訊圍棋（野狐圍棋）平臺，在與多名人類一線頂尖棋手過招後，絕藝曾閉關過一段時間，在大幅度提升了價值網路的精度後，一度以刑天的ID再度亮相。

“絕藝”在騰訊圍棋平臺上的戰績。騰訊圖

根據騰訊圍棋（野狐圍棋）提供的資料，截至2017年3月9日，“絕藝”與柯潔、古力、聶衛平、範廷鈺、時越、井山裕太、樸廷桓、元晟溱等共計超過100位知名人類棋手有過交鋒，在509局對局中“絕藝”388勝121負，勝率達76.23%。“絕藝”執白的對局有259局，其勝率達到71.43%，“絕藝”執黑的對局有250局，其勝率達81.2%。

具體到個人對弈結果，“絕藝”與柯潔對弈21局，“絕藝”取得16勝5負的戰績。其中柯潔曾拿到過4連勝，而“絕藝”則取得過對柯潔的13連勝，其中“絕藝”執白7局取得5局勝利，“絕藝”執黑14場取得11局的勝利。“絕藝”與第18屆農心杯的終結者、中國名將范蘊若共對弈38局，範蘊若勝12局負26局，勝率為31.6%。

“絕藝”與人類棋手的對弈結果。騰訊圖

結束UEC杯比賽後，3月26日，“絕藝”還將參加由UEC杯衍生出的“電聖戰”。“電聖戰”是由UEC杯的勝出者，對陣人類頂尖棋手，由日本棋院與電氣通信大學於2013年創辦。屆時，“絕藝”將挑戰日本新銳棋手一力遼。

冠軍背後是計算資源的較量

在今年的UEC杯比賽中，共有30位人工智慧“棋手”參賽。3月18日預賽，採用迴圈積分賽制，“絕藝”以7局全勝戰績進入16強。3月19日決賽，採用淘汰制，“絕藝”以4連勝的成績戰勝日本DeepZenGo獲冠軍。

“絕藝”預賽戰績

UEC杯比賽用時每方30分鐘，平均下來20秒左右就要落子，因此參賽程式的計算能力對比賽成績有著至關重要的作用。根據賽制，UEC杯對硬體設定沒有強制性要求，比賽時並不是所有的程式都使用統一的硬體設定。雖然要求參賽者必須報告機器功耗，但特別說明功率在1000W以上的，可以通過特別許可參賽。

比賽過程中，各家人工智慧“棋手”通過手裡的筆記型電腦，把比賽資料發送到各自的伺服器計算平臺上進行比賽。有意思的是，因為需要聯網發送資料，在3月18日的比賽過程中，還發生了因為斷網而導致比賽暫停的情況。

UEC杯的快棋賽制其實是對人工智慧“棋手”背後計算資源的考驗。“絕藝”的背後是騰訊，而DeepZenGo由日本公司DWANGO提供背後支持，DWANGO也是日本著名視頻網站NICONICO動畫的母公司。得益於各自團隊的強大支持，“絕藝”和DeepZenGo兩者在預賽中一路過關斬將，並沒有遭遇什麼抵抗就打進了決賽。決賽中兩位對手的交鋒成為此屆比賽的最大看點。

下圍棋並非AlphaGo的最終目的

2016年年初，DeepMind在《自然》雜誌上發表的關於AlphaGo的論文，介紹了圍棋人工智慧背後的演算法。此後，許多人工智慧圍棋程式的開發都基於AlphaGo的研究。換句話說，“絕藝”、DeepZenGo等都是去年那個AlphaGo的跟隨者。

不過，現在的AlphaGo已經不再是當初的那個AlphaGo了。從2016年12月29日晚起，升級後的AlphaGo改名為“Master”、接連“踢館”著名線上圍棋網站弈城網和野狐網。截至2017年1月4日，Master斬獲了60連勝，擊敗15位世界冠軍，其中包括中國、韓國、日本各自的“當今第一人”柯潔、樸廷桓和井山裕太。

斬獲60連勝後，DeepMind聯合創始人之一戴密斯·哈撒比斯（Demis Hassabis）更是在推特上激動發聲：“在非正式測試結束後，我們期待在今年安排一些標準時長的正式比賽”。此前有媒體報導，今年4月份，中國棋手柯潔將有機會在烏鎮與AlphaGo進行比賽。

但對於AlphaGo的母公司DeepMind而言，參加圍棋比賽並不是其開發AlphaGo的最終目的。DeepMind公司曾公佈過自己2017年的三大目標：實現演算法突破，提升社會影響，建立倫理規範。利用AlphaGo背後的演算法發掘出可以運用於社會福祉的新科學知識，由此來解決人類的氣候、能源和醫療健康等問題。

騰訊推出的“絕藝”也採用了相似的策略。據騰訊官方介紹，“絕藝”的演算法基於策略網路與價值網路兩大核心，並提升了價值網路的精度。

“絕藝”在騰訊圍棋平臺上的戰績。騰訊圖

“絕藝”與人類棋手的對弈結果。騰訊圖

冠軍背後是計算資源的較量

“絕藝”預賽戰績

下圍棋並非AlphaGo的最終目的