您的位置:首頁>體育>正文

騰訊“絕藝”全勝戰績奪世界圍棋AI冠軍,曾對柯潔13連勝

3月19日, 第10屆日本UEC杯電腦圍棋大賽在日本東京都日本電氣通信大學(UEC)落幕, 騰訊人工智慧實驗室(騰訊AI Lab)研發的圍棋人工智慧程式“絕藝”(英文名:FineArt) 在最終的決賽中, 戰勝了日本“棋手”DeepZenGO, 以11戰全勝戰績獲得這次比賽冠軍。

“絕藝”戰勝DeepZenGO

UEC杯始創於2007年, 與普通圍棋賽不同, 參賽選手不是人類, 而是人工智慧, 每年在日本舉行, 是最具傳統和權威的電腦圍棋大賽。 UEC杯每年邀請各國高水準AI齊聚東京比賽, 促進相關學術及科技的交流。 日本的DeepZenGo、法國的“瘋石”(Crazy Stone)、美國Facebook公司的“黑暗森林”(Dark Forest)等著名電腦圍棋程式曾先後在UEC杯折桂獲獎。

比賽現場

說到圍棋AI比賽, 必定繞不開曾戰勝過人類棋手李世石的AlphaGo。 不過, 據澎湃新聞瞭解, 此次DeepMind公司的AlphaGo團隊與去年一樣, 並未選擇參賽。

“絕藝”背後的人工智慧

據騰訊介紹, “絕藝”的名字取自唐代詩人杜牧的送別詩《重送絕句》:“絕藝如君天下少, 閒人似我世間無。 別後竹窗風雪夜,一燈明暗覆吳圖。 ”為了開發圍棋人工智慧, 騰訊人工智慧實驗室組建了一支13人的團隊, 花了近一年的時間打造“絕藝”。

“絕藝”現場比賽圖

“很高興絕藝能夠在UEC杯奪冠, 這是非常難得的寶貴經驗。 絕藝不同於其他實驗室AI, 它得益於世界超一流棋手的指導, 通過不斷與高手交流及學習, 一步步成長起來。 我們希望, 通過絕藝能夠讓更多人關注、喜愛進而傳承圍棋這一傳統文化。 ”騰訊公司副總裁、騰訊AI Lab負責人姚星在賽後接受媒體採訪時說。

騰訊AI Lab負責人姚星在賽後接受媒體採訪

“絕藝”的研發始於2016年1月。 當時姚星在騰訊內部給工程師發了一條消息:有沒有信心做圍棋AI, 如果圍棋不行, 先做象棋AI也行。

隨後, 騰訊人工智慧實驗室高級總監、專家工程師劉永升經過調研, 在2016年3月做出了第一個DEMO(測試版)。 到2016年3月下旬, 騰訊內部圍棋AI正式立項,

項目名稱weigo。 不過那時, AlphaGo已經以4:1的成績戰勝了韓國棋手李世石。

關於AlphaGo背後的演算法, Facebook“黑暗森林”圍棋軟體的開發者田淵棟曾介紹過, AlphaGo這個系統主要由四個部分組成:一是走棋網路, 給定當前局面, 預測/採樣下一步的走棋;二是快速走子, 目標和第一步一樣, 但在適當犧牲走棋品質的條件下, 速度要比第一步快1000倍;三是估值網路, 給定當前局面, 估計是白勝還是黑勝;四是蒙特卡洛樹搜索, 研發者將遊戲中所有的可能性表示成一棵樹, 樹的第N層就代表著遊戲中的第N步。 樹的node(節點)數是隨著樹的深度成指數增長的, 不考慮剪枝, 每個node都需要進行估值。 把以上這4個部分連起來, 形成一個完整的系統。

AlphaGo之後, Crazy Stone、DeepZenGo等紛紛在自己的程式中加入了深度學習模組。 騰訊推出的“絕藝”也採用了相似的策略。據騰訊官方介紹,“絕藝”的演算法基於策略網路與價值網路兩大核心,並提升了價值網路的精度。

除了背後演算法相似外,“絕藝”也採取了AlphaGo曾經使用的訓練策略,即學習了大量的人類棋譜,又進行了自我博弈學習,以及通過與人類選手對戰,增加自己的“戰鬥經驗值”。

2016年11月,“絕藝”正式登錄騰訊圍棋(野狐圍棋)平臺,在與多名人類一線頂尖棋手過招後,絕藝曾閉關過一段時間,在大幅度提升了價值網路的精度後,一度以刑天的ID再度亮相。

“絕藝”在騰訊圍棋平臺上的戰績。 騰訊 圖

根據騰訊圍棋(野狐圍棋)提供的資料,截至2017年3月9日,“絕藝”與柯潔、古力、聶衛平、範廷鈺、時越、井山裕太、樸廷桓、元晟溱等共計超過100位知名人類棋手有過交鋒,在509局對局中“絕藝”388勝121負,勝率達76.23%。“絕藝”執白的對局有259局,其勝率達到71.43%,“絕藝”執黑的對局有250局,其勝率達81.2%。

具體到個人對弈結果,“絕藝”與柯潔對弈21局,“絕藝”取得16勝5負的戰績。其中柯潔曾拿到過4連勝,而“絕藝”則取得過對柯潔的13連勝,其中“絕藝”執白7局取得5局勝利,“絕藝”執黑14場取得11局的勝利。“絕藝”與第18屆農心杯的終結者、中國名將范蘊若共對弈38局,範蘊若勝12局負26局,勝率為31.6%。

“絕藝”與人類棋手的對弈結果。 騰訊 圖

結束UEC杯比賽後,3月26日,“絕藝”還將參加由UEC杯衍生出的“電聖戰”。“電聖戰”是由UEC杯的勝出者,對陣人類頂尖棋手,由日本棋院與電氣通信大學於2013年創辦。屆時,“絕藝”將挑戰日本新銳棋手一力遼。

冠軍背後是計算資源的較量

在今年的UEC杯比賽中,共有30位人工智慧“棋手”參賽。3月18日預賽,採用迴圈積分賽制,“絕藝”以7局全勝戰績進入16強。3月19日決賽,採用淘汰制,“絕藝”以4連勝的成績戰勝日本DeepZenGo獲冠軍。

“絕藝”預賽戰績

UEC杯比賽用時每方30分鐘,平均下來20秒左右就要落子,因此參賽程式的計算能力對比賽成績有著至關重要的作用。根據賽制,UEC杯對硬體設定沒有強制性要求,比賽時並不是所有的程式都使用統一的硬體設定。雖然要求參賽者必須報告機器功耗,但特別說明功率在1000W以上的,可以通過特別許可參賽。

比賽過程中,各家人工智慧“棋手”通過手裡的筆記型電腦,把比賽資料發送到各自的伺服器計算平臺上進行比賽。有意思的是,因為需要聯網發送資料,在3月18日的比賽過程中,還發生了因為斷網而導致比賽暫停的情況。

UEC杯的快棋賽制其實是對人工智慧“棋手”背後計算資源的考驗。“絕藝”的背後是騰訊,而DeepZenGo由日本公司DWANGO提供背後支持,DWANGO也是日本著名視頻網站NICONICO動畫的母公司。得益於各自團隊的強大支持,“絕藝”和DeepZenGo兩者在預賽中一路過關斬將,並沒有遭遇什麼抵抗就打進了決賽。決賽中兩位對手的交鋒成為此屆比賽的最大看點。

下圍棋並非AlphaGo的最終目的

2016年年初,DeepMind在《自然》雜誌上發表的關於AlphaGo的論文,介紹了圍棋人工智慧背後的演算法。此後,許多人工智慧圍棋程式的開發都基於AlphaGo的研究。換句話說,“絕藝”、DeepZenGo等都是去年那個AlphaGo的跟隨者。

不過,現在的AlphaGo已經不再是當初的那個AlphaGo了。從2016年12月29日晚起,升級後的AlphaGo改名為“Master”、接連“踢館”著名線上圍棋網站弈城網和野狐網。截至2017年1月4日,Master斬獲了60連勝,擊敗15位世界冠軍,其中包括中國、韓國、日本各自的“當今第一人”柯潔、樸廷桓和井山裕太。

斬獲60連勝後,DeepMind聯合創始人之一戴密斯·哈撒比斯(Demis Hassabis)更是在推特上激動發聲:“在非正式測試結束後,我們期待在今年安排一些標準時長的正式比賽”。此前有媒體報導,今年4月份,中國棋手柯潔將有機會在烏鎮與AlphaGo進行比賽。

但對於AlphaGo的母公司DeepMind而言,參加圍棋比賽並不是其開發AlphaGo的最終目的。DeepMind公司曾公佈過自己2017年的三大目標:實現演算法突破,提升社會影響,建立倫理規範。利用AlphaGo背後的演算法發掘出可以運用於社會福祉的新科學知識,由此來解決人類的氣候、能源和醫療健康等問題。

騰訊推出的“絕藝”也採用了相似的策略。據騰訊官方介紹,“絕藝”的演算法基於策略網路與價值網路兩大核心,並提升了價值網路的精度。

除了背後演算法相似外,“絕藝”也採取了AlphaGo曾經使用的訓練策略,即學習了大量的人類棋譜,又進行了自我博弈學習,以及通過與人類選手對戰,增加自己的“戰鬥經驗值”。

2016年11月,“絕藝”正式登錄騰訊圍棋(野狐圍棋)平臺,在與多名人類一線頂尖棋手過招後,絕藝曾閉關過一段時間,在大幅度提升了價值網路的精度後,一度以刑天的ID再度亮相。

“絕藝”在騰訊圍棋平臺上的戰績。 騰訊 圖

根據騰訊圍棋(野狐圍棋)提供的資料,截至2017年3月9日,“絕藝”與柯潔、古力、聶衛平、範廷鈺、時越、井山裕太、樸廷桓、元晟溱等共計超過100位知名人類棋手有過交鋒,在509局對局中“絕藝”388勝121負,勝率達76.23%。“絕藝”執白的對局有259局,其勝率達到71.43%,“絕藝”執黑的對局有250局,其勝率達81.2%。

具體到個人對弈結果,“絕藝”與柯潔對弈21局,“絕藝”取得16勝5負的戰績。其中柯潔曾拿到過4連勝,而“絕藝”則取得過對柯潔的13連勝,其中“絕藝”執白7局取得5局勝利,“絕藝”執黑14場取得11局的勝利。“絕藝”與第18屆農心杯的終結者、中國名將范蘊若共對弈38局,範蘊若勝12局負26局,勝率為31.6%。

“絕藝”與人類棋手的對弈結果。 騰訊 圖

結束UEC杯比賽後,3月26日,“絕藝”還將參加由UEC杯衍生出的“電聖戰”。“電聖戰”是由UEC杯的勝出者,對陣人類頂尖棋手,由日本棋院與電氣通信大學於2013年創辦。屆時,“絕藝”將挑戰日本新銳棋手一力遼。

冠軍背後是計算資源的較量

在今年的UEC杯比賽中,共有30位人工智慧“棋手”參賽。3月18日預賽,採用迴圈積分賽制,“絕藝”以7局全勝戰績進入16強。3月19日決賽,採用淘汰制,“絕藝”以4連勝的成績戰勝日本DeepZenGo獲冠軍。

“絕藝”預賽戰績

UEC杯比賽用時每方30分鐘,平均下來20秒左右就要落子,因此參賽程式的計算能力對比賽成績有著至關重要的作用。根據賽制,UEC杯對硬體設定沒有強制性要求,比賽時並不是所有的程式都使用統一的硬體設定。雖然要求參賽者必須報告機器功耗,但特別說明功率在1000W以上的,可以通過特別許可參賽。

比賽過程中,各家人工智慧“棋手”通過手裡的筆記型電腦,把比賽資料發送到各自的伺服器計算平臺上進行比賽。有意思的是,因為需要聯網發送資料,在3月18日的比賽過程中,還發生了因為斷網而導致比賽暫停的情況。

UEC杯的快棋賽制其實是對人工智慧“棋手”背後計算資源的考驗。“絕藝”的背後是騰訊,而DeepZenGo由日本公司DWANGO提供背後支持,DWANGO也是日本著名視頻網站NICONICO動畫的母公司。得益於各自團隊的強大支持,“絕藝”和DeepZenGo兩者在預賽中一路過關斬將,並沒有遭遇什麼抵抗就打進了決賽。決賽中兩位對手的交鋒成為此屆比賽的最大看點。

下圍棋並非AlphaGo的最終目的

2016年年初,DeepMind在《自然》雜誌上發表的關於AlphaGo的論文,介紹了圍棋人工智慧背後的演算法。此後,許多人工智慧圍棋程式的開發都基於AlphaGo的研究。換句話說,“絕藝”、DeepZenGo等都是去年那個AlphaGo的跟隨者。

不過,現在的AlphaGo已經不再是當初的那個AlphaGo了。從2016年12月29日晚起,升級後的AlphaGo改名為“Master”、接連“踢館”著名線上圍棋網站弈城網和野狐網。截至2017年1月4日,Master斬獲了60連勝,擊敗15位世界冠軍,其中包括中國、韓國、日本各自的“當今第一人”柯潔、樸廷桓和井山裕太。

斬獲60連勝後,DeepMind聯合創始人之一戴密斯·哈撒比斯(Demis Hassabis)更是在推特上激動發聲:“在非正式測試結束後,我們期待在今年安排一些標準時長的正式比賽”。此前有媒體報導,今年4月份,中國棋手柯潔將有機會在烏鎮與AlphaGo進行比賽。

但對於AlphaGo的母公司DeepMind而言,參加圍棋比賽並不是其開發AlphaGo的最終目的。DeepMind公司曾公佈過自己2017年的三大目標:實現演算法突破,提升社會影響,建立倫理規範。利用AlphaGo背後的演算法發掘出可以運用於社會福祉的新科學知識,由此來解決人類的氣候、能源和醫療健康等問題。

Next Article
喜欢就按个赞吧!!!
点击关闭提示