“貝瑞基因杯”2018世界人工智慧圍棋大賽今晚閉幕, 來自騰訊微信團隊的鳳凰圍棋在決賽三番棋中以2:1力挫老牌的王者絕藝, 首次亮相世界賽就摘得了桂冠。
獅子頭:恭喜鳳凰圍棋(以下金毛)獲得人工智慧圍棋世界大賽的冠軍, 先介紹一下創造神奇的團隊吧。
金毛:謝謝!很高興接受弈客的採訪。 好汗顏, 我們的團隊都不太會下圍棋, 最高水準可能在18K以下吧(笑)。 團隊的開發工程師有5位。
金毛:我們是微信AI團隊的一部分。 微信中有很多AI的業務, 比如語音輸入法, 英中互譯。 我們的主業是做微信翻譯。 去年10月份, Deepmind的Zero論文發佈不久, 我們正好有一些空餘時間, 當時我們正在做一個很大的基於雲端的人工智慧訓練平臺, 支持包括深度學習在內的各種機器學習模型, 我們需要有一個東西去完善我們這個平臺, 同時我們也想學一下最新的AI技術, 看到Zero論文之後, 我們覺得Zero的想法非常棒, 正好符合我們的想法。
獅子頭:從演算法層面, 除了遵循“Zero”的演算法, 有沒有其他更新的研究?
金毛:首先我們會根據TA的最基本想法, 不會使用人類的棋譜進行訓練。
獅子頭:您預測什麼時候能真正達到AlphaZero最終的水準 ?
金毛:首先沒那麼多硬體資源, 也不可能有那麼多的資源投放進去。 其次我們需要精打細算, 做一些效率改進, 提升訓練的效率, 因此不可能很快達到它的水準。 去年10月份論文公佈,
獅子頭:LeelaZero 已經訓練了大致700萬譜, 每天還在不斷增強。 AlphaZero總共訓練了2700萬譜, 你們準備訓練多少?
金毛:我們的路徑不太一樣, 我們需要提高效率, 使用更少的訓練量達到滿意的效果。
獅子頭:這個項目還會繼續嗎, 還會繼續參加AI的世界大賽?
金毛:一切都還不確定, 目前我們已經達到了一個里程碑,
獅子頭:這次參加比賽之前, 有沒有對其他AI做一些瞭解?
金毛:我們所有的對局大家都能看到。 我們在明別人在暗。 別人的馬甲上來打我們, 也是幫我們測試了:)。 我們需要按照一個系統工程方法, 保證忠實的實現。 第一是忠實實現;第二提高我們的訓練效率, 因為我們沒有那麼多GPU;第三就是說我們的雲訓練平臺要進一步完善。
獅子頭:預測一下現在你的這個棋力和比如說像柯潔這樣職業頂尖棋手, 他們跟和你差距有多大?
金毛:如果您觀察我們公開的歷史棋譜, 其實上面有很多局, 我們都是用一台家用的單機在打, 甚至配置比一個單卡的1080Ti還要低。 根據這些線索大致可以估計我們的棋力水準。實際上我們沒有嚴格去做過類似的測試。
獅子頭:今後有計劃到其他圍棋賽事上繼續表演嗎?
金毛:我們最初覺得能進決賽已經很開心了,現在拿到冠軍更是意外之喜,這個目標已經完成了。所以下一步可能我現在也沒法做一個決定,我們需要繼續討論。我們這個團隊本來的目標也不是為了做出一款圍棋產品,只是想這個機會學習學和實踐AI新技術。
獅子頭:現在的Block已經達到幾層了?
金毛:稍候我們會詳細公佈金毛的一些指標,我們使用家用機的配置和職業棋手較量,如果Block太高,機器可能根本跑不起來。
獅子頭:有些AI,比如星陣,除了下貼七目半的圍棋以外,可以做到動態改變貼目數。現在大部分的AI都是根據勝率來下棋,在確保勝率的情況下,他的棋風可能會偏向退縮,保守 ? 你們是不是已經儲備了可以用動態貼目,包括下出這種追求極致不退讓棋風等技術儲備?
金毛:我們對於星陣瞭解也是剛剛開始。我們主要是做Zero的方法。我們覺得也許人類的一些認識跟AI的認識是不一樣,沒有退縮一說。他就是追求勝利,那你勝率提高,你說他是退縮還是不退縮呢?
AlphaGo開闢了圍棋人工智慧嶄新的時代,後繼者接過火炬繼續前行 。如果學習只在於模仿,那麼我們就不會有科學的進步和技術的昇華,期待鳳凰圍棋,星陣,LeelaZero等優秀的AI團隊的科學家們創造更偉大的演算法,將圍棋技術的革命推進極致!
根據這些線索大致可以估計我們的棋力水準。實際上我們沒有嚴格去做過類似的測試。獅子頭:今後有計劃到其他圍棋賽事上繼續表演嗎?
金毛:我們最初覺得能進決賽已經很開心了,現在拿到冠軍更是意外之喜,這個目標已經完成了。所以下一步可能我現在也沒法做一個決定,我們需要繼續討論。我們這個團隊本來的目標也不是為了做出一款圍棋產品,只是想這個機會學習學和實踐AI新技術。
獅子頭:現在的Block已經達到幾層了?
金毛:稍候我們會詳細公佈金毛的一些指標,我們使用家用機的配置和職業棋手較量,如果Block太高,機器可能根本跑不起來。
獅子頭:有些AI,比如星陣,除了下貼七目半的圍棋以外,可以做到動態改變貼目數。現在大部分的AI都是根據勝率來下棋,在確保勝率的情況下,他的棋風可能會偏向退縮,保守 ? 你們是不是已經儲備了可以用動態貼目,包括下出這種追求極致不退讓棋風等技術儲備?
金毛:我們對於星陣瞭解也是剛剛開始。我們主要是做Zero的方法。我們覺得也許人類的一些認識跟AI的認識是不一樣,沒有退縮一說。他就是追求勝利,那你勝率提高,你說他是退縮還是不退縮呢?
AlphaGo開闢了圍棋人工智慧嶄新的時代,後繼者接過火炬繼續前行 。如果學習只在於模仿,那麼我們就不會有科學的進步和技術的昇華,期待鳳凰圍棋,星陣,LeelaZero等優秀的AI團隊的科學家們創造更偉大的演算法,將圍棋技術的革命推進極致!