鈦媒體注:現在談到人工智慧, 不可能繞過AlphaGo, 從去年戰勝李世石到今年在網路上大勝各方圍棋手, 它儼然已經成為了一個代言詞。
UEC杯是世界權威的圍棋大賽, 每年在日本舉行, 與普通圍棋賽不同, 參賽選手不是人類, 全是AI。 3月19日, 第10屆UEC杯在東京落下了帷幕, 來自騰訊AI Lab(騰訊人工智慧實驗室)研發的圍棋人工智慧程式“絕藝”(Fine Art)獲得了此次杯賽的冠軍。
從概念到產品落地, 如今的絕藝還不滿一周歲, 所以這也是它第一次參加UEC杯電腦圍棋大賽。 作為世界級別的AI賽事, UEC曾經亮相了來自日本的DeepZenGo、法國的“瘋石”(Crazy Stone)、美國Facebook公司的“黑暗森林”(Dark Forest)等諸多的電腦圍棋程式。
“絕藝”與日本“DeepZenGo”決勝局對弈圖
今年的UEC杯一共有30支軟體參賽, 絕藝在積分賽中以7連勝的成績進入了16強。 在當天的決賽中, 經過50多分鐘的“鏖戰”, 二度擊敗來自日本的 DeepZenGo, 又以四連勝戰績奪得了冠軍, 日本的“DeepZenGo”則獲得了亞軍。 3月26日, “絕藝”還將在東京與日本先鋒棋手一力遼在“電聖戰”中進行人機對弈。
絕藝的英文名字叫做Fine Art, 而“絕藝”出自杜牧的《重送絕句》:絕藝如君天下少, 閒人似我世間無。 別後竹窗風雪夜, 一燈明暗覆吳圖。
自1997年, IBM深藍超級電腦在國際象棋比賽中戰勝世界冠軍加里·卡斯帕羅夫, 最近能夠引起轟動效果的人機對戰便是去年3月份, AlphaGo與李世石的人機對戰。
作為人類頂尖水準的棋類遊戲, 圍棋的計算量是巨大的, 根據Google團隊的描述“為所有可能的步數建立搜尋樹”, 這樣的技術在圍棋上是實現不了的。
根據AlphaGo研究者DavidSilver的解釋, AlphaGo的策略是圍棋巨大無比的搜索空間壓縮到可控的範圍之內。
在AlphaGo兩種不同的神經網路中, “策略網路”的作用是預測下一步, 並用來將搜索範圍縮小至最有可能硬起的那些步驟;“價值網路”則是用來減少搜尋樹的深度,
根據絕藝團隊的介紹, “絕藝”的學習主要包括人類棋譜資料庫和機器自對弈, 它的演算法基於策略網路與價值網路兩大核心。
這兩方面的學習, 具體來講則是:一部分來自人類棋譜, 通過深度卷積網路的訓練, 得到一個策略網路;第二部分為自對弈棋譜, 也通過深度卷積網路訓練, 得到一個估值網路。
再進一步講, 則是“策略”指每一步博弈時, 各種選擇的取捨, 選好棋棄差棋, 這是偏微觀評估;而“價值”則指能看懂棋局, 判斷給定棋局是不是能贏, 這是偏宏觀的評估。
“絕藝”曾先後使用多個ID, 在騰訊圍棋平臺與業餘和職業高手切磋,
在諸多的社交網路與媒體的評論區, 鈦媒體發現大家除了對絕藝有著好奇的一面之外, 更多的則是一種不謀而合的期待, 而這也是鈦媒體比較想要瞭解的一個問題:
絕藝與阿法狗什麼什麼時間能來一場PK呢?(鈦媒體編輯張霖綜合報導)