圍棋之幸？圍棋之悲？史上最年輕“五冠王”柯潔宣佈再戰AI

人們談論說，人還是那個人，狗不再是那只狗——

但這次，狗不再是那只狗，人也不是那個人了。

昨天下午，論智從中新網瞭解到，剛剛斬獲人生第五冠的棋手柯潔在中國棋院宣佈，將于明年四月再度對戰圍棋AI程式：

作為一名棋手，我還是很享受去挑戰強大的對手。對我而言弈無止境，下棋是不斷挑戰自我的過程，下這樣的棋是有意義的，是我人生中很寶貴的經歷。

這是繼今年五月在三番棋中敗於AlphaGo後，柯潔首次重燃對AI的戰意。

五冠王：柯潔的脫胎換骨

26日，首屆新奧杯世界圍棋公開賽五番棋決賽決勝局正式廊坊落下帷幕，

柯潔執黑以3/4子險勝另一名中國選手彭立堯，將比分鎖定在了3-2。這是新奧杯的首個世界冠軍，同時也是柯潔的第五個個人世界冠軍。至此，柯潔打破韓國“石佛”李昌鎬的記錄（21歲295天），成了世界上最年輕的“五冠王”，時年20歲146天。

2015年1月14日，第2屆百靈杯決賽柯潔3-2邱峻；

2015年12月8日，第20屆三星杯決賽柯潔2-0時越;

2016年1月5日，第2屆MLILY夢百合杯決賽柯潔3-2勝李世石;

2016年12月8日，第21屆三星杯決賽柯潔2-1勝柁嘉熹;

2017年11月26日，第1屆新奧杯決賽柯潔3-2彭立堯。

綜觀柯潔這一年的成績，除了在對陣AlphaGo一役上吃了大虧，他的總體表現可圈可點，但也不乏一些起起落落。 AlphaGo事件後，柯潔曾以22連勝的成績奪得媒體矚目，成為繼井山裕太（26連勝）、李昌鎬（24連勝）之後的史上第三人。但在放出“和人下棋原來能這麼輕鬆”的豪言後，從8月起他也有走下坡路的趨勢，甚至在不久前讓出了自己蟬聯了38個月的世界第一的位置（8天后又奪回）。

雖然是一個靠AlphaGo起家的“過氣網紅”，但棋手柯潔對中國圍棋的貢獻是有目共睹的。圍棋是一項高強度的腦力活動，

柯潔是人，是人就意味著會妥協、有情感、狀態會不穩定。這大半年來，無論是被棋院要求走穴表演，還是仍為AlphaGo一戰心中耿耿，亦或是狀態掉進了低谷，在奪得新奧杯冠軍前，人們不知道他在賽前的戰績是2勝6負，也不清楚他心中的壓抑。他在接受採訪時表示：

今年剛開始期待很高，特別是剛開始跟AlphaGo下完棋後的連勝，以為沒人能阻擋我了，但後來發現阻擋我的人還是很多的。後來我也看開了，努力過就沒有遺憾。今年總的成績還算滿意。

現在的柯潔，似乎已經不再是那個曾經口出狂言的世界第一人。天才還是天才，但是他也開始展現出自己作為職業棋手的一面。偶像負責吸引眼球，但棋手不能丟的是對於精益求精的追求。

圍棋世界勝敗無常，你必須有好勝心，但你也要毫無包袱地正視自己的每一場勝利和失敗。

吳清源杯：此狗非彼狗

看罷柯潔，讓我們來看這一次的狗。

今天，第一屆“吳清源杯”世界女子圍棋賽新聞發佈會在中國棋院舉行，借著人工智慧的勢頭，主辦方又打出了人工智慧圍棋賽這樣吸睛的招牌，來為真正的比賽主體——女子圍棋賽造勢助威。

一代棋聖，少小離家，隨局動盪，最後魂歸故里。想依靠圍棋打造AI產業的福州市是這麼煽情的。而柯潔和女棋手於之瑩作為當前國內棋手中的領軍人物，這一次又被邀請擔任形象大使。簡而言之，這還是一場走穴表演。

在女子圍棋賽舉行期間，一場同期舉辦的人工智慧圍棋大賽也會拉開帷幕。

據主辦方介紹，比賽邀請了騰訊絕藝、天壤、臺灣CGI、日本DeepZenGo等來自中、日、韓、歐美等國家和地區的多支AI隊伍，屆時柯潔將與上海人工智慧初創公司天壤智慧的AI程式——天壤一決高下。

新奧杯解說介面（天壤也可用作棋局分析）

談及天壤，人們會把它稱為“人工智慧界冉冉升起的一顆新星”，它也在本屆新奧杯世界圍棋比賽上擔任了解說，但這個曾在比賽中有過不俗表現的AI並沒有收穫與其成績相稱的關注度。在“象嶼杯”上，它搭檔聶衛平負于臺灣世界冠軍王立誠和人工智慧CGI；在龍星戰上，它不敵DeepZenGo獲得了季軍。也許是國人更愛冠軍，人們只在這兩場比賽裡記住了勝者CGI和絕藝。

由於這些原因，我們對天壤知之不多，但在“象嶼杯”期間，“天壤”創始人薛貴榮曾透露了一些設計思路：

其實它就是以大量人類的棋譜為起點，然後用兩個同樣的系統不斷對弈，產生人類未必熟悉的棋路。在這個過程中再進行不斷地反覆運算，修正下棋的策略，達到棋力的提升。

粗一看，它類似AlphaGo的強化學習，又似乎帶有一些GAN的意味。據不可靠消息，天壤已經達到了AlphaGo Master的水準，但具體表現如何，我們還需要靜待比賽給出答案。

此外，屆時替天壤執子的不是“黃博士”二號，而是一個由福州大學自動化學院研發的機械臂，恐怕到時候柯潔需要克服的不只是對AI的心理陰影，還有面對一個機械對手的不適感。

AlphaGo：不與紅塵為伍

相比圈內的浮躁，不再下圍棋的AlphaGo前陣子在技術上實現了又一輪突破。

正如論智在AlphaZero一天攻陷3大棋牌遊戲，這是RL的成就還是TPU的勝利？提到的，無論是硬體水準過硬，還是演算法性能出色，AlphaZero在只有遊戲規則的前提下一天內就擊敗了3類棋牌遊戲中的頂級“選手”，這本身就是一個非常了不起的成就。這裡我們再對這個新貴進行一番梳理。

眾所周知，AlphaGo依靠棋譜資料集和RL進行學習，而它的升級版AlphaGo Zero則更進一步，無需棋譜，僅靠自學就在短期內超越了前輩。這次的AlphaZero是AlphaGo Zero演算法的通用版本，它也不再需要借用傳統手工搜集整理的資料和遊戲的特定技巧玩法進行學習，而是依靠DNN、蒙特卡洛樹搜索演算法和“白板”強化學習演算法不斷自我對弈，用評分系統不斷訓練自己在3種棋類遊戲的棋局中佔據優勢，最後戰勝對手。

在DeepMind的實驗中，AlphaZero在4個小時內就學會了國際象棋，在2個小時內就學會了日本將棋，並在8個小時內精通了圍棋。

AlphaZero國際象棋、將棋、圍棋百場對局結果

如上圖所示，經過一天訓練，它在百場比賽中擊敗了這些對手。它們分別是2016年TCEC冠軍、今年在51場比賽中保持不敗戰績的國際象棋AI程式Stockfish，2017年CSA世界冠軍、日本將棋AI程式Elmo，以及DeepMind上一篇論文的主角、只訓練了3天就超越AlphaGo（李世石版）的圍棋AI程式AG0 3（AlphaGo Zero3天訓練版）。

當然，AlphaZero也不完全是AlphaGo Zero的重製版，它也進行了不少升級：

AlphaGo Zero只會考慮輸/贏兩種結果，因此它會不斷估計並優化勝率；而AlphaZero會估計和優化比賽結果，並考慮平局或其他潛在的情況。

由於無論怎麼調整棋局方位，圍棋的規則都不會發生變化，AlphaZero沿用了AlphaGo Zero的方法，會通過增加一些對稱資料強化訓練，並在蒙特卡洛樹搜索期間隨機調整棋盤角度進行評估。但考慮到國際象棋和將棋的規則是不對稱的，AlphaZero沒有增加訓練資料，在搜索時也不會改變棋盤位置。

AlphaGo Zero演算法提升自我的方式是不斷反覆運算，它會計算每一次訓練的表現，如果後一次比前一次更優，那後者會代替前者進行之後的自我對弈。而AlphaZero從頭到尾只有一個神經網路，它只通過更新參數來完成自我更新，省去了評分步驟，也不統計最佳狀態。

AlphaGo Zero通過貝葉斯優化調整搜索的超參數，而AlphaZero則重複使用相同的超參數，無需針對特定遊戲做改變。當然，這一點也有例外，就是AlphaZero為了保證搜索會把雜訊添加進之前的動作中，它與合理下法的數量成正比。

結語：浮躁的圍棋與未來

縱觀這整件事，可以發現這很明顯這又是一起炒作，一個噱頭，而我們年僅20歲的天才棋手柯潔又成了圍棋行業、某些部門，甚至是某些觀眾的消費物件。

柯潔確實是歷代棋手中的一個“異類”，作為這個時代圍棋界的棋手，他除了需要取得成績，還承擔著宣傳、發揚圍棋的使命。和傳統體育的沒落一樣，圍棋的沒落也許是這個時代的一個必然，人工智慧在其中只是充當了催化劑的作用。為了挽救這個傳承千年的文化遊戲，我們能理解棋手們的苦心。今年10月份，當柯潔因活動過多狀態不佳時，聶衛平聶老曾說了一段話：

各個行業的明星不少，但英雄卻不多。什麼是行業英雄？除了在個人技藝上出類拔萃之外，還要有社會責任感、愛心、善心，傳播正能量。在這方面，柯潔做得非常不錯，是圍棋界的榜樣。

非常現實的一番評價，我們呼籲個體價值的實現，但是又對這種流傳下來的犧牲小我拯救大我的做法無力辯駁。

日本圍棋曾經如日中天，現在已經幾乎喪失了全部活力。20世紀初，日本棋院曾出品動漫作品來吸引青少年學習圍棋，這在當時確實起到了一點作用，但杯水車薪。前幾年，韓國也曾推出一部以曹薰鉉、李昌鎬、李世石等棋手為原型的電視劇，起到了一些宣傳效果。而現在，中國棋院只是針對現在的偶像經濟打造了一個圍棋偶像，說到底，大家都是為了圍棋，為了拯救日薄西山的圍棋。

可以說，柯潔的英雄形象是一些人刻意塑造的。他是一個不可多得的天才，也許能在圍棋史上創造又一個偉大的神話，但他同時也只是一個普通的一流選手。圍棋沒有常勝者，天賦、智力、年齡、靈感……它需要棋手沉下心來，鑽研努力。當一個天才被冠上人類最強智力去和機器比拼，當他需要履行使命頻繁地去參加公益活動，這其實也在消費他的天賦，他是行業的犧牲品。獲益者是誰？是圍棋本身？是圍棋從業人員？是圍棋經濟？還是AI？其實它們都是，甚至連我們這些普通人，也不能置身事外。

也許最看不慣的，是連冰冷蠢笨的機械臂都要借電腦的算力來踩上人類一腳。

除了吸引更多人關注圍棋外，這樣的炒作也帶來了行業生存之本——資金，無論是人才、比賽還是賽制，雖然許多人一直在批判近年來圍棋行業的混亂與浮躁，但飽漢怎知餓漢饑，這是圍棋之幸？還是圍棋之悲？