華文網

輸了!柯潔首戰告負AlphaGo,哈薩比斯:這不是人機大戰

授權轉自

唐旭 若樸 發自東瑤村

量子位元 報導 | QbitAI

19歲的柯潔輸了。

圍棋人機大戰2.0版的第一場,雙方交鋒至第286手棋,執黑的柯潔以約四分之一子的微弱劣勢,敗給圍棋人工智慧程式AlphaGo。

全程記錄

10:30,柯潔和代為AlphaGo落子的黃士傑博士落座。

10:31,兩位選手猜先,柯潔執黑先行。

隨後,柯潔在右上角落下第一子,耗時13秒。

AlphaGo在右下角落下第一子,耗時45秒。

柯潔的第一步也被解讀為尊重對手。柯潔第二步下出“三三”。這是AlphaGo的常用下法。隨後雙方開始你來我往。

總體而言,AlphaGo落子速度比柯潔明顯要快。

第21手,柯潔提掉白棋一子。而AlphaGo第30手,則讓柯潔眉頭一緊。此時,現場講評的華以剛和徐瑩表示,這盤棋場面好看,而且有不少沒見過的下法出現。

比賽中,柯潔有時會突然發笑,有時也會默默搖頭。

AlphaGo落下第50手,此時從盤面看,

白棋暫時領先18.5目(僅供參考)。而這個時候,柯潔的思考時間已經比AlphaGo多用了將近40分鐘。

第54手,白棋下出一個斷。現場講解的華以剛表示,AlphaGo下棋的效率令人心煩,並認為這將是這盤棋的焦點之一。而柯潔也再次皺起眉頭,小長考了很久。

柯潔用時一個小時後,

常昊、張璿夫婦代替華以剛、徐瑩在現場上臺講解。常昊、張璿上臺之後,也再次講解第54手的斷,認為是一個出乎意料的“後中先”。

在國內棋手中,柯潔以下棋速度快著稱。而今天柯潔用時約80分鐘思考後,AlphaGo才用時約20分鐘。雙方的差距正在越拉越大。

97手!柯潔下出天馬行空的一招。

創新工廠人工智慧工程院副院長王詠剛評價說:“這分明就是兩個AI在下棋!講輸贏仍然悲觀,但柯潔在人類裡足以封神!”

柯潔用時還剩1小時07分的時候,現場講解的常昊和張璿判斷戰鬥可能要進入官子階段,而整個盤面柯潔比較辛苦。此時AlphaGo用時還剩2小時20分,大約領先14.5目(僅供參考)。

148手的出現,讓觀戰的網友一陣驚呼,紛紛大呼不理解。

隨著比賽的進行,柯潔的表情逐漸嚴峻了起來。或者用手撐在面部,或者抓住自己的頭髮,或者悄悄的搖搖頭。與此同時,柯潔的耗時逐漸流逝。

柯潔時間還剩大約半個小時的時候,AlphaGo還有兩個小時。行至第173手,明顯雙方都已經進入官子階段。從盤面上看,如果AlphaGo不出錯的話,黑棋的局勢要差一點。

“這時可能要靠電力局的同志們了”,有網友笑侃。

在收官階段,柯潔和AlphaGo相互步步緊逼,屢屢祭出強硬下法。下午2點06分,柯潔又開始一個小長考。

現場講解的徐瑩表示,收官階段非常重要,她舉例說以前的李昌鎬經常依靠官子階段的發揮,半目逆轉局面。

192手之後,盤面上似乎已經沒有重要的官子了。AlphaGo已經能夠“心態平和”的落子了,華以剛表示這說明AI已經對盤面有了相當的自信。

華以剛判斷,結果馬上出來了。此時,柯潔還剩不到18分鐘。

此時徐瑩粗略點出白棋目數為:65+8,而華以剛點完黑棋的目數,判斷黑棋貼不出7.5目。柯潔應該輸棋無疑。

第247手,儘管柯潔落子有點猶豫,但他心裡早已明白一切。

在最後細小的收官階段,柯潔下棋如飛,而AlphaGo在看似不用想的時候,反而落子仍然非常謹慎。

單官階段,柯潔一直堅持走完,沒有輕易認輸。

哈薩比斯:這不是人機大戰

首日比賽之前,現場還舉行了一個簡短的開幕式。桐鄉市委書記,國家體育總局棋牌中心主任、Alphabet執行董事長施密特、DeepMind創始人兼CEO哈薩比斯等先後致辭。

以下是量子位元整理節選的部分發言。

△ 施密特

施密特:

非常高興回到中國,中國對我來說意義非凡。這是一個珍貴的機會,可以打造一個更美的世界。去年我在韓國就說,不管勝負如何,人性終將獲勝。電腦有自己擅長的事情,人類有自己的專長。

我們處在人工智慧的時代,我們相信這能打造更好的生活,我們所面臨的各個領域都有很多未解之謎,科學家通過人工智慧,可以做到更多的事情。

這是一個偉大的圍棋賽事,天才的選手和團隊與AlphaGo對戰,可以認為是人機合作時代的開啟。

非常感謝今天你們能允許我們來到這裡。

△ 哈薩比斯

哈薩比斯:

我對未來幾天的比賽充滿期待。我們非常感激中國圍棋協會、體育總局、桐鄉政府等幫助我們如期舉行人機大戰。柯潔是一個真正的藝術家,天才式的圍棋選手。這場對弈將開啟圍棋界的下法新天地。

這次峰會的宗旨,是在世界最深奧、美麗的棋盤上,探索新的下法。可能再過一萬年,我們也無法窮盡圍棋的下法和定式。圍棋變化繁多,非常神秘。

三年前,我們想也許人工智慧有足夠的能力下圍棋。AlphaGo不是一個預程式設計的圍棋程式,而是採用人類相似的方式進行學習。

一年半前,我們與樊麾進行對弈,現在樊麾也加入了我們。AlphaGo以人類無法想像的方式下圍棋。一年前我們和李世乭進行了對局,我們也為之感歎。今年一月,我們給他取名“Master”,並在網上取得60連勝的成就。

這不是人機大戰,而是人使用電腦發現新的奧秘和知識。和哈勃望遠鏡一樣,探索宇宙,AlphaGo就是新的哈勃望遠鏡。

AlphaGo可以用在其他領域。我們相信在製藥、醫療領域,都可以借由人工智慧解決,幫助專家取得更大領域的突破。

希望通過未來與人類專家的合作,找到各種創新的方式。希望探索有新的創新,也希望AlphaGo在其他領域有新的突破。

最後我們想對圍棋界表達深深的謝意,這已經超過我們最初的想像。希望能探索新的下法,我們最終的目的不是誰贏,因為最終的勝利屬於人類。

我們希望在座的各位能一起探索圍棋的真諦。我祝柯潔好運。

9時40分,柯潔上臺參與活動,然後離場準備稍後的比賽。

決戰前夜:柯潔不眠

決戰前夕,感慨萬千…

在這個特殊的時間,我有些話想和熱愛圍棋、關注圍棋、關注我的朋友們說:

無論輸贏,這都將是我與人工智慧最後的三盤對局

很多人可能會問為什麼?

其實私底下我已經與朋友家人說了很多次這樣的想法,現在的AI進步之快遠超我們的想像。像國產的絕藝、日產的ZEN雖然和AIphago還有著較大差距,但已經表現出超強的實力了…我相信未來是屬於人工智慧的。

可它始終都是冷冰冰的機器,與人類相比,我感覺不到它對圍棋的熱情和熱愛。對它而言…它的熱情——也只不過是運轉速度過快導致CPU發熱罷了。

我會我用所有的熱情去與它做最後的對決,不管面對再強大的對手——我也絕不會後退!至少這…最後一次…

拼盡全力後,無論結果…管他口中是是非非,來一首《滄海一聲笑》..豈不美哉、快意?我淡然笑到…

不眠夜,且看且珍惜,請大家欣賞我最後的三盤人機大戰。

相比于柯潔的心情複雜,阿法狗這邊似乎顯得頗為輕鬆。

DeepMind創始人兼CEO哈薩比斯,昨晚才抵達烏鎮。而對於第二天一早就要打響的比賽,他的態度是:“我都等不及了”。

AlphaGo簡介

如何進行訓練?

一直以來,圍棋就被認為是傳統遊戲中對人工智慧最具挑戰性的項目。這不僅僅是因為圍棋包含了龐大的搜索空間,更是因為對於落子位置的評估難度已遠遠超過了簡單的啟發式演算法。

為了應對圍棋的巨大複雜性,AlphaGo採用了一種新穎的機器學習技術,結合了監督學習和強化學習的優勢。通過訓練形成一個策略網路(policy network),將棋盤上的局勢作為輸入資訊,並對所有可行的落子位置生成一個概率分佈。

然後,訓練出一個價值網路(value network)對自我對弈進行預測,以 -1(對手的絕對勝利)到1(AlphaGo的絕對勝利)的標準,預測所有可行落子位置的結果。

這兩個網路自身都十分強大,而 AlphaGo將這兩種網路整合進基於概率的蒙特卡羅樹搜索(MCTS)中,實現了它真正的優勢。最後,新版的AlphaGo產生大量自我對弈棋局,為下一代版本提供了訓練資料,此過程循環往復。

如何決定落子?

在獲取棋局資訊後,AlphaGo會根據策略網路探索哪個位置同時具備高潛在價值和高可能性,進而決定最佳落子位置。

在分配的搜索時間結束時,類比過程中被系統最頻繁考察的位置將成為AlphaGo的最終選擇。在經過先期的全盤探索和過程中對最佳落子的不斷揣摩後,AlphaGo的搜索演算法就能在其計算能力之上加入近似人類的直覺判斷。

黑棋的局勢要差一點。

“這時可能要靠電力局的同志們了”,有網友笑侃。

在收官階段,柯潔和AlphaGo相互步步緊逼,屢屢祭出強硬下法。下午2點06分,柯潔又開始一個小長考。

現場講解的徐瑩表示,收官階段非常重要,她舉例說以前的李昌鎬經常依靠官子階段的發揮,半目逆轉局面。

192手之後,盤面上似乎已經沒有重要的官子了。AlphaGo已經能夠“心態平和”的落子了,華以剛表示這說明AI已經對盤面有了相當的自信。

華以剛判斷,結果馬上出來了。此時,柯潔還剩不到18分鐘。

此時徐瑩粗略點出白棋目數為:65+8,而華以剛點完黑棋的目數,判斷黑棋貼不出7.5目。柯潔應該輸棋無疑。

第247手,儘管柯潔落子有點猶豫,但他心裡早已明白一切。

在最後細小的收官階段,柯潔下棋如飛,而AlphaGo在看似不用想的時候,反而落子仍然非常謹慎。

單官階段,柯潔一直堅持走完,沒有輕易認輸。

哈薩比斯:這不是人機大戰

首日比賽之前,現場還舉行了一個簡短的開幕式。桐鄉市委書記,國家體育總局棋牌中心主任、Alphabet執行董事長施密特、DeepMind創始人兼CEO哈薩比斯等先後致辭。

以下是量子位元整理節選的部分發言。

△ 施密特

施密特:

非常高興回到中國,中國對我來說意義非凡。這是一個珍貴的機會,可以打造一個更美的世界。去年我在韓國就說,不管勝負如何,人性終將獲勝。電腦有自己擅長的事情,人類有自己的專長。

我們處在人工智慧的時代,我們相信這能打造更好的生活,我們所面臨的各個領域都有很多未解之謎,科學家通過人工智慧,可以做到更多的事情。

這是一個偉大的圍棋賽事,天才的選手和團隊與AlphaGo對戰,可以認為是人機合作時代的開啟。

非常感謝今天你們能允許我們來到這裡。

△ 哈薩比斯

哈薩比斯:

我對未來幾天的比賽充滿期待。我們非常感激中國圍棋協會、體育總局、桐鄉政府等幫助我們如期舉行人機大戰。柯潔是一個真正的藝術家,天才式的圍棋選手。這場對弈將開啟圍棋界的下法新天地。

這次峰會的宗旨,是在世界最深奧、美麗的棋盤上,探索新的下法。可能再過一萬年,我們也無法窮盡圍棋的下法和定式。圍棋變化繁多,非常神秘。

三年前,我們想也許人工智慧有足夠的能力下圍棋。AlphaGo不是一個預程式設計的圍棋程式,而是採用人類相似的方式進行學習。

一年半前,我們與樊麾進行對弈,現在樊麾也加入了我們。AlphaGo以人類無法想像的方式下圍棋。一年前我們和李世乭進行了對局,我們也為之感歎。今年一月,我們給他取名“Master”,並在網上取得60連勝的成就。

這不是人機大戰,而是人使用電腦發現新的奧秘和知識。和哈勃望遠鏡一樣,探索宇宙,AlphaGo就是新的哈勃望遠鏡。

AlphaGo可以用在其他領域。我們相信在製藥、醫療領域,都可以借由人工智慧解決,幫助專家取得更大領域的突破。

希望通過未來與人類專家的合作,找到各種創新的方式。希望探索有新的創新,也希望AlphaGo在其他領域有新的突破。

最後我們想對圍棋界表達深深的謝意,這已經超過我們最初的想像。希望能探索新的下法,我們最終的目的不是誰贏,因為最終的勝利屬於人類。

我們希望在座的各位能一起探索圍棋的真諦。我祝柯潔好運。

9時40分,柯潔上臺參與活動,然後離場準備稍後的比賽。

決戰前夜:柯潔不眠

決戰前夕,感慨萬千…

在這個特殊的時間,我有些話想和熱愛圍棋、關注圍棋、關注我的朋友們說:

無論輸贏,這都將是我與人工智慧最後的三盤對局

很多人可能會問為什麼?

其實私底下我已經與朋友家人說了很多次這樣的想法,現在的AI進步之快遠超我們的想像。像國產的絕藝、日產的ZEN雖然和AIphago還有著較大差距,但已經表現出超強的實力了…我相信未來是屬於人工智慧的。

可它始終都是冷冰冰的機器,與人類相比,我感覺不到它對圍棋的熱情和熱愛。對它而言…它的熱情——也只不過是運轉速度過快導致CPU發熱罷了。

我會我用所有的熱情去與它做最後的對決,不管面對再強大的對手——我也絕不會後退!至少這…最後一次…

拼盡全力後,無論結果…管他口中是是非非,來一首《滄海一聲笑》..豈不美哉、快意?我淡然笑到…

不眠夜,且看且珍惜,請大家欣賞我最後的三盤人機大戰。

相比于柯潔的心情複雜,阿法狗這邊似乎顯得頗為輕鬆。

DeepMind創始人兼CEO哈薩比斯,昨晚才抵達烏鎮。而對於第二天一早就要打響的比賽,他的態度是:“我都等不及了”。

AlphaGo簡介

如何進行訓練?

一直以來,圍棋就被認為是傳統遊戲中對人工智慧最具挑戰性的項目。這不僅僅是因為圍棋包含了龐大的搜索空間,更是因為對於落子位置的評估難度已遠遠超過了簡單的啟發式演算法。

為了應對圍棋的巨大複雜性,AlphaGo採用了一種新穎的機器學習技術,結合了監督學習和強化學習的優勢。通過訓練形成一個策略網路(policy network),將棋盤上的局勢作為輸入資訊,並對所有可行的落子位置生成一個概率分佈。

然後,訓練出一個價值網路(value network)對自我對弈進行預測,以 -1(對手的絕對勝利)到1(AlphaGo的絕對勝利)的標準,預測所有可行落子位置的結果。

這兩個網路自身都十分強大,而 AlphaGo將這兩種網路整合進基於概率的蒙特卡羅樹搜索(MCTS)中,實現了它真正的優勢。最後,新版的AlphaGo產生大量自我對弈棋局,為下一代版本提供了訓練資料,此過程循環往復。

如何決定落子?

在獲取棋局資訊後,AlphaGo會根據策略網路探索哪個位置同時具備高潛在價值和高可能性,進而決定最佳落子位置。

在分配的搜索時間結束時,類比過程中被系統最頻繁考察的位置將成為AlphaGo的最終選擇。在經過先期的全盤探索和過程中對最佳落子的不斷揣摩後,AlphaGo的搜索演算法就能在其計算能力之上加入近似人類的直覺判斷。