華文網

2:0!柯潔次戰中盤告負AlphaGo,表現一度完美

唐旭 若樸 發自 東瑤村

量子位元 報導 | QbitAI

鏖戰155手,柯潔二戰AlphaGo再次落敗。中盤告負。

這場比賽的激烈和複雜程度,超越雙方的首場對決。中盤階段,根據AlphaGo的評估柯潔下的堪稱完美。AlphaGo之父哈薩比斯驚呼難以置信。

對弈全程

△ 柯潔執白

第二場,柯潔執白。古力九段說,在圍棋界柯潔白棋勝率最高。

執黑的AlphaGo先行,耗時1分16秒才下出第一手。這對AlphaGo更像是一次長考,柯潔在等待期間端起杯子喝了一口水。

AlphaGo的第一手,就和人類習慣不同。柯潔落下第二手時,

已經確定這一盤不會是模仿棋。不過雙方的前四手棋跟第一盤一樣。

從第五手開始,黑棋率先變招。

第八手,柯潔像下出一手“模仿棋”。

現場解說的古力表示,與人類對弈相比,人機大戰的開局階段要慢得多。而張璿透露,根據AlphaGo的計算,對局的前十手柯潔勝率更高。

從第九手開始,雙方一致在棋盤右上角展開爭奪。直到第30手開始,柯潔脫先。AlphaGo也立刻跟進轉移戰場。

“雙方都很靈活,

有點跟不上”在野狐圍棋解說的柁嘉熹九段說。

行至第53手,AlphaGo落子之後,現場解說的周睿羊、劉菁表示,這是目前下出的最強手,已經超出人類的想像。

不過總體來說,柯潔在棋盤下部的表現還算不錯。此時柯潔比賽用時還剩1小時55分鐘,AlphaGo還剩2小時37分鐘。

“我都不敢往這想”,周睿羊評價柯潔今天下得非常狠。“天翻地覆的變化”劉菁形容今天這盤棋比第一盤激烈精彩。

與此同時,DeepMind創始人兼CEO哈薩比斯也在推特上表示:Incredible. According to #AlphaGo evaluations Ke Jie is playing perfectly at the moment.

中文翻譯:難以置信。根據AlphaGo的評估,柯潔目前下得很完美。

△ 哈薩比斯推特截圖

第88手,柯潔再次下出超強手。

之前人類和AlphaGo的對弈,局面都比較簡單,很少出現今天這種膠著複雜的情況。第101手,黑提白一子,黑棋消劫。古力表示不認可,認為這步過後白棋形勢更好

此後,柯潔下棋越來越果斷,落子時開始拍出聲音。看見鏡頭中的柯潔,古力說:“柯潔拍棋的動作出來了,

證明氣勢已經出來了”

第114手,兩位解說評價柯潔今天選擇了一種最激烈的下法;而野狐解說:“進入柯神的節奏了”。古力問:“我們是不是有希望見證歷史”。第118手左右,雙方陷入亂戰。現場解說的古力:現在下好的話,勝負可能就基本定了。

然而盤面風雲突變。柯潔出現失誤。

AlphaGo下出第141手後,柯潔陷入長考,剩餘比賽時間54分鐘,AlphaGo剩餘2小時12分鐘。這時,柯潔的白棋已經陷入劣勢。

下午一點半左右,各路場外解說已經判定白棋大勢已去。

與第一盤不同,柯潔在第二場中試圖把場面變得更加混亂,並且屢屢下出強手。中間創造了一些機會,但也很快出現了失誤。優勢沒能轉化成勝勢。

現場解說的劉菁說:現在已經比較絕望,周睿羊說:局面想要逆轉很困難。

下午1:36,柯潔中盤認輸。

場外視角

在棋局之外,每個人都在追問這場對弈的意義。

DeepMind創始人兼CEO哈薩比斯表示,此前Master在網上下的都是快棋,人類棋手在下棋時時間控制得可能不會太精准,人類棋手在網上的注意力也不一定完全集中,因此仍然需要跟柯潔進行對弈,對AlphaGo繼續測試。

期間量子位請教在現場觀戰的顏水成博士,他是360副總裁及人工智慧研究院院長。顏水成表示,他關注的一個重點是背後的強化學習。

強化學習,驅動AlphaGo進行自我博弈,這一訓練結束後,形成一個價值網路,用於對未來的棋局輸贏進行預測,在不同的下法中作出優劣判斷。

而搜狗CEO王小川從另一個角度思考,稱AlphaGo將重演一部進化史。他在自己知乎發表文章:“AlphaGo2.0告訴我們:如果有合適的條件,完全可能有其他的生命進化路徑,以及更不一樣的進化結果。”

當然上面都是來自科技界的觀點。

量子位在現場跟一位圍棋界的資深前輩對話時,已經頭髮花白的前輩口氣強硬的直言:“你們這些搞科技的不應該摻和體育比賽……”

△ 代AlphaGo落子的黃士傑博士

新AlphaGo背後技術

昨日無戰事,開了一天的人工智慧論壇,主要就是科技界在發聲。期間,DeepMind團隊首次曝光了新版AlphaGo的更多細節。

詳細內容,量子位元已經在《新AlphaGo首度揭秘》進行了全面的報導,這裡我們再進行一個簡短的要點總結:

- 跟柯潔對戰的版本仍是年初連勝的AlphaGo Master

- Master比對陣李世乭的v18版棋力再漲三子

- AlphaGo Master使用40層神經網路

- 在雲上單機運行,使用4個第一代TPU

- v18版本使用50個第一代TPU

- Master運算量只有v18版本的十分之一

- 自學成才,AlphaGo自我對弈提高棋力

- 強化學習、反復反覆運算,產生更強的神經網路

花絮

大戰之前一天,柯潔還跟連笑等一起外出射箭、釣魚,遊玩放鬆。

另外,今天一早抵達會場,現場的大螢幕測試,展示了一張激動人心的PPT。量子位轉帖如下,大家感受一下。

也許平行宇宙真的出現了這一幕。

本週六,柯潔將和AlphaGo上演最後一戰。

祝福柯潔。

【完】

招聘

量子位元正在招募編輯記者、運營、產品等崗位,工作地點在北京中關村。相關細節,請在對話介面,回復:“招聘”。

One More Thing…

今天AI界還有哪些事值得關注?在量子位元(QbitAI)對話介面回復“今天”,看我們全網搜羅的AI行業和研究動態。筆芯~

下午1:36,柯潔中盤認輸。

場外視角

在棋局之外,每個人都在追問這場對弈的意義。

DeepMind創始人兼CEO哈薩比斯表示,此前Master在網上下的都是快棋,人類棋手在下棋時時間控制得可能不會太精准,人類棋手在網上的注意力也不一定完全集中,因此仍然需要跟柯潔進行對弈,對AlphaGo繼續測試。

期間量子位請教在現場觀戰的顏水成博士,他是360副總裁及人工智慧研究院院長。顏水成表示,他關注的一個重點是背後的強化學習。

強化學習,驅動AlphaGo進行自我博弈,這一訓練結束後,形成一個價值網路,用於對未來的棋局輸贏進行預測,在不同的下法中作出優劣判斷。

而搜狗CEO王小川從另一個角度思考,稱AlphaGo將重演一部進化史。他在自己知乎發表文章:“AlphaGo2.0告訴我們:如果有合適的條件,完全可能有其他的生命進化路徑,以及更不一樣的進化結果。”

當然上面都是來自科技界的觀點。

量子位在現場跟一位圍棋界的資深前輩對話時,已經頭髮花白的前輩口氣強硬的直言:“你們這些搞科技的不應該摻和體育比賽……”

△ 代AlphaGo落子的黃士傑博士

新AlphaGo背後技術

昨日無戰事,開了一天的人工智慧論壇,主要就是科技界在發聲。期間,DeepMind團隊首次曝光了新版AlphaGo的更多細節。

詳細內容,量子位元已經在《新AlphaGo首度揭秘》進行了全面的報導,這裡我們再進行一個簡短的要點總結:

- 跟柯潔對戰的版本仍是年初連勝的AlphaGo Master

- Master比對陣李世乭的v18版棋力再漲三子

- AlphaGo Master使用40層神經網路

- 在雲上單機運行,使用4個第一代TPU

- v18版本使用50個第一代TPU

- Master運算量只有v18版本的十分之一

- 自學成才,AlphaGo自我對弈提高棋力

- 強化學習、反復反覆運算,產生更強的神經網路

花絮

大戰之前一天,柯潔還跟連笑等一起外出射箭、釣魚,遊玩放鬆。

另外,今天一早抵達會場,現場的大螢幕測試,展示了一張激動人心的PPT。量子位轉帖如下,大家感受一下。

也許平行宇宙真的出現了這一幕。

本週六,柯潔將和AlphaGo上演最後一戰。

祝福柯潔。

【完】

招聘

量子位元正在招募編輯記者、運營、產品等崗位,工作地點在北京中關村。相關細節,請在對話介面,回復:“招聘”。

One More Thing…

今天AI界還有哪些事值得關注?在量子位元(QbitAI)對話介面回復“今天”,看我們全網搜羅的AI行業和研究動態。筆芯~