華文網

人類必輸的比賽有什麼意義?AlphaGo首席科學家這樣說

今天上午10時30分,柯潔九段與AlphaGo的三番局第二戰如期開始,柯潔執白子,AIphaGo執黑子。今天下午2時許,棋局進入中盤柯潔表示認輸。而在此前23日的首局對弈中,柯潔以1/4子告負。在柯潔兩次輸給圍棋人工智慧AlphaGo後,

圍棋界和技術界出現評論井噴, 一派感歎AlphaGo實力強大的景象中,也有“不明覺厲”的圍觀群眾寫段子:

【“那一天,人類終於回想起了,曾經一度被 AlphaGo 支配的恐怖,還有第一次輸棋時的無知無覺。”——來自30年後的人類奴隸。(網友 王豹豹)】

有意思的是,像這樣懷有“人工智慧威脅論”的人並不在少數。或許是對公眾的情緒(或者說腦洞)有所感知, AlphaGo 團隊的兩位大咖,DeepMind 創始人Demis Hassabis 和首席科學家 David Silver,

這兩天反復提到一個觀點:AlphaGo 不是要打敗人類,而是要幫助人類開拓新的知識疆域,更好地探索我們所在的宇宙。

除此之外,昨天的“人工智慧高峰論壇”期間,Hassabis 和 Silver 又集中回答了一批外界關心的問題,包括:跟去年單挑韓國棋手李世石時相比,AlphaGo 到底進化了多少?既然已經在圍棋界笑傲江湖,對陣柯潔的意義何在?下一步會不會繼續下棋,有什麼別的打算?以及,如此優秀的 AlphaGo,

距離《銀翼殺手》裡那種幾乎與人無異的“超級人工智慧”還有多遠?

這裡可以先透露Hassabis 對最後一個問題的答案:“很遠。”

DeepMind的首席科學家 David Silver。

和以前的版本有何變化?

對陣柯潔版AlphaGo已經有“直覺”

Silver 說,這次與柯潔對陣的,是 AlphaGo Master 版,它比此前單挑李世石的 V18版、網路約占群雄的V25版(化名 Master),

都要強大。

“我們非常努力地工作,改進了AlphaGo的基礎演算法。事實證明,演算法常常比資料的多少或者運算力更重要。當你把演算法弄對,使它們足夠通用和強大,它們的運行速度是非常快的。”Silver 表示,AlphaGo Master消耗的計算資源更少,約為V18版本的十分之一。它的訓練時間也更少,只用了幾周而非之前的數月。

最初,AlphaGo 還需要依靠人類棋譜來學習,而現在,它已經可以通過自我博弈來學習。

這也可以解答近兩天網上一些人的疑問:讓 AlphaGo 自己跟自己下棋會怎麼樣?事實上,AlphaGo 正是通過跟自己下棋來實現不斷的進化。隨著訓練的增加、演算法的改進,AlphaGo 會變得越來越強。如果讓去年的 V18版跟現在的AlphaGo Master 對弈,後者毫無疑問會佔據上風。

在解釋 AlphaGo的技術原理時,Silver 用了一個非常人類的詞彙,“直覺”。AlphaGo具有更強大的策略網路與價值網路,前者用來預測棋子的移動,後者用來預測獲勝者。因此,AlphaGo不必窮舉所有可能的棋步來“暴力計算”,只需要結合蒙特卡洛樹搜索判斷最有希望獲勝的棋步即可。

從這個角度看,AlphaGo確實和以往那些需要提前輸入大量規則、獲勝全靠暴力計算的下棋程式不同,稱其具有“直覺”也不為過。那麼問題來了,連以往被認為機器不可能有的直覺都有了,AlphaGo 是否預示著通用人工智慧的曙光?

這裡先解釋下何為“通用人工智慧”。人工智慧領域有個說法:人類在每件事上都能做得很好,卻無法在任何事上做到最好(Human is good at everything but not best at anything. ),機器卻恰恰相反。打敗國際象棋大師的“深藍”就很好的例子,下國際象棋所向披靡,下跳棋卻會秒變智障。

“通用人工智慧”,簡單來說就是像人一樣,可以解決多種多樣、不同類型的問題。自從上世紀50年代人工智慧的概念誕生以來,這就是科學家們孜孜以求的夢想。

不過,對於通用人工智慧的問題,Silver 的回答還表現出科學家典型的謹慎。 他說,AlphaGo是圍棋人工智慧,通過持續的強化學習,它在特定的領域中具備了直覺。這跟人類接受培訓時產生的直覺、意識是不同的。當然,AlphaGo 背後的演算法和技術原理是可以拓展到其他領域的。

沒有懸念的比賽意義何在?

柯潔可能會幫AlphaGo發現新弱點

鑒於 AlphaGo 60:0橫掃人類高手在前,很多人覺得這次對弈的結果已經毫無懸念,笑到最後的肯定是AlphaGo。柯潔首戰失利後,又有人在討論,進行一場沒有懸念的比賽,意義在哪裡呢?

對此,Silver說,新版本的AlphaGo經過了幾百萬次的自我訓練,並且在檢測舊版本弱點方面表現出色。但是,當AlphaGo與從未對弈過的人類棋手對局時,這樣的優勢就不復存在了,尤其是柯潔這樣的圍棋大師。柯潔可能幫助發現Alphago未曾展露的新弱點。

“這樣的衡量標準是無法比較的。”Silver 也順便表示了對後兩局對弈的期待,“興奮!”

Hassabis 則說,Master的挑戰方式是網路快棋,在時間控制上不是特別精准,人類棋手的注意力也不一定完全集中。這回採用傳統的對弈方式,對 AlphaGo 來說是非常難得的機會,希望能借助比賽找到它的弱點 。去年的五番棋大戰中,李世石在第四場對弈中贏了AlphaGo,就為團隊後續改良 AlphaGo 提供了依據。

在 Hassabis 看來,已經很強的AlphaGo,依然能夠通過攜手人類,探索圍棋的更多可能性。昨天的賽後新聞發佈會上他也說,感謝柯潔將AlphaGo推向了極限。反過來,AlphaGo對圍棋選手和整個圍棋界來講是一個有效的工具,可以用來探索這項遊戲的真諦。

正是出於以上考慮,此次比賽除了單人賽,還設置了配對賽與團體賽。Silver 還順道解釋了一個小疑問:正常來說,棋越下到後面結果越明朗,人的思考時間也會相應減少,為什麼AlphaGo 的思考時間卻始終穩定呢?這是因為 AlphaGo 的計算量是恒定的,它的目的就是要贏,為了最大限度地保證贏棋,當然是選擇始終勻速的求穩下法。

不過,身居“世界圍棋第一人”高位的柯潔已經表態,不會再和人工智慧下棋。AlphaGo 今後又有什麼打算呢?

Hassabis 說,AlphaGo 背後涉及到非常多的技術,在現實應用上還處於早期的探索階段。他可以肯定的是,AlphaGo 使用的技術會逐漸推廣到谷歌的應用中。而根據此前的媒體報導,DeepMind 已經與英國國民醫療服務體系NHS 展開合作,希望借助人工智慧來改善醫療服務。

至於 AlphaGo 是否繼續下棋、繼續挑戰,Hassabis沒有正面回答,只透露說會在接下來的兩天公佈 AlphaGo 的未來動向,之後也會公開最新版本的更多細節。

AlphaGo的盈利前景?

他們說:不關心!

“變現”,這個隨著近兩年的創業風潮變得無比流行的詞彙,也被拋到了DeepMind 面前。公司的聯合創始人Mustafa Suleyman很酷地表示,“商業利潤對我們來說沒那麼重要”。

DeepMind公司聯合創始人Mustafa Suleyman。

Suleyman說,與盈利相比,DeepMind在推廣技術應用時更看重的社會價值,比如醫療、水淨化、食品安全、能源,等等。他開玩笑道,七年前創立DeepMind 時,所有人都說他們瘋了;三年前打算開發 AlphaGo,所有人又說他們瘋了;不久前,公司開始將 AlphaGo 背後的技術推廣到醫療領域,可能還是有人評價他們瘋了。

“做事情要有長遠的眼光。我們會為全球提供最優秀的醫療服務。我舉個例子吧,現在,最富有的人和一般人用的筆記型電腦,基本上是一樣的。就像筆記型電腦一樣,我們希望所有人能享有的醫療服務也是同等品質的。”Suleyman說,醫療領域的低效問題為時已久,甚至連一些醫生、護士都表示歡迎人工智慧來幫他們減負。

據瞭解,人工智慧走向現實應用,也並非一帆風順。DeepMind 此前就被控違規使用了患者資料,涉嫌侵犯個人隱私。目前,有關方面還在調查中。

對此,Suleyman 表現得也相當坦誠。他說,人工智慧的應用過程中確實出現了和現有監管機制不匹配的情況,需要在迅速發展的科技和監管機制之前尋找平衡點。對於患者資料的問題,他表示說絕對不會把資料和穀歌帳戶聯繫起來或是用於保險等商業業務,希望今後能加強社會對於人工智慧及相關技術的信任。

在昨天上午的演講中,Hassabis也談到了人工智慧應用的倫理問題。一方面,資訊超載和系統冗雜對人來來說是巨大挑戰,開發人工智慧,可能是這些問題的“元解決方案”。另一方面,人工智慧必須在倫理和道德框架內被恰當運用才能夠造福人類。他舉例說,人工智慧可以被用於材料分析、新藥研發,但絕對不能被用於武器研製。另外,人工智慧技術不應該被掌握在少數幾家巨頭公司手中,而是應該開源給全人類。

最後,說回開頭,科幻作品裡的超級人工智慧是否會很快出現? Hassabis 認為,AlphaGo 雖然厲害,但也只是處在人工智慧的起步階段,科學家們還有很多的關鍵問題沒有攻克,因此,超級人工智慧的實現“還有很長的路要走”。

采寫/攝影:南都記者 馮群星

編輯:林雲

AlphaGo確實和以往那些需要提前輸入大量規則、獲勝全靠暴力計算的下棋程式不同,稱其具有“直覺”也不為過。那麼問題來了,連以往被認為機器不可能有的直覺都有了,AlphaGo 是否預示著通用人工智慧的曙光?

這裡先解釋下何為“通用人工智慧”。人工智慧領域有個說法:人類在每件事上都能做得很好,卻無法在任何事上做到最好(Human is good at everything but not best at anything. ),機器卻恰恰相反。打敗國際象棋大師的“深藍”就很好的例子,下國際象棋所向披靡,下跳棋卻會秒變智障。

“通用人工智慧”,簡單來說就是像人一樣,可以解決多種多樣、不同類型的問題。自從上世紀50年代人工智慧的概念誕生以來,這就是科學家們孜孜以求的夢想。

不過,對於通用人工智慧的問題,Silver 的回答還表現出科學家典型的謹慎。 他說,AlphaGo是圍棋人工智慧,通過持續的強化學習,它在特定的領域中具備了直覺。這跟人類接受培訓時產生的直覺、意識是不同的。當然,AlphaGo 背後的演算法和技術原理是可以拓展到其他領域的。

沒有懸念的比賽意義何在?

柯潔可能會幫AlphaGo發現新弱點

鑒於 AlphaGo 60:0橫掃人類高手在前,很多人覺得這次對弈的結果已經毫無懸念,笑到最後的肯定是AlphaGo。柯潔首戰失利後,又有人在討論,進行一場沒有懸念的比賽,意義在哪裡呢?

對此,Silver說,新版本的AlphaGo經過了幾百萬次的自我訓練,並且在檢測舊版本弱點方面表現出色。但是,當AlphaGo與從未對弈過的人類棋手對局時,這樣的優勢就不復存在了,尤其是柯潔這樣的圍棋大師。柯潔可能幫助發現Alphago未曾展露的新弱點。

“這樣的衡量標準是無法比較的。”Silver 也順便表示了對後兩局對弈的期待,“興奮!”

Hassabis 則說,Master的挑戰方式是網路快棋,在時間控制上不是特別精准,人類棋手的注意力也不一定完全集中。這回採用傳統的對弈方式,對 AlphaGo 來說是非常難得的機會,希望能借助比賽找到它的弱點 。去年的五番棋大戰中,李世石在第四場對弈中贏了AlphaGo,就為團隊後續改良 AlphaGo 提供了依據。

在 Hassabis 看來,已經很強的AlphaGo,依然能夠通過攜手人類,探索圍棋的更多可能性。昨天的賽後新聞發佈會上他也說,感謝柯潔將AlphaGo推向了極限。反過來,AlphaGo對圍棋選手和整個圍棋界來講是一個有效的工具,可以用來探索這項遊戲的真諦。

正是出於以上考慮,此次比賽除了單人賽,還設置了配對賽與團體賽。Silver 還順道解釋了一個小疑問:正常來說,棋越下到後面結果越明朗,人的思考時間也會相應減少,為什麼AlphaGo 的思考時間卻始終穩定呢?這是因為 AlphaGo 的計算量是恒定的,它的目的就是要贏,為了最大限度地保證贏棋,當然是選擇始終勻速的求穩下法。

不過,身居“世界圍棋第一人”高位的柯潔已經表態,不會再和人工智慧下棋。AlphaGo 今後又有什麼打算呢?

Hassabis 說,AlphaGo 背後涉及到非常多的技術,在現實應用上還處於早期的探索階段。他可以肯定的是,AlphaGo 使用的技術會逐漸推廣到谷歌的應用中。而根據此前的媒體報導,DeepMind 已經與英國國民醫療服務體系NHS 展開合作,希望借助人工智慧來改善醫療服務。

至於 AlphaGo 是否繼續下棋、繼續挑戰,Hassabis沒有正面回答,只透露說會在接下來的兩天公佈 AlphaGo 的未來動向,之後也會公開最新版本的更多細節。

AlphaGo的盈利前景?

他們說:不關心!

“變現”,這個隨著近兩年的創業風潮變得無比流行的詞彙,也被拋到了DeepMind 面前。公司的聯合創始人Mustafa Suleyman很酷地表示,“商業利潤對我們來說沒那麼重要”。

DeepMind公司聯合創始人Mustafa Suleyman。

Suleyman說,與盈利相比,DeepMind在推廣技術應用時更看重的社會價值,比如醫療、水淨化、食品安全、能源,等等。他開玩笑道,七年前創立DeepMind 時,所有人都說他們瘋了;三年前打算開發 AlphaGo,所有人又說他們瘋了;不久前,公司開始將 AlphaGo 背後的技術推廣到醫療領域,可能還是有人評價他們瘋了。

“做事情要有長遠的眼光。我們會為全球提供最優秀的醫療服務。我舉個例子吧,現在,最富有的人和一般人用的筆記型電腦,基本上是一樣的。就像筆記型電腦一樣,我們希望所有人能享有的醫療服務也是同等品質的。”Suleyman說,醫療領域的低效問題為時已久,甚至連一些醫生、護士都表示歡迎人工智慧來幫他們減負。

據瞭解,人工智慧走向現實應用,也並非一帆風順。DeepMind 此前就被控違規使用了患者資料,涉嫌侵犯個人隱私。目前,有關方面還在調查中。

對此,Suleyman 表現得也相當坦誠。他說,人工智慧的應用過程中確實出現了和現有監管機制不匹配的情況,需要在迅速發展的科技和監管機制之前尋找平衡點。對於患者資料的問題,他表示說絕對不會把資料和穀歌帳戶聯繫起來或是用於保險等商業業務,希望今後能加強社會對於人工智慧及相關技術的信任。

在昨天上午的演講中,Hassabis也談到了人工智慧應用的倫理問題。一方面,資訊超載和系統冗雜對人來來說是巨大挑戰,開發人工智慧,可能是這些問題的“元解決方案”。另一方面,人工智慧必須在倫理和道德框架內被恰當運用才能夠造福人類。他舉例說,人工智慧可以被用於材料分析、新藥研發,但絕對不能被用於武器研製。另外,人工智慧技術不應該被掌握在少數幾家巨頭公司手中,而是應該開源給全人類。

最後,說回開頭,科幻作品裡的超級人工智慧是否會很快出現? Hassabis 認為,AlphaGo 雖然厲害,但也只是處在人工智慧的起步階段,科學家們還有很多的關鍵問題沒有攻克,因此,超級人工智慧的實現“還有很長的路要走”。

采寫/攝影:南都記者 馮群星

編輯:林雲