您的位置:首頁>科技>正文

柯潔“復仇”絕藝:在AI面前,尊嚴能吃嗎?

柯潔終於“回敬”了人工智慧一局。

在去年敗給了加強版AlphaGo之後, 1月18日, 柯潔在野狐圍棋上, 和騰訊AI Lab研發的圍棋人工智慧“絕藝”又開展了一場對弈,

成為首位接受AI“讓二子”的世界冠軍。 但是, 這一局僅僅對弈了77手, 柯潔追殺白棋右上未果, 果斷認輸。

但是, 在1月24日, 情況發生了變化。 “絕藝”當天在野狐圍棋, 同樣讓二子, 但是卻遭遇了人類的強勢“復仇”:連續三局, 絕藝落敗。 范蘊若六段成為第一個擊敗絕藝的人, 隨後, 上次戰敗的柯潔和連笑九段, 也先後取勝。

范蘊若之後, 柯潔第二個出戰, 這一次, 柯潔乾脆俐落地72手戰勝了絕藝。

絕藝在野狐的14連勝之路, 也就此告終, 沒有複製master的成功。

柯潔, 不復是那個單純只有年少氣盛的棋手。

還記得去年5月, 在烏鎮, 柯潔和AlphaGo的對戰, 總比分 0:3 敗於機器之手。 最後一局比賽中, 柯潔在局面不利時長時間離開, 回來後又淚灑現場。 賽後柯潔一度哽咽:它太完美,

我很痛苦, 看不到任何勝利的希望。

那是一場幾乎令人類感到絕望的戰鬥。 回顧當時柯潔的三局對弈, 升級版的AlphaGo, 做出了更多令我們驚訝的舉動。

而就在不久前, DeepMind團隊發表了最新論文, 提出強化學習演算法AlphaZero, 一種可以從零開始, 通過自我對弈強化學習在多種任務上達到超越人類水準的新演算法。

據說, AlphaZero在8個小時訓練後就擊敗李世石版本的AlphaGo;再用4小時訓練擊敗世界頂級的國際象棋程式Stockfish;再用2小時訓練擊敗世界頂級將棋程式Elmo。

世界當時為之譁然。 仿佛已經看到了人類被通用AI完爆的未來。

但好在, 在1月23日的達沃斯論壇午餐會上, Mustafa Suleyman(DeepMind 聯合創始人兼主管)在和創新工廠董事長李開複、李飛飛等的對話中坦承, Alpha zero沒有那麼神, 外界對它有點誇大了。 它要想工作, 必須滿足三個前提:可預測環境(圍棋規則), 清晰獎勵系統(輸贏), 無變數(variability) 。 也並不是外界說的不受監督, Alpha zero的監督來自於它的結構和訓練環境。

這終於讓人松了一口氣。 李飛飛也提醒大家, 目前AI還不能理解語境、複雜的知識,

要識別人類的情緒、感情和動機, 也還有很長的路要走。

而今天更令人欣慰的是, 無論人類是否能夠真正“反攻”機器, 而至少, 現在的柯潔, 讓我們看到了人類回歸初心、一顆珍珠經歷打磨後更加光華圓潤。

柯潔說:

在AI面前, 尊嚴是什麼?能吃嗎?我只知道

我喜歡下棋。

我熱愛圍棋。

比起機器, 這就是人類, 我最喜歡的樣子。 《職業棋手與人工智慧的差距?》

今天執黑和騰訊的AI 絕藝下了一盤被讓兩子(黑貼6.5 大約等於讓先倒貼目)贏了一盤。

前幾天第一次嘗試輸了, 被大肆報導了一番...今天贏了, 卻沒有任何報導。 現在的人呀...真是喜歡搞個大新聞啊...

其實穩著下優勢還是蠻大的...主要是第一次被AI讓一手, 真的有一種說不出的滋味...苦楚?無奈?可我還是想去挑戰。

前幾天和很多棋院小夥伴聚會, 大家都很開心。 除了敘舊聊得最多的就是AI。 還有就是我們棋手到底和AI有多大的差距?這不僅是廣大愛好者最關心的話題, 其實也是我們最關心的話題。

其實聊這個話題的時候,我的內心是極其沉重的。你們可能也懂。AI到底給了我多大的傷害——它可是唯一一個在棋盤上把我殺哭的啊!!

但自從慢慢接受了以後,這又是不得不去面對的一個話題...

我經常會回想起兩年前的我,那個把熱血漫畫主角套進現實中、那個極度中二的圍棋少年。所有決賽的對手都是要擊敗的boss——而alphago就是最終暗黑大boss!他是壞人!(笑)熱血漫畫的主角一定會幹掉最終boss,我一定會贏!然而...結局我沒贏,中二的少年沒贏。我輸了,而且輸的很徹底。

現在雖然也沒到油膩的年紀,但心態確實已經發生了很大變化,油膩到可以放下尊嚴去向AI虛心討教了。

那麼到底,我們職業棋手AI有多大差距呢?

首先是心態

我覺得,我在和人類下棋的時候是英勇無畏的。因為老子棋就是最強的!(笑)

和AI下。。。我這裡會不會被幹漏啊。。。哎呀我的棋怎麼這麼薄啊。。。哎呀我的實地怎麼這麼少啊。。。像一個60歲的老母親擔心自己遠遊的孩子一樣擔心自己的棋,最後結局一般都是哎呀不行了不夠了認輸鍵在哪我要認輸。

棋未先行心態已崩

但若是以一個平和的心態去面對。

我覺得差距,不會有想像中那麼大。

具體有多少差距,我保險點的說,絕對不會超過三子。

我不喜歡放空話,我希望登到有AI真的到了alphgo zero的水準的話,我可以放下尊嚴去下正式的讓子棋,給愛好者們看看到底又多大差距。

在AI面前,尊嚴是什麼?能吃嗎?我只知道

我喜歡下棋。

我熱愛圍棋。

AI要識別人類情感,還早得很

Mustafa Suleyman:說AlphaZero這個系統不受監督有點誇大了,監督來自於它的結構和訓練環境。所以尤其是依賴強化學習的具體方法,在現實生活中效果不是很好。在現實生活我們無法提供模擬器,進行這種巨量的訓練來形成演算法。AlphaZero現在只是在三件事成立的情況能夠工作:可預測環境(圍棋規則)清晰獎勵系統(輸贏),無變數(variability)。

但我對深度學習在現實中的應用潛力非常有信心,人們現在低估了這一潛力。我們的目光已經投到了幾十年後,比如極現代化狀態下的super-intelligence,但我們應該思考的都是更近期、更實用的可能。

在我看來強化學習 3-5年內都沒有普及應用。

李飛飛:人工智慧還是一個新領域,只發展了60年左右。當我還是一個大學生時,我想像不到人工智慧會帶來的巨變,它巨大的搜索能力,更不用說無人駕駛這些了。我們見證了非常了不起的突破。

我想提醒大家,這個時代充滿了巨大的可能性,我們要深切地思考人工智慧的本質,前面還有很長的路要走。電腦還不能理解語境、複雜的知識,要識別人類的情緒、感情和動機,我們也還有很長的路要走。

我有一位同事70年代時就在這個領域工作,他認為我們今天對完美的人工智慧機器的定義是:一台能做出完美食物的機器,雖然房間已經著火了。

李開複:這個領域頂尖的前100名科學家中已經有一些是中國人,我認為,關於中國,有四個方面還並沒有被得到認識,但這四個方面會是中國未來發展的非常強勁的推力。

第一,中國一流的理工科教育。第二,活躍的創業氛圍和資本對這個領域的大量投資。作為一家風險投資機構,我們投資了45家人工智慧公司。這些公司分佈在各個領域。

第三,中國巨大的資料量。中國共用單車的使用人數是美國的3倍,但單車交易量是美國的50倍。這個支付系統擁有6.5億使用者,不收傭金、無中間人,支援移動支付。我們早就幻想能做到這樣,但這卻在中國發生了。在此基礎上,形成了大量可供進行支付的公司和建立該系統的企業家們挖掘的資料。另一方面,消費者們願意出讓隱私來換取安全和便利。

第四,政府的政策。

另一方面,中國政府和企業對待科技的立場上傾向實用主義,在實用主義立場影響下,實現會更快、收集的資料會更多、做出的產品會更好,促能成更大的突破。

回顧:烏鎮棋局,AlphaGo有多厲害?

烏鎮對弈第一場,柯潔執黑先行,經過4小時17分37秒,289手的激戰後,最後AlphaGo以1/4子取勝。棋到中盤時,阿爾法狗已經領先差不多一個貼目。但是之後,它採取了保守的下法,沒有寸土必爭。在賽後,不由得引發了人們對此結果可怕的猜測:贏半目,是AlphaGo故意設置好的?

第二局,AlphaGo提前一個多小時,中盤取勝。這一局,AlphaGo執黑先行,而它在落子前,不同以往地經過了思索,最後選擇了“效仿對手”,以第一局柯潔採用的小目、三三開局。

在之後的人機配對賽中,與人類棋手搭檔的AlphaGo決定投子認輸,遭到拒絕後,AlphaGo的棋路變得越來越消極,最終,古力在不可逆轉的情勢下,也只得認輸。

和柯潔對戰的是去年年初戰勝60位高手的AlphaGo Master。

目前的AlphaGo是單機版。

配備了4塊TPU。

與2016年3月與李世石的比賽時相比,當前的版本在處理計算時所消耗的能量僅為過去的十分之一。

當時,與柯潔對戰的AlphaGo Master的等級分已經接近了4800分。

AlphaGo採用強化學習,讓人工智慧進行自我博弈,產生更強的神經網路。這一次AlphaGo用自我對弈訓練出的策略網路,可以做到不需要更多運算,直接給出下一步的決策。

相比之下,烏鎮的AlphaGo比去年擊敗了李世石那一版的AlphaGo Lee相比要“強三子”。

其實聊這個話題的時候,我的內心是極其沉重的。你們可能也懂。AI到底給了我多大的傷害——它可是唯一一個在棋盤上把我殺哭的啊!!

但自從慢慢接受了以後,這又是不得不去面對的一個話題...

我經常會回想起兩年前的我,那個把熱血漫畫主角套進現實中、那個極度中二的圍棋少年。所有決賽的對手都是要擊敗的boss——而alphago就是最終暗黑大boss!他是壞人!(笑)熱血漫畫的主角一定會幹掉最終boss,我一定會贏!然而...結局我沒贏,中二的少年沒贏。我輸了,而且輸的很徹底。

現在雖然也沒到油膩的年紀,但心態確實已經發生了很大變化,油膩到可以放下尊嚴去向AI虛心討教了。

那麼到底,我們職業棋手AI有多大差距呢?

首先是心態

我覺得,我在和人類下棋的時候是英勇無畏的。因為老子棋就是最強的!(笑)

和AI下。。。我這裡會不會被幹漏啊。。。哎呀我的棋怎麼這麼薄啊。。。哎呀我的實地怎麼這麼少啊。。。像一個60歲的老母親擔心自己遠遊的孩子一樣擔心自己的棋,最後結局一般都是哎呀不行了不夠了認輸鍵在哪我要認輸。

棋未先行心態已崩

但若是以一個平和的心態去面對。

我覺得差距,不會有想像中那麼大。

具體有多少差距,我保險點的說,絕對不會超過三子。

我不喜歡放空話,我希望登到有AI真的到了alphgo zero的水準的話,我可以放下尊嚴去下正式的讓子棋,給愛好者們看看到底又多大差距。

在AI面前,尊嚴是什麼?能吃嗎?我只知道

我喜歡下棋。

我熱愛圍棋。

AI要識別人類情感,還早得很

Mustafa Suleyman:說AlphaZero這個系統不受監督有點誇大了,監督來自於它的結構和訓練環境。所以尤其是依賴強化學習的具體方法,在現實生活中效果不是很好。在現實生活我們無法提供模擬器,進行這種巨量的訓練來形成演算法。AlphaZero現在只是在三件事成立的情況能夠工作:可預測環境(圍棋規則)清晰獎勵系統(輸贏),無變數(variability)。

但我對深度學習在現實中的應用潛力非常有信心,人們現在低估了這一潛力。我們的目光已經投到了幾十年後,比如極現代化狀態下的super-intelligence,但我們應該思考的都是更近期、更實用的可能。

在我看來強化學習 3-5年內都沒有普及應用。

李飛飛:人工智慧還是一個新領域,只發展了60年左右。當我還是一個大學生時,我想像不到人工智慧會帶來的巨變,它巨大的搜索能力,更不用說無人駕駛這些了。我們見證了非常了不起的突破。

我想提醒大家,這個時代充滿了巨大的可能性,我們要深切地思考人工智慧的本質,前面還有很長的路要走。電腦還不能理解語境、複雜的知識,要識別人類的情緒、感情和動機,我們也還有很長的路要走。

我有一位同事70年代時就在這個領域工作,他認為我們今天對完美的人工智慧機器的定義是:一台能做出完美食物的機器,雖然房間已經著火了。

李開複:這個領域頂尖的前100名科學家中已經有一些是中國人,我認為,關於中國,有四個方面還並沒有被得到認識,但這四個方面會是中國未來發展的非常強勁的推力。

第一,中國一流的理工科教育。第二,活躍的創業氛圍和資本對這個領域的大量投資。作為一家風險投資機構,我們投資了45家人工智慧公司。這些公司分佈在各個領域。

第三,中國巨大的資料量。中國共用單車的使用人數是美國的3倍,但單車交易量是美國的50倍。這個支付系統擁有6.5億使用者,不收傭金、無中間人,支援移動支付。我們早就幻想能做到這樣,但這卻在中國發生了。在此基礎上,形成了大量可供進行支付的公司和建立該系統的企業家們挖掘的資料。另一方面,消費者們願意出讓隱私來換取安全和便利。

第四,政府的政策。

另一方面,中國政府和企業對待科技的立場上傾向實用主義,在實用主義立場影響下,實現會更快、收集的資料會更多、做出的產品會更好,促能成更大的突破。

回顧:烏鎮棋局,AlphaGo有多厲害?

烏鎮對弈第一場,柯潔執黑先行,經過4小時17分37秒,289手的激戰後,最後AlphaGo以1/4子取勝。棋到中盤時,阿爾法狗已經領先差不多一個貼目。但是之後,它採取了保守的下法,沒有寸土必爭。在賽後,不由得引發了人們對此結果可怕的猜測:贏半目,是AlphaGo故意設置好的?

第二局,AlphaGo提前一個多小時,中盤取勝。這一局,AlphaGo執黑先行,而它在落子前,不同以往地經過了思索,最後選擇了“效仿對手”,以第一局柯潔採用的小目、三三開局。

在之後的人機配對賽中,與人類棋手搭檔的AlphaGo決定投子認輸,遭到拒絕後,AlphaGo的棋路變得越來越消極,最終,古力在不可逆轉的情勢下,也只得認輸。

和柯潔對戰的是去年年初戰勝60位高手的AlphaGo Master。

目前的AlphaGo是單機版。

配備了4塊TPU。

與2016年3月與李世石的比賽時相比,當前的版本在處理計算時所消耗的能量僅為過去的十分之一。

當時,與柯潔對戰的AlphaGo Master的等級分已經接近了4800分。

AlphaGo採用強化學習,讓人工智慧進行自我博弈,產生更強的神經網路。這一次AlphaGo用自我對弈訓練出的策略網路,可以做到不需要更多運算,直接給出下一步的決策。

相比之下,烏鎮的AlphaGo比去年擊敗了李世石那一版的AlphaGo Lee相比要“強三子”。

Next Article
喜欢就按个赞吧!!!
点击关闭提示