華文網

AlphaGo Zero完全自學吊打老狗,人類資料沒用了?

而阿爾法元與幾位哥哥的最大區別是,它不再需要人類資料作訓練。因此,我們把AlphaGo Zero稱作“阿爾法元”,天為始,元為初,寓意從零開始。

本文共計2711字,閱讀時間5分鐘。

記者 | 蔡浩爽

編輯 | 趙力

AlphaGo家族的人工智慧圍棋手進入了華山論劍南帝北丐中神通的境界,比發明出雙手互搏術的周伯通更厲害的是,最新的AlphaGo Zero記者表示,阿爾法元的自主學習帶來的技術革新並非適用於所有人工智慧領域。“圍棋是一種對弈遊戲,是適用於規則並可以窮舉的。

在相對有結構的領域,比如新材料開發,過去靠的可能是靈感,未來就可以靠自主學習。阿爾法元的新技術確實可能帶來革新。但是,像語音辨識,圖像識別,自然語音理解等等領域,缺乏用簡單規則就能判別的樣本,它們依然需要大量的人類資料。”

在整個人工智慧產學研屆為DeepMind19日淩晨發表的這篇論文額手相慶時,也有人當頭澆下一盆冷水。

互聯網進化論作者、電腦博士劉鋒在一篇文章中表示:“關於AlphaGo是否具備創新創造性問題,

我們認為它依然是依託人工支援的大資料訓練形成的策略模型,同時在比賽中結合比賽對手的落點資料,根據其內部的運算規則,來不斷形成自己的落點資料,這些落點資料最終形成比賽資料集合。AlphaGo根據圍棋規則與對手的比賽資料集合進行計算和比較,判斷輸贏,整個過程完全在人類設定的規則下運行,
無法體現其自身的創造性。”

孫甲松也同樣認為,這一成果在人工智慧角度沒有實現實質性突破,“我認為這只是把AlphaGo過去的學習演算法進行了大幅度改進,將價值網路和策略網路整合為一個統一架構,使得在機器學習時,可以同時兼顧價值和策略的最優性。不但大幅度提高了機器學習的速度,同時學習結果也使得現在的系統遠超了原來的AlphaGo,因此有了100:0的結果。但我認為這只是對原來演算法的優化,

雖然使得電腦跟人下圍棋更是天下無敵,但這只能說是一個小小的進步,從人工智慧的角度還是沒有實質性的突破。”

但在李開複看來,論文的成果不可低估。“雖然有些技術並不是DeepMind開創的,比如ResNet。但能夠完美集成這些技術,本身就具有里程碑意義。”他認為,DeepMind的這一成果具有指向標意義,證明了這個方向的可行性。“哪怕這一成果稱不上諾布林水準或者圖靈水準,

但今夜過後,我相信會有一大半以上的研究人員在這個方向開始嘗試。”

有觀點稱,阿爾法元的工程和演算法確實非常厲害。但人們容易對此產生誤解,認為人工智慧是萬能的,所有人工智慧都可以無需人類經驗從零學習。每次關於人工智慧的討論,都會被引導人工智慧威脅論。

但李開複認為,人天生就具備跨領域的能力,比如人可以同時看到、聽到、感受到,但在這方面,人工智慧還差著十萬八千里;人工智慧也並不像很多人以為的那樣具有自主思考能力。“當下的機器沒有欲望,不會設立目標,也沒有自我意識。”

“在我看來,今天的事件更應該總結為兩點:一是AI前進的速度比想像中更快,即便是我們這些所謂行業內的人士都被阿爾法元跌破眼鏡;二是要正視中美在人工智慧方面的差距。中國還從未有可以引領行業的論文出現。”李開複對尋找中國創客(ID:xjbmaker)記者說。

但在這方面,人工智慧還差著十萬八千里;人工智慧也並不像很多人以為的那樣具有自主思考能力。“當下的機器沒有欲望,不會設立目標,也沒有自我意識。”

“在我看來,今天的事件更應該總結為兩點:一是AI前進的速度比想像中更快,即便是我們這些所謂行業內的人士都被阿爾法元跌破眼鏡;二是要正視中美在人工智慧方面的差距。中國還從未有可以引領行業的論文出現。”李開複對尋找中國創客(ID:xjbmaker)記者說。