AlphaGo Zero完全自學吊打老狗，人類資料沒用了？

分類＼科技
時間＼2017-10-19

而阿爾法元與幾位哥哥的最大區別是，它不再需要人類資料作訓練。因此，我們把AlphaGo Zero稱作“阿爾法元”，天為始，元為初，寓意從零開始。

本文共計2711字，閱讀時間5分鐘。

記者 | 蔡浩爽

編輯 | 趙力

AlphaGo家族的人工智慧圍棋手進入了華山論劍南帝北丐中神通的境界，比發明出雙手互搏術的周伯通更厲害的是，最新的AlphaGo Zero記者表示，阿爾法元的自主學習帶來的技術革新並非適用於所有人工智慧領域。“圍棋是一種對弈遊戲，是適用於規則並可以窮舉的。

在相對有結構的領域，比如新材料開發，過去靠的可能是靈感，未來就可以靠自主學習。阿爾法元的新技術確實可能帶來革新。但是，像語音辨識，圖像識別，自然語音理解等等領域，缺乏用簡單規則就能判別的樣本，它們依然需要大量的人類資料。”

在整個人工智慧產學研屆為DeepMind19日淩晨發表的這篇論文額手相慶時，也有人當頭澆下一盆冷水。

互聯網進化論作者、電腦博士劉鋒在一篇文章中表示：“關於AlphaGo是否具備創新創造性問題，

我們認為它依然是依託人工支援的大資料訓練形成的策略模型，同時在比賽中結合比賽對手的落點資料，根據其內部的運算規則，來不斷形成自己的落點資料，這些落點資料最終形成比賽資料集合。AlphaGo根據圍棋規則與對手的比賽資料集合進行計算和比較，判斷輸贏，整個過程完全在人類設定的規則下運行，

無法體現其自身的創造性。”

孫甲松也同樣認為，這一成果在人工智慧角度沒有實現實質性突破，“我認為這只是把AlphaGo過去的學習演算法進行了大幅度改進，將價值網路和策略網路整合為一個統一架構，使得在機器學習時，可以同時兼顧價值和策略的最優性。不但大幅度提高了機器學習的速度，同時學習結果也使得現在的系統遠超了原來的AlphaGo，因此有了100:0的結果。但我認為這只是對原來演算法的優化，

雖然使得電腦跟人下圍棋更是天下無敵，但這只能說是一個小小的進步，從人工智慧的角度還是沒有實質性的突破。”

但在李開複看來，論文的成果不可低估。“雖然有些技術並不是DeepMind開創的，比如ResNet。但能夠完美集成這些技術，本身就具有里程碑意義。”他認為，DeepMind的這一成果具有指向標意義，證明了這個方向的可行性。“哪怕這一成果稱不上諾布林水準或者圖靈水準，

但今夜過後，我相信會有一大半以上的研究人員在這個方向開始嘗試。”

有觀點稱，阿爾法元的工程和演算法確實非常厲害。但人們容易對此產生誤解，認為人工智慧是萬能的，所有人工智慧都可以無需人類經驗從零學習。每次關於人工智慧的討論，都會被引導人工智慧威脅論。

但李開複認為，人天生就具備跨領域的能力，比如人可以同時看到、聽到、感受到，但在這方面，人工智慧還差著十萬八千里；人工智慧也並不像很多人以為的那樣具有自主思考能力。“當下的機器沒有欲望，不會設立目標，也沒有自我意識。”

“在我看來，今天的事件更應該總結為兩點：一是AI前進的速度比想像中更快，即便是我們這些所謂行業內的人士都被阿爾法元跌破眼鏡；二是要正視中美在人工智慧方面的差距。中國還從未有可以引領行業的論文出現。”李開複對尋找中國創客（ID：xjbmaker）記者說。

但在這方面，人工智慧還差著十萬八千里；人工智慧也並不像很多人以為的那樣具有自主思考能力。“當下的機器沒有欲望，不會設立目標，也沒有自我意識。”