GAITC丨尖峰對話：繼續大資料驅動深度學習還是另尋他途

小編

在5月21-22日舉辦的2017全球人工智慧技術大會上，進行了兩場尖峰對話，可謂是精彩紛呈。兩組嘉賓在臺上唇槍舌劍，論戰人工智慧，場間妙語連珠，引爆多個當下的AI熱點。提問環節更是反響熱烈欲罷不能，小編特地將尖峰對話速記整理出來，好讓粉絲們再次回味當時的熱烈場面。

山世光/主持人：

大家好，我是來自中國科學院計算技術研究所的山世光，這次2017全球人工智慧技術大會是在第三次人工智慧熱潮大背景下召開的，我們知道人工智慧在歷史上經過兩次大起大落的發展階段，現在我們似乎非常幸運地進入了第三次人工智慧熱潮，而這一次的人工智慧的熱潮的興起與深度學習有極其密切的關係，那麼深度學習是否通用人工智慧問題的終極解決方案？這就是我們今天Panel的討論主題--通用AI之路：繼續大資料驅動深度學習還是另尋他途，

有請嘉賓：

360副總裁， 360人工智慧研究院院長顏水成

羅切斯特大學教授、騰訊優圖顧問羅傑波

雲知聲董事長/首席技術官梁家恩

北京大學資訊科學技術學院教授、電腦科學技術系主任黃鐵軍

山東大學電腦科學與技術學院院長、軟體學院院長、教授陳寶權

北京大學資訊科學技術學院智慧科學系教授、機器感知與智慧教育部重點實驗室主任查紅彬

幾位嘉賓都是在人工智慧大的範疇裡有過非常久的研究經驗或者是工程經驗的，我們可以看到幾位嘉賓的分佈，有4位目前還是在學術界，是非常著名的大學或者研究機構的教授或者是院長級別的大咖，我們的顏水成教授剛剛從學術界來到工業界，也是在學術領域有非常多的研究的經驗，

還有一位來自工業界的梁家恩博士，來自于雲知聲，也是技術出身，因為這次大會其實是一個全球人工智慧技術大會，這個話題偏技術，我們希望探索討論通用人工智慧這樣一個話題，我們的技術應該怎麼走的問題。

幾位嘉賓剛才做了非常簡單的介紹，相信大家還希望能夠知道的更多一些，下面請幾位嘉賓分別簡單做一下自我介紹，同時解讀一下他們對這個話題的理解，首先請查紅彬老師。

查紅彬：

各位老師，各位同學，各位嘉賓大家好！本來我看到今天討論者的名字排出來的時候，我應該是坐最邊上的。沒想到坐在了主持人邊上，輪到最先發言了。我是叫查紅彬，今天很高興參加這個討論。

我們現在講到大資料，講到深度學習，這是我們今天討論中非常核心的概念。這兩個概念的出現，在今天的人工智慧領域，甚至是整個科學技術領域的發展中都發揮了非常重要的作用。這一點是毋庸置疑的，不然沒有這麼多人對這些概念感興趣。但是如果我們將尺度放大一點，在人工智慧的發展歷史中來看大資料與深度學習，可能這樣一些概念並沒有脫離傳統的人工智慧的框架，是在人工智慧發展過程中自然的進步。也就是說，我們還有很多問題目前沒有完全解決，比如說智慧系統本身的柔性，智慧體與環境間的交互行為，還有新的計算方法和硬體框架，這些都是遺留下來的問題，值得我們進一步探討，

謝謝大家。

陳寶權：

各位嘉賓好，我算是第一次參加人工智慧類的會議，以前不敢參加這個會議，因為有一點投機的嫌疑，我本人的研究方向不是人工智慧，是做視覺計算，但我發現人工智慧確實已經涉及到了各個領域的發展，也包括視覺計算。我的研究團隊最近也開始採用深度學習的方法解決我們原來不太能解決的問題，或者解決不太好的問題，比如在三維視覺中的三維場景理解問題，所以覺得這是一個不可忽略的發展方向。回到今天的研討題目，從我本人作為一個新手進入這個領域來講，基於資料的深度學習還是一個新的途徑，它還有很多可以挖掘的東西，是不是還有其他的途徑呢，對我來說目前不敢奢望，我覺得目前重要的是在現在的途徑之上，怎麼樣把它進一步的完善，把深度學習的模式識別，這樣一個工具性的東西，變成真正有智慧的東西，這是我們可以研討的方向。謝謝各位。

黃鐵軍：

各位專家、各位同仁，我是北京大學的黃鐵軍，電腦專業的。在這麼多年裡，我覺得每個搞電腦的心裡都有一個通用人工智慧的夢想，即怎麼實現強人工智慧。這個夢想一直在我腦子裡，2014年我突然發現，存在一條通用人工智慧的技術路線，當然這未必是唯一的技術路線，但是它真的是存在的，這是這一生最值得做的一件事。我認為人工智慧的終極目標就是做強人工智慧，可惜昨天看會議日程的時候發現英文翻譯錯了，“通用人工智慧”應該翻譯成“Artificial General Intelligence”，定義很清楚，但是怎麼實現，一會兒還有機會討論，我先說到這。

梁家恩：

各位嘉賓、老師、同學大家上午好，我是雲知聲的梁家恩，雲知聲是技術起家的創業公司，團隊在人工智慧行業已經有將近20年的積累。現在是第三次人工智慧浪潮，雲知聲五年前開始創業，主要是面向物聯網提供完整的人工智慧服務解決方案。今天論壇的主題是“通用AI之路：繼續大資料驅動深度學習，還是另尋他路”，在過去的五年裡，大資料和深度學習，已經為雲知聲在技術性能提升和產業應用落地做了非常大的貢獻。通用人工智慧，從我們的角度來看，大資料和深度學習會有很大貢獻，但整體上還沒有比較清晰的路徑。現在有很多新的機器學習方法不斷出現，都非常值得期待，謝謝大家。

羅傑波：

大家好，我叫羅傑波，來自美國羅切斯特大學。我這個人比較不喜歡跟風，所以我實際上跟顏教授是反著來的，我在柯達工業界做了15年，做過開發，做過研究，6年前我決定回到學術界。我的主要研究領域是兩個，一個是電腦視覺，這是我有20多年經驗的領域，最近十多年是大資料的挖掘，特別是基於圖像資料的挖掘。對深度學習，我一不排斥，二不迷信。打個比方，AI是個大家庭，這個大家庭裡原來有很多孩子，視覺只是一個，自然語言理解，語音辨識，機器學習等等，電腦視覺這個孩子屬於熊孩子一類的，很長時間成績很差，最近因為吃了深度學習這個藥就趕上來了。作為一個電腦視覺領域工作很多年的從業者，我認為現在不是電腦視覺飄飄然的時候，應該和人工智慧大家庭一起推動行業的發展，謝謝大家。

顏水成：

我叫顏水成，在2015年底從學術界來到工業界，前期研究電腦視覺和機器學習比較多，加入360以後開始涉獵語音和語義方面的東西，算是對人工智慧的四個維度都有一些初步的認識，但是如果說涉及到強人工智慧的話，我個人覺得不得不把學術界和工業界兩個合在一起來分析。我覺得當前的狀態來說，強人工智慧的理想是豐滿的，但是現實是骨幹的。總的來說，強人工智慧到底要實現什麼樣具體目標還不是特別清晰，至少在我看來。在這種情況下，我覺得可能最好的方式是工業界專注在弱人工智慧，在特定領域如果已經有可以用的東西，則在產業界中發揮它應有的效能。但是強人工智慧不是完全放棄掉了，比較適合於在高校裡，像黃老師做這種研究非常合適，等這方面真的有它可見的一些成功的案例以後，工業界再涉獵比較好。謝謝大家！

山世光/主持人：

我們的嘉賓們已經有開火的味道了，剛才羅老師說電腦視覺是個熊孩子，在座的幾位嘉賓除了梁博士都是搞這個熊孩子的。我們知道深度學習在過去幾年的時間裡，之所以能夠得到大家足夠的重視或者引起大家非常大的興趣，很大程度上也是因為人工智慧在電腦視覺和語音辨識等感知領域取得了非常大的進步，除此之外，這幾年已經有非常多的領域涉獵深度學習，下面我們請每位嘉賓分享一下，最近在深度學習應用方面哪些新的比較大的進步，以便聽眾理解這種大資料驅動的深度學習的技術路線，它能解決什麼樣的問題，之後我們再討論一下這種路線不能解決什麼樣的問題。還是從查老師開始吧。

查紅彬：

剛才也說到，今天在座的很多討論者都從事電腦視覺研究，大家基本上是做感知方面的。如果我們仔細地分析一下大資料這個概念，其實它與感知之間有著非常密切的聯繫。什麼叫大數據？今天的大會報告中說到了行業大資料，其實這些大資料是人工智慧中感知系統一個非常大的變革。為什麼這麼說呢？如果我們將一個大的行業，一個大的企業，看作一個系統的話，我們拿到的大資料，就是我們得到的有關這個系統的感知資訊。從這個意義上講，今天我們講的大資料獲取就是系統完成了對外部世界的感知任務。當然這個感知概念與我們通常講的人的視覺、聽覺、觸覺等有所區別，而是更廣義更抽象層面上的感知。現在講物聯網，就是要在各個行業，像醫療、交通等，獲得更多有用的資料，有更強的感知能力。當然，這種感知能力是相對被動的，系統只能將手頭已有的資料提供給系統。

陳寶權：

我一點體會，資料驅動未來的趨勢可能是一方面往大，一方面往小發展，大的就是在一些行業裡，針對特定的目標，儘量把這個資料集中在特定的目標領域，因為如果是很散亂的資料，它估計是學到的東西是有限的，不精准的。另外一個是小，資料在小樣本的情況下怎麼樣學到東西，這個應該是未來很重要的趨勢。說得具體一點，比如我做三維場景的理解，以前理解都是通過對大量二維影像的學習。但想想，這個世界是天然三維的，三維表達是一個更加緊湊更加本質的表達，那麼學習的物件和表達不應該只是二維圖片和模式表達，怎麼樣把三維本質的表達和深度學習結合起來，讓一個小樣本也能得到很好的學習的結果，這個是我們比較關心的問題。

黃鐵軍：

總體上講，我認為大資料、深度學習、神經網路，這幾個方向從長遠來說都是對的，大方向是對的，但是不等於現在就好了。我比較反對小樣本這種說法，那邊是大資料，就有人說在小樣本我的演算法好，其實大家想一想，人的智慧生成其實就是大資料訓練的結果，當然這是廣義的大資料，我們從單細胞的生物演化出今天大腦皮層的複雜結構，什麼東西在影響？就是進化過程中，地球的各種環境作為大資料刺激這個系統的演化過程。所以我們的智慧的產生，本來就是大資料訓練的結果，進化大資料，演化的結果。我們今天說大資料，大家老覺得對資料苛求太多，其實本來就應該這樣：真正強的智慧，背後的資料一定足夠豐富，不豐富哪來這麼強的智能呢？所謂小樣本學習，總得有一個學習模型在後面吧？學習模型總要採用某種實現結構吧？這種結構從何而來？像人腦，如果我們要設計更複雜的神經網路，神經網路的結構怎麼就應該那樣呢？這種結構本身就是資料訓練的結果，所以我的意思是，不要片面強調小樣本，小樣本不可能單純作為一種方法存在，它要在複雜結構和模型基礎上才能存在。

梁家恩：

大資料深度學習，在工業界取得了舉世矚目的成果。如果沒有深度學習和過去互聯網發展積累下來的大資料，現在可能我們沒法看到這麼好的結果，這在聽覺、視覺方面的進展是毋庸置疑的。現在深度學習的“黑盒子”屬性沒有完全解開，有些科學家覺得深度學習太工程化，在數學上不是特別優雅，和傳統機器學習不一樣，但是在工業界非常實用，在未來一段時間裡，還會發揮非常重要的作用。大資料深度學習，特別適合解決資料量很大的端到端的序列映射問題，效果非常好；如果說不太適合的場景，就是資料規模不夠大、或者不是一個簡單的序列映射的問題，比如符號理解、推理和對話。目前的深度學習網路結構通常是設計好的，如何根據問題尋找適合的網路結構，這點上需要更多的研究和推進，也是我們期待的。至於大資料，我們現在的機器學習，用到的訓練資料主要還是靠人工干預得到的標注資料，並不是一個真正的大資料。所謂大資料，應該是能用上人處理不了的資料規模，這是未來的機器學習的一大挑戰，這個跨度非常大，也是目前的一個熱點所在。人類的學習，是以進化了很多年的大腦為基礎，感知特徵抽象能力非常強，人出生以後，各種學習都是在相對比較小的樣本上進行的，能很快通過適應和調整，達到較高的認知水準，這是我的看法。

羅傑波：

因為我最近教書教多了，一般我不上來就說自己的觀點，我講幾個故事，你聽完了就知道我的觀點。我們今天講人工智慧，我們可以拿人的智慧做一個例子，我以前的導師有一個小孩子很聰明，3歲時候有一個現象，因為我的頭髮是自然卷，長的時候是卷的，理完發就不卷了，我每次理完發他就不認識我。我想說什麼意思，3歲以前，我認為人不是用深度學習，我認為到5歲以後，就具備深度學習的能力了。但是我的觀點是，深度學習只能讓一個機器達到5歲的智慧。

顏水成：

會不會是3歲的時候，深入學習模型還沒有學好呢？

羅傑波：

我主要想說的是，深度學習只能讓一個系統達到5歲，5歲對世界的認識是什麼呢，主要是感知，不是認知。我再講一個例子，我女兒的例子，我女兒我認為她很聰明，至少比我聰明，這個是IQ指數出來的，她現在16歲了，她在美國從小長大，她不知道醃黃瓜pickle是從黃瓜來的，因為我們在中國長大，我們知道醃黃瓜怎麼出來的，我一到美國就知道。她沒有見過，但是她在16歲某一天突然反應過來了，她認知醃黃瓜是從黃瓜來了。我認為5年級的學生就不需要大資料了，你問他，他也能知道醃黃瓜是黃瓜來的。我講這兩個故事的意思呢，我認為深度學習“不”可能讓我們達到強人工智慧的地步，但是深入學習讓我們把底層的問題，比如說視覺是我們人感知世界的主要手段，占70%的資訊是從視覺來的，視覺這個問題不解決，想討論更上層的人工智慧的問題，這是沒有基礎的。因為深入學習，電腦視覺有一個長足的進步，讓我們在這個基礎上可以真正去探索，去解決強人工智慧的問題，這個就是我的觀點。

顏水成：

我非常贊成黃老師的觀點。我們先討論一下基於大資料的深度學習為什麼這麼重要，我想從這個角度分享一些我的觀點，大家可以看到，大概在2015年2016年早期的時候，大家在講人工智慧的時候，主要講人工智慧的三要素，大資料，計算能力和演算法。但是2016年底和2017年初有一些變化，大家講人工智慧有四個要素，有大資料，有計算，有演算法，還有一個是場景。場景是非常重要的，從工業界的角度來說，如果人工智慧演算法或者說能力沒有落地的場景，人工智慧就沒有它的價值。如果從這個角度出發，我們會發現，大資料是非常關鍵的。為什麼呢？如果這個場景本身不產生大資料，很可能是大家比較關心它，很重要，但可能不是高頻的應用。有些場景從整個社會的層面來說是非常有價值，比如說一種特有的疾病，如果能治好那是非常有價值的，但是可能的病人的數字不是特別多，這個時候比較適合從國家投入的角度去解決問題。從商業的角度來說，如果這個場景沒有足夠的資料，這個商業場景不可能往前走，要想有比較好的應用場景，必須有價值，也要高頻，一定就有大資料，大資料驅動深度學習往前推動，我認為是因為大家越來越重視人工智慧的落地性，希望在工業上產生價值而帶來的結果。

陳寶權：

大小資料是一個相對的概念，我之所以提出小資料，是針對你最後要達到的目標，目標越來越高，可是你處理的物件越來越複雜，相比之下，手頭所擁有的資料就會顯得越小，，所以大小資料是相對的概念。如何在有限的資料的情況下，也就是說不是你想多大就有多大資料的情況下，可以仍然達到你預期的目標，這就需要小資料的概念。

顏水成：

為什麼拿不到大資料，是因為這個場景根本無法拿到這個大資料，還是你根本無法標誌這個資料？

羅傑波：

大資料不是簡單的很多資料，沒有標定的大資料是沒有用處的，所以即使現在我們有能力拿到很多資料，其實要建立很強大的人工智慧系統，比如說人臉識別，它是需要很多標定的資料。為什麼人臉識別發展這麼快，是因為有大量標定資料。在別的領域，比如醫學，實際上醫學應該是限定領域的問題，它應該發展得比通用圖像識別要快，但是它現在沒有跟上來的原因，就是因為沒有足夠的標定的資料。我想跟大家說一點，我們要大資料，但是我們更需要的是有標定的大資料。

山世光/主持人：

這裡是不是存在一個有效大資料的問題？比如我觀察一類物體做識別，你看到一個物體的大量的樣本，並不等於你見了這一類物體的大量的不同的相似物體的大量樣本。我剛才問題的意思是說，是否是我們現在所有碰到的AI問題，只要有有效的大資料，用深度學習，就一定可以解決好？甚至是否可以說只要機器見到了比人見到的更多的大資料，用深度學習就可以做的比人好呢？

黃鐵軍：

我一定要提醒大家一下，小樣本是相對於大資料而存在的，不要絕對化。舉個例子，比如特殊事件，異常事件，說缺乏大資料，搜集不到那些資料，車哪能老撞？這種缺少大資料的情況怎麼辦？沒有大資料！其實這是開發是錯誤的，正常的資料都給你了，突然出現不正常的，異常實際上正常大資料的例外，仍然是大資料。通用智慧能做到這一點，實際上仍然是大資料驅動的，因為你見到太多的正常，突然出現不正常，你就應該有發現不正常的能力，你發現異常的能力來自哪裡？仍然是基於大量的資料訓練。

顏水成：

在360曾經有一件事情，是關於殺毒軟體的。以前的做法，用演算法把病毒和非病毒分開。360有一段時間做白名單，就是把你電腦裡，網上雲盤裡存的檔，有極其多不是病毒的樣本，不一定有特別模式，存下來，有這些大資料在那個地方，當你的電腦上出現一些檔，我可以非常肯定地確定一些樣本一定不是病毒，這個就跟剛才說的異常事件一樣，不一定通過分類的方法，而通過白名單確定這些東西一定是好的，剩下的就是我們需要注意的就可以了。

山世光/主持人：

這次為什麼勒索病毒沒有搞定呢？

顏水成：

這個的原理不一樣，它是一種通過新的埠漏洞進行攻擊。通過早期監測發現一些異常以後，360的安全工程師就把它確定，很快360就有修復的SDK發佈出來了。

羅傑波：

我贊成黃老師說的，大資料大家一般想到的都是監督學習，但是大資料學習有一個重要的手段，就是無監督學習，當你把正常的樣本瞭解得很清楚以後，任何跟它不相像的東西就是異常的outlier。現在很多人認識到，深度學習要向無監督學習方向發展。

山世光/主持人：

有沒有哪位嘉賓覺得：即使現在有了有效的大資料，還有解決不了的問題呢？

黃鐵軍：

所謂的資料，就是描述你要解決問題的素材，你要解決什麼問題，一定要對這個問題描述，比如說我要解決這個問題，目前的深入學習能不能解決好，那取決於背後的網路模型是不是夠強大，演算法是不是好，不是方向對不對，而是資料在哪兒？大家可以不斷提高新的模型和演算法，今天解決不好，可能過一段新模型就解決了，資料還是那些資料，大資料和神經網路、機器學習的大方向沒錯。

山世光/主持人：

我的意思就是，有什麼問題是現在我們知道的深度學習模型搞不定的，即使我們與足夠大規模的有效資料。

黃鐵軍：

現在的學習模型和神經網路結構解決不了一些問題並不奇怪，還要繼續改進提升。

山世光/主持人：

剛才我們幾位元嘉賓也討論到這個話題，我們現在能夠解決好的問題通常都是大資料驅動的，如果是我們類比人的話，就像剛才羅教授提到，很多時候小孩認蘋果，其實沒有經過上千個蘋果的學習，看幾個蘋果的圖片，就可以形成比較強的識別蘋果的能力。剛才說了，因為進化過程中，人類作為一個種群，已經進行了大資料的學習。而對每個個體而言，其胚胎發育期，通過基因繼承了這些大資料學習的結果，而出生後的發育則經常是小樣本小資料學習。那麼像陳老師提到小資料學習之類的問題，該如何進行學習呢？

陳寶權：

我覺得這個題目是把我們鎖定在大資料了，其實我覺得大資料能解決的事情還是非常有限的，我講講人類認知的過程，人類可以不停的積累知識，有一個抽象的能力，在抽象的層面傳遞知識，這是我們人類所具備的能力，還不說人作為一個生物體還有其意識，情感，這方面的計算模型，如果有的話，不一定是基於大資料。人的抽象思維的能力，傳遞知識的能力，這方面是我們在基本模式識別的基礎之上很快進化到的更高的認知過程，我覺得它絕對是超過了所謂資料，以大資料驅動的深度學習的範疇。不過正好澄清一下，強人工智慧我現在不太熱心，我只是覺得，在目前這個情況下，過度討論這個問題可能會浪費我們的時間，原因是人類的認知有一個螺旋式上升的過程，你得先把底層的認知，如深度學習所能達到的模式識別能力搞得更清楚了，才可能推進更高層次認知的研究。把一個太超前的目標作為近期目標來討論，就有可能形而上，就是浪費時間，這是我個人的觀點。

羅傑波：

我補充一下，剛才黃老師也談到，我認為人類除了深度學習和資料驅動的學習以外，還有一個遷移學習，就是我們通常說的舉一反三。現在很多人意識到這個重要性，遷移學習有幾種，一種是很近的領域遷移過去，譬如你在醫學圖像一個模態上搞出一個模型，再把模型轉移到其他的模態，這個比較容易遷移。更難遷移的是，你會打羽毛球的人，碰到網球大概知道怎麼打，這就是更高一層的遷移能力。你不能用模型遷移。但是人是怎麼解決這個問題，我認為是知識遷移的問題，不是一個模型的遷移，是知識的遷移。這個說起來比較玄，我們先從模型的遷移，比如知識圖譜我認為就是有潛力的東西，我們現在也在摸索，怎麼把外部的知識，以知識圖譜的形式和數位驅動的深度學習結合起來。這個有一個實際需要，我如果確實拿不到標定的資料，我加上我學到的知識就可以達到我們的目的，我認為這是一個努力的方向。

顏水成：

其實這個題目不是特別清晰，我們說的意思應該是，基於資料驅動的深度學習，是不是能用一種純粹的端對端的形式把所有的問題解決。如果純粹只有深度學習的話，不能解決所有的問題，深度學習可以作為解決一個特定問題裡的子模組，比如一個很典型的例子，下圍棋，我們用的是搜尋樹的方式進行推演，但其中用到三個神經網路決定下一步怎麼下，下的子以後可能取勝的概率多少，這時候深度學習在傳統解決問題的框架中起到非常積極的作用。在我看來，大資料驅動的深度學習，可能不一定能解決所有的問題，但是很明顯，到這個時間點，它已經變成解決大部分問題中不可或缺的模組，這是肯定的。

梁家恩：

我覺得在工業界應用中，沒有資料是寸步難行的。首先，真實應用中有很多問題，是需要真實資料來定義的，這是解決問題的一個很重要的點，沒有資料在工業界很難落地；第二點，即便在有資料的情況下，也不是一招就能解決所有問題的，人工智慧技術有60年的積累，有很多的問題也有很多的方法。現在是深度學習，也就是過去的神經網路，80年代也曾經被打入冷宮，最近資料和深度學習的完美結合，給我們帶來了顛覆性的突破，但是我想也不能解決所有的問題。對於資料序列到符號序列的影射問題，是比較適合深度學習框架的；對於符號層面的各種邏輯推理和因果關係等，可能不適合這種方法。至於通用人工智慧，大資料深度學習，應該不能解決所有問題，到底用哪種方法更好，目前還不能下定論，核心的是高效的機器學習方法問題。從我們角度看，像生成對抗網路（GAN），通過類比真實資料和訓練區分網路提升效果，以及 AlphaGo 通過左右手互搏生成資料進行增強學習，都是目前看起來比較有前途的方法。所以，我覺得通用 AI 核心的還是資料和方法，資料是不可或缺的，對於方法來說，任何單一方法可能都解決不了所有問題。

查紅彬：

大資料與學習系統被分成了兩個概念，但是從應用的角度看，這兩者是分不開的。可能將來最理想的狀況是，不是你給系統提供資料，而是系統本身要直接找資料，需要它和環境之間有更多的互動，這樣才能找到它所需要的資料。所以資料驅動並不意味著把系統演算法和資料分開，兩者之間存在著非常緊密的聯繫。

山世光/主持人：

我個人非常認同，主動資料的搜集對系統是非常重要的角度。討論到現在，大家的觀點有一點是相同的，就是認為大資料的深度學習，這應該是一個基礎性的東西，但是它是不夠的，特別是解決我們通用人工智慧的問題是不夠的。最近李開複老師有一本書《人工智慧》，有一章講大資料和深度學習不能解決的問題，列了六個，一個是跨領域的推理，二是抽象能力，三是不僅知其然還要知其所以然，四是自我意識，五是審美，六是情感。接下來的環節裡我們討論一下，這樣一套技術路線不能解決什麼樣的問題？

羅傑波：

我說一下，剛才李開複老師說的問題，我不同意他的觀點。他認為人工智慧不能解決的這些問題，其實是可以解決的，審美、情感，審美這個問題，用深度學習可以解決得很好。情感這個問題我們是最近幾年做的，也是用深度學習做的，其實也達到一個很好的程度了。還有知其然不知其所以然，譬如說圖像，用生成對抗神經網路。現在也輕而易舉可以生成蕭邦、舒伯特，你想要哪個音樂家就可以要那個音樂家的風格。

顏水成：

這點我不贊同，確確實實通過深度學習可以生成出一些美的東西。但是你會多多少少發現，這些美的東西並不是創新，只是風格模仿出來了。比如我加入360以後，我和設計UXC的團隊聊天的時候，他們能夠創造出一些以前從來沒有存在過的，但是看起來又很美的東西。現在的人工智慧，通過大資料學習的方式產生出來，是沒有辦法達到這個層次的，我跟他們聊，他們很高興，因為他們的工作不可能被人工智慧取代。

羅傑波：

這個問題上我反而比你樂觀。畫家、音樂家，實際上也是先把前面的畫家、音樂家的東西學習以後才開始創作沒有的東西，對吧？

顏水成：

如果是模仿梵古的話就沒有自己風格了。

山世光/主持人：

這個也不一定吧，例如AlphaGo已經創造出一些新的好棋招，乍看起來是人類棋手不能理解的，甚至是過去覺得不好的一些招數。

羅傑波：

對，你要創新就是變革，你引進隨機的因素，但是你只要學到了總的準則，什麼樣的東西聽起來好，什麼樣的東西看起來好，這個神經網路能判斷。加上隨機因素的東西，是可能產生前面沒有過的東西的。現在可能還沒有，但是我覺得還是挺樂觀的。

山世光/主持人：

對，隨機性很重要。人類進化過程就是基於隨機的基因突變，很多新東西都是從隨機那來的，其他老師有什麼觀點。

陳寶權：

我們回到70年代，在智慧領域看不上人工智慧，深入學習它是一個技術，現在說人工智慧很靠譜，說明它是一個工具，非常簡單。所有人工智慧可以實現的東西，包括情感，包括審美，它實際上就變成了一個工具，如果說到真的智慧就是有意外，比如說音樂，原來沒有交響樂，他創造出了交響樂，這就是人的智慧。你說以前沒有的東西多了，沒有飛機，人的智慧突發奇想，就設計這個飛機，這樣的智慧，我也不能說永遠不可能，但是這個跨度是很大的，沒有一定的基礎，談這個事就寫小說，目前的智慧從計算的角度達不到那樣的程度的。

查紅彬：

關於李開複先生講到的人工智慧相關的事情，我覺得他講的基本是強人工智慧範疇的東西。我們今天在做研究的時候，一定要有一個分界線，分清楚強人工智慧與弱人工智慧。現在有很多翻譯系統，能夠翻譯相當複雜的文章，翻譯相當複雜的對話，但是沒有一個人說這些機器能理解這些文章和對話。機器沒有理解能力，只不過根據已有的規則進行了轉換，只是在有很多資料的時候，通過大量的訓練能夠做到這一點。機器如有理解能力，這就是強人工智慧了。在應用中，電腦助手能幫我們做很多事情，但是它們沒有進入到強人工智慧的層次。

黃鐵軍：

我既支持今天的深度學習，也認為未來的強人工智慧和今天有明顯的區別，但我同樣支持這兩者存在必然的聯繫。我不同意李開複講的六點，因為他站在以人類為中心的思維方式上，什麼東西都拿來簡單跟人類對比。當然大家可以想各種實現的途徑，我剛才講了我認為的途徑，神經網路這個路線是對的，但是你是什麼樣的神經網路我們要討論。第二個，大資料，有很多資料，刺激、交互、環境，來培育這個智慧，這也是對的。強人工智慧有可能實現，具體實現方式，確實沒有時間展開講。但是它作為一個目標，一定要定這樣的目標，為什麼？大家想一想，電腦為什麼成功？電腦70年到今天影響世界，是因為它是通用資訊處理的機器，這台機器買回去裝不同的軟體可以做不同的事情，人工智慧如果是做通用的，才能成為支撐各種智慧應用的通用平臺。短期內公司要賺錢，做專用人工智慧，要在專用人工智慧上做得比別人好，這些東西都對，我也不反對。但是作為一個學科，作為人類對智慧的追求來說，一定要把通用人工智慧做出長期目標。一旦有了通用人工智慧，就可以實現各種各樣的應用，包括李開複說的六點，都不是必然不能實現的東西，實際上都能實現。人類智慧都能實現，為什麼它就不能實現？要跳出以人為中心的角度來思考問題，不能把所有東西簡單跟人對比。

顏水成：

我補充一點關於什麼東西人工智不能做。我比較贊同李開複老師說的情感。機器人通過它的感知，或者通過它的認知能力，給你傳達一種愛的時候，比如它給你一個擁抱，它說它非常喜歡你，從人的角度，是不是能接受它所表達的情感，你會願意把你真實的愛和情感回饋給它麼？這是人工智慧最難的點。其實挺有意思的事情，AI的拼音是“愛”，到底人工智慧(AI)是不是能產生“愛”(AI)是值得思考的。

黃鐵軍：

這個人工智慧本身是不是一個智慧的主體，這個很關鍵。一定有這個智慧主體的觀念，再說直接一點就是有機器是可以湧現出意識，但是這個意識不等於人類的意識，機器意識可以和人類意識交流，就像我們和動物之間可以交流，可以有有愛。

顏水成：

比如說家裡的貓狗從那裡跳過來的，你心裡是能接受這種愛是真實的，但是機器給你傳達這種愛的時候，你會想這就是機器的指令所產生的動作和表現。

黃鐵軍：我們的感情也是不過是神經脈衝產生的表像而已。

梁家恩：

我想我們做人工智慧，目的可能並不是為了去類比一個人的全部行為，這可能也不是機器最擅長和做得最好的事情。未來人工智慧可能就像 AlphaGo 這種典型應用一樣，它只需要在某些特定領域（如下圍棋）方面超過人類專家的水準，對我們來說就非常有用。通過人工智慧的方法，把這些專業的問題解決好，超過人類專家的能力，這對我們人類的幫助也是最大的。模擬人的全方位能力，並整合人的感情等各方面的因素，對當前工業界來說，還不是最主要追求的目標。

羅傑波：

我經常愛用一個例子就是飛機，從前人想做飛機的時候，總想讓飛機扇翅膀。萊特兄弟做出的飛機不需要扇翅膀就可以飛，所以機器不一定模擬人。解決同樣的問題，不需要用同樣的方法解，比如說resnet，150多層的resnet，我相信人的腦子裡絕對沒有，但是這個沒有關係，這個network可以工作，我想說的問題是，我們的智慧可以做人工智慧的reference，但是沒有必要讓人工智慧一定要去跟人對比，戰勝人，模仿人，這是沒有必要的。

山世光/主持人：

正好這個問題丟給黃老師，他是國內類腦計算的代表人之一，現在我們越來越多的任務，電腦做的比人類好，比如說人臉識別，那是不是意味著我們想做的比人好，不一定非要類腦，類腦就意味著只能做的和人一樣好，而不可能超過人，比如剛才說了飛機的例子，您作為類腦計算積極的宣導者，對這樣的問題是什麼樣的看法。

黃鐵軍：

我覺得很多時候大家討論問題是有誤解的.剛才講到類腦，當然我現在不怎麼用這個詞了，我講神經形態計算。一說“類”就想到模仿人的功能，模仿人的情感，這不是類腦的精髓，“類腦”不是模仿表面的功能，而是從精確模仿神經網路做起。我先用飛機做例子，每次大家說飛機，都說飛機很強大，從跨大洋可以飛過來，但是飛機絕對不如蒼蠅那麼靈活，蒼蠅只有十幾萬的神經元可以起飛、追逐、躲避等，飛機還要造跑道才能飛上去，只會那麼一個簡單的動作，所以飛機並不比一生物系統強大。飛機造出來學到了生物的部分特徵，飛機也有翅膀，你只仿了一部分就可以做出很強大的東西，我不否定，但是不能因此能否定深度模仿的必要性。我說的模仿是指的結構模仿的必要性，通過高精度模擬，把智慧甚至超越人的智慧做出來，能不能做？當然能做！如果不瞭解“怎麼類”，就反對這種可能性，我覺得太武斷。我只是說，現在要作一種通用人工智慧，它能湧現出智慧，它有創造性，有自我意識，對這個問題是怎麼做的問題。我不排除做飛機，而是說同時還要做一個蒼蠅，蒼蠅能進入各種環境，很靈活，那我怎麼做？而不是簡單否定能不能、要不要的問題。

羅傑波：

對，這個我同意，我說的是不要機械的模仿，可以靈活的模仿，剛才說的是靈活的模仿，這個上面我們沒有衝突。

黃鐵軍：

為什麼現在用“神經形態計算”呢？第一我們認為神經網路的這個技術路線對的，但是今天的神經網路模型不夠強，它可能產生的功能複雜性不夠，所以我們要做新的神經網路，這個神經網路一定能產生動力學行為，產生一定的創造性，比如說人的創造性，靈光一閃，就是這樣一種狀態，某種穩定的狀態就是思維現象。這樣的神經網路做計算並不高效，我們從小學做數學作業，作業本寫完肚子就餓了，但是電腦用不了多少電晶體就直接高效解決。人類智慧做計算低效，但是這種網路能夠產生更多複雜性，因此人類智慧能夠應對各種環境挑戰是有道理的。所以，下一代複雜神經網路這個總路線是對的，還需要類似於深度學習這種辦法，它的功能很強，甚至能湧現剛才說的類似人的甚至超越人的智慧。

山世光/主持人：

剛才黃老師給我們對這件事情做了非常好的澄清。時間的關係，留五分鐘的時間給台下的觀眾，我們有兩到三個問題。

提問：你好，我是一個學生，我也是對人工智慧比較感興趣，在研究這方面的問題，我想問一個問題，各位老師，因為我們知道人工智慧，我們提出人工智慧，從當初提出人工智慧的開始，我們就是想用它應用，用它來幫助人類做一些事情，我想知道，你們認為在哪些領域需要AI有意識的？

陳寶權：

其實這個事情呢，所有的資訊技術都存在ethics的問題，並不只是AI，站在這個角度，它也不是突變，任何的資訊技術永遠存在這個問題，比如視頻分析的水準越高，對人類隱私的暴露就越多。我只能這麼回答，這不是人工智慧帶來的新問題。

查紅彬：

對於應用而言，我想很多系統並不需要意識。意識牽扯到很複雜的過程，只是在系統需要適應極其複雜的環境的時候才可能產生意識。為什麼人有意識，而有些動物沒有意識？因為生物在進化過程中有自己的目的，自己要生存，要傳遞自身的基因，所以整個系統變得越來越複雜，來應對複雜的環境及其變化。最後可能當這個複雜程度超過一定範圍之後，就產生了類似於意識這種東西。不過，意識到底能起什麼樣的作用，還說不清楚。有的人說有作用，有人說根本沒有作用，但可以說的是，意識和生物本身的進化過程有關係，而且和生物的本能及其生存目的是有關係的。在當今的應用中，當我們考慮一個設備和機器的時候，並不需要它有自己生存的目的，即使有意識，它起到的作用不大。所以從應用的角度來說，起碼在很長一段時間內，意識不在大家考慮的範圍內。

顏水成：

從對等的角度來說，如果你希望這個東西有意識，和你交互的本體也是有意識的，所以從我個人來說，如果需要意識的場景，應該更多的是設備或者智慧體，是跟人進行交互的時候，這個意識就變得非常重要。

梁家恩：

首先，以現在的 AI 技術水準還做不出機器“意識”，目前還不用太擔心；其次，AI 真正要做好，可能並不需要人類的 “意識”，機器擅長的是根據資料做出客觀的判斷，如果在計算出收益和損失概率時，還“意識”到損失風險而不敢決策，反而不能發揮優勢。

羅傑波：

我同意查老師的觀點，意識是為了生存而產生的，我認為人工智慧不要有意識，除非我們想讓它把人類滅了，它不需要有意識。

山世光/主持人：最後一個問題。

提問：我現在理解，哪怕是深入學習或者是各種學習方法，或者是人工智慧方法，主要是專注於個體的某方面能力的提升，比如語音，圖像識別，我們知道群智慧，個體的智慧水準比較低，但是群體就可以發揮很強的群體的智慧，各位老師，除了作為單個的個體的人工智慧，對於群智慧的發展，是不是持樂觀的態度？

山世光/主持人：

簡單總結，問題是：智慧是不是需要群體？

羅傑波：

你這個問題比較有意思，但是我認為深度神經網路就這麼一個例子，每個神經元很差勁的，它合在一起群智慧就很高，這本身就是一個例子。

顏水成：

我們這塊的研究很少，最近包括Deepmind和阿裡巴巴都有這方面的研究，如果在戰爭遊戲中，如何讓不同個體通過協同產生好的結果。記得在國家人工智慧2.0裡面也有一個協同/群體智慧的概念。

黃鐵軍：

群體智慧有很好的發展方向，有很好的發展前景，我沒有什麼好的評論，毫無疑問這是人工智慧未來發展的重要的方向，螞蟻、蜜蜂它們都是靠協同解決很多複雜問題，我們也一樣，為什麼這麼多人在一起開會？而不是一個人悶在屋子裡想呢。

山世光/主持人：最後一個問題。

提問：我是武漢的老師，也是做機器人方面的，我只想問一個問題，剛才聽了很多專家講，談論未來機器人能不能超越人類，或者能不能跟人類談戀愛，我想說，現在人工智慧的發展，在我們現在生活中的應用已經很強大了，比如現在有機器人家教，機器人翻譯，機器人會計，我想問的問題是，若干年以後，當這些機器人家教和會計人會計超越人類以後，那人類做什麼工作？

查紅彬：

這是最近很多人議論的話題，包括一些通俗刊物，如美國的《時代》週刊、英國的《經濟學人》，都有文章討論這件事。有些人憂慮，機器是否要與人搶工作。如果我們將現在的狀況和100多年前做個比較，可以發現，100多年前很多新的產業出現時，也有很多人擔心勞動力淘汰問題。但是，現在看來，當時的狀況並沒有那麼糟糕。現在，機器人可以幫人幹很多事情，同時先進的工業化和智慧化也會創造一些新的就業機會。另外，人們的生活水準提高後，富裕了，可以做一些改善文化生活方面的事情，這也是工作。我個人覺得，起碼在下一個100年內，問題不會像想像的那麼悲觀。

提問：謝謝給我這次機會，我是來自北京郵電大學心裡安全大賽的學生，我想問一下顏水成老師，因為專業相關，360在資訊安全塊的研究，有沒有跟人工智慧，深入學習這塊做交叉的研究，比如谷歌利用大資料預測了H1N1的爆發，360能不能預測一些病毒，或者以後用人工智慧實現一些攻防對戰？

顏水成：

非常歡迎你到360實習或者交流。我給你的回答是，歷史上用過，現在在用，將來也會用。以前360有一個QVM引擎做這種病毒和非病毒的預測。從2015年開始，360用深度學習做一些和安全相關的事情，比如說你在網上獲取一段資料流程，用深度學習判斷這個流是用什麼樣的協議發送出來的，用什麼樣的應用程式發送出來的。將來360在這塊也非常清晰，我跟360安全部門的負責人也有很多的交流和討論，我覺得後面類似於像深度學習這樣的演算法，肯定會在安全領域發揮更大的效能，非常歡迎你過來交流，謝謝。

山世光/主持人：

謝謝顏水成。我們拖了10分鐘的時間，剛剛我們做了大量討論，但相信大家並不會覺得我們討論出了一個答案，事實上這也不是我們討論的目的，因為這本身不是一個有明確答案的問題，當然即使有答案，各位嘉賓已經藏在心裡自己偷偷回去做了，不會告訴大家，當然這是開玩笑，因為這確實是一個很複雜的問題，相信我們通過這樣一個討論和交流，給大家提供了很多的視角和維度，這是更加重要的。

山世光/主持人：

那最後我們還是請每位嘉賓每人用一兩句話簡單總結一下吧。

顏水成：

我本人非常喜歡一部電影《Chappie》。一個機器人有了基本的運動和控制能力之後，通過它的視覺、聽覺、觸覺，逐步通過老師教，自己看電視等形式，把自己的智慧提升到至少十幾歲小孩的水準，所以我覺得人工智慧下一步發展的一個很好的點是跨模態的協同學習。

羅傑波：

我贊同他這個跨模態的協同學習。另外，我想說的是，大家不要有誤解，我對深度學習是持積極態度的，我只是說，大家不要只看深度學習，程咬金還有三板斧，同學們不要只有一板斧。科學的發展是不斷有新的東西出來，你的眼界和思維不要局限於一個東西，即使這個東西十分好，十分熱，但是你的眼界要開闊一些。

梁家恩：

我認為人工智慧第三次浪潮對我們大家來說機會都非常大，也有非常多的挑戰需要我們克服，不管技術、工程還是產品應用上。我們首先要扎扎實實解決好當下問題、做出讓用戶真正用得起來的好產品，這點非常重要；同時，我們也要看到未來，在技術和產品方面，五年之後我們想到和看到的東西，是有可能和現在完全不一樣的，所以，我們需要以更開放的思維來看待未來的發展。

黃鐵軍：

陳寶權：

一句話三部分，第一是針對人工智慧的公眾教育很重要，要有一個類似斯坦福AI2.0那樣的報告，從科技、政策、社會學等各個方面，讓公眾對人工智慧有一個正確的認識。第二就是科技界要腳踏實地，扎扎實實把眼前的事情做好，避免大躍進似的冒進。第三就是對未來人工智慧的發展要有願景和規劃，如果真要說強人工智慧，就應該先定義好一個新物種，因為這個新物種肯定不是與人雷同，這個新物種定義清楚以後再決定怎麼做。

查紅彬：

我的觀點是，現在人工智慧的熱潮的確是推動了社會和產業的發展，但是這裡有很多要素需要進一步剝離開，需要細化。不能單純只看資料和演算法，很多其他因素都需要考慮，比如，智慧體和環境之間的互動。如果沒有智慧體與環境間的密切互動，系統的自主學習就很難做到。

山世光/主持人：

好，今天的討論到此結束，希望大家有所收穫，再次感謝幾位嘉賓非常幽默，其實沒有保留的分享，感謝大家。

CAAI原創丨作者系上述嘉賓

未經授權嚴禁轉載及翻譯

如需轉載合作請向學會或本人申請

轉發請注明轉自中國人工智慧學會

交叉、融合、相生、共贏

我覺得目前重要的是在現在的途徑之上，怎麼樣把它進一步的完善，把深度學習的模式識別，這樣一個工具性的東西，變成真正有智慧的東西，這是我們可以研討的方向。謝謝各位。

黃鐵軍：

梁家恩：

羅傑波：

顏水成：

山世光/主持人：

查紅彬：

陳寶權：

黃鐵軍：

梁家恩：

羅傑波：

顏水成：

會不會是3歲的時候，深入學習模型還沒有學好呢？

羅傑波：

顏水成：

陳寶權：

顏水成：

為什麼拿不到大資料，是因為這個場景根本無法拿到這個大資料，還是你根本無法標誌這個資料？

羅傑波：

山世光/主持人：

黃鐵軍：

顏水成：

山世光/主持人：

這次為什麼勒索病毒沒有搞定呢？

顏水成：

羅傑波：

山世光/主持人：

有沒有哪位嘉賓覺得：即使現在有了有效的大資料，還有解決不了的問題呢？

黃鐵軍：

山世光/主持人：

我的意思就是，有什麼問題是現在我們知道的深度學習模型搞不定的，即使我們與足夠大規模的有效資料。

黃鐵軍：

現在的學習模型和神經網路結構解決不了一些問題並不奇怪，還要繼續改進提升。

山世光/主持人：

陳寶權：

羅傑波：

顏水成：

梁家恩：

查紅彬：

山世光/主持人：

羅傑波：

顏水成：

羅傑波：

這個問題上我反而比你樂觀。畫家、音樂家，實際上也是先把前面的畫家、音樂家的東西學習以後才開始創作沒有的東西，對吧？

顏水成：

如果是模仿梵古的話就沒有自己風格了。

山世光/主持人：

這個也不一定吧，例如AlphaGo已經創造出一些新的好棋招，乍看起來是人類棋手不能理解的，甚至是過去覺得不好的一些招數。

羅傑波：

山世光/主持人：

對，隨機性很重要。人類進化過程就是基於隨機的基因突變，很多新東西都是從隨機那來的，其他老師有什麼觀點。

陳寶權：

查紅彬：

黃鐵軍：

顏水成：

黃鐵軍：

顏水成：

黃鐵軍：我們的感情也是不過是神經脈衝產生的表像而已。

梁家恩：

羅傑波：

山世光/主持人：

黃鐵軍：

羅傑波：

對，這個我同意，我說的是不要機械的模仿，可以靈活的模仿，剛才說的是靈活的模仿，這個上面我們沒有衝突。

黃鐵軍：

山世光/主持人：

剛才黃老師給我們對這件事情做了非常好的澄清。時間的關係，留五分鐘的時間給台下的觀眾，我們有兩到三個問題。

陳寶權：

查紅彬：

顏水成：

梁家恩：

羅傑波：

我同意查老師的觀點，意識是為了生存而產生的，我認為人工智慧不要有意識，除非我們想讓它把人類滅了，它不需要有意識。

山世光/主持人：最後一個問題。

山世光/主持人：

簡單總結，問題是：智慧是不是需要群體？

羅傑波：

你這個問題比較有意思，但是我認為深度神經網路就這麼一個例子，每個神經元很差勁的，它合在一起群智慧就很高，這本身就是一個例子。

顏水成：

黃鐵軍：

山世光/主持人：最後一個問題。

查紅彬：

顏水成：

山世光/主持人：

那最後我們還是請每位嘉賓每人用一兩句話簡單總結一下吧。

顏水成：

羅傑波：

梁家恩：

黃鐵軍：

陳寶權：

查紅彬：

山世光/主持人：

好，今天的討論到此結束，希望大家有所收穫，再次感謝幾位嘉賓非常幽默，其實沒有保留的分享，感謝大家。

CAAI原創丨作者系上述嘉賓

未經授權嚴禁轉載及翻譯

如需轉載合作請向學會或本人申請

轉發請注明轉自中國人工智慧學會

交叉、融合、相生、共贏