您的位置:首頁>科技>正文

UC伯克利教授邁克爾·喬丹採訪:人類對機器學習期待過高,機器學習的發展還應當更廣闊

雷鋒網 AI 科技評論按:2017年6月21日至22日, 騰訊·雲+未來峰會在深圳舉行。 在昨天主題為“機器學習:創新視角, 直面挑戰”的演講 - 雷鋒網後, 雷鋒網 AI 科技評論在內的多家媒體共同對演講者人工智慧泰斗邁克爾·歐文·喬丹只是一種比喻, 除此之外的說法都有問題。 如果真的是那樣的話, 我們其實應該模仿動物的神經細胞才對, 雖然也有人那樣做, 但是沒有取得什麼進展。 所以我們走到今天這一步靠的是數學、電腦等方面的原理, 而不是靠仿生學。

記者提問:深度學習仍然是機器學習的主流工具, 不過也有人覺得不應該過早孤注一擲。

相比需要大量資料的深度學習, 也有像概率程式設計這樣典型的使用少量資料的例子。 那麼您怎麼看人工智慧研究目前的同質化現象, 您對不斷出現的新方法是如何看待的?

邁克爾·喬丹:如果我們看看現代機器學習庫的話, 比如基於Spark的機器學習庫, 裡面有各種各樣的方法, 它們都有各自的作用, 比如用矩陣譜、集群演算法以一定方法建立推薦系統, 比鄰的方法也可以用來解決一些問題, 增強學習也經常可以轉換成一個大規模的樹搜索。 所以確實, 用到神經網路和反向傳播的稠密矩陣操作是非常有用的, 比如NVIDIA就有各種需要的軟硬體可以支援各種不同的方法, 它確實能支持深度學習,

但是如果我要解決的問題範疇裡標籤的數量很少, 比如文本, 我只是想要識別一段不帶標籤的文本的特徵, 我可能用語言學分配方法就夠了, 這就是一種人們在這個範疇中用來找到文字重點的方法。 說這麼多你應該懂了, 深度學習不是唯一可行的方法。 雖然給它製造專用的GPU、TPU確實重要, 可以支援很多種不同的應用。 但是我們想要建立下一代的架構, 它要能支持樹操作、搜索操作、約束下降操作和其它一些需要的語言學操作, 而不僅僅是一層層的矩陣。

記者提問:您如何看待中國的AI潮流?您認為騰訊能在其中扮演怎樣的角色?

邁克爾·喬丹:我對騰訊的情況不太清楚, 不太好評價, 我只知道外界看來他們除了社交網路外還有很大一塊娛樂和遊戲業務。

在現在這個階段, 有遊戲和娛樂的環境, 就可以模擬出一個虛擬世界, 在裡面得到準確的事實, 從而生成真實世界可能無法得到的標籤;而且可以在強化學習方面起到幫助, 在虛擬世界裡面可以做海量的搜索;或者還有其它方法, 都可以大規模地使用我們現有的機器學習技術。 還可以在虛擬世界中嘗試一些真實世界中可能會傷害到人類的技術。 利用內在的遊戲技術可以探索機器學習方面的新想法, 這很重要, 騰訊看起來似乎也有很大的自然優勢。

記者提問:大資料催生了很多工業應用, 許多互聯網、金融證券巨頭都開始涉足AI。 您看好AI的前景嗎?

邁克爾·喬丹:人們對AI的期待太高了。

語言方面的期待是最高的, 許多人都覺得聊天機器人會發展得像人差不多, 不過我不太相信, 我覺得聊天機器人對世界的理解是沒辦法跟人類相提並論的, 比如理解上下文、理解語言的發展——以前是如何表達的、如何理解可能發生的事情——人類有對事情的預見, 針對不同的環境可以建立不同的計畫、運用舉例類比比喻。 我小孩今年5歲就可以做到所有這些事情, 但是人工智慧很長一段時間都做不到這些。 人們期待人工智慧的智力水準可以達到小孩的程度, 但是小孩能做的事情也很多啊, 所以這是做不到的。 這方面的期待太高了。 另外人們還期待AI系統可以在某些方面比人類更聰明, 但是我們永遠都不會讓機器人成為決策者,
比如做CEO、CTO之類的, 它們沒有對世界的那種微妙的理解, 沒辦法抽象地做推理, 沒法面對不確定性的事情還做出優秀的決定, 沒有好的直覺。 所以我覺得人們期待人工智慧做這些, 不是那麼理性。

記者提問:我們期待人工智慧除了做計算性的思考, 還可以做推理和決策。 您認為大資料在這些方面能發揮作用嗎?

邁克爾·喬丹:大資料是必須的, 但是只有大資料還不夠。 借助大資料, 很多以前做不對的細節現在可以做對了, 但是這不代表你就能清楚地觀察全域、能理解抽象的概念、能做長期的推理、能改變事情發生的可能性、對事情做出預見。 所以, 其實推理是很難的, 在多步驟的、具有不確定性的狀況下, 人類能做得非常好,但是人工智慧系統就需要用大量的資料反復訓練,然後才能在某些步驟中模仿人類,但這還是沒辦法達到人類的水準。

記者提問:那有沒有新的演算法可以達到更好的效果呢?

邁克爾·喬丹:沒有,據我所知還沒有什麼那樣的神奇演算法。肯定還需要幾十年的研究,要有更好的演算法、更好的工程技術做出的更好的模擬器、用正確的方式收集資料、建立起大型的合作機構比如企業,付出努力解決關鍵的問題。在這個過程中會有越來越好的演算法出現,有可能會有突破性的演算法出現,不過我也不確定會不會出現,我覺得都不是很必要。會有突破的是,新的組織資料、組織決策、組織以往資訊的方式,然後與人類協作,讓人類成為其中一環,讓機器學習變得更好,達成人類的目標。你得明白,電腦視覺、語音辨識這樣的技術就是在最近的30年裡慢慢變得越來越好的。我們感覺到明顯變好了,但這都是基於以往的經驗一步步過來的。未來很多方面的發展也會是這樣。

記者提問:MIT科技評論有篇文章中提到過“AI內心的黑暗秘密”,他們的意思是,沒有人知道最先進的演算法工作的時候具體是怎麼工作的。美國國防部甚至認為可解釋性是AI發展的一大擋路石。您是怎麼看的?

邁克爾·喬丹:解釋性是眾多問題之一。還有魯棒性、安全性、語義性、抽象性等等許多問題,解釋性只是其中一個。如果某個領域內對神經網路最大的擔憂是它的解釋性的話,那也許就這時候就不應該用神經網路,而應該用決策樹,解釋性要強得多。決策樹是沿著路徑往下走的,人類可以理解路徑上的每一步,而且可以根據不同狀況做出不同決定,用事情發生的前後關係做判斷。不過它的性能就不如神經網路那麼好了,但是也不錯。還有一些領域如果有足夠的資料也可以用隨機森林-多選擇決策樹,它的效果和神經網路差不多,而且也可以用在對解釋性要求更好的場合裡。對做決策來說,人類決策的解釋性比決策樹還要好得多,人類可以預見到應該考慮什麼、沒有考慮什麼,還能解釋出為什麼有東西不需要考慮。我們現有的學習模型都不擅長這些。所以這個確實是一個大問題,不會有一個全新的方法可以橫空出世來給神經網路解決這個問題,很難沿著某個路徑進行解釋,我們只能在神經網路的週邊設計別的東西。另外,我覺得總體的來說,單獨一個神經網路對大多數問題都不是合適的解決方案,它應該只是一部分,和其它的部分共同協作起來、考慮其它的情境、在周圍構建一些其它的架構,才是好的解決方案。

記者提問:您在演講中提到,我們需要建立一個在正常工作的同時還要能不給人添麻煩、不引發災難的系統,這樣的系統現在有沒有呢?

邁克爾·喬丹:這需要深厚的工程能力。比如資料庫,人們還沒有用機器學習的方法去做資料庫,但是銀行系統就能很好地工作,全世界的資料庫之間不停地進行聯絡和交易,不僅做到了即時性、還做到了協作性。當我自己全世界旅行的時候,我銀行帳戶裡的錢不會跟著我來回交易,但是我和我妻子兩個人用同一個帳戶,一個人在美國取錢,一個人在中國取錢,帳戶餘額還是對的。這樣的系統服務著幾十億人,這是驚人的成就,僅僅靠來回發送資料。“這些資料是哪來的”、“在發生了這樣一系列事情以後應該如何應對”,資料庫系統做的就是這些事,它沒有什麼學習功能,但是它也需要有智慧的基礎設施才能讓人感到信任、才能保證正確等等。如果把這樣的思路和機器學習結合在一起,那就能對什麼事情是能發生的、未來會發生什麼做出預測。所以,這應該不算是什麼突破,但是需要深入的工程研究才能設計出有多種防範能力的系統,然後就有了能判斷出相關的資訊、能正確選取資訊用來做預測的系統。這其中牽扯到很多選擇,如果知道在同樣的環境中採集到的資料有哪些是可用的,資料庫已經為你分析好了,那你就會更信任這樣的資料庫系統。這就是做預測困難的地方,你在環境中採集到的資料可能和資料庫中的不一樣,你沒辦法採集到所有的資料。在真實世界中,你需要知道哪些資料是有關係的,還要知道為什麼,然後才能用它們做出預測。所以能做好這個的系統需要多種組成部分,需要有工程化的思考。

採訪現場,邁克爾·喬丹教授對待記者們的問題表現得非常耐心和積極,在問答過程中與記者們保持著互動,他的回答熱情也越來越高,情緒越來越豐富,語速也越來越快。可惜因為邁克爾·喬丹教授的行程較緊,沒法抽出更多時間,採訪就匆匆結束了。

邁克爾·喬丹教授的回答中透露出他對機器學習的嚴謹和熱忱,雷鋒網 AI 科技評論也會繼續對相關資訊保持關注。

人類能做得非常好,但是人工智慧系統就需要用大量的資料反復訓練,然後才能在某些步驟中模仿人類,但這還是沒辦法達到人類的水準。

記者提問:那有沒有新的演算法可以達到更好的效果呢?

邁克爾·喬丹:沒有,據我所知還沒有什麼那樣的神奇演算法。肯定還需要幾十年的研究,要有更好的演算法、更好的工程技術做出的更好的模擬器、用正確的方式收集資料、建立起大型的合作機構比如企業,付出努力解決關鍵的問題。在這個過程中會有越來越好的演算法出現,有可能會有突破性的演算法出現,不過我也不確定會不會出現,我覺得都不是很必要。會有突破的是,新的組織資料、組織決策、組織以往資訊的方式,然後與人類協作,讓人類成為其中一環,讓機器學習變得更好,達成人類的目標。你得明白,電腦視覺、語音辨識這樣的技術就是在最近的30年裡慢慢變得越來越好的。我們感覺到明顯變好了,但這都是基於以往的經驗一步步過來的。未來很多方面的發展也會是這樣。

記者提問:MIT科技評論有篇文章中提到過“AI內心的黑暗秘密”,他們的意思是,沒有人知道最先進的演算法工作的時候具體是怎麼工作的。美國國防部甚至認為可解釋性是AI發展的一大擋路石。您是怎麼看的?

邁克爾·喬丹:解釋性是眾多問題之一。還有魯棒性、安全性、語義性、抽象性等等許多問題,解釋性只是其中一個。如果某個領域內對神經網路最大的擔憂是它的解釋性的話,那也許就這時候就不應該用神經網路,而應該用決策樹,解釋性要強得多。決策樹是沿著路徑往下走的,人類可以理解路徑上的每一步,而且可以根據不同狀況做出不同決定,用事情發生的前後關係做判斷。不過它的性能就不如神經網路那麼好了,但是也不錯。還有一些領域如果有足夠的資料也可以用隨機森林-多選擇決策樹,它的效果和神經網路差不多,而且也可以用在對解釋性要求更好的場合裡。對做決策來說,人類決策的解釋性比決策樹還要好得多,人類可以預見到應該考慮什麼、沒有考慮什麼,還能解釋出為什麼有東西不需要考慮。我們現有的學習模型都不擅長這些。所以這個確實是一個大問題,不會有一個全新的方法可以橫空出世來給神經網路解決這個問題,很難沿著某個路徑進行解釋,我們只能在神經網路的週邊設計別的東西。另外,我覺得總體的來說,單獨一個神經網路對大多數問題都不是合適的解決方案,它應該只是一部分,和其它的部分共同協作起來、考慮其它的情境、在周圍構建一些其它的架構,才是好的解決方案。

記者提問:您在演講中提到,我們需要建立一個在正常工作的同時還要能不給人添麻煩、不引發災難的系統,這樣的系統現在有沒有呢?

邁克爾·喬丹:這需要深厚的工程能力。比如資料庫,人們還沒有用機器學習的方法去做資料庫,但是銀行系統就能很好地工作,全世界的資料庫之間不停地進行聯絡和交易,不僅做到了即時性、還做到了協作性。當我自己全世界旅行的時候,我銀行帳戶裡的錢不會跟著我來回交易,但是我和我妻子兩個人用同一個帳戶,一個人在美國取錢,一個人在中國取錢,帳戶餘額還是對的。這樣的系統服務著幾十億人,這是驚人的成就,僅僅靠來回發送資料。“這些資料是哪來的”、“在發生了這樣一系列事情以後應該如何應對”,資料庫系統做的就是這些事,它沒有什麼學習功能,但是它也需要有智慧的基礎設施才能讓人感到信任、才能保證正確等等。如果把這樣的思路和機器學習結合在一起,那就能對什麼事情是能發生的、未來會發生什麼做出預測。所以,這應該不算是什麼突破,但是需要深入的工程研究才能設計出有多種防範能力的系統,然後就有了能判斷出相關的資訊、能正確選取資訊用來做預測的系統。這其中牽扯到很多選擇,如果知道在同樣的環境中採集到的資料有哪些是可用的,資料庫已經為你分析好了,那你就會更信任這樣的資料庫系統。這就是做預測困難的地方,你在環境中採集到的資料可能和資料庫中的不一樣,你沒辦法採集到所有的資料。在真實世界中,你需要知道哪些資料是有關係的,還要知道為什麼,然後才能用它們做出預測。所以能做好這個的系統需要多種組成部分,需要有工程化的思考。

採訪現場,邁克爾·喬丹教授對待記者們的問題表現得非常耐心和積極,在問答過程中與記者們保持著互動,他的回答熱情也越來越高,情緒越來越豐富,語速也越來越快。可惜因為邁克爾·喬丹教授的行程較緊,沒法抽出更多時間,採訪就匆匆結束了。

邁克爾·喬丹教授的回答中透露出他對機器學習的嚴謹和熱忱,雷鋒網 AI 科技評論也會繼續對相關資訊保持關注。

Next Article
喜欢就按个赞吧!!!
点击关闭提示