華文網

這家初創公司被美國防部定義為“第三次AI浪潮”的代表

本文屬於本次Emtech Digital人工智慧峰會獨家精選。

Gamalon是最近大火的一家從事機器學習相關研究的初創公司,他們的核心技術Bayesian Program Synthesis(BPS)實現了讓機器自主完成概率程式設計,而不再需要人工編寫。

技術公佈後,甚至有媒體宣稱機器學習的速度將可能提升百倍。

讓機器自行完成概率程式設計

也正因如此,美國國防部高級計畫研究局(DARPA)於不久前對Gamalon注資720萬美元,這筆投資是DARPA近年來投入金額最大的案例之一,而且 Gamalon 的技術也被DARPA歸為“第三次AI浪潮”。


美國當地時間 3 月 28 日,Gamalon創始人兼首席執行官Ben Vigoda在《麻省理工科技評論》於三藩市舉辦的Emtech Digital數字峰會上做了專場演講,DT君隨即也對Ben Vigoda做了獨家專訪。

Ben Vigoda麻省理工科技評論EmTech Digital數字峰會上做演講

這家被認為“可能會為AI發展帶來顛覆式新方法”的公司到底有何獨特之處?請見以下專訪全文:

問:今天上午的演講非常精彩,觀眾們對Gamalon研究人工智慧的方式也非常有興趣。你們所使用的“概率程式設計”(Probabilistic Programing)與目前基於大資料的深度學習方法非常不同,甚至可以說是基於“小資料”,在設定目標後,由機器去自主學習,會和強化學習有類似之處麼?

答:其實和強化學習不太一樣,楊立昆(Yann LeCun)有一個關於機器學習三種類型的精彩演講。他認為,機器學習就像一個蛋糕,

上面點綴的漿果就是強化學習,非常美味,但是數量很少。

有點類似於你贏得或輸掉了一個遊戲,會有很強的體驗感,但並不是經常發生。然後,蛋糕上的糖霜可以看做是監督學習。比如,在遊戲中得分或死亡,這要比直接輸掉或贏得遊戲更常發生。

Yann LeCun的“機器學習蛋糕”

最後就是蛋糕本身了,我們稱之為無監督學習,這類是最多的。我們沒有關於這些資料的回饋,也沒人會為我們解釋這些資料。比如,你通過機器學習來識別貓,首先得準備大量貓、狗的圖片,但並沒有人告訴你哪些是貓、哪些是狗,這就是無監督學習。

但即便是在無監督的情況下,有些機器學習系統還是能分辨出貓和狗。畢竟,貓都長得差不多,狗也長得差不多,

而且貓和狗看起來不一樣。

問:你是如何想到將“概率程式設計”應用於人工智慧研究的?畢竟目前絕大多數的方法都趨於同質化。

答:非常好的問題!我個人的觀點是,人工智慧的研究目前確實有同質化的問題。目前最主流的方法,比如大家都在做的深度學習:分析海量的資料、調用大量的計算能力。但如果大家都押寶在一種人工智慧上,這對其發展是不利的。原因是,AI目前所處的階段還太早,根本無法判斷那種方法會最終勝出。在這個時候去推崇某一技術明顯是有問題的。

Ben Vigoda 正在接受 DT 君專訪

AI領域同樣需要生態多樣性。某種程度上,Gamalon其實得益於目前在深度學習領域的大量投資,因為人們只會去關心一件事:你能用深度學習做什麼?我們反倒有了自己的發展空間。於是,我們獲得美國國防部高級研究計畫局(DARPA)的投資。

回到你的問題,為什麼我們會嘗試一條完全不同的 AI 研究路徑?舉例而言,吳恩達曾經想設計一套無人機飛控系統,他在編碼時考慮到了流體動力學、空氣動力學、機械工程等諸多問題,但這套飛控系統還是無法正常工作。

有一天,他突然說,為啥不直接用感測器呢?如果墜機了就是一個負面強化學習,如果能穩定在空中就給一個正面的強化學習,並通過這種方式來訓練系統,並最終成功控制無人機。

吳恩達的無人直升機團隊

吳恩達的例子說明什麼?他最初想純手工打造一套飛控系統,但是失敗了,而使用強化學習、資料分析的方法獲得了成功。我也有類似的經歷,只不過我們的物件不是無人機。

我創立的上一家公司為機器學習開發晶片,後來被Analog Devices收購。我們當初做的就是為晶片設計演算法,比如用於自動駕駛、雷達、智慧手錶、醫療感測器、語音辨識等。與吳恩達的無人機飛控系統很相似,都屬於單一任務流程。

我們最初在建立模型方面也遇到了很大的問題,但我們沒有選擇吳恩達所用的深度學習的路徑,而是把建立模型當做一個工程問題來解決:通過概率程式設計來測試。

你知道,在上世紀七八十年代,優秀的程式師非常難找,除了深厚的專業知識背景,還要很懂客戶和市場。否則要做成一個軟體專案非常不容易。

但你看看現在,隨便一個大學畢業生,扔給他一套Python訓練一周就可以程式設計了。我們在過去35年建立起了很多的軟體工具,大大降低了像程式設計這種原本專業性非常強的工作門檻。

問:沒錯,這就是比爾·蓋茨當年提出的將程式設計技術商品化的概念,讓所有人都可以進入這個行業。但史蒂夫·約伯斯就不這麼認為,他覺得技術還多樣化,而不是作為一種標準商品。你認為,目前AI領域也存在這個問題麼?

答:我們可能並沒準備好將機器學習“民主化”,當然,這也包括Gamalon專注的概率程式設計,這些都還是處於非常早期的技術。但我們的結論是:開發工具還是很必要的。

Gamalon的概率程式設計如何通過人類筆跡來生成一個標準三角形

吳恩達無法手工編碼來設計一套飛控系統,並不是因為手工編碼做不到,而是缺乏相應的開發工具來建立飛行控制的概率程式設計模型。換而言之,如果有這麼一套開發工具,或者吳恩達就不需要使用深度學習了。

總得來說,在某些場景下,比如僅僅是輸入輸出、感測器與校準等,這些類似於動物反應的情況下,深度學習是一個非常好的選擇。但如果 AI 系統涉及到要有自己的“想法”或“判斷”,深度學習就不怎麼樣了。

問:Gamalon技術的優勢在哪?接受DARPA的投資是否有考慮過軍用技術與商用技術的界定?

答:大部分初創公司都是以現有商用技術為基礎,在上面去做用戶體驗,我的上一家公司也是一樣。而現在Gamalon則不同,我們的優勢在於獨特的技術賦予我們獨特的市場地位,哪怕最接近的競爭對手也無法做出與我們類似的東西,我們再產品差異化方面做得很好。

更重要的是,我們是第一家將這一技術商業化的公司。目前,據我們所知道的,全球在這方面做研究的有七個團隊,大多在大學和研究機構,但只有我們是唯一的一家把這項技術變成商業化應用。

不利的地方在於風險非常大,我們必須開發全新的技術,還要讓它可以進入應用端。畢竟,我們不是拿現有技術做改進。

關於與 DARPA 的合作,他們會將所投資的專案進行分級,據我所知,DARPA根據保密級別分為1-10級,每一個級別又會再做細分,他們稱之為“技術成熟度”(Technology Readiness Level, TRL)。

比如,DARPA 將 Gamalon 劃為 6 級,這裡面又分為6.1(大學實驗室級別)、6.2(工業科研級別與原型機)、6.3(可小範圍部署),以此類推。

目前,Gamalon就是處於6.1級,有點類似於最早期的互聯網,不對外開放,但也不保密,旨在幫助美國國防部看清未來技術發展趨勢。

問:目前的深度學習需要大量的資料以及計算資源,這會耗費大量財力物力。但有說法是AI最終將從雲端走向本地設備端,Gamalon目前就可以基於像iPad這樣的設備,這是否代表你也認同這一趨勢?

答:非常好的問題。我們與 Google TensorFlow 以及 TensorFlow Mobile 的團隊聊過此事。他們相信,做深度學習的訓練需要大量的計算資源,雲端訓練是最好的選擇,但會在移動端做識別。

簡單說,就是在移動端收集資料→發送到雲端→在雲端訓練神經網路→將訓練完成的神經網路下發到移動端→移動端成功識別。畢竟,識別所需的計算資源要比訓練所需的計算資源少成百上千倍。

所以說,DARPA的“第二次技術浪潮”中定義的深度學習是結構化的,訓練和學習是中心化的,繼而感測器得以隨之部署。這是必要的,因為需要雲端去做的訓練肯定無法在移動端完成。

DARPA將AI定義為三次浪潮:人工輸入的知識庫、深度學習為代表的訓練模式、自主從資料中獲取知識結構

DARPA還定義了“第三次技術浪潮”,雖然這類定義聽起來很炫酷,但也確實有一個技術解釋:高等機器學習概率程式設計(Probabilistic Programming for Advanced Machine Learning, PPMAL),Gamalon就屬於這一類。這類技術在結構上與深度學習不同,要解決的是無法連接雲端情況下,或者說因為安全或隱私問題而不能接入雲端時的技術解決方案。

概率程式設計這項技術不同於深度學習,不需要大量資料和計算資源,往當地語系化和移動端的方向發展是其自然趨勢。但反過來看,即便是在目前深度學習占主導地位的情況下,概率程式設計也能反過來幫助深度學習提高效率。這意味著在同等資料和計算資源的條件下,能完成更多的任務、節約成本。

通過幾幅簡單的檯燈示意圖讓機器學會識別不同形狀的檯燈

問:既然你認為機器學習的未來發展是去中心化、向移動端發展,那目前Gamalon有沒有來自移動領域的合作夥伴?

答:目前還沒有,不過你這倒真是個好主意,我們會認真考慮。真的,或許是時候跟移動產業建立一些夥伴關係了。

原因是,AI目前所處的階段還太早,根本無法判斷那種方法會最終勝出。在這個時候去推崇某一技術明顯是有問題的。

Ben Vigoda 正在接受 DT 君專訪

AI領域同樣需要生態多樣性。某種程度上,Gamalon其實得益於目前在深度學習領域的大量投資,因為人們只會去關心一件事:你能用深度學習做什麼?我們反倒有了自己的發展空間。於是,我們獲得美國國防部高級研究計畫局(DARPA)的投資。

回到你的問題,為什麼我們會嘗試一條完全不同的 AI 研究路徑?舉例而言,吳恩達曾經想設計一套無人機飛控系統,他在編碼時考慮到了流體動力學、空氣動力學、機械工程等諸多問題,但這套飛控系統還是無法正常工作。

有一天,他突然說,為啥不直接用感測器呢?如果墜機了就是一個負面強化學習,如果能穩定在空中就給一個正面的強化學習,並通過這種方式來訓練系統,並最終成功控制無人機。

吳恩達的無人直升機團隊

吳恩達的例子說明什麼?他最初想純手工打造一套飛控系統,但是失敗了,而使用強化學習、資料分析的方法獲得了成功。我也有類似的經歷,只不過我們的物件不是無人機。

我創立的上一家公司為機器學習開發晶片,後來被Analog Devices收購。我們當初做的就是為晶片設計演算法,比如用於自動駕駛、雷達、智慧手錶、醫療感測器、語音辨識等。與吳恩達的無人機飛控系統很相似,都屬於單一任務流程。

我們最初在建立模型方面也遇到了很大的問題,但我們沒有選擇吳恩達所用的深度學習的路徑,而是把建立模型當做一個工程問題來解決:通過概率程式設計來測試。

你知道,在上世紀七八十年代,優秀的程式師非常難找,除了深厚的專業知識背景,還要很懂客戶和市場。否則要做成一個軟體專案非常不容易。

但你看看現在,隨便一個大學畢業生,扔給他一套Python訓練一周就可以程式設計了。我們在過去35年建立起了很多的軟體工具,大大降低了像程式設計這種原本專業性非常強的工作門檻。

問:沒錯,這就是比爾·蓋茨當年提出的將程式設計技術商品化的概念,讓所有人都可以進入這個行業。但史蒂夫·約伯斯就不這麼認為,他覺得技術還多樣化,而不是作為一種標準商品。你認為,目前AI領域也存在這個問題麼?

答:我們可能並沒準備好將機器學習“民主化”,當然,這也包括Gamalon專注的概率程式設計,這些都還是處於非常早期的技術。但我們的結論是:開發工具還是很必要的。

Gamalon的概率程式設計如何通過人類筆跡來生成一個標準三角形

吳恩達無法手工編碼來設計一套飛控系統,並不是因為手工編碼做不到,而是缺乏相應的開發工具來建立飛行控制的概率程式設計模型。換而言之,如果有這麼一套開發工具,或者吳恩達就不需要使用深度學習了。

總得來說,在某些場景下,比如僅僅是輸入輸出、感測器與校準等,這些類似於動物反應的情況下,深度學習是一個非常好的選擇。但如果 AI 系統涉及到要有自己的“想法”或“判斷”,深度學習就不怎麼樣了。

問:Gamalon技術的優勢在哪?接受DARPA的投資是否有考慮過軍用技術與商用技術的界定?

答:大部分初創公司都是以現有商用技術為基礎,在上面去做用戶體驗,我的上一家公司也是一樣。而現在Gamalon則不同,我們的優勢在於獨特的技術賦予我們獨特的市場地位,哪怕最接近的競爭對手也無法做出與我們類似的東西,我們再產品差異化方面做得很好。

更重要的是,我們是第一家將這一技術商業化的公司。目前,據我們所知道的,全球在這方面做研究的有七個團隊,大多在大學和研究機構,但只有我們是唯一的一家把這項技術變成商業化應用。

不利的地方在於風險非常大,我們必須開發全新的技術,還要讓它可以進入應用端。畢竟,我們不是拿現有技術做改進。

關於與 DARPA 的合作,他們會將所投資的專案進行分級,據我所知,DARPA根據保密級別分為1-10級,每一個級別又會再做細分,他們稱之為“技術成熟度”(Technology Readiness Level, TRL)。

比如,DARPA 將 Gamalon 劃為 6 級,這裡面又分為6.1(大學實驗室級別)、6.2(工業科研級別與原型機)、6.3(可小範圍部署),以此類推。

目前,Gamalon就是處於6.1級,有點類似於最早期的互聯網,不對外開放,但也不保密,旨在幫助美國國防部看清未來技術發展趨勢。

問:目前的深度學習需要大量的資料以及計算資源,這會耗費大量財力物力。但有說法是AI最終將從雲端走向本地設備端,Gamalon目前就可以基於像iPad這樣的設備,這是否代表你也認同這一趨勢?

答:非常好的問題。我們與 Google TensorFlow 以及 TensorFlow Mobile 的團隊聊過此事。他們相信,做深度學習的訓練需要大量的計算資源,雲端訓練是最好的選擇,但會在移動端做識別。

簡單說,就是在移動端收集資料→發送到雲端→在雲端訓練神經網路→將訓練完成的神經網路下發到移動端→移動端成功識別。畢竟,識別所需的計算資源要比訓練所需的計算資源少成百上千倍。

所以說,DARPA的“第二次技術浪潮”中定義的深度學習是結構化的,訓練和學習是中心化的,繼而感測器得以隨之部署。這是必要的,因為需要雲端去做的訓練肯定無法在移動端完成。

DARPA將AI定義為三次浪潮:人工輸入的知識庫、深度學習為代表的訓練模式、自主從資料中獲取知識結構

DARPA還定義了“第三次技術浪潮”,雖然這類定義聽起來很炫酷,但也確實有一個技術解釋:高等機器學習概率程式設計(Probabilistic Programming for Advanced Machine Learning, PPMAL),Gamalon就屬於這一類。這類技術在結構上與深度學習不同,要解決的是無法連接雲端情況下,或者說因為安全或隱私問題而不能接入雲端時的技術解決方案。

概率程式設計這項技術不同於深度學習,不需要大量資料和計算資源,往當地語系化和移動端的方向發展是其自然趨勢。但反過來看,即便是在目前深度學習占主導地位的情況下,概率程式設計也能反過來幫助深度學習提高效率。這意味著在同等資料和計算資源的條件下,能完成更多的任務、節約成本。

通過幾幅簡單的檯燈示意圖讓機器學會識別不同形狀的檯燈

問:既然你認為機器學習的未來發展是去中心化、向移動端發展,那目前Gamalon有沒有來自移動領域的合作夥伴?

答:目前還沒有,不過你這倒真是個好主意,我們會認真考慮。真的,或許是時候跟移動產業建立一些夥伴關係了。