華文網

斯坦福博士休學蟄伏兩年,弄出了這輛叫板 Google和特斯拉的無人車

這是一輛藍色的林肯汽車,車頂有一塊 LED 屏,幾個黑色的圓柱形的東西圍繞在 LED 屏周圍,不停轉動。車頭前方也有一個黑色的凸起。在駕駛座旁邊是一個螢幕,上面顯示著藍色的密密麻麻的點和藍色的框,

隨著汽車的行駛,螢幕上的點和線也在不斷的刷新。在副駕上座位邊上,還配備著一個小型滅火器。

我坐在這輛車上,在山景城兜了一圈。在這段 7.5 公里,20 分鐘左右的車程裡,我們經過了 16 個紅綠燈、經過了四向 STOP SIGN(停止標識) 路口,經過了紅色箭頭左轉路口等。

大部分時間裡,整個體驗都很舒服,只有偶爾略覺突然的加速減速,和司機旁邊顯示幕上科幻感極強的畫面,在提醒我這是一輛無人駕駛車。

沒錯,我身旁的司機手並沒有放在方向盤上,腳也離開了油門和刹車。車頂的相機、雷射雷達和雷達是汽車的眼睛,

而車廂後的電腦是汽車的大腦,一套基於深度學習的演算法把我從路邊接了上去,又把我送回到停車場。

這就是我們此前報導過的創業公司 Drive.ai研發的自動駕駛汽車。這家神秘的自動駕駛汽車公司成立不到兩年,但這已經是它的第四代車輛。我也有幸成為了它第一個外部乘客。機器人司機表現得非常的自然,比我以往坐過的自動駕駛汽車更像“人類”,

比如當我們駛到一個路口時,恰好遇上紅燈轉綠燈,車子並沒有先停下來再啟動,而是用無比自然的減速加速切換,度過了這個路口。

“雖然看起來很簡單,但其中有一些很難的地方。”陪我一起體驗的工程師說。比如某一個左轉路口是左轉箭頭綠燈亮起才能走,而要讓汽車明白在這個特定的路口前行綠燈和左轉箭頭綠燈的差別,並不容易。“剛開始汽車是搞不明白的。

我們就收集了一些這樣的路口資料來對它進行訓練,它才學會。”

當然,這輛車也還有很多可以做的更好的地方,比如加減速的處理如何更平穩、怎麼做到紅燈合理右轉以及無無保護左轉等。但是整體來說,已經是很不錯的駕駛體驗。

聯合創始人兼 CEO Sameep Tandon 告訴我們,目前他們的車隊已經具備 L4 級別(部分狀況下的完全自動駕駛)的自動駕駛水準,接下來他們希望和更多的合作夥伴進行合作,把他們的軟硬體解決方案帶到商務車隊上去。

經典機器人方向 V.S. 深度學習方向,自動駕駛哪家強?

自動駕駛汽車公司這麼多,Drive.ai 有什麼不同?

在採訪中,幾位聯合創始人一再強調,Drive.ai 是一個“深度學習技術為先”的公司。這也就意味著他們採用的技術和 Waymo(原Google 無人駕駛車部門)、特斯拉等都不太一樣,他們用的是深度學習技術來打造自動駕駛系統。

這意味著什麼?

在自動駕駛領域,基本可以分成兩個流派:一個是採用經典機器人方向,是基於規則的(rule-base) 的。工程師會為每個場景都寫好固定的代碼,來告訴機器人應該怎麼去做。這樣的結果是,如果新的場景出現、又沒有對應代碼的話,那麼機器很可能就不知道怎麼應對。這就嚴重限制了它的可拓展性。

舉一個例子,Waymo 的自動駕駛汽車,在從總部山景城擴展到奧斯丁的時候,僅僅因為山景城的紅綠燈是豎向的,而奧斯丁的則是橫向,就沒有辦法順利識別紅綠燈,而不得不讓程式師重新去寫程式“教”它。

另外一個現在更受歡迎、包括 Drive.ai 也選擇的方向,是基於深度學習技術。深度學習可以類比大腦識別機制,對於非結構化資料(比如圖像語音等)進項更好的識別、判斷和分類,讓演算法可以從資料和訓練中得到學習。這樣就像人腦一樣,只需要工程師通過類似的場景不斷對機器進行訓練,它就能自己學會做出判斷,這樣即使在全新的場景裡,車子也知道如何處理,更有利於適應和擴展。

比如,同樣是在識別紅綠燈的時候,rule-base 的自動駕駛汽車會需要在高精度地圖上特別標注出所有紅綠燈、讓機器固定看到那個方向;但是深度學習演算法可以直接從相機裡識別紅綠燈的顏色,所以車輛就可以自己看懂紅綠燈,以及整個路口的行車情況,以此來決定是否前行了。

Sameep Tandon 說,隨著深度學習的優勢被意識到,越來越很多公司都號稱自己的技術是基於深度學習基礎,但是事實上很少有人真正做到這點。“我們所有的技術,比如地圖、移動規劃、決策全部都是基於深度學習的。我們是用深度學習來設計我們的整個系統,這和其他公司走經典機器人方向、只是把深度學習當做一個補充部分,這有很大不同。”他說。

從資料處理到演算法訓練再到計算資源,基於深度學習打造一個自動駕駛公司

Drive.ai 的另外一個創始人 Tao Wang 說,自動駕駛的難點之一自動駕駛產生的資料量是極大的,在收集到自動駕駛資料之後,怎麼使用成為 了關鍵。第一步要做的事情就是標記它們,才能讓演算法引擎得到訓練。一個小時自動駕駛產生的資料,即使是在大互聯網公司裡,也需要 800 個小時的人工來去標記它。

Drive.ai 他們自己打造了一個定制化的資料標記工具,可以不斷優化整個資料工作流程,進行高品質的資料分類。他們使用深度學習來讓同一個任務可以同時進行多個分類,把輸出結果整合到一起後,就可以產生高品質的標記。他們現在資料標記的速度已經是大公司的 20 倍,這也就意味著可以有更多資料可以“喂”給演算法引擎學習,從而讓汽車可以快速處理新的道路、學習新的使用場景,隨著訓練資料的增加而持續提高性能。

Tao Wang 說,Drive.ai 的深度學習系統甚至比專門的人類標注者都更準確。有一次演算法顯示某個燈是紅燈,但是專門的標注員回憶說是綠燈,結果他們專程查看了一下資料後,發現真的是紅燈。“這也表明演算法可以被訓練得比人類更聰明。無論是決策,路線規劃還是定位都可以做得很好。”

有一次,他們的車看到了路上有一隻狗狗滑滑板,標注員很震驚地和工程師說,“請問這個要怎麼分類?”然而汽車還是能正常的行駛。深度學習關鍵就在於不需要識別每一樣東西,而是知道怎麼樣是安全的駕駛,然後自己做出決策。

另外一個很重要的部分是,Drive.ai 打造了一個模擬器,可以模擬生成各種場景,比如自行車車搶道等,檢查學習引擎怎麼處理這些情況。這個模擬器是 7*24 小時運轉,所以相當於他們的車一直在虛擬世界的道路上進行各種測試。而在真實世界裡,作為最早拿到加州自動駕駛汽車上路測試許可證的創業公司之一,Drive.ai 也已經讓自家無人車在山景城的城區上路測試9個月了,沒有任何的事故發生。

還有一個關鍵點在於,基於深度學習的自動駕駛系統可以擺脫對於昂貴硬體的依賴。和特斯拉與 Waymo 的“天價”定制感測器不同, Drive.ai 使用的是商業化的低成本硬體,包括雷射雷達、雷達和相機,深度學習系統會同步所有的感測器資料,來基於這些資訊作出最明智的決策,避免單個噪點導致的誤判。這樣即使其中一個失靈了,別的也可以正常工作。

正是感測器的冗餘設計,才讓他們完成了雨夜開車的成就 —— 即使雨水把相機給擋住了,但是其他的感測器讓汽車仍然能安全進行自動駕駛。

由於感測器會將資訊傳遞給他們軟體系統的人工智慧神經網路,這些神經網路系統可以在普通計算硬體上運行,所以這讓他們的解決方案成本大大降低。

“我們的改裝方案並不貴,而且可以適應各類汽車,無論是汽車,貨車,卡車,或者是高爾夫車都行。可以在一周之內,就登陸一個新的汽車平臺。而且由於我們在為機器應用打造規模化神經網路方面的專長,我們可以只需要其他自動駕駛汽車的計算資源的一部分,就可讓自動駕駛汽車運行。每台車需要的處理器資源差不多是一台臺式電腦的30%而已。”Sameep Tandon 說。

大部分的自動駕駛汽車都需要精確到釐米的高精度地圖,來進行感知,搞清楚汽車開向哪裡,這樣做的結果就是會需要持續地更新高精度地圖,非常昂貴而且很危險。而深度學習讓 Drive.ai 的自動駕駛汽車可以比較地圖上的物體和真實的環境,像是車道、人行道這類東西,所以即使環境改變了,汽車也能適應。

斯坦福整個人工智慧實驗室成員跑來創業

為什麼 Drive.ai 可以做到這一點?這還要從他們團隊的成員背景開始說。雖然Drive.ai 公司才成立不到兩年,但是早在四五年前,這個團隊的創始人們就已經在斯坦福的人工智慧實驗室,開始了怎麼把深度學習系統規模化的研究。

沒錯,團隊核心成員都來自于深度學習界鼎鼎大名的吳恩達的實驗室。兩年前,由於發現了深度學習在無人駕駛上的機會,實驗室的 6 個人全都從博士專案中暫停,一起成立了這家公司。所以,在一些公司有一兩位深度學習方面的專才就很稀罕的時候,這個團隊可以說把斯坦福的人工智慧實驗室都搬空了……

“自動駕駛是非常難的,如果只是某一個人的話,都很難做好,所以我們決定大家一起做好了。”聯合創始人兼 CEO Sameep Tandon 說。“我們那時就和很多汽車公司都聊過,發現我們有這麼棒的技術,等不及畢業了。”

Tandon說,團隊在從很早的時候就開始做非常基礎的研究,比如資料標注等,是最棒的深度學習團隊之一。當他們還在斯坦福的時候,就曾經打造過世界上最大的神經網路。當時 Google 用1000 台機器在他們 Google 大腦項目裡做了一個實驗,結果他們只用 了16 GPU 機器就複現了這個效果,只花了十分之一的成本。所以Tandon 很有底氣的說,他不知道其他號稱深度學習的公司都有些什麼核心技術,但是他們絕對是世界上最好的深度學習團隊之一。

在低調研發了兩年後,Drive.ai 現在認為自家在 L4 級別無人駕駛的研究上已經到了一定的階段,希望能夠進一步尋找合作夥伴,把他們的技術帶到更多汽車上去。聯合創始人 Carol Reiley 告訴我們,Drive.ai 和 OEM 商們關係很親密,也希望獲得汽車製造商們的支持。“我們不造車和感測器,我們只是提供一個解決方案。現在希望先從商務車隊開始合作,包括包裹運送、食物運送、零售等可以。我們希望和合作夥伴們一起先做到 L4 的程度,提高定位準確性,一起收集資料,然後不斷向外拓展,最終會再向消費者層級的 L5 級進發。”

“深度學習作為人工智慧的一種領先方法,可以教機器如何像人類一樣思考,這就是無人駕駛的關鍵。在這個基礎上,打造一個可以擴展的、適用廣泛、安全的平臺,就是我們做的事。我們相信,無論是從安全性還是到效率方面,自動駕駛會整個顛覆交通系統。”Sameep Tandon說。

Drive.ai 有什麼不同?

在採訪中,幾位聯合創始人一再強調,Drive.ai 是一個“深度學習技術為先”的公司。這也就意味著他們採用的技術和 Waymo(原Google 無人駕駛車部門)、特斯拉等都不太一樣,他們用的是深度學習技術來打造自動駕駛系統。

這意味著什麼?

在自動駕駛領域,基本可以分成兩個流派:一個是採用經典機器人方向,是基於規則的(rule-base) 的。工程師會為每個場景都寫好固定的代碼,來告訴機器人應該怎麼去做。這樣的結果是,如果新的場景出現、又沒有對應代碼的話,那麼機器很可能就不知道怎麼應對。這就嚴重限制了它的可拓展性。

舉一個例子,Waymo 的自動駕駛汽車,在從總部山景城擴展到奧斯丁的時候,僅僅因為山景城的紅綠燈是豎向的,而奧斯丁的則是橫向,就沒有辦法順利識別紅綠燈,而不得不讓程式師重新去寫程式“教”它。

另外一個現在更受歡迎、包括 Drive.ai 也選擇的方向,是基於深度學習技術。深度學習可以類比大腦識別機制,對於非結構化資料(比如圖像語音等)進項更好的識別、判斷和分類,讓演算法可以從資料和訓練中得到學習。這樣就像人腦一樣,只需要工程師通過類似的場景不斷對機器進行訓練,它就能自己學會做出判斷,這樣即使在全新的場景裡,車子也知道如何處理,更有利於適應和擴展。

比如,同樣是在識別紅綠燈的時候,rule-base 的自動駕駛汽車會需要在高精度地圖上特別標注出所有紅綠燈、讓機器固定看到那個方向;但是深度學習演算法可以直接從相機裡識別紅綠燈的顏色,所以車輛就可以自己看懂紅綠燈,以及整個路口的行車情況,以此來決定是否前行了。

Sameep Tandon 說,隨著深度學習的優勢被意識到,越來越很多公司都號稱自己的技術是基於深度學習基礎,但是事實上很少有人真正做到這點。“我們所有的技術,比如地圖、移動規劃、決策全部都是基於深度學習的。我們是用深度學習來設計我們的整個系統,這和其他公司走經典機器人方向、只是把深度學習當做一個補充部分,這有很大不同。”他說。

從資料處理到演算法訓練再到計算資源,基於深度學習打造一個自動駕駛公司

Drive.ai 的另外一個創始人 Tao Wang 說,自動駕駛的難點之一自動駕駛產生的資料量是極大的,在收集到自動駕駛資料之後,怎麼使用成為 了關鍵。第一步要做的事情就是標記它們,才能讓演算法引擎得到訓練。一個小時自動駕駛產生的資料,即使是在大互聯網公司裡,也需要 800 個小時的人工來去標記它。

Drive.ai 他們自己打造了一個定制化的資料標記工具,可以不斷優化整個資料工作流程,進行高品質的資料分類。他們使用深度學習來讓同一個任務可以同時進行多個分類,把輸出結果整合到一起後,就可以產生高品質的標記。他們現在資料標記的速度已經是大公司的 20 倍,這也就意味著可以有更多資料可以“喂”給演算法引擎學習,從而讓汽車可以快速處理新的道路、學習新的使用場景,隨著訓練資料的增加而持續提高性能。

Tao Wang 說,Drive.ai 的深度學習系統甚至比專門的人類標注者都更準確。有一次演算法顯示某個燈是紅燈,但是專門的標注員回憶說是綠燈,結果他們專程查看了一下資料後,發現真的是紅燈。“這也表明演算法可以被訓練得比人類更聰明。無論是決策,路線規劃還是定位都可以做得很好。”

有一次,他們的車看到了路上有一隻狗狗滑滑板,標注員很震驚地和工程師說,“請問這個要怎麼分類?”然而汽車還是能正常的行駛。深度學習關鍵就在於不需要識別每一樣東西,而是知道怎麼樣是安全的駕駛,然後自己做出決策。

另外一個很重要的部分是,Drive.ai 打造了一個模擬器,可以模擬生成各種場景,比如自行車車搶道等,檢查學習引擎怎麼處理這些情況。這個模擬器是 7*24 小時運轉,所以相當於他們的車一直在虛擬世界的道路上進行各種測試。而在真實世界裡,作為最早拿到加州自動駕駛汽車上路測試許可證的創業公司之一,Drive.ai 也已經讓自家無人車在山景城的城區上路測試9個月了,沒有任何的事故發生。

還有一個關鍵點在於,基於深度學習的自動駕駛系統可以擺脫對於昂貴硬體的依賴。和特斯拉與 Waymo 的“天價”定制感測器不同, Drive.ai 使用的是商業化的低成本硬體,包括雷射雷達、雷達和相機,深度學習系統會同步所有的感測器資料,來基於這些資訊作出最明智的決策,避免單個噪點導致的誤判。這樣即使其中一個失靈了,別的也可以正常工作。

正是感測器的冗餘設計,才讓他們完成了雨夜開車的成就 —— 即使雨水把相機給擋住了,但是其他的感測器讓汽車仍然能安全進行自動駕駛。

由於感測器會將資訊傳遞給他們軟體系統的人工智慧神經網路,這些神經網路系統可以在普通計算硬體上運行,所以這讓他們的解決方案成本大大降低。

“我們的改裝方案並不貴,而且可以適應各類汽車,無論是汽車,貨車,卡車,或者是高爾夫車都行。可以在一周之內,就登陸一個新的汽車平臺。而且由於我們在為機器應用打造規模化神經網路方面的專長,我們可以只需要其他自動駕駛汽車的計算資源的一部分,就可讓自動駕駛汽車運行。每台車需要的處理器資源差不多是一台臺式電腦的30%而已。”Sameep Tandon 說。

大部分的自動駕駛汽車都需要精確到釐米的高精度地圖,來進行感知,搞清楚汽車開向哪裡,這樣做的結果就是會需要持續地更新高精度地圖,非常昂貴而且很危險。而深度學習讓 Drive.ai 的自動駕駛汽車可以比較地圖上的物體和真實的環境,像是車道、人行道這類東西,所以即使環境改變了,汽車也能適應。

斯坦福整個人工智慧實驗室成員跑來創業

為什麼 Drive.ai 可以做到這一點?這還要從他們團隊的成員背景開始說。雖然Drive.ai 公司才成立不到兩年,但是早在四五年前,這個團隊的創始人們就已經在斯坦福的人工智慧實驗室,開始了怎麼把深度學習系統規模化的研究。

沒錯,團隊核心成員都來自于深度學習界鼎鼎大名的吳恩達的實驗室。兩年前,由於發現了深度學習在無人駕駛上的機會,實驗室的 6 個人全都從博士專案中暫停,一起成立了這家公司。所以,在一些公司有一兩位深度學習方面的專才就很稀罕的時候,這個團隊可以說把斯坦福的人工智慧實驗室都搬空了……

“自動駕駛是非常難的,如果只是某一個人的話,都很難做好,所以我們決定大家一起做好了。”聯合創始人兼 CEO Sameep Tandon 說。“我們那時就和很多汽車公司都聊過,發現我們有這麼棒的技術,等不及畢業了。”

Tandon說,團隊在從很早的時候就開始做非常基礎的研究,比如資料標注等,是最棒的深度學習團隊之一。當他們還在斯坦福的時候,就曾經打造過世界上最大的神經網路。當時 Google 用1000 台機器在他們 Google 大腦項目裡做了一個實驗,結果他們只用 了16 GPU 機器就複現了這個效果,只花了十分之一的成本。所以Tandon 很有底氣的說,他不知道其他號稱深度學習的公司都有些什麼核心技術,但是他們絕對是世界上最好的深度學習團隊之一。

在低調研發了兩年後,Drive.ai 現在認為自家在 L4 級別無人駕駛的研究上已經到了一定的階段,希望能夠進一步尋找合作夥伴,把他們的技術帶到更多汽車上去。聯合創始人 Carol Reiley 告訴我們,Drive.ai 和 OEM 商們關係很親密,也希望獲得汽車製造商們的支持。“我們不造車和感測器,我們只是提供一個解決方案。現在希望先從商務車隊開始合作,包括包裹運送、食物運送、零售等可以。我們希望和合作夥伴們一起先做到 L4 的程度,提高定位準確性,一起收集資料,然後不斷向外拓展,最終會再向消費者層級的 L5 級進發。”

“深度學習作為人工智慧的一種領先方法,可以教機器如何像人類一樣思考,這就是無人駕駛的關鍵。在這個基礎上,打造一個可以擴展的、適用廣泛、安全的平臺,就是我們做的事。我們相信,無論是從安全性還是到效率方面,自動駕駛會整個顛覆交通系統。”Sameep Tandon說。