用深度學習為自動駕駛汽車構建大腦，Drive.ai解鎖雨夜穿行新技能

分類＼科技
時間＼2017-03-23

今年2月，長期隱身的自動駕駛汽車技術研發公司Drive.ai悄然上線，發佈了一段長約四分鐘的視頻。視頻中，一輛測試汽車在雨夜中穿行過美國加利福尼亞州山景城（Mountain View）的街道，全程駕駛員的雙手都沒有碰過方向盤上，

沒有任何干預動作。

我們找到Drive.ai的聯合創始人王弢，和他聊了聊Drive.ai背後的設計理念和核心技術。

Drive.ai想為商業車隊提供包括感測器組合、控制系統和車內外交互介面在內的後裝套件，實現特定路線（如外賣、計程車等）的L4級別自動駕駛（即在任何情況下都不需要人工干預）。

感知方面，Drive.ai後裝套件中的感測器包括多個攝像頭、雷達和雷射雷達，這樣的組合可以在某一感測器出現錯誤或故障的情況下提供一定冗餘度，

譬如攝像頭和雷達可以在雨雪霧等極端天氣中精度嚴重下降的雷射雷達提供環境感知。值得一提的是，大部分自動駕駛技術提供商採用高精度地圖來彌補感測器缺陷、為自動駕駛提供資料支援路線規劃，而Drive.ai則想避免使用維護和運營成本很高、且臨時變數不可控的高精度地圖，目前使用的是自己收集資料生成的、不包含3D空間內物體資訊的2D地圖，

未來會和協力廠商地圖供應商合作。

決策方面，不同於一些起步較早、技術路線基於傳統機器人學的自動駕駛技術提供商，Drive.ai使用的是基於非規則學習的深度學習網路模型，這有三項優勢。其一，場景泛化。規則學習雖然可以快速建立起應對八九成場景的決策系統，面對新的和罕見的情況卻很難可靠應對；非規則學習的泛化能力讓它可以更好地即時理解資料並解決此類長尾問題。

其二，複雜決策。大量算例支援下的非規則學習有複雜決策方面的優勢，這已經在AlphaGo等深度學習程式中體現出來。未來會有很長一段時間，路面上會有自動駕駛車輛和人工駕駛車輛共存，而自動駕駛所需的複雜決策（是否超車、變道等等）與圍棋相似——基於對方的動作，進行自己的下一步動作，合理地獲得路權。

其三，硬體需求。自動駕駛過程中，感測器每小時會採集幾十GB的資料流程，存儲和計算都是很大的挑戰。利用非規則學習而非現成的知識庫進行決策，對計算晶片的效能要求相對較低，在計算能力相當於個人電腦的車載設備上即可完成核心資料處理。

非規則學習的核心、也是進展難點，是海量標注的資料，以及海量的實驗試錯。Drive.ai的資料來源包括採集車收集的真實資料，

和模擬器生成的各種場景（包含極端情況）的類比資料。對這些場景中出現的物體（如車輛、行人、自行車等）進行標注，是個技術瓶頸——每小時車程收集的資料需要800個小時的人工標注，而王弢告訴36氪，Drive.ai利用自己的標注系統來進行半自動的識別和標注，比其他公司快20倍，能夠在短時間內提取到更多有用的資料。在實驗方面，Drive.ai的團隊同樣有較多積累。譬如在使用大規模顯卡（CPU+GPU）集群進行大規模神經網路訓練方面，Drive.ai就擁有市面上最快的大規模平行計算軟硬體基礎架構。此前谷歌曾使用千餘台機器完成了當時世界最大的深度學習神經網路，Drive.ai彼時在斯坦福的團隊用16台機器、十分之一的成本實現了重建。

非規則學習的問題在於演算法不可解釋：“端到端”的訓練中，策略規劃有不透明的區域，原理和機制並不明確（“黑盒”）。針對這個問題，Drive.ai採用的是當下學界主流的生成式對抗網路（GANs），將完整的端到端系統拆分開來，在涵蓋絕大多數場景的標準化測試機上，對決策機制的不同部分進行驗證和測試。

在實現自動駕駛功能之外，Drive.ai認為自動駕駛車輛與其他通勤者的溝通同樣重要，因此設計了包括LED顯示幕和聲音系統來向行人和自行車示意自己的行為。這些人車交互（HRI, human-robot interaction）部分的設計還在持續開發中。

Drive.ai在車頂安裝了一塊LED顯示幕，用於向行人和其他駕駛者傳遞文字資訊和emoji表情。

已經獲得美國加州無人駕駛路測執照的Drive.ai，現處於路測階段。雖然demo中表現很好，但從樣車測試到產品落地還有一段路要走。落地中常見的成本過高和場景拓展性低等問題，Drive.ai應該能較好應對——Drive.ai的套件在成本上控制嚴格，感測器以低價攝像頭和雷達為主，高價的雷射雷達使用較少，並規避了運維成本高的高精地圖；此外，非規則學習演算法也提升了L4技術可運用場景的可拓展性。

公司還未正式進入商業化運營，但今年會進行和一些協力廠商運輸服務提供者的試運營（約數十至百輛車），在固定路線上進行L4級別的自動駕駛，期間會進行人為監督。這些預設行駛路線上的乘客和貨物的運輸，將初步證明其技術的可靠性。同時，Drive.ai也向一些車廠提供L2-L3級別的技術，實現初步的商業化。目前暫時不方便透露關於合作物件的更多資訊。

Drive.ai的創始團隊。

麥肯錫和彭博新能源經濟資訊聯合發佈報告稱，2030年高級別自動駕駛汽車（L3和L4）將達到整體銷量的50%，其中L4級別的市場規模達到5500萬輛至6000萬量。鑒於自動駕駛的發展方向將是toB主導——運營商統一管理自動駕駛汽車，提供去人力化的端到端運輸解決方案——這五千多萬輛車，就是面向商用車隊的Drive.ai的下游市場。

這個市場上選手雲集。想要向商用車和乘用車提供L4級別自動駕駛技術Drive.ai的競爭對手，既有擁有造車經驗的傳統整車廠，又有財力人力和技術皆儲備雄厚的科技巨頭，還有其他初創公司。這5500至6000萬輛車中，去掉穀歌、特斯拉、百度、富豪、寶馬等自主研發的車，剩下的有多少會搭載Drive.ai的解決方案，取決於Drive.ai能否比通用收購的Cruise Automation、福特收購的Argo AI、專注計程車的nuTonomy、專注物流商用車的Otto和圖森等等自動駕駛技術提供商，更早推出低成本且安全可靠的整體解決方案。

公司共有大約50位員工，其中以技術人員為主。Drive.ai的核心團隊來自斯坦福大學人工智慧實驗室，對自然語言處理、電腦視覺和自動駕駛等領域的深度學習有豐富經驗。其中，公司CEO Sameep Tandon來自斯坦福大學的人工智慧實驗室，負責自動駕駛車輛深度學習方向的研究；COO Fred Rosenzweig曾在矽谷多家初創公司擔任CEO；總裁Carol Reiley在機器人領域有超過15年的經驗，並擁有六項技術專利。值得一提的是她另一個身份——人工智慧和機器學習領域國際上最權威的學者之一、今日宣佈離職的百度首席科學家吳恩達的妻子。“開啟自己在人工智慧領域的新篇章”的具體指向，很有可能就是他一直熱愛並專長、在百度卻始終無緣掌舵的自動駕駛，而Drive.ai似乎是個非常好的選擇。

Drive.ai近期計畫開始新一輪融資，暫不方便透露融資額，預計在數億級人民幣，主要用於技術開發和車隊拓展。去年五月，公司獲得了來自Northern Light Venture Capital，Oriza Ventures和InnoSpring Seed Fund的1200萬美元投資。

Drive.ai就擁有市面上最快的大規模平行計算軟硬體基礎架構。此前谷歌曾使用千餘台機器完成了當時世界最大的深度學習神經網路，Drive.ai彼時在斯坦福的團隊用16台機器、十分之一的成本實現了重建。

Drive.ai在車頂安裝了一塊LED顯示幕，用於向行人和其他駕駛者傳遞文字資訊和emoji表情。

Drive.ai的創始團隊。