用深度學習為自動駕駛汽車構建大腦,Drive.ai解鎖雨夜穿行新技能
今年2月,長期隱身的自動駕駛汽車技術研發公司Drive.ai悄然上線,發佈了一段長約四分鐘的視頻。視頻中,一輛測試汽車在雨夜中穿行過美國加利福尼亞州山景城(Mountain View)的街道,全程駕駛員的雙手都沒有碰過方向盤上,
我們找到Drive.ai的聯合創始人王弢,和他聊了聊Drive.ai背後的設計理念和核心技術。
Drive.ai想為商業車隊提供包括感測器組合、控制系統和車內外交互介面在內的後裝套件,實現特定路線(如外賣、計程車等)的L4級別自動駕駛(即在任何情況下都不需要人工干預)。
感知方面,Drive.ai後裝套件中的感測器包括多個攝像頭、雷達和雷射雷達,這樣的組合可以在某一感測器出現錯誤或故障的情況下提供一定冗餘度,
決策方面,不同於一些起步較早、技術路線基於傳統機器人學的自動駕駛技術提供商,Drive.ai使用的是基於非規則學習的深度學習網路模型,這有三項優勢。其一,場景泛化。規則學習雖然可以快速建立起應對八九成場景的決策系統,面對新的和罕見的情況卻很難可靠應對;非規則學習的泛化能力讓它可以更好地即時理解資料並解決此類長尾問題。
非規則學習的核心、也是進展難點,是海量標注的資料,以及海量的實驗試錯。Drive.ai的資料來源包括採集車收集的真實資料,
非規則學習的問題在於演算法不可解釋:“端到端”的訓練中,策略規劃有不透明的區域,原理和機制並不明確(“黑盒”)。針對這個問題,Drive.ai採用的是當下學界主流的生成式對抗網路(GANs),將完整的端到端系統拆分開來,在涵蓋絕大多數場景的標準化測試機上,對決策機制的不同部分進行驗證和測試。
在實現自動駕駛功能之外,Drive.ai認為自動駕駛車輛與其他通勤者的溝通同樣重要,因此設計了包括LED顯示幕和聲音系統來向行人和自行車示意自己的行為。這些人車交互(HRI, human-robot interaction)部分的設計還在持續開發中。
Drive.ai在車頂安裝了一塊LED顯示幕,用於向行人和其他駕駛者傳遞文字資訊和emoji表情。
已經獲得美國加州無人駕駛路測執照的Drive.ai,現處於路測階段。雖然demo中表現很好,但從樣車測試到產品落地還有一段路要走。落地中常見的成本過高和場景拓展性低等問題,Drive.ai應該能較好應對——Drive.ai的套件在成本上控制嚴格,感測器以低價攝像頭和雷達為主,高價的雷射雷達使用較少,並規避了運維成本高的高精地圖;此外,非規則學習演算法也提升了L4技術可運用場景的可拓展性。
公司還未正式進入商業化運營,但今年會進行和一些協力廠商運輸服務提供者的試運營(約數十至百輛車),在固定路線上進行L4級別的自動駕駛,期間會進行人為監督。這些預設行駛路線上的乘客和貨物的運輸,將初步證明其技術的可靠性。同時,Drive.ai也向一些車廠提供L2-L3級別的技術,實現初步的商業化。目前暫時不方便透露關於合作物件的更多資訊。
Drive.ai的創始團隊。
麥肯錫和彭博新能源經濟資訊聯合發佈報告稱,2030年高級別自動駕駛汽車(L3和L4)將達到整體銷量的50%,其中L4級別的市場規模達到5500萬輛至6000萬量。鑒於自動駕駛的發展方向將是toB主導——運營商統一管理自動駕駛汽車,提供去人力化的端到端運輸解決方案——這五千多萬輛車,就是面向商用車隊的Drive.ai的下游市場。
這個市場上選手雲集。想要向商用車和乘用車提供L4級別自動駕駛技術Drive.ai的競爭對手,既有擁有造車經驗的傳統整車廠,又有財力人力和技術皆儲備雄厚的科技巨頭,還有其他初創公司。這5500至6000萬輛車中,去掉穀歌、特斯拉、百度、富豪、寶馬等自主研發的車,剩下的有多少會搭載Drive.ai的解決方案,取決於Drive.ai能否比通用收購的Cruise Automation、福特收購的Argo AI、專注計程車的nuTonomy、專注物流商用車的Otto和圖森等等自動駕駛技術提供商,更早推出低成本且安全可靠的整體解決方案。
公司共有大約50位員工,其中以技術人員為主。Drive.ai的核心團隊來自斯坦福大學人工智慧實驗室,對自然語言處理、電腦視覺和自動駕駛等領域的深度學習有豐富經驗。其中,公司CEO Sameep Tandon來自斯坦福大學的人工智慧實驗室,負責自動駕駛車輛深度學習方向的研究;COO Fred Rosenzweig曾在矽谷多家初創公司擔任CEO;總裁Carol Reiley在機器人領域有超過15年的經驗,並擁有六項技術專利。值得一提的是她另一個身份——人工智慧和機器學習領域國際上最權威的學者之一、今日宣佈離職的百度首席科學家吳恩達的妻子。“開啟自己在人工智慧領域的新篇章”的具體指向,很有可能就是他一直熱愛並專長、在百度卻始終無緣掌舵的自動駕駛,而Drive.ai似乎是個非常好的選擇。
Drive.ai近期計畫開始新一輪融資,暫不方便透露融資額,預計在數億級人民幣,主要用於技術開發和車隊拓展。去年五月,公司獲得了來自Northern Light Venture Capital,Oriza Ventures和InnoSpring Seed Fund的1200萬美元投資。
Drive.ai就擁有市面上最快的大規模平行計算軟硬體基礎架構。此前谷歌曾使用千餘台機器完成了當時世界最大的深度學習神經網路,Drive.ai彼時在斯坦福的團隊用16台機器、十分之一的成本實現了重建。非規則學習的問題在於演算法不可解釋:“端到端”的訓練中,策略規劃有不透明的區域,原理和機制並不明確(“黑盒”)。針對這個問題,Drive.ai採用的是當下學界主流的生成式對抗網路(GANs),將完整的端到端系統拆分開來,在涵蓋絕大多數場景的標準化測試機上,對決策機制的不同部分進行驗證和測試。
在實現自動駕駛功能之外,Drive.ai認為自動駕駛車輛與其他通勤者的溝通同樣重要,因此設計了包括LED顯示幕和聲音系統來向行人和自行車示意自己的行為。這些人車交互(HRI, human-robot interaction)部分的設計還在持續開發中。
Drive.ai在車頂安裝了一塊LED顯示幕,用於向行人和其他駕駛者傳遞文字資訊和emoji表情。
已經獲得美國加州無人駕駛路測執照的Drive.ai,現處於路測階段。雖然demo中表現很好,但從樣車測試到產品落地還有一段路要走。落地中常見的成本過高和場景拓展性低等問題,Drive.ai應該能較好應對——Drive.ai的套件在成本上控制嚴格,感測器以低價攝像頭和雷達為主,高價的雷射雷達使用較少,並規避了運維成本高的高精地圖;此外,非規則學習演算法也提升了L4技術可運用場景的可拓展性。
公司還未正式進入商業化運營,但今年會進行和一些協力廠商運輸服務提供者的試運營(約數十至百輛車),在固定路線上進行L4級別的自動駕駛,期間會進行人為監督。這些預設行駛路線上的乘客和貨物的運輸,將初步證明其技術的可靠性。同時,Drive.ai也向一些車廠提供L2-L3級別的技術,實現初步的商業化。目前暫時不方便透露關於合作物件的更多資訊。
Drive.ai的創始團隊。
麥肯錫和彭博新能源經濟資訊聯合發佈報告稱,2030年高級別自動駕駛汽車(L3和L4)將達到整體銷量的50%,其中L4級別的市場規模達到5500萬輛至6000萬量。鑒於自動駕駛的發展方向將是toB主導——運營商統一管理自動駕駛汽車,提供去人力化的端到端運輸解決方案——這五千多萬輛車,就是面向商用車隊的Drive.ai的下游市場。
這個市場上選手雲集。想要向商用車和乘用車提供L4級別自動駕駛技術Drive.ai的競爭對手,既有擁有造車經驗的傳統整車廠,又有財力人力和技術皆儲備雄厚的科技巨頭,還有其他初創公司。這5500至6000萬輛車中,去掉穀歌、特斯拉、百度、富豪、寶馬等自主研發的車,剩下的有多少會搭載Drive.ai的解決方案,取決於Drive.ai能否比通用收購的Cruise Automation、福特收購的Argo AI、專注計程車的nuTonomy、專注物流商用車的Otto和圖森等等自動駕駛技術提供商,更早推出低成本且安全可靠的整體解決方案。
公司共有大約50位員工,其中以技術人員為主。Drive.ai的核心團隊來自斯坦福大學人工智慧實驗室,對自然語言處理、電腦視覺和自動駕駛等領域的深度學習有豐富經驗。其中,公司CEO Sameep Tandon來自斯坦福大學的人工智慧實驗室,負責自動駕駛車輛深度學習方向的研究;COO Fred Rosenzweig曾在矽谷多家初創公司擔任CEO;總裁Carol Reiley在機器人領域有超過15年的經驗,並擁有六項技術專利。值得一提的是她另一個身份——人工智慧和機器學習領域國際上最權威的學者之一、今日宣佈離職的百度首席科學家吳恩達的妻子。“開啟自己在人工智慧領域的新篇章”的具體指向,很有可能就是他一直熱愛並專長、在百度卻始終無緣掌舵的自動駕駛,而Drive.ai似乎是個非常好的選擇。
Drive.ai近期計畫開始新一輪融資,暫不方便透露融資額,預計在數億級人民幣,主要用於技術開發和車隊拓展。去年五月,公司獲得了來自Northern Light Venture Capital,Oriza Ventures和InnoSpring Seed Fund的1200萬美元投資。