華文網

蘋果罕見發表論文闡述自動駕駛最新成果

蘋果兩位元電腦研究人員Yin Zhou, Oncel Tuzel近期在一個名為Arxiv的論文網站上發表了一篇關於自動駕駛視覺系統研究成果的論文。這對於向來對產品保持神秘的蘋果公司而言實屬罕見。

這篇論文闡述了蘋果如何基於雷射雷達LiDAR技術,開發一套能夠識別行人和騎車人的用於自動駕駛的視覺系統。這也意味著比起開發一輛具體的自動駕駛汽車而言,蘋果在自動駕駛方面的涉足將會更加聚焦軟體方面的技術。

蘋果開發的這套基於LiDAR的機器視覺系統被命名為VoxelNet,

根據蘋果論文的描述,它能夠解決目前基於三維點雲的LiDAR視覺識別不夠精確的問題。LiDAR的精確度要高於攝像頭,但是它的問題在於點過於稀疏,不利於物體特徵的提取。蘋果在論文中寫道:“在包括自主導航、家用機器人和AR、VR等應用中,利用三維點雲精確地探測物體一直是一個核心的問題。”

為此,蘋果電腦科學家開發了一套複雜的機器視覺和人工智慧的演算法,並在電腦上類比了這套系統。類比結果顯示,蘋果訓練的神經網路已經能對多種幾何體進行三維特徵表示,因此能夠識別出行人和騎車人。論文稱,在KITTI汽車探測的標準測試中,VoxelNet的性能已經遠遠好過目前的LiDAR技術。

目前針對物體的探測大多數是基於雷射雷達LiDAR技術,

通過把光打到物體上,測算光返回所用的時間,來測算物體的距離,並對它們的形狀進行描述。

但是單單使用LiDAR會讓探測遠處較小的物體變得困難,因此LiDAR通常也會和攝像頭一起使用。蘋果的研究人員認為LiDAR以及基於攝像頭的解決方案很難部署到大多數場景,而且很多時候會因為其對環境的敏感性而導致感測器探測失靈。

機器視覺系統的基礎研究是近幾年的熱門,全球頂尖高校實驗室都在從事這方面的研究,競爭相當激烈。賓夕法尼亞大學電腦視覺教授史建波告訴#Teku特酷#:“蘋果論文中闡述的這套視覺系統確實進行了很好的工程設計,但科研創新性方面的程度並不高。”

史建波解釋道,

在KITTI三維物體探測的測試中,蘋果系統的性能等級並不是最高的。“目前性能等級最高的是在今年的機器視覺大會CVPR上,由加州大學聖達戈分校Hao Su教授所開發的一種叫做PointNet的方法,絕對值等級能高出5%至10%,這是相當大的差距。在PointNet之前,清華大學教授Ma Humin開發的Multimodal(MV)系統的等級最高。”史建波說道。

蘋果的VoxelNet和Hao Su教授都是使用基於點雲資料的LiDAR所開發的視覺系統。史建波解釋道:“點雲是機器人領域中非常常見的機器視覺的探測方法。但是這方面的認知過程仍然比較慢。”史建波早在2010年就曾使用點雲的方法進行機器視覺的研究。

他同時指出,相對於圖片而言,目前仍然沒有足夠多的點雲資料可以使用,因此基於點雲做研究限制很大。史建波說道:“2010年的時候,很少人能夠從政府以外的機構獲取LiDAR點雲資料,傳統機器視覺的人認為圖片對於認知已經足夠了,所以點雲資料和圖片資料不在一個數量級。直到近期人們開始慢慢地關注到點雲。”

目前LiDAR的成本仍然很高,根據掃描線數的不同,16線至64線的LiDAR成本在1萬至8萬美元不等。比如蘋果論文中所闡述的機器視覺的深度學習技術,就是基於最高級別64線LiDAR的三維點雲資料開發,這種LiDAR價格高達7.5萬美元。這也是為什麼在能用攝像頭的情況下,人們不會去使用LiDAR去解決問題,儘管LiDAR的精確度更高。比如英特爾收購的Mobileye就是使用攝像頭的解決方案。

“但是未來LiDAR和攝像頭的邊界會變得模糊,兩者會共存相當長一段時間。二維和三維識別技術也將趨同。”史建波對#Teku特酷#表示,“單線LiDAR已經在很多場合下用到了,比如家用掃地機器人、亞馬遜Kiva倉儲機器人等。”

但是這方面的認知過程仍然比較慢。”史建波早在2010年就曾使用點雲的方法進行機器視覺的研究。

他同時指出,相對於圖片而言,目前仍然沒有足夠多的點雲資料可以使用,因此基於點雲做研究限制很大。史建波說道:“2010年的時候,很少人能夠從政府以外的機構獲取LiDAR點雲資料,傳統機器視覺的人認為圖片對於認知已經足夠了,所以點雲資料和圖片資料不在一個數量級。直到近期人們開始慢慢地關注到點雲。”

目前LiDAR的成本仍然很高,根據掃描線數的不同,16線至64線的LiDAR成本在1萬至8萬美元不等。比如蘋果論文中所闡述的機器視覺的深度學習技術,就是基於最高級別64線LiDAR的三維點雲資料開發,這種LiDAR價格高達7.5萬美元。這也是為什麼在能用攝像頭的情況下,人們不會去使用LiDAR去解決問題,儘管LiDAR的精確度更高。比如英特爾收購的Mobileye就是使用攝像頭的解決方案。

“但是未來LiDAR和攝像頭的邊界會變得模糊,兩者會共存相當長一段時間。二維和三維識別技術也將趨同。”史建波對#Teku特酷#表示,“單線LiDAR已經在很多場合下用到了,比如家用掃地機器人、亞馬遜Kiva倉儲機器人等。”