您的位置:首頁>科技>正文

蘋果罕見發表論文闡述自動駕駛最新成果

蘋果兩位元電腦研究人員Yin Zhou, Oncel Tuzel近期在一個名為Arxiv的論文網站上發表了一篇關於自動駕駛視覺系統研究成果的論文。 這對於向來對產品保持神秘的蘋果公司而言實屬罕見。

這篇論文闡述了蘋果如何基於雷射雷達LiDAR技術, 開發一套能夠識別行人和騎車人的用於自動駕駛的視覺系統。 這也意味著比起開發一輛具體的自動駕駛汽車而言, 蘋果在自動駕駛方面的涉足將會更加聚焦軟體方面的技術。

蘋果開發的這套基於LiDAR的機器視覺系統被命名為VoxelNet, 根據蘋果論文的描述, 它能夠解決目前基於三維點雲的LiDAR視覺識別不夠精確的問題。 LiDAR的精確度要高於攝像頭, 但是它的問題在於點過於稀疏, 不利於物體特徵的提取。 蘋果在論文中寫道:“在包括自主導航、家用機器人和AR、VR等應用中, 利用三維點雲精確地探測物體一直是一個核心的問題。 ”

為此, 蘋果電腦科學家開發了一套複雜的機器視覺和人工智慧的演算法, 並在電腦上類比了這套系統。 類比結果顯示, 蘋果訓練的神經網路已經能對多種幾何體進行三維特徵表示, 因此能夠識別出行人和騎車人。 論文稱, 在KITTI汽車探測的標準測試中, VoxelNet的性能已經遠遠好過目前的LiDAR技術。

目前針對物體的探測大多數是基於雷射雷達LiDAR技術, 通過把光打到物體上, 測算光返回所用的時間, 來測算物體的距離, 並對它們的形狀進行描述。

但是單單使用LiDAR會讓探測遠處較小的物體變得困難, 因此LiDAR通常也會和攝像頭一起使用。 蘋果的研究人員認為LiDAR以及基於攝像頭的解決方案很難部署到大多數場景, 而且很多時候會因為其對環境的敏感性而導致感測器探測失靈。

機器視覺系統的基礎研究是近幾年的熱門, 全球頂尖高校實驗室都在從事這方面的研究, 競爭相當激烈。 賓夕法尼亞大學電腦視覺教授史建波告訴#Teku特酷#:“蘋果論文中闡述的這套視覺系統確實進行了很好的工程設計, 但科研創新性方面的程度並不高。 ”

史建波解釋道, 在KITTI三維物體探測的測試中, 蘋果系統的性能等級並不是最高的。 “目前性能等級最高的是在今年的機器視覺大會CVPR上, 由加州大學聖達戈分校Hao Su教授所開發的一種叫做PointNet的方法, 絕對值等級能高出5%至10%,

這是相當大的差距。 在PointNet之前, 清華大學教授Ma Humin開發的Multimodal(MV)系統的等級最高。 ”史建波說道。

蘋果的VoxelNet和Hao Su教授都是使用基於點雲資料的LiDAR所開發的視覺系統。 史建波解釋道:“點雲是機器人領域中非常常見的機器視覺的探測方法。 但是這方面的認知過程仍然比較慢。 ”史建波早在2010年就曾使用點雲的方法進行機器視覺的研究。

他同時指出, 相對於圖片而言, 目前仍然沒有足夠多的點雲資料可以使用, 因此基於點雲做研究限制很大。 史建波說道:“2010年的時候, 很少人能夠從政府以外的機構獲取LiDAR點雲資料, 傳統機器視覺的人認為圖片對於認知已經足夠了, 所以點雲資料和圖片資料不在一個數量級。 直到近期人們開始慢慢地關注到點雲。 ”

目前LiDAR的成本仍然很高,根據掃描線數的不同,16線至64線的LiDAR成本在1萬至8萬美元不等。比如蘋果論文中所闡述的機器視覺的深度學習技術,就是基於最高級別64線LiDAR的三維點雲資料開發,這種LiDAR價格高達7.5萬美元。這也是為什麼在能用攝像頭的情況下,人們不會去使用LiDAR去解決問題,儘管LiDAR的精確度更高。比如英特爾收購的Mobileye就是使用攝像頭的解決方案。

“但是未來LiDAR和攝像頭的邊界會變得模糊,兩者會共存相當長一段時間。二維和三維識別技術也將趨同。”史建波對#Teku特酷#表示,“單線LiDAR已經在很多場合下用到了,比如家用掃地機器人、亞馬遜Kiva倉儲機器人等。”

目前LiDAR的成本仍然很高,根據掃描線數的不同,16線至64線的LiDAR成本在1萬至8萬美元不等。比如蘋果論文中所闡述的機器視覺的深度學習技術,就是基於最高級別64線LiDAR的三維點雲資料開發,這種LiDAR價格高達7.5萬美元。這也是為什麼在能用攝像頭的情況下,人們不會去使用LiDAR去解決問題,儘管LiDAR的精確度更高。比如英特爾收購的Mobileye就是使用攝像頭的解決方案。

“但是未來LiDAR和攝像頭的邊界會變得模糊,兩者會共存相當長一段時間。二維和三維識別技術也將趨同。”史建波對#Teku特酷#表示,“單線LiDAR已經在很多場合下用到了,比如家用掃地機器人、亞馬遜Kiva倉儲機器人等。”

Next Article
喜欢就按个赞吧!!!
点击关闭提示