您的位置:首頁>正文

增強現實正在面臨的3大挑戰(中)

SnailShellVR 11月3日訊(微信號:SnailShellVR)

上期我們分析了增強現實目前面臨的三大挑戰之一——沉浸的視野, 現在我們來談談增強現實的第二大挑戰。

即時對象分類

蘋果的ARKit和穀歌的ARCore技術能讓你在智慧手機上實現一些非常炫麗和新穎的類AR體驗, 但是在大多數情況下, 這些系統僅局限於“理解”地板和牆壁等平面。 這就是為什麼現在iOS上99%的AR應用和演示作品都只能發生在地板或桌子上。

為什麼是地板和牆壁?因為它們很容易分類。 地板或牆壁的平面與另一地板和另一牆壁的平面相同, 所以系統有信心假定這一平面能夠向所有方面延展, 直到與另一平面相交。

注意, 我這裡使用的是“理解”一詞, 而不是“感知”或“檢測”。 這是因為儘管所述系統或許能夠“看到”除地板和牆壁之外的物件形狀, 但目前還無法理解它們。

以杯為例。 當你看著一個杯子時, 你看到的不僅僅是一種形狀。 可以說你對杯子已經非常瞭解。 至於瞭解有多少?我們來看看:

〮你知道杯子與它所在的平面是截然不同的物體

〮你知道杯子裡包含一定的空間, 可以用來容納液體和其他物體

〮你知道人們可以用杯子喝水

〮你知道杯子很容易被打翻, 導致杯內的液體或物體溢出……

當然, 我還可以繼續往下說, 但關鍵是電腦並不知道這一點。 它只能“看到”一個形狀, 而不是一個杯子。 電腦無法得到杯子內部的完整視圖, 也無法映射出完整的形狀, 它甚至不能假定杯子內部存在一定的空間。 換句話說, 電腦不知道杯子是獨立於其所在平面的一個物件。

因此, 讓電腦視覺理解“杯子”, 而不僅僅只是看到一個形狀, 就顯得尤為重要。 這就是為什麼多年以來, 我們在AR演示作品中看到人們把基準標記附加到物件身上, 以便實現更精准的跟蹤和交互。

為什麼會這麼困難呢?第一個挑戰就是分類。 杯子有數千種形狀、大小、顏色和紋理。 一些杯子還具有特殊屬性和特殊用途(如燒杯), 這意味著不同的杯子可以在完全不同的場景和環境下被使用。

試想編寫一個演算法, 可以説明電腦瞭解所有這些概念, 以便能夠在它看到時知道這是一個杯子。 那麼單從眼前來看, 如何編寫代碼向電腦解釋杯子和碗之間的區別就是一個極大的挑戰, 更別說從成千上萬個相當類似的物品中辨識出某個單一的對象了。

儘管目前基於智慧手機的AR發生在你的周圍環境中, 但你卻很難與之交互。 所以我們如今在智慧手機上看到的所有AR體驗都被降格到了地板和牆壁上。 這些系統不可能與我們周圍的世界進行有力的互動, 因為雖然系統能夠“看到”地板和牆壁, 但並不能夠“理解”它們。

對於我們所設想的科幻AR更是如此, 如透過AR眼鏡, 你可以直觀看到杯子裡咖啡的溫度;或者將微波爐的剩餘時間顯示在其上方, 我們需要系統“理解”更多關於我們周圍的世界。

那麼我們如何才能實現呢?答案似乎要涉及所謂的“深度學習”。 用於每種物件類型的手寫分類演算法, 甚至是普通的分類演算法, 都是一項非常複雜的任務。但是我們或許可以訓練電腦的神經網路,把它們設計為隨著時間自動調整程式設計,以準確檢測周圍的許多常見物件。

下一步就是大幅擴展合理的分類庫,然後將這些基於圖像的檢測與從AR跟蹤系統採集到的即時環境映射資料結合起來。一旦讓AR系統“理解”我們周圍的世界,我們就可以著手解決AR體驗的自我調整設計挑戰了。

更多VR/AR/AI新鮮資訊及資源下載敬請關注SNAIL SHELL微信公眾號(微信號:SnailShellVR),回復“我要”有驚喜。

從共用單車、充電寶、雨傘到VR,人類在構築怎樣的共用未來?

成人VR遊戲銷量猛增竟是Oculus Rift大幅降價所致?

增強現實正在面臨的3大挑戰(上)

都是一項非常複雜的任務。但是我們或許可以訓練電腦的神經網路,把它們設計為隨著時間自動調整程式設計,以準確檢測周圍的許多常見物件。

下一步就是大幅擴展合理的分類庫,然後將這些基於圖像的檢測與從AR跟蹤系統採集到的即時環境映射資料結合起來。一旦讓AR系統“理解”我們周圍的世界,我們就可以著手解決AR體驗的自我調整設計挑戰了。

更多VR/AR/AI新鮮資訊及資源下載敬請關注SNAIL SHELL微信公眾號(微信號:SnailShellVR),回復“我要”有驚喜。

從共用單車、充電寶、雨傘到VR,人類在構築怎樣的共用未來?

成人VR遊戲銷量猛增竟是Oculus Rift大幅降價所致?

增強現實正在面臨的3大挑戰(上)

同類文章
Next Article
喜欢就按个赞吧!!!
点击关闭提示