增強現實正在面臨的3大挑戰（中）

SnailShellVR 11月3日訊（微信號：SnailShellVR）

上期我們分析了增強現實目前面臨的三大挑戰之一——沉浸的視野，現在我們來談談增強現實的第二大挑戰。

即時對象分類

蘋果的ARKit和穀歌的ARCore技術能讓你在智慧手機上實現一些非常炫麗和新穎的類AR體驗，但是在大多數情況下，這些系統僅局限於“理解”地板和牆壁等平面。這就是為什麼現在iOS上99％的AR應用和演示作品都只能發生在地板或桌子上。

為什麼是地板和牆壁？因為它們很容易分類。地板或牆壁的平面與另一地板和另一牆壁的平面相同，所以系統有信心假定這一平面能夠向所有方面延展，直到與另一平面相交。

注意，我這裡使用的是“理解”一詞，而不是“感知”或“檢測”。這是因為儘管所述系統或許能夠“看到”除地板和牆壁之外的物件形狀，但目前還無法理解它們。

以杯為例。當你看著一個杯子時，你看到的不僅僅是一種形狀。可以說你對杯子已經非常瞭解。至於瞭解有多少？我們來看看：

〮你知道杯子與它所在的平面是截然不同的物體

〮你知道杯子裡包含一定的空間，可以用來容納液體和其他物體

〮你知道人們可以用杯子喝水

〮你知道杯子很容易被打翻，導致杯內的液體或物體溢出……

當然，我還可以繼續往下說，但關鍵是電腦並不知道這一點。它只能“看到”一個形狀，而不是一個杯子。電腦無法得到杯子內部的完整視圖，也無法映射出完整的形狀，它甚至不能假定杯子內部存在一定的空間。換句話說，電腦不知道杯子是獨立於其所在平面的一個物件。

因此，讓電腦視覺理解“杯子”，而不僅僅只是看到一個形狀，就顯得尤為重要。這就是為什麼多年以來，我們在AR演示作品中看到人們把基準標記附加到物件身上，以便實現更精准的跟蹤和交互。

為什麼會這麼困難呢？第一個挑戰就是分類。杯子有數千種形狀、大小、顏色和紋理。一些杯子還具有特殊屬性和特殊用途（如燒杯），這意味著不同的杯子可以在完全不同的場景和環境下被使用。

試想編寫一個演算法，可以説明電腦瞭解所有這些概念，以便能夠在它看到時知道這是一個杯子。那麼單從眼前來看，如何編寫代碼向電腦解釋杯子和碗之間的區別就是一個極大的挑戰，更別說從成千上萬個相當類似的物品中辨識出某個單一的對象了。

儘管目前基於智慧手機的AR發生在你的周圍環境中，但你卻很難與之交互。所以我們如今在智慧手機上看到的所有AR體驗都被降格到了地板和牆壁上。這些系統不可能與我們周圍的世界進行有力的互動，因為雖然系統能夠“看到”地板和牆壁，但並不能夠“理解”它們。

對於我們所設想的科幻AR更是如此，如透過AR眼鏡，你可以直觀看到杯子裡咖啡的溫度；或者將微波爐的剩餘時間顯示在其上方，我們需要系統“理解”更多關於我們周圍的世界。

那麼我們如何才能實現呢？答案似乎要涉及所謂的“深度學習”。用於每種物件類型的手寫分類演算法，甚至是普通的分類演算法，都是一項非常複雜的任務。但是我們或許可以訓練電腦的神經網路，把它們設計為隨著時間自動調整程式設計，以準確檢測周圍的許多常見物件。

下一步就是大幅擴展合理的分類庫，然後將這些基於圖像的檢測與從AR跟蹤系統採集到的即時環境映射資料結合起來。一旦讓AR系統“理解”我們周圍的世界，我們就可以著手解決AR體驗的自我調整設計挑戰了。

更多VR/AR/AI新鮮資訊及資源下載敬請關注SNAIL SHELL微信公眾號（微信號：SnailShellVR），回復“我要”有驚喜。

從共用單車、充電寶、雨傘到VR，人類在構築怎樣的共用未來？

成人VR遊戲銷量猛增竟是Oculus Rift大幅降價所致？

增強現實正在面臨的3大挑戰（上）

都是一項非常複雜的任務。但是我們或許可以訓練電腦的神經網路，把它們設計為隨著時間自動調整程式設計，以準確檢測周圍的許多常見物件。

更多VR/AR/AI新鮮資訊及資源下載敬請關注SNAIL SHELL微信公眾號（微信號：SnailShellVR），回復“我要”有驚喜。

從共用單車、充電寶、雨傘到VR，人類在構築怎樣的共用未來？

成人VR遊戲銷量猛增竟是Oculus Rift大幅降價所致？

增強現實正在面臨的3大挑戰（上）