VConv

近日，德國薩爾大學和馬克斯·普朗克資訊學研究所的研究人員已經加入英特爾，以使用不完整的3D掃描資料來改進數位3D物件創建。 “VConv-DAE”是一種卷積體積自動編碼器，可以從雜訊資料中學習體積表示。

3D掃描具有廣泛的應用範圍，從汽車和航空航天部門的逆向工程，到採集定制足部矯形器的解剖資料，簡單地製作3D列印模型。

但是讓不完整或扭曲的3D掃描生成的資料可能是無效的。這不是偶然的事情：不正確的照明、3D掃描期間的移動以及各種其他因素可能導致生成的3D模型具有嚴重的問題。

解決這些問題的最好辦法當然是通過投資適當的照明設備、穩定的旋轉盤和各種其他工具來消除這些問題。但是當這些選項不可用時，必須探索其他路線。

一個潛在的路線剛剛由一個多技術和廣泛採購的研究人員開發，由來自計算巨頭英特爾和兩個德國研究機構的代表組成：在慕尼克的馬克斯·普朗克資訊學研究所和在索爾布呂肯的薩爾州大學。

這個多學科團隊一起開發了VConv-DAE，一種深體積形狀學習編碼器，通過估計體素佔用網格來學習嘈雜資料的體積表示。

研究人員說，該工具非常適用於在3D掃描應用中可能出現的“挑戰性任務，

如去噪和形狀完成”。

“儘管3D掃描技術近年來取得了重大進展，但數位和自動捕獲真實物體的幾何形狀仍然是一個挑戰， ”馬克斯·普朗克資訊學研究所的“可擴展學習和感知”組織的領導者Mario Fritz說道。

Fritz所說的那種3D掃描設備並不一定是高端設備，而是像微軟Kinect這樣的運動感應輸入裝置，它通常用於微軟Xbox遊戲機上的視頻遊戲。

Kinect硬體的一個缺點是無法準確識別各種紋理。這意味著太反射、斑駁或其他難以辨別的曲面可能會導致3D資料不準確，這可能會影響3D列印。

“由此產生的有缺陷或甚至不完整的三維幾何形狀對於一系列應用程式構成了一個真正的問題，例如在虛擬或增強現實中，

與機器人或3D列印一起工作， ”Fritz說。

為了解決這些問題，新開發的VConv-DAE工具使用特殊的深度學習神經網路從不完整的資料集中生成3D模型。

根據研究人員的說法，編碼器成功的秘訣在於避免使用標籤分配每個物件的直觀錯誤：“培訓以及由此產生的代表性與物件標籤的概念有著強烈和不必要的聯繫， ”他們說，他們的體素佔用網格估計方法工作非常好。

有趣的是，新技術提供了“用於分類的競爭性能”，同時也為形狀插值提供了有希望的結果。

最終，這可能有助於新一代的3D掃描工具，允許像Kinect這樣的簡單硬體生成高精度的3D資料，而不會丟失任何資訊。

就職于薩爾大學電腦圖形學教授和德國人工智慧研究中心（DFKI）的Philipp Slusallek說， “將來必須能夠快速捕捉現實世界中的物體，

並以現實的方式將其投射到數位世界中。 ”

Slusallek是歐洲聯合研究專案“分散式3D物件設計”（DISPORO）的領先人物。 DISTRO是一個將歐洲視覺計算和3D電腦圖形領先實驗室聯合在一起的網路，目的是在分散式3D物件設計、定制和製作領域培養新一代科學家、技術人員和企業家。