您的位置:首頁>科技>正文

如何讓無人機靈活穿越滿是障礙的房間?訓練一個迴圈神經網路試試看

如今, 深度學習已經在語音辨識、電腦視覺等多個應用領域取得了重大突破。 然而, 要說到它在機器人領域的發展, 那就要另當別論了——深度學習在機器人領域, 不僅發展速度慢, 甚至還遭到很多人的質疑。 為什麼呢?

究其原因, 最重要的一點在於所需資料難以共用——將深度學習應用到機器人領域, 涉及到許多具體物理系統的表達。 這意味著, 所需資料往往是機器人領域的特定資料集。 因此, 研究人員在收集資料時, 就要耗費較多時間;而在處理和環境相交互的主動系統時, 則會更加費時。

近日, 來自魯汶大學的兩位研究人員Klaas Kelchtermans和Tinne Tuytelaars就為解決這一問題展開了研究,

並將研究成果撰寫成論文《How hard is it to cross the room ? - Training (Recurrent) Neural Networks to steer a UAV》, 發佈在了arXiv上。 雷鋒網對論文進行了部分編譯。

論文地址:https://arxiv.org/abs/1702.07600

摘要

我們研究了在無人機導航控制中採用迴圈神經網路(RNN)代替前饋神經網路(FNN), 是否能增加其活動的靈活性。 實驗條件是:無人機在執行高級導航任務時, 需要用前視攝像頭收集資訊。

為了讓無人機通過模仿學習學會執行導航任務, 我們建立了一個用來訓練神經網路、可應用於空中和陸地兩種交通工具的通用框架。 實驗中, 我們把框架應用於在模擬環境中飛行的無人機中, 讓它學習如何穿越有多障礙物的房間。

到目前為止, 無人機控制的訓練過程中通常只使用前饋神經網路。

為了處理更多高難度的任務, 我們提出, 引入迴圈神經網路代替前饋神經網路, 並且訓練一個長短期記憶體( LSTM)來控制無人機。

通過視覺資訊進行控制屬於序列預測問題, 並且需要高相關性的輸入資料。 這一高相關性就使得訓練神經網路, 尤其是迴圈神經網路, 變得不容易進行。

為了克服這一問題, 我們在訓練網路時採用了WW-TBPTT法(window-wise truncated backpropagation through time)。 另外, 考慮到端對端訓練所需的資料通常無法獲得, 我們將“只對全連接(FC)進行再訓練的控制層”和“只對長短期記憶體控制層(所需網路為端到端的訓練)進行再訓練的控制層”的表現進行了對比。

最後, 通過讓無人機穿越有障礙物房間這一相對簡單的實驗, 我們已經能看出訓練神經控制網路所具有的重要指導意義和其良好的實踐效果。

視覺化的差異性有助於解釋無人機學習到的行為。

雷鋒網注:此圖為論文中的圖12——平均模仿損失對比圖

實驗變數:已知和未知的房間、無人機用不同構架的神經網路和不同訓練方法進行控制、是否有攝像頭;

S-LSTM 用S-TBPTT訓練、WW-LSTM用WW-TBPTT。

探討和結論

此研究中, 我們測試了在導航控制中, 記憶體(圖12)能如何説明深度神經網路更高效地運作。

結果表明, 用WW-TBPTT去除訓練資料的相關性, 在訓練如長短期記憶體這樣的迴圈神經網路時, 極其有説明。 儘管使用WW-TBPTT 法會使實驗方差增大, 計算存儲值的過程也使訓練變慢(如圖12最右邊一組橫條圖), 但它能通過時間長度有效避免滑動截斷反向傳播的順序偏差(the sequential bias of sliding truncated back propagation)。

另外, 實驗結果表明, 預先訓練網路也非常有意義。 在導航控制試驗中, 僅僅重訓練最後一層卷積網路全連接層(如Inception), 比訓練端對端訓練網路表現更好。 訓練端對端網路不僅需要更多資料, 而且時間也更長。 也正是上述這個原因, 機器人(雷鋒網注:這裡指無人機)在實際應用中才不夠靈活。

我們將公開“穿過房間一”和“穿過房間二”兩次實驗的資料集(它們代表了實驗所需資料的複雜程度), 讓其他研究人員能以此為參考標準, 學習導航控制。

最後, 我們還想強調, 想要打開深度學習這個黑箱子, 差異化評價法和視覺化是非常有必要的。

Next Article
喜欢就按个赞吧!!!
点击关闭提示