您的位置:首頁>正文

介紹一款基於FPGA的CNN硬體加速器IP

作者:Sleibso, 編譯:Stark

隨著人工智慧(AI)的不斷發展, 它已經從早期的人工特徵工程進化到現在可以從海量資料中學習, 機器視覺、語音辨識以及自然語言處理等領域都取得了重大突破。 CNN(Convolutional Neural Network, 卷積神經網路)在人工智慧領域受到越來越多的青睞, 它是深度學習技術中極具代表性的網路結構之一, 尤其在影像處理領域取得了很大的成功。 隨著網路變得越來越大、越來越複雜, 我們需要大量的計算資源來對其進行訓練, 因此人們紛紛將注意力轉向FPGA(Field Programmable Gate Array, 現場可程式設計閘陣列)器件, FPGA不僅具有軟體的可程式設計性和靈活性,

同時又有ASIC高吞吐和低延遲的特性, 而且由於具有豐富的I/O介面, FPGA還非常適合用作協定和介面轉換的晶片。

近日KORTIQ公司推出了一款Xilinx FPGA的CNN加速器IP——AIScale, 它能夠利用實現訓練好的CNN網路, 比如行業標準的ResNet、AlexNet、Tiny Yolo和VGG-16等, 並將它們進行壓縮輸出二進位描述檔, 可以部署到Xilinx全系列可程式設計邏輯器件上。 Zynq SoC和Zynq UltraScale+ MPSoC器件PS可以提供資料給AIScale CNN加速器(PL), 經過分類處理將輸出資料給PS。 壓縮後的CNN網路佔用資源相對小很多, 可以部署在片上記憶體中, 可以更快更靈活的切換CNN網路。

圖1:AIScale在電腦視覺應用案例示意圖

AIScale加速器的核心是AIScale RCC(Re-configurable Compute Core), 使用者根據需求可以靈活自訂AIScale RCC模組的數量, AIScale RCC支援卷積預處理、池化/採樣、加權和全連接層等處理。 資源更豐富的Zynq SoC和UltraScale+ MPSoC可以集成更多的AIScale RCC模組, 這會給AIScale加速器帶來更大的性能提升。 當然也可以根據成本、系統功耗、性能需求集成一定的AIScale RCC模組, 選擇合適的Xilinx FPGA器件。

圖2:多個 AIScale RCC模組層級聯連接

KORTIQ公司目前專注於嵌入式和電腦視覺領域, 設計工業4.0和物聯網(IoT)等, 未來將會為AIScale CNN加速器提供更多更先進的特性, 比如圖像分類、物體識別和追蹤、人臉和語音辨識、自然語言處理等, 將先進的人工智慧網路應用到自動化生產、控制等場景中, 提高相關行業的生產力為使用者帶來更好的服務。

同類文章
Next Article
喜欢就按个赞吧!!!
点击关闭提示