介紹一款基於FPGA的CNN硬體加速器IP

作者:Sleibso，編譯:Stark

隨著人工智慧（AI）的不斷發展，它已經從早期的人工特徵工程進化到現在可以從海量資料中學習，機器視覺、語音辨識以及自然語言處理等領域都取得了重大突破。 CNN（Convolutional Neural Network，卷積神經網路）在人工智慧領域受到越來越多的青睞，它是深度學習技術中極具代表性的網路結構之一，尤其在影像處理領域取得了很大的成功。隨著網路變得越來越大、越來越複雜，我們需要大量的計算資源來對其進行訓練，因此人們紛紛將注意力轉向FPGA（Field Programmable Gate Array，現場可程式設計閘陣列）器件， FPGA不僅具有軟體的可程式設計性和靈活性，

同時又有ASIC高吞吐和低延遲的特性，而且由於具有豐富的I/O介面， FPGA還非常適合用作協定和介面轉換的晶片。

近日KORTIQ公司推出了一款Xilinx FPGA的CNN加速器IP——AIScale，它能夠利用實現訓練好的CNN網路，比如行業標準的ResNet、AlexNet、Tiny Yolo和VGG-16等，並將它們進行壓縮輸出二進位描述檔，可以部署到Xilinx全系列可程式設計邏輯器件上。 Zynq SoC和Zynq UltraScale+ MPSoC器件PS可以提供資料給AIScale CNN加速器（PL），經過分類處理將輸出資料給PS。壓縮後的CNN網路佔用資源相對小很多，可以部署在片上記憶體中，可以更快更靈活的切換CNN網路。

圖1：AIScale在電腦視覺應用案例示意圖

AIScale加速器的核心是AIScale RCC（Re-configurable Compute Core），使用者根據需求可以靈活自訂AIScale RCC模組的數量， AIScale RCC支援卷積預處理、池化/採樣、加權和全連接層等處理。資源更豐富的Zynq SoC和UltraScale+ MPSoC可以集成更多的AIScale RCC模組，這會給AIScale加速器帶來更大的性能提升。當然也可以根據成本、系統功耗、性能需求集成一定的AIScale RCC模組，選擇合適的Xilinx FPGA器件。

圖2：多個 AIScale RCC模組層級聯連接

KORTIQ公司目前專注於嵌入式和電腦視覺領域，設計工業4.0和物聯網（IoT）等，未來將會為AIScale CNN加速器提供更多更先進的特性，比如圖像分類、物體識別和追蹤、人臉和語音辨識、自然語言處理等，將先進的人工智慧網路應用到自動化生產、控制等場景中，提高相關行業的生產力為使用者帶來更好的服務。