作者:Sleibso, 編譯:Stark
隨著人工智慧(AI)的不斷發展, 它已經從早期的人工特徵工程進化到現在可以從海量資料中學習, 機器視覺、語音辨識以及自然語言處理等領域都取得了重大突破。 CNN(Convolutional Neural Network, 卷積神經網路)在人工智慧領域受到越來越多的青睞, 它是深度學習技術中極具代表性的網路結構之一, 尤其在影像處理領域取得了很大的成功。 隨著網路變得越來越大、越來越複雜, 我們需要大量的計算資源來對其進行訓練, 因此人們紛紛將注意力轉向FPGA(Field Programmable Gate Array, 現場可程式設計閘陣列)器件, FPGA不僅具有軟體的可程式設計性和靈活性,
近日KORTIQ公司推出了一款Xilinx FPGA的CNN加速器IP——AIScale, 它能夠利用實現訓練好的CNN網路, 比如行業標準的ResNet、AlexNet、Tiny Yolo和VGG-16等, 並將它們進行壓縮輸出二進位描述檔, 可以部署到Xilinx全系列可程式設計邏輯器件上。 Zynq SoC和Zynq UltraScale+ MPSoC器件PS可以提供資料給AIScale CNN加速器(PL), 經過分類處理將輸出資料給PS。 壓縮後的CNN網路佔用資源相對小很多, 可以部署在片上記憶體中, 可以更快更靈活的切換CNN網路。
圖1:AIScale在電腦視覺應用案例示意圖
AIScale加速器的核心是AIScale RCC(Re-configurable Compute Core), 使用者根據需求可以靈活自訂AIScale RCC模組的數量, AIScale RCC支援卷積預處理、池化/採樣、加權和全連接層等處理。 資源更豐富的Zynq SoC和UltraScale+ MPSoC可以集成更多的AIScale RCC模組, 這會給AIScale加速器帶來更大的性能提升。 當然也可以根據成本、系統功耗、性能需求集成一定的AIScale RCC模組, 選擇合適的Xilinx FPGA器件。
圖2:多個 AIScale RCC模組層級聯連接
KORTIQ公司目前專注於嵌入式和電腦視覺領域, 設計工業4.0和物聯網(IoT)等, 未來將會為AIScale CNN加速器提供更多更先進的特性, 比如圖像分類、物體識別和追蹤、人臉和語音辨識、自然語言處理等, 將先進的人工智慧網路應用到自動化生產、控制等場景中, 提高相關行業的生產力為使用者帶來更好的服務。