華文網

2017年全球及中國人工智慧晶片行業前景研究報告

一、人工智慧的高速發展催生AI晶片

隨著大資料的發展,計算能力的提升,人工智慧近兩年迎來了新一輪的爆發。而人工智慧的實現依賴三個要素:演算法是核心,硬體和資料是基礎,

晶片就是硬體的最重要組成部分。它其實包括兩個計算過程:1、訓練(Train);2、應用(Inference)。

為什麼需要人工智慧晶片?神經網路演算法應用的不斷發展,使得傳統的 CPU 已經無法負擔幾何級增長的計算量。深度學習作為機器學習的分支,是當前人工智慧研究的主流方式。簡單說就是用數學方法類比人腦神經網路,用大量資料訓練機器來類比人腦學習過程,其本質是把傳統演算法問題轉化為資料和計算問題。

所以對底層基礎晶片的要求也發生了根本性改變:人工智慧晶片的設計目的不是為了執行指令,而是為了大量資料訓練和應用的計算。

AI晶片的誕生之路

二、人工智慧晶片三種技術路線分析

目前適合深度學習的人工智慧晶片主要有GPU、FPGA、ASIC三種技術路線。三類晶片代表分別有英偉達(NVIDIA)的Tesla系列GPU、賽靈思(Xilinx)的FPGA和Google的TPU。GPU 最先被引入深度學習,技術最為成熟;FPGA具有硬體可程式設計特點,

性能出眾但壁壘高。ASCI 由於可定制、低成本是未來終端應用的趨勢。

1、DPU

GPU使用SIMD(單指令多資料流程)來讓多個執行單元以同樣的步伐來處理不同的資料,原本用於處理圖像資料,但其離散化和分散式的特徵,以及用矩陣運算替代布耳運算適合處理深度學習所需要的非線性離散資料。作為加速器的使用,可以實現深度學習演算法。

GPU由平行計算單元和控制單元以及存儲單元構成GPU擁有大量的核(多達幾千個核)和大量的高速記憶體,

擅長做類似影像處理的平行計算,以矩陣的分散式形式來實現計算。同CPU不同的是,GPU的計算單元明顯增多,特別適合大規模平行計算。

GPU與CPU的比較

2、FPGA

FPGA是用於解決專用積體電路的一種方案。

專用積體電路是為特定使用者或特定電子系統製作的積體電路。人工智慧演算法所需要的複雜並行電路的設計思路適合用FPGA實現。FPGA計算晶片佈滿“邏輯單元陣列”,內部包括可配置邏輯模組,輸入輸出模組和內部連線三個部分,相互之間既可實現組合邏輯功能又可實現時序邏輯功能的獨立基本邏輯單元。

FPGA相對於CPU與GPU有明顯的能耗優勢,主要有兩個原因。

首先,在FPGA中沒有取指令與指令解碼操作,在Intel的CPU裡面,由於使用的是CISC架構,僅僅解碼就占整個晶片能耗的50%;在GPU裡面,取指令與解碼也消耗了10%~20%的能耗。其次,FPGA的主頻比CPU與GPU低很多,通常CPU與GPU都在1GHz到3GHz之間,而FPGA的主頻一般在500MHz以下。如此大的頻率差使得FPGA消耗的能耗遠低於CPU與GPU。

3、ASIC

ASIC(專用定制晶片)是為實現特定要求而定制的晶片,具有功耗低、可靠性高、性能高、體積小等優點,但不可程式設計,可擴展性不及FPGA,尤其適合高性能/低功耗的移動端。

目前,VPU和TPU都是基於ASIC架構的設計。針對圖像和語音這兩方面的人工智慧定制晶片,目前主要有專用於影像處理的VPU,以及針對語音辨識的FAGA和TPU晶片。

圖像應用和語音應用人工智慧定制晶片

三、全球人工智慧晶片行業發展現狀

1、全球人工智慧晶片行業規模分析

2016年人工智慧晶片市場規模達到6億美金,預計到2022年將達到60億美金,年複合增長率達到46.7%,增長迅猛,發展空間巨大。

2、全球人工智慧晶片行業格局分析

2016年成為晶片企業和互聯網巨頭們在晶片領域全面展開部署的一年。而在這其中,英偉達保持著絕對的領先地位。但隨著包括穀歌、臉書、微軟、亞馬遜以及百度在內的巨頭相繼加入決戰,人工智慧領域未來的格局如何,仍然待解。

從雲端晶片來看,目前GPU佔據雲端人工智慧主導市場,占人工智慧晶片市場份額的35%。而在這其中,GPU的領跑者英偉達(Nvidia)因其在人工智慧領域的優勢使其成為了資本市場的絕對寵兒:在過去的一年中,曾經以遊戲晶片見長的Nvidia股價從十幾年的穩居30美元迅速飆升至120美元。據悉,世界上目前約有3000多家AI初創公司,大部分都採用了Nvidia提供的硬體平臺。

互聯網和晶片行業巨頭紛紛佈局 AI晶片領域

3、FPGA潛力被低估了,未來大有可為

演算法正向有利於FPGA發展的方向反覆運算。模型壓縮是從訓練環節走向推理環節的必要過程。深鑒科技在將LSTM模型的尺寸壓縮20倍後,採用了搭建在FPGA上的硬體框架ESE,獲得了高一個數量級的能量效率提升。能量效率分別為CPU的40倍和GPU的11.5倍。

FPGA受益於晶片NRE費用指數級上升帶來的規模效應。隨著制程工藝不斷提高,晶片NRE費用指數級上升,越來越多的ASIC晶片將由於達不到規模經濟而被迫放棄,從而轉向直接基於FPGA開發設計。

四、中國人工智慧晶片行業發展現狀

1、我國人工智慧晶片行業正處於起步階段

目前,我國的人工智慧晶片行業發展尚處於起步階段。華為在2017年德國柏林國際消費類電子產品展覽會發佈華為首款人工智慧( AI)移動計算平臺——麒麟 970,是業界首顆帶有獨立 NPU(神經網路單元)的手機晶片,是華為人工智慧的重要里程碑,也是中國晶片設計行業的重要里程碑。

2、我國人工智慧晶片行業規模分析

隨著大資料的發展,計算能力的提升,人工智慧近兩年迎來了新一輪的爆發。晶片約占人工智慧比重的15%,結合我國人工智慧市場規模,推算出2016年我國人工智慧晶片市場規模約為20億元。

3、我國人工智慧晶片行業區域發展分析

據工信部統計,中國北上深三座城市的人工智慧相關企業總數達447家,攀升速度迅猛。目前,幾乎所有互聯網企業的互聯網產品,都會或多或少加入演算法和深度學習的功能,AI正在成為中國互聯網公司的標配。

五、科技巨頭紛紛佈局人工智慧晶片領域

全球科技巨頭都在加緊佈局AI晶片,希望走在科技變革時代的前線。

NVIDIA是AI晶片的市場領先者,佔據了全球GPU70%的市場份額;Intel接連收購Altera、Nervana、Movidius,全方位佈局AI產品;Google發佈兩代TPU,從ASIC方向進軍AI晶片市場;寒武紀科技是中科院計算所孵化的一家獨角獸公司。2016年推出了國際首個深度學習專用處理器晶片(NPU),技術全球領先。

1、NVIDIA:GPU龍頭,AI晶片的市場領先者

目前全球GPU行業的市場份額有超過70%被英偉達公司佔據。而應用在人工智慧領域的可進行通用計算的GPU市場則基本被英偉達公司壟斷。

自1999年發佈第一款GPU以來,GPU就成為了英偉達最為核心的產品,占到了英偉達總營業收入的八成以上。英偉達的股價表現也是十分驚人,2016年英偉達的股價上漲了228%,過去的5年內累計上漲500%。

目前英偉達GPU晶片主要應用方向為資料中心晶片、自動駕駛晶片和嵌入式晶片。主要包括採用Pascal架構的TeslaP100和TeslaP10晶片、採用Volta架構的DGX-1晶片、自動駕駛的DriverPX2晶片、JetsonTX2晶片等。

GPU晶片構成公司最主要收入來源,2017年上半年,GPU貢獻收入34.59億美元,占公司總收入的83%;TegraProcessor貢獻收入6.65億美元,占比16%,其他部分貢獻收入1%。

2、Intel:全領域佈局人工智慧產品

2015年,英特爾以167億美元收購了FPGA製造商Altera。英特爾斥鉅資收購Altera不是來為FPGA技術發展做貢獻的,而是要讓FPGA技術為英特爾的發展做貢獻。

2016年8月,Intel宣佈收購創業公司NervanaSystems。Nervana準備推出深度學習定制晶片NervanaEngine,相比GPU在訓練方面可以提升10倍性能。與TeslaP100類似,該晶片也利用16-bit半精度浮點計算單元和大容量高頻寬記憶體(HBM,計畫為32GB,是競品P100的兩倍),摒棄了大量深度學習不需要的通用計算單元。

Intel人工智慧佈局

3、Google:發佈兩代TPU,從ASIC方向進軍AI晶片市場

第一代TPU展現出ASIC在神經網路推斷方面的優秀性能。穀歌在2016年的I/O大會上推出了自己的AI晶片——張量處理器TPU(第一代)。

第二代TPU兼具推理+訓練。2017年5月I/O大會上,穀歌發佈了第二代TPU—CloudTPU,峰值性能達到180TFLOPS/s。第一代TPU只加速推理,但第二代TPU新增了訓練的功能。不僅如此,穀歌的用戶還能通過專門的網路,在雲端利用TPU構建機器學習的超級電腦。

Google公司TPU架構

4、寒武紀:在國際上開創了深度學習處理器方向

寒武紀科技由創始人陳天石教授帶領中科院團隊成立於2016年,致力於打造各類智慧雲伺服器、智慧終端機以及智慧型機器人的核心處理器晶片。

2016年推出的寒武紀1A處理器(Cambricon-1A)是世界首款商用深度學習專用處理器,其搭載了國際首個深度學習專用處理器晶片(NPU)(屬於ASIC),面向智慧手機、安防監控、可穿戴設備、無人機和智慧駕駛等各類終端設備,並於2017年8月獲得了包括阿裡在內的1億美元A輪融資。

寒武紀1號晶片和同期主流晶片對比

目前寒武紀主要包括三條產品線:

(1)智慧終端機處理器IP授權:智慧IP指令集可授權集成到手機、安防、可穿戴設備等終端晶片中,客戶包括國內頂尖SoC廠商。

(2)智慧雲伺服器晶片:作為PCIE加速卡插在雲伺服器上,客戶主要是國內的知名伺服器廠商。

(3)家用智慧服務機器人晶片:從智慧玩具、智慧助手入手,使服務機器人獨立具備看聽說的能力。客戶是各類下游機器人廠商,產品的推出將比智慧雲伺服器晶片更晚一些。

中國正在發力人工智慧晶片,以縮小與全球科技巨頭的差距。

尤其適合高性能/低功耗的移動端。

目前,VPU和TPU都是基於ASIC架構的設計。針對圖像和語音這兩方面的人工智慧定制晶片,目前主要有專用於影像處理的VPU,以及針對語音辨識的FAGA和TPU晶片。

圖像應用和語音應用人工智慧定制晶片

三、全球人工智慧晶片行業發展現狀

1、全球人工智慧晶片行業規模分析

2016年人工智慧晶片市場規模達到6億美金,預計到2022年將達到60億美金,年複合增長率達到46.7%,增長迅猛,發展空間巨大。

2、全球人工智慧晶片行業格局分析

2016年成為晶片企業和互聯網巨頭們在晶片領域全面展開部署的一年。而在這其中,英偉達保持著絕對的領先地位。但隨著包括穀歌、臉書、微軟、亞馬遜以及百度在內的巨頭相繼加入決戰,人工智慧領域未來的格局如何,仍然待解。

從雲端晶片來看,目前GPU佔據雲端人工智慧主導市場,占人工智慧晶片市場份額的35%。而在這其中,GPU的領跑者英偉達(Nvidia)因其在人工智慧領域的優勢使其成為了資本市場的絕對寵兒:在過去的一年中,曾經以遊戲晶片見長的Nvidia股價從十幾年的穩居30美元迅速飆升至120美元。據悉,世界上目前約有3000多家AI初創公司,大部分都採用了Nvidia提供的硬體平臺。

互聯網和晶片行業巨頭紛紛佈局 AI晶片領域

3、FPGA潛力被低估了,未來大有可為

演算法正向有利於FPGA發展的方向反覆運算。模型壓縮是從訓練環節走向推理環節的必要過程。深鑒科技在將LSTM模型的尺寸壓縮20倍後,採用了搭建在FPGA上的硬體框架ESE,獲得了高一個數量級的能量效率提升。能量效率分別為CPU的40倍和GPU的11.5倍。

FPGA受益於晶片NRE費用指數級上升帶來的規模效應。隨著制程工藝不斷提高,晶片NRE費用指數級上升,越來越多的ASIC晶片將由於達不到規模經濟而被迫放棄,從而轉向直接基於FPGA開發設計。

四、中國人工智慧晶片行業發展現狀

1、我國人工智慧晶片行業正處於起步階段

目前,我國的人工智慧晶片行業發展尚處於起步階段。華為在2017年德國柏林國際消費類電子產品展覽會發佈華為首款人工智慧( AI)移動計算平臺——麒麟 970,是業界首顆帶有獨立 NPU(神經網路單元)的手機晶片,是華為人工智慧的重要里程碑,也是中國晶片設計行業的重要里程碑。

2、我國人工智慧晶片行業規模分析

隨著大資料的發展,計算能力的提升,人工智慧近兩年迎來了新一輪的爆發。晶片約占人工智慧比重的15%,結合我國人工智慧市場規模,推算出2016年我國人工智慧晶片市場規模約為20億元。

3、我國人工智慧晶片行業區域發展分析

據工信部統計,中國北上深三座城市的人工智慧相關企業總數達447家,攀升速度迅猛。目前,幾乎所有互聯網企業的互聯網產品,都會或多或少加入演算法和深度學習的功能,AI正在成為中國互聯網公司的標配。

五、科技巨頭紛紛佈局人工智慧晶片領域

全球科技巨頭都在加緊佈局AI晶片,希望走在科技變革時代的前線。

NVIDIA是AI晶片的市場領先者,佔據了全球GPU70%的市場份額;Intel接連收購Altera、Nervana、Movidius,全方位佈局AI產品;Google發佈兩代TPU,從ASIC方向進軍AI晶片市場;寒武紀科技是中科院計算所孵化的一家獨角獸公司。2016年推出了國際首個深度學習專用處理器晶片(NPU),技術全球領先。

1、NVIDIA:GPU龍頭,AI晶片的市場領先者

目前全球GPU行業的市場份額有超過70%被英偉達公司佔據。而應用在人工智慧領域的可進行通用計算的GPU市場則基本被英偉達公司壟斷。

自1999年發佈第一款GPU以來,GPU就成為了英偉達最為核心的產品,占到了英偉達總營業收入的八成以上。英偉達的股價表現也是十分驚人,2016年英偉達的股價上漲了228%,過去的5年內累計上漲500%。

目前英偉達GPU晶片主要應用方向為資料中心晶片、自動駕駛晶片和嵌入式晶片。主要包括採用Pascal架構的TeslaP100和TeslaP10晶片、採用Volta架構的DGX-1晶片、自動駕駛的DriverPX2晶片、JetsonTX2晶片等。

GPU晶片構成公司最主要收入來源,2017年上半年,GPU貢獻收入34.59億美元,占公司總收入的83%;TegraProcessor貢獻收入6.65億美元,占比16%,其他部分貢獻收入1%。

2、Intel:全領域佈局人工智慧產品

2015年,英特爾以167億美元收購了FPGA製造商Altera。英特爾斥鉅資收購Altera不是來為FPGA技術發展做貢獻的,而是要讓FPGA技術為英特爾的發展做貢獻。

2016年8月,Intel宣佈收購創業公司NervanaSystems。Nervana準備推出深度學習定制晶片NervanaEngine,相比GPU在訓練方面可以提升10倍性能。與TeslaP100類似,該晶片也利用16-bit半精度浮點計算單元和大容量高頻寬記憶體(HBM,計畫為32GB,是競品P100的兩倍),摒棄了大量深度學習不需要的通用計算單元。

Intel人工智慧佈局

3、Google:發佈兩代TPU,從ASIC方向進軍AI晶片市場

第一代TPU展現出ASIC在神經網路推斷方面的優秀性能。穀歌在2016年的I/O大會上推出了自己的AI晶片——張量處理器TPU(第一代)。

第二代TPU兼具推理+訓練。2017年5月I/O大會上,穀歌發佈了第二代TPU—CloudTPU,峰值性能達到180TFLOPS/s。第一代TPU只加速推理,但第二代TPU新增了訓練的功能。不僅如此,穀歌的用戶還能通過專門的網路,在雲端利用TPU構建機器學習的超級電腦。

Google公司TPU架構

4、寒武紀:在國際上開創了深度學習處理器方向

寒武紀科技由創始人陳天石教授帶領中科院團隊成立於2016年,致力於打造各類智慧雲伺服器、智慧終端機以及智慧型機器人的核心處理器晶片。

2016年推出的寒武紀1A處理器(Cambricon-1A)是世界首款商用深度學習專用處理器,其搭載了國際首個深度學習專用處理器晶片(NPU)(屬於ASIC),面向智慧手機、安防監控、可穿戴設備、無人機和智慧駕駛等各類終端設備,並於2017年8月獲得了包括阿裡在內的1億美元A輪融資。

寒武紀1號晶片和同期主流晶片對比

目前寒武紀主要包括三條產品線:

(1)智慧終端機處理器IP授權:智慧IP指令集可授權集成到手機、安防、可穿戴設備等終端晶片中,客戶包括國內頂尖SoC廠商。

(2)智慧雲伺服器晶片:作為PCIE加速卡插在雲伺服器上,客戶主要是國內的知名伺服器廠商。

(3)家用智慧服務機器人晶片:從智慧玩具、智慧助手入手,使服務機器人獨立具備看聽說的能力。客戶是各類下游機器人廠商,產品的推出將比智慧雲伺服器晶片更晚一些。

中國正在發力人工智慧晶片,以縮小與全球科技巨頭的差距。