您的位置:首頁>數碼>正文

三星將推首款AI晶片NPU,性能超華為蘋果,智慧終端機AI芯大PK

新智元報導

新智元編輯部

【新智元導讀】作為AI晶片後入者的三星正提著大刀趕來:據外媒爆料, 三星已經接近完成一款AI晶片的研發,

其性能已經堪比蘋果的A11和華為麒麟970, 三星極有可能在2月25日舉行的MWC 2018大會上發佈Galaxy S9的同時, 展示其新AI技術的能力。

據《韓國先驅報》網站報導, 三星電子已經基本完成第一款神經處理單元(NPU)的開發工作, 準備在今年晚些時候部署到設備上。 NPU被廣泛稱為AI晶片,

據稱三星將在即將發佈的智能手機上搭載這款晶片, 此舉有助於其手機趕超競爭對手。

“據三星內部人士爆料, 三星已經基本完成了伺服器AI晶片的開發工作, 預計該晶片將出售給伺服器廠商。 ”一名AI專家告訴《韓國先驅報》。

除了CPU、GPU等之外, 智能手機上再加上NPU的話, 手機本身就可以在沒有雲伺服器説明的情況下處理、分析和存儲智慧手機上產生的資料。 NPU被廣泛認為是智慧手機的大腦。

目前, 三星在這個領域落後于蘋果和華為這兩個最大的競爭對手, 後兩者都已經推出了移動端的AI晶片。 蘋果公司去年發佈了iPhone X, 使用NPU實現臉部識別和動畫表情符號等人們熟知的功能。 緊接著, 華為推出了一款能夠隨時間學習用戶習慣的NPU,

部署在Mate 10 Pro手機上。

儘管三星對於這個市場是後來者, 但那位“AI專家”對韓國先驅報稱, “三星已經達到蘋果和華為的技術水準, 而且在今年下半年肯定會推出更好的晶片。 ”據報導, 三星的晶片每秒運行的速度超過了蘋果的A11和華為的麒麟970。

此外, 同一消息人士透露, 三星可能將在2月25日舉行的MWC 2018大會上發佈Galaxy S9的同時, 展示其新AI技術的能力。

據稱三星在人工智慧相關項目上投入了大量資金, 並與韓國各大學的教授和研究人員合作, 以製造出相比競爭對手更安全、更高效的晶片。

該消息人士透露, 三星還正在為Galaxy Note 9智慧手機開發一款增強的NPU, 該款手機預計在今年9月份發佈。 就像之前的Galaxy Note 7和Note 8一樣, Note 9可能成為三星的一個轉捩點。

AI手機進入戰國時代,

晶片研發馬太效應漸顯

正如上文所說, 三星的這款AI晶片, 主要的競爭對手是蘋果和華為。 目前, 蘋果的iPhoneX和華為的Mate10(Pro)、V10等系列手機均已經使用人工智慧晶片, 成為AI手機的領導者。

iPhone X中的“A11生物神經網路引擎”(A11 bionic neural engine)晶片, 每秒運算次數最高可達6000億次, 相當於0.6TFlops(寒武紀NPU則是1.92TFlops, 每秒可以進行19200次浮點運算), 採用了六核心設計, 由2個高性能核心與4個高能效核心組成。 相比A10, 其中兩個性能核心的速度提升了25%, 四個能效核心的速度提升了70%。 工藝方面, A11採用了台積電10nm FinFET工藝, 集成了43億個電晶體。

A11能説明加速人工智慧任務, 包括Face ID, Animoji和AR應用程式。 A11同時支持Core ML, 這是蘋果在WWDC開發者大會上推出的一款新型機器學習框架。 Core ML支援所有主要的神經網路, 如DNN、RNN、CNN等, 開發者可以把訓練完成的機器學習模型封裝進App之中。

華為麒麟970晶片, 首次採用台積電10nm工藝, 集成55億個電晶體(驍龍835是31億顆, 蘋果A10是33億顆), 功耗降低20%。 採用4個Cortex A73 核心, 4個Cortex A53 核心, GPU為具有12個核心的 Mali-G72 MP12, 每秒處理速度可達萬億次。 麒麟970晶片內置全新升級自研相機雙ISP, 支持人工智慧場景識別、人臉追焦、智慧運動場景檢測, 同時夜拍效果再次升級。 基帶方面, 麒麟970採用了更先進的4.5G LTE技術, 支援全球最高是LTE Cat.18規格, 實現目前業界最高的1.2Gbps峰值下載速率。 同時內建TEE和inSE安全引擎, 擁有更高的安全性。

不過, 三星、蘋果、華為“三國殺”的局面不會持續很久。

由於智慧手機的競爭進入到嚴重的同質化階段, 跟全面屏一樣, 人工智慧晶片將會是手機廠商下一個“標配”的重點。 除了三星、蘋果、華為三巨頭,還有很多廠商湧入智慧手機和AI晶片的競爭,例如最近傳聞將於2018年下半年上市的小米——2017年2月,小米自主研發的手機晶片澎湃S1問世,成為國產手機中第二家擁有自主研發晶片能力的手機廠商。

人工智慧晶片對手機性能提升、人機交互等功能上有巨大的想像空間,AI手機特別是高端旗艦AI手機的研發能力是能夠拉開與對手差距的重要一步,手機市場格局也會隨著研發能力逐漸分化,強者更強,弱者更弱的馬太效應將逐漸凸顯。

移動端AI晶片,誰能笑到最後?

由於GPU存在功耗瓶頸,同時使用者越來越關心個人隱私安全與時效性,終端智慧晶片的發展順應時代所需。

終端的智慧晶片則需要同時具備高性能與低功耗的特徵。此外,終端也涵蓋了不同的應用場景,都需要針對具體需求,在功耗、延遲、資料輸送量、加速器方案的選擇上做出調整和優化。

新智元對部分移動端能夠支撐AI功能的晶片做了梳理:

穀歌:Pixel VisualCore

2017年10月,Google在其官方博客上公開了Pixel2中使用的一顆專用影像處理輔助處理器——Pixel VisualCore。這是Google在用於伺服器的TPU之後推出的第二顆晶片,這次針對的是移動端。Pixel VisualCore由Google與Intel合作設計開發,主要用於影像處理和機器學習。這塊晶片由8個IPU(每個包含512個ALU)+1個Cortex-A53核心組成,最大可提供3TFLOPS浮點運算能力。

高通:驍龍845處理器

說到手機晶片,怎能不提高通。高通在2017年12月初正式發佈了驍龍845移動平臺。驍龍845處理器採用10納米LPP制程工藝,其中GPU採用Adreno 630,X20 LTE數據機、WiFi、影像方面使用Spectra 280ISP,以及Hexagon 685DSP輔助處理器、音質方面使用高通Aqstic Audio、CPU採用四個2.8GHz大核+四個1.8GHz小核+2MB緩存的Kryo 385 CPU、移動安全晶片,另在845中新增了一塊獨立記憶體。AI方面,驍龍845主要通過Kryo 385定制架構、Adreno 630、Hexagon 685在終端非同步運算資料。相比835,驍龍845在AI上的計算能力是835的三倍,目前已經可以支援S845GoogleTensorFlow、Facebook Caffe以及Open NeuralNetwork Exchange在內的多款主流深度學習框架。

Movidius VPU Myriad2

2016年9月,Intel發表聲明收購了Movidius。Movidius專注於研發高性能視覺處理晶片。現任CEO是原來德州儀器OMAP部門的總經理,它的技術指導委員會也是實力強大,擁有半導體和處理器行業的元老級人物——被蘋果收購的 P.A.Semi 創始人丹尼爾·多伯普爾(Daniel Dobberpuhl),卡內基梅隆大學電腦科學/電腦視覺專家金出武雄,以及前蘋果 iPhone 和 iPod 部門工程副總裁、資深工程師大衛·圖普曼(David Tupman)三人坐鎮。

其最新一代的Myriad2視覺處理器主要由SPARC處理器作為主控制器,加上專門的DSP處理器和硬體加速電路來處理專門的視覺和圖像信號。這是一款以DSP架構為基礎的視覺處理器,在視覺相關的應用領域有極高的能耗比,可以將視覺計算普及到幾乎所有的嵌入式系統中。該晶片已被大量應用在Google 3D專案Tango手機、大疆無人機、FLIR智慧紅外攝像機、海康深眸系列攝像機、華睿智能工業相機等產品中。

寒武紀 1H8和1H16

寒武紀於2016年發佈了全球首款商用深度學習專用處理器IP——寒武紀1A處理器。寒武紀1A的橫空出世打破了多項記錄,受到了業界廣泛關注,入選了第三屆世界互聯網大會評選的十五項“世界互聯網領先科技成果”。2017年11月,在公司首次發佈會上,CEO陳天石介紹了三款全新的智慧處理器IP產品,其中就包括面向低功耗場景視覺應用的寒武紀1H8、擁有更廣泛通用性和更高性能的寒武紀1H16。

陳天石介紹說,與寒武紀1A相比,新品在功耗、能效比、成本開銷等方面進行了優化,性能功耗比再次實現飛躍,適用範圍覆蓋了圖像識別、安防監控、智慧駕駛、無人機、語音辨識、自然語言處理等各個重點應用領域。

地平線旭日和征程

2017年12月20日,地平線在北京舉行發佈會,推出的征程(Journey)和旭日(Sunrise)兩款面向電腦視覺的處理器,分別用於無人駕駛和智慧攝像頭。旭日和征程都屬於嵌入式人工智慧視覺晶片,分別面向智慧駕駛和智慧攝像頭。地平線首席晶片架構師周峰對新智元介紹,這兩款晶片,晶片性能可達到1Tops,即時處理1080P@30幀,每幀可同時對200個目標進行檢測、跟蹤、識別。 典型功耗做到1.5w。

深鑒聽濤

2017年10月24日,深鑒科技召開發佈會,正式對外宣佈完成約4000萬美元A+輪融資,由螞蟻金服與三星風投領投。CEO姚頌還公佈了一系列晶片計畫,由深鑒自主研發的晶片“聽濤”、“觀海”將於2018年第三季度上市。

其中,“聽濤”將於2018年上半年完成產品裝載,該系列晶片採用台積電28納米制程,核心使用深鑒自己的亞里斯多德架構,峰值性能1.1瓦 4.1 TOPS。亞里斯多德架構針對卷積神經網路而設計。目前,卷積神經網路一般用來處理圖像相關的智慧問題,而此架構靈活與可擴展的特性使它可被應用於各種不同規格的終端中。

異構智能:NovuTensor

在今年 CES 上,NovuMind(中文名稱“異構智慧”)向業界首次展示其自主研發的第一款高性能、低功耗的 AI 晶片 NovuTensor,號稱可能是除了 TPU 之外,世界上跑得最快的單晶片。

NovuMind 方面表示,這是截至目前世界上唯一能夠實際運行的、性能達到主流 GPU/TPU 水準而性能/功耗比卻遠超主流 GPU/TPU 的晶片——在功耗 12w 的情況下,NovuTensor 每秒可識別 300 張圖像,每張圖像上,最多可檢測 8192 個目標,相比目前最先進的桌面伺服器 GPU(250W,每秒可識別 666 張圖像),僅使用 1/20 電力即可達到其性能的 1/2;而相比目前最先進的移動端或嵌入式晶片,相同用電的情況下,性能是其三倍以上。據瞭解,本次 CES 展示的僅僅是 FPGA 版本,等正在流片的 ASIC 晶片正式出廠,性能將提高 4 倍,耗電將減少一半,耗能不超過 5 瓦、可進行 15 萬億次運算的超高性能。

GTI 光矛處理器

成立於2017年初的Gyrfalcon Technology Inc.(簡稱GTI)近期以“光矛處理器 Lightspeeur 2801S”引發業內關注,這也是一家由中國晶片老兵創立的公司,總部位於美國矽谷。其晶片方案基於APiM架構,有28000個並行神經計算核,真正支援片上並行與原位計算,不需要使用外部存儲單元,克服了由記憶體頻寬而導致的性能瓶頸,在效率能耗比方面表現卓越,達到9.3Tops/Watt,無論在訓練模式還是推理模式下均可提供高密度計算性能。

在今年的CES上,GTI推出了內置Lightspeeur 2801S晶片的Laceli 人工智慧計算棒,可以在1瓦的功率下提供超過每秒9.3萬億次浮點運算的性能,超越英特爾Movidius的神經計算棒,後者每瓦功率範圍的運算力則是0.1萬億次。Laceli 人工智慧計算棒可以在多種深度學習場景中應用,包括圖像和視頻識別、理解及描述, 自然語言理解、自然語言處理等。

新智元AI技術+產業社群招募中,歡迎對AI技術+產業落地感興趣的同學,加小助手微信號: aiera2015_1 入群;通過審核後我們將邀請進群,加入社群後務必修改群備註(姓名-公司-職位;專業群審核較嚴,敬請諒解)。

除了三星、蘋果、華為三巨頭,還有很多廠商湧入智慧手機和AI晶片的競爭,例如最近傳聞將於2018年下半年上市的小米——2017年2月,小米自主研發的手機晶片澎湃S1問世,成為國產手機中第二家擁有自主研發晶片能力的手機廠商。

人工智慧晶片對手機性能提升、人機交互等功能上有巨大的想像空間,AI手機特別是高端旗艦AI手機的研發能力是能夠拉開與對手差距的重要一步,手機市場格局也會隨著研發能力逐漸分化,強者更強,弱者更弱的馬太效應將逐漸凸顯。

移動端AI晶片,誰能笑到最後?

由於GPU存在功耗瓶頸,同時使用者越來越關心個人隱私安全與時效性,終端智慧晶片的發展順應時代所需。

終端的智慧晶片則需要同時具備高性能與低功耗的特徵。此外,終端也涵蓋了不同的應用場景,都需要針對具體需求,在功耗、延遲、資料輸送量、加速器方案的選擇上做出調整和優化。

新智元對部分移動端能夠支撐AI功能的晶片做了梳理:

穀歌:Pixel VisualCore

2017年10月,Google在其官方博客上公開了Pixel2中使用的一顆專用影像處理輔助處理器——Pixel VisualCore。這是Google在用於伺服器的TPU之後推出的第二顆晶片,這次針對的是移動端。Pixel VisualCore由Google與Intel合作設計開發,主要用於影像處理和機器學習。這塊晶片由8個IPU(每個包含512個ALU)+1個Cortex-A53核心組成,最大可提供3TFLOPS浮點運算能力。

高通:驍龍845處理器

說到手機晶片,怎能不提高通。高通在2017年12月初正式發佈了驍龍845移動平臺。驍龍845處理器採用10納米LPP制程工藝,其中GPU採用Adreno 630,X20 LTE數據機、WiFi、影像方面使用Spectra 280ISP,以及Hexagon 685DSP輔助處理器、音質方面使用高通Aqstic Audio、CPU採用四個2.8GHz大核+四個1.8GHz小核+2MB緩存的Kryo 385 CPU、移動安全晶片,另在845中新增了一塊獨立記憶體。AI方面,驍龍845主要通過Kryo 385定制架構、Adreno 630、Hexagon 685在終端非同步運算資料。相比835,驍龍845在AI上的計算能力是835的三倍,目前已經可以支援S845GoogleTensorFlow、Facebook Caffe以及Open NeuralNetwork Exchange在內的多款主流深度學習框架。

Movidius VPU Myriad2

2016年9月,Intel發表聲明收購了Movidius。Movidius專注於研發高性能視覺處理晶片。現任CEO是原來德州儀器OMAP部門的總經理,它的技術指導委員會也是實力強大,擁有半導體和處理器行業的元老級人物——被蘋果收購的 P.A.Semi 創始人丹尼爾·多伯普爾(Daniel Dobberpuhl),卡內基梅隆大學電腦科學/電腦視覺專家金出武雄,以及前蘋果 iPhone 和 iPod 部門工程副總裁、資深工程師大衛·圖普曼(David Tupman)三人坐鎮。

其最新一代的Myriad2視覺處理器主要由SPARC處理器作為主控制器,加上專門的DSP處理器和硬體加速電路來處理專門的視覺和圖像信號。這是一款以DSP架構為基礎的視覺處理器,在視覺相關的應用領域有極高的能耗比,可以將視覺計算普及到幾乎所有的嵌入式系統中。該晶片已被大量應用在Google 3D專案Tango手機、大疆無人機、FLIR智慧紅外攝像機、海康深眸系列攝像機、華睿智能工業相機等產品中。

寒武紀 1H8和1H16

寒武紀於2016年發佈了全球首款商用深度學習專用處理器IP——寒武紀1A處理器。寒武紀1A的橫空出世打破了多項記錄,受到了業界廣泛關注,入選了第三屆世界互聯網大會評選的十五項“世界互聯網領先科技成果”。2017年11月,在公司首次發佈會上,CEO陳天石介紹了三款全新的智慧處理器IP產品,其中就包括面向低功耗場景視覺應用的寒武紀1H8、擁有更廣泛通用性和更高性能的寒武紀1H16。

陳天石介紹說,與寒武紀1A相比,新品在功耗、能效比、成本開銷等方面進行了優化,性能功耗比再次實現飛躍,適用範圍覆蓋了圖像識別、安防監控、智慧駕駛、無人機、語音辨識、自然語言處理等各個重點應用領域。

地平線旭日和征程

2017年12月20日,地平線在北京舉行發佈會,推出的征程(Journey)和旭日(Sunrise)兩款面向電腦視覺的處理器,分別用於無人駕駛和智慧攝像頭。旭日和征程都屬於嵌入式人工智慧視覺晶片,分別面向智慧駕駛和智慧攝像頭。地平線首席晶片架構師周峰對新智元介紹,這兩款晶片,晶片性能可達到1Tops,即時處理1080P@30幀,每幀可同時對200個目標進行檢測、跟蹤、識別。 典型功耗做到1.5w。

深鑒聽濤

2017年10月24日,深鑒科技召開發佈會,正式對外宣佈完成約4000萬美元A+輪融資,由螞蟻金服與三星風投領投。CEO姚頌還公佈了一系列晶片計畫,由深鑒自主研發的晶片“聽濤”、“觀海”將於2018年第三季度上市。

其中,“聽濤”將於2018年上半年完成產品裝載,該系列晶片採用台積電28納米制程,核心使用深鑒自己的亞里斯多德架構,峰值性能1.1瓦 4.1 TOPS。亞里斯多德架構針對卷積神經網路而設計。目前,卷積神經網路一般用來處理圖像相關的智慧問題,而此架構靈活與可擴展的特性使它可被應用於各種不同規格的終端中。

異構智能:NovuTensor

在今年 CES 上,NovuMind(中文名稱“異構智慧”)向業界首次展示其自主研發的第一款高性能、低功耗的 AI 晶片 NovuTensor,號稱可能是除了 TPU 之外,世界上跑得最快的單晶片。

NovuMind 方面表示,這是截至目前世界上唯一能夠實際運行的、性能達到主流 GPU/TPU 水準而性能/功耗比卻遠超主流 GPU/TPU 的晶片——在功耗 12w 的情況下,NovuTensor 每秒可識別 300 張圖像,每張圖像上,最多可檢測 8192 個目標,相比目前最先進的桌面伺服器 GPU(250W,每秒可識別 666 張圖像),僅使用 1/20 電力即可達到其性能的 1/2;而相比目前最先進的移動端或嵌入式晶片,相同用電的情況下,性能是其三倍以上。據瞭解,本次 CES 展示的僅僅是 FPGA 版本,等正在流片的 ASIC 晶片正式出廠,性能將提高 4 倍,耗電將減少一半,耗能不超過 5 瓦、可進行 15 萬億次運算的超高性能。

GTI 光矛處理器

成立於2017年初的Gyrfalcon Technology Inc.(簡稱GTI)近期以“光矛處理器 Lightspeeur 2801S”引發業內關注,這也是一家由中國晶片老兵創立的公司,總部位於美國矽谷。其晶片方案基於APiM架構,有28000個並行神經計算核,真正支援片上並行與原位計算,不需要使用外部存儲單元,克服了由記憶體頻寬而導致的性能瓶頸,在效率能耗比方面表現卓越,達到9.3Tops/Watt,無論在訓練模式還是推理模式下均可提供高密度計算性能。

在今年的CES上,GTI推出了內置Lightspeeur 2801S晶片的Laceli 人工智慧計算棒,可以在1瓦的功率下提供超過每秒9.3萬億次浮點運算的性能,超越英特爾Movidius的神經計算棒,後者每瓦功率範圍的運算力則是0.1萬億次。Laceli 人工智慧計算棒可以在多種深度學習場景中應用,包括圖像和視頻識別、理解及描述, 自然語言理解、自然語言處理等。

新智元AI技術+產業社群招募中,歡迎對AI技術+產業落地感興趣的同學,加小助手微信號: aiera2015_1 入群;通過審核後我們將邀請進群,加入社群後務必修改群備註(姓名-公司-職位;專業群審核較嚴,敬請諒解)。

Next Article
喜欢就按个赞吧!!!
点击关闭提示