您的位置:首頁>科技>正文

從PC到智能手機、平板:人工智慧時代下,揭秘IT架構深層變化

新財富APP(www.ikuyu.cn), 溝通資本與分析師的橋樑, 提供有深度的見解

作者 海通證券 鄭宏達 謝春生

人工智慧時代終端的智慧選擇

終端設備一路走來經歷了單片機、PC機、ARM、智慧手機和平板的時代,

語言和演算法也從簡單彙編、C語言、Java發展到了神經網路演算法階段, 現在的智慧終端機已經在晶片和存儲的發展推動下具有了強大的算力, GPU/FPGA/ASIC都將越來越多地應用於終端晶片, 快閃記憶體的快速發展也使得終端存儲的容量和性能更優。 未來我們看到的攝像頭、車載電子、智慧家居或許在外形上和從前沒有發生太大的變化, 但其底層基礎資訊架構和深度學習的能力可能已經發生變革。

英偉達:榮耀背後的厚積薄發

英偉達的爆發

英偉達近日公佈截至2017年4月30日的2018年第一財季季報, 財報顯示, 英偉達營收19.4億美元, 同比增長48.4%, 淨利潤5.07億美元, 同比增長144%。 每股收益0.85美元, 比去年同期增長126%。 英偉達第一財季業績遠超預期, 第二財季展望也非常樂觀。 NVIDIA(英偉達)創立於1993年, 總部位於美國加州, 是享有盛名的智慧晶片廠商, 在本輪人工智慧的浪潮中, 微軟、穀歌、亞馬遜、特斯拉以及大大小小的AI公司幾乎都在使用英偉達的AI晶片。

2015年9月起, 其股價一路高歌猛進, 至今已經翻了五倍以上。

英偉達的轉型之路:在挫折中快速發展

1993年英偉達成立, 旨在製造速度更快, 能產出更真實畫面的遊戲特製晶片。 當時聯合創始人黃仁勳、Chris Malachowsky以及Curtis Priem看到了剛剛興起的遊戲專用影像處理器市場, 研發專用晶片去加速電子遊戲中的圖像渲染速度,

提高玩家的遊戲體驗。 兩年之後, 英偉達推出首款遊戲主機加速器NV1。 直到今天, 這項業務依然是英偉達營收的重要組成部分。

1999年推出GPU, 但在當時計算能力制約著深度學習的發展。 GPU可以用來加速影像處理速度以提高遊戲中的玩家體驗, 同時, 強大的計算能力也有著通用計算的潛力, 比如可以應用到深度學習等對計算能力要求很高的領域。 深度學習最早興起於20世紀60年代, 也被稱作神經網路, 是機器學習的一個分支, 它可以用來進行語音辨識以及圖像識別、圖像分類等。 但是由於計算精度嚴重依賴於網路的層數或者說複雜度, 網路越複雜, 訓練樣本即資料登錄越多, 反覆運算計算次數越多,

計算結果的精度越高, 所以對計算能力有著很高的要求。 當時的計算能力無法滿足深度學習的要求, 所以深度學習的發展一直沒有很大的突破。

GPU加速計算是指同時利用圖形處理器(GPU)和CPU, 加快科學、分析、工程、消費和企業應用程式的運行速度。 GPU能夠使從汽車、手機和平板電腦到無人機和機器人等平臺的應用程式加速運行。

2006年, 英偉達發佈了CUDA程式設計工具包, 研究人員可以以更快更廉價的方式開發深度學習模型。 為了使得用於做3D渲染的GPU可以應用在通用計算領域, 英偉達推出了CUDA(Compute Unified Device Architecture)技術。 CUDA框架使得GPU可以通過更加方便高效的介面和開發者進行交互, 開發者就可以充分利用GPU的運算資源。 自此之後, 英偉達的所有GPU都逐步支持CUDA。

CUDA(統一計算設備架構)既是一個平行計算平臺,又是一種程式設計模型,可利用圖形處理器(GPU)的能力,顯著提高計算性能。自推出以來,CUDA已被廣泛部署於數千種應用程式,應用領域包括天文學、生物學、化學、物理學、資料採擷、製造業、金融以及其他計算密集型領域。

2010年,在深度學習發展史上發生了具有里程碑意義的事件:斯坦福的軟體語言學教授吳恩達(AndrewNg)會見了Google當時的CEO,決定開發GoogleBrain(深度學習+GPU)。在這樣一個事件之後,不僅互聯網巨頭們紛紛開始佈局人工智慧與深度學習,AI逐漸滲透到了各個領域。基於深層學習,英偉達持續優化其硬體並始終保持良好的市場份額。

在挫折中快速發展。回顧英偉達的發展歷程,GPU行業中形成過與ATI兩家鼎立的局面,也因為技術原因與微軟合作失敗而遭到微軟和英特爾巨頭圍剿的艱難時光;不斷革新技術,推出CUDA(統一計算設備)架構,也曾因為競爭對手的相似解決方案導致產品失敗。2009年以來,基於CUDA的GPU在高性能計算領域威力凸顯,人工智慧在通用GPU下實現重大突破,帶來大量客戶。英偉達繼續佈局CUDA軟體生態系統,業務開始爆發。2016年,英偉達發佈Pascal架構的Tesla晶片,在GPU市場份額達到70%,應用層重點佈局自動駕駛。可以看出,英偉達的發展道路並不是一帆風順的,有挫折有危機也伴隨著機遇。現在之所以處在AI大市場的中心正是因為英偉達一直以來堅持對GPU+CUDA的佈局,堅定的看好GPU的計算能力,迎來了屬於GPU的時代。

為了抓住人工智慧市場,英偉達為深度學習打造了一系列產品。從超級電腦到智慧車輛計算平臺;從VR遊戲顯卡到為網路服務商提供的加速器,再到為資料中心提供的加速器。Nvidia已經形成了從大資料訓練系統、資料中心推理系統、到智慧駕駛終端應用的全方位深度學習平臺佈局。

主營業務分析

電子競技、VR驅動遊戲業務強勁增長:根據英偉達官方資料,過去5年(FY2012-2016)來,遊戲業務收入年均複合增長率(CAGR)達21%,平均銷售價格(ASP)增長11%,平均銷售量(ASU)增長9%。

VR驅動遊戲業務高速增長。據英偉達Q4FY2017,當季遊戲業務營收為13.48億美元,占總營收的62.1%,同比增長66%。虛擬實境對高端獨立GPU需求強勁,未來VR將成為強大推動力。據Gartner估計,2020年全球高端VR硬體設備出貨量有望達到2600萬台。伴隨著VR行業的高增長,英偉達在遊戲行業中的成長動能可望持續。將VR帶給設計師、藝術家和科學家:在專業視覺化領域,英偉達通過Quadro平臺,一方面將為設計師、藝術家、科學家等終端使用者提供產品,另一方面為開發者提供SDK、外掛程式等,來豐富軟體應用。

英偉達通過兩大網路部署其資料中心產品——Tesla GPU:1)第一是伺服器製造商比如Dell,IBM等,這些公司將Tesla平臺集成到他們的資料中心伺服器中。目前,超過400款伺服器機型都裝配了Tesla;2)第二是雲服務提供者,例如微軟Azure、亞馬遜AWSEC2、以及阿裡雲等。

2013年SC13大會上NVIDIA與IBM宣佈,兩家公司計畫在GPU加速版本的IBM系列企業軟體應用上展開合作。此舉標誌著GPU加速器技術首次突破了超級計算領域,進入到企業級資料中心當中。2017財年資料中心業務收入暴增1.99億美元,由2016財年Q4同期的9700萬美元暴增到2017財年Q4的2.96億美元達到205%的增幅。得益於深度學習和人工智慧技術的普及和在工業界的推廣,大量的資料中心開始採用英偉達的GPU等其他產品。

無人駕駛無人匹敵。剛剛落幕的CES2017大會上,英偉達CEO黃仁勳為CES做了開幕演講,介紹了公司在無人駕駛的整體佈局。根據LuxResearch預測,到2030年,自動駕駛汽車有望達到870億美元規模,軟體市場甚至更大。目前,英偉達在自動駕駛汽車領域無論是硬體還是軟體都佔據重要地位,雖然英特爾和德州儀器等半導體製造商也在試圖進入這一領域,但目前還無法與英偉達匹敵。

加速佈局智慧駕駛。英偉達依靠GPU加速與深度學習完美適配的先天優勢,從車載超級電腦平臺和人工智慧駕駛系統兩個角度發力。英偉達也宣佈了一系列合作夥伴:首先是Audi,兩家公司共同打造無人駕駛汽車,預計在2020年推出level4的高度自動化汽車能夠上路;第二是地圖服務商,包括百度、TomTom、HERE等,開發高精度導航地圖;第三是博世、采埃孚等汽車零部件公司,優化無人駕駛系統,開啟英偉達DrivePX2智慧駕駛平臺的商業化路徑。

開發AICo-Pilot人工智慧協同駕駛:基於DrivePX2平臺,將包括四大感知功能:面部識別;頭部追蹤;眼部追蹤;唇語識別。目前仍在開發中,已經實現了識別唇語和面部朝向的功能。英偉達正和奧迪共同研發奧迪Q7自動駕駛概念車,計畫2020年前將實現L4高度自動駕駛級別。博世將聯手英偉達,開發一套基於DrivePX2平臺,未來推廣向博世在全球的量產車型。

從終端應用類型分,NVIDIA的產品服務於遊戲、專業圖形化、資料中心、汽車、OEM&IP五種需求。遊戲領域收入的穩健增長、資料中心和汽車領域銷售收入的爆發是NVIDIA收入增長的原因。遊戲領域一直是NVIDIA盈利的主要來源,專業圖形化領域一直為NVIDIA貢獻穩定的收入,資料中心領域是NVIDIA未來發力點之一,智慧汽車領域是NVIDIA未來另一個發力點,OEM&IP(OEM是英偉達與品牌機廠商的合作業務,IP是專利授權的業務)是NVIDIA的另一大傳統收入。

AI時代智慧平臺高速計算和存儲解決方案

腦細胞一定要多–GPU/FPGA/ASIC

從電腦問世以來,CPU作為通用處理器就承擔著機器“大腦”的職責,負責控制與計算功能。然而,CPU的設計架構決定了它計算能力的提升空間並不大,因為將近3/4的電晶體都用來實現Cache(快取記憶體)的功能,又存在著相當大的面積去實現複雜的控制功能,而用於計算的ALU單元資源就很有限了。同時,一味地提高頻率會造成晶片功耗過大帶來的發熱問題。而目前適合用於處理神經網路演算法,適應於人工智慧需求的計算平臺有GPU(圖形處理器)、FPGA(現場可程式設計邏輯陣列)以及ASIC(專用積體電路)等。

GPU之所以被認為訓練深度學習模型的重要基礎晶片,主要是其有大量的核(多達幾千個核)和大量的高速記憶體,最初被設計用於遊戲,電腦影像處理等,後被發現擅長做類似影像處理的平行計算。GPU擅長海量資料的處理,平行處理大量瑣碎資訊,被應用到“深度學習”領域。以英偉達TeslaK40為例,浮點計算能力的峰值為4.29T/s。

FPGA即可程式設計邏輯陣列,僅僅是提供了輸入輸出以及邏輯單元等硬體資源,具體的電路實現都是通過硬體描述語言HDL來配臵的。用HDL描述的邏輯被編譯成電晶體級的組合,所以FPGA不受固有架構的影響,每一個演算法的實現都可以“定制化”。所以在可以利用並行加速的人工智慧演算法中,只要設計人員採用平行計算等技巧對運算進行加速,FPGA就可以實現目標功能。FPGA中的大量門電路全部都可以被用來作為計算單元,以Xilinx的V7-690T為例,包括3600個DSP(數位信號處理)單元,最高可以達到1.8T/s的浮點計算能力。

ASIC就是專用積體電路晶片,是為了某一類需求而特別定制的晶片。與FPGA相比,ASIC一旦確定電路結構就不能再改變,演算法是固定不變的。這樣定制的晶片對於某一特定的演算法效率更高,功耗也更低。但是缺點也顯而易見,演算法一旦改變原有的晶片就不能再使用了。晶片出貨量越大成本越是低廉。所以,對於成熟的演算法,晶片需求量大的場景ASIC是非常適合的。

可以說,GPU是相對更加通用化的計算平臺,FPGA是可程式設計重新配臵的用於專用計算的平臺,而ASIC是為了專用計算而產生,一旦生產出來,電路就固化無法改變。這三類硬體系統各有優劣,而且使用場景不同。GPU從圖形處理領域逐漸進軍智慧駕駛、圖像識別等AI領域,市場上以英偉達的晶片占比最多。FPGA一次性成本低廉,目標市場是企業軍工市場。ASIC一次性成本很高但在量產的情況下可大大降低成本,適合於消費電子市場。

唯快不破的新型快閃記憶體技術

智慧攝像頭、智慧音箱、智慧手機大多數的嵌入式設備都能看到快閃記憶體的身影,快閃記憶體的存儲單元是場效應電晶體,是一種受電壓控制的三端器件,相比于傳統機械運動的磁片有著速度快,頻寬高,體積小和能耗低的特點,非常適合應用於嵌入式智慧系統。目前主流應用於嵌入式系統的快閃記憶體一般為16-64GB快閃記憶體標準eMMC,未來有向快閃記憶體標準UFS發展的趨勢,速度也將直逼系統級快閃記憶體標準SSD。從存儲介質來看,性能的提升是必然的趨勢,未來發展的3D Xpoint 和相變存儲技術將在耐用性和速度上有一個 1000倍的提升。

英特爾和美光推出的3D Xpoint技術創新高密度設計得益於交叉點結構、非易失、高耐久性和存儲層次的改變,當然預計未來價格在 DRAM(每 GB5 美元左右)和NAND(每GB25美分左右)之間,無法短期內大規模應用於終端,最有可能首先應用於資料中心,但根據官網的資料,跨 PCIe/NVMe 介面的3D XPoint能夠提供NAND快閃記憶體延遲的千分之一和1000倍的耐久性,這意味著該介質未來無論在記憶體或者存儲領域都將處於重要的地位。巨頭之間的較量從來沒有停止,IBM的相變存儲和三星也在蓄勢待發。

快閃記憶體在智慧終端機的使用已經比較普及,主要的原因是體積小、速度快、能耗低和頻寬高等特點,沒有機械裝臵也使得可以在更加複雜的環境中應用。傳統的馮諾依曼架構在資料的傳輸上消耗的時間較長,未來神經網路演算法更多是並行處理打破了傳統的馮諾依曼結構,性能更高和價格更便宜的快閃記憶體技術在未來將替代部分記憶體功能,實現計算和存儲更大的融合。

有容乃大的新型快閃記憶體技術

NAND快閃記憶體介質有SLC、MLC和TLC類型之分,NAND的制程工藝不斷進步,從早期的50nm一路發展到目前的15/16nm,提高容量、降低成本,但NAND快閃記憶體跟處理器不一樣,先進工藝雖然帶來了更大的容量,但NAND快閃記憶體的制程工藝是雙刃劍,容量提升、成本降低的同時可靠性及性能都在下降,因為這和NAND工藝有關,以至於制程工藝達到某個點後成本優勢逐漸消失。3D NAND的解決思路便出現了。廠商不再單單提高制程工藝,同時關注堆疊的層數。這樣3D NAND快閃記憶體的容量、性能、可靠性有了保證,目前比如東芝的15nm NAND容量密度為1.28Gb/mm2,而三星32層堆疊的3DNAND可以輕鬆達到1.87Gb/mm2,48層堆疊的則可以達到2.8Gb/mm2。

3D NAND技術是從2D NAND平房建成了高樓大廈,從三星2013年開始量產3DNAND快閃記憶體,到Intel和美光3D NAND最後入場並帶來殺手鐧快閃記憶體3D XPoint。快閃記憶體SSD容量也一路從2015年16TB發展到了2017年64TB容量,並且這個趨勢沒有絲毫減緩的跡象。智慧終端機多使用eMMC和UFS的標準,雖然性能上不如PC端SSD,但容量的擴大將對終端資料存儲和資料庫比對能力大大提升,智慧終端機配臵智慧晶片和大型存放區,能快速提取圖像特徵值存儲並和目標資料庫進行高速比對,避免了大量資料傳輸到後端才能處理的延時。

終端智慧化成為未來趨勢

終端設備智慧化是未來的發展趨勢。在大資料時代,資料中心是一切計算的核心,每時每刻都有海量的資料在雲端進行不同的計算處理再傳輸到世界的各個角落,現在人工智慧的發展更是離不開海量的資料與強大計算能力的硬體平臺。然而,面對正在爆發式增長的資料,對資料傳輸和存儲的要求都與日俱增,成本開銷也越來越大。通過嵌入式計算平臺,將終端設備不斷智慧化,使之在本地可以進行全部離線計算或者部分計算是未來人工智慧發展的趨勢。

現在各行各業都看到了未來人工智慧化的趨勢,尤其是安防、無人駕駛、智慧家居、智慧型機器人等。隨著國內“智慧城市”“平安城市”的不斷建設,安防領域將會走在人工智慧的前列。而海量的視頻傳輸以及存儲起來成本巨大,攝像機能夠離線進行一定的計算將會大大減輕資料中心的壓力。在無人駕駛領域,特斯拉、穀歌、百度、騰訊等各個巨頭都在不遺餘力的研發對應的自動駕駛汽車,而自動駕駛就需要即時分析通過車輛感測器、攝像頭傳輸過來的路況行人等各種資訊,利用深度學習對這些資料進行處理也需要有強大計算能力的智慧化硬體支援,比如特斯拉Model X就搭載了英偉達Drive PX 2。

智慧終端機使決策和回應更及時

實例:海康威視前裝英偉達人工智慧計算平臺Jetson

2016年10月在海康威視的新品發佈會上,海康威視推出了基於深度學習的一系列智慧安防產品:“深眸”系列智慧攝像機、“神捕”系列智慧交通產品以及“臉譜”系列人臉分析伺服器等。並宣佈與英偉達達成合作夥伴關係,聯合發佈了最新雙目智慧攝像機,依託英偉達嵌入式人工智慧計算平臺Jetson TX1可以實現強大的視頻捕捉功能,該攝像機把智慧分析模組一起嵌到攝像機組裡,不需要連接後端伺服器,將攝像機組“武裝”成軟硬體一體化的“武林高手”。

“深眸”系列攝像機由槍機、筒機、球機、雙目、多目、鷹眼等一系列形態各異的產品組成,其依託強大的多引擎硬體平臺,內嵌專為視頻監控場景設計、優化的深度學習演算法。基於深度學習技術,它可以支援人臉識別、人員行為分析、人體屬性分析、人臉動態對比等多種智慧檢測,具備比人腦更精准的安防大資料歸納能力。可以實現在各種複雜環境下人、車、物的多重特徵資訊提取和事件檢測,可充分滿足多場景、多行業的應用需求。

英偉達1993年成立伊始立足於遊戲顯卡,不斷進行技術創新尋求計算性能的逐步提高,1999年開創性的提出GPU,2006發佈CUDA程式設計工具包,以其卓越的人工智慧晶片為深度學習提供底層計算支援,已經從一家圖形晶片公司轉型為一家全球領先的GPU計算技術提供商。此次海康威視與英偉達達成合作就是看中了英偉達人工智慧專用GPU晶片強大的視覺計算能力以及低功耗的優勢。

海康威視此次和英偉達聯合發佈的這款雙目智慧攝像機採用的是雙目技術,搭載兩個圖像感測器,精確獲取目標的三維資訊。隨著安防行業的不斷發展,智慧視覺分析技術的使用場景越來越多樣化。現在有多種多樣的視覺處理技術,比如雙目技術、多球機聯動跟蹤技術、面向事後應用的智慧技術以及視頻拼接技術。雙目技術就是利用視差原理,通過不同位元臵的圖像採集設備獲取物體不同角度的兩幅圖像,對兩幅圖像進行一定的位元臵偏差計算就可以得到物體的三維幾何資訊。同時,由於雙目技術是基於兩個不同角度的影像處理技術,可以分析目標的位元臵座標、姿態資訊、與背景的距離就可以得到其速度等移動資訊,達到立體視覺跟蹤的效果,可以應用在複雜的追蹤環境中。

Jetson TX1專門為視頻監控場景中的計算而研發,集成了高效的深度學習演算法。在深眸雙目人臉攝像機中,Jetson TX1完成了圖片快速比對,人臉高效識別的功能,可以達到攝像機即時進行至少6萬張二代身份證照片的小庫比對。傳統的人臉識別產品都是採用前端攝像機抓拍圖片,後端伺服器計算比對的模式,而該深眸攝像機組可以不依託伺服器而即時進行影像處理,人臉識別,極大提高了識別效率,而這些都得益于英偉達強大的電腦視覺處理晶片。

今年3月份,英偉達宣佈Jetson系列也將進入Pascal架構時代。4月份舉辦的Jetson TX2 Editor's Day活動中,英偉達向外界展示了最新推出的Jetson TX2。與上一代產品TX1相比,GPU架構從Maxwell變成了Pascal,記憶體從4GB升級到了8GB,存儲也從16GB eMMC升級到了32GB eMMC,資料處理量與效率都得到了進一步提高。並且允許通過提高功耗的方式加快平臺計算能力,最多可以達到 TX1 兩倍的計算能力。值得注意的是,TX2 與 TX1 的物理封裝完全相同,如果要對深眸雙目攝像機進行更新換代只需要簡單替換計算平臺,簡潔高效。

不僅僅是安防產商致力於將攝像頭智慧化,近日微軟在2017開發者大會上公佈了名為“AI for Workspace Safety”的新技術,以電腦視覺為主,將所有的監控攝像頭AI化,達到“搜索世界”的目的,現在仍然在測試階段。

智慧終端機解決人機交互和資料壓縮

實例:特斯拉汽車搭載英偉達Drive PX 2

智慧駕駛的關鍵就是通過感測器、攝像頭以及雷達等得到外界環境資訊,通過一定的演算法對這些資訊進行處理給汽車以正確的指令。在人工智慧的時代,可以通過深度學習使得汽車不斷進行學習,經過充分訓練之 後無人駕駛就有了實現的可能,但是深度學習依賴具有強大計算能力的硬體。特斯拉的自動駕駛軟體系統“Tesla Vision”就是基於英偉達的Drive PX 2計算平臺,利用GPU來進行計算的加速。據英偉達官方介紹,DrivePX 2 提供的處理能力超過以前系統的40倍,它運行了特斯拉開發的神經網路,用於視覺、聲納和雷達處理。

現在特斯拉的所有車型上或多或少都具有一定的計算能力,使得他們在未來有實現自動駕駛的潛能。汽車越來越智慧化有助於緩解交通壓力以及降低交通事故發生的可能性。不僅僅是汽車,在人工智慧的時代,終端將會具有計算能力,多元輸入的資料會經過合理的壓縮和處理,決定保留哪些參數,哪些就會永遠的拋棄。經過壓縮,每個自動駕駛汽車形成的小網再和整個大的車聯網進行有效的通信。

智慧終端機符合應用羽量級趨勢

實例:可穿戴設備

智能手錶、智慧眼鏡等智慧化的可穿戴設備逐步走進我們的日常生活。在可穿戴設備領域,這些日常用品都具有了一定的計算能力甚至日後可以在萬物互聯的時代代替手機實現一些交互,比如顯示智慧烤箱的功能表和食譜等。可穿戴設備領域一個亟需解決的問題就是能耗問題,為了降低功耗,延長待機時間,在這些設備中就可以嵌入低功耗且計算能力強大的GPU。比如 Imagination Technologies 發佈的PowerVR圖形處理器 IP內核就是一個可以相容Android系統的GPU解決方案。

AppleWatch中搭載的是S1晶片,包含了30幾個獨立部件,根據ABI的拆解照片顯示,S1晶片有一顆8GB快閃記憶體晶片、ADIAD7194觸控式螢幕控制器、IDTP9022無線充電晶片、AMSAS3923NFC信號放大器、NXPNFC控制器以及Dialog(D2238A)電源管理元件。提供類似於手機的通知和控制功能,比如資訊郵件提示、電話接打、日曆、運動追蹤Activity、Siri、音樂等多種功能。硬體上也搭載了PowerVR驅動器以及GPU。

AI時代計算和存儲發生在邊緣網路

深度學習計算單元讓雲變得更輕

實例:谷歌的TPU

穀歌這個雲巨頭有著巨大的運算量需求,有別于其他雲廠商大量地建設更多的運算中心,谷歌開發了適用於AI計算的高性能專用硬體—TPU。官方網站上TPU的AI運算測試比NVDIAK 80GPU平均速度快15-30倍,比伺服器級Intel Haswe llCPU快70多倍,雖然benchmark的選擇都是因晶片而異,同時對於某些特定負載運行效率也表現不好,隨著巨頭決定未來持續投入並更新TPU架構,該晶片在未來工業界將有一席之地。

想像中的雲計算中心往往是伺服器農場,成千上萬的通用伺服器帶著CPU通用處理器日以繼夜在運轉。TPU是典型的ASIC晶片,屬於特定應用領域的專用處理晶片。穀歌之所以能夠做到這件事情,是因為穀歌的市場容量足夠大。設想一下谷歌作為搜尋引擎最普通的一個需要,即應用上萬個通用中央處理器運行7天來訓練一個識別貓臉的深度學習神經網路,他完全可以打造一款深度學習處理器,用以完成資料中心需求最大的GMM-HMM等經典模型訓練。未來的雲計算中心隨著神經網路深度學習專用晶片的使用和專用GPU加速伺服器的應用,基礎資訊設施將走上羽量級,專業化和高效化的道路。

高密度存儲使終端具有更強學習能力

實例:智慧家居的AI應用

Echo是亞馬遜於2014年發佈的一款家庭智慧音箱,通過內臵的Alexa語音交互系統可以實現語音購物、語音支付、語音點歌等功能,同時,Echo基於亞馬遜AWS雲服務,隨時與雲端相連,當Echo被喚醒以後,用戶可以通過雲獲取互聯網上的信息,比如新聞天氣等。

由於Echo沒有配臵顯示幕幕,所有功能都是通過語音交互進行的。在家庭的場景中如何讓Echo能夠辨別出哪些是命令哪些是普通交談就用到了亞馬遜一直研究的機器學習技術。比如在播放著電視機節目的客廳裡,用戶說出了Alexa,Echo就會通過內臵的演算法對其他雜音進行遮罩而被用戶喚醒。

據研究機構CIRP統計,截至2016年4月,AmazonEcho的銷量已經突破300萬台,而語音助手Alexa有希望能為亞馬遜的另一支柱業務。

提取資料特徵值管理熱資料和冷資料

實例:公安犯罪嫌疑人特徵

熱資料在公安抓捕犯罪嫌疑人的過程中,能派上大用場。隨著監控攝像頭的佈局越來越廣,智慧終端機將攝像頭採集資訊和自身存儲特徵資料庫資訊進行比對,能迅速找到犯罪嫌疑人。時間久遠的視頻無法在近期偵破案件的過程中派上用場,但不能馬上予以刪除。若將所有的視頻全部存儲,則會耗用大量的存儲空間,其中許多無用資訊將造成存儲空間的浪費。因此,在公安鎖定犯罪嫌疑人的過程中,將結合人臉識別與冷熱資料分類技術,將識別到犯罪嫌疑人行蹤的資料劃歸為熱資料,提取特徵值終端存儲以備日後多次訪問和高速比對;而將其它資料劃歸為冷資料,遷移至相應的冷資料層,減少存儲的能耗以及存儲空間的浪費。

資料存儲的二八定律一般用來劃分熱資料和冷資料在存儲硬體需求上的配置。在傳統資料庫中,準確劃分熱資料和冷資料的問題一直存在,對應資料庫中的概念就是某些表很熱(訪問次數多),但有些表很冷(訪問次數少),而這些資料熱點問題最終都會落在存儲介質上。一般而言,應對熱資料問題傳統解決方案是加大存儲緩存Cache或使用快閃記憶體設備加速,而將冷資料移轉到低速的存儲介質,隨著快閃記憶體技術發展和大量應用,終端資料壓縮和智慧識別能力提高,冷熱資料資料不同管理成為趨勢,隨之產生熱資料中心、冷資料中心、智慧資料湖等。

風險提示

1.人工智慧應用推進不達預期;

2.智慧終端機下游需求不足;

3.技術路線發生重大變化。

(完)

股市有風險,投資需謹慎。本文僅供受眾參考,不代表任何投資建議,任何參考本文所作的投資決策皆為受眾自行獨立作出,造成的經濟、財務或其他風險均由受眾自擔。

CUDA(統一計算設備架構)既是一個平行計算平臺,又是一種程式設計模型,可利用圖形處理器(GPU)的能力,顯著提高計算性能。自推出以來,CUDA已被廣泛部署於數千種應用程式,應用領域包括天文學、生物學、化學、物理學、資料採擷、製造業、金融以及其他計算密集型領域。

2010年,在深度學習發展史上發生了具有里程碑意義的事件:斯坦福的軟體語言學教授吳恩達(AndrewNg)會見了Google當時的CEO,決定開發GoogleBrain(深度學習+GPU)。在這樣一個事件之後,不僅互聯網巨頭們紛紛開始佈局人工智慧與深度學習,AI逐漸滲透到了各個領域。基於深層學習,英偉達持續優化其硬體並始終保持良好的市場份額。

在挫折中快速發展。回顧英偉達的發展歷程,GPU行業中形成過與ATI兩家鼎立的局面,也因為技術原因與微軟合作失敗而遭到微軟和英特爾巨頭圍剿的艱難時光;不斷革新技術,推出CUDA(統一計算設備)架構,也曾因為競爭對手的相似解決方案導致產品失敗。2009年以來,基於CUDA的GPU在高性能計算領域威力凸顯,人工智慧在通用GPU下實現重大突破,帶來大量客戶。英偉達繼續佈局CUDA軟體生態系統,業務開始爆發。2016年,英偉達發佈Pascal架構的Tesla晶片,在GPU市場份額達到70%,應用層重點佈局自動駕駛。可以看出,英偉達的發展道路並不是一帆風順的,有挫折有危機也伴隨著機遇。現在之所以處在AI大市場的中心正是因為英偉達一直以來堅持對GPU+CUDA的佈局,堅定的看好GPU的計算能力,迎來了屬於GPU的時代。

為了抓住人工智慧市場,英偉達為深度學習打造了一系列產品。從超級電腦到智慧車輛計算平臺;從VR遊戲顯卡到為網路服務商提供的加速器,再到為資料中心提供的加速器。Nvidia已經形成了從大資料訓練系統、資料中心推理系統、到智慧駕駛終端應用的全方位深度學習平臺佈局。

主營業務分析

電子競技、VR驅動遊戲業務強勁增長:根據英偉達官方資料,過去5年(FY2012-2016)來,遊戲業務收入年均複合增長率(CAGR)達21%,平均銷售價格(ASP)增長11%,平均銷售量(ASU)增長9%。

VR驅動遊戲業務高速增長。據英偉達Q4FY2017,當季遊戲業務營收為13.48億美元,占總營收的62.1%,同比增長66%。虛擬實境對高端獨立GPU需求強勁,未來VR將成為強大推動力。據Gartner估計,2020年全球高端VR硬體設備出貨量有望達到2600萬台。伴隨著VR行業的高增長,英偉達在遊戲行業中的成長動能可望持續。將VR帶給設計師、藝術家和科學家:在專業視覺化領域,英偉達通過Quadro平臺,一方面將為設計師、藝術家、科學家等終端使用者提供產品,另一方面為開發者提供SDK、外掛程式等,來豐富軟體應用。

英偉達通過兩大網路部署其資料中心產品——Tesla GPU:1)第一是伺服器製造商比如Dell,IBM等,這些公司將Tesla平臺集成到他們的資料中心伺服器中。目前,超過400款伺服器機型都裝配了Tesla;2)第二是雲服務提供者,例如微軟Azure、亞馬遜AWSEC2、以及阿裡雲等。

2013年SC13大會上NVIDIA與IBM宣佈,兩家公司計畫在GPU加速版本的IBM系列企業軟體應用上展開合作。此舉標誌著GPU加速器技術首次突破了超級計算領域,進入到企業級資料中心當中。2017財年資料中心業務收入暴增1.99億美元,由2016財年Q4同期的9700萬美元暴增到2017財年Q4的2.96億美元達到205%的增幅。得益於深度學習和人工智慧技術的普及和在工業界的推廣,大量的資料中心開始採用英偉達的GPU等其他產品。

無人駕駛無人匹敵。剛剛落幕的CES2017大會上,英偉達CEO黃仁勳為CES做了開幕演講,介紹了公司在無人駕駛的整體佈局。根據LuxResearch預測,到2030年,自動駕駛汽車有望達到870億美元規模,軟體市場甚至更大。目前,英偉達在自動駕駛汽車領域無論是硬體還是軟體都佔據重要地位,雖然英特爾和德州儀器等半導體製造商也在試圖進入這一領域,但目前還無法與英偉達匹敵。

加速佈局智慧駕駛。英偉達依靠GPU加速與深度學習完美適配的先天優勢,從車載超級電腦平臺和人工智慧駕駛系統兩個角度發力。英偉達也宣佈了一系列合作夥伴:首先是Audi,兩家公司共同打造無人駕駛汽車,預計在2020年推出level4的高度自動化汽車能夠上路;第二是地圖服務商,包括百度、TomTom、HERE等,開發高精度導航地圖;第三是博世、采埃孚等汽車零部件公司,優化無人駕駛系統,開啟英偉達DrivePX2智慧駕駛平臺的商業化路徑。

開發AICo-Pilot人工智慧協同駕駛:基於DrivePX2平臺,將包括四大感知功能:面部識別;頭部追蹤;眼部追蹤;唇語識別。目前仍在開發中,已經實現了識別唇語和面部朝向的功能。英偉達正和奧迪共同研發奧迪Q7自動駕駛概念車,計畫2020年前將實現L4高度自動駕駛級別。博世將聯手英偉達,開發一套基於DrivePX2平臺,未來推廣向博世在全球的量產車型。

從終端應用類型分,NVIDIA的產品服務於遊戲、專業圖形化、資料中心、汽車、OEM&IP五種需求。遊戲領域收入的穩健增長、資料中心和汽車領域銷售收入的爆發是NVIDIA收入增長的原因。遊戲領域一直是NVIDIA盈利的主要來源,專業圖形化領域一直為NVIDIA貢獻穩定的收入,資料中心領域是NVIDIA未來發力點之一,智慧汽車領域是NVIDIA未來另一個發力點,OEM&IP(OEM是英偉達與品牌機廠商的合作業務,IP是專利授權的業務)是NVIDIA的另一大傳統收入。

AI時代智慧平臺高速計算和存儲解決方案

腦細胞一定要多–GPU/FPGA/ASIC

從電腦問世以來,CPU作為通用處理器就承擔著機器“大腦”的職責,負責控制與計算功能。然而,CPU的設計架構決定了它計算能力的提升空間並不大,因為將近3/4的電晶體都用來實現Cache(快取記憶體)的功能,又存在著相當大的面積去實現複雜的控制功能,而用於計算的ALU單元資源就很有限了。同時,一味地提高頻率會造成晶片功耗過大帶來的發熱問題。而目前適合用於處理神經網路演算法,適應於人工智慧需求的計算平臺有GPU(圖形處理器)、FPGA(現場可程式設計邏輯陣列)以及ASIC(專用積體電路)等。

GPU之所以被認為訓練深度學習模型的重要基礎晶片,主要是其有大量的核(多達幾千個核)和大量的高速記憶體,最初被設計用於遊戲,電腦影像處理等,後被發現擅長做類似影像處理的平行計算。GPU擅長海量資料的處理,平行處理大量瑣碎資訊,被應用到“深度學習”領域。以英偉達TeslaK40為例,浮點計算能力的峰值為4.29T/s。

FPGA即可程式設計邏輯陣列,僅僅是提供了輸入輸出以及邏輯單元等硬體資源,具體的電路實現都是通過硬體描述語言HDL來配臵的。用HDL描述的邏輯被編譯成電晶體級的組合,所以FPGA不受固有架構的影響,每一個演算法的實現都可以“定制化”。所以在可以利用並行加速的人工智慧演算法中,只要設計人員採用平行計算等技巧對運算進行加速,FPGA就可以實現目標功能。FPGA中的大量門電路全部都可以被用來作為計算單元,以Xilinx的V7-690T為例,包括3600個DSP(數位信號處理)單元,最高可以達到1.8T/s的浮點計算能力。

ASIC就是專用積體電路晶片,是為了某一類需求而特別定制的晶片。與FPGA相比,ASIC一旦確定電路結構就不能再改變,演算法是固定不變的。這樣定制的晶片對於某一特定的演算法效率更高,功耗也更低。但是缺點也顯而易見,演算法一旦改變原有的晶片就不能再使用了。晶片出貨量越大成本越是低廉。所以,對於成熟的演算法,晶片需求量大的場景ASIC是非常適合的。

可以說,GPU是相對更加通用化的計算平臺,FPGA是可程式設計重新配臵的用於專用計算的平臺,而ASIC是為了專用計算而產生,一旦生產出來,電路就固化無法改變。這三類硬體系統各有優劣,而且使用場景不同。GPU從圖形處理領域逐漸進軍智慧駕駛、圖像識別等AI領域,市場上以英偉達的晶片占比最多。FPGA一次性成本低廉,目標市場是企業軍工市場。ASIC一次性成本很高但在量產的情況下可大大降低成本,適合於消費電子市場。

唯快不破的新型快閃記憶體技術

智慧攝像頭、智慧音箱、智慧手機大多數的嵌入式設備都能看到快閃記憶體的身影,快閃記憶體的存儲單元是場效應電晶體,是一種受電壓控制的三端器件,相比于傳統機械運動的磁片有著速度快,頻寬高,體積小和能耗低的特點,非常適合應用於嵌入式智慧系統。目前主流應用於嵌入式系統的快閃記憶體一般為16-64GB快閃記憶體標準eMMC,未來有向快閃記憶體標準UFS發展的趨勢,速度也將直逼系統級快閃記憶體標準SSD。從存儲介質來看,性能的提升是必然的趨勢,未來發展的3D Xpoint 和相變存儲技術將在耐用性和速度上有一個 1000倍的提升。

英特爾和美光推出的3D Xpoint技術創新高密度設計得益於交叉點結構、非易失、高耐久性和存儲層次的改變,當然預計未來價格在 DRAM(每 GB5 美元左右)和NAND(每GB25美分左右)之間,無法短期內大規模應用於終端,最有可能首先應用於資料中心,但根據官網的資料,跨 PCIe/NVMe 介面的3D XPoint能夠提供NAND快閃記憶體延遲的千分之一和1000倍的耐久性,這意味著該介質未來無論在記憶體或者存儲領域都將處於重要的地位。巨頭之間的較量從來沒有停止,IBM的相變存儲和三星也在蓄勢待發。

快閃記憶體在智慧終端機的使用已經比較普及,主要的原因是體積小、速度快、能耗低和頻寬高等特點,沒有機械裝臵也使得可以在更加複雜的環境中應用。傳統的馮諾依曼架構在資料的傳輸上消耗的時間較長,未來神經網路演算法更多是並行處理打破了傳統的馮諾依曼結構,性能更高和價格更便宜的快閃記憶體技術在未來將替代部分記憶體功能,實現計算和存儲更大的融合。

有容乃大的新型快閃記憶體技術

NAND快閃記憶體介質有SLC、MLC和TLC類型之分,NAND的制程工藝不斷進步,從早期的50nm一路發展到目前的15/16nm,提高容量、降低成本,但NAND快閃記憶體跟處理器不一樣,先進工藝雖然帶來了更大的容量,但NAND快閃記憶體的制程工藝是雙刃劍,容量提升、成本降低的同時可靠性及性能都在下降,因為這和NAND工藝有關,以至於制程工藝達到某個點後成本優勢逐漸消失。3D NAND的解決思路便出現了。廠商不再單單提高制程工藝,同時關注堆疊的層數。這樣3D NAND快閃記憶體的容量、性能、可靠性有了保證,目前比如東芝的15nm NAND容量密度為1.28Gb/mm2,而三星32層堆疊的3DNAND可以輕鬆達到1.87Gb/mm2,48層堆疊的則可以達到2.8Gb/mm2。

3D NAND技術是從2D NAND平房建成了高樓大廈,從三星2013年開始量產3DNAND快閃記憶體,到Intel和美光3D NAND最後入場並帶來殺手鐧快閃記憶體3D XPoint。快閃記憶體SSD容量也一路從2015年16TB發展到了2017年64TB容量,並且這個趨勢沒有絲毫減緩的跡象。智慧終端機多使用eMMC和UFS的標準,雖然性能上不如PC端SSD,但容量的擴大將對終端資料存儲和資料庫比對能力大大提升,智慧終端機配臵智慧晶片和大型存放區,能快速提取圖像特徵值存儲並和目標資料庫進行高速比對,避免了大量資料傳輸到後端才能處理的延時。

終端智慧化成為未來趨勢

終端設備智慧化是未來的發展趨勢。在大資料時代,資料中心是一切計算的核心,每時每刻都有海量的資料在雲端進行不同的計算處理再傳輸到世界的各個角落,現在人工智慧的發展更是離不開海量的資料與強大計算能力的硬體平臺。然而,面對正在爆發式增長的資料,對資料傳輸和存儲的要求都與日俱增,成本開銷也越來越大。通過嵌入式計算平臺,將終端設備不斷智慧化,使之在本地可以進行全部離線計算或者部分計算是未來人工智慧發展的趨勢。

現在各行各業都看到了未來人工智慧化的趨勢,尤其是安防、無人駕駛、智慧家居、智慧型機器人等。隨著國內“智慧城市”“平安城市”的不斷建設,安防領域將會走在人工智慧的前列。而海量的視頻傳輸以及存儲起來成本巨大,攝像機能夠離線進行一定的計算將會大大減輕資料中心的壓力。在無人駕駛領域,特斯拉、穀歌、百度、騰訊等各個巨頭都在不遺餘力的研發對應的自動駕駛汽車,而自動駕駛就需要即時分析通過車輛感測器、攝像頭傳輸過來的路況行人等各種資訊,利用深度學習對這些資料進行處理也需要有強大計算能力的智慧化硬體支援,比如特斯拉Model X就搭載了英偉達Drive PX 2。

智慧終端機使決策和回應更及時

實例:海康威視前裝英偉達人工智慧計算平臺Jetson

2016年10月在海康威視的新品發佈會上,海康威視推出了基於深度學習的一系列智慧安防產品:“深眸”系列智慧攝像機、“神捕”系列智慧交通產品以及“臉譜”系列人臉分析伺服器等。並宣佈與英偉達達成合作夥伴關係,聯合發佈了最新雙目智慧攝像機,依託英偉達嵌入式人工智慧計算平臺Jetson TX1可以實現強大的視頻捕捉功能,該攝像機把智慧分析模組一起嵌到攝像機組裡,不需要連接後端伺服器,將攝像機組“武裝”成軟硬體一體化的“武林高手”。

“深眸”系列攝像機由槍機、筒機、球機、雙目、多目、鷹眼等一系列形態各異的產品組成,其依託強大的多引擎硬體平臺,內嵌專為視頻監控場景設計、優化的深度學習演算法。基於深度學習技術,它可以支援人臉識別、人員行為分析、人體屬性分析、人臉動態對比等多種智慧檢測,具備比人腦更精准的安防大資料歸納能力。可以實現在各種複雜環境下人、車、物的多重特徵資訊提取和事件檢測,可充分滿足多場景、多行業的應用需求。

英偉達1993年成立伊始立足於遊戲顯卡,不斷進行技術創新尋求計算性能的逐步提高,1999年開創性的提出GPU,2006發佈CUDA程式設計工具包,以其卓越的人工智慧晶片為深度學習提供底層計算支援,已經從一家圖形晶片公司轉型為一家全球領先的GPU計算技術提供商。此次海康威視與英偉達達成合作就是看中了英偉達人工智慧專用GPU晶片強大的視覺計算能力以及低功耗的優勢。

海康威視此次和英偉達聯合發佈的這款雙目智慧攝像機採用的是雙目技術,搭載兩個圖像感測器,精確獲取目標的三維資訊。隨著安防行業的不斷發展,智慧視覺分析技術的使用場景越來越多樣化。現在有多種多樣的視覺處理技術,比如雙目技術、多球機聯動跟蹤技術、面向事後應用的智慧技術以及視頻拼接技術。雙目技術就是利用視差原理,通過不同位元臵的圖像採集設備獲取物體不同角度的兩幅圖像,對兩幅圖像進行一定的位元臵偏差計算就可以得到物體的三維幾何資訊。同時,由於雙目技術是基於兩個不同角度的影像處理技術,可以分析目標的位元臵座標、姿態資訊、與背景的距離就可以得到其速度等移動資訊,達到立體視覺跟蹤的效果,可以應用在複雜的追蹤環境中。

Jetson TX1專門為視頻監控場景中的計算而研發,集成了高效的深度學習演算法。在深眸雙目人臉攝像機中,Jetson TX1完成了圖片快速比對,人臉高效識別的功能,可以達到攝像機即時進行至少6萬張二代身份證照片的小庫比對。傳統的人臉識別產品都是採用前端攝像機抓拍圖片,後端伺服器計算比對的模式,而該深眸攝像機組可以不依託伺服器而即時進行影像處理,人臉識別,極大提高了識別效率,而這些都得益于英偉達強大的電腦視覺處理晶片。

今年3月份,英偉達宣佈Jetson系列也將進入Pascal架構時代。4月份舉辦的Jetson TX2 Editor's Day活動中,英偉達向外界展示了最新推出的Jetson TX2。與上一代產品TX1相比,GPU架構從Maxwell變成了Pascal,記憶體從4GB升級到了8GB,存儲也從16GB eMMC升級到了32GB eMMC,資料處理量與效率都得到了進一步提高。並且允許通過提高功耗的方式加快平臺計算能力,最多可以達到 TX1 兩倍的計算能力。值得注意的是,TX2 與 TX1 的物理封裝完全相同,如果要對深眸雙目攝像機進行更新換代只需要簡單替換計算平臺,簡潔高效。

不僅僅是安防產商致力於將攝像頭智慧化,近日微軟在2017開發者大會上公佈了名為“AI for Workspace Safety”的新技術,以電腦視覺為主,將所有的監控攝像頭AI化,達到“搜索世界”的目的,現在仍然在測試階段。

智慧終端機解決人機交互和資料壓縮

實例:特斯拉汽車搭載英偉達Drive PX 2

智慧駕駛的關鍵就是通過感測器、攝像頭以及雷達等得到外界環境資訊,通過一定的演算法對這些資訊進行處理給汽車以正確的指令。在人工智慧的時代,可以通過深度學習使得汽車不斷進行學習,經過充分訓練之 後無人駕駛就有了實現的可能,但是深度學習依賴具有強大計算能力的硬體。特斯拉的自動駕駛軟體系統“Tesla Vision”就是基於英偉達的Drive PX 2計算平臺,利用GPU來進行計算的加速。據英偉達官方介紹,DrivePX 2 提供的處理能力超過以前系統的40倍,它運行了特斯拉開發的神經網路,用於視覺、聲納和雷達處理。

現在特斯拉的所有車型上或多或少都具有一定的計算能力,使得他們在未來有實現自動駕駛的潛能。汽車越來越智慧化有助於緩解交通壓力以及降低交通事故發生的可能性。不僅僅是汽車,在人工智慧的時代,終端將會具有計算能力,多元輸入的資料會經過合理的壓縮和處理,決定保留哪些參數,哪些就會永遠的拋棄。經過壓縮,每個自動駕駛汽車形成的小網再和整個大的車聯網進行有效的通信。

智慧終端機符合應用羽量級趨勢

實例:可穿戴設備

智能手錶、智慧眼鏡等智慧化的可穿戴設備逐步走進我們的日常生活。在可穿戴設備領域,這些日常用品都具有了一定的計算能力甚至日後可以在萬物互聯的時代代替手機實現一些交互,比如顯示智慧烤箱的功能表和食譜等。可穿戴設備領域一個亟需解決的問題就是能耗問題,為了降低功耗,延長待機時間,在這些設備中就可以嵌入低功耗且計算能力強大的GPU。比如 Imagination Technologies 發佈的PowerVR圖形處理器 IP內核就是一個可以相容Android系統的GPU解決方案。

AppleWatch中搭載的是S1晶片,包含了30幾個獨立部件,根據ABI的拆解照片顯示,S1晶片有一顆8GB快閃記憶體晶片、ADIAD7194觸控式螢幕控制器、IDTP9022無線充電晶片、AMSAS3923NFC信號放大器、NXPNFC控制器以及Dialog(D2238A)電源管理元件。提供類似於手機的通知和控制功能,比如資訊郵件提示、電話接打、日曆、運動追蹤Activity、Siri、音樂等多種功能。硬體上也搭載了PowerVR驅動器以及GPU。

AI時代計算和存儲發生在邊緣網路

深度學習計算單元讓雲變得更輕

實例:谷歌的TPU

穀歌這個雲巨頭有著巨大的運算量需求,有別于其他雲廠商大量地建設更多的運算中心,谷歌開發了適用於AI計算的高性能專用硬體—TPU。官方網站上TPU的AI運算測試比NVDIAK 80GPU平均速度快15-30倍,比伺服器級Intel Haswe llCPU快70多倍,雖然benchmark的選擇都是因晶片而異,同時對於某些特定負載運行效率也表現不好,隨著巨頭決定未來持續投入並更新TPU架構,該晶片在未來工業界將有一席之地。

想像中的雲計算中心往往是伺服器農場,成千上萬的通用伺服器帶著CPU通用處理器日以繼夜在運轉。TPU是典型的ASIC晶片,屬於特定應用領域的專用處理晶片。穀歌之所以能夠做到這件事情,是因為穀歌的市場容量足夠大。設想一下谷歌作為搜尋引擎最普通的一個需要,即應用上萬個通用中央處理器運行7天來訓練一個識別貓臉的深度學習神經網路,他完全可以打造一款深度學習處理器,用以完成資料中心需求最大的GMM-HMM等經典模型訓練。未來的雲計算中心隨著神經網路深度學習專用晶片的使用和專用GPU加速伺服器的應用,基礎資訊設施將走上羽量級,專業化和高效化的道路。

高密度存儲使終端具有更強學習能力

實例:智慧家居的AI應用

Echo是亞馬遜於2014年發佈的一款家庭智慧音箱,通過內臵的Alexa語音交互系統可以實現語音購物、語音支付、語音點歌等功能,同時,Echo基於亞馬遜AWS雲服務,隨時與雲端相連,當Echo被喚醒以後,用戶可以通過雲獲取互聯網上的信息,比如新聞天氣等。

由於Echo沒有配臵顯示幕幕,所有功能都是通過語音交互進行的。在家庭的場景中如何讓Echo能夠辨別出哪些是命令哪些是普通交談就用到了亞馬遜一直研究的機器學習技術。比如在播放著電視機節目的客廳裡,用戶說出了Alexa,Echo就會通過內臵的演算法對其他雜音進行遮罩而被用戶喚醒。

據研究機構CIRP統計,截至2016年4月,AmazonEcho的銷量已經突破300萬台,而語音助手Alexa有希望能為亞馬遜的另一支柱業務。

提取資料特徵值管理熱資料和冷資料

實例:公安犯罪嫌疑人特徵

熱資料在公安抓捕犯罪嫌疑人的過程中,能派上大用場。隨著監控攝像頭的佈局越來越廣,智慧終端機將攝像頭採集資訊和自身存儲特徵資料庫資訊進行比對,能迅速找到犯罪嫌疑人。時間久遠的視頻無法在近期偵破案件的過程中派上用場,但不能馬上予以刪除。若將所有的視頻全部存儲,則會耗用大量的存儲空間,其中許多無用資訊將造成存儲空間的浪費。因此,在公安鎖定犯罪嫌疑人的過程中,將結合人臉識別與冷熱資料分類技術,將識別到犯罪嫌疑人行蹤的資料劃歸為熱資料,提取特徵值終端存儲以備日後多次訪問和高速比對;而將其它資料劃歸為冷資料,遷移至相應的冷資料層,減少存儲的能耗以及存儲空間的浪費。

資料存儲的二八定律一般用來劃分熱資料和冷資料在存儲硬體需求上的配置。在傳統資料庫中,準確劃分熱資料和冷資料的問題一直存在,對應資料庫中的概念就是某些表很熱(訪問次數多),但有些表很冷(訪問次數少),而這些資料熱點問題最終都會落在存儲介質上。一般而言,應對熱資料問題傳統解決方案是加大存儲緩存Cache或使用快閃記憶體設備加速,而將冷資料移轉到低速的存儲介質,隨著快閃記憶體技術發展和大量應用,終端資料壓縮和智慧識別能力提高,冷熱資料資料不同管理成為趨勢,隨之產生熱資料中心、冷資料中心、智慧資料湖等。

風險提示

1.人工智慧應用推進不達預期;

2.智慧終端機下游需求不足;

3.技術路線發生重大變化。

(完)

股市有風險,投資需謹慎。本文僅供受眾參考,不代表任何投資建議,任何參考本文所作的投資決策皆為受眾自行獨立作出,造成的經濟、財務或其他風險均由受眾自擔。

Next Article
喜欢就按个赞吧!!!
点击关闭提示