穀歌推出定制化機器學習晶片速度是傳統GPU的15到30倍

谷歌自主開發定制化晶片，以加速其機器學習演算法，這已不是什麼秘密了。早在2016年5月，該公司就在其I/O開發者大會上首次公佈了這款名為Tensor Processing Units(簡稱TPU)的晶片。

但是，該公司從未詳細地介紹過它們，只是聲稱這些晶片是專門為其TensorFlow機器學習框架度身定做的。

但是在週三，穀歌首次詳細地介紹了這種晶片的相關資訊。

谷歌的大衛-派特森(David Patterson)不僅與人聯合發表了有關TPU晶片的文章，而且在美國國家工程院於加利福尼亞州山景城舉行的一次活動中作了相關演講。這篇有關TPU晶片的文章總共有高達75名聯合署名作者。

晶片設計師可以上述文章中找到詳細的有關TPU的運行原理。根據穀歌自己的衡量標準， TPU執行穀歌一般機器學習任務的平均速度是標準GPU/CPU晶片(這裡指英特爾Haswell晶片和英偉達K80 GPU)的15到30倍。由於資料中心的耗電量也是一個重要的考量， TPU的每瓦計算能力是GPU/CPU晶片的30到80倍。

穀歌還指出，雖然大多數工程師針對卷積神經網路改造了其晶片，但是這些網路僅占穀歌資料中心工作量的大約5%，因為該公司的大多數應用程式均使用多層感知器神經網路。

穀歌聲稱，早在2006年，它就開始研究如何在其資料中心使用GPU、FPGA(現場可程式設計閘陣列)和定制化ASIC(實際上就是TPU)。

但是在當時，並沒有多少應用程式可以從這種特殊的晶片受益，因為大多數任務均可以通過資料中心提供的額外的晶片進行處理。

“在2013年，情況發生了改變。我們預計，由於深度神經網路(DNN)變得如何非常流行，它可能要求我們把資料中心的計算能力提高一倍。如果採用傳統的CPU晶片，成本就會變得極其昂貴。 ”穀歌在其檔中稱， “因此，我們開始優先開發定制化ASIC。 ”

谷歌研究人員稱，他們的目標就是“將其性價比提高到GPU晶片的10倍。 ”

穀歌從2015年起就一直在公司內部使用TPU晶片，而且它以後也可能只會讓自己使用這種晶片。但是該公司指出，它希望其他公司能夠借鑒吸收它的研究成果， “打造下一代更高標準的晶片”。

在過去五年中， AMD和英偉達等公司的GPU晶片已成為了經濟型深度學習技術的默認基礎架構。但是，穀歌、微軟和其他公司還開始探索其他類型的晶片，包括處理各種不同人工智慧任務的FPGA。谷歌知名硬體工程師諾姆-久皮(Norm Jouppi)在一篇博文中稱，

穀歌的TPU晶片已開始支援Google Image Search(圖片搜索)、Google Photos(穀歌照片)和Google Cloud Vision(圖像識別平臺)應用程式設計介面等等。

相對而言， TPU晶片的單片記憶體容量是英偉達K80 GPU的3.5倍，但是它的體積相對更小。目前，穀歌可以在一台伺服器中整合兩個TPU晶片。

“為了減少延緩部署的概率， TPU晶片並沒有與CPU進行整合，而是被設計成PCIe I/O匯流排上的輔助處理器。這使得它能夠直接插入現有的伺服器中，就像GPU晶片一樣。而且，為了讓硬體設計和故障排除過程變得更為簡單，託管伺服器會發送指令給TPU晶片執行，而不是讓TPU晶片自己獲取指令。因此，從設計理念上來說， TPU晶片更接近於FPU輔助處理器，而不是GPU。 ”上述文章稱。

中文科技資訊宣導尊重與保護智慧財產權。如發現本站文章存在版權問題，煩請30天內提供版權疑問、身份證明、版權證明、聯繫方式等發郵件至news@citnews.com.cn，我們將及時溝通與處理。

煩請30天內提供版權疑問、身份證明、版權證明、聯繫方式等發郵件至news@citnews.com.cn，我們將及時溝通與處理。

穀歌推出定制化機器學習晶片 速度是傳統GPU的15到30倍

穀歌推出定制化機器學習晶片速度是傳統GPU的15到30倍