您的位置:首頁>科技>正文

速度狂飆280%的深度學習神器!阿裡雲GPU實例GN6 V100深度評測

在 GTC 2017 大會上, NVIDIA 的 CEO 黃仁勳正式發佈了其新一代旗艦計算卡 Tesla V100, 但是一項技術從發佈到真正使用到生產環境中, 仍需要大量的時間。 V100 何時才能夠被廣大消費者接觸到呢?阿裡雲首先交出了自己的答卷。

近期, 國內雲計算一哥阿裡雲開啟了新一代高性能 GPU 計算雲伺服器 GN6 系列的公測, 也是國內運營商中首個提供最新 NVIDIA V100 GPU 的雲服務提供者。

GPU 雲伺服器

據悉, 新的計算實例搭載最新的 NVIDIA V100 計算核心, 宣稱可帶來數倍的深度學習性能提升。 究竟搭載英偉達V100的阿裡雲GPU實例有幾把刷子, 我們申請了一台最新的GN6系列雲伺服器, 進行了深度測試, 一起來看下。

人工智慧市場爆發 GPU雲伺服器成香餑餑

國內雲服務廠商上線實例一覽

隨著人工智慧的發展, 基於 GPU 的異構計算開始不斷升溫。 特別是傳統的 CPU 通用計算由於受到半導體工藝、存儲頻寬瓶頸等問題, 開始在人工智慧的運算中顯露疲態。

而 GPU 由於省去了 CPU 中複雜的控制流, 可以將所有算力都投入到深度學習所需要的向量運算中去, 大大提高了算力和算力利用率。

除了性能之外, 帶來的更多的還是成本的降低。 按照傳統方案, 雲服務商可以採購4個機架、共160個CPU伺服器, 在功耗65千瓦的情況下提供每秒45000張照片的處理能力。 而如果換成GPU的產品, 你可能只需要一個裝有8片GPU的伺服器, 同樣的每秒45000張照片處理能力, 但是你只需要7個伺服器插槽, 總共的功耗也只有3千瓦。

阿裡雲人工智慧佈局

在公測期間, 用戶可以登陸阿裡雲平臺提交測試申請, 提交申請的用戶會拿到阿裡雲異構計算平臺提供的 GN6 雲伺服器, 進行業務和平臺驗證。 如果你像我一樣, 忍受不了長時間的計算, 那麼GN6系列可能是在目前所有的選擇中最合適的那一款。

得益於搭載的 NVIDIA V100 GPU 擁有的新的 VOLTA 架構及新增的 Tensor 單元等因素, GN6 雲伺服器相比前代 GN5 雲伺服器擁有更加強勁的性能, 能夠以更少的時間花費來完成計算。

從P100到V100 性能提升近300%

V100 P100 對比

使用 MXNet 框架, 測試 Inception-V3 網路在 ImageNet 資料集的圖像分類訓練的 Benchmark 性能

MXnet 對比

使用 NVCaffe 框架, 測試 GoogLeNet 網路在 ImagNet 資料集的圖像分類訓練性能

NVCaffe

目前來說, 社區的框架還沒有更新到能夠完全利用 TensorCore 的水準,所以性能無法達到在發佈會上聲稱的十數倍的提升,不過即使是在這種情況下,我們測試到的結果依然表現不俗,性能相比於前代 GN5 雲伺服器提升了接近 3 倍。同樣工作量的訓練任務工作時間將壓縮過半。

隨著後續機器學習框架不斷升級優化,TensorCore 的性能將得到全面發揮,將會給機器學習帶來再一次大幅度提速。

姍姍來遲的基礎鏡像 雲伺服器開箱即用

創建雲伺服器時,開發者可以直接在選擇鏡像時在鏡像市場搜索“深度學習”,就可以找到預裝深度學習框架的系統鏡像,點擊使用就可以直接創建開箱即用的 GPU 雲伺服器。

鏡像市場

我們在使用 GPU 雲伺服器進行深度學習所需要的準備時間從原來的數個小時縮短到了不到五分鐘,確確實實節省了大量的工作時間。

總結

就目前人工智慧而言,已然進入戰國時代,而且各家的產品都有可能在這個廣闊的市場中找到自己的定位和細分市場,從跑分來看,阿裡雲的 GN6系列雲伺服器是市面上性能最強的GPU雲伺服器,,沒有之一。在易用性上,一鍵部署、鏡像市場等服務都有不俗的表現。

在價格方面,阿裡雲GN6相比同類的V100伺服器要低上不少,讓我們看到了作為雲計算領軍者的誠意。同時我們也相信未來會有更多的雲廠商推出類似的服務,讓整個人工智慧市場擁有強大的計算能力。

社區的框架還沒有更新到能夠完全利用 TensorCore 的水準,所以性能無法達到在發佈會上聲稱的十數倍的提升,不過即使是在這種情況下,我們測試到的結果依然表現不俗,性能相比於前代 GN5 雲伺服器提升了接近 3 倍。同樣工作量的訓練任務工作時間將壓縮過半。

隨著後續機器學習框架不斷升級優化,TensorCore 的性能將得到全面發揮,將會給機器學習帶來再一次大幅度提速。

姍姍來遲的基礎鏡像 雲伺服器開箱即用

創建雲伺服器時,開發者可以直接在選擇鏡像時在鏡像市場搜索“深度學習”,就可以找到預裝深度學習框架的系統鏡像,點擊使用就可以直接創建開箱即用的 GPU 雲伺服器。

鏡像市場

我們在使用 GPU 雲伺服器進行深度學習所需要的準備時間從原來的數個小時縮短到了不到五分鐘,確確實實節省了大量的工作時間。

總結

就目前人工智慧而言,已然進入戰國時代,而且各家的產品都有可能在這個廣闊的市場中找到自己的定位和細分市場,從跑分來看,阿裡雲的 GN6系列雲伺服器是市面上性能最強的GPU雲伺服器,,沒有之一。在易用性上,一鍵部署、鏡像市場等服務都有不俗的表現。

在價格方面,阿裡雲GN6相比同類的V100伺服器要低上不少,讓我們看到了作為雲計算領軍者的誠意。同時我們也相信未來會有更多的雲廠商推出類似的服務,讓整個人工智慧市場擁有強大的計算能力。

Next Article
喜欢就按个赞吧!!!
点击关闭提示