IBM搭載有最新設計的POWER9處理器的新一代伺服器Power Systems AC922日前亮相。 IBM稱, 基於Linux的AC922採用了一系列創新的技術, 旨在大幅提升Chainer、TensorFlow及Caffe等各大人工智慧框架的性能, 並加速Kinetica等資料庫, 從而可以大大加速深度學習過程。
至頂網伺服器頻道 12月29日 新聞消息:臨近2017年歲末, 儘管IBM並為此做太多宣傳, 但IBM POWER9現身的新聞還是引起了業界廣泛關注。 IBM宣佈推出搭載有最新設計的POWER9處理器的新一代伺服器Power Systems AC922。 IBM稱, 基於Linux的AC922採用了一系列創新的技術, 旨在大幅提升Chainer、TensorFlow及Caffe等各大人工智慧框架的性能, 並加速Kinetica等資料庫, 從而可以加速深度學習, 可將深度學習框架的訓練時效提高近四倍。
IBM全新POWER9處理器採用14納米技術, 嵌入80億個電晶體
為AI而生IBM的Power伺服器現在的主流晶片是POWER8, 發佈於四年前。 應該說, 四年間IT市場發生了重大變化,
眾所周知, AI應用的一大特點是資料量特別巨大, 這一方面要求服務器具有強悍的計算力, 同時也對資料的輸入輸出能力提出新的要求, 需要能把海量的資料及時送達CPU。 POWER9在兩個方面都有非常好的表現, 尤其是I/O上。
據IBM傑出工程師、大中華區硬體系統部首席技術官李永輝介紹, POWER9同時支援四種連接介面, 包括最新的PCIe 4.0擴展匯流排、NVIDIA NVLink 2.0高速互連、CAPI以及OpenCAPI, 和基於PCIe Gen 3的x86系統相比, 這種組合能讓其資料傳送性能提升近10倍。
“AI應用大多數時候都需要處理海量的資料, 為了讓資料能更快地送達CPU, POWER9做了很多工作, 這讓伺服器在AI應用上具有非常好的表現。 ” 李永輝表示。
以NVLink為例。 這是NVIDIA推出的一種新的、高速的、節點內的互聯技術, 基於這一連接技術可以在GPU-GPU以及GPU-CPU之間實現高速大頻寬直連通訊, 從而加快AI應用的學習訓練過程。 同樣, IBM的CAPI在資料加速上也非常有特色。 CAPI(Coherent Accelerator Processor Interface)本質上是讓I/O的加速器可以跟CPU共用它的記憶體、緩存, 基於這個介面, I/O板卡可以更快速地與CPU交換資料。 CAPI在POWER8中首次應用, 到POWER9中升級到了CAPI 2.0。
當然, 除了支援更多I/O加速能力之外, POWER9本身在計算能力上也有很大的提升, 比如採用14納米的制程工藝, 具有更高的電晶體密度, 其最多可達24個核心,
“圖像的處理(如4K、8K的視頻處理)和語音的處理, 都需要很大的網路輸送量, 傳統架構無法滿足, IBM看到這種需求, 在POWER中做了針對性的設計, 從而實現了資料的加速能力。 ”李永輝表示。
正是得益於POWER9的這些創新, 搭載POWER9的AC922 Power Systems才具有了獨特的AI支援能力。 順便提一句, “AC922”中的“AC”就是加速計算的意思, 可見這台伺服器原本就是為AI而專門設計的。
AC922 Power Systems是一個2U的機櫃, 採用2個POWER(CPU可選16或 20個核)處理器, 每個CPU最多可接3個NVIDIA Tesla V100的GPU, 一共可接6個GPU, CPU與GPU通過6個NVLink 2.0介面相連。 據悉, NVLink 2.0 提供CPU與GPU或GPU與GPU間通信性能高達到每秒100GB/s到150GB/s的連接, 這是PCIe 3.0速度的7到10倍。 因為AI依賴於數千次反復進行的深度學習訓練, 所以NVLink 的採用可以明顯改進系統性能。
李永輝透露, POWER9是美國能源部正在建的Summit及Sierra超級電腦的核心,
目前, 在伺服器市場的競爭格局是英特爾和AMD代表的x86陣營主導, 而IBM、甲骨文所代表的RISC陣營一直處於守勢。 一直以來, 在與x86陣營的競爭, IBM的POWER主打的高性能、高可靠以及更低功耗, 從而在一些關鍵任務應用場景中擁有不少高端客戶。 這些特點在POWER9中還會有, 比如, 李永輝提到, 跟x86相比POWER9擁有1.8倍的頻寬、2.6倍的容量以及更快更大的記憶體系統。 但很顯然, 與以往相比這些數字的對比似乎已經不是重點, IBM現在更願意展示POWER在一些應用場景中的優勢。
IBM大中華區科技合作部副總裁Mary Coucher就告訴記者:“在過去可能大家都更多的是關注於晶片, 關注內核、執行緒、記憶體,而現在我們更關注於不同的工作負載,關注晶片如何為這些負載提供最大程度的支援,並針對不同的負載推出不同系列的產品。”
正因為此原因,Mary Coucher透露,與POWER8相比,POWER9將會有更多的產品類型,比如,將會細分出主打Scale-out場景的POWER9和主打Scale-up應用場景的POWER9。
IBM副總裁、大中華區硬體系統部總經理侯淼也告訴記者,這一調整的背後是因為客戶在伺服器架構平臺選擇中的決策重心已經發生了改變。“十年前,很多客戶在選型的時候會首選RISC架構的伺服器,五年前會首先考慮x86。但是今天,很多客戶選型時會優先看應用。比如,我要做一個人臉識別的系統或者一個鋼廠的殘次品診斷系統,然後看哪些平臺能夠説明我實現這個目標。”
截止目前,IBM並沒有做大規模的POWER9發佈,關於POWER9透露的資訊並不多。採訪中, Mary Coucher 告訴記者,圍繞POWER9有一系列系統計畫在2018年公佈,更多產品也將在2018年上市。屆時用戶是否認可POWER9的這些創新答案也會揭曉,我們將密切關注。
關注內核、執行緒、記憶體,而現在我們更關注於不同的工作負載,關注晶片如何為這些負載提供最大程度的支援,並針對不同的負載推出不同系列的產品。”正因為此原因,Mary Coucher透露,與POWER8相比,POWER9將會有更多的產品類型,比如,將會細分出主打Scale-out場景的POWER9和主打Scale-up應用場景的POWER9。
IBM副總裁、大中華區硬體系統部總經理侯淼也告訴記者,這一調整的背後是因為客戶在伺服器架構平臺選擇中的決策重心已經發生了改變。“十年前,很多客戶在選型的時候會首選RISC架構的伺服器,五年前會首先考慮x86。但是今天,很多客戶選型時會優先看應用。比如,我要做一個人臉識別的系統或者一個鋼廠的殘次品診斷系統,然後看哪些平臺能夠説明我實現這個目標。”
截止目前,IBM並沒有做大規模的POWER9發佈,關於POWER9透露的資訊並不多。採訪中, Mary Coucher 告訴記者,圍繞POWER9有一系列系統計畫在2018年公佈,更多產品也將在2018年上市。屆時用戶是否認可POWER9的這些創新答案也會揭曉,我們將密切關注。