您的位置:首頁>科技>正文

憑什麼,Ta是全球之最?

在浪潮新一代M5伺服器家族中, 頂著“全球密度之最皇冠”的NF5288M5(AGX-2)伺服器無疑是“夜空中最閃亮的那顆星”。

960TFlops的計算性能

2U空間支援8GPU的硬體設定

支援基於NVIDIA® NVLink™ 的GPU

以及所有PCIe 3.0介面的輔助處理器

支援多達10種GPU拓撲配置

高達300GB/s的GPU內部互連

……

從這些讓人驚豔的資料可以看出, NF5288M5實現了靈活性、密度、性能的全方位“開掛”。 然而, 為了打造這款“最小最強大”的AI神器, 研發GG們必須要攻克互連、供電、散熱三大設計難題。

溫馨提示:前方乾貨來襲, 請調整閱讀姿勢。

01

互連挑戰

8塊GPU之間採用Hybrid Cube Mesh拓撲互連, 支持GPU間高達300GB/s 的NVIDIA® NVLink™超高速匯流排, 如何保證緊湊佈線、信號完整性是一個巨大的挑戰。 同時, 靈活可調的互連拓撲, 對系統再構也提出了高要求。

浪潮放招

基於8路伺服器的設計經驗, NF5288M5採用高速信號走線佈局, 以保證NVLink™的走線盡可能短。 同時採用Fiber Wave抑制技術, 讓信號處於最佳狀態, 使得GPU得以發揮最佳性能。

有別於業界異構伺服器CPU和GPU緊耦合的互連方式, NF5288M5採用解耦式設計, 可靈活調整GPU、CPU的拓補, 滿足AI雲、深度學習模型訓練和線上推理等各類AI應用場景對計算架構的彈性需求。

02

供電挑戰

8塊功耗高達300W的GPU, 以及伺服器內其他的計算、存儲和I/O資源, 整機的功耗需求達到3000W, 如何在2U的空間內提供足夠的供電能力, 保證供電效率, 並節省空間的使用, 成為又一挑戰。

浪潮放招

NF5288M5借鑒了浪潮在整機櫃伺服器的供電設計方式, 對單伺服器內部採用無線纜大電流供電設計, 減少了供電線纜對空間的佔用以及對散熱氣流的影響。

同時採用超低損耗供電傳輸, 達到97%高效數位供電, 保證供電效率。

03

散熱挑戰

3000W的供電, 意味著3000W的峰值發熱量, 相當於6台2U伺服器的散熱量壓縮到一台2U伺服器內,

如何進行氣流調配, 解決散熱成為第三大挑戰。

浪潮放招

NF5288M5在設計之初, 從佈局、風道和氣流多個方面統籌進行考慮。 低發熱量元件前置, 高發熱量元件後置, 避免局部熱點, 讓空氣在伺服器的內部均衡的升溫, 再通過高速風扇將熱量快速帶出伺服器, 最終NF5288M5可以和傳統伺服器一樣工作在35℃的環溫下。 並且為了支援低PUE資料中心, 還可以配置氣液混合散熱, 甚至可以支援45℃的高環溫運行。

Next Article
喜欢就按个赞吧!!!
点击关闭提示