太瘋狂了——浪潮把100塊硬碟塞進了一個伺服器！

【聽楊姐說】

7月12日下午，浪潮集團推出了新一代伺服器——M5。這台伺服器有很多特點，最突出的、給姐印象最深刻的就是裡面有100塊硬碟！

要知道，以前正常的伺服器硬碟大多小於40塊硬碟！艾瑪，按照浪潮這麼個玩法，伺服器豈不是就變成了一個大硬碟排插？難道他們沒考慮過共振的問題麼？

要知道，浪潮是把這100個3.5大盤放在一個4U空間裡的，這100個硬碟同時工作時，它們的轉動會帶來很大的共振，而共振會對硬碟的壽命和運行性能產生很大的影響——後果多嚴重啊!

從40到100

姐當然要問這個關鍵問題——浪潮的產品經理吳安的解釋是，這個問題他們浪潮能夠解決：因為磁片的共振會降低磁片的性能，甚至會讓客戶造成資料的丟失，因此浪潮也是不斷反復嘗試並導入了一些測試方案，最終選擇了對整個伺服器進行分區的設計。

再說細緻點，首先是分成四個硬碟區，

通過分倉的設計減少共振。此外，還對關鍵部件採用了不同層次的組合設計，並對關鍵元件採用了橫向和縱向的優化設計，最終成功的解決了磁片共振的問題。

困難顯然並不止這些，但浪潮為什麼要做這樣的事呢——因為隨著資料的爆炸式增長！

大家一起來看一個數字：在網路連接方面，今天的聯網設備已經達到110億台，到2020年將會達到300億台，再過五年又需要增加3倍，還要能夠實現即時的分析和洞察，促進感測器自動駕駛的普及、零售業以及包括體育這樣行業的轉型——這得產生多大的資料量？得有多大的計算需求？

再舉個栗子：一個中等城市視頻監控規模大概5000個攝像頭，一個省應該會有10萬個攝像頭進行聯網，分散採集，集中存儲。如果咱們以視頻為1080P這個格式進行採集，一個月它會產生100PB的資料量！

菜心們， 100PB是什麼概念——如果採用公用的資料伺服器需要278台才能將它存的下來，如果用今天浪潮發佈的NF5280M5卻只需要100台就會將這些100T的資料完整無缺的存儲下來。

因為——浪潮M5的計算性能峰值提升了125%，

多路伺服器計算密度提升100%，存儲伺服器的存儲密度是上一代的2.78倍，相比上一代產品性能提升1.5倍！

當然， 100塊硬碟也只是物理上的表面，這個M5更加有趣的地方在於它是有“腦子”滴——就算是並聯的排插，也絕不是一個簡單的排插！

浪潮集團副總裁彭震告訴楊姐，現在所有的公司都在講 “智慧”，浪潮伺服器的硬體基礎其實就是為了能夠讓自己的伺服器更加“智慧”。原因有兩點：第一，智慧平臺對計算、設計等等方面帶來的一些全新的改變。第二，在新一代的M5上，浪潮做到了通過靈活的平臺化對應場景化，而且可以面向多樣化的設計和適用。

沒錯，其實不用彭震說你仔細研究一下也會發現，這款M5其實是和英特爾的一個平臺同期發佈的，

但M5並不是僅僅更換CPU那麼簡單——此前傳統的伺服器，更多還是定義在整個傳統的IT的計算模式裡，但這代產品更像面向智慧計算而設計的一代產品，浪潮內部也正是這麼定義的。

也論場景

記得浪潮在管道大會上早就宣佈了，浪潮對於未來的計算描繪主要在智慧計算，這個智慧計算就是CBD，即雲+大資料+深度學習，雲計算就是浪潮的計算平臺，大資料是一個認知方法，深度學習是一個高效的工具——浪潮對智慧計算的認知就是這三部分組成的，並且有“極致、彈性、開放、智慧”四個設計原則。

傳統的伺服器，更多的是傳統伺服器架構的意義——即一個伺服器面向各種場景，面向各種應用。伺服器的數量比較少，採用中庸的設計，一台多能，幹啥都行。但這種伺服器往往是比較均衡的。

但據楊姐所知，實際上在智慧計算裡面有三大應用場景：一個是雲計算的場景，一個是大資料的場景，一個是深度學習的場景。

而雲計算這個場景裡就面臨大量的分散式部署，分散式部署裡面，有計算密集型、存儲密集型，I/O密集型，實際上在整個雲計算模式裡面，不同類型的伺服器往往只做一類事情，對伺服器的要求就是怎樣做的密度更高。

所以，浪潮的雙子星，四子星，甚至2U的八子星，就是做的更加高密度。另一方面，就是存儲——在M5裡面放100個硬碟，浪潮實際上就是要把存儲能力做到極致。

以前雲計算公司採購沒那麼複雜，但以後你要仔細了，因為你會發現伺服器的種類變多了，浪潮正在試圖把每一種類型的伺服器都做到相對極致。除了在4U裡面放了100個硬碟，浪潮還在2U裡面放8個GPU——這在全球來看都是最頂級的、最高密度的設計。

當然，伺服器也必須要兼顧靈活性、相容性……等等特性。

要知道，現在各種“組織”太多了，每個組織都有很多標準。因此，融合不同組織的標準，形成統一開放的計算生態就是一個非常必要的事。

還好，浪潮是中國ODCC開放資料中心委員會會員、OCP白金會員、Open19的首批會員，一方面可以不斷推動各個組織標準的產業化，另一方面，可以針對三大開放計算標準推出很多相容性產品。

是的，伺服器必須開放——以前大家都是在自己的伺服器上跑自己的應用，夠可靠就可以，但現在不一樣了，雲計算平臺裡，一個客戶可能有幾千台、上萬台、幾萬台、甚至百萬台伺服器，這些伺服器來自于不同的廠商，來自于不同代的產品，要管理這些產品，包括怎麼樣讓不同的廠商往一個架構裡面去堆設備，而且還能夠相互管理、相互相容，開放極其重要。

浪潮的解決辦法，就是在整個系統管理裡採用了像Redfish、OpenBMC這樣一些開源的標準，Redfish可以管理幾千台，甚至幾萬台伺服器。

但最重要的是，這些技術上的準備，都為“智慧”服務。

伺服器也智慧

伺服器的智慧之處，體現於應對大面積“壞死”的時候。

在楊姐看來，此次浪潮強調的“智慧”其實就是根據不同的情況來處理容錯。舉個栗子：伺服器現在最容易出問題的地方之一是記憶體：現在的伺服器記憶體越來越大，記憶體出錯就變成了一個大概率事件，換記憶體也成了大概率事件。

智慧接入防護技術，主要是用來提升系統可靠性的。大家都知道在系統內，記憶體數量占整個伺服器部件的30%，並且記憶體其實是資料存儲的重要部件之一，一旦記憶體出現問題，將導致系統宕機、業務停滯，影響非常巨大。

浪潮則在系統運行過程中即時對所有bit進行監控，當發現有問題時及時判斷、介入、主動隔離，借此來提升運行可靠性。通過防護系統的引入，可以讓因記憶體導致的故障降低99%——浪潮認為，這實際上也是一種智慧的處理模式。

此外，浪潮還把很多智慧技術放到了伺服器裡面，使它能夠在資料中心裡更加容易被定義，更加可靠，而且更加“自我調整”。

比如說基於伺服器自己的計算能力、能耗來調整周邊的環境；比如把自己的故障作為一種大資料的方式往上層建，然後由上層的故障分析軟體統一分析這些故障，統一進行這種故障的趨勢的研判……等等。

楊姐點評：

這次採訪浪潮，收貨頗多——深度學習其實是一種返璞歸真、化繁為簡！

現在，人工智慧非常火爆，人工智慧裡面主要用的還是深度學習這樣一種技術。但深度學習這種技術和傳統的CPU的計算模式完全不一樣：在傳統的計算模式裡，精度越高越好，但是在深度學習這個場景裡面，其實是在降維度的，就是在降精度——深度學習的精度要求很低，因為它是不斷靠反覆運算來識別，分析一個資料，反到對資料的精確度要求不那麼高。

這就像人腦一樣，人腦在思考的時候，真的是一看到你就知道你身高有多少釐米，體重有多少，寬有多少嗎？

沒有，其實就是一個籠籠統統大概的估計，很抽象，很具體。再比如人們識別一隻貓，並不是分析這只貓身上有多少根毛，眼睛有多大——其實並不是這樣識別的，反倒有一些更抽象的。所以，在深度學習的計算模型裡面，它的精度是降低的，而且要快。

採用中庸的設計，一台多能，幹啥都行。但這種伺服器往往是比較均衡的。