您的位置:首頁>科技>正文

太瘋狂了——浪潮把100塊硬碟塞進了一個伺服器!

【聽楊姐說】

7月12日下午, 浪潮集團推出了新一代伺服器——M5。 這台伺服器有很多特點, 最突出的、給姐印象最深刻的就是裡面有100塊硬碟!

要知道, 以前正常的伺服器硬碟大多小於40塊硬碟!艾瑪, 按照浪潮這麼個玩法, 伺服器豈不是就變成了一個大硬碟排插?難道他們沒考慮過共振的問題麼?

要知道, 浪潮是把這100個3.5大盤放在一個4U空間裡的, 這100個硬碟同時工作時, 它們的轉動會帶來很大的共振, 而共振會對硬碟的壽命和運行性能產生很大的影響——後果多嚴重啊!

從40到100

姐當然要問這個關鍵問題——浪潮的產品經理吳安的解釋是, 這個問題他們浪潮能夠解決:因為磁片的共振會降低磁片的性能, 甚至會讓客戶造成資料的丟失, 因此浪潮也是不斷反復嘗試並導入了一些測試方案, 最終選擇了對整個伺服器進行分區的設計。

再說細緻點, 首先是分成四個硬碟區,

通過分倉的設計減少共振。 此外, 還對關鍵部件採用了不同層次的組合設計, 並對關鍵元件採用了橫向和縱向的優化設計, 最終成功的解決了磁片共振的問題。

困難顯然並不止這些, 但浪潮為什麼要做這樣的事呢——因為隨著資料的爆炸式增長!

大家一起來看一個數字:在網路連接方面, 今天的聯網設備已經達到110億台, 到2020年將會達到300億台, 再過五年又需要增加3倍, 還要能夠實現即時的分析和洞察, 促進感測器自動駕駛的普及、零售業以及包括體育這樣行業的轉型——這得產生多大的資料量?得有多大的計算需求?

再舉個栗子:一個中等城市視頻監控規模大概5000個攝像頭, 一個省應該會有10萬個攝像頭進行聯網, 分散採集, 集中存儲。 如果咱們以視頻為1080P這個格式進行採集, 一個月它會產生100PB的資料量!

菜心們, 100PB是什麼概念——如果採用公用的資料伺服器需要278台才能將它存的下來, 如果用今天浪潮發佈的NF5280M5卻只需要100台就會將這些100T的資料完整無缺的存儲下來。

因為——浪潮M5的計算性能峰值提升了125%,

多路伺服器計算密度提升100%, 存儲伺服器的存儲密度是上一代的2.78倍, 相比上一代產品性能提升1.5倍!

當然, 100塊硬碟也只是物理上的表面, 這個M5更加有趣的地方在於它是有“腦子”滴——就算是並聯的排插, 也絕不是一個簡單的排插!

浪潮集團副總裁彭震告訴楊姐, 現在所有的公司都在講 “智慧”, 浪潮伺服器的硬體基礎其實就是為了能夠讓自己的伺服器更加“智慧”。 原因有兩點:第一, 智慧平臺對計算、設計等等方面帶來的一些全新的改變。 第二, 在新一代的M5上, 浪潮做到了通過靈活的平臺化對應場景化, 而且可以面向多樣化的設計和適用。

沒錯, 其實不用彭震說你仔細研究一下也會發現, 這款M5其實是和英特爾的一個平臺同期發佈的,

但M5並不是僅僅更換CPU那麼簡單——此前傳統的伺服器, 更多還是定義在整個傳統的IT的計算模式裡, 但這代產品更像面向智慧計算而設計的一代產品, 浪潮內部也正是這麼定義的。

也論場景

記得浪潮在管道大會上早就宣佈了, 浪潮對於未來的計算描繪主要在智慧計算, 這個智慧計算就是CBD, 即雲+大資料+深度學習, 雲計算就是浪潮的計算平臺, 大資料是一個認知方法, 深度學習是一個高效的工具——浪潮對智慧計算的認知就是這三部分組成的, 並且有“極致、彈性、開放、智慧”四個設計原則。

傳統的伺服器, 更多的是傳統伺服器架構的意義——即一個伺服器面向各種場景, 面向各種應用。 伺服器的數量比較少, 採用中庸的設計,一台多能,幹啥都行。但這種伺服器往往是比較均衡的。

但據楊姐所知,實際上在智慧計算裡面有三大應用場景:一個是雲計算的場景,一個是大資料的場景,一個是深度學習的場景。

而雲計算這個場景裡就面臨大量的分散式部署,分散式部署裡面,有計算密集型、存儲密集型,I/O密集型,實際上在整個雲計算模式裡面,不同類型的伺服器往往只做一類事情,對伺服器的要求就是怎樣做的密度更高。

所以,浪潮的雙子星,四子星,甚至2U的八子星,就是做的更加高密度。另一方面,就是存儲——在M5裡面放100個硬碟,浪潮實際上就是要把存儲能力做到極致。

以前雲計算公司採購沒那麼複雜,但以後你要仔細了,因為你會發現伺服器的種類變多了,浪潮正在試圖把每一種類型的伺服器都做到相對極致。除了在4U裡面放了100個硬碟,浪潮還在2U裡面放8個GPU——這在全球來看都是最頂級的、最高密度的設計。

當然,伺服器也必須要兼顧靈活性、相容性……等等特性。

要知道,現在各種“組織”太多了,每個組織都有很多標準。因此,融合不同組織的標準,形成統一開放的計算生態就是一個非常必要的事。

還好,浪潮是中國ODCC開放資料中心委員會會員、OCP白金會員、Open19的首批會員,一方面可以不斷推動各個組織標準的產業化,另一方面,可以針對三大開放計算標準推出很多相容性產品。

是的,伺服器必須開放——以前大家都是在自己的伺服器上跑自己的應用,夠可靠就可以,但現在不一樣了,雲計算平臺裡,一個客戶可能有幾千台、上萬台、幾萬台、甚至百萬台伺服器,這些伺服器來自于不同的廠商,來自于不同代的產品,要管理這些產品,包括怎麼樣讓不同的廠商往一個架構裡面去堆設備,而且還能夠相互管理、相互相容,開放極其重要。

浪潮的解決辦法,就是在整個系統管理裡採用了像Redfish、OpenBMC這樣一些開源的標準,Redfish可以管理幾千台,甚至幾萬台伺服器。

但最重要的是,這些技術上的準備,都為“智慧”服務。

伺服器也智慧

伺服器的智慧之處,體現於應對大面積“壞死”的時候。

在楊姐看來,此次浪潮強調的“智慧”其實就是根據不同的情況來處理容錯。舉個栗子:伺服器現在最容易出問題的地方之一是記憶體:現在的伺服器記憶體越來越大,記憶體出錯就變成了一個大概率事件,換記憶體也成了大概率事件。

智慧接入防護技術,主要是用來提升系統可靠性的。大家都知道在系統內,記憶體數量占整個伺服器部件的30%,並且記憶體其實是資料存儲的重要部件之一,一旦記憶體出現問題,將導致系統宕機、業務停滯,影響非常巨大。

浪潮則在系統運行過程中即時對所有bit進行監控,當發現有問題時及時判斷、介入、主動隔離,借此來提升運行可靠性。通過防護系統的引入,可以讓因記憶體導致的故障降低99%——浪潮認為,這實際上也是一種智慧的處理模式。

此外,浪潮還把很多智慧技術放到了伺服器裡面,使它能夠在資料中心裡更加容易被定義,更加可靠,而且更加“自我調整”。

比如說基於伺服器自己的計算能力、能耗來調整周邊的環境;比如把自己的故障作為一種大資料的方式往上層建,然後由上層的故障分析軟體統一分析這些故障,統一進行這種故障的趨勢的研判……等等。

楊姐點評:

這次採訪浪潮,收貨頗多——深度學習其實是一種返璞歸真、化繁為簡!

現在,人工智慧非常火爆,人工智慧裡面主要用的還是深度學習這樣一種技術。但深度學習這種技術和傳統的CPU的計算模式完全不一樣:在傳統的計算模式裡,精度越高越好,但是在深度學習這個場景裡面,其實是在降維度的,就是在降精度——深度學習的精度要求很低,因為它是不斷靠反覆運算來識別,分析一個資料,反到對資料的精確度要求不那麼高。

這就像人腦一樣,人腦在思考的時候,真的是一看到你就知道你身高有多少釐米,體重有多少,寬有多少嗎?

沒有,其實就是一個籠籠統統大概的估計,很抽象,很具體。再比如人們識別一隻貓,並不是分析這只貓身上有多少根毛,眼睛有多大——其實並不是這樣識別的,反倒有一些更抽象的。所以,在深度學習的計算模型裡面,它的精度是降低的,而且要快。

採用中庸的設計,一台多能,幹啥都行。但這種伺服器往往是比較均衡的。

但據楊姐所知,實際上在智慧計算裡面有三大應用場景:一個是雲計算的場景,一個是大資料的場景,一個是深度學習的場景。

而雲計算這個場景裡就面臨大量的分散式部署,分散式部署裡面,有計算密集型、存儲密集型,I/O密集型,實際上在整個雲計算模式裡面,不同類型的伺服器往往只做一類事情,對伺服器的要求就是怎樣做的密度更高。

所以,浪潮的雙子星,四子星,甚至2U的八子星,就是做的更加高密度。另一方面,就是存儲——在M5裡面放100個硬碟,浪潮實際上就是要把存儲能力做到極致。

以前雲計算公司採購沒那麼複雜,但以後你要仔細了,因為你會發現伺服器的種類變多了,浪潮正在試圖把每一種類型的伺服器都做到相對極致。除了在4U裡面放了100個硬碟,浪潮還在2U裡面放8個GPU——這在全球來看都是最頂級的、最高密度的設計。

當然,伺服器也必須要兼顧靈活性、相容性……等等特性。

要知道,現在各種“組織”太多了,每個組織都有很多標準。因此,融合不同組織的標準,形成統一開放的計算生態就是一個非常必要的事。

還好,浪潮是中國ODCC開放資料中心委員會會員、OCP白金會員、Open19的首批會員,一方面可以不斷推動各個組織標準的產業化,另一方面,可以針對三大開放計算標準推出很多相容性產品。

是的,伺服器必須開放——以前大家都是在自己的伺服器上跑自己的應用,夠可靠就可以,但現在不一樣了,雲計算平臺裡,一個客戶可能有幾千台、上萬台、幾萬台、甚至百萬台伺服器,這些伺服器來自于不同的廠商,來自于不同代的產品,要管理這些產品,包括怎麼樣讓不同的廠商往一個架構裡面去堆設備,而且還能夠相互管理、相互相容,開放極其重要。

浪潮的解決辦法,就是在整個系統管理裡採用了像Redfish、OpenBMC這樣一些開源的標準,Redfish可以管理幾千台,甚至幾萬台伺服器。

但最重要的是,這些技術上的準備,都為“智慧”服務。

伺服器也智慧

伺服器的智慧之處,體現於應對大面積“壞死”的時候。

在楊姐看來,此次浪潮強調的“智慧”其實就是根據不同的情況來處理容錯。舉個栗子:伺服器現在最容易出問題的地方之一是記憶體:現在的伺服器記憶體越來越大,記憶體出錯就變成了一個大概率事件,換記憶體也成了大概率事件。

智慧接入防護技術,主要是用來提升系統可靠性的。大家都知道在系統內,記憶體數量占整個伺服器部件的30%,並且記憶體其實是資料存儲的重要部件之一,一旦記憶體出現問題,將導致系統宕機、業務停滯,影響非常巨大。

浪潮則在系統運行過程中即時對所有bit進行監控,當發現有問題時及時判斷、介入、主動隔離,借此來提升運行可靠性。通過防護系統的引入,可以讓因記憶體導致的故障降低99%——浪潮認為,這實際上也是一種智慧的處理模式。

此外,浪潮還把很多智慧技術放到了伺服器裡面,使它能夠在資料中心裡更加容易被定義,更加可靠,而且更加“自我調整”。

比如說基於伺服器自己的計算能力、能耗來調整周邊的環境;比如把自己的故障作為一種大資料的方式往上層建,然後由上層的故障分析軟體統一分析這些故障,統一進行這種故障的趨勢的研判……等等。

楊姐點評:

這次採訪浪潮,收貨頗多——深度學習其實是一種返璞歸真、化繁為簡!

現在,人工智慧非常火爆,人工智慧裡面主要用的還是深度學習這樣一種技術。但深度學習這種技術和傳統的CPU的計算模式完全不一樣:在傳統的計算模式裡,精度越高越好,但是在深度學習這個場景裡面,其實是在降維度的,就是在降精度——深度學習的精度要求很低,因為它是不斷靠反覆運算來識別,分析一個資料,反到對資料的精確度要求不那麼高。

這就像人腦一樣,人腦在思考的時候,真的是一看到你就知道你身高有多少釐米,體重有多少,寬有多少嗎?

沒有,其實就是一個籠籠統統大概的估計,很抽象,很具體。再比如人們識別一隻貓,並不是分析這只貓身上有多少根毛,眼睛有多大——其實並不是這樣識別的,反倒有一些更抽象的。所以,在深度學習的計算模型裡面,它的精度是降低的,而且要快。

Next Article
喜欢就按个赞吧!!!
点击关闭提示