您的位置:首頁>正文

超級計算為大幅提升速度,計畫建造“E級”機器正在向前發展

田納西州橡樹嶺國家實驗室的工作人員開始填滿一個計算龐然大物的空洞房間:一排排整齊的計算單元, 大約290公里的光纖電纜和一個冷卻系統能夠承載游泳池的水。

美國能源部(DOE)預計, 這個名為Summit的這台價值2.8億美元的機器明年準備就緒時, 它將使美國重新獲得自2012年以來沒有的所有權 - 這是最快的超級電腦世界。

峰會旨在以200 petaflops的峰值速度運行, 能夠每秒鐘通過多達200萬億次的“浮點運算”(一種計算演算法)。 這可能使得首腦會議比中國目前的世界紀錄保持者快60%。

但是對於許多電腦科學家來說, Summit的完成只是一個長得多的比賽的一圈。 在全球範圍內, 工程師和科學家團隊正致力於處理能力方面的下一個飛躍:“E級”電腦, 能夠運行在驚人的1,000或更高的petaflops上。 已經有四個國內或國際團隊與本地區的電腦行業合作, 正朝著這個雄心勃勃的目標邁進。

中國計畫在2020年之前將第一台E級機器投入運行。 美國通過美國能源部的Exascale電腦專案計畫在2021年前至少建造一台。 歐盟和日本預計將緊隨其後。

科學家預計, E級電腦將使他們能夠解決氣候科學, 可再生能源, 基因組學, 地球物理學和人工智慧等領域目前難以解決的問題。 這可能包括配對燃料化學和燃燒發動機的詳細模型, 以便更快地確定可以降低溫室氣體排放的改進措施。 或者它可以允許在高達一公里的空間解析度下模擬全球氣候。 加州勞倫斯伯克利國家實驗室(Lawrence Berkeley National Laboratory)的計算科學家安·阿爾葛籣(Ann Almgren)說, 有了正確的軟體, “將會有很多科學可以做, 我們現在無法做到”。

但是, 達到E級機制是一項巨大的技術挑戰。 曾經伴隨著摩爾定律的計算性能和能量效率的指數增長已經不再保證,

為了不斷取得進步, 需要對超級電腦元件進行積極的改變。 而且, 在速度測試中表現良好的超級電腦不一定會在科學應用方面表現出色。

將高性能計算提升到一個新水準的努力正在推動超級電腦的設計和性能的改變。 伊利諾斯州阿貢國家實驗室(Argonne National Laboratory)的電腦科學家湯瑪斯•佈雷廷(Thomas Brettin)說:“這是我在職業生涯中遇到的最困難的問題之一, 他正在研製E級機器的醫療軟體。

硬體加速

計算行業更廣泛的趨勢正在形成百億億電腦的道路。 十多年來, 電晶體的封裝如此緊密, 以至於無法使計算晶片以更快的速度運行。 為了避免這種情況, 今天的超級電腦嚴重依賴並行性,

使用一堆晶片來創建具有數百萬處理單元(稱為“內核”)的機器。 超級電腦可以通過串聯更多的這些晶片而變得更加強大。

但隨著這些機器越來越大, 資料管理變得更加挑戰。 將資料移入或移出記憶體, 甚至在內核之間移動資料, 比計算本身需要更多的能量。 據估計, 高達90%的高性能電腦供電用於資料傳輸。

這導致了一些令人震驚的預測。 2008年, 在一份美國國防部高級研究計畫局的報告中, 由電腦科學家彼得·科格(Peter Kogge)領導的一個小組得出的結論是, 用可預見的技術建造的一台E級電腦將需要數千兆瓦的電力 - 可能來自專用的核電站(參見go.nature。 com / 2hs3x6d)。 印第安那州聖母大學(University of Notre Dame)教授科格(Kogge)說:“權力是E級計算的頭號, 二號, 三號和四號問題。

2015年, 考慮到技術的改進, Kogge將這一估算降低到了180到425兆瓦之間。 但是, 這比現在的頂級超級電腦還要強大得多。 今天引領世界排名的體制 - 中國的雙威太湖之光 - 消耗約15兆瓦。

阿貢的計算, 環境和生命科學副實驗室主任裡克·史蒂文斯(Rick Stevens)說:“彼得的報告很重要, 因為它引發了警鐘。 他部分地感謝Kogge的預測, 他說:“圍繞著削弱的力量已經有了很多的智力發酵”。

但近年來, 史蒂文斯說, 大量新技術已經幫助降低了功耗。 一個關鍵的進步是使記憶體更接近計算核心, 以減少資料必須經過的距離。 出於類似的原因, 工程師們也建立了向上的堆疊高性能記憶體陣列, 而不是在兩個維度上進行擴展。 超級電腦也越來越多地採用快閃記憶體, 不需要電源來維護資料,就像其他一些廣泛使用的記憶體一樣。而且電路設計人員可以在不使用晶片時關閉電路,或者改變電壓或頻率,以節省電力。

對加工商的更基本的改變也是有所作為的。一個主要的發展是採用通用版本的圖形處理單元(GPU),它們擅長于諸如視頻遊戲渲染等應用所需的資料密集型數位運算。結合GPU和中央處理單元(CPU)引導流量的電腦在物理類比上特別精通。勞倫斯伯克利國家實驗室的凱薩琳·葉利克(Katherine Yelick)說,從程式設計的角度來看,真實地動畫“ 海底總動員”(Finding Nemo)等電影中海浪的計算與類比氣候模式中的大氣動力學並沒有太大的不同。

其他超級電腦已經建成了“羽量級”處理器,放棄了一些有利於速度和能源效率的能力。中國採用輕量化方案打造雙威太湖之光。在美國對中國超級電腦中心銷售晶片(2015年)進行貿易禁運之後不久,該機器就成為了本土處理器的頭把交椅。北京北京航空航太大學電腦科學家錢德培(Depei Qian)說,Sunway羽量級處理器與花園式CPU沒有根本的區別,正在幫助管理中國的E級。單個內核簡化,本地記憶體有限,速度較低。但隨著許多人一起工作,整個機器更快。

美國能源部(DOE)第一個E級系統電力使用目標是40兆瓦,最大發電量為60兆瓦。計算巨頭英特爾一直負責為該機器製造晶片,位於華盛頓州西雅圖的超級計算公司Cray已經被分包來組裝整個系統。關於如何實現這一目標的細節尚未公佈。但是加利福尼亞州聖克拉拉的英特爾公司高性能和超級計算部門的總設計師Al Gara表示,該公司正在開發一個新的平臺 - 包括一個新的晶片微架構 - 旨在最大限度地降低功耗。

其他人有更積極的目標。錢其琛表示,中國的第一個E級系統的目標只有30兆瓦。法國替代能源和原子能公司高性能計算專家Jean-PhilippeNominé說,隨著2022年或2023年的最後期限以及更多的時間在其系統上工作,歐洲的專案可能會減少到10兆瓦。能源委員會在巴黎附近的薩克萊。但是,能源效率只是一個因素:也有性能問題。

“E級”的含義已成為對電腦科學家進行深思熟慮的一個問題。最簡單的定義是一台電腦,它可以以1 exaflops的速率處理一組特定的線性代數方程 - 相當於1,000 petaflops。自1993年以來,一群研究人員使用這個稱為LINPACK的基準排名超級電腦名列榜首。

LINPACK已經成為超級電腦性能的縮影,自2013年6月以來,中國的超級電腦已經名列榜首(見“穩步躍升”)。但速度並不是一切,諾克斯維爾田納西大學的電腦科學家傑克·東拉拉(Jack Dongarra)說,他是Top500榜單的創始人。“每個人都想要吹牛的權利,”Dongarra說。但是他將高峰期超級電腦的評分與車速表上的最高速度進行了比較。雖然能夠達到每小時300公里的速度看起來令人印象深刻,但真正給汽車帶來最大價值的是在日常駕駛過程中如何在極限速度下完成的。

電腦通過特定的線性代數運算的速度並不一定反映其預測藥物活性,訓練神經網路或執行複雜類比的能力。所有的處理能力都有不同的要求,可以同時處理多種計算,以及必須移動多少資料。美國能源部科學辦公室高級科學計算研究副主任芭芭拉·赫爾蘭(Barbara Helland)表示,“500強”並不能衡量硬體在實際應用上的表現如何。

儘管如此,今天的頂級超級電腦已經被“建造成提供最高的LINPACK性能”,去年從英特爾退休的電腦科學家Shekhar Borkar說。Borkar說,一個真實世界的科學應用可能會使用這個速度的10%,但是更為典型的是1.5-3%。他預計這個限制將持續在E級。

在美國,人們越來越擔心峰值速度和效用之間的這種脫節,導致了E級計算的不同應用驅動的定義。美國能源部的目標是第一台E級電腦的性能比美國目前最快的系統性能高出50倍:17.7千萬億次(由LINPACK測量)泰坦。例如,這可能意味著在給定時間內篩選50倍的潛在太陽能材料,或者將全球氣候建模為空間解析度提高50倍的因素。

為了追求這些成果,美國能源部正與來自學術界,政府和工業界的數百名研究人員合作。它已經成立了25個團隊,每個團隊的任務是設計能夠利用E級機器來解決特定的科學或工程問題(如發動機設計)的軟體。史蒂文斯說,美國Exascale超級電腦成功的主要標準將是25個應用程式性能的“幾何平均值”。

在開發這種電腦時,該機構也在努力改善使用超級電腦的人員,編寫軟體的人員和負責建設硬體的半導體公司之間的協作。美國能源部的E級項目“我們把這些社區聯繫在一起。我們可以強制這種趨同,“負責該項目的橡樹嶺國家實驗室電腦科學家道格·科特(Doug Kothe)說。團結用戶和建設者的這種稱為協同設計的策略並不新鮮。但是,Kothe說,“現在這樣做並沒有像現在這樣廣泛深入。

“我已經在這20年了。這是我第一次看到這種協調和支持,“華盛頓國家核安全局(NNSA)超級計算研究和運營專案經理Thuc Hoang說。

美國並不是唯一一個促進這些不同領域的科學家和工程師之間的合作。中國的超級電腦被批評為優先考慮科學的速度,在其E級設計中也採用了協同設計,重點是15個軟體應用。“我們必須把軟硬體開發與領域科學家聯繫起來。

未來的證明

但博卡爾和其他一些觀察人士擔心,中國和美國的第一個E級系統可能是不適合實際應用的特技機器。Borkar說:“提供更高的應用性能意味著設計不同的,更現實的機器。他補充說,“肯定會損害LINPACK的性能,使其從市場行銷角度看起來很糟糕”。(Borkar指出,雖然他仍然為美國政府和私營公司提供諮詢,但這些觀點是他自己的。)

博卡爾說,他希望美國特別是堅持2008年初步形成的計畫,而這個計畫本來可以利用億位元組轉變,從根本上重新思考電腦問題。他說:“進化方法將失敗。“你需要一個革命性的方法。”史蒂文斯說,大的變化正在閉門造車。他預計,美國能源部將在耶誕節前後完成與英特爾的正式合同。在那之前,他說:“我不能告訴你我們在做什麼,但這是非常有創意的。

但是超級計算如何進一步推進是有限度的。隨著每一代新一代的超級電腦,程式師必須建立在他們擁有的軟體上。“我們有遺留的代碼,”黃說。她在國家核安全局工作的計畫依靠超級電腦來維護美國的武器庫,以遵守核武器試驗的禁令。“由於我的辦公室負責,我們不能放棄那些花了我們十年時間來開發和驗證的舊代碼。”

預算上的限制也決定了美國的Exascale計畫。Aurora的目標是成為一個180 petaflops的機器,並在2018年開始在阿貢(Argonne)工作。但該機構沒有足夠的資金開始調試Exascale硬體。美國能源部並沒有公佈徵求建議書的要求,而是將英特爾和克雷公司的Aurora合同改為一台E級電腦,並在2021年之前供貨。史蒂文斯堅信自己的技術正在交付中。

同時,其他E級計畫正在取得進展。仍然是首先達到百億億的目標,到2020年是中國。該國正在稱重三個原型。東亞拉說,兩個建在超級電腦設施,這個國家最快的機器,可能是在這個國家開創的羽量級架構的變化。第三個由北京的計算公司曙光公司構建,它與高性能晶片開發商AMD有聯繫,因此可以使用AMD的主力微架構。Dongarra認為,這台機器可能會有新的特點,與羽量級不同。

與此同時,研究人員正在考慮在未來幾十年將超越E級,實現更快更好的超級電腦。生產下一代超級電腦可能意味著採用目前仍處於早期階段的技術:神經形態電路,或許是仿照大腦中神經元的運作,或量子計算。

但許多研究人員的主要擔心是確保他們能夠提供承諾的E級系統,而且為他們開發的科學應用程式在開機時就能正常工作。

不需要電源來維護資料,就像其他一些廣泛使用的記憶體一樣。而且電路設計人員可以在不使用晶片時關閉電路,或者改變電壓或頻率,以節省電力。

對加工商的更基本的改變也是有所作為的。一個主要的發展是採用通用版本的圖形處理單元(GPU),它們擅長于諸如視頻遊戲渲染等應用所需的資料密集型數位運算。結合GPU和中央處理單元(CPU)引導流量的電腦在物理類比上特別精通。勞倫斯伯克利國家實驗室的凱薩琳·葉利克(Katherine Yelick)說,從程式設計的角度來看,真實地動畫“ 海底總動員”(Finding Nemo)等電影中海浪的計算與類比氣候模式中的大氣動力學並沒有太大的不同。

其他超級電腦已經建成了“羽量級”處理器,放棄了一些有利於速度和能源效率的能力。中國採用輕量化方案打造雙威太湖之光。在美國對中國超級電腦中心銷售晶片(2015年)進行貿易禁運之後不久,該機器就成為了本土處理器的頭把交椅。北京北京航空航太大學電腦科學家錢德培(Depei Qian)說,Sunway羽量級處理器與花園式CPU沒有根本的區別,正在幫助管理中國的E級。單個內核簡化,本地記憶體有限,速度較低。但隨著許多人一起工作,整個機器更快。

美國能源部(DOE)第一個E級系統電力使用目標是40兆瓦,最大發電量為60兆瓦。計算巨頭英特爾一直負責為該機器製造晶片,位於華盛頓州西雅圖的超級計算公司Cray已經被分包來組裝整個系統。關於如何實現這一目標的細節尚未公佈。但是加利福尼亞州聖克拉拉的英特爾公司高性能和超級計算部門的總設計師Al Gara表示,該公司正在開發一個新的平臺 - 包括一個新的晶片微架構 - 旨在最大限度地降低功耗。

其他人有更積極的目標。錢其琛表示,中國的第一個E級系統的目標只有30兆瓦。法國替代能源和原子能公司高性能計算專家Jean-PhilippeNominé說,隨著2022年或2023年的最後期限以及更多的時間在其系統上工作,歐洲的專案可能會減少到10兆瓦。能源委員會在巴黎附近的薩克萊。但是,能源效率只是一個因素:也有性能問題。

“E級”的含義已成為對電腦科學家進行深思熟慮的一個問題。最簡單的定義是一台電腦,它可以以1 exaflops的速率處理一組特定的線性代數方程 - 相當於1,000 petaflops。自1993年以來,一群研究人員使用這個稱為LINPACK的基準排名超級電腦名列榜首。

LINPACK已經成為超級電腦性能的縮影,自2013年6月以來,中國的超級電腦已經名列榜首(見“穩步躍升”)。但速度並不是一切,諾克斯維爾田納西大學的電腦科學家傑克·東拉拉(Jack Dongarra)說,他是Top500榜單的創始人。“每個人都想要吹牛的權利,”Dongarra說。但是他將高峰期超級電腦的評分與車速表上的最高速度進行了比較。雖然能夠達到每小時300公里的速度看起來令人印象深刻,但真正給汽車帶來最大價值的是在日常駕駛過程中如何在極限速度下完成的。

電腦通過特定的線性代數運算的速度並不一定反映其預測藥物活性,訓練神經網路或執行複雜類比的能力。所有的處理能力都有不同的要求,可以同時處理多種計算,以及必須移動多少資料。美國能源部科學辦公室高級科學計算研究副主任芭芭拉·赫爾蘭(Barbara Helland)表示,“500強”並不能衡量硬體在實際應用上的表現如何。

儘管如此,今天的頂級超級電腦已經被“建造成提供最高的LINPACK性能”,去年從英特爾退休的電腦科學家Shekhar Borkar說。Borkar說,一個真實世界的科學應用可能會使用這個速度的10%,但是更為典型的是1.5-3%。他預計這個限制將持續在E級。

在美國,人們越來越擔心峰值速度和效用之間的這種脫節,導致了E級計算的不同應用驅動的定義。美國能源部的目標是第一台E級電腦的性能比美國目前最快的系統性能高出50倍:17.7千萬億次(由LINPACK測量)泰坦。例如,這可能意味著在給定時間內篩選50倍的潛在太陽能材料,或者將全球氣候建模為空間解析度提高50倍的因素。

為了追求這些成果,美國能源部正與來自學術界,政府和工業界的數百名研究人員合作。它已經成立了25個團隊,每個團隊的任務是設計能夠利用E級機器來解決特定的科學或工程問題(如發動機設計)的軟體。史蒂文斯說,美國Exascale超級電腦成功的主要標準將是25個應用程式性能的“幾何平均值”。

在開發這種電腦時,該機構也在努力改善使用超級電腦的人員,編寫軟體的人員和負責建設硬體的半導體公司之間的協作。美國能源部的E級項目“我們把這些社區聯繫在一起。我們可以強制這種趨同,“負責該項目的橡樹嶺國家實驗室電腦科學家道格·科特(Doug Kothe)說。團結用戶和建設者的這種稱為協同設計的策略並不新鮮。但是,Kothe說,“現在這樣做並沒有像現在這樣廣泛深入。

“我已經在這20年了。這是我第一次看到這種協調和支持,“華盛頓國家核安全局(NNSA)超級計算研究和運營專案經理Thuc Hoang說。

美國並不是唯一一個促進這些不同領域的科學家和工程師之間的合作。中國的超級電腦被批評為優先考慮科學的速度,在其E級設計中也採用了協同設計,重點是15個軟體應用。“我們必須把軟硬體開發與領域科學家聯繫起來。

未來的證明

但博卡爾和其他一些觀察人士擔心,中國和美國的第一個E級系統可能是不適合實際應用的特技機器。Borkar說:“提供更高的應用性能意味著設計不同的,更現實的機器。他補充說,“肯定會損害LINPACK的性能,使其從市場行銷角度看起來很糟糕”。(Borkar指出,雖然他仍然為美國政府和私營公司提供諮詢,但這些觀點是他自己的。)

博卡爾說,他希望美國特別是堅持2008年初步形成的計畫,而這個計畫本來可以利用億位元組轉變,從根本上重新思考電腦問題。他說:“進化方法將失敗。“你需要一個革命性的方法。”史蒂文斯說,大的變化正在閉門造車。他預計,美國能源部將在耶誕節前後完成與英特爾的正式合同。在那之前,他說:“我不能告訴你我們在做什麼,但這是非常有創意的。

但是超級計算如何進一步推進是有限度的。隨著每一代新一代的超級電腦,程式師必須建立在他們擁有的軟體上。“我們有遺留的代碼,”黃說。她在國家核安全局工作的計畫依靠超級電腦來維護美國的武器庫,以遵守核武器試驗的禁令。“由於我的辦公室負責,我們不能放棄那些花了我們十年時間來開發和驗證的舊代碼。”

預算上的限制也決定了美國的Exascale計畫。Aurora的目標是成為一個180 petaflops的機器,並在2018年開始在阿貢(Argonne)工作。但該機構沒有足夠的資金開始調試Exascale硬體。美國能源部並沒有公佈徵求建議書的要求,而是將英特爾和克雷公司的Aurora合同改為一台E級電腦,並在2021年之前供貨。史蒂文斯堅信自己的技術正在交付中。

同時,其他E級計畫正在取得進展。仍然是首先達到百億億的目標,到2020年是中國。該國正在稱重三個原型。東亞拉說,兩個建在超級電腦設施,這個國家最快的機器,可能是在這個國家開創的羽量級架構的變化。第三個由北京的計算公司曙光公司構建,它與高性能晶片開發商AMD有聯繫,因此可以使用AMD的主力微架構。Dongarra認為,這台機器可能會有新的特點,與羽量級不同。

與此同時,研究人員正在考慮在未來幾十年將超越E級,實現更快更好的超級電腦。生產下一代超級電腦可能意味著採用目前仍處於早期階段的技術:神經形態電路,或許是仿照大腦中神經元的運作,或量子計算。

但許多研究人員的主要擔心是確保他們能夠提供承諾的E級系統,而且為他們開發的科學應用程式在開機時就能正常工作。

同類文章
Next Article
喜欢就按个赞吧!!!
点击关闭提示