華文網

國家超級計算天津中心主任助理馮景華:超級計算,雲計算,大資料融合平臺

為進一步推動中國乃至全球科技創新,鼓勵並扶持創新發明者,保障廣大創新成果得到轉化及應用,2017年3月17日在北京國家會議中心隆重舉辦XSUMMIT未來科技峰會(簡稱:XSUMMIT峰會)。第六屆全球遊戲大會暨XSUMMIT峰會的主題:“連接未來”,

是科技創新與文化創意方面的年度國際“雙創”盛典。本屆XSUMMIT峰會議題圍繞人工智慧等前沿科技熱點展開,邀請到多位極具聲望與影響力的科技界大牛到場分享,共同展望未來。

國家超級計算天津中心主任助理馮景華以“超級計算,

雲計算,大資料融合平臺”為主題展開精彩分享,以下為演講實錄:

首先,非常感謝主辦方給我這個機會,宋總給我打的電話,我說遊戲我不是太在行,後來說是未來科技,想到這個題目,我說是不是把當前熱的話題連在一起就可以了,它們之間能不能融合在一起?這是我一會兒要回答的一個問題。我可能需要花一點時間介紹一下超算中心,就是我所在的這個單位,

國家超級計算天津中心它是幹什麼的。

超算中心在天津市的開發區,屬於濱海新區的一部分,如果有企業在那邊應該對那兒比較熟,研發比較好。它是國家批准的首批國家級的超算中心,當時天河一號是首個世界第一,我們正在研究下一代的超級電腦。我們也是比較開放的一個單位,雖然是一個事業單位,我們也是開放合作,所以歡迎這個領域的相關的企業跟我們提出廣泛的合作。

我們現在基本上能夠做到收支平衡,同時略有節餘,我們在國際上應該算是首家,我們基本上自己養活自己,當然做超級電腦的錢是國家投的。國家級高性能計算中心這是工信部給的牌子,還有工信部給的工業雲平臺牌子,我們本身對裝備製造業和工業企業的創新發展有很大的義務所在。同時,我們還是國內首個發改委給了一個大資料地方實驗室的單位,

是在2013年的時候。我們還和其他的一些單位有聯合的工程實驗室,還有我們承擔了濱海新區所有電子政務的業務。所以,剛才胡總提到的智慧城市的業務也歡迎大家在濱海新區能夠落地。我花兩分鐘時間介紹一下超算中心,回答一下我來自哪兒,我們是幹什麼的。

超級計算+雲計算+大資料能不能相加?我覺得超級計算是驅動創新,英特爾有一個廣告最後結尾就是超級計算驅動創新,

它驅動創新體驗在很多方面,包括資訊化技術本身,包括其他科技這種的一些驅動,都有很多我一會兒詳細的稍微講一下。從超級計算的發展歷程來看,從1976年第一台工人的超級電腦,那時候只有160Mflops,現在超級電腦最新的峰值到125P,這是什麼概念?40年超級電腦的速度提升8000萬倍,而且現在基本上還以每五年一個週期十倍的速度增長,所以它是一個指數的增長,每五年翻十倍這樣的速度在擴張。

為什麼超級電腦發展這麼快?人工智慧的基礎都是要有強大的計算能力為基礎,同時超級電腦已經成為國家高端資訊技術一個重要的基礎驅動,是國家綜合科技創新能力的技術支撐。因為全世界的大國都在競爭這個,美國不用說,原來的TOP500的全球排名裡面,一般都是美國世界第一,後來日本,德國幾次世界第一,基本上沒有其他國家的世界第一。因為它非常重要,所以全世界都非常關注,它是可以創新的一個巨大推動。

超級計算的驅動創新體現在兩個方面,一個是資訊技術的創新,本身就是驅動資訊技術,做一台超級電腦網上也許有人在提,超級電腦好像堆錢砸錢就行了,這純屬胡扯,因為超級電腦基本上在推動包括晶片、存儲和資訊技術的發展,當然包括能耗,包括穩定性、可靠性,包括其他監控的一些相關技術。比如晶片領域,在超算裡面很早就開始用GPO,用FPGA,用DSP,用ARM這種。現在人工智慧裡面很火熱的很多都在用GPO,這是在2007年的時候有一個架構提出能做超級電腦。

第二個存儲和通信也非常重要。像“天河”系列的通信頻寬基本都比當前市面上存在的應用比較多的商用的通信頻寬快一倍。什麼概念?比如說前段時間騰訊,包括阿裡都發佈了一個人工智慧的大型的超級電腦,大概有500多個節點,或者1000多個節點,基本用IP網,大概100G,“天河2”200G,“天河3”還會更快。

對於其他科技創新,我今天不是來講超算的,如果講超算15分鐘是不夠的,可以講到很多。剛才覃總提到的生命科學,胡總提到的一些人工智慧,其實都是離不開超級電腦的推動的。我們總結的超算的三個重要意義是算天、算地、算人。第一個是石油勘探,這個我都看不懂,是裡面能看到岩層裡面什麼地方有油,這口井,北方很多壓油井,他們要決定這個井打在哪兒?如果打錯一口,損失兩千到六千萬人民幣,如果打對了當然就對了。原來沒有做計算模擬的時候準確率是1/3。現在有這個基本能做到非常準確,因為它的岩層結構是很清晰的,當然還有大飛機的空氣對流模擬,這都是離不開超級電腦。還有氣候氣象,還有海洋氣候等等這些,這是其他科技創新的一個推動。

當然,我還得吐槽一點,高技術是一定買不來的,像現在世界排名最前的泰晤士光和“天河2”,泰晤士光基本是全國產的。我們下一代超級電腦全部是自主的。

說完超級電腦簡單說一下雲計算,因為在座很多也是搞雲計算的高手,雲計算本身裡面很多其他服務,比如CDN、雲主機、網路、服務、安全,這些在我看來更多是一種服務模式的創新。當然,它是有技術創新的,有很多優化技術在做,但是實際上它更多是一種服務模式本身的創新。這種服務模式創新,研發人員可以花更少的投入做這件事情,運維人員可以降低本身原始的工作,可以借助合乎雲平臺折算一個高效易用的服務模式來提升自身的生產能力。大資料我也不講大資料技術,因為大資料有很多技術可以講,展開時間都不太夠。大資料本身在我看來是一種推動服務升級的方面。包括剛才胡總提到的智慧城市,包括一些其他的便民服務,政府可以用大資料提高我的服務品質,然後企業可以用大資料來提升我的服務水準,我可以賣得更多,可以把用戶行為分析的更好,這都是大資料能提高的服務的升級達到的一個效果。也就是超級計算、雲計算、大資料這三個在一起能達到一個什麼效果呢?在我看來它是一個滿足用戶需求,能夠便於用戶使用的,具備超算能力的這樣一個服務平臺,這樣一個平臺就可以有大方面的應用。因為剛開始我們也只是做超算,2011年我們也只做超算,但是很多應用必須要結合著來,我們在這個上面也取得了一些成果。

其實我們天河在人工智慧方面做的工作還比較少,有客觀原因。因為2010年我們取得世界第一的時候,那時候深度學習、人工智慧還沒有像現在這麼火。很快我們在2013年的時候超級計算用的就比較飽和了,但是下一代超級電腦現在正在研究,我們把人工智慧作為非常重點的一個方向,我現在已經在測試平臺上把開源的深度學習的框架測試過了,這個是沒問題的。當然,還有很多優化的空間,優化的路要走。所以,歡迎人工智慧領域的朋友跟我們一塊合作,把中國的人工智慧做的更前進一步。

目前取得的一些進展,簡單的過一下,因為和我們今天在座的可能相關性並不是太高。第一,做了氣候氣象,是雲門戶的方式,需要做到200個節點,每天算四次,準確率到99%,每次計算2個小時,99%好像很低,因為做雲計算的基本上號稱3個9,5個9這樣的概念,其實不是,200多個節點,1000多條記憶體,出任何一點問題,這個環節就失效了,因為時間不允許,一天四次的預報必須要做,所以這個故障率是非常低的,說明中國的超級電腦除了在用的方面,在穩定性方面也是非常好的。

我們做國人健康的健康雲平臺,現在做百萬人高血壓的這個,要去做這些。因為研究發現中國高血壓都是90/140,這個標準其實是因人而異的,有些人血壓高,但是沒有任何症狀,而且有些論文已經證明這個。天津華大所有的產權診斷的資料都是在我們這兒,現在接近2P,每年有數十萬的病歷。

工業領域,在座可能沒有工業企業,因為工業企業想用到你的超算平臺,其實我們的人員水準沒有那麼高,工業水準還是可以的,所以我想很簡單的來用,那就做個很簡單的平臺,可以在上面提交你的任務,可以遠端三維視覺化,直接做任務,不用買軟體了。這是直接看到的結果。這是工業方面的,當然這是案例,直接可以在平臺完成。

文化創意領域,也是同樣的概念,做一些創意,渲染的都可以在這個平臺上完成。

智慧城市領域,我們在做的是做BIM,包括建築、文化,包括施工模擬,濱海新區有一條地鐵線,這條線的整個BIM系統是我們做的。智慧城市,所有電子政務系統基本都是我們在支撐,所以歡迎如果在智慧城市有很多自己產品的都可以在濱海新區跟我們做更多的合作,還有互聯網金融的信產系統,涉及到很多行政上的東西,就不細講了,有一個流程,主要做採集業務,不是做監管,因是我們監管是不具備這個資質的。

因為今天在座的可能都是搞人工智慧,搞遊戲的,我們歡迎廣泛的合作,希望能夠一起來共同為科技進步做一點貢獻,謝謝大家!

每五年翻十倍這樣的速度在擴張。

為什麼超級電腦發展這麼快?人工智慧的基礎都是要有強大的計算能力為基礎,同時超級電腦已經成為國家高端資訊技術一個重要的基礎驅動,是國家綜合科技創新能力的技術支撐。因為全世界的大國都在競爭這個,美國不用說,原來的TOP500的全球排名裡面,一般都是美國世界第一,後來日本,德國幾次世界第一,基本上沒有其他國家的世界第一。因為它非常重要,所以全世界都非常關注,它是可以創新的一個巨大推動。

超級計算的驅動創新體現在兩個方面,一個是資訊技術的創新,本身就是驅動資訊技術,做一台超級電腦網上也許有人在提,超級電腦好像堆錢砸錢就行了,這純屬胡扯,因為超級電腦基本上在推動包括晶片、存儲和資訊技術的發展,當然包括能耗,包括穩定性、可靠性,包括其他監控的一些相關技術。比如晶片領域,在超算裡面很早就開始用GPO,用FPGA,用DSP,用ARM這種。現在人工智慧裡面很火熱的很多都在用GPO,這是在2007年的時候有一個架構提出能做超級電腦。

第二個存儲和通信也非常重要。像“天河”系列的通信頻寬基本都比當前市面上存在的應用比較多的商用的通信頻寬快一倍。什麼概念?比如說前段時間騰訊,包括阿裡都發佈了一個人工智慧的大型的超級電腦,大概有500多個節點,或者1000多個節點,基本用IP網,大概100G,“天河2”200G,“天河3”還會更快。

對於其他科技創新,我今天不是來講超算的,如果講超算15分鐘是不夠的,可以講到很多。剛才覃總提到的生命科學,胡總提到的一些人工智慧,其實都是離不開超級電腦的推動的。我們總結的超算的三個重要意義是算天、算地、算人。第一個是石油勘探,這個我都看不懂,是裡面能看到岩層裡面什麼地方有油,這口井,北方很多壓油井,他們要決定這個井打在哪兒?如果打錯一口,損失兩千到六千萬人民幣,如果打對了當然就對了。原來沒有做計算模擬的時候準確率是1/3。現在有這個基本能做到非常準確,因為它的岩層結構是很清晰的,當然還有大飛機的空氣對流模擬,這都是離不開超級電腦。還有氣候氣象,還有海洋氣候等等這些,這是其他科技創新的一個推動。

當然,我還得吐槽一點,高技術是一定買不來的,像現在世界排名最前的泰晤士光和“天河2”,泰晤士光基本是全國產的。我們下一代超級電腦全部是自主的。

說完超級電腦簡單說一下雲計算,因為在座很多也是搞雲計算的高手,雲計算本身裡面很多其他服務,比如CDN、雲主機、網路、服務、安全,這些在我看來更多是一種服務模式的創新。當然,它是有技術創新的,有很多優化技術在做,但是實際上它更多是一種服務模式本身的創新。這種服務模式創新,研發人員可以花更少的投入做這件事情,運維人員可以降低本身原始的工作,可以借助合乎雲平臺折算一個高效易用的服務模式來提升自身的生產能力。大資料我也不講大資料技術,因為大資料有很多技術可以講,展開時間都不太夠。大資料本身在我看來是一種推動服務升級的方面。包括剛才胡總提到的智慧城市,包括一些其他的便民服務,政府可以用大資料提高我的服務品質,然後企業可以用大資料來提升我的服務水準,我可以賣得更多,可以把用戶行為分析的更好,這都是大資料能提高的服務的升級達到的一個效果。也就是超級計算、雲計算、大資料這三個在一起能達到一個什麼效果呢?在我看來它是一個滿足用戶需求,能夠便於用戶使用的,具備超算能力的這樣一個服務平臺,這樣一個平臺就可以有大方面的應用。因為剛開始我們也只是做超算,2011年我們也只做超算,但是很多應用必須要結合著來,我們在這個上面也取得了一些成果。

其實我們天河在人工智慧方面做的工作還比較少,有客觀原因。因為2010年我們取得世界第一的時候,那時候深度學習、人工智慧還沒有像現在這麼火。很快我們在2013年的時候超級計算用的就比較飽和了,但是下一代超級電腦現在正在研究,我們把人工智慧作為非常重點的一個方向,我現在已經在測試平臺上把開源的深度學習的框架測試過了,這個是沒問題的。當然,還有很多優化的空間,優化的路要走。所以,歡迎人工智慧領域的朋友跟我們一塊合作,把中國的人工智慧做的更前進一步。

目前取得的一些進展,簡單的過一下,因為和我們今天在座的可能相關性並不是太高。第一,做了氣候氣象,是雲門戶的方式,需要做到200個節點,每天算四次,準確率到99%,每次計算2個小時,99%好像很低,因為做雲計算的基本上號稱3個9,5個9這樣的概念,其實不是,200多個節點,1000多條記憶體,出任何一點問題,這個環節就失效了,因為時間不允許,一天四次的預報必須要做,所以這個故障率是非常低的,說明中國的超級電腦除了在用的方面,在穩定性方面也是非常好的。

我們做國人健康的健康雲平臺,現在做百萬人高血壓的這個,要去做這些。因為研究發現中國高血壓都是90/140,這個標準其實是因人而異的,有些人血壓高,但是沒有任何症狀,而且有些論文已經證明這個。天津華大所有的產權診斷的資料都是在我們這兒,現在接近2P,每年有數十萬的病歷。

工業領域,在座可能沒有工業企業,因為工業企業想用到你的超算平臺,其實我們的人員水準沒有那麼高,工業水準還是可以的,所以我想很簡單的來用,那就做個很簡單的平臺,可以在上面提交你的任務,可以遠端三維視覺化,直接做任務,不用買軟體了。這是直接看到的結果。這是工業方面的,當然這是案例,直接可以在平臺完成。

文化創意領域,也是同樣的概念,做一些創意,渲染的都可以在這個平臺上完成。

智慧城市領域,我們在做的是做BIM,包括建築、文化,包括施工模擬,濱海新區有一條地鐵線,這條線的整個BIM系統是我們做的。智慧城市,所有電子政務系統基本都是我們在支撐,所以歡迎如果在智慧城市有很多自己產品的都可以在濱海新區跟我們做更多的合作,還有互聯網金融的信產系統,涉及到很多行政上的東西,就不細講了,有一個流程,主要做採集業務,不是做監管,因是我們監管是不具備這個資質的。

因為今天在座的可能都是搞人工智慧,搞遊戲的,我們歡迎廣泛的合作,希望能夠一起來共同為科技進步做一點貢獻,謝謝大家!