您的位置:首頁>科技>正文

神州數碼主席郭為:大資料就是大智慧,終極是生命科學

文/邱月燁

城市與大資料的結合真正變得越來越緊密, 我們居住的物理世界與虛擬世界正在加速融合。

1月11日, 神州數碼控股有限公司與廣州市城市建設投資集團有限公司聯合舉辦“數字中國·未來城市”首屆廣州塔未來城市論壇,

神州控股董事局主席郭為在論壇上表示, 智慧城市從無到有, 經過多年的發展之後到了一個新的階段。

早在2010年, 神州控股就提出了智慧城市發展理念, 搭建基於互聯網的應用服務平臺。 2016年神州控股提出了“雲計算+大資料”戰略, 2017年從傳統IT服務提供者轉型為創新型大資料服務商。

目前, 據神州控股給出的資料, 其智慧城市業務已覆蓋全中國120多個城市, 基於資料整合的城市服務平臺簽約已達40多個城市/地區, 並且已經在30多個城市開展運營, 覆蓋常住人口超過一億人。

作為智慧城市成果的一部分, 神州控股發還布了“大資料精准醫療臨床決策平臺”。

神州醫療CEO史文釗介紹了關於精准醫療和大資料、基因測序的精准醫療罕見病產品、基因測序的精准醫學腫瘤產品和基因測序的藥物基因組學產品以及精准醫療產品的推廣和部署。 據介紹, 成立於2016年底的神州醫療孵化近十年、籌備近三年。

神州控股從聯想科技分離出來, 在20年間經歷了中國最大的整合IT服務商、智慧城市專家、大資料雲服務提供者等幾次重大轉型。 根據神州控股發佈截至2017年6月30日的半年財報, 營業額約港幣57.33億元, 同比上升5.60%(公司業務收入主要來源於中國大陸, 以人民幣計價, 收入增長率為10.53%)。

其中, 神州控股的新業務收入達到4.14億港幣, 較去年同期的2.73億港幣大幅增長51.21%(人民幣同比增長58.41%),

新業務毛利達2.09億港幣, 同比增長50.75%;同時, 隨著利潤較高的新業務在營業額中的占比增加, 集團毛利率也由17.98%提升至20.12%。

在論壇上, 神州數碼控股有限公司董事局主席郭為就“大資料”這一主題, 從科學、技術、社會、哲學等層面進行了深度演講, 以下為演講內容(有刪節):

“大資料”一詞已被廣泛使用, 但很多廠商、專家和專著卻只能給出感性的概念, 以講故事居多。

我們到底應該如何理解大資料?大資料到底有什麼價值?我們該如何使用大資料?中國在大資料領域的機會在哪裡?我把自己的思考總結成以下七個點。

第一, 從科學的角度來定義, 大資料的核心是資料, 屬於數學範疇。 數學作為一門基礎學科, 和其他學科有緊密的結合,

推動了這些學科的發展。

當代有一門學科發展非常迅速, 這就是資料科學, 它既不是純粹的理論數學, 也不是純粹的數學應用, 而是專門研究資料本身的科學體系。 而“大資料”是對資料科學一種文藝化的稱呼, 我們要避免把“大資料”這個概念神秘化。

隨著互聯網和物聯網技術大規模應用以後, 資料收集和處理能力不斷提高, 人類掌握的資料樣本容量將接近無限大, 於是統計的可信性會趨近百分之百, 這時大資料得出的規律就將愈加接近真實。

因此, 資料科學旨在用最簡單、直觀的方法, 去解決複雜的系統問題。

這就引出了第二點, 在現實生活中, 人們所遇到的很多現象和系統是活的、進化的、隨機的,

這些都是複雜問題, 比如蝴蝶效應, 就完全無法用簡單的理論來解釋。

大資料的作用在這裡就突顯出來了, 我們可以在電腦裡構建各種各樣的模型疊加起來, 導入各種相關的變數, 去模仿複雜系統, 用模擬的方式來推演、預測。 地震預測和氣象預測就是非常典型的應用。

人類社會是個典型的複雜系統, 所以社會科學領域的問題非常複雜。 例如回答一個看似簡單的問題“我國是不是要開放政策允許生育二胎?”就要構建一個複雜的國家人口模型, 含有幾千個變數, 其中一兩個政策參數或變數的改變, 會引起環境、經濟、教育、醫療等等一系列的社會波動。

舉個最簡單的例子, 學齡兒童數目的波動可能會帶來教育資源分佈不均衡問題, 需要提前若干年就匹配設計相應的調整方案。設想某年小學入學人數翻倍,但師資儲備不足,可能會引發多少混亂?又或者某年大學考生數目出現斷崖式下跌,但院校招生計畫規模不變,又會使得人才培養出現什麼問題?所以針對計劃生育這樣一個政策的制訂,需要引入幾千個資料,構建幾千個變數的複雜系統。

這就是針對複雜系統大資料該如何去發揮、如何去應用的一個典型案例。從系統角度來看,大資料是簡單系統演化為複雜或者超複雜系統之後,一種可用的規律描述方法。這個意義上來講,大資料需要在系統科學的指導下來應用。而系統科學的誕生實際上就是為了解決複雜系統的問題。

這就進入到了第三個層次,也是一個更宏大的層次,我們所認知的世界究竟是什麼?

人類對世界的認知可分為三個階段:對物理世界的認知,對資料世界的認知,最後是對生命世界的認知。所有人類問題的終結很可能在於生命科學,我們必須解決生命延伸與存活環境之間的矛盾,破除生命延續的限制。

然而這三者之間是有互相關係的:沒有物質世界的科學突破,沒有量子力學的突破,就不可能有電腦用數位進行計算的發展;而沒有大資料技術的發展,就不可能有生命科學的進步。

人類基因測序的資料量是PB級的:1 PB = 1024 TB = 1048576 GB,所以今天的電腦在面對基因測序的工作量時都還存在能力不足的問題,但我們只需短暫等待,因為強大的量子電腦即將開始投入實用。

資料科學的發展會推動生命科學的發展。人類生命延續的一個重點在於攻克癌症腫瘤難關。腫瘤的病發有很多相關因素,病發後要看治療過程中的各種方法。

而未來攻克癌症的藥物一定是靶向藥,輔助以精准的、副作用最低的放射線治療,其結果就是重症醫療的個性化,癌症死亡率和致命性將極大降低。這就是資料科學和生命科學最有效的一個結合,而這需要的運算量也一定是難以想像的大。

所以產業和學界目前集中精力在研究的,就是如何提高計算能力,如何使用演算法來優化疾病和診治之間的函數關係、大資料關係。這就是由大資料構造的另一類虛擬映射。

以上是對大資料含義的闡述,再進一步需要回答,它到底能給我們帶來什麼價值?可以說,大資料就是大智慧。

今天,人工智慧(AI)這個技術非常火熱。很多人在講AI的時候把它講得很神秘。但實際上,AI也始終都是在做模擬驗證。人類在模擬很多東西的時候,是沿著兩個方向去做。一種是機理上的模仿,另一種是功能性的模仿。人工智慧是對人的一種功能性的模仿。是什麼功能呢?計算功能。它能解決的問題在本質上都是可以計算的,都是數學問題。

當然,要實現這樣的功能模仿,有三個前提條件,就是前述三條內容——資料科學的發展、對複雜系統的認知以及大量資料的積累(成為虛擬映射)。如此,電腦可以再現環境的特徵,通過一系列的演算法和函數,通過不斷的參數調節反覆運算,使得這個系統的輸入輸出結果逐漸逼近人的思維結果。

這樣,大資料和AI就可以説明我們完成很多需要重複性腦力勞動的工作,成為了人類思維和智慧的延伸。過去的發明創造主要從體力上解放人類,未來的科學技術要在智力維度上幫助人類完成更複雜的工作。這就是從大資料到大智慧的過程。

可以設想,未來,AI會在諸多領域發揮它的價值,比如醫療領域。依據腫瘤的電子影像來診斷,是需要醫生有多年經驗的,這個經驗,就是它對於影像這一現象和腫瘤這一結論之間的關係判斷。

看過一千個片子的年輕醫生肯定不如一個看過上萬的片子的老醫生判斷準確。但是,AI可以用大資料的方式去模仿人類學習看片子,判斷就可能比這個老醫生更準確。

腫瘤的放射性治療也是同理。有經驗的醫生對於放射性治療針對的位置、方向都能設計得更準確。未來可能AI也可以幫助人類做這樣的方案,減輕醫生的壓力。

對於認識世界來說,大資料就是大智慧;而對於認識人來說,管理學也會因為大資料帶來革命性的變化,這是第五點。

經驗和心理成熟度可能與管理水準有直接關係——人的認知不同,決定了管理方式不同,處理手段不同。對大資料的管理也需要高超的認知水準。我們管理大資料,除了要對物理世界產生積極可控的影響之外,也將更多地優化自身的虛擬映射,這也是大資料管理的一個新特徵。

定義一個人在過去是靠各種假想假設和驗證。而現在不需要假設,只要統計在社交網路的資料,看人在所有關係圈裡的表現即可。一個人做父親做得怎麼樣,做兒子做得是否孝順,對孩子是不是很愛護呵護,作為一個債務人是不是很講信用按時還貸,作為一個公務員是不是很愛崗敬業等等,在大資料面板之前一目了然。

可以這樣比喻:物理世界和虛擬世界之間有一扇旋轉門,推門進去就是虛擬世界,走出來就是物理世界。我們如何運用好這個旋轉門,用虛擬世界的這些新的規律、新方法、新技術來解決我們現實生活當中所面對的問題,是智慧城市最根本的一個方向。

建設社會信用體系,每個人就會很在意自己的行為,違信、違法的成本會變得越來越高——這就是用大資料來進行社會管理的最有效、最典型的一個實例。

第六點,從商業的角度來看,大資料產業裡有什麼機會?

首先要明確的是,大資料產業鏈,或者說是計算技術的產業鏈,可以分為資料獲取、資料計算、資料存儲、資料分析、應用場景和資料傳輸六個環節。

在世界範圍內,資料存儲、資料傳輸還是在靠大型IT公司支撐;資料分析行業目前是國外領先,但是由於它的多樣性,還沒能被某一家企業所壟斷,這是我國電腦產業非常好的機會;應用場景的多樣性,也決定了資料分析產業很難被一兩家公司壟斷。所以,中國電腦產業在資料獲取、資料分析和資料應用上有很多突破機會。

在資料傳輸和存儲方面,我國依然有很強的後發優勢。我國現在有國際一流的光量子技術團隊,量子計算方面已經取得了全球領先的成果。量子通訊領域,憑藉墨子號量子衛星和京滬通訊,我國也建立了領先優勢;下一步就是要解決長距離傳輸和頻寬這兩個問題,攻克之後就可以大面積改造所有通訊基礎設施,將掀起下一代通訊技術革命。

最後澄清一個概念,就是“雲”和“大資料”的關係。

除了“大資料”以外,我們也經常聽到“雲”這個概念,某種意義上大資料是它的內義,雲是它的主體,即所有的大資料都要放在雲架構上。雲的形態就是“資料中心+網路+終端”。雲與固態物體不同,沒人能夠準確感知它的形狀是什麼,但它卻承載著來自所有人的所有資料。無論人是什麼角色,不管人在做什麼,其實都在構建一個無比龐大的“雲”。而建此“雲”的目的,就是使大資料的應用價值得到最大體現。這就是雲和大資料的一種關係。

雲和大資料也有顯著的區別。例如雲強調延展性,而大資料更看重品質;雲是如何將服務送到你的手上,大資料講如何提升資料的價值。雲與大資料很難分開,因為它們彼此支持,互為中樞與脈絡,為真正的大智慧提供源源不斷的土壤與空間。

需要提前若干年就匹配設計相應的調整方案。設想某年小學入學人數翻倍,但師資儲備不足,可能會引發多少混亂?又或者某年大學考生數目出現斷崖式下跌,但院校招生計畫規模不變,又會使得人才培養出現什麼問題?所以針對計劃生育這樣一個政策的制訂,需要引入幾千個資料,構建幾千個變數的複雜系統。

這就是針對複雜系統大資料該如何去發揮、如何去應用的一個典型案例。從系統角度來看,大資料是簡單系統演化為複雜或者超複雜系統之後,一種可用的規律描述方法。這個意義上來講,大資料需要在系統科學的指導下來應用。而系統科學的誕生實際上就是為了解決複雜系統的問題。

這就進入到了第三個層次,也是一個更宏大的層次,我們所認知的世界究竟是什麼?

人類對世界的認知可分為三個階段:對物理世界的認知,對資料世界的認知,最後是對生命世界的認知。所有人類問題的終結很可能在於生命科學,我們必須解決生命延伸與存活環境之間的矛盾,破除生命延續的限制。

然而這三者之間是有互相關係的:沒有物質世界的科學突破,沒有量子力學的突破,就不可能有電腦用數位進行計算的發展;而沒有大資料技術的發展,就不可能有生命科學的進步。

人類基因測序的資料量是PB級的:1 PB = 1024 TB = 1048576 GB,所以今天的電腦在面對基因測序的工作量時都還存在能力不足的問題,但我們只需短暫等待,因為強大的量子電腦即將開始投入實用。

資料科學的發展會推動生命科學的發展。人類生命延續的一個重點在於攻克癌症腫瘤難關。腫瘤的病發有很多相關因素,病發後要看治療過程中的各種方法。

而未來攻克癌症的藥物一定是靶向藥,輔助以精准的、副作用最低的放射線治療,其結果就是重症醫療的個性化,癌症死亡率和致命性將極大降低。這就是資料科學和生命科學最有效的一個結合,而這需要的運算量也一定是難以想像的大。

所以產業和學界目前集中精力在研究的,就是如何提高計算能力,如何使用演算法來優化疾病和診治之間的函數關係、大資料關係。這就是由大資料構造的另一類虛擬映射。

以上是對大資料含義的闡述,再進一步需要回答,它到底能給我們帶來什麼價值?可以說,大資料就是大智慧。

今天,人工智慧(AI)這個技術非常火熱。很多人在講AI的時候把它講得很神秘。但實際上,AI也始終都是在做模擬驗證。人類在模擬很多東西的時候,是沿著兩個方向去做。一種是機理上的模仿,另一種是功能性的模仿。人工智慧是對人的一種功能性的模仿。是什麼功能呢?計算功能。它能解決的問題在本質上都是可以計算的,都是數學問題。

當然,要實現這樣的功能模仿,有三個前提條件,就是前述三條內容——資料科學的發展、對複雜系統的認知以及大量資料的積累(成為虛擬映射)。如此,電腦可以再現環境的特徵,通過一系列的演算法和函數,通過不斷的參數調節反覆運算,使得這個系統的輸入輸出結果逐漸逼近人的思維結果。

這樣,大資料和AI就可以説明我們完成很多需要重複性腦力勞動的工作,成為了人類思維和智慧的延伸。過去的發明創造主要從體力上解放人類,未來的科學技術要在智力維度上幫助人類完成更複雜的工作。這就是從大資料到大智慧的過程。

可以設想,未來,AI會在諸多領域發揮它的價值,比如醫療領域。依據腫瘤的電子影像來診斷,是需要醫生有多年經驗的,這個經驗,就是它對於影像這一現象和腫瘤這一結論之間的關係判斷。

看過一千個片子的年輕醫生肯定不如一個看過上萬的片子的老醫生判斷準確。但是,AI可以用大資料的方式去模仿人類學習看片子,判斷就可能比這個老醫生更準確。

腫瘤的放射性治療也是同理。有經驗的醫生對於放射性治療針對的位置、方向都能設計得更準確。未來可能AI也可以幫助人類做這樣的方案,減輕醫生的壓力。

對於認識世界來說,大資料就是大智慧;而對於認識人來說,管理學也會因為大資料帶來革命性的變化,這是第五點。

經驗和心理成熟度可能與管理水準有直接關係——人的認知不同,決定了管理方式不同,處理手段不同。對大資料的管理也需要高超的認知水準。我們管理大資料,除了要對物理世界產生積極可控的影響之外,也將更多地優化自身的虛擬映射,這也是大資料管理的一個新特徵。

定義一個人在過去是靠各種假想假設和驗證。而現在不需要假設,只要統計在社交網路的資料,看人在所有關係圈裡的表現即可。一個人做父親做得怎麼樣,做兒子做得是否孝順,對孩子是不是很愛護呵護,作為一個債務人是不是很講信用按時還貸,作為一個公務員是不是很愛崗敬業等等,在大資料面板之前一目了然。

可以這樣比喻:物理世界和虛擬世界之間有一扇旋轉門,推門進去就是虛擬世界,走出來就是物理世界。我們如何運用好這個旋轉門,用虛擬世界的這些新的規律、新方法、新技術來解決我們現實生活當中所面對的問題,是智慧城市最根本的一個方向。

建設社會信用體系,每個人就會很在意自己的行為,違信、違法的成本會變得越來越高——這就是用大資料來進行社會管理的最有效、最典型的一個實例。

第六點,從商業的角度來看,大資料產業裡有什麼機會?

首先要明確的是,大資料產業鏈,或者說是計算技術的產業鏈,可以分為資料獲取、資料計算、資料存儲、資料分析、應用場景和資料傳輸六個環節。

在世界範圍內,資料存儲、資料傳輸還是在靠大型IT公司支撐;資料分析行業目前是國外領先,但是由於它的多樣性,還沒能被某一家企業所壟斷,這是我國電腦產業非常好的機會;應用場景的多樣性,也決定了資料分析產業很難被一兩家公司壟斷。所以,中國電腦產業在資料獲取、資料分析和資料應用上有很多突破機會。

在資料傳輸和存儲方面,我國依然有很強的後發優勢。我國現在有國際一流的光量子技術團隊,量子計算方面已經取得了全球領先的成果。量子通訊領域,憑藉墨子號量子衛星和京滬通訊,我國也建立了領先優勢;下一步就是要解決長距離傳輸和頻寬這兩個問題,攻克之後就可以大面積改造所有通訊基礎設施,將掀起下一代通訊技術革命。

最後澄清一個概念,就是“雲”和“大資料”的關係。

除了“大資料”以外,我們也經常聽到“雲”這個概念,某種意義上大資料是它的內義,雲是它的主體,即所有的大資料都要放在雲架構上。雲的形態就是“資料中心+網路+終端”。雲與固態物體不同,沒人能夠準確感知它的形狀是什麼,但它卻承載著來自所有人的所有資料。無論人是什麼角色,不管人在做什麼,其實都在構建一個無比龐大的“雲”。而建此“雲”的目的,就是使大資料的應用價值得到最大體現。這就是雲和大資料的一種關係。

雲和大資料也有顯著的區別。例如雲強調延展性,而大資料更看重品質;雲是如何將服務送到你的手上,大資料講如何提升資料的價值。雲與大資料很難分開,因為它們彼此支持,互為中樞與脈絡,為真正的大智慧提供源源不斷的土壤與空間。

Next Article
喜欢就按个赞吧!!!
点击关闭提示