您的位置:首頁>正文

道阻且長,行則將至:資料院四周年系列報導之科研篇

[編者按]作為一個研究院, 衡量實力的一大重要標準是其科研的能力和成果。 資料科學研究院(以下簡稱:資料院)作為高校的非實體教學科研機構, 並沒有隸屬自己編制的老師或研究人員, 想要將最重要的科研工作搞起來, 勢必要探索出一條新的路徑。 本文將帶你瞭解資料院在科研領域的從零到一, 有著怎樣的建設思路和歷程。

筆者採訪資料院創建之初的參與者, 時任清華大學研究生院副院長, 現任教育研究院黨總支書記劉惠琴老師時, 劉老師在肯定資料院四年成績的同時, 還念念不忘設計資料院時的“初心”:學校希望整合全校資料到資料院,

不同的人進行不同的授權, 建成一個資料分析平臺, 進而再成立大資料國家實驗室, 去整合、處理國家量級的資料。

知時而起, 知難而進

在大約12平米的辦公室裡, 資料院科學研究部首席架構師黎成權正在向韓亦舜院長彙報清華醫學研究資料平臺的建設進展:“目前參與合作的單位有5家, 還有5家正在談。 ”平臺搭建工作緊鑼密鼓開展了10個月, 心氣很高的黎成權認為這樣的進展速度還不夠理想。

平臺開發團隊與醫院資訊科人員進行資料對接合作

清華臨床醫學科研資料平臺(以下簡稱:醫學資料平臺)是資料院與清華臨床醫學院牽頭搭建的一個醫療資料共用平臺。 希望將醫院的醫學專家和校內的工科專家聚在一起, 共同打造一個醫療資料共用資源池, 實現醫療資料的彙集、整理和儲存, 並為高校和醫學界的研究者提供研究素材, 更好的發揮醫療資料價值。 這個平臺被比喻為“醫工結合”鴻溝上的一座橋。

“沒有人做這件事, 也沒有人敢做這件事, 這絕對開創了國內的先河。 ”清華大學生物醫學影像研究中心研究院趙錫海這樣評價資料院帶頭搭建醫學資料平臺。 從平臺建設之初, 趙錫海就被韓院長邀請參與到平臺建設中來, 他非常瞭解其意義:“現在有大量的醫療資料堆積在醫院或醫療機構, 他們不能丟, 也不敢用;學校的老師需要真實的資料用於醫學研究, 他們有需求, 但是要不到資料。 必須有一個人去打破這樣的惡性循環, 資料院在做的這件事真的夠大膽, 如能做成, 將為社會創造極大的價值。 ”

趙老師冠以資料院“大膽”二字, 是因為他清楚平臺搭建過程中的每個環節都面臨挑戰:從國家層面, 資料開放共用是大趨勢;從實操層面,

醫療資料的開放共用還沒有解決好法律環境的支撐。 同時, 醫療資料沒有明確的歸屬權, 想要使用資料是否需要跟每一個患者簽訂相應的協定, 這又是一個問題;資料處理環節, 需要與擁有資料的部門逐一溝通, 怎樣打通壁壘實現資料融合、怎樣給醫療資料脫敏、怎樣識別複雜的醫療資料都需要付出大量人力精力;研究成果環節, 還涉及一個現實的問題, 由醫學、工科等專家跨學科、跨領域合作, 所得出的研究成果如何分配......

其難重重, 其路漫漫。 我們不禁疑問, 韓亦舜院長因何決定要做這件事, 且堅持要做下去。 提及平臺搭建的初衷, 韓亦舜院長回憶道:“我曾三天兩頭往醫院跑, 去參加醫生的讀片會、去纏著醫生看電子顯微鏡下的病理切片、去與科室主任交流,

甚至去參加患者及家屬組織的活動。 別人總問, 你不懂醫, 為什麼要做這些?我是去傾聽, 去思考應該從哪裡破局健康醫療大資料, 去觀察醫生間的知識是如何傳承的, 去瞭解患者的真實需求是什麼, 去發現醫生最不想做又不得不做的事情是什麼?有一次看到他們統計病理切片中的細胞數量, 研究人員在顯微鏡下觀察, 手中拿著計數器一下一下按鍵計數。 當時給我的觸動非常大。 縱然醫學領域很多複雜功能暫時難以用機器智慧解決, 但這樣統計細胞數量, 利用資料科學領域的圖像識別是有可能解決的事情。 當時我就下定決心, 要實現醫工結合, 而且無論如何都要做成。”

董家鴻和韓亦舜共同簽署合作協定

清華長庚醫院作為搭建醫學資料平臺的合作方,正是因為清華大學臨床醫學院院長、北京清華長庚醫院執行院長董家鴻院士在抱有同樣的初衷下與韓院長一拍即合。董家鴻說,這樣一個資料融合的平臺想做起來太難,面臨很多否定和阻礙,只有資料院是從始至終無條件在支援推動醫工結合,也正是資料院這股“韌勁兒”打動了他。董家鴻和韓亦舜都抱有同一個信念:這件事意義非常,我們要做下去,且要做好。

目前依託清華長庚醫院的“單中心多病種平臺”和聚焦肝膽疾病的“多中心單病種平臺”都有了雛形,校內老師的目光陸續投向了這裡。

千淘萬漉雖辛苦,吹盡寒沙始到金

在坎坷探索醫工結合之路的同時,資料院在交通大資料領域的研究也在艱難推進。“要加快建設交通管理大資料分析研判平臺,提高預測預警能力;要推廣應用交通集成指揮平臺,逐步實現道路狀況自動感知、交通態勢自動研判、路況資訊自動發佈等功能……”2018年年初,貴州省舉辦的交警系統貫徹全國公安廳局長座談會精神動員部署會上, 公安部副部長李偉在講話中強調了資料科學在交通領域的應用。而他作為典型提及的大資料分析研判、應用交通集成指揮等平臺或功能正是資料院交通大資料研究中心貴州省合作的研究:複合型大資料交通態勢感知智慧指揮中心。

複合型大資料交通態勢感知智慧指揮中心是資料院交通大資料研究中心團隊與貴州省公安廳交通管理局合作開展的課題研究,專注于利用交通模擬、大資料學習、機器學習和深度學習技術,融合多達100類跨界多類型、多源頭大資料,實現交通態勢和交通風險的感知,將交通安全管理從被動的事後應對處置轉變為交通風險的主動的事前預警處理、事中快速疏導,從而降低交通事故死亡率,優化交通管理和治理,更好的服務人民群眾。

胡主任與團隊成員在討論交通風險預警系統

“現在的系統還不完美,但是已經有過小試牛刀。例如去年發生的黃果樹瀑布擁堵事件,我們通過感知交通態勢和發送風險預警,成功規避了潛在的交通事故,化解了各類危機。”資料院交通大資料研究中心副主任胡慶勇提起他們在做的事,自然流露出自信和驕傲。當時臨近春節,胡總和他的團隊已經打響了春運安全保障實戰:“每當別人放假的時候,就是我們最忙的時候。”胡總說,“因為我們搞的是交通管理大資料,我們做的風險預警早一秒都有可能避免一場交通事故,這是人命關天的事。”為了跟春運搶時間,團隊大部分成員都從北京轉移到貴州省交管局科研所的辦公室辦公,每天加班到深夜。今年春運期間,他們總共發起了135次智慧誘導任務,惠及了700多萬人,後期資料分析也表明了誘導效果是明顯的,收到誘導資訊提示後延遲出行的交通參與者比例達到14%以上。

清華“出身”的胡慶勇思維敏捷、語速飛快、極注重效率,他對自己的團隊要求非常嚴格:“資料時代的技術、應用都日新月異,我們在做的事情沒有前車之鑒,必須要拼速度、拼實力才能向前走,不然就等著被淘汰。”他同樣也強調情懷,因為中心在做的研究在全國都屬於開創性的工作,每一步的推進都要克服諸多難關,沒有情懷,不可能堅持下來。他針對資料來源舉例道:“做交通大資料領域的研究,得收集電信運營商、交管局、互聯網門戶等各類資料,但是人人都謹慎,最初我們沒有成果,得讓對方知道我們要做什麼,讓對方認可我們的價值。此外,部分資料是不開放的,需要我們部署相關系統遠端處理資料再拿來用,從而實現客流分析。實現過程非常艱難,耗費了大量的人力物力成本。”

胡慶勇與團隊成員在貴州省交管局的辦公室討論工作

資料院交通大資料研究中心由清華大學教授、清華大學交通研究所所長陸化普領軍,憑藉其深厚的學術科研背景為國家交通管理大資料提供“智庫”支援;有企業經歷的胡慶勇擔任中心副主任,充分發揮企業優勢,使得中心能夠以問題引導,讓科研落地到實際應用。目前,中心在貴州、內蒙、雲南等多地進行了科研部署,也終於從零逐漸突破到一。細數這些年的工作和進展,胡慶勇感慨萬千:“我一直非常認可資料院RONG的理念,只有大家都擁有包容、融合的心態,資料才能夠被更好的開發利用,發揮更大價值,我們的工作也會有更快的進展。我的小目標是拿(jian)下(li)十個不同環境類型的省份(合作關係),讓清華資料院的交通大資料研究中心,在省域交通管理領域佔有一席地位。那時候我們中心就牛了。韓老師還曾答應會重重獎勵我,嘿嘿。”

在資料的彙聚和應用領域,貴州交警走在了前面,清華資料院的理念與技能會支持貴州交警繼續引領大資料的應用。

要高峰,也要高原

採訪中,無論是劉惠琴、董家鴻、趙錫海這幾位元資料科研平臺建設宣導者的代表,還是黎成權、胡慶勇等資料科研平臺建設實踐者的代表,都負有強烈的使命感和責任感。

“這是一個必須帶著情懷才能堅持做下去的事情。平心而論,搭建這樣的資料平臺,特別是早期的工作,的確沒有多少學術價值。很多人問過我:這些代表清華的水準嗎?對資料院有什麼意義?”經過長長寂靜,韓老師接著說“我真不知道該如何回答。我認定,它對清華基於資料驅動的科研有意義,對大資料的應用落地有意義。從醫生們、老師們興奮的眼神中,從合作夥伴步步提高的成績中,我堅信它有意義。我就去做吧,數據院就去做吧。”

事實上,資料院始終在為這一目標努力著,例如與臨床醫學院合作搭建的清華臨床醫學科研資料平臺、與電腦系和法學院共同搭建的司法資料平臺等都在進行不同領域的資料彙集,但這終歸是一個長遠的目標,推進起來不容易。韓亦舜表示:“一方面我們還沒有較為完善的資料使用和管理規範,一方面不同領域、學科的人需要很好的溝通理解才能進行有效合作。想要推進這件事,沒有速成方法,就要靠不斷溝通、探索和嘗試。這些事情如果沒人肯幹,我們國家的大資料研究和應用落地都難以推進。所以我打定主意要做破局的那個人。在科研方向,資料院歡迎所有人以資料院作為平臺開展研究,當然資料院也要求來這裡的人必須擁有開放的心態。資料融合是發揮資料價值的第一步,做成了我就值了。如果我不做,總覺得是我的遺憾。我不想留下遺憾。”

清華文化中,“自強不息”固然說的是清華人的奮鬥精神,“厚德載物”更是體現清華人對自我的要求,說的是情懷。“引領一流大資料科研”是資料院的使命,也是清華大資料人的使命。如今的資料院在科研方向逐漸實現從零到一的突破,但這一切僅僅是開始。面對資料科學這條雄關漫道,資料院始終不忘初心,向前邁進。

今天的清華科研,要高峰,也要高原,要頂天,也要立地!我們來了,我們是認真的。

預告:

全國200餘所高校開展大資料教育

清華有何不同?

大資料π型人才培養之路

困難何在?

面對打擊,

資料院女漢子們如何走過?

“資料院四周年報導之教學篇”

為大家講述人才培養方向的探索與實踐

本周日晚,敬請關注。

而且無論如何都要做成。”

董家鴻和韓亦舜共同簽署合作協定

清華長庚醫院作為搭建醫學資料平臺的合作方,正是因為清華大學臨床醫學院院長、北京清華長庚醫院執行院長董家鴻院士在抱有同樣的初衷下與韓院長一拍即合。董家鴻說,這樣一個資料融合的平臺想做起來太難,面臨很多否定和阻礙,只有資料院是從始至終無條件在支援推動醫工結合,也正是資料院這股“韌勁兒”打動了他。董家鴻和韓亦舜都抱有同一個信念:這件事意義非常,我們要做下去,且要做好。

目前依託清華長庚醫院的“單中心多病種平臺”和聚焦肝膽疾病的“多中心單病種平臺”都有了雛形,校內老師的目光陸續投向了這裡。

千淘萬漉雖辛苦,吹盡寒沙始到金

在坎坷探索醫工結合之路的同時,資料院在交通大資料領域的研究也在艱難推進。“要加快建設交通管理大資料分析研判平臺,提高預測預警能力;要推廣應用交通集成指揮平臺,逐步實現道路狀況自動感知、交通態勢自動研判、路況資訊自動發佈等功能……”2018年年初,貴州省舉辦的交警系統貫徹全國公安廳局長座談會精神動員部署會上, 公安部副部長李偉在講話中強調了資料科學在交通領域的應用。而他作為典型提及的大資料分析研判、應用交通集成指揮等平臺或功能正是資料院交通大資料研究中心貴州省合作的研究:複合型大資料交通態勢感知智慧指揮中心。

複合型大資料交通態勢感知智慧指揮中心是資料院交通大資料研究中心團隊與貴州省公安廳交通管理局合作開展的課題研究,專注于利用交通模擬、大資料學習、機器學習和深度學習技術,融合多達100類跨界多類型、多源頭大資料,實現交通態勢和交通風險的感知,將交通安全管理從被動的事後應對處置轉變為交通風險的主動的事前預警處理、事中快速疏導,從而降低交通事故死亡率,優化交通管理和治理,更好的服務人民群眾。

胡主任與團隊成員在討論交通風險預警系統

“現在的系統還不完美,但是已經有過小試牛刀。例如去年發生的黃果樹瀑布擁堵事件,我們通過感知交通態勢和發送風險預警,成功規避了潛在的交通事故,化解了各類危機。”資料院交通大資料研究中心副主任胡慶勇提起他們在做的事,自然流露出自信和驕傲。當時臨近春節,胡總和他的團隊已經打響了春運安全保障實戰:“每當別人放假的時候,就是我們最忙的時候。”胡總說,“因為我們搞的是交通管理大資料,我們做的風險預警早一秒都有可能避免一場交通事故,這是人命關天的事。”為了跟春運搶時間,團隊大部分成員都從北京轉移到貴州省交管局科研所的辦公室辦公,每天加班到深夜。今年春運期間,他們總共發起了135次智慧誘導任務,惠及了700多萬人,後期資料分析也表明了誘導效果是明顯的,收到誘導資訊提示後延遲出行的交通參與者比例達到14%以上。

清華“出身”的胡慶勇思維敏捷、語速飛快、極注重效率,他對自己的團隊要求非常嚴格:“資料時代的技術、應用都日新月異,我們在做的事情沒有前車之鑒,必須要拼速度、拼實力才能向前走,不然就等著被淘汰。”他同樣也強調情懷,因為中心在做的研究在全國都屬於開創性的工作,每一步的推進都要克服諸多難關,沒有情懷,不可能堅持下來。他針對資料來源舉例道:“做交通大資料領域的研究,得收集電信運營商、交管局、互聯網門戶等各類資料,但是人人都謹慎,最初我們沒有成果,得讓對方知道我們要做什麼,讓對方認可我們的價值。此外,部分資料是不開放的,需要我們部署相關系統遠端處理資料再拿來用,從而實現客流分析。實現過程非常艱難,耗費了大量的人力物力成本。”

胡慶勇與團隊成員在貴州省交管局的辦公室討論工作

資料院交通大資料研究中心由清華大學教授、清華大學交通研究所所長陸化普領軍,憑藉其深厚的學術科研背景為國家交通管理大資料提供“智庫”支援;有企業經歷的胡慶勇擔任中心副主任,充分發揮企業優勢,使得中心能夠以問題引導,讓科研落地到實際應用。目前,中心在貴州、內蒙、雲南等多地進行了科研部署,也終於從零逐漸突破到一。細數這些年的工作和進展,胡慶勇感慨萬千:“我一直非常認可資料院RONG的理念,只有大家都擁有包容、融合的心態,資料才能夠被更好的開發利用,發揮更大價值,我們的工作也會有更快的進展。我的小目標是拿(jian)下(li)十個不同環境類型的省份(合作關係),讓清華資料院的交通大資料研究中心,在省域交通管理領域佔有一席地位。那時候我們中心就牛了。韓老師還曾答應會重重獎勵我,嘿嘿。”

在資料的彙聚和應用領域,貴州交警走在了前面,清華資料院的理念與技能會支持貴州交警繼續引領大資料的應用。

要高峰,也要高原

採訪中,無論是劉惠琴、董家鴻、趙錫海這幾位元資料科研平臺建設宣導者的代表,還是黎成權、胡慶勇等資料科研平臺建設實踐者的代表,都負有強烈的使命感和責任感。

“這是一個必須帶著情懷才能堅持做下去的事情。平心而論,搭建這樣的資料平臺,特別是早期的工作,的確沒有多少學術價值。很多人問過我:這些代表清華的水準嗎?對資料院有什麼意義?”經過長長寂靜,韓老師接著說“我真不知道該如何回答。我認定,它對清華基於資料驅動的科研有意義,對大資料的應用落地有意義。從醫生們、老師們興奮的眼神中,從合作夥伴步步提高的成績中,我堅信它有意義。我就去做吧,數據院就去做吧。”

事實上,資料院始終在為這一目標努力著,例如與臨床醫學院合作搭建的清華臨床醫學科研資料平臺、與電腦系和法學院共同搭建的司法資料平臺等都在進行不同領域的資料彙集,但這終歸是一個長遠的目標,推進起來不容易。韓亦舜表示:“一方面我們還沒有較為完善的資料使用和管理規範,一方面不同領域、學科的人需要很好的溝通理解才能進行有效合作。想要推進這件事,沒有速成方法,就要靠不斷溝通、探索和嘗試。這些事情如果沒人肯幹,我們國家的大資料研究和應用落地都難以推進。所以我打定主意要做破局的那個人。在科研方向,資料院歡迎所有人以資料院作為平臺開展研究,當然資料院也要求來這裡的人必須擁有開放的心態。資料融合是發揮資料價值的第一步,做成了我就值了。如果我不做,總覺得是我的遺憾。我不想留下遺憾。”

清華文化中,“自強不息”固然說的是清華人的奮鬥精神,“厚德載物”更是體現清華人對自我的要求,說的是情懷。“引領一流大資料科研”是資料院的使命,也是清華大資料人的使命。如今的資料院在科研方向逐漸實現從零到一的突破,但這一切僅僅是開始。面對資料科學這條雄關漫道,資料院始終不忘初心,向前邁進。

今天的清華科研,要高峰,也要高原,要頂天,也要立地!我們來了,我們是認真的。

預告:

全國200餘所高校開展大資料教育

清華有何不同?

大資料π型人才培養之路

困難何在?

面對打擊,

資料院女漢子們如何走過?

“資料院四周年報導之教學篇”

為大家講述人才培養方向的探索與實踐

本周日晚,敬請關注。

同類文章
Next Article
喜欢就按个赞吧!!!
点击关闭提示