您的位置:首頁>正文

閉關4年,投入8億資金,500位頂級數據科學家完成了一個“髒活兒”

許多人有所不知, 國內現有的資訊化系統已經超過4000個, 平均每家醫院使用的超過100個, 這些系統對資料的結構和表達存在很大差異, 這其中有超過半數資料是自然語言的文本, 而每家醫院的科室甚至醫生對資訊的書寫方式都可能不同, 這種極度複雜性讓電腦無法理解資料且進行計算。

如果換成人工執行, 500人終其一生也無法處理數十億的病歷。

但是有這麼一家公司, 確實做到了。 經過4年的不懈努力、8億元的巨額投入, 500位科學家的執著, 縱深大量疾病研究, “在泥濘中砥礪前行, 打造未來數字醫療的基礎設施”,

最終獲得了近百家中國頂級醫療研究機構(排名前150)和政府機構的信任。 這家公司就是醫渡雲。

“20人、8億元、12億份、2000萬個”

2013年, 醫渡雲成立了一支20人的團隊。 他們憑著一股“以可用資料作為基礎的新型醫療才是未來”的信念, 花了近4年時間、8億資金只做一件事:埋首於醫療大資料、人工智慧基礎平臺研發。

至今, 他們協助醫療機構完成超過12億餘份病歷資料的數位化與資料化處理, 從中建立超過2000多萬個診斷名的標準化, 這意味著每天的病歷處理數量高達70萬份、每天至少需建立超過1.5萬個標準化診斷名。 國內排名前150家醫院中三分之二是它的合作客戶。 今年, 他們還將與10個省市政府機構, 合作建立起區域化醫療資料平臺。

“20人、8億元、12億筆、2000萬個”, 這些數字, 代表著一家中國原創公司的崛起。 或許這些數字在大多數人眼中並不特別, 但正是這些數字背後的力量在推動中國醫療改革, 用資料人工智慧改善民生。

醫渡雲正在改變中國醫療行業的樣貌。

這一波人工智慧的復興, 在中國出現了許多贏得巨額融資的初創公司, 沒有鎂光燈照射的醫渡雲在公眾界顯得有點“默默無名”。 儘管獲得大型投資機構投資, 從技術開發、落地、到串起產學研三大環節, 早已超過獨角獸的身價, 但他們從未對外公佈。

而且, 他們所做事情的起點, 實際上也是整個醫療過程中相當辛苦的部分--把原始資料變成可用資料, 即“大資料的基礎處理”。

“醫療這件事, 大家都想做,

比如說掛號、幫你找專家等, 我不否認他們的價值, 但最最基礎的工作, 把原始資料變成可用資料這種‘髒活’, 沒人願意做”醫渡雲創始人宮如璟開玩笑的說。 但事實的確如此, 建立基礎的活最難做, 就像蓋房子打地基一樣, 因此很少有初創公司會像醫渡雲一樣選擇切入技術門檻很高的基礎系統。

他們為中國醫療體系打“地基”的進展如何呢?醫渡雲處理病歷數累計12億餘份, 整理出2000多萬個診斷名。 能把分散的、非結構、非標準化的資料自動轉化成標準可用的, 而且聚集起來, 這就是醫渡雲的技術本事。

有了這個一致化的資料集後, 基礎架構平臺可以發揮效用的空間就被徹底打開了。

敢啃“硬骨頭”, 才能構建起龐大規模平臺

在諸多公司裡, 大多數是選定一、兩個領域切入, 鮮少看到一家公司像醫渡雲一樣, 戰線拉得這麼遠:開發的“醫學資料智慧平臺”(DPAP)涵蓋從基礎科研、臨床系統、醫院管理系統, 再到跨院跨區的合作共用, 但卻又能全盤統籌、協作有秩, 而非“PPT造車”式的紙上談兵。

在資料領域產生質的突破, 才能解密整個產業鏈。 這也是產業鏈中最“硬”的骨頭。 原因除了重視隱私保護的行業特性, 使得對科技的評估、導入相對較慢之外, 很多資料是屬於非結構化甚至醫生個性化的自然語言文本, 例如醫生主觀撰寫的病歷、巡診紀錄, 而且資訊散落院內各部門, 也導致了資料運用之難。

要突破這個瓶頸, 第一件事就是得有一個基礎設施平臺, 接著再讓平臺上長出各種智慧模組, 並且能與醫院現有的系統對接。

因此, 醫渡雲用三年半的時間專注開發出一個整合性極強的醫療資料處理系統, 能把原始零散的不可計算資料變成高品質可計算可應用資料, 平臺上聚集了大量知識圖譜、300種以上的智慧處理模組以及二十餘種專病庫。

這件事有多難?醫渡雲首席技術官(CTO)徐濟銘舉了一個具體的例子,同一個疾病,每位醫生的寫法可能都不同,例如“二型糖尿病”的“二”,有人寫漢字、阿拉伯數字等,還有人會寫糖尿病二型、或是Type2Diabetes,這還只是最簡單的一種,很多拗口的疾病有更多複雜的寫法,儘管在醫療診斷裡有所謂的國際疾病分類編碼標準(ICD),不過也才2萬多種,不足以應付實際情形的發展。

想要解決這個問題,就必須讓機器看懂不同說法其實都是指同一種疾病。而這個問題還只是DPAP平臺上數不清的問題中的一個“小”問題,解決它都需要電腦對自然語言中詞語的結構和語義有深刻的理解才能做得到。

而醫渡雲開發的基礎平臺可以把過去分散的、來自不同廠商的資料等,快速轉變為標準化,而且符合CFDA和美國食品藥物監督管理局(FDA)認可的資料。

300個模組功能背後的超長戰線

醫渡雲的四位創始人不斷提及的一個理念就是:“改善人類與疾病的關係”,但具體要如何“改善”?這個重任實際上就落到了他們的醫療大資料平臺上。

真正制約醫療大資料發揮價值的主要瓶頸,在於資料平臺從集成到處理,再到應用這三個維度的能力。這就意味著,僅僅將資料從不可用變為可用,只是醫渡雲使命的起點,如何在可用資料的基礎上構建出相應的應用,同樣是至關重要的一個環節。

如今,在資料智慧驅動下,其核心基礎“醫學資料智慧平臺”已經搭載了300多個應用模組,貫穿整個醫療過程。

例如在臨床輔助診療上,結構化資料按照不同的功能模組呈現,準確反映每個患者在其整個治療週期中的病情進展,DPAP通過對散落的資料整合,構建患者的時間軸模組,以診療事件時間為主線,完成疾病資料建模;從疾病的角度來看,DPAP還能夠提供疾病資料模型。而無論是疾病資料模型,還是患者診療模型,這都是臨床科研、路徑挖掘、療效評價、輔助診斷應用的基礎。

根據國際國內醫學標準,目前醫渡雲已經完成了對不少疾病的不同核心資訊的整合和識別,構建出25個大病種、3000多個疾病的模型,而這個成果數位還在不斷擴大。

目前,支撐醫渡雲所擁有的300多個功能模組的技術,涵蓋了近年來頗為關鍵的基礎演算法和人工智慧技術,涉及到醫學自然語言處理、醫學影像處理、醫學知識圖譜構建、醫療大資料採擷、大規模(深度)機器學習模型及應用等,這其中有多個專案,更是目前全球學術研究發展的熱點所在。

爬過15座山之後迎來質變

系統開發完成後,新的挑戰就是落地。醫渡雲在2017年開始將產品推向商業化,現在國內排名前150的醫院有超過三分之二成了它的客戶。

“究竟是怎麼辦到的?”得到的答案很誠實且很誠懇,“就是慢慢做,第一家是最難的,花了1年2個月才上線,前15家幾乎沒有網路效應,產能上不去,很痛苦,”宮如璟回憶說。

醫渡雲在2013年成立時,儘管行業能接受這種大資料、AI創新的理念,但部分醫院的策略仍偏保守,更大程度上是出於與商業公司進行資料合作在資料安全性與合規性上的擔心和不安。醫渡雲的資料安全技術、資料合規保障機制一步步被醫院感知,這一瓶頸才被打破。

就這樣,醫渡雲的應用產品一步一步吸引了許多專家、醫院,磁吸效應逐漸產生,而且“機器”看多了、學多了,系統就變得更聰明。例如中山大學附屬腫瘤醫院攜手醫渡雲進行大資料戰略合作,並在業內知名的《柳葉刀》(TheLancet)期刊上發表了與鼻咽癌相關的論文。目前雙方在鼻咽癌、結直腸癌和肺癌等方面都有科研合作。

“在跨越了15家客戶後,平臺網路的價值快速擴大,量變產生質變”。現在醫渡雲已處理醫院10幾年的資料,完全不用人工,最快兩周就可以完工上線。

醫療行業是一個門檻很高的行業,再加上科技巨頭、初創公司全都聚集於此,競爭更加激烈,但宮如璟毫不畏懼,她的信心來源很簡單也很困難,就是團隊的技術實力。

宮如璟在英國求學期間蟬聯了五年全英數學冠軍,在華爾街投行14年的歷練;CEO孫喆曾聯合創立北京惠旭金信,主要關注醫療行業投資,在醫療行業有豐富的投資和經營實踐經驗。

CTO徐濟銘則是中國科學院研究生院電腦應用專業碩士,曾負責百度搜索服務團隊、框計算團隊等核心技術團隊,也曾獲選百度最有價值員工。首席戰略官(CSO)何直,早先曾是阿裡巴巴集團產品總監,領導了天貓大資料平臺建設,在連續創業的歷程中,先後創立了專攻大資料採擷的精准行銷軟體及服務的杭州數雲資訊等四家公司。

宮如璟笑著說,現任首席資料科學家彭濤,“還是當時跟今日頭條搶的,他加入的原因是他覺得我們的東西更難,有挑戰”。很多員工都是基於想要一起改變中國醫療現狀的這股熱情而加入。

去年底,醫渡雲找來了前微軟亞洲研究院資深研究經理,專攻自然語言處理與知識工程研究的閆峻,出任首席人工智慧科學家,並且延攬了美國斯坦福大學統計系教授王永雄,擔任首席資料科學顧問,強化了這家學霸公司的陣容。

隨著業務快速增長,團隊人數過去幾年都是翻倍的增長,到了今年底預計會達到800餘人,其中研發團隊占比高達60%以上,大部分都是來自全球/國內的知名互聯網公司和頂尖實驗室;還有20%的團隊是完全專注在醫學領域,因此整家公司有高達80%以上的人力資源都是在做醫療領域研發。

跨區整合,資料智慧輻射至藥物研發和醫保

在與醫療機構的順利合作之後,醫渡雲將目光放得更遠。孫喆透露,建立跨區的資料中心將是今年的工作重點,預計建立10個左右省級層面的區域醫療資料中心。

醫療資料中心會把當地的三甲醫院、二級、三級醫院的資料通通集中到這個區域的雲平臺上,因為跨院資料的集中共用,説明患者能夠建立起一個完整的患者健康檔案,患者不必帶著病歷到處跑,醫院之間也能有效的為患者做全面的健康類服務。

對於藥物研發的效益,醫渡雲希望推動醫院和醫院之間的聯合。例如每一家醫院現在都有自己的新藥研發基地,當製藥企業某個新藥研發專案聯合區域的時候,承接能力會變得更強,將會加快新藥上市。“同時也可對政府提供整個公共決策的支撐”孫喆強調。

去年,醫渡雲與重慶醫科大學聯合共建了重慶醫科大學醫渡雲醫學資料研究院,成為國家首個醫學資料二級學院。一同與國家食品藥品監督管理總局(CFDA)展開了藥品不良反應的合作,基於整個重慶區域人群分析基礎之上,有效分析出該區域的藥品使用情況、具有重慶特殊性的不良反應等,這就是區域平臺的龐大效能。

通過這樣的合作,除了瞭解中國藥品不良反應的發生情況,還有一個很大的意義在於拉動製藥產業,以及建立一個聚集產管學研力量的優質監測機制。

由此可見,醫渡雲的服務已經從最初只面向醫療機構,走到了區域平臺、輔助公共決策的層次上。

不久前,醫渡雲也與南京醫科大學簽約,作為合作夥伴承建江蘇省轉化研究院國家級新藥創制專案的資訊平臺,致力於“讓藥品的研發必須朝品質更好、更安全、更便宜”。

除了臨床試驗外,新藥上市後的不良反應監管一直也是業界的難題。

傳統模式下,這種監管依賴于醫生的主動上報,或者企業需要調動非常多的人力資源,在新藥上市後去醫院採集相關的資訊。整個過程高度容易產生錯誤、疏漏。為了解決這個問題,醫渡雲承接了重慶醫科大學和CFDA不良反應管理中心的專項課題,研發基於大資料和演算法的智慧監察系統。

而制約醫療行業變革的另一個核心因素則是醫保的管理。只有醫保作為支付方能更加科學的去評估一個疾病的支付方式和定價,才能從根本上幫助整個醫療市場形成良性迴圈。

近期,醫渡雲即將宣佈與清華大學自動化系合作建立智慧醫療自主系統聯合研究中心,針對醫保領域的應用從理論和方法上進一步深入創新。未來面向醫保的應用不論是核心技術或系統架構設計將會不停向上升級。

醫渡雲現在正在做的,就是幫助醫療產業和外部產業融合。近日,醫渡雲與人民健康在醫療大資料領域在推動醫療創新產業發展、共同搭建人民健康雲平臺、醫療資料品質評價體系研究與評價標準制定等方面開展廣泛合作,在醫療健康服務創新領域開展積極探索,助力“健康中國”戰略實施和“國家大資料戰略”落地。這不僅牽涉到14億人的健康,如果發展得順利,還可以為全人類做出貢獻。畢竟,互聯網+醫療健康已經成為中國醫療行業變革的重要舉措,醫渡雲將披荊斬棘、砥礪前行。

這件事有多難?醫渡雲首席技術官(CTO)徐濟銘舉了一個具體的例子,同一個疾病,每位醫生的寫法可能都不同,例如“二型糖尿病”的“二”,有人寫漢字、阿拉伯數字等,還有人會寫糖尿病二型、或是Type2Diabetes,這還只是最簡單的一種,很多拗口的疾病有更多複雜的寫法,儘管在醫療診斷裡有所謂的國際疾病分類編碼標準(ICD),不過也才2萬多種,不足以應付實際情形的發展。

想要解決這個問題,就必須讓機器看懂不同說法其實都是指同一種疾病。而這個問題還只是DPAP平臺上數不清的問題中的一個“小”問題,解決它都需要電腦對自然語言中詞語的結構和語義有深刻的理解才能做得到。

而醫渡雲開發的基礎平臺可以把過去分散的、來自不同廠商的資料等,快速轉變為標準化,而且符合CFDA和美國食品藥物監督管理局(FDA)認可的資料。

300個模組功能背後的超長戰線

醫渡雲的四位創始人不斷提及的一個理念就是:“改善人類與疾病的關係”,但具體要如何“改善”?這個重任實際上就落到了他們的醫療大資料平臺上。

真正制約醫療大資料發揮價值的主要瓶頸,在於資料平臺從集成到處理,再到應用這三個維度的能力。這就意味著,僅僅將資料從不可用變為可用,只是醫渡雲使命的起點,如何在可用資料的基礎上構建出相應的應用,同樣是至關重要的一個環節。

如今,在資料智慧驅動下,其核心基礎“醫學資料智慧平臺”已經搭載了300多個應用模組,貫穿整個醫療過程。

例如在臨床輔助診療上,結構化資料按照不同的功能模組呈現,準確反映每個患者在其整個治療週期中的病情進展,DPAP通過對散落的資料整合,構建患者的時間軸模組,以診療事件時間為主線,完成疾病資料建模;從疾病的角度來看,DPAP還能夠提供疾病資料模型。而無論是疾病資料模型,還是患者診療模型,這都是臨床科研、路徑挖掘、療效評價、輔助診斷應用的基礎。

根據國際國內醫學標準,目前醫渡雲已經完成了對不少疾病的不同核心資訊的整合和識別,構建出25個大病種、3000多個疾病的模型,而這個成果數位還在不斷擴大。

目前,支撐醫渡雲所擁有的300多個功能模組的技術,涵蓋了近年來頗為關鍵的基礎演算法和人工智慧技術,涉及到醫學自然語言處理、醫學影像處理、醫學知識圖譜構建、醫療大資料採擷、大規模(深度)機器學習模型及應用等,這其中有多個專案,更是目前全球學術研究發展的熱點所在。

爬過15座山之後迎來質變

系統開發完成後,新的挑戰就是落地。醫渡雲在2017年開始將產品推向商業化,現在國內排名前150的醫院有超過三分之二成了它的客戶。

“究竟是怎麼辦到的?”得到的答案很誠實且很誠懇,“就是慢慢做,第一家是最難的,花了1年2個月才上線,前15家幾乎沒有網路效應,產能上不去,很痛苦,”宮如璟回憶說。

醫渡雲在2013年成立時,儘管行業能接受這種大資料、AI創新的理念,但部分醫院的策略仍偏保守,更大程度上是出於與商業公司進行資料合作在資料安全性與合規性上的擔心和不安。醫渡雲的資料安全技術、資料合規保障機制一步步被醫院感知,這一瓶頸才被打破。

就這樣,醫渡雲的應用產品一步一步吸引了許多專家、醫院,磁吸效應逐漸產生,而且“機器”看多了、學多了,系統就變得更聰明。例如中山大學附屬腫瘤醫院攜手醫渡雲進行大資料戰略合作,並在業內知名的《柳葉刀》(TheLancet)期刊上發表了與鼻咽癌相關的論文。目前雙方在鼻咽癌、結直腸癌和肺癌等方面都有科研合作。

“在跨越了15家客戶後,平臺網路的價值快速擴大,量變產生質變”。現在醫渡雲已處理醫院10幾年的資料,完全不用人工,最快兩周就可以完工上線。

醫療行業是一個門檻很高的行業,再加上科技巨頭、初創公司全都聚集於此,競爭更加激烈,但宮如璟毫不畏懼,她的信心來源很簡單也很困難,就是團隊的技術實力。

宮如璟在英國求學期間蟬聯了五年全英數學冠軍,在華爾街投行14年的歷練;CEO孫喆曾聯合創立北京惠旭金信,主要關注醫療行業投資,在醫療行業有豐富的投資和經營實踐經驗。

CTO徐濟銘則是中國科學院研究生院電腦應用專業碩士,曾負責百度搜索服務團隊、框計算團隊等核心技術團隊,也曾獲選百度最有價值員工。首席戰略官(CSO)何直,早先曾是阿裡巴巴集團產品總監,領導了天貓大資料平臺建設,在連續創業的歷程中,先後創立了專攻大資料採擷的精准行銷軟體及服務的杭州數雲資訊等四家公司。

宮如璟笑著說,現任首席資料科學家彭濤,“還是當時跟今日頭條搶的,他加入的原因是他覺得我們的東西更難,有挑戰”。很多員工都是基於想要一起改變中國醫療現狀的這股熱情而加入。

去年底,醫渡雲找來了前微軟亞洲研究院資深研究經理,專攻自然語言處理與知識工程研究的閆峻,出任首席人工智慧科學家,並且延攬了美國斯坦福大學統計系教授王永雄,擔任首席資料科學顧問,強化了這家學霸公司的陣容。

隨著業務快速增長,團隊人數過去幾年都是翻倍的增長,到了今年底預計會達到800餘人,其中研發團隊占比高達60%以上,大部分都是來自全球/國內的知名互聯網公司和頂尖實驗室;還有20%的團隊是完全專注在醫學領域,因此整家公司有高達80%以上的人力資源都是在做醫療領域研發。

跨區整合,資料智慧輻射至藥物研發和醫保

在與醫療機構的順利合作之後,醫渡雲將目光放得更遠。孫喆透露,建立跨區的資料中心將是今年的工作重點,預計建立10個左右省級層面的區域醫療資料中心。

醫療資料中心會把當地的三甲醫院、二級、三級醫院的資料通通集中到這個區域的雲平臺上,因為跨院資料的集中共用,説明患者能夠建立起一個完整的患者健康檔案,患者不必帶著病歷到處跑,醫院之間也能有效的為患者做全面的健康類服務。

對於藥物研發的效益,醫渡雲希望推動醫院和醫院之間的聯合。例如每一家醫院現在都有自己的新藥研發基地,當製藥企業某個新藥研發專案聯合區域的時候,承接能力會變得更強,將會加快新藥上市。“同時也可對政府提供整個公共決策的支撐”孫喆強調。

去年,醫渡雲與重慶醫科大學聯合共建了重慶醫科大學醫渡雲醫學資料研究院,成為國家首個醫學資料二級學院。一同與國家食品藥品監督管理總局(CFDA)展開了藥品不良反應的合作,基於整個重慶區域人群分析基礎之上,有效分析出該區域的藥品使用情況、具有重慶特殊性的不良反應等,這就是區域平臺的龐大效能。

通過這樣的合作,除了瞭解中國藥品不良反應的發生情況,還有一個很大的意義在於拉動製藥產業,以及建立一個聚集產管學研力量的優質監測機制。

由此可見,醫渡雲的服務已經從最初只面向醫療機構,走到了區域平臺、輔助公共決策的層次上。

不久前,醫渡雲也與南京醫科大學簽約,作為合作夥伴承建江蘇省轉化研究院國家級新藥創制專案的資訊平臺,致力於“讓藥品的研發必須朝品質更好、更安全、更便宜”。

除了臨床試驗外,新藥上市後的不良反應監管一直也是業界的難題。

傳統模式下,這種監管依賴于醫生的主動上報,或者企業需要調動非常多的人力資源,在新藥上市後去醫院採集相關的資訊。整個過程高度容易產生錯誤、疏漏。為了解決這個問題,醫渡雲承接了重慶醫科大學和CFDA不良反應管理中心的專項課題,研發基於大資料和演算法的智慧監察系統。

而制約醫療行業變革的另一個核心因素則是醫保的管理。只有醫保作為支付方能更加科學的去評估一個疾病的支付方式和定價,才能從根本上幫助整個醫療市場形成良性迴圈。

近期,醫渡雲即將宣佈與清華大學自動化系合作建立智慧醫療自主系統聯合研究中心,針對醫保領域的應用從理論和方法上進一步深入創新。未來面向醫保的應用不論是核心技術或系統架構設計將會不停向上升級。

醫渡雲現在正在做的,就是幫助醫療產業和外部產業融合。近日,醫渡雲與人民健康在醫療大資料領域在推動醫療創新產業發展、共同搭建人民健康雲平臺、醫療資料品質評價體系研究與評價標準制定等方面開展廣泛合作,在醫療健康服務創新領域開展積極探索,助力“健康中國”戰略實施和“國家大資料戰略”落地。這不僅牽涉到14億人的健康,如果發展得順利,還可以為全人類做出貢獻。畢竟,互聯網+醫療健康已經成為中國醫療行業變革的重要舉措,醫渡雲將披荊斬棘、砥礪前行。

同類文章
Next Article
喜欢就按个赞吧!!!
点击关闭提示