您的位置:首頁>科技>正文

中國或成醫療AI最大市場,誰能成就醫學界 ImageNet?|垂直AI特稿

新智元原創

新智元於3月25日參加智慧未來·醫療人工智慧峰會, 活動由匯醫慧影、英特爾醫療等聯合主辦。 其中匯醫慧影成立於2015年,

其創始人柴象飛兩年前從斯坦福大學回到國內, 那時候他覺得春雨醫生做的非常好, 讓他看到了醫療影像在商業模式上的巨大創新。 因此他和郭娜一起創立了匯醫慧影, 致力於發掘醫療影像資料價值, 以最前沿的雲計算、大資料和人工智慧技術, 打造智慧醫學影像平臺和腫瘤放療平臺。 在這一過程中, 英特爾醫療提供了很多支援, 匯醫慧影也成為了英特爾聯合實驗室的一員。

參與本次醫療AI峰會的嘉賓有英特爾醫療與生命科學部亞太區總經理李亞東, 匯醫慧影創始人柴象飛和郭娜, 藍馳創投合夥人陳維廣, 斯坦福大學放療科終身教授邢磊, 跨入到醫療界的國際核能院院士張勤, 萬方資料股份有限公司副總經理張秀梅,

鄭大五附院黨委書記王新軍和某著名設備商代表。 本文綜合了會場演講、論壇和新智元對斯坦福醫療AI專家邢磊的專訪內容, 讓我們破除迷信, 跟隨AI技術大牛和醫療行業大拿一起揭開中國醫療AI之現狀。

強化深度學習:醫療AI最有前途的技術?

自從2012年深度學習技術被引入到圖像識別資料集ImageNet(做為測試標準), 其識別率近年屢創新高, 並且在某些領域如圖像分類等方面達到人類水準。 深度學習技術加上醫療影像領域累積多年的資料, 給這一領域帶來了令人驚喜的突破。

新智元曾經報導過斯坦福的研究人員發佈在Nature上的研究, CNN做皮膚癌診斷, 與21位皮膚科醫生對比測試, 結果系統的精確度與人類醫生相當(“至少”91%)。

還有JAMA上發佈的利用CNN對糖尿病視網膜病變的診斷, 結果表明, 其演算法的性能與眼科醫生的性能一致。

CNN在醫學上的應用可謂在頂級刊物上連放大招, 那麼深度學習技術是醫學影像領域效果最好的技術嗎?

斯坦福大學邢磊教授告訴新智元:深度學習及強化深度學習, 代表目前新潮的技術, 它們能解決很多以前不能解決的問題, 把醫療AI推向新的高潮。

深度學習

強化深度學習在2016年初AlphaGo對戰李世乭中大放異彩。 AlphaGo學習棋譜到了一定程度, 就可在和對手及自己對弈的大量棋局中, 使用強化學習來進一步改善它, 這可以說是它不斷超越自己, 最終戰勝人類冠軍的關鍵所在。 作為一種有效的機器學習方法, 強化學習主要研究在特定情境或環境下的操作方式,

使得獎勵信號最大化。 同樣在醫療AI的決策過程中, 一個程式操作會常會影響其接收到的資料, 不同的操作中程式會接受到不同的輸入資訊。 強化學習可找出決策或操作的最優方案, 以獲得最大的獎勵。

乳腺鉬靶腫塊判讀

邢磊博士介紹, 其實在深度學習之前, 大約在90年代, 就已有很多人做電腦輔助診斷(CAD)。 之前神經網路做不深, 現在有了新型電腦和深度學習之後, 可以實現很深的網路。 但是就以皮膚癌的診斷為例, 目前在臨床上還沒有真正意義上的大規模的應用。 基於深度學習的診斷尚處於研發階段。 但以現在的研發速度來看, 這些新技術離臨床應用已經並不十分遙遠了。

腦出血區域自動標記

另外, 深度學習並不是在所有場景下都需要。 這跟具體遇到的問題有關, 有時候一般的機器學習技術已經夠用。 新的演算法可以說是層出不窮, 日新月異。 把不同的演算法結合起來也是AI的領域常用的方法。

動態不確定因果圖:診斷各種疾病

人工智慧不止是深度學習,也不止是大資料,張勤教授深以為然。他通過多年研究,提出了一套動態不確定因果圖DUCG(DynamicUncertain Causality Graph)理論,用於因果知識的圖形表達和推理。DUCG克服了貝葉斯網路的簡潔表達和推理模型只適用于單賦值情況,不適用於多賦值和邏輯迴圈等情況的問題。

張勤教授創立動態不確定因果圖的本意是為了解決核電站的線上故障診斷,因為核電故障資料極少,診斷要求高(要診斷從未出現過的故障),必須充分利用領域專家知識才行。核電站有數千甚至數萬個即時動態信號,故障發展迅速,要求DUCG能夠在秒級對眾多信號(其中可能存在虛假信號)進行動態推理,高效準確地診斷故障,為提升核電站的安全性和經濟效益提供智慧技術支援。他的團隊迄今已取得上百起故障診斷實驗100%的成功率,無一失手。現已用於核電站和衛星系統的故障監測和診斷。

那麼DUCG能否用於醫療診斷呢?

張勤團隊首先與醫學專家合作,針對各類疾病建立DUCG醫學知識庫(並不是機器從資料裡面自動學出知識,而是醫生用圖形語言在機器中表達自己的知識,並由機器自動合成知識庫。)張勤認為,宏觀世界(微米以上尺度)萬物皆因果,例如上呼吸道感染可能導致咳嗽、頭痛等,這就是具有不確定性的因果知識。他們用103張因果子圖合成一個知識庫,包含各種風險因素、病史、症狀、體征、影像學檢查和實驗室檢查、以及各種邏輯組合和無條件或有條件因果關係及不確定性參數,與DUCG推理機相結合,進行疾病診斷。

他們這套系統跟某醫院合作診斷某類疾病,樣本集中有近4000個病例,涉及27種病,按照每種病不超過10個病例隨機抽出203個病例進行測試,最後結果正確率99.01%,只有兩個病例因記錄不完整而不正確。張勤的團隊還做過眩暈疾病的DUCG診斷,也達到了遠高於國際同行的正確率。目前正在開展暈厥和胸痛疾病的智慧診斷知識庫開發。

張勤團隊正在進一步開發這套系統使之不僅能説明醫生診斷,而且能啟發醫生知道下一步做什麼檢查最有價值,而不是盲目檢查,增加醫保和病人的負擔。這套系統還可用於醫院分診,也就是根據病人自述和分診師瞭解到的資訊計算並排序選擇優先就診的科室或可能需要的會診科室。

張勤還表示,重要的是智慧診斷系統不僅能告訴病人或醫生是什麼病,還要告訴為什麼是這個病,因為做決策並承擔責任的是醫生,不是智慧系統,至少在目前的情況下是如此。最後他認為,醫療資料並不是只要多就好,資料品質高才行。

下一個挑戰:誰能成就醫學界的ImageNet?

醫療AI的技術遠不止深度學習、機器學習、動態不確定圖等,此外醫療AI中也面臨著很多挑戰。

全維度數據:基因 + 蛋白 + 病理+ 影像 + 臨床 + 隨訪

對於普通的圖像研究者,ImageNet提供了1000萬張意義上的圖片供訓練。但是醫學資料非常大,對於醫學影像診斷的模型,目前並沒有一個權威的公開資料集。根據斯坦福邢磊博士所說,資料庫也是有一些,但是並不全,並不足夠大。比如乳腺癌有資料集算比較多的,但是沒有大到幾十萬個病例。研究人員有時候需要自己採集資料,很多時候可能就只有用幾百個資料來訓練模型。

邢磊博士也提出,很難確定多大的資料是大資料,畢竟資料量並不是越大越好,有時候可能有限的病人資料就足夠了,這與具體情況和問題及資料的品質有關。

但是如果有一個權威大資料集,對研究者來說絕對是一件好事。但是這是一種階梯式發展的,無法一蹴而就。跟ImageNet不同,一個權威巨型的醫學資料集可能最先在中國實現而不是外國。因為政府參與力度可以較大。一般的講,病人資料及資料的使用涉及病人隱私及權利。雖然大家都知道這個資料集對病人、醫院,已及整個人類社會都有利,但是這件事情需要政府層面的政策和統籌協調。

邢磊教授樂觀的表示,這件事情是遲早會解決,且中國的優勢可能更大。

那麼正如張勤提到的需要對2萬多種疾病診斷,如果每一個都做人工智慧,也是一個很大的工程,應該怎麼解決?

邢磊博士表示,將來需要一個醫學界的平臺,就像穀歌的Tensorflow,但是比Tensorflow更上層,專注於影像。疾病雖然多,但是還是有許多共同之處,並不是每一個AI模型都需從頭做起。人們甚至可以考慮把目前已做不了醫學影像的Tensorflow添加影像處理的功能,再將這種平臺開放,然後再細化到具體的各個病種。這當然還是要依靠醫學界不同領域的同仁來共同努力和貢獻。

兩大趨勢兩大不平衡,竟讓中國成為醫療AI最佳落地點

英特爾醫療李亞東介紹了全球的兩大趨勢成為醫療AI 的巨大驅動力:

1. 人口老齡化,特別是中國,中國2020年將達到20%65歲以上老齡化人口。55歲以上的人群佔用的醫療資源在50%以上。在這樣的人口老齡化的背景對人工智慧的需求急劇上升。怎麼樣解決這樣一個急需增長的需求的挑戰?

2. 慢性病的挑戰接踵而至。中國是慢性病問題最嚴重的一個區域,中國的患病人口在全球毫無疑問是領先的。

可以說,這兩大趨勢使得中國或成為醫療AI最大市場。

兩大不平衡:

第一是醫療資源供需嚴重不平衡。不僅僅在中國,在美國也嚴重不足,美國去年缺30幾萬護士,十幾萬醫生。中國醫患關係緊張,工作壓力大,醫學院畢業生在三年之內50%以上轉行做其他行業。好醫生尤其稀缺,中國的三甲醫院人滿為患。怎麼樣解決這些問題?

第二是地域醫療資源不平衡。2013年三甲醫院占衛計委醫療總數的0.1%,但是大量的病人是在基層,而極少數的三甲醫院門庭若市,醫生連上廁所的時間都沒有。大城市的三甲醫院跟鄉村或小城市醫療實力天壤之別,即使有的地方醫院設備很先進,但是醫務人員軟實力欠缺,拿著好設備看病看不准。對於三四線城市甚至偏遠山區的人,怎麼讓他們也能享受到較高品質的醫療服務?

總之,在老齡化和慢性病的大環境下,醫療資源(人、物)供應短缺,特別是中國醫療資源供需嚴重不平衡,地域資源差距巨大,人工智慧可能是解決這些問題的突破口。

未來:醫療AI解放了誰?

《人類簡史》的作者在書中預言,大資料和人工智慧的發展成熟,會讓6成的人類失去工作。目前,醫療中一些領域AI已經達到人類水準了,是否會引起大批醫療工作者的失業?這些醫療工作者如何適應這一變革?

邢磊博士表示,這是一個漸進的過程,並不會突然發生,可能需要10年、15年。對於可能被取代的人,焦慮無法避免,每一次技術革命都會有類似的焦慮。這是一個適應過程,時間拉得越長,適應過程來的會越簡單 。目前,大部分醫療的工作還是勞動密集型,工作量很大,知識訓練要求很高,這些以後會有很大的改善。

但是,AI不會也不可能代替醫生,即使機器在某方面比人強,但電腦畢竟是電腦,它的“思維”是人類訓練出來的,無論是廣度和深度都將是有限的。還是有特例,最後還是需要人做決定。 邢磊博士說:“我希望還是由人來做決定,是在機器輔助下的人的決定,而不是機器讓我吃什麼藥,打什麼針,這不人性化。”他認為機器與人的合作更好,機器沒有創新,但是人會有創新。機械式的非精准醫療會漸漸消失,這是大趨勢,但是把所有醫療工作完全交給機器是不太可能的,至少還有很漫長的路要走。

最後借用自稱“人工智慧人文學派支持者”張秀梅的話結束: “醫生是醫者仁心,不管人工智慧技術再怎麼發展,好醫生永遠都是不可替代的。資本和技術本身是沒有屬性的,可善可惡。但是到了醫療健康的產業資本的時候,我們要正確的三觀,要把所做的事情引向治病救人的善念。”

“我們不是考慮AI是否取代醫生,我們應該考慮的是怎麼讓AI真正幫助到人。”向每一個醫療行業用AI改善醫療服務的人致敬!

3月27日,新智元開源·生態AI技術峰會暨新智元2017創業大賽頒獎盛典隆重召開,包括“BAT”在內的中國主流 AI 公司、600多名行業精英齊聚,共同為2017中國人工智慧的發展畫上了濃墨重彩的一筆。

點擊閱讀原文,查閱文字版大會實錄

人工智慧不止是深度學習,也不止是大資料,張勤教授深以為然。他通過多年研究,提出了一套動態不確定因果圖DUCG(DynamicUncertain Causality Graph)理論,用於因果知識的圖形表達和推理。DUCG克服了貝葉斯網路的簡潔表達和推理模型只適用于單賦值情況,不適用於多賦值和邏輯迴圈等情況的問題。

張勤教授創立動態不確定因果圖的本意是為了解決核電站的線上故障診斷,因為核電故障資料極少,診斷要求高(要診斷從未出現過的故障),必須充分利用領域專家知識才行。核電站有數千甚至數萬個即時動態信號,故障發展迅速,要求DUCG能夠在秒級對眾多信號(其中可能存在虛假信號)進行動態推理,高效準確地診斷故障,為提升核電站的安全性和經濟效益提供智慧技術支援。他的團隊迄今已取得上百起故障診斷實驗100%的成功率,無一失手。現已用於核電站和衛星系統的故障監測和診斷。

那麼DUCG能否用於醫療診斷呢?

張勤團隊首先與醫學專家合作,針對各類疾病建立DUCG醫學知識庫(並不是機器從資料裡面自動學出知識,而是醫生用圖形語言在機器中表達自己的知識,並由機器自動合成知識庫。)張勤認為,宏觀世界(微米以上尺度)萬物皆因果,例如上呼吸道感染可能導致咳嗽、頭痛等,這就是具有不確定性的因果知識。他們用103張因果子圖合成一個知識庫,包含各種風險因素、病史、症狀、體征、影像學檢查和實驗室檢查、以及各種邏輯組合和無條件或有條件因果關係及不確定性參數,與DUCG推理機相結合,進行疾病診斷。

他們這套系統跟某醫院合作診斷某類疾病,樣本集中有近4000個病例,涉及27種病,按照每種病不超過10個病例隨機抽出203個病例進行測試,最後結果正確率99.01%,只有兩個病例因記錄不完整而不正確。張勤的團隊還做過眩暈疾病的DUCG診斷,也達到了遠高於國際同行的正確率。目前正在開展暈厥和胸痛疾病的智慧診斷知識庫開發。

張勤團隊正在進一步開發這套系統使之不僅能説明醫生診斷,而且能啟發醫生知道下一步做什麼檢查最有價值,而不是盲目檢查,增加醫保和病人的負擔。這套系統還可用於醫院分診,也就是根據病人自述和分診師瞭解到的資訊計算並排序選擇優先就診的科室或可能需要的會診科室。

張勤還表示,重要的是智慧診斷系統不僅能告訴病人或醫生是什麼病,還要告訴為什麼是這個病,因為做決策並承擔責任的是醫生,不是智慧系統,至少在目前的情況下是如此。最後他認為,醫療資料並不是只要多就好,資料品質高才行。

下一個挑戰:誰能成就醫學界的ImageNet?

醫療AI的技術遠不止深度學習、機器學習、動態不確定圖等,此外醫療AI中也面臨著很多挑戰。

全維度數據:基因 + 蛋白 + 病理+ 影像 + 臨床 + 隨訪

對於普通的圖像研究者,ImageNet提供了1000萬張意義上的圖片供訓練。但是醫學資料非常大,對於醫學影像診斷的模型,目前並沒有一個權威的公開資料集。根據斯坦福邢磊博士所說,資料庫也是有一些,但是並不全,並不足夠大。比如乳腺癌有資料集算比較多的,但是沒有大到幾十萬個病例。研究人員有時候需要自己採集資料,很多時候可能就只有用幾百個資料來訓練模型。

邢磊博士也提出,很難確定多大的資料是大資料,畢竟資料量並不是越大越好,有時候可能有限的病人資料就足夠了,這與具體情況和問題及資料的品質有關。

但是如果有一個權威大資料集,對研究者來說絕對是一件好事。但是這是一種階梯式發展的,無法一蹴而就。跟ImageNet不同,一個權威巨型的醫學資料集可能最先在中國實現而不是外國。因為政府參與力度可以較大。一般的講,病人資料及資料的使用涉及病人隱私及權利。雖然大家都知道這個資料集對病人、醫院,已及整個人類社會都有利,但是這件事情需要政府層面的政策和統籌協調。

邢磊教授樂觀的表示,這件事情是遲早會解決,且中國的優勢可能更大。

那麼正如張勤提到的需要對2萬多種疾病診斷,如果每一個都做人工智慧,也是一個很大的工程,應該怎麼解決?

邢磊博士表示,將來需要一個醫學界的平臺,就像穀歌的Tensorflow,但是比Tensorflow更上層,專注於影像。疾病雖然多,但是還是有許多共同之處,並不是每一個AI模型都需從頭做起。人們甚至可以考慮把目前已做不了醫學影像的Tensorflow添加影像處理的功能,再將這種平臺開放,然後再細化到具體的各個病種。這當然還是要依靠醫學界不同領域的同仁來共同努力和貢獻。

兩大趨勢兩大不平衡,竟讓中國成為醫療AI最佳落地點

英特爾醫療李亞東介紹了全球的兩大趨勢成為醫療AI 的巨大驅動力:

1. 人口老齡化,特別是中國,中國2020年將達到20%65歲以上老齡化人口。55歲以上的人群佔用的醫療資源在50%以上。在這樣的人口老齡化的背景對人工智慧的需求急劇上升。怎麼樣解決這樣一個急需增長的需求的挑戰?

2. 慢性病的挑戰接踵而至。中國是慢性病問題最嚴重的一個區域,中國的患病人口在全球毫無疑問是領先的。

可以說,這兩大趨勢使得中國或成為醫療AI最大市場。

兩大不平衡:

第一是醫療資源供需嚴重不平衡。不僅僅在中國,在美國也嚴重不足,美國去年缺30幾萬護士,十幾萬醫生。中國醫患關係緊張,工作壓力大,醫學院畢業生在三年之內50%以上轉行做其他行業。好醫生尤其稀缺,中國的三甲醫院人滿為患。怎麼樣解決這些問題?

第二是地域醫療資源不平衡。2013年三甲醫院占衛計委醫療總數的0.1%,但是大量的病人是在基層,而極少數的三甲醫院門庭若市,醫生連上廁所的時間都沒有。大城市的三甲醫院跟鄉村或小城市醫療實力天壤之別,即使有的地方醫院設備很先進,但是醫務人員軟實力欠缺,拿著好設備看病看不准。對於三四線城市甚至偏遠山區的人,怎麼讓他們也能享受到較高品質的醫療服務?

總之,在老齡化和慢性病的大環境下,醫療資源(人、物)供應短缺,特別是中國醫療資源供需嚴重不平衡,地域資源差距巨大,人工智慧可能是解決這些問題的突破口。

未來:醫療AI解放了誰?

《人類簡史》的作者在書中預言,大資料和人工智慧的發展成熟,會讓6成的人類失去工作。目前,醫療中一些領域AI已經達到人類水準了,是否會引起大批醫療工作者的失業?這些醫療工作者如何適應這一變革?

邢磊博士表示,這是一個漸進的過程,並不會突然發生,可能需要10年、15年。對於可能被取代的人,焦慮無法避免,每一次技術革命都會有類似的焦慮。這是一個適應過程,時間拉得越長,適應過程來的會越簡單 。目前,大部分醫療的工作還是勞動密集型,工作量很大,知識訓練要求很高,這些以後會有很大的改善。

但是,AI不會也不可能代替醫生,即使機器在某方面比人強,但電腦畢竟是電腦,它的“思維”是人類訓練出來的,無論是廣度和深度都將是有限的。還是有特例,最後還是需要人做決定。 邢磊博士說:“我希望還是由人來做決定,是在機器輔助下的人的決定,而不是機器讓我吃什麼藥,打什麼針,這不人性化。”他認為機器與人的合作更好,機器沒有創新,但是人會有創新。機械式的非精准醫療會漸漸消失,這是大趨勢,但是把所有醫療工作完全交給機器是不太可能的,至少還有很漫長的路要走。

最後借用自稱“人工智慧人文學派支持者”張秀梅的話結束: “醫生是醫者仁心,不管人工智慧技術再怎麼發展,好醫生永遠都是不可替代的。資本和技術本身是沒有屬性的,可善可惡。但是到了醫療健康的產業資本的時候,我們要正確的三觀,要把所做的事情引向治病救人的善念。”

“我們不是考慮AI是否取代醫生,我們應該考慮的是怎麼讓AI真正幫助到人。”向每一個醫療行業用AI改善醫療服務的人致敬!

3月27日,新智元開源·生態AI技術峰會暨新智元2017創業大賽頒獎盛典隆重召開,包括“BAT”在內的中國主流 AI 公司、600多名行業精英齊聚,共同為2017中國人工智慧的發展畫上了濃墨重彩的一筆。

點擊閱讀原文,查閱文字版大會實錄

Next Article
喜欢就按个赞吧!!!
点击关闭提示