華文網

Airdoc創始人張大磊:AI在醫療領域中應用的問題與局限

7月1日,在由武漢國家生物產業基地建設管理辦公室主辦、火石創造承辦、光谷健康智慧園協辦的醫療大資料與醫學人工智慧高峰論壇上,Airdoc創始人兼董事長張大磊做了題為《AI在醫療領域中應用的問題與局限》的演講。

文|程聰

Airdoc是醫療領域人工智慧領軍企業,專注於人工智慧醫學影像識別領域的應用,一直嘗試通過科技手段解決影像學方面醫療資源配置不平均。在現場,張大磊重點分享了在智慧影像領域的實踐經驗,以及人工智慧在醫療圖像識別上的局限性。

本文系根據張大磊先生在火石創造承辦的《醫療大資料與醫學人工智慧高峰論壇》上的精彩分享整理而成。

根據嘉賓意見,分享內容已刪去部分敏感觀點及內部資訊。

“More Intelligent, Better Care”

“在現實中醫療資源配置不平均很多人被漏診,而人工智慧可以學習醫學專家的經驗,應用在基層能夠輔助基層醫生工作,提升他們的疾病識別水準。”張大磊這樣描述成立Airdoc的初衷,

語氣誠懇。

近幾年,人工智慧圖像識別技術快速發展,在某些特定領域已經超過人類。醫學影像作為疾病診斷的重要路徑之一成為了一個熱點。醫療行業涉及知識面廣,人工智慧可以在多個環節發揮作用。比如:醫學影像識別、生物技術、輔助診斷、藥物研發等領域,目前應用最為廣泛的當屬醫學影像識別。

“總體來講,整個行業呈現出欣欣向榮的態勢。

但實際上真正落地的時候還是有很多問題。”張大磊簡單介紹了人工智慧在醫療圖像識別上的三種常規做法及其局限性。

人工智慧在醫療圖像識別上的三種常規做法

張大磊介紹,目前人工智慧在醫學影像識別的應用上主要有三種方法:分類、檢測和分割。

分類是最簡單的,需要輸入大量的樣本學習,一般“萬”級別的樣本訓練出來的結果才能說比較好,但是只能夠識別有沒有病,

不能對醫學影像進行標注。

張大磊現場舉例:假設通過演算法識別圖片上的高度相似病變,如果用分類樣本量小就很難調准。這一環節存在著樣本量不夠以及樣本不均衡的問題,同時,醫生標注的工作量是最小的,醫生把弱標籤經過分類處理之後就可以進行標注。

檢測,即從圖像中檢測出來有什麼。需要的訓練樣本量一般比分類的樣本量少一些,但醫生標注的工作量有所增加。

舉個例子,如果要標注放射樣本量,醫生需要把每個片子看一遍,把有問題的地方框出來,這個過程中如有框漏,會影響檢測的效果。

分割,醫生標注的工作量大,需要醫生把病灶的輪廓標注出來。相對來說,乳腺癌淋巴轉移好標一些,但有一些很難標,比如標注所有的病變點,很可能一個片子上的病變點有幾百個,要全部標注出來工作量就太大了。而實際上,醫生大致看一下就知道是幾期了。

所以,當樣本量比較小的時候會選擇分割或者資料增強。目前,對於罕見病或小樣本資料,有一些辦法可以把資料造出來,造出來的資料看上去沒什麼區別,但要把這些資料清洗出來。

以上每一種方法可以解決不同需求的問題。通過這三種基本的方法,常見的任務都是這幾種方法的排列組合。

Airdoc創始人兼董事長張大磊

人工智慧在醫療圖像識別上的局限

1.標注往往是一個瓶頸

“標注是一個很苦的活,很多人會認為人工智慧從業者是在寫演算法,實際上80%的時間都是在做資料預處理。在資料預處理上花的每一份心思都會在最終結果上得到相應的回報,這是非常重要的。但醫療領域的標注往往需要醫學專家對資料進行標注,所以標注往往是一個瓶頸。”

張大磊認為,在未來2到5年之內,小樣本學習理論層面會獲得足夠的突破,Airdoc一直在探索這方面並希望能做出一定的成績,但近2年之內沒有什麼好的辦法,還是要大量醫生去做標注。

2.資料品質問題

不管在美國還是中國,大多數醫院裡拿出來的資料都不標準化,用演算法直接做一遍都會發現結果很差。為什麼?人類歷史上從來沒有一個工具,可以讓一個大夫看過的所有資料給另一個大夫看一遍,醫生是高度個性化的(儘管有各種各樣的指南)。這就存在一個問題:同樣一個病,十個大夫會給出五種或三種診斷意見,到底誰對誰錯,有時候很難說,常規做法是多人同時標注取公共結果,但本質上來說這也不是金標準。

單純看圖的時候,覺得這個時間節點上是4a,但如果病人三個月後回訪時,最開始做4A判斷的大夫會覺得是4b,這是非常常見的事情。把弱標籤變成標注的過程中,往往有很多技術之外的因素存在,這些因素如果不處理好,很可能產生資料污染。

3.交互問題

總體來講,病人和醫生交互越多環節,演算法的品質越差。

中醫的望聞問切,我們都可以理解為交互。通過演算法只去識別其中一兩個,比如識別面部或舌苔時,已經天然丟失掉了很多資訊。並且,丟失的資訊往往會對最終的判斷產生影響。如果大家做某一場景的AI時,醫生和病人交互越少的環節越好。假如有一個環節上醫生不需要見病人也可以作出判斷,這是最好的。“因為演算法是可控的,交互是不可控的。”

4.弱勢的通用人工智慧

通用人工智慧是非常弱的,但人類醫生就是一個通用的人工智慧。比如患者問醫生吃飯了沒,他會根據當時場景判斷這個人是否只是在打招呼,這個過程存在複雜的前回饋。幾乎任何一個中國人都能聽懂這樣的笑話:中國乒乓球隊很厲害,誰都打不過,中國男子足球隊很厲害,誰都打不過。我們都能理解兩者是不同的,但對於演算法來說如果沒有常識庫演算法會認為意思是一樣的。前回饋需要建立一個非常好的常識庫。

2015年時,Airdoc收集整理了所有文獻和教材建立一個心血管相關的常識庫,最後發現它比醫生專家的常識庫還是要少。

5.監管發展與技術發展間有著巨大的鴻溝

監管是很長時間變一次,但技術發展是非常快的。技術的反覆運算速度和醫療體系以安全為第一考核的反覆運算速度,很明顯是完全不相符的。

張大磊表示,之前與FDA打交道時發現,如果要以最嚴格方式通過FDA演算法類的審核的現有規定,幾乎不可能,因為FDA要求所有東西完全定型,最終在市場上銷售的東西跟申報的東西一模一樣。但現實問題是,每一個AI演算法背後都可以自學習,都會變得越來越聰明,如果只發佈定型版本,那提高部分要不斷重新申報。

6.市場還處於慢慢培育中

張大磊認為,目前市場還是處於慢慢培育過程中。

“從大家認識它到被接受再到相應支付體系的完善,以及到醫保的介入,都需要一個很長的時間,在這個過程中,需要投身於這個行業的人有更多耐心更加團結,一起把這個行業做起來。”

而實際上,醫生大致看一下就知道是幾期了。

所以,當樣本量比較小的時候會選擇分割或者資料增強。目前,對於罕見病或小樣本資料,有一些辦法可以把資料造出來,造出來的資料看上去沒什麼區別,但要把這些資料清洗出來。

以上每一種方法可以解決不同需求的問題。通過這三種基本的方法,常見的任務都是這幾種方法的排列組合。

Airdoc創始人兼董事長張大磊

人工智慧在醫療圖像識別上的局限

1.標注往往是一個瓶頸

“標注是一個很苦的活,很多人會認為人工智慧從業者是在寫演算法,實際上80%的時間都是在做資料預處理。在資料預處理上花的每一份心思都會在最終結果上得到相應的回報,這是非常重要的。但醫療領域的標注往往需要醫學專家對資料進行標注,所以標注往往是一個瓶頸。”

張大磊認為,在未來2到5年之內,小樣本學習理論層面會獲得足夠的突破,Airdoc一直在探索這方面並希望能做出一定的成績,但近2年之內沒有什麼好的辦法,還是要大量醫生去做標注。

2.資料品質問題

不管在美國還是中國,大多數醫院裡拿出來的資料都不標準化,用演算法直接做一遍都會發現結果很差。為什麼?人類歷史上從來沒有一個工具,可以讓一個大夫看過的所有資料給另一個大夫看一遍,醫生是高度個性化的(儘管有各種各樣的指南)。這就存在一個問題:同樣一個病,十個大夫會給出五種或三種診斷意見,到底誰對誰錯,有時候很難說,常規做法是多人同時標注取公共結果,但本質上來說這也不是金標準。

單純看圖的時候,覺得這個時間節點上是4a,但如果病人三個月後回訪時,最開始做4A判斷的大夫會覺得是4b,這是非常常見的事情。把弱標籤變成標注的過程中,往往有很多技術之外的因素存在,這些因素如果不處理好,很可能產生資料污染。

3.交互問題

總體來講,病人和醫生交互越多環節,演算法的品質越差。

中醫的望聞問切,我們都可以理解為交互。通過演算法只去識別其中一兩個,比如識別面部或舌苔時,已經天然丟失掉了很多資訊。並且,丟失的資訊往往會對最終的判斷產生影響。如果大家做某一場景的AI時,醫生和病人交互越少的環節越好。假如有一個環節上醫生不需要見病人也可以作出判斷,這是最好的。“因為演算法是可控的,交互是不可控的。”

4.弱勢的通用人工智慧

通用人工智慧是非常弱的,但人類醫生就是一個通用的人工智慧。比如患者問醫生吃飯了沒,他會根據當時場景判斷這個人是否只是在打招呼,這個過程存在複雜的前回饋。幾乎任何一個中國人都能聽懂這樣的笑話:中國乒乓球隊很厲害,誰都打不過,中國男子足球隊很厲害,誰都打不過。我們都能理解兩者是不同的,但對於演算法來說如果沒有常識庫演算法會認為意思是一樣的。前回饋需要建立一個非常好的常識庫。

2015年時,Airdoc收集整理了所有文獻和教材建立一個心血管相關的常識庫,最後發現它比醫生專家的常識庫還是要少。

5.監管發展與技術發展間有著巨大的鴻溝

監管是很長時間變一次,但技術發展是非常快的。技術的反覆運算速度和醫療體系以安全為第一考核的反覆運算速度,很明顯是完全不相符的。

張大磊表示,之前與FDA打交道時發現,如果要以最嚴格方式通過FDA演算法類的審核的現有規定,幾乎不可能,因為FDA要求所有東西完全定型,最終在市場上銷售的東西跟申報的東西一模一樣。但現實問題是,每一個AI演算法背後都可以自學習,都會變得越來越聰明,如果只發佈定型版本,那提高部分要不斷重新申報。

6.市場還處於慢慢培育中

張大磊認為,目前市場還是處於慢慢培育過程中。

“從大家認識它到被接受再到相應支付體系的完善,以及到醫保的介入,都需要一個很長的時間,在這個過程中,需要投身於這個行業的人有更多耐心更加團結,一起把這個行業做起來。”