華文網

獨家|類腦計算在醫療圖像上的應用(附PPT下載)

本文長度為2517字,建議閱讀4分鐘

本文為你分享“類腦計算在醫療圖像上的應用”的講座精華。

[ 導讀 ]本文整理自2017年7月3日,清華大學生物醫學工程系教授宋森在清華-青島資料科學研究院,

聯合清華大學醫學院未來影像實驗室共同舉辦的 “清華大學人工智慧與未來醫學影像高峰論壇”上,發表的”類腦計算在醫療圖像上的應用”演講內容精華。

後臺回復關鍵字“清華大資料”

一、類腦人工智慧與深度學習

1.類腦人工智慧

類腦人工智慧,

跟我研究背景有關。我小時候玩過一段人工智慧,後來覺得從當時來看,如果要實現人工智慧,還要向人的大腦學習,所以有很長一段時間在進行大腦的研究。現在我非常高興有機會能把這兩點結合起來。

2.深度學習

大家聽的比較多的所謂深度學習,

從類腦人工智慧的角度來看,是受到靈長類視覺結構的啟發。左邊那張圖,視覺系統有很多層,所以這是為什麼叫深度學習。

3.深度學習的歷史

最近深度學習有比較大突破,在醫療圖像裡面也有很大進展。大資料和計算能力的提升,使得這種受大腦啟發的演算法總算能夠和現實應用結合起來。

當然,深度學習真正的歷史是幾起幾伏,很曲折的。

這幾年機器學習的主要的區別是什麼?傳統上做機器學習,是先要用人工去提取一些特徵,然後通常會訓練一個比較簡單的分類器。這幾年的區別就是開始能夠做自動特徵提取。

具體來說,深度學習自動特徵提取這一部分是把它分成了很多層。

大家可能知道深度學習突破是2012年。

有一個比賽,從網上找到了大量圖片,給它們進行標注,然後讓機器去學習,看能不能學出來。前幾年準確率都還挺低,後來用深度學習的方法直接一下提升了幾十個百分點,從這個以後深度學習變得非常熱門。

二、深度學習應用到醫療圖像領域

1.皮膚癌診斷

皮膚癌診斷跟這類演算法很像,給一個標籤看它能不能做?取得了很大成功。但是,如果把深度學習的方法應用到醫療上,很多情況下不是這麼直接就能用過去的,還是有些特殊性。

2.深度學習應用到生物圖像

這是我做博士後期間我們開始進行的嘗試,神經元圖片想把它變成右邊這樣,然後就能分型研究,本質是一個分割問題。

我們開始了一個合作專案,能不能通過對形態學進行描述,把這個視網膜類神經元搞清楚。

為什麼困難?它難的地方在哪裡?主要是因為成像的原因,有時候會斷開,有時候會連起來。

一開始我花了一年時間,嘗試傳統方法,但效果不好,後來我博士後的導師說我們要不要試試卷積神經網路,雖然這個方法當時名聲很差。於是我們就開始用這個方法做端到端的訓練。這個方法現在叫深度學習。

最後突破是什麼呢?我們後來搞明白了,你要從剛才圖片照片直接變成一個細化的結構很難,如果你看傳統演算法設計上,它其實把它變成類似於中間這樣一個圖片,然後再把它一層一層剝掉,剝的這個過程用深度學習不是很好做。它是多步運算,所以我們其實主要是把深度學習來做一件它並不適合的事情,就很難。

其實我們真正需要的就是把那些中斷點連起來,所以我們就把原圖進行二值化,人工把那些斷的點全連起來。這張圖其實跟原圖長得很像。所以在做一個問題之前,你得搞清楚深度學習擅長什麼,不擅長什麼。

三、注意力神經元網路

1.注意力神經元網路研究

我回到清華以後, 2014年跟微軟研究院的張錚老師合作,提出了一個叫注意力的神經網路。總的來說,是受神經科學的啟發,我們認為以前的神經元模型太簡單了。神經元可以看到它有兩種因素,它會把兩種因素乘起來,現在叫注意力機制,目前這類演算法在深度學習裡面得到了廣泛應用。

2.圖像預測

我們的兩位學生,受張鈸院士的指導。

要根據這個圖像預測一年以後的發病率。要怎麼弄呢?你要仔細想一想人是怎麼做的。人會先看到一些可疑的地方。

第一步把這些可疑的地方找出來,找的過程中我們就用了類似於注意力機制,把兩組輸入整合的機制。(上圖中的R)

在這個基礎上就選出五個可能的病灶地方,再用概率的方法整合起來預測發病率。這個概率的方法是很關鍵的,減少了過擬合的可能。

3.類腦計算

清華有類腦計算研究中心,我們的目的是慢慢邁向通用人工智慧,是跨學科領域的一個中心。

四、對未來的展望

1.對未來的展望

對於醫學影像來說,人工智慧有幾個方向很重要:

第一個是醫學影像確實是個小資料問題,不可能像網路圖片是海量的,成百萬上千萬的。醫學影像涉及到幾千例、幾萬例就不得了,所以要把每一張圖片價值化。通過適合小資料的演算法,把這些圖像裡面的價值放大。這是我們研究上很重要的一點。

第二個是需要有可解釋的機器學習。如果只是一個黑箱子出來是不夠的,中間不知是什麼。在上面肺癌的例子裡,我們先發現可能的病灶,然後再判斷,找出一些特徵,這樣對醫生會有幫助。

第三個就是需要多模態的融合,以及可能跟基因、病歷等這些融合。

2.小樣本問題

減少對標注的依賴對醫療影像很重要。前年發表在science,是怎麼回事呢?通俗的講:你能不能先學會一個概念,比如說怎麼寫字。不是給你一大堆東西,你就照著弄,而是你先學會寫字這個概念。你學會了以後,給你看一個樣子,它馬上就學會了。我們在醫療影像上由於資料量比較小,以後真能用的可能是類似這樣的:比如說你先學會了怎麼看片,到了一個醫院以後,給你看幾個例子,大概這一類就學會了,這樣比較現實。

3.可解釋的機器學習

另外一個就是可解釋的機器學習。因為很大一個問題:機器學習如果是黑箱的話,你不知道他學習什麼。

上圖是很有名的例子,用深度學習的方法,將左圖與右圖組合起來,用右邊的風格畫左邊這張畫。然後問你,這是什麼?我相信有人可能會說這是一個帆船,絕對不會說這是一個豹子,但是神經元網路說這是豹子,認為是船的概率為零。為什麼?現在的卷積網路,他其實更關心概率分佈,更關心紋路。

怎麼辦?有點像我們下圍棋,你必須要有直覺。一些基礎功能怎麼去檢測,這些深度學習可以幫你。同時你要有推理過程,基於概率等等。這樣算是一個完整系統,跟人的思考方式是一樣的。

4.多態融合和複雜決策

最後比較有意思的是,我們需要多模態的融合和複雜決策。我也看到一些希望,最近一篇文章通過比較挖掘電子病歷,用機器學習的方法可以較好的預測心臟病發作,所以在未來我們有辦法把各個成像模式跟電子病歷的融合。

5.硬體加速和清華腦類計算研究中心

硬體加速也非常重要,清華類腦計算中心有非常多研究,包括張鈸院士,有一整套解決方法,從演算法到硬體我們都希望跟大家合作。

後臺回復關鍵字“清華大資料”

更多精彩乾貨內容,敬請搜索關注清華-青島資料科學研究院官方公眾平臺“資料派THU”

皮膚癌診斷跟這類演算法很像,給一個標籤看它能不能做?取得了很大成功。但是,如果把深度學習的方法應用到醫療上,很多情況下不是這麼直接就能用過去的,還是有些特殊性。

2.深度學習應用到生物圖像

這是我做博士後期間我們開始進行的嘗試,神經元圖片想把它變成右邊這樣,然後就能分型研究,本質是一個分割問題。

我們開始了一個合作專案,能不能通過對形態學進行描述,把這個視網膜類神經元搞清楚。

為什麼困難?它難的地方在哪裡?主要是因為成像的原因,有時候會斷開,有時候會連起來。

一開始我花了一年時間,嘗試傳統方法,但效果不好,後來我博士後的導師說我們要不要試試卷積神經網路,雖然這個方法當時名聲很差。於是我們就開始用這個方法做端到端的訓練。這個方法現在叫深度學習。

最後突破是什麼呢?我們後來搞明白了,你要從剛才圖片照片直接變成一個細化的結構很難,如果你看傳統演算法設計上,它其實把它變成類似於中間這樣一個圖片,然後再把它一層一層剝掉,剝的這個過程用深度學習不是很好做。它是多步運算,所以我們其實主要是把深度學習來做一件它並不適合的事情,就很難。

其實我們真正需要的就是把那些中斷點連起來,所以我們就把原圖進行二值化,人工把那些斷的點全連起來。這張圖其實跟原圖長得很像。所以在做一個問題之前,你得搞清楚深度學習擅長什麼,不擅長什麼。

三、注意力神經元網路

1.注意力神經元網路研究

我回到清華以後, 2014年跟微軟研究院的張錚老師合作,提出了一個叫注意力的神經網路。總的來說,是受神經科學的啟發,我們認為以前的神經元模型太簡單了。神經元可以看到它有兩種因素,它會把兩種因素乘起來,現在叫注意力機制,目前這類演算法在深度學習裡面得到了廣泛應用。

2.圖像預測

我們的兩位學生,受張鈸院士的指導。

要根據這個圖像預測一年以後的發病率。要怎麼弄呢?你要仔細想一想人是怎麼做的。人會先看到一些可疑的地方。

第一步把這些可疑的地方找出來,找的過程中我們就用了類似於注意力機制,把兩組輸入整合的機制。(上圖中的R)

在這個基礎上就選出五個可能的病灶地方,再用概率的方法整合起來預測發病率。這個概率的方法是很關鍵的,減少了過擬合的可能。

3.類腦計算

清華有類腦計算研究中心,我們的目的是慢慢邁向通用人工智慧,是跨學科領域的一個中心。

四、對未來的展望

1.對未來的展望

對於醫學影像來說,人工智慧有幾個方向很重要:

第一個是醫學影像確實是個小資料問題,不可能像網路圖片是海量的,成百萬上千萬的。醫學影像涉及到幾千例、幾萬例就不得了,所以要把每一張圖片價值化。通過適合小資料的演算法,把這些圖像裡面的價值放大。這是我們研究上很重要的一點。

第二個是需要有可解釋的機器學習。如果只是一個黑箱子出來是不夠的,中間不知是什麼。在上面肺癌的例子裡,我們先發現可能的病灶,然後再判斷,找出一些特徵,這樣對醫生會有幫助。

第三個就是需要多模態的融合,以及可能跟基因、病歷等這些融合。

2.小樣本問題

減少對標注的依賴對醫療影像很重要。前年發表在science,是怎麼回事呢?通俗的講:你能不能先學會一個概念,比如說怎麼寫字。不是給你一大堆東西,你就照著弄,而是你先學會寫字這個概念。你學會了以後,給你看一個樣子,它馬上就學會了。我們在醫療影像上由於資料量比較小,以後真能用的可能是類似這樣的:比如說你先學會了怎麼看片,到了一個醫院以後,給你看幾個例子,大概這一類就學會了,這樣比較現實。

3.可解釋的機器學習

另外一個就是可解釋的機器學習。因為很大一個問題:機器學習如果是黑箱的話,你不知道他學習什麼。

上圖是很有名的例子,用深度學習的方法,將左圖與右圖組合起來,用右邊的風格畫左邊這張畫。然後問你,這是什麼?我相信有人可能會說這是一個帆船,絕對不會說這是一個豹子,但是神經元網路說這是豹子,認為是船的概率為零。為什麼?現在的卷積網路,他其實更關心概率分佈,更關心紋路。

怎麼辦?有點像我們下圍棋,你必須要有直覺。一些基礎功能怎麼去檢測,這些深度學習可以幫你。同時你要有推理過程,基於概率等等。這樣算是一個完整系統,跟人的思考方式是一樣的。

4.多態融合和複雜決策

最後比較有意思的是,我們需要多模態的融合和複雜決策。我也看到一些希望,最近一篇文章通過比較挖掘電子病歷,用機器學習的方法可以較好的預測心臟病發作,所以在未來我們有辦法把各個成像模式跟電子病歷的融合。

5.硬體加速和清華腦類計算研究中心

硬體加速也非常重要,清華類腦計算中心有非常多研究,包括張鈸院士,有一整套解決方法,從演算法到硬體我們都希望跟大家合作。

後臺回復關鍵字“清華大資料”

更多精彩乾貨內容,敬請搜索關注清華-青島資料科學研究院官方公眾平臺“資料派THU”