您的位置:首頁>健康>正文

2020年,精准醫療足以影響中國整體GDP

4月20日, 穀歌與Verily宣佈啟動長達四年, 萬人參與的大型健康項目, 欲打造人類健康地圖。 對1萬名志願者的血液、唾液和糞便等樣本進行癌症液體活檢、基因組分析和腸道微生物菌群等多種分析。

基於精准醫學的疾病診斷與個體化治療已成為全球醫療發展的必然趨勢, 且未來將不局限於疾病治療, 功能將前置到疾病預防和健康保健等廣闊領域中。 然而, 精准醫學如火如荼的發展背後, 卻面臨著不容忽視的重大問題, 人類對自身遺傳密碼的瞭解還處於非常早期的階段。

陳潤生院士認為, 除了占遺傳密碼3%的編碼蛋白質的基因序列外, 非編碼的RNA所蘊藏的基因暗資訊, 對疾病的診斷治療將提供全新的視野, 為藥物設計的研發提供全新的平臺, 為動植物新品種、新性狀的培育提供全新的基礎。

由中國生物醫學工程學會和中國醫學科學院主辦的“2017中國生物醫學工程大會”近日舉行,

貝殼社為活動提供全程媒體支援。 中國科學院院士陳潤生發表了“基因組、大資料與精准醫學”的主題演講, 現將演講精華內容整理如下:

2020年, 精准醫療足以影響中國整體GDP

2015年1月20日, 美國總統奧巴馬發表了2015~2016 國情咨文, 開啟精准醫學研究之路, 我國在近兩年以精准醫學為主的重大專項也開始立項, 到目前為止, 一共有60個專案, 總資金大約12億元, 已經開始運行, 下一期精准醫學的專案也在評審當中。

精准醫學由美國開始, 進入20世紀末期, 開始劃時代的專案——破譯人類自身遺傳密碼, 之後整個生物醫學研究就從表述進入到分子時代, 在人類科學史上是空前的。

破譯自身遺傳密碼後, 積累了大量資料,

發現很多位元點變化直接和人類重大疾病相關, 這造就了精准醫學的基礎。 每個人每個細胞中有30億個堿基。 目前花5000~6000就可以在國內測自己的遺傳密碼, 預計到今年年底或明年年初, 花100美金就能測自己的遺傳密碼了, 相信以基因組測序為代表的分子水準資訊的獲得會很快變為常規的檢測手段, 會大量湧入醫療單位, 成為醫療和生物醫學研究中基礎的事實。

精准醫學的本質用一句話概況, 是組學大資料和醫學的結合, 精准醫學和傳統醫學相比, 唯一不同是增加了以基因組為代表的分子水準的資料, 是大量組學資料的湧入。 組學大資料包含兩層含義, 一層是基因組為代表的資料獲取, 但是由於這些資料太大,

所以要指導和生物醫學的關聯, 必須用現代大資料物解析的辦法來挖掘海量資料的內涵, 所以, 另一層是大資料的生物學醫學內涵的深度挖掘。

組學資料引入到臨床中, 未來的深遠意義是導致醫療體系發生概念及本質上的變化:從當前治療過渡到未來的健康保障。 未來的精准意義是, 在任何人任何生存時期, 都可以對組學資料進行測量, 根據測量瞭解機體健康狀況, 進行適當的評估和干預, 因此未來的精准意義下的醫療體系是面向全民的健康保障體系, 而不是現代針對病人的診斷治療體系, 由於概念上的變化, 可能導致相應新興產業的出現, 估計2018年全球相應產業市場規模可達2238億美金。 有估計到2020年,

精准醫療相應產業可達1.8萬億美金, 這足以影響國家總體GDP, 有深遠影響。

所以精准醫學已經成為新一輪科技競爭和引領國家發展潮流的戰略制高點, 美國也在積極推動領域研究, 美國是準備測量100萬個自由人的遺傳密碼, 現在已經測完68萬人了。 歐盟和日本都在開展精准醫學計畫。

精准醫學四大細分產業前景

精准醫學在哪些方面開始促進相應新產業的發展呢?至少在4個方面, 我們國內相應產業已經實現了:

第一個是海量資料庫和樣本庫的產業出現, 精准醫學是10萬~100萬量級的樣本的獲取、存儲和使用, 對應的是百萬量級的資料的存儲;有人估計在近期可達到100億美金的規模;據統計, 2015年生物樣本庫市值將超過22.5億美元。 至2018年生物大資料的市場總額增長至76億美元,年複合增長率達到71.6%,生物資料的商業份額已經初步體現。2015年1月,羅氏製藥子公司Genetech向23 and me注資6000萬美金,用於共用23 and me收集的帕金森患者的基因資料,並基於資料資訊研發帕金森病的治療方案;

第二個是以基因組測序為代表的組學資料的獲取,BBC research資料顯示,全球基因測序市場總量從2007年的794.1萬美元增長至2013年的45億美元,預計未來幾年全球市場仍將繼續保持快速增長,2018年達到117億美元,但隨著測序成本下降,成為全民能實現的項目,但我認為相應經費絕對不止117億美金,要大得多;

第三個分子診斷也是性價比最高的產業,是基於海量資料採擷新的疾病分子標記和新的治療藥物靶點,雖然複雜但性價比極好,已經成為生物醫藥行業新熱點。一般新藥出現,單品藥物市場可達到100億美金量級,海量資料出現後會帶來無數疾病診斷的新靶點和藥物治療靶點;據Markets and Markets公司估測,2018年的全球市場市值將達到79億美金,2013~2018年間的複合年增長率為9.7%;

基於精准醫學理念的個體化治療市場規模日益擴大,美國十大商業保險公司已將50余項疾病個體化診療分子檢測項目列入醫療保險,巨大市場空間吸引眾多醫藥公司開展研發,目前已有多種個體化診療產品上市。截止2013年,美國FDA已批准100多種個體化藥物,重點關注慢病和癌症。

第四個產業是新的醫療設施,如健康設施、健康從業人員在內的大健康產業圈,這個產業圈估計2018年可以到達2000億美金。上述四個產業在國內已經興起,相信未來會發展得更好。

實現精准醫學要做哪些準備?有兩個基礎,一是組學大資料,精准醫學是組學大資料和臨床醫學的結合,所以必須獲取組學大資料;第二個是搭建分子水準上的微觀資訊和疾病表型之間的關聯。兩個基礎建立後再和現代影像學、生化學結合起來,精准醫學才能發展得更好。

基因暗資訊背後的產業機遇

精准醫學目前處於什麼階段?個人觀點是精准醫學剛剛起步。在組學資料的獲取和分析上,在大資料的處理上,都存在難以克服的重大挑戰。這些挑戰諸多,我今天只講一個挑戰,由此就能看出精准醫學也只能是剛剛開始。

基因組有大量暗資訊。遺傳密碼非常容易測得,現階段6000塊就能測完,未來600~700塊就能測完,就能得到3x109的遺傳信息。問題是對於這樣的遺傳密碼,我們的知識疆界在哪裡,能解釋多少?目前對於基因組的解釋,人類目前的水準是,真正從規律上能完全解釋的部分,大約是遺傳密碼的3%。換句話說,全世界的科學家能測完遺傳密碼,能精確解釋的只有3%,這3%就是編碼蛋白質的基因。另外97%我們稱作遺傳密碼中的非編碼區,迄今為止,這是暗的,我們依然不能瞭解。在這樣一個背景下,如何做到精准呢?97%的非編碼區都不知道是幹什麼的,當產生變化後,它的生物學意義就無從知曉。

我舉一篇文獻為例,發表在2010年Science上,2001年人類基因組第一次破譯時,科學家原本以為30億堿基裡能找到10萬個基因,但吃驚地是只發現不到3.5萬個,蛋白編碼區只占整個基因組的1.5%,難道其餘基因組暗物質都是無用的麼?所以這是非常嚴重的問題,很多高端人群去測自己的遺傳密碼,不是沒用,能用的、可分析的只占3%,這就是目前的現狀。

從精准醫學意義上看,我們的遺傳密碼是暗的,但從基礎研究來講,卻有無限創新的機會。這97%為我們締造了非常多的原始創新機會:

第一個方面,從遺傳密碼來講,把人的遺傳密碼和其他進化等級不同的遺傳密碼相比較,Coding代表從規律上已經瞭解的遺傳密碼。Non-coding非編碼區,代表迄今為止不知道功能的部分。

可看出,單細胞原核生物大腸桿菌是如此地簡單低等的生物,85%的遺傳密碼都用來編碼蛋白質,所以測完後就大致知道它是如何生活的。酵母,是單細胞真核生物,稍微高等一些,編碼蛋白質的部分就少了(70%),非編碼區增加(28%);線蟲,是簡單的多細胞,只有960個細胞,但已經是較為高等的多細胞生物,用來編碼蛋白質的部分只有28%;果蠅,已經是昆蟲了,編碼部分只有17%,人類編碼部分只占1.5%,非編碼區增加到98%。

這說明我們也許會認為從生物從簡單到複雜,低等到高等,基因越來越多,蛋白質越來越多,恰恰相反,這是錯誤的,實際上不知道功能的非編碼部分突飛猛進地增加。說明從演化邏輯看來,非編碼序列一定具有更加重要的生物學功能,一定和生物更加高等、更加複雜的功能相關聯。

第二個方面,有人會認為遺傳密碼中有很多冗餘,這也許是正常的。但97%是否發生了資訊,是否活動,用生物學角度講,它是否有轉錄本呢?如果有不同地活動,證明97%是存在的,是活躍地,是每時每刻都在工作,事實確實如此。全世界有幾十個實驗室都百分百地都找到了來自97%序列的轉錄本,只是這部分轉錄組不造蛋白,而是以RNA形式發生功能。這樣結果就充分證明97%的非編碼區內是生物功能的重要組成部分,絕大部分的轉錄產物是非編碼RNA,物種間最主要的差別也是非編碼RNA。

下面,我舉例說明,非編碼RNA與幾種疾病的關係,以發現的個別功能原件與腫瘤相關的研究為例。

第一個是PCGEM1(前列腺特異性RNA基因具有細胞增長促進功能),是來自97%的轉錄本,過表達能導致前列腺癌;第二個來源97%的轉錄本叫HIS-1,該基因在脊椎動物中高度保守,在小鼠中發現可導致白血病,在致癌通路中能控制細胞週期進程;第三個是MALAT-1,可導致非小細胞肺癌,肺癌是我國發病率最高的腫瘤,發病率每年都在遞增,其中80%是非小細胞肺癌。

這三個例子說明腫瘤的病因完全可以來自非編碼區,我們現在所有醫院的臨床指標都來自3%,蛋白編碼的基因部分,而治療的靶向藥物也是針對那3%的,97%的基因突變導致的腫瘤在目前水準下是發現不了也治療不了。這是腫瘤治療遇到的很大問題,腫瘤分子標誌物的成功率很低也是很好理解的,97%沒有納入到疾病的診斷治療視野當中,不止腫瘤,心腦血管病、代謝疾病也有97%的非編碼基因在起作用。說明目前要做到在分子水準上精准地預測疾病必須開發97%的巨大領域,它和所有疾病都相關。

這是我們和協和的赫捷課題組共同研究的成果,在97%當中發現腫瘤標誌物,能很好地區分食管鱗癌的分期及預後;另外也會找到97%的轉錄本,可以影響腫瘤幹細胞的幹性(腫瘤幹細胞中長鏈非編碼RNA IncTCF7能促進人類肝癌幹細胞的自我更新,2015年的研究成果);還有最近剛剛上線的研究成果,發現97%的轉錄本對共有免疫系統具有巨大作用(長非編碼核酸IncKdm2b調控淋巴細胞機制研究,2017年發表在Nature Immunology)。還有非編碼的轉錄本H19,醫生肯定清楚,P53是很重要的蛋白,是我們的保護神。97%中的H19也是我們的保護神,如果它不發生突變,可以通過類似細胞凋亡的途徑,使得某些癌變細胞凋亡。

資料說明,還有許多非編碼基因還沒被發現。人類3%中大約有2萬個元件,97%有多少元件沒有資料。但可以以老鼠舉例,幾年前,日本遺傳研究所(RIKEN)得到小鼠全部轉錄本的克隆,獲得約181,000個全長的RNA轉錄本,其中編碼蛋白質的轉錄本僅有約20,000個,其餘約161,000個轉錄本全部歸屬於非編碼RNA。一個新元件從沒有到發現其功能一定能發表在三大核心期刊CNS上,這就是原始創新的機會。

從過往經驗看,占人類基因組3%的這部分,一共有50個諾貝爾獎金獲得者,面對未開發的97%,將有望誕生更多的諾貝爾獎獲得者。所以,非編碼區的研究對疾病的診斷治療將提供全新的視野,為藥物設計的研發提供全新的平臺,為動植物新品種、新性狀的培育提供全新的基礎。

盯!最熱的醫藥資訊請保持關注「桃花島科技」

至2018年生物大資料的市場總額增長至76億美元,年複合增長率達到71.6%,生物資料的商業份額已經初步體現。2015年1月,羅氏製藥子公司Genetech向23 and me注資6000萬美金,用於共用23 and me收集的帕金森患者的基因資料,並基於資料資訊研發帕金森病的治療方案;

第二個是以基因組測序為代表的組學資料的獲取,BBC research資料顯示,全球基因測序市場總量從2007年的794.1萬美元增長至2013年的45億美元,預計未來幾年全球市場仍將繼續保持快速增長,2018年達到117億美元,但隨著測序成本下降,成為全民能實現的項目,但我認為相應經費絕對不止117億美金,要大得多;

第三個分子診斷也是性價比最高的產業,是基於海量資料採擷新的疾病分子標記和新的治療藥物靶點,雖然複雜但性價比極好,已經成為生物醫藥行業新熱點。一般新藥出現,單品藥物市場可達到100億美金量級,海量資料出現後會帶來無數疾病診斷的新靶點和藥物治療靶點;據Markets and Markets公司估測,2018年的全球市場市值將達到79億美金,2013~2018年間的複合年增長率為9.7%;

基於精准醫學理念的個體化治療市場規模日益擴大,美國十大商業保險公司已將50余項疾病個體化診療分子檢測項目列入醫療保險,巨大市場空間吸引眾多醫藥公司開展研發,目前已有多種個體化診療產品上市。截止2013年,美國FDA已批准100多種個體化藥物,重點關注慢病和癌症。

第四個產業是新的醫療設施,如健康設施、健康從業人員在內的大健康產業圈,這個產業圈估計2018年可以到達2000億美金。上述四個產業在國內已經興起,相信未來會發展得更好。

實現精准醫學要做哪些準備?有兩個基礎,一是組學大資料,精准醫學是組學大資料和臨床醫學的結合,所以必須獲取組學大資料;第二個是搭建分子水準上的微觀資訊和疾病表型之間的關聯。兩個基礎建立後再和現代影像學、生化學結合起來,精准醫學才能發展得更好。

基因暗資訊背後的產業機遇

精准醫學目前處於什麼階段?個人觀點是精准醫學剛剛起步。在組學資料的獲取和分析上,在大資料的處理上,都存在難以克服的重大挑戰。這些挑戰諸多,我今天只講一個挑戰,由此就能看出精准醫學也只能是剛剛開始。

基因組有大量暗資訊。遺傳密碼非常容易測得,現階段6000塊就能測完,未來600~700塊就能測完,就能得到3x109的遺傳信息。問題是對於這樣的遺傳密碼,我們的知識疆界在哪裡,能解釋多少?目前對於基因組的解釋,人類目前的水準是,真正從規律上能完全解釋的部分,大約是遺傳密碼的3%。換句話說,全世界的科學家能測完遺傳密碼,能精確解釋的只有3%,這3%就是編碼蛋白質的基因。另外97%我們稱作遺傳密碼中的非編碼區,迄今為止,這是暗的,我們依然不能瞭解。在這樣一個背景下,如何做到精准呢?97%的非編碼區都不知道是幹什麼的,當產生變化後,它的生物學意義就無從知曉。

我舉一篇文獻為例,發表在2010年Science上,2001年人類基因組第一次破譯時,科學家原本以為30億堿基裡能找到10萬個基因,但吃驚地是只發現不到3.5萬個,蛋白編碼區只占整個基因組的1.5%,難道其餘基因組暗物質都是無用的麼?所以這是非常嚴重的問題,很多高端人群去測自己的遺傳密碼,不是沒用,能用的、可分析的只占3%,這就是目前的現狀。

從精准醫學意義上看,我們的遺傳密碼是暗的,但從基礎研究來講,卻有無限創新的機會。這97%為我們締造了非常多的原始創新機會:

第一個方面,從遺傳密碼來講,把人的遺傳密碼和其他進化等級不同的遺傳密碼相比較,Coding代表從規律上已經瞭解的遺傳密碼。Non-coding非編碼區,代表迄今為止不知道功能的部分。

可看出,單細胞原核生物大腸桿菌是如此地簡單低等的生物,85%的遺傳密碼都用來編碼蛋白質,所以測完後就大致知道它是如何生活的。酵母,是單細胞真核生物,稍微高等一些,編碼蛋白質的部分就少了(70%),非編碼區增加(28%);線蟲,是簡單的多細胞,只有960個細胞,但已經是較為高等的多細胞生物,用來編碼蛋白質的部分只有28%;果蠅,已經是昆蟲了,編碼部分只有17%,人類編碼部分只占1.5%,非編碼區增加到98%。

這說明我們也許會認為從生物從簡單到複雜,低等到高等,基因越來越多,蛋白質越來越多,恰恰相反,這是錯誤的,實際上不知道功能的非編碼部分突飛猛進地增加。說明從演化邏輯看來,非編碼序列一定具有更加重要的生物學功能,一定和生物更加高等、更加複雜的功能相關聯。

第二個方面,有人會認為遺傳密碼中有很多冗餘,這也許是正常的。但97%是否發生了資訊,是否活動,用生物學角度講,它是否有轉錄本呢?如果有不同地活動,證明97%是存在的,是活躍地,是每時每刻都在工作,事實確實如此。全世界有幾十個實驗室都百分百地都找到了來自97%序列的轉錄本,只是這部分轉錄組不造蛋白,而是以RNA形式發生功能。這樣結果就充分證明97%的非編碼區內是生物功能的重要組成部分,絕大部分的轉錄產物是非編碼RNA,物種間最主要的差別也是非編碼RNA。

下面,我舉例說明,非編碼RNA與幾種疾病的關係,以發現的個別功能原件與腫瘤相關的研究為例。

第一個是PCGEM1(前列腺特異性RNA基因具有細胞增長促進功能),是來自97%的轉錄本,過表達能導致前列腺癌;第二個來源97%的轉錄本叫HIS-1,該基因在脊椎動物中高度保守,在小鼠中發現可導致白血病,在致癌通路中能控制細胞週期進程;第三個是MALAT-1,可導致非小細胞肺癌,肺癌是我國發病率最高的腫瘤,發病率每年都在遞增,其中80%是非小細胞肺癌。

這三個例子說明腫瘤的病因完全可以來自非編碼區,我們現在所有醫院的臨床指標都來自3%,蛋白編碼的基因部分,而治療的靶向藥物也是針對那3%的,97%的基因突變導致的腫瘤在目前水準下是發現不了也治療不了。這是腫瘤治療遇到的很大問題,腫瘤分子標誌物的成功率很低也是很好理解的,97%沒有納入到疾病的診斷治療視野當中,不止腫瘤,心腦血管病、代謝疾病也有97%的非編碼基因在起作用。說明目前要做到在分子水準上精准地預測疾病必須開發97%的巨大領域,它和所有疾病都相關。

這是我們和協和的赫捷課題組共同研究的成果,在97%當中發現腫瘤標誌物,能很好地區分食管鱗癌的分期及預後;另外也會找到97%的轉錄本,可以影響腫瘤幹細胞的幹性(腫瘤幹細胞中長鏈非編碼RNA IncTCF7能促進人類肝癌幹細胞的自我更新,2015年的研究成果);還有最近剛剛上線的研究成果,發現97%的轉錄本對共有免疫系統具有巨大作用(長非編碼核酸IncKdm2b調控淋巴細胞機制研究,2017年發表在Nature Immunology)。還有非編碼的轉錄本H19,醫生肯定清楚,P53是很重要的蛋白,是我們的保護神。97%中的H19也是我們的保護神,如果它不發生突變,可以通過類似細胞凋亡的途徑,使得某些癌變細胞凋亡。

資料說明,還有許多非編碼基因還沒被發現。人類3%中大約有2萬個元件,97%有多少元件沒有資料。但可以以老鼠舉例,幾年前,日本遺傳研究所(RIKEN)得到小鼠全部轉錄本的克隆,獲得約181,000個全長的RNA轉錄本,其中編碼蛋白質的轉錄本僅有約20,000個,其餘約161,000個轉錄本全部歸屬於非編碼RNA。一個新元件從沒有到發現其功能一定能發表在三大核心期刊CNS上,這就是原始創新的機會。

從過往經驗看,占人類基因組3%的這部分,一共有50個諾貝爾獎金獲得者,面對未開發的97%,將有望誕生更多的諾貝爾獎獲得者。所以,非編碼區的研究對疾病的診斷治療將提供全新的視野,為藥物設計的研發提供全新的平臺,為動植物新品種、新性狀的培育提供全新的基礎。

盯!最熱的醫藥資訊請保持關注「桃花島科技」

Next Article
喜欢就按个赞吧!!!
点击关闭提示