您的位置:首頁>正文

顧衛紅大夫:建設更為開放和標準化的CHPO才能長保活力

圖片來自“視覺中國”

【編者按】顧衛紅, 生化與分子生物學博士, 衛生部中日友好醫院神經內科分子遺傳實驗室負責人, CHPO總召集人。

牽頭成立中國多系統萎縮研究組(CNMSA-SG), 與歐洲多系統萎縮研究組(EMSA-SG)、北美多系統萎縮研究組(NAMSA-SG)日本多系統萎縮研究協會(JAMSAC)建立了密切合作。

本文首發於中國證券網, 作者祁豆豆;億歐編輯整理, 供行業人士參考。

“對於HPO/CHPO來說, 我們不一味追求完善, 首先要在相關方中宣傳理念, 講求如何落地, 從連接一種種疾病的表型資訊和基因資料起步, 從落實到一個個具體的患者開始, 一邊推廣, 一邊完善, 讓更多的用戶參與進來。 ”在2017年初於杭州舉辦的以“開放之路, 你我同行”為主題的2017開放醫療與健康聯盟(OMAHA)第二屆會員大會上, 中日友好醫院運動障礙與神經遺傳病研究中心負責人、CHPO總協調人顧衛紅大夫如此表示。

HPO(Human Phenotype Ontology)即人類表型標準用語, 而在此基礎上誕生的CHPO即中文人類表型標準用語,也可以理解為中文人類表型標準用語聯盟(Human Phenotype Ontology Consortium)。

自2016年初成立以來, 在過去一年多的時間裡, 作為該公益組織總協調人的顧衛紅大夫積極奔走、聯合各方, 做了大量溝通連接以及專案設計工作, 為HPO的當地語系化建設和進一步落地應用發揮了重要作用。

當前相關領域現狀及HPO的臨床需求

近幾年, 基因測序技術飛速發展, 助推精准醫學的興起。 在遺傳病、出生缺陷、腫瘤等疾病的診斷方面, 基因資料變的越來越重要, 而如何連接、解析臨床疾病表型資訊和基因資料之間的關係, 已成為新的發展瓶頸。

顧衛紅大夫認為, HPO可以在疾病表型和致病基因之間起到重要的連接作用, 但現階段兩者的連接存在障礙。

首先是臨床表型資訊的採集效率問題, 隨著二代測序、三代測序等基因測序技術的迅速發展, 獲取基因資料愈加便捷, 成本也不斷降低, 但與之對應的臨床表型資訊的採集效率卻嚴重滯後。

其次是標準化問題, “人對自然界的認識最開始是‘井底之蛙’, 然後是‘瞎子摸象’, 這是一個不斷趨於明確和無限接近真理的過程。 ”顧衛紅表示, 臨床具有複雜性和模糊性特點, 醫學發展的長久歷史造成了疾病命名的交叉分類, 很多疾病的表型存在變異性, 同一個致病基因的突變在不同患者身上表現可能不同。 同時, 每名醫生對患者病情的描述和判斷上也存在差異, 患者的早、中、後期的病程進展表現也不相同。

此外, 內外環境因素也都會在不同程度上對表型產生影響。 更重要的是, 目前的醫療資訊的採集和記錄缺乏標準化方式, 缺乏統一的設計和質控, 碎片化嚴重, 具有很大的局限性, 而且臨床醫生與基因機構缺乏交流平臺。 顧衛紅認為, 很多時候醫生所掌握的個體表型資訊多樣、模糊, 檢測機構通過測序獲得的個體基因資料變異數量很大。 臨床表型資訊與基因檢測資料的有機結合至關重要, 需要臨床醫生和基因機構之間的緊密協作。

“在醫學不斷發展的過程中, 疾病表型與基因之間的關係從模糊到清晰是一個漫長的過程, 需要更多相關領域的人士共同參與完善。 ”顧衛紅表示, HPO作為人類表型術語集, 所提供的是人類疾病中描述表型醫學的標準術語,

與其他系統化設計的標準術語集如LOINC、SNOMED CT等不同, 後者涵蓋全面且完整, 從層面寬度到深度設計很完善。

HPO是源於連接的術語系統, 其主要來源為已有的醫學文獻和資料庫對於遺傳病/罕見病的表型描述, 其優勢為可精准地注釋疾病, 連接表型與基因資料, 而目前存在的主要問題為覆蓋度亟待完善。

成立CHPO恰逢其時

顧衛紅把成立CHPO的原因歸結於一次“機緣巧合”, 但從行業發展趨勢來看, 這其實是一種“殊途同歸”的必然。

時間回到2015年, 當時業內發生了一個知名的基因檢測事件即“林林案例”, 患兒為疑難性遺傳病/罕見病,由於家長是清華校友, 所以清華大學生命科學與醫學校友會為此發起了一場公益活動, 希望相關領域的專家學者以及各個基因檢測機構和公司能夠參與該公益項目,為“林林”找到真正的病因。

彼時國內多家大型基因檢測機構和公司都參與其中,免費為患者做全基因組測序、全外顯子測序等檢測項目。但是,由於各家檢測資料均為基因資料,而表型資料為患兒家長所提供,包括長達70多頁的臨床資料和病理檢查結果。經過比對表型資訊和基因資料,各家機構或公司所得出的結果均不一致,每家對自己的檢測都有不同的解讀分析。

因此在2015年底,清華大學生命科學與醫學校友會再次召集了專案參與方針對該病例組織了一場專題研討會。在本次研討會上,參與各方將各自的分析結果進行了討論和交流。由於長期致力於遺傳病、罕見病患者的相關臨床和研究及公益,顧衛紅作為唯一一名臨床醫生受邀參加了這次討論會。

“當時包括遺傳諮詢、基因檢測等各領域的專家一起談論交流,最終也沒有達成共識,無法明確致病基因。但大家共同的體會是,難以將檢測出的基因資料與臨床表型資訊進行對接是其中最大的痛點。”顧衛紅表示,當時與會者一致認為,臨床表型資料缺乏統一標準,限制了基因資料的分析效率,相關領域迫切需要推動臨床術語標準化的落地應用。有專家提出引入HPO,大家一致同意共同推動HPO的當地語系化推廣,“林林案例”也就此促成了CHPO的誕生。

據瞭解,CHPO的正式成立時間為2016年的1月,創建人包括華大基因團隊、王凱(著名生物資訊學專家,美國哥倫比亞大學基因組醫學所臨床資訊學主任)、張巍(美國醫學遺傳學會雙專科執照認證診斷醫師,美國醫學遺傳學院專家委員)、黃尚志(國內知名遺傳學家,世界衛生組織遺傳病社區控制合作中心主任)以及顧衛紅。作為一個純公益組織,其目的就是為了在中國建立一個開放平臺,通過聯合各相關領域專業人士,逐步建立中文臨床表型術語標準,並讓其指導、服務于中文使用者的臨床和科研工作。

開放和標準化至關重要

“站在行業發展的角度看,資訊資料共用是基礎,而標準化是共用和連接的前提,如果沒有標準化和共同語言,就不可能建造一個‘通天塔’。”在顧衛紅看來,建設一個更為開放和更加標準化的CHPO才能保持長久活力。而利用互聯網技術和平臺可以讓臨床表型資訊和基因資料在整合分析會診和解讀上變得更加有效。

為了對原始翻譯進行編輯優化,在王凱等人的努力下,CHPO維琪(wiki)網站正式建立,之後顧衛紅組織專業人士對詞條進行編輯優化,來自海內外的80餘位臨床、遺傳等領域的專業人士參與了這項工作。

為了和HPO保持緊密聯絡,CHPO還專門設立了聯絡組,通過郵件和電話會議等方式與HPO進行交流。顧衛紅表示“我們與HPO達成共識,建立了CHPO和HPO網站互鏈,希望通過連接的方式匹配表型類似的遺傳病患者,這對於疾病的基因學研究至關重要。”CHPO專門建立了審核委員會,負責不同分類詞彙的中文譯名及定義的編輯優化,並計畫擇期開放註冊,從而讓更多的專業人士參與到CHPO的編輯工作中。

CHPO網站也進行了全新改版,功能更加完善,將CHPO下的指導委員會、維護組、聯絡組、審核委員會等各部門均設定了詞條編輯頁面及成員個人頁面。“每個成員的工作價值得到了體現,同時也會促進大家更積極的參與和投入到這件事中。”顧衛紅說。

據瞭解,HPO主要分為四類名詞,即“表型異常、遺傳模式、死亡/衰老以及臨床調節因素”。其中,“表型異常”是最大的一類名詞,分為23大類,其中神經系統異常的詞彙有1572條,而最多的骨胳系統達到了3532個詞。目前,CHPO取得了階段性的工作成果,截至到2016年10月,在去除不同分類中的重複詞條後,目前總詞條數達到了11896個。

HPO/CHPO的落地實踐

顧衛紅表示,目前表型資訊與基因資料的連接流程是:醫生採集表型資訊後,將病歷交於檢測公司,但是不同醫生提供的病歷品質參差不齊,之後檢測公司將病歷中的關鍵字轉化為HPO,檢索候選致病基因,在完成基因測序後,經過生物資訊和遺傳學分析,對變異位點進行初篩,之後將候選致病基因與患者的變異位點相結合進行選點,出具檢測報告,並注明“請結合臨床”,由醫生為患者解讀基因報告。

“基於醫生品質不同且缺乏標準化術語的病歷,由檢測機構歸納為HPO,這個過程很容易出現偏差。如果能讓醫生瞭解、熟悉並使用HPO歸納患者核心表型,提供給檢測機構,將有助於提高病歷品質,且減少表型資訊傳遞過程中的丟失和偏倚。”顧衛紅認為,基因檢測用於疾病診斷是開展醫療和健康管理等後續工作的基礎。那麼到底如何借助HPO這一工具來連接患者表型資料和基因資料呢?

顧衛紅認為,由於醫療資料碎片化現象嚴重,將普通門診電子病歷系統中的相關資訊作為結構化的表型資料十分困難,門診病歷錄入的聚類查詢在管理上也存在一定難度。在目前階段,無論從專業還是流程方面來講,建立完善的頂層設計十分困難,需要自下而上從局部進行探索,打通相關環節,之後再逐步複製擴大完善。首先需要以患者資料為中心去連接臨床醫生、患者、檢測機構和相關的資料機構。”顧衛紅如此表示。

為此,顧大夫基於自己的專病門診,與一脈基因合作,共同開發了“運動障礙與神經遺傳病專病門診”表型資訊採集電子病歷系統。在首頁中,除基本資訊外,還包括疾病分類以及查詢和匯出功能。不同於常規的住院病歷,該系統收集的表型資訊是一種具有針對性的“精准”病歷,基於某一類疾病的常見表型設計資料庫,通過病史、體格檢查、輔助檢查等頁面採集表型資訊。

在擬診頁面,設計了核心表型輸入方式,通過連接CHPO詞庫,檢索患者的核心表型,從而選取CHPO/HPO關鍵字。目前正在探索連接基因檢測機構,可以將送檢的患者表型資訊(包括CHPO/HPO關鍵字)分享給檢測機構用戶,隨後基因檢測機構或公司結合分享的資料進行基因資料的初步分析,將結果上傳到系統中,臨床醫生再根據初步的分析結果與患者疾病表型資訊進行比對,最後為病人提供最終的基因檢測報告。

“我們一直在摸索如何把相關資訊更好地分享,梳理表型資訊與基因資料連接的流程。”顧衛紅說。此外,患者可以通過掃描二維碼獲取病歷資訊並列印病歷摘要,從而在醫療資訊的共用方面也進行了相應的探索。

顧衛紅坦言,在推動CHPO當地語系化應用的過程中,需要建立起包括臨床、遺傳、生物資訊、醫學資料等在內的多個專業領域的廣泛合作,通過HPO/CHPO將醫生獲得的複雜多樣的表型資訊、基因檢測機構獲得的大量的基因變異資料同已有的知識庫和資料庫三者之間進行有效連接。

“在這個過程中,醫生採集患者表型資訊轉化為HPO,是後續分析工作的重要基礎。HPO/CHPO就是為連接而來,所以未來要一直走下去,去探索更多的連接。”顧衛紅如此說道。

51

64

希望相關領域的專家學者以及各個基因檢測機構和公司能夠參與該公益項目,為“林林”找到真正的病因。

彼時國內多家大型基因檢測機構和公司都參與其中,免費為患者做全基因組測序、全外顯子測序等檢測項目。但是,由於各家檢測資料均為基因資料,而表型資料為患兒家長所提供,包括長達70多頁的臨床資料和病理檢查結果。經過比對表型資訊和基因資料,各家機構或公司所得出的結果均不一致,每家對自己的檢測都有不同的解讀分析。

因此在2015年底,清華大學生命科學與醫學校友會再次召集了專案參與方針對該病例組織了一場專題研討會。在本次研討會上,參與各方將各自的分析結果進行了討論和交流。由於長期致力於遺傳病、罕見病患者的相關臨床和研究及公益,顧衛紅作為唯一一名臨床醫生受邀參加了這次討論會。

“當時包括遺傳諮詢、基因檢測等各領域的專家一起談論交流,最終也沒有達成共識,無法明確致病基因。但大家共同的體會是,難以將檢測出的基因資料與臨床表型資訊進行對接是其中最大的痛點。”顧衛紅表示,當時與會者一致認為,臨床表型資料缺乏統一標準,限制了基因資料的分析效率,相關領域迫切需要推動臨床術語標準化的落地應用。有專家提出引入HPO,大家一致同意共同推動HPO的當地語系化推廣,“林林案例”也就此促成了CHPO的誕生。

據瞭解,CHPO的正式成立時間為2016年的1月,創建人包括華大基因團隊、王凱(著名生物資訊學專家,美國哥倫比亞大學基因組醫學所臨床資訊學主任)、張巍(美國醫學遺傳學會雙專科執照認證診斷醫師,美國醫學遺傳學院專家委員)、黃尚志(國內知名遺傳學家,世界衛生組織遺傳病社區控制合作中心主任)以及顧衛紅。作為一個純公益組織,其目的就是為了在中國建立一個開放平臺,通過聯合各相關領域專業人士,逐步建立中文臨床表型術語標準,並讓其指導、服務于中文使用者的臨床和科研工作。

開放和標準化至關重要

“站在行業發展的角度看,資訊資料共用是基礎,而標準化是共用和連接的前提,如果沒有標準化和共同語言,就不可能建造一個‘通天塔’。”在顧衛紅看來,建設一個更為開放和更加標準化的CHPO才能保持長久活力。而利用互聯網技術和平臺可以讓臨床表型資訊和基因資料在整合分析會診和解讀上變得更加有效。

為了對原始翻譯進行編輯優化,在王凱等人的努力下,CHPO維琪(wiki)網站正式建立,之後顧衛紅組織專業人士對詞條進行編輯優化,來自海內外的80餘位臨床、遺傳等領域的專業人士參與了這項工作。

為了和HPO保持緊密聯絡,CHPO還專門設立了聯絡組,通過郵件和電話會議等方式與HPO進行交流。顧衛紅表示“我們與HPO達成共識,建立了CHPO和HPO網站互鏈,希望通過連接的方式匹配表型類似的遺傳病患者,這對於疾病的基因學研究至關重要。”CHPO專門建立了審核委員會,負責不同分類詞彙的中文譯名及定義的編輯優化,並計畫擇期開放註冊,從而讓更多的專業人士參與到CHPO的編輯工作中。

CHPO網站也進行了全新改版,功能更加完善,將CHPO下的指導委員會、維護組、聯絡組、審核委員會等各部門均設定了詞條編輯頁面及成員個人頁面。“每個成員的工作價值得到了體現,同時也會促進大家更積極的參與和投入到這件事中。”顧衛紅說。

據瞭解,HPO主要分為四類名詞,即“表型異常、遺傳模式、死亡/衰老以及臨床調節因素”。其中,“表型異常”是最大的一類名詞,分為23大類,其中神經系統異常的詞彙有1572條,而最多的骨胳系統達到了3532個詞。目前,CHPO取得了階段性的工作成果,截至到2016年10月,在去除不同分類中的重複詞條後,目前總詞條數達到了11896個。

HPO/CHPO的落地實踐

顧衛紅表示,目前表型資訊與基因資料的連接流程是:醫生採集表型資訊後,將病歷交於檢測公司,但是不同醫生提供的病歷品質參差不齊,之後檢測公司將病歷中的關鍵字轉化為HPO,檢索候選致病基因,在完成基因測序後,經過生物資訊和遺傳學分析,對變異位點進行初篩,之後將候選致病基因與患者的變異位點相結合進行選點,出具檢測報告,並注明“請結合臨床”,由醫生為患者解讀基因報告。

“基於醫生品質不同且缺乏標準化術語的病歷,由檢測機構歸納為HPO,這個過程很容易出現偏差。如果能讓醫生瞭解、熟悉並使用HPO歸納患者核心表型,提供給檢測機構,將有助於提高病歷品質,且減少表型資訊傳遞過程中的丟失和偏倚。”顧衛紅認為,基因檢測用於疾病診斷是開展醫療和健康管理等後續工作的基礎。那麼到底如何借助HPO這一工具來連接患者表型資料和基因資料呢?

顧衛紅認為,由於醫療資料碎片化現象嚴重,將普通門診電子病歷系統中的相關資訊作為結構化的表型資料十分困難,門診病歷錄入的聚類查詢在管理上也存在一定難度。在目前階段,無論從專業還是流程方面來講,建立完善的頂層設計十分困難,需要自下而上從局部進行探索,打通相關環節,之後再逐步複製擴大完善。首先需要以患者資料為中心去連接臨床醫生、患者、檢測機構和相關的資料機構。”顧衛紅如此表示。

為此,顧大夫基於自己的專病門診,與一脈基因合作,共同開發了“運動障礙與神經遺傳病專病門診”表型資訊採集電子病歷系統。在首頁中,除基本資訊外,還包括疾病分類以及查詢和匯出功能。不同於常規的住院病歷,該系統收集的表型資訊是一種具有針對性的“精准”病歷,基於某一類疾病的常見表型設計資料庫,通過病史、體格檢查、輔助檢查等頁面採集表型資訊。

在擬診頁面,設計了核心表型輸入方式,通過連接CHPO詞庫,檢索患者的核心表型,從而選取CHPO/HPO關鍵字。目前正在探索連接基因檢測機構,可以將送檢的患者表型資訊(包括CHPO/HPO關鍵字)分享給檢測機構用戶,隨後基因檢測機構或公司結合分享的資料進行基因資料的初步分析,將結果上傳到系統中,臨床醫生再根據初步的分析結果與患者疾病表型資訊進行比對,最後為病人提供最終的基因檢測報告。

“我們一直在摸索如何把相關資訊更好地分享,梳理表型資訊與基因資料連接的流程。”顧衛紅說。此外,患者可以通過掃描二維碼獲取病歷資訊並列印病歷摘要,從而在醫療資訊的共用方面也進行了相應的探索。

顧衛紅坦言,在推動CHPO當地語系化應用的過程中,需要建立起包括臨床、遺傳、生物資訊、醫學資料等在內的多個專業領域的廣泛合作,通過HPO/CHPO將醫生獲得的複雜多樣的表型資訊、基因檢測機構獲得的大量的基因變異資料同已有的知識庫和資料庫三者之間進行有效連接。

“在這個過程中,醫生採集患者表型資訊轉化為HPO,是後續分析工作的重要基礎。HPO/CHPO就是為連接而來,所以未來要一直走下去,去探索更多的連接。”顧衛紅如此說道。

51

64

同類文章
Next Article
喜欢就按个赞吧!!!
点击关闭提示