利用UGC攻克技術難題 WeGene加速解讀基因秘密
中新網5月25日電 隨著基因檢測在遺傳病檢測、新藥研發、腫瘤診斷及治療、生物多樣性保護等多領域的應用,
國內領先的個人基因組服務公司——WeGene是一家致力於消費級基因資料解讀與個性化健康服務的創業公司。在IT基礎設施搭建上,WeGene採用UCloud研發的通用計算服務(UGC)不僅攻克了技術難題,
個人基因解讀開拓者
基因檢測是指通過血液、其他體液或細胞對被測者的DNA分子進行檢測,並分析被檢測者所含致病基因、疾病易感性基因等情況的一種技術,可以診斷疾病, 預測疾病風險,還可以分析祖源成分,解析運動基因。
相比人類基因緩慢的進化速度,基因組測序技術的發展在近二十年裡突飛猛進,
今年1月,國家發展改革委正式印發《“十三五”生物產業發展規劃》,在發展目標中提到,通過生物產業的發展,基因檢測能力(含孕前、產前、新生兒)覆蓋出生人口50%以上,社會化檢測服務受眾大幅增加。另外,中投顧問發佈的《2017-2021年中國基因檢測行業投資分析及前景預測報告》預計,
目前,基因檢測行業蓄勢爆發的狀態不僅加速大公司佈局,同時也吸引大批創業者加入。WeGene是一家成立於2014年的個人基因組服務供應商,通過高通量基因檢測技術,
近期,WeGene宣佈與全球最大基因組學研發機構——華大基因旗下子公司華大科技達成戰略合作,將共同推動人類基因組研究和應用領域的發展,並為客戶提供更可靠的資料和更優質的個性化服務。
微解讀平臺的技術困擾
然而,每一位成功者背後都要經歷不同的曲折與探索,WeGene也不例外。初期,在WeGene開放給社區開發者自行創建協力廠商基因解讀的“微解讀”平臺上,開發者們只能通過單個的基因位點去解讀性狀。但因為許多複雜性狀都是由多位點決定的,所以單位點的解讀方式缺乏充分的合理性。
不過,想要在微解讀中支援對多個位點組合的情況進行分析依然比較複雜,因為對於不同的基因解讀專案,其解讀規則、演算法均不相同,很難通過使用者圖形介面去創建。當微解讀功能被限制時,開發者們必須通過更為複雜的開放API進行應用開發,WeGene也收到了“開放平臺API的使用太複雜、寫個基因分析應用還要搞資料庫、Web框架怎麼用?能不能只寫個腳本來分析?”等一系列來自生物資訊工程師們的抱怨。
這種“繁雜的研發模式”嚴重影響了社區開發者的開發意願。開發者們必須將基因解讀演算法改寫成服務端程式,進行部署上線,再通過API從 WeGene 的資料庫中拉取資料並為使用者進行計算,最後將計算結果返回給使用者並存入資料庫中。
這種研發模式極大增加了開發週期和運維成本,社區開發者需要考慮伺服器容量、存儲容量、網路頻寬、架構伸縮性等多重問題,很多時候無法專注於業務本身,而WeGene也需要投入大量精力、資源去幫助開發者們逐個解決基礎架構和計算成本的問題。
UCloud助力WeGene平臺升級
通用計算(UCloud General Compute,簡稱“UGC”)是由國內領先的雲計算提供商UCloud研發的分散式大規模平行計算服務,是UCloud基於UGC高效平行計算能力搭建的物件存儲(UFile)圖片處理服務。UGC能夠充分利用UCloud一個區域內的多個可用區的UHost(雲主機),提供基於UCloud雲平臺的高可用性、高安全性和高功能性,同時滿足圖片處理、機器學習、大資料處理、生物資料分析等領域的計算需求。
UGC可提供十萬核級的併發計算能力,系統自動完成任務調度,並按實際使用量計費。在使用UCloud提供的UGC服務之後,開發者只需要上傳已經被抽象為計算函數的各種基因解讀演算法代碼,WeGene 會通過自動化構建過程將這些演算法打包到UGC的演算法倉庫中。通過調用UGC的API,使這些函數能夠在UGC平臺上被遠端執行並即時返回運行結果。這一過程將開發者從底層架構中解放了出來,使他們能夠專注於業務的實現。
作為Serverless服務,UGC能夠根據WeGene的請求量,自動化實現服務的伸縮計算和資源的調度分配,進行完全自動化、彈性的擴展。同時,根據UGC“pay-as-you-go”的收費原則,還最大程度節約了WeGene的資源使用成本。
伴隨科技進步,基因工程已進入普通百姓的生活,人們只需簡單操作就能得到與自身緊密相關的基因解答。一直以來,UCloud積極與基因工程、航太技術等前沿科技企業開展合作,推動科技研究和應用市場實現快速落地,為人類更深入地瞭解自己與世界服務。
所以單位點的解讀方式缺乏充分的合理性。不過,想要在微解讀中支援對多個位點組合的情況進行分析依然比較複雜,因為對於不同的基因解讀專案,其解讀規則、演算法均不相同,很難通過使用者圖形介面去創建。當微解讀功能被限制時,開發者們必須通過更為複雜的開放API進行應用開發,WeGene也收到了“開放平臺API的使用太複雜、寫個基因分析應用還要搞資料庫、Web框架怎麼用?能不能只寫個腳本來分析?”等一系列來自生物資訊工程師們的抱怨。
這種“繁雜的研發模式”嚴重影響了社區開發者的開發意願。開發者們必須將基因解讀演算法改寫成服務端程式,進行部署上線,再通過API從 WeGene 的資料庫中拉取資料並為使用者進行計算,最後將計算結果返回給使用者並存入資料庫中。
這種研發模式極大增加了開發週期和運維成本,社區開發者需要考慮伺服器容量、存儲容量、網路頻寬、架構伸縮性等多重問題,很多時候無法專注於業務本身,而WeGene也需要投入大量精力、資源去幫助開發者們逐個解決基礎架構和計算成本的問題。
UCloud助力WeGene平臺升級
通用計算(UCloud General Compute,簡稱“UGC”)是由國內領先的雲計算提供商UCloud研發的分散式大規模平行計算服務,是UCloud基於UGC高效平行計算能力搭建的物件存儲(UFile)圖片處理服務。UGC能夠充分利用UCloud一個區域內的多個可用區的UHost(雲主機),提供基於UCloud雲平臺的高可用性、高安全性和高功能性,同時滿足圖片處理、機器學習、大資料處理、生物資料分析等領域的計算需求。
UGC可提供十萬核級的併發計算能力,系統自動完成任務調度,並按實際使用量計費。在使用UCloud提供的UGC服務之後,開發者只需要上傳已經被抽象為計算函數的各種基因解讀演算法代碼,WeGene 會通過自動化構建過程將這些演算法打包到UGC的演算法倉庫中。通過調用UGC的API,使這些函數能夠在UGC平臺上被遠端執行並即時返回運行結果。這一過程將開發者從底層架構中解放了出來,使他們能夠專注於業務的實現。
作為Serverless服務,UGC能夠根據WeGene的請求量,自動化實現服務的伸縮計算和資源的調度分配,進行完全自動化、彈性的擴展。同時,根據UGC“pay-as-you-go”的收費原則,還最大程度節約了WeGene的資源使用成本。
伴隨科技進步,基因工程已進入普通百姓的生活,人們只需簡單操作就能得到與自身緊密相關的基因解答。一直以來,UCloud積極與基因工程、航太技術等前沿科技企業開展合作,推動科技研究和應用市場實現快速落地,為人類更深入地瞭解自己與世界服務。