華文網

你還在用U盤、硬碟存儲資料?NO,NO,快看美國人用的什麼吧

[據物理學家組織 2017年3月2日報導]《科學》雜誌上的一篇新型研究表明,哥倫比亞大學和紐約基因組中心(NYGC)的研究人員為手機上的視頻流(streaming video)設計的演算法,將更多的資訊壓縮到DNA的四個堿基,

可解鎖DNA的完全存儲潛力。他們證明,這項技術是非常可靠的。

DNA是一種理想的存儲介質,因為它體積超小,在陰涼乾燥的環境下可儲存上千年。該項研究的合著者、哥倫比亞大學電腦科學教授、哥倫比亞資料科學研究院成員、紐約基因組中心的核心成員雅尼夫·埃爾裡赫表示,

DNA不會像磁帶和CD那樣隨時間的推移而分解,且不會過時。

埃爾裡赫和他的同事,紐約基因組中心的助理研究院迪娜·傑林斯基選擇以下六個檔編碼寫入DNA:一個完整的電腦作業系統、一部1895年的法國電影、電影《火車到站》、一張50美元的亞馬遜禮品卡、一個電腦病毒、一塊“先驅者”徽章和一項資訊理論家克勞德·香農1948年的研究。

他們將所有檔案壓縮成一個主文件,

然後將資料分成由1和0組成的二進位碼短字串。使用“噴泉碼”糾刪演算法(

erasure-correcting algorithm),隨機將字串打包成所謂的“水滴”(droplet),並將每個“水滴”中的1和0繪製在DNA的四個堿基(A、G、C和T)上。該演算法刪除會產生錯誤的字母組合,在每個“水滴”中添加條碼,有助於以後的檔重組。

研究人員一共產生了72000個DNA鏈,每個鏈上含有200個堿基,他們將這些DNA以文字檔的形式送往三藩市DNA合成公司Twist Bioscience,該公司擅長將數位資料轉換為生物資料。兩周後,他們拿到了合成的DNA分子。

為了恢復檔,研究人員使用現代測序技術讀取DNA鏈,然後利用軟體將一串代碼轉換為二進位。研究報告稱,他們恢復了先前的檔,且錯誤率為零。

研究人員還驗證了,使用他們的編碼技術可以創建一個幾乎無限數量的檔,

這項技術通過聚合酶鏈反應(PCR)使DNA樣本增殖,這些檔、甚至是檔的副本所恢復後的檔都可以達到零錯誤率。

研究人員表示,他們的編碼策略可在1克DNA上容納215拍位元組的資料,是哈佛大學的喬治·丘奇、歐洲資訊生物研究所的尼克·戈德曼和伊萬·伯尼研究結果的100倍。這是有史以來密度最高的資料存放裝置。

DNA資料存儲能力在理論上每種堿基可存儲兩個二進位位元,但是由於DNA本身的生物約束,以及重組和讀取需要加入冗餘資訊,DNA的實際存儲能力為每種堿基可存儲1.8個二進位位元。使用該團隊的噴泉碼技術使讀取和寫入過程更高效,平均每個堿基的存儲量可達到1.6個二進位位元。