[據物理學家組織 2017年3月2日報導]《科學》雜誌上的一篇新型研究表明, 哥倫比亞大學和紐約基因組中心(NYGC)的研究人員為手機上的視頻流(streaming video)設計的演算法, 將更多的資訊壓縮到DNA的四個堿基, 可解鎖DNA的完全存儲潛力。 他們證明, 這項技術是非常可靠的。
DNA是一種理想的存儲介質, 因為它體積超小, 在陰涼乾燥的環境下可儲存上千年。 該項研究的合著者、哥倫比亞大學電腦科學教授、哥倫比亞資料科學研究院成員、紐約基因組中心的核心成員雅尼夫·埃爾裡赫表示, DNA不會像磁帶和CD那樣隨時間的推移而分解, 且不會過時。
埃爾裡赫和他的同事, 紐約基因組中心的助理研究院迪娜·傑林斯基選擇以下六個檔編碼寫入DNA:一個完整的電腦作業系統、一部1895年的法國電影、電影《火車到站》、一張50美元的亞馬遜禮品卡、一個電腦病毒、一塊“先驅者”徽章和一項資訊理論家克勞德·香農1948年的研究。
他們將所有檔案壓縮成一個主文件, 然後將資料分成由1和0組成的二進位碼短字串。 使用“噴泉碼”糾刪演算法(
erasure-correcting algorithm), 隨機將字串打包成所謂的“水滴”(droplet), 並將每個“水滴”中的1和0繪製在DNA的四個堿基(A、G、C和T)上。 該演算法刪除會產生錯誤的字母組合, 在每個“水滴”中添加條碼, 有助於以後的檔重組。
研究人員一共產生了72000個DNA鏈, 每個鏈上含有200個堿基, 他們將這些DNA以文字檔的形式送往三藩市DNA合成公司Twist Bioscience, 該公司擅長將數位資料轉換為生物資料。 兩周後, 他們拿到了合成的DNA分子。
為了恢復檔, 研究人員使用現代測序技術讀取DNA鏈, 然後利用軟體將一串代碼轉換為二進位。 研究報告稱, 他們恢復了先前的檔, 且錯誤率為零。
研究人員還驗證了, 使用他們的編碼技術可以創建一個幾乎無限數量的檔, 這項技術通過聚合酶鏈反應(PCR)使DNA樣本增殖, 這些檔、甚至是檔的副本所恢復後的檔都可以達到零錯誤率。
研究人員表示, 他們的編碼策略可在1克DNA上容納215拍位元組的資料, 是哈佛大學的喬治·丘奇、歐洲資訊生物研究所的尼克·戈德曼和伊萬·伯尼研究結果的100倍。
DNA資料存儲能力在理論上每種堿基可存儲兩個二進位位元, 但是由於DNA本身的生物約束, 以及重組和讀取需要加入冗餘資訊,