您的位置:首頁>正文

你還在用U盤、硬碟存儲資料?NO,NO,快看美國人用的什麼吧

[據物理學家組織 2017年3月2日報導]《科學》雜誌上的一篇新型研究表明, 哥倫比亞大學和紐約基因組中心(NYGC)的研究人員為手機上的視頻流(streaming video)設計的演算法, 將更多的資訊壓縮到DNA的四個堿基, 可解鎖DNA的完全存儲潛力。 他們證明, 這項技術是非常可靠的。

DNA是一種理想的存儲介質, 因為它體積超小, 在陰涼乾燥的環境下可儲存上千年。 該項研究的合著者、哥倫比亞大學電腦科學教授、哥倫比亞資料科學研究院成員、紐約基因組中心的核心成員雅尼夫·埃爾裡赫表示, DNA不會像磁帶和CD那樣隨時間的推移而分解, 且不會過時。

埃爾裡赫和他的同事, 紐約基因組中心的助理研究院迪娜·傑林斯基選擇以下六個檔編碼寫入DNA:一個完整的電腦作業系統、一部1895年的法國電影、電影《火車到站》、一張50美元的亞馬遜禮品卡、一個電腦病毒、一塊“先驅者”徽章和一項資訊理論家克勞德·香農1948年的研究。

他們將所有檔案壓縮成一個主文件, 然後將資料分成由1和0組成的二進位碼短字串。 使用“噴泉碼”糾刪演算法(

erasure-correcting algorithm), 隨機將字串打包成所謂的“水滴”(droplet), 並將每個“水滴”中的1和0繪製在DNA的四個堿基(A、G、C和T)上。 該演算法刪除會產生錯誤的字母組合, 在每個“水滴”中添加條碼, 有助於以後的檔重組。

研究人員一共產生了72000個DNA鏈, 每個鏈上含有200個堿基, 他們將這些DNA以文字檔的形式送往三藩市DNA合成公司Twist Bioscience, 該公司擅長將數位資料轉換為生物資料。 兩周後, 他們拿到了合成的DNA分子。

為了恢復檔, 研究人員使用現代測序技術讀取DNA鏈, 然後利用軟體將一串代碼轉換為二進位。 研究報告稱, 他們恢復了先前的檔, 且錯誤率為零。

研究人員還驗證了, 使用他們的編碼技術可以創建一個幾乎無限數量的檔, 這項技術通過聚合酶鏈反應(PCR)使DNA樣本增殖, 這些檔、甚至是檔的副本所恢復後的檔都可以達到零錯誤率。

研究人員表示, 他們的編碼策略可在1克DNA上容納215拍位元組的資料, 是哈佛大學的喬治·丘奇、歐洲資訊生物研究所的尼克·戈德曼和伊萬·伯尼研究結果的100倍。

這是有史以來密度最高的資料存放裝置。

DNA資料存儲能力在理論上每種堿基可存儲兩個二進位位元, 但是由於DNA本身的生物約束, 以及重組和讀取需要加入冗餘資訊,

DNA的實際存儲能力為每種堿基可存儲1.8個二進位位元。 使用該團隊的噴泉碼技術使讀取和寫入過程更高效, 平均每個堿基的存儲量可達到1.6個二進位位元。

同類文章
Next Article
喜欢就按个赞吧!!!
点击关闭提示