李忠東/編 譯
不久前,微軟公司宣布,它和美國華盛頓大學(xué)研究人員合作,利用人工合成DNA作為數(shù)據(jù)存儲介質(zhì)的技術(shù),保存了大約200兆數(shù)據(jù),其中有包括《戰(zhàn)爭與和平》在內(nèi)的100部經(jīng)典文學(xué)作品、被譯成100多種語言的《世界人權(quán)宣言》、數(shù)字圖書館“古騰堡工程” 排名前100位的電子書以及全球作物多樣性信托基金的種子數(shù)據(jù)庫等。
盡管已經(jīng)有研究證明數(shù)據(jù)可以被保存在DNA中,然而一次性向DNA寫入如此多數(shù)據(jù)還是第一次。微軟公司和美國華盛頓大學(xué)的研究團隊成功地將4個圖片文件的數(shù)據(jù)編碼為人工合成DNA片段的核苷酸序列。更重要的是,他們能實現(xiàn)逆過程——從更大的DNA池中取回正確的核苷酸序列,重建圖像,而且沒有丟失1個字節(jié)的信息。
DNA的4種堿基(A,G,C,T)可被用來作數(shù)據(jù)編碼
DNA存儲技術(shù)著眼于未來、具有劃時代意義,它利用人工合成的脫氧核糖核酸(DNA)作為存儲介質(zhì),具有高效、存儲量大、存儲時間長、易獲取且免維護的優(yōu)點。利用DNA存儲數(shù)據(jù)的關(guān)鍵是DNA堿基,DNA這種雙螺旋結(jié)構(gòu)上有4種化學(xué)基團,即堿基,它們按照特定順序排列,組成遺傳信息,指導(dǎo)生物體生長發(fā)育。DNA數(shù)字存儲系統(tǒng)同樣利用這4種堿基“字母”開發(fā)定制代碼。當(dāng)復(fù)制一份計算機文件時,DNA數(shù)字存儲系統(tǒng)首先把硬盤信息中的二進制數(shù)翻譯成定制代碼,然后借助標(biāo)準(zhǔn)DNA合成機器制造出相應(yīng)的堿基序列。這一序列是多個重復(fù)片段,即便某些片段遭損毀,數(shù)據(jù)也不會丟失。分子生物學(xué)實驗室用讀取生物體DNA的標(biāo)準(zhǔn)設(shè)備讀取信息,能即時呈現(xiàn)在電腦屏幕上。
DNA存儲技術(shù)的顯著優(yōu)點之一是容量大。1克DNA能夠存儲相當(dāng)于300萬張CD的容量。用DNA存儲數(shù)據(jù)保存時間可能長達數(shù)千年。與硬盤、磁帶等存儲介質(zhì)不同的是,DNA不需要經(jīng)常維護。
試管底部粉紅色物質(zhì)即DNA,少量DNA即可存儲大量數(shù)據(jù)
在信息存儲上,硬盤完全不能和DNA相提并論。在人類的基因序列中,1毫克DNA分子的信息存儲空間能在儲存美國國會圖書館全部書籍之后還有剩余。美國國會圖書館建于1800年,是美國的4個官方國家圖書館之一,也是全球最重要的圖書館之一。目前藏品總數(shù)1.3億件,包括很多稀有圖書、特色收藏、電影膠片和電視片等。
微軟公司希望在未來把DNA存儲介質(zhì)技術(shù)和現(xiàn)有硅技術(shù)硬盤結(jié)合起來,創(chuàng)造出更安全快速的大容量硬盤。到那時,一鞋盒DNA就足以保存100個大型數(shù)據(jù)中心的數(shù)據(jù)。
國際數(shù)據(jù)資訊公司預(yù)計,全球范圍內(nèi)保存的數(shù)據(jù)到明年將達到16萬億千兆,其中大部分位于大型數(shù)據(jù)中心。當(dāng)前的電子存儲設(shè)備發(fā)展速度趕不上數(shù)據(jù)量的增長,無法在期望的成本內(nèi)保存所有信息。由于大數(shù)據(jù)應(yīng)用的爆發(fā)性增長,提高存儲密度已刻不容緩。DNA作為一種極具吸引力的潛在數(shù)據(jù)存儲介質(zhì),具有廣闊的應(yīng)用前景和商業(yè)價值,是生物芯片的核心元素。
研究團隊將4個圖片文件的數(shù)據(jù)編碼為人工合成DNA片段的核苷酸序列
生物芯片又稱蛋白芯片或基因芯片,起源于DNA雜交探針技術(shù)與半導(dǎo)體工業(yè)技術(shù)相結(jié)合的結(jié)晶。它在生命科學(xué)研究及實踐、醫(yī)學(xué)科研及臨床、藥物設(shè)計、環(huán)境保護、農(nóng)業(yè)、軍事等各個領(lǐng)域用途廣泛,將產(chǎn)生巨大的社會和經(jīng)濟效益。
研究人員認為,微軟公司的成功令人關(guān)注,但制作訂制DNA分子的成本高昂,是DNA存儲技術(shù)大規(guī)模使用的主要障礙。如果希望人們接受這一技術(shù),那么其成本至少要低于磁帶成本。
耐久性極好的DNA
磁帶是目前用于長期存儲的標(biāo)準(zhǔn)介質(zhì),隨著生物技術(shù)的進步和DNA讀寫工具的成本下降,DNA有望最終取而代之。DNA的耐久性極好,在干燥寒冷的情況下表現(xiàn)尤為突出。2016年3月,有研究人員部分重建了古人類基因,這些古人類的骨骼保存在西班牙一處洞穴里已超過40萬年。作為對比,磁帶保存數(shù)據(jù)只有幾十年時間,隨后就會老化。
(資料來源:英國《每日郵報》)