馮智
信息的儲(chǔ)存對(duì)人類文明的傳承來說至關(guān)重要,數(shù)千年來,人類保存信息的方式由巖洞壁畫、甲骨文、竹木簡(jiǎn)、牛皮紙,一直發(fā)展到近百年來的磁帶、膠卷、光盤,以及如今的精密半導(dǎo)體存儲(chǔ)芯片。介質(zhì)越來越小巧,可存儲(chǔ)的信息量卻越來越龐大。在可預(yù)見的未來,會(huì)不會(huì)出現(xiàn)更具革命性的儲(chǔ)存手段呢?比如細(xì)菌。
事實(shí)上,科學(xué)家從未停止過對(duì)更新存儲(chǔ)介質(zhì)的探索,畢竟在信息爆炸的未來,找到更便宜、容量更大的存儲(chǔ)介質(zhì),能給人們的生活和工作帶來更多便利。于是有人提出,能不能利用DNA儲(chǔ)存信息?畢竟DNA的存儲(chǔ)量之巨是顯而易見的,它能輕易裝下人體內(nèi)所有的秘密。
當(dāng)然,DNA存儲(chǔ)并非一個(gè)嶄新的概念,早在半個(gè)多世紀(jì)以前,就有人提出過,然而受制于當(dāng)時(shí)有限的生物學(xué)發(fā)展進(jìn)度,很多想法也僅僅止步于概念。但如今,得益于近十年來分子生物學(xué)的突飛猛進(jìn),人們開始重新重視DNA存儲(chǔ)技術(shù)。
話說回來,DNA是如何記住每個(gè)人體內(nèi)獨(dú)有的海量遺傳信息呢?據(jù)分子生物學(xué)家介紹,DNA可將腺嘌呤(A)、鳥嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)四種堿基以不同的方式排列組合,輔以細(xì)胞特有的讀取方式,高效儲(chǔ)存生物體豐富的遺傳信息。因此科學(xué)家認(rèn)為,既然遺傳信息都能夠被留存下來,那么其他信息為何不可?
這種推想完全可行。舉個(gè)例子,單位質(zhì)量的DNA可存儲(chǔ)455EB的信息,這是全球一年信息總量的四分之一;而單位體積的DNA可存儲(chǔ)的信息為整個(gè)互聯(lián)網(wǎng)的33倍。顯然,DNA可以作為一種穩(wěn)定且密集的數(shù)據(jù)存儲(chǔ)介質(zhì),潛在優(yōu)勢(shì)是密度大、能耗低,且壽命長(zhǎng)。
對(duì)此,生物學(xué)家進(jìn)行了嘗試。
首先是確定信息轉(zhuǎn)換的規(guī)則。生物學(xué)家為DNA內(nèi)的腺嘌呤(A)、鳥嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)四種堿基,賦予了數(shù)字概念,把它們當(dāng)做數(shù)字信息,即把數(shù)字化的信息轉(zhuǎn)變?yōu)橛脡A基來表示。用二進(jìn)制來舉個(gè)例子,如果把A和G當(dāng)做0,C和T當(dāng)做1,就可以排列組合成任何信息,簡(jiǎn)單又直觀。
后來科學(xué)家開始采用四進(jìn)制模式,即把A、T、C、G看作0、1、2、3,這種方式可以大大縮小數(shù)據(jù)量,但同時(shí)也導(dǎo)致堿基重復(fù)出現(xiàn),序列穩(wěn)定性隨之變差,對(duì)數(shù)據(jù)的精確重現(xiàn)造成了破壞。
于是科學(xué)家決定采用三進(jìn)制手段,讓前一位堿基成為后一位堿基的決定條件。假如前一位堿基為A,則下一位就把A排除,用C、G、T來代表0、1、2,以此類推。解決了堿基問題后,分子生物學(xué)家開始嘗試把各類信息數(shù)據(jù)導(dǎo)入DNA里,比如有一位哈佛大學(xué)的研究者就成功把一本書的電子數(shù)據(jù)編輯成了DNA形式。
如今這項(xiàng)技術(shù)雖然比50年前有了飛躍式的進(jìn)步,但還遠(yuǎn)未實(shí)現(xiàn)在活體細(xì)胞基因組中存儲(chǔ)信息這一目標(biāo),因而距離真正的應(yīng)用、普及還尚有距離。然而,DNA巨大的儲(chǔ)存潛力和大數(shù)據(jù)信息爆炸的時(shí)代緊迫性,無(wú)時(shí)無(wú)刻不在激勵(lì)著分子生物學(xué)家們開展更多的探究。想象一下,未來你抽屜里的移動(dòng)硬盤,可能會(huì)被一只小小的細(xì)菌所替代,所以當(dāng)下的一切嘗試都是值得的!
●梁衍軍 薦稿