Lori Dajose
近期的《自然》雜志中發(fā)表一項研究,來自加州理工學(xué)院生物工程助理教授Lu-lu Qian(錢璐璐)實驗室發(fā)明了一種由DNA制成的人工神經(jīng)網(wǎng)絡(luò),可以正確識別分子數(shù)字。這項工作標(biāo)志著人工智能在編入合成生物分子電路方面,邁出了重要的一步。
“盡管科學(xué)家只是剛剛開始探索在分子機(jī)器中創(chuàng)造人工智能,但卻具有無可爭辯的巨大潛力。”錢璐璐表示。相比百年前,電子計算機(jī)和智能電話已經(jīng)讓人類變得更有能力。與之相似的是,人工分子機(jī)器可以使所有物體分子化。在未來的百余年中,人工分子機(jī)器將更有能力和快速地對周圍的環(huán)境作出反應(yīng)。
人工神經(jīng)網(wǎng)絡(luò)是由人類大腦啟發(fā)所得的數(shù)學(xué)模型。雖然相比生物神經(jīng)網(wǎng)絡(luò),人工的還是太過簡單,可是它已經(jīng)具備了如神經(jīng)元網(wǎng)絡(luò)一樣的功能,可以處理復(fù)雜的信息。錢教授實驗室對于這項研究的終極目標(biāo)是為DNA人工神經(jīng)網(wǎng)絡(luò)中的一系列智能行為編程(能夠計算、做決定甚至更多)。
錢教授認(rèn)為:“每個人類的大腦中有800億個神經(jīng)元,它們負(fù)責(zé)處理高度負(fù)責(zé)的決定,而蛔蟲只能用幾百萬的神經(jīng)元處理較為簡單的決定。在這次的研究中,我們設(shè)計并創(chuàng)造了一種生物化學(xué)回路,它可以像小神經(jīng)元網(wǎng)絡(luò)一樣,分類較從前更復(fù)雜的分子信息?!?/p>
為說明DNA神經(jīng)網(wǎng)絡(luò)的能力,錢教授實驗室的研究生Kevin Cherry為人工神經(jīng)網(wǎng)絡(luò)選擇了一項經(jīng)典挑戰(zhàn)任務(wù):識別手寫。人類手寫千變?nèi)f化,當(dāng)一個人仔細(xì)識別一串?dāng)?shù)字涂鴉,大腦就會進(jìn)行復(fù)雜的計算以識別出文字,即使對于人類而言識別出他人潦草的書寫也是件非常困難的事情。
識別手寫字母是將智能編程為人工神經(jīng)網(wǎng)絡(luò)的一項常用方法,這些網(wǎng)絡(luò)必須“教授”如何識別數(shù)字,考慮手寫時的變化,然后將未知的數(shù)字與它們所說的“記憶”相比較,最后決定數(shù)字的身份。簡單來講,所謂的DNA神經(jīng)網(wǎng)絡(luò)就是將DNA和試管作為構(gòu)建神經(jīng)網(wǎng)絡(luò)的物理基礎(chǔ),就相當(dāng)于我們通常所見的硅和晶體管。
2011年,錢教授和同事創(chuàng)造了首個DNA人造神經(jīng)模式,但它只能識別出少量的四個模式?!蹲匀弧冯s志論文的第一作者Cherry 論證了,經(jīng)過嚴(yán)格設(shè)計的DNA序列可以實現(xiàn)規(guī)定的化學(xué)反應(yīng),進(jìn)而正確識別分子手寫。不同于幾何形狀多變的視覺手寫,每個分子手寫的例子并不能真正地呈現(xiàn)數(shù)字的形狀。相反,每個分子數(shù)字是由選自100個分子中的獨特DNA鏈組成,每個被分配的分子代表任意一個10×?10圖案中的一個獨立像素,在一個試管中這些DNA鏈互相融合。
給定一個分子手寫的特定樣本,DNA神經(jīng)網(wǎng)絡(luò)可以將手寫分為9類,每一類都代表了手寫1到9數(shù)字的1/9種可能。首先Cherry建立了一個DNA神經(jīng)網(wǎng)絡(luò)用以區(qū)別手寫數(shù)字6和7,他測試了36個手寫數(shù)字,結(jié)果試管神經(jīng)網(wǎng)絡(luò)準(zhǔn)確地識別了所有數(shù)字。從理論上來講,這個系統(tǒng)能夠分類超過12000個手寫數(shù)字6和7,其中90%的數(shù)字抽取自手寫數(shù)字?jǐn)?shù)據(jù)庫。
而錢璐璐之前制造的DNA機(jī)器人,則在模擬計算機(jī)的運算過程中也派上了用場。其中的主角“入侵鏈”,是一個具有特定核苷酸序列的單鏈DNA分子;它會與另一雙鏈DNA結(jié)合,迫使其斷裂原有的氫鍵,釋放出雙螺旋的另一條鏈,該鏈叫做釋放鏈。其中,入侵鏈可以看作一個輸入信號,而釋放鏈則是輸出信號;輸入鏈在釋放后,可以轉(zhuǎn)化為入侵鏈,與不同的分子反應(yīng),最終分子之間形成了一個相互作用的網(wǎng)絡(luò),可以模擬復(fù)雜的“輸入-輸出”的運算功能。
這一運算過程的關(guān)鍵,是利用DNA分子編碼“贏者通吃”的競爭策略。在確定未知數(shù)字時,使用被稱為“殲滅者”的特定DNA分子來選擇優(yōu)勝者,殲滅者與不同分子的競爭者形成復(fù)合體,經(jīng)過反應(yīng)生成不發(fā)生化學(xué)反應(yīng)的物質(zhì)。殲滅者迅速吃掉所有競爭者分子,直到剩下最后一個競爭者。最后,獲勝的競爭者恢復(fù)到一個相當(dāng)高的濃度,并產(chǎn)生指示網(wǎng)絡(luò)決策的熒光信號。
“贏家通吃”的神經(jīng)網(wǎng)絡(luò),被認(rèn)為能夠?qū)?shù)據(jù)庫中98%的手寫數(shù)字進(jìn)行正確分類識別。而在此之前,錢璐璐就做過類似的嘗試。只是在過去的實驗中,僅通過4種不同的DNA分子組成的識別模型,在圖像的數(shù)量與復(fù)雜性上都大大受限;相比之下,新模型具有更強(qiáng)大的計算力,即可以大規(guī)?!皰呤帯焙唵螆D形,又可以小范圍識別復(fù)雜圖像。
如果在20世紀(jì),我們因為一個手掌大小的灰色金屬儀器而震驚,那么在21世紀(jì),我們是不是會看到一碗含有智能分子的“智慧湯”:通過在湯中加入特定的原材料,我們可以訓(xùn)練其執(zhí)行不同的任務(wù);在一個接一個的化學(xué)反應(yīng)中,“智慧湯”不斷學(xué)習(xí)進(jìn)化,得出結(jié)論,并以分子化合物的形式儲存,形成“記憶”。這就像你對著湯拋出一個問題,它會不斷的思考,最終給你答案一樣。
而接下來Cherry依靠他首個DNA神經(jīng)網(wǎng)絡(luò)的原則,發(fā)展出另一個更加復(fù)雜可以在1到9之間區(qū)分單獨3位數(shù)的模式,當(dāng)給定一個未知數(shù)字,這個“智能湯”將接受一系列的反應(yīng)并輸出兩個熒光信號,比如綠或黃代表5綠或紅代表9。
錢教授和Cherry計劃發(fā)展一種可以學(xué)習(xí),從添加在試管中的數(shù)據(jù)例子中形成記憶的模式。錢教授表示,同樣的“智慧湯”可以被訓(xùn)練成執(zhí)行各種不同的任務(wù)。通常的醫(yī)學(xué)診斷可以探測出一些生物分子的存在,比如膽固醇、血糖。使用這種更加復(fù)雜的生物分子電路,可以讓醫(yī)學(xué)診斷和試驗的范圍更加廣泛,從而囊括上百種生物分子,并且在分子環(huán)境中直接對其進(jìn)行分析。
不過,這些距離現(xiàn)實應(yīng)用還有很遠(yuǎn)的距離,但科學(xué)家們期望的,不僅是將這種智能分子機(jī)器作為一個計算機(jī)的替代品,即便它或許能做出更復(fù)雜的計算與決策,我們更想看到的是,其生物屬性里蘊涵著巨大的潛能。
編譯自《自然》《Caltech》
(責(zé)任編輯 姜懿翀)