金鳳
近日,人工智能公司DeepMind宣布,其用AlphaFold預(yù)測了六種由新冠病毒基因編碼的蛋白質(zhì)的三維結(jié)構(gòu),包括膜蛋白、非結(jié)構(gòu)蛋白等,而且已經(jīng)開放下載。
病毒由核酸和蛋白質(zhì)組成,而蛋白質(zhì)是由病毒基因組編碼的。病毒蛋白質(zhì)有兩種,一種是結(jié)構(gòu)蛋白,它們可以構(gòu)成一個形態(tài)成熟的有感染性的病毒顆粒,幫助病毒侵染細(xì)胞,例如殼體蛋白、膜糖蛋白和存在于病毒顆粒中的酶等;另一種是非結(jié)構(gòu)蛋白,則幫助病毒在宿主細(xì)胞里復(fù)制、基因表達(dá),擴(kuò)大在人體內(nèi)的“領(lǐng)地”。
早在1月10日,中國公布新冠病毒全基因組序列。但僅僅知道基因組序列,并不能充分了解蛋白質(zhì)是如何工作的。
“蛋白質(zhì)的成分包括20種氨基酸,每個蛋白質(zhì)由幾十到上千個氨基酸組成。部分氨基酸的線性序列會形成螺旋或者折疊狀的二級結(jié)構(gòu),并進(jìn)一步有序組合堆積成三維結(jié)構(gòu),這種三維結(jié)構(gòu)決定了蛋白質(zhì)在人體內(nèi)如何發(fā)揮作用?!敝袊幙拼髮W(xué)藥學(xué)院教授肖易倍接受采訪時,打了個比方,如果說人體的病毒受體是鎖,病毒的刺突糖蛋白就是鑰匙,如果這些鑰匙能插進(jìn)人體病毒受體蛋白,就會侵染細(xì)胞,科學(xué)家要做的,就是弄清楚鑰匙內(nèi)的三維結(jié)構(gòu)是什么、鑰匙和鎖的關(guān)系是什么,進(jìn)而阻止鑰匙去開鎖,即阻止病毒侵染細(xì)胞。
“知道了蛋白質(zhì)如何發(fā)揮功能,就知道如何有針對性地抑制病毒活性,如果發(fā)現(xiàn)某個蛋白是入侵宿主細(xì)胞的關(guān)鍵蛋白,就可以針對這個蛋白或者蛋白的某個區(qū)域做藥物設(shè)計。”南京大學(xué)生命科學(xué)學(xué)院教授、博導(dǎo)董咸池說。
在DeepMind團(tuán)隊看來,可根據(jù)氨基酸序列確定蛋白質(zhì)的三維結(jié)構(gòu)。他們基于深度神經(jīng)網(wǎng)絡(luò),通過預(yù)測蛋白質(zhì)中每對氨基酸之間的距離,以及連接這些氨基酸的化學(xué)鍵之間的角度,使用兩種方法,來構(gòu)建預(yù)測模型。
“第一步是在結(jié)構(gòu)生物學(xué)常用的技術(shù)上,訓(xùn)練神經(jīng)網(wǎng)絡(luò)預(yù)測蛋白質(zhì)中每對氨基酸之間的距離或角度,然后不斷組合這些概率,提高蛋白質(zhì)結(jié)構(gòu)預(yù)測的準(zhǔn)確度;第二步是通過梯度下降來優(yōu)化得分。他們預(yù)測的是整個蛋白質(zhì)鏈,而不是蛋白質(zhì)結(jié)構(gòu)組裝之前的蛋白質(zhì)‘碎片,因此一定程度上降低了整個預(yù)測過程的復(fù)雜性?!焙洗髮W(xué)超算中心副主任、教授彭紹亮告訴筆者,AlphaFold從頭開始對蛋白質(zhì)的形態(tài)結(jié)構(gòu)進(jìn)行建模,而沒有使用已經(jīng)解析的蛋白質(zhì)作為模板,這意味著需要超大的計算量。
而據(jù)清華大學(xué)自動化系生物信息學(xué)副教授汪小介紹,在目前國際的蛋白質(zhì)數(shù)據(jù)庫(PDB)中,有大約3萬種已知的蛋白質(zhì)結(jié)構(gòu),利用其中與目標(biāo)序列具有相似性的蛋白質(zhì)序列,可以為蛋白質(zhì)結(jié)構(gòu)預(yù)測提供支持。
在人工智能深度學(xué)習(xí)之外,科學(xué)家們想要獲取蛋白質(zhì)結(jié)構(gòu),目前大多從核磁共振、冷凍電鏡與X射線衍射技術(shù)中尋求答案。
“三種方法都依賴大型設(shè)施、儀器,實驗手段獲得的蛋白質(zhì)結(jié)構(gòu),通俗地說就是給蛋白質(zhì)多角度拍照片,然后根據(jù)海量二維照片重構(gòu)三維結(jié)構(gòu),結(jié)果客觀精確,但是實驗周期比較長,通常需要幾個月,實驗門檻和實驗成本高,實驗難度也不小?!迸斫B亮說。
此次AlphaFold對新冠病毒蛋白質(zhì)結(jié)構(gòu)的預(yù)測,是脫離于實驗之外的結(jié)構(gòu)重構(gòu)。預(yù)測的準(zhǔn)確性,尚需同行評審,以及實際臨床治療的驗證。不過,DeepMind指出,“模型會指出結(jié)構(gòu)的哪些部分更有可能是正確的,雖然這些未被研究的蛋白質(zhì)不是當(dāng)前治療的重點,但它們可能會增加研究人員對新冠病毒的理解”。
而對于AlphaFold的預(yù)測結(jié)果,彭紹亮認(rèn)為,如果預(yù)測結(jié)果準(zhǔn)確,還要進(jìn)行分子對接、分子動力學(xué)模擬等很多計算分析過程,以及動物實驗、人體臨床試驗的驗證?!坝嬎憧梢圆粩啾患铀?,但實驗過程是不可回避的,而最終的一切都是以能做出臨床可用的藥物和疫苗為目標(biāo)?!?/p>