• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    “可折疊性”在酶智能設(shè)計改造中的應(yīng)用研究
    ——以AlphaFold2為例

    2023-07-10 02:39:58孟巧珍郭菲
    合成生物學(xué) 2023年3期
    關(guān)鍵詞:殘基蛋白質(zhì)預(yù)測

    孟巧珍,郭菲

    (1 天津大學(xué)智能與計算學(xué)部 計算機學(xué)院,天津 300350; 2 中南大學(xué)計算機學(xué)院,湖南 長沙 410000)

    酶一般是功能性的蛋白質(zhì),在各種生物反應(yīng)中作為生物催化劑參與,是生物細(xì)胞發(fā)揮功能不可或缺的部分。經(jīng)過漫長的歲月進(jìn)化,天然酶為了適應(yīng)自然環(huán)境而擁有了特定的功能[1-2],一般適宜在溫和環(huán)境下且具有特定作用。由于具備高效特定作用,且無污染的特性,酶非常受工業(yè)生產(chǎn)研究人員的青睞。例如用于釀酒的酵母菌、用于降解塑料的酶等等,都是酶分子應(yīng)用在工業(yè)領(lǐng)域中的經(jīng)典例子。但實際工業(yè)生產(chǎn)過程中,發(fā)現(xiàn)在工業(yè)環(huán)境中直接應(yīng)用天然酶并沒有達(dá)到滿意的效果。錯誤的折疊、出現(xiàn)副產(chǎn)物、功能不適宜等缺陷對酶在工業(yè)行業(yè)的應(yīng)用發(fā)出了挑戰(zhàn)[3]。

    要想解決這一問題,必須對酶進(jìn)行改造或者設(shè)計新酶來滿足特定的工業(yè)環(huán)境或者功能需求。那么,認(rèn)識酶的結(jié)構(gòu)與功能的關(guān)系是非常重要的[4]。傳統(tǒng)的酶改造過程涉及到修改酶的基因,使其在細(xì)胞中被成功表達(dá)純化[5]。然后對得到的突變體進(jìn)行試驗驗證是否能提高性能。這期間的時間、人力成本是巨大的,而且成功率非常低。隨著人工智能技術(shù)的發(fā)展,利用計算方法輔助指導(dǎo)酶的改造或者設(shè)計開始成為主流[6-10]。計算算法的快速實現(xiàn),極大地降低了遍歷窮舉整個可能計算空間的搜索,同時利用優(yōu)化算法很容易尋找到可行解。例如中科院微生物研究所吳邊課題組[11]使用多種計算工具,根據(jù)塑料降解酶的序列從保守性、結(jié)構(gòu)能量值等角度篩選可能存在的突變位點,獲得了塑料降解酶PETase的突變體DuraPETase。該突變體的熔融溫度提高了35 ℃,溫和溫度下對塑料降解酶的降解能力提升了23%。根據(jù)特定的改造或者設(shè)計目標(biāo),智能計算方法一般是基于酶的序列或者結(jié)構(gòu)挖掘和酶功能之間的映射關(guān)系,并希望借此能了解酶的各種作用機制,比如催化作用、特異性結(jié)合能力等。

    那么,對于設(shè)計或者改造后的新酶,是否可以按照實驗要求折疊成給定的構(gòu)象,實現(xiàn)要設(shè)計的功能?這個能力一般稱為“可折疊性”[12-13]。實驗驗證是將新酶序列在大腸桿菌中純化表達(dá),同時測定是否具有給定的功能。但是,現(xiàn)在很多工作隨機生成新酶,可以產(chǎn)生大量要求的序列。這些序列如果都通過實驗室測定其是否合理,并不符合通過計算手段降低實驗成本的初衷。迄今為止,盡管從頭酶設(shè)計有了諸多成果,但大多都表現(xiàn)出低效率。有研究表明錯誤折疊是大多數(shù)酶設(shè)計工作失敗的原因。如果在設(shè)計或者改造的過程中,考慮加入結(jié)構(gòu)約束的話,則在很大程度上可以提高新酶的“可折疊性”。最近5年來,基于人工智能與數(shù)據(jù)驅(qū)動技術(shù)的蛋白質(zhì)結(jié)構(gòu)預(yù)測取得了一系列的突破性進(jìn)展[14-16]。例如,AlphaFold2[14]預(yù)測了人類蛋白組的98.5%蛋白結(jié)構(gòu),極大豐富了蛋白結(jié)構(gòu)數(shù)據(jù)并促進(jìn)對人類生命機制的研究。實際上,蛋白質(zhì)結(jié)構(gòu)預(yù)測實際上可以被稱為“逆式”的蛋白質(zhì)設(shè)計。那么,在蛋白質(zhì)設(shè)計領(lǐng)域,蛋白質(zhì)結(jié)構(gòu)預(yù)測這些相對成熟化的工具,是否能從結(jié)構(gòu)約束角度促進(jìn)酶的改造設(shè)計工具更快速且精確化促進(jìn)酶的“可折疊性”研究呢?

    本文聚焦于智能算法改造設(shè)計新酶這一應(yīng)用背景,首先對現(xiàn)有的研究工作從骨架設(shè)計、序列設(shè)計兩個角度進(jìn)行了系統(tǒng)性的梳理。然后介紹了成熟化的蛋白質(zhì)結(jié)構(gòu)預(yù)測工具的四種方法框架,并以AlphaFold2為重點介紹了相應(yīng)的工作流程。蛋白質(zhì)結(jié)構(gòu)問題可以理解為尋找一個合適的擬合函數(shù)f,能夠?qū)⑿蛄锌臻g映射到結(jié)構(gòu)空間。因此這部分內(nèi)容從四個角度來展開:①基于物理化學(xué)規(guī)則打分;②基于統(tǒng)計知識打分;③基于深度學(xué)習(xí)預(yù)測打分;④端到端一步式。蛋白質(zhì)改造設(shè)計則分別從序列和結(jié)構(gòu)兩個角度挖掘和功能之間的模式(見摘要圖)。最后本文總結(jié)出三種蛋白質(zhì)結(jié)構(gòu)預(yù)測工具在酶設(shè)計/改造中的應(yīng)用場景,展示如何利用“可折疊性”幫助改造或者設(shè)計穩(wěn)定且具有給定功能的酶。希望本篇文章能對如何利用正確折疊進(jìn)行合理酶設(shè)計改造有所幫助。

    1 酶的智能改造設(shè)計策略

    人工智能在酶的設(shè)計改造過程中的應(yīng)用,有助于對酶序列、功能以及結(jié)構(gòu)空間的快速探索。對于酶的計算機智能輔助設(shè)計,通常集中于酶的熱穩(wěn)定性、耐酸堿性、催化活性、底物特異性以及酶的從頭設(shè)計等方面[2]。前面幾種的設(shè)計著重于對酶的功能空間的探索,提高酶的某種已有功能特性,且不影響其原有的其他功能特性。而酶的從頭設(shè)計則側(cè)重于設(shè)計一種新酶,其目標(biāo)功能可能只是具有8個β“片段桶”(barrel)這樣的形狀要求,或者是這個“桶”從結(jié)構(gòu)上更為松散的功能性要求,又或者是β片段的排列方式這種結(jié)構(gòu)上的要求。這意味著酶的設(shè)計要從結(jié)構(gòu)和功能上達(dá)到統(tǒng)一。

    利用人工智能解決問題是根據(jù)已有的數(shù)據(jù)挖掘內(nèi)部隱藏的看不見的模式,即序列、結(jié)構(gòu)與功能之間的內(nèi)在的關(guān)系映射。第一步則需要合理地將酶的描述特征提取到并表示成機器識別的模式,一般分為以下幾類:基于序列的,基于結(jié)構(gòu)的,基于嵌入的?;谛蛄械?,包含一些常見的onehot編碼、物理化學(xué)特性編碼(疏水性、電荷等)、進(jìn)化保守性、AA-index[17]、zScales[18]等?;诮Y(jié)構(gòu)的,包含一些基于統(tǒng)計的殘基對間的接觸勢、相鄰結(jié)構(gòu)域的類型及物理化學(xué)性質(zhì)、骨架扭轉(zhuǎn)角度、鍵長、距離活性位點的遠(yuǎn)近等[19]。而基于嵌入的,是指模型通過在大量蛋白質(zhì)家族序列或者結(jié)構(gòu)上進(jìn)行類似于“完形填空”的訓(xùn)練過程中,學(xué)習(xí)到序列/結(jié)構(gòu)鄰居的上下文信息。在此過程中,模型學(xué)習(xí)氨基酸的有意義的中間表示,并提煉出每個氨基酸位置周圍的重要結(jié)構(gòu)環(huán)境,比如ProtVec[20]、ESM-1V[21]、TAPE[22]、dMaSIF[23]等。接下來需要構(gòu)建合適的模型預(yù)測或者生成目標(biāo)。這部分的差異,可參考文獻(xiàn)[24]。接下來根據(jù)目標(biāo)從酶的智能改造和設(shè)計兩部分展開。

    1.1 酶的智能改造

    酶的智能改造通常指的是在對酶的催化機制、空間結(jié)構(gòu)、物化屬性等有一定了解的基礎(chǔ)上,利用計算手段有目的地對酶的功能進(jìn)行改造。對于任意的一條酶序列,可能的突變方案都是非常龐大的,且無法在實驗室逐一驗證所有可能的突變方案是否合理有效。采用人工智能技術(shù)尋找酶的可能突變位點以及對突變位點組合,能夠快速地實現(xiàn)高通量篩選,減少生物化學(xué)實驗成本。這里僅結(jié)合人工智能探討現(xiàn)有對酶的功能改造相關(guān)工作。

    利用酶的序列以及功能性指標(biāo)數(shù)據(jù)對,構(gòu)建模型,然后利用模型指導(dǎo)酶分子改造。其構(gòu)建的模型輸入一般是基于序列或者結(jié)構(gòu)提取的描述符,輸出則是蛋白質(zhì)適應(yīng)性的預(yù)測目標(biāo),一般對應(yīng)于要改造的具體功能性指標(biāo)。一旦模型建立,即可通過預(yù)測大量突變序列的性能快速篩選不理想的突變體。以Frances H.Arnold團隊[25]發(fā)表在PNAS上的工作為例。該工作主要是改造一氧化氮雙加氧酶(NOD)立體選擇性,并選擇多個機器學(xué)習(xí)模型去構(gòu)建NOD的立體選擇性催化模型,包括但不僅限于K最近鄰、線性模型、決策樹、隨機森林,將76%(S)-ee初始突變體提升至93%(S)-ee及反轉(zhuǎn)至79%(S)-ee。中科院微生物研究所吳邊團隊[11]提出一種新型蛋白質(zhì)穩(wěn)定性計算設(shè)計策略GRAPE。該策略對傳統(tǒng)篩選突變體策略進(jìn)行補充,并通過系統(tǒng)聚類分析對得到的單點有益突變進(jìn)行聚類,同時結(jié)合貪婪算法進(jìn)行網(wǎng)絡(luò)迭代疊加,大幅度規(guī)避了以往遇到的累積突變所帶來的負(fù)協(xié)同相互作用。設(shè)計出的突變體DuraPETase可在中等溫度下有效降解塑料,為酶的設(shè)計的計算策略提供了非常重要的方向。當(dāng)特定類型的酶數(shù)據(jù)比較小的時候,可以借助在大量通用酶類數(shù)據(jù)上的預(yù)訓(xùn)練模型來學(xué)習(xí)氨基酸對之間的相互作用關(guān)系或者鄰居結(jié)構(gòu)環(huán)境信息,指導(dǎo)后續(xù)的酶改造任務(wù)。這種方法的好處是可以根據(jù)特定任務(wù)在具體的數(shù)據(jù)集上對預(yù)訓(xùn)練模型進(jìn)行微調(diào),以適應(yīng)于不同的小數(shù)據(jù)集的下游任務(wù)。2021年提出的Low-N模型充分利用了UniRep中大量的蛋白質(zhì)序列,通過無監(jiān)督語言預(yù)訓(xùn)練任務(wù)提取了蛋白質(zhì)的一般功能特征,然后在特定家族序列上微調(diào),進(jìn)一步捕捉到了該家族的特異性特征[26]。通過上述方式得到的蛋白質(zhì)表示,僅需要少量的序列和目標(biāo)功能的數(shù)據(jù),就可以訓(xùn)練一個簡單且有效的監(jiān)督模型。將該模型應(yīng)用到實際中,最少僅需24個avGFP突變體的數(shù)據(jù)集,就設(shè)計出了新的熒光蛋白,可以與高保真且高通量的蛋白質(zhì)工程產(chǎn)物sfGFP相媲美。Low-N以較少的數(shù)量實現(xiàn)了蛋白質(zhì)序列到功能模式的轉(zhuǎn)變。類似工作還有文獻(xiàn)[27]中提到的SEMA。

    除此之外,隨著日益豐富的結(jié)構(gòu)數(shù)據(jù)與逐漸成熟的深度網(wǎng)絡(luò)學(xué)習(xí)能力,從酶的結(jié)構(gòu)數(shù)據(jù)集中直接挖掘結(jié)構(gòu)與功能之間的關(guān)系也成為可能。2022年,得克薩斯大學(xué)奧斯汀分校McKetta化學(xué)工程系教授Hal S.Alper[28]結(jié)合人工智能技術(shù)和酶工程,改造出一系列塑料降解酶的變體,相關(guān)工作發(fā)表在Nature上。其中最優(yōu)秀的突變體FAST-PETase優(yōu)于現(xiàn)有的PET降解酶的變體的降解效率,且能在更廣泛環(huán)境中具有較好的活性,證明了在工業(yè)規(guī)模上酶塑料回收的可行途徑。該方法首先篩選有效突變位點的方法是利用一個深度學(xué)習(xí)算法MutCompute[19]來有效過濾篩選突變位點 。MutCompute通過一個3D的自監(jiān)督的卷積網(wǎng)絡(luò)模型,對每一個殘基構(gòu)造一個局部微環(huán)境,統(tǒng)計該環(huán)境中原子(C、H、O、N、S)出現(xiàn)的次數(shù)、電荷、溶劑可達(dá)面積來編碼該局部環(huán)境,最后預(yù)測每個殘基的序列類型(分類問題)。根據(jù)該殘基一個已有突變體上的預(yù)測概率值與在野生型中的概率差異值大小,衡量出殘基在野生型結(jié)構(gòu)中的“不匹配度”(disfavoured),進(jìn)而篩選出這種得分較大的突變位點,結(jié)合以往文獻(xiàn)中報道的有效突變位點以及活性口袋位點,指導(dǎo)后續(xù)進(jìn)一步篩選有效組合突變。該方法捕獲了由結(jié)構(gòu)決定的功能模式的指導(dǎo)轉(zhuǎn)化,篩選條件是該殘基在給定的蛋白質(zhì)折疊環(huán)境中適配的能力。相比單純使用序列的模型,考慮殘基在結(jié)構(gòu)環(huán)境中是否適配或從已有結(jié)構(gòu)數(shù)據(jù)中挖掘這種規(guī)律,約束了改造酶的合理性并且增加了可能的改造位點方案。類似的工作還被應(yīng)用在TEM-1 β-內(nèi)酰胺酶和白色念珠菌磷化異構(gòu)酶(CaPMI)中[29]。

    實際上在酶改造過程中,序列和結(jié)構(gòu)信息并不是互相割裂的。Connor W.Coley組提出一種將結(jié)構(gòu)約束在序列表示上,就是一種有效的思路。相比僅用ESM-1b[30]提取蛋白質(zhì)序列的平均池化模式得到的序列特征,融入離酶活中心遠(yuǎn)近的結(jié)構(gòu)性差異構(gòu)建的池化策略,則在增強酶的嵌入性表達(dá)的同時還提高了酶活性預(yù)測任務(wù)的模型性能[31]。豐富的酶結(jié)構(gòu)信息,是非常重要且有效的(參見上面加入結(jié)構(gòu)約束之后幾個工作的性能提升)。隨著AlphaFold2等高精度有效的蛋白質(zhì)結(jié)構(gòu)預(yù)測方法的提出,如何結(jié)合預(yù)測出來的海量結(jié)構(gòu)數(shù)據(jù)擴展對酶的功能改造,是具有研究價值的。

    1.2 酶的智能設(shè)計

    酶的從頭設(shè)計是指創(chuàng)造出自然界中不存在,具有新的功能、結(jié)構(gòu)或者形狀的酶。在人工智能技術(shù)沒有被引入到這個領(lǐng)域之前,大多數(shù)酶的設(shè)計是構(gòu)建基于物理或者統(tǒng)計的模型去擬合力場(這一部分的基本思路和蛋白質(zhì)折疊一致)。本小節(jié)根據(jù)不同的設(shè)計目標(biāo)以及任務(wù)需求,從主鏈結(jié)構(gòu)設(shè)計、氨基酸序列設(shè)計兩部分展開,著重探討智能計算算法給蛋白質(zhì)設(shè)計領(lǐng)域帶來的新思路(如表1)。

    表1 蛋白質(zhì)設(shè)計工具匯總Table 1 Summary of protein design tools

    1.2.1 主鏈結(jié)構(gòu)設(shè)計

    主鏈結(jié)構(gòu)設(shè)計,指的是設(shè)計出符合預(yù)先定義的結(jié)構(gòu)拓?fù)浼s束(例如:二級結(jié)構(gòu)基本單元的組成以及順序、相對位置等)。這里介紹一個非常典型且有突破性的工作,SCUBA[32]。該工作由中國科學(xué)技術(shù)大學(xué)劉海燕和陳泉團隊提出,是一個具有高自主可設(shè)計性的主鏈設(shè)計算法,且并不依賴側(cè)鏈類型。該算法在結(jié)構(gòu)數(shù)據(jù)中基于核密度估計構(gòu)造神經(jīng)網(wǎng)絡(luò)形式的能量函數(shù)來捕獲高階相關(guān)關(guān)系,可在不確定序列(即設(shè)計的能量函數(shù)不依賴于側(cè)鏈,充分考慮柔性)的情況下,連續(xù)廣泛搜索主鏈結(jié)構(gòu)空間,突破之前方法僅限于已有模式的限制。再輔以該團隊提出的給定主鏈設(shè)計序列的能量統(tǒng)計模型ABACUS[48],形成了一套全新的蛋白質(zhì)自主設(shè)計新路線。

    此外,Namrata Anand陸續(xù)提出基于生成對抗網(wǎng)絡(luò)(generative adversarial network, GAN)[49]實現(xiàn)蛋白質(zhì)骨架設(shè)計的工作,從生成模型的角度考慮蛋白的骨架設(shè)計。發(fā)表在2018年的NeurIPS[33],利用DCGAN(deep convolutional GANs)[50]模型生成Cα原子之間的相對距離圖(考慮到平移旋轉(zhuǎn)不變性),將該配對距離約束引入到折疊成給定結(jié)構(gòu)的可微問題中,并采用交替方向乘子法(alternating direction method of multipliers, ADMM)優(yōu)化該凸規(guī)劃問題[33]。緊接著2019年發(fā)表的另一個工作也采用GAN實現(xiàn)給定距離約束下骨架設(shè)計,只是后面的精細(xì)化調(diào)整有所不同[34]。

    1.2.2 氨基酸序列設(shè)計

    氨基酸序列設(shè)計,則是在蛋白質(zhì)結(jié)構(gòu)已知的情況下,設(shè)計其相應(yīng)的側(cè)鏈類型,也就是氨基酸序列。根據(jù)在設(shè)計過程中給出的約束不同,可以采用不同的方法來設(shè)計序列。

    當(dāng)從功能上約束設(shè)計的序列時,可以采用序列生成方法,在具有給定功能的酶序列數(shù)據(jù)上挖掘殘基間的模式直接生成新酶的序列。常用的生成模型有長短期記憶網(wǎng)絡(luò)(long short-term memory,LSTM)[51]、GAN、變分自動編碼器(variational autoencoder,VAE)[52]、Transformer[53]等。Mire Zloh課題組[35]構(gòu)建了基于LSTM的生成模型和雙向LSTM分類模型,設(shè)計了對大腸桿菌具有潛在抗菌活性的新型的抗菌短肽序列,經(jīng)過分類模型的預(yù)測發(fā)現(xiàn)設(shè)計出的肽序列被認(rèn)為具有抗菌功能的概率在70.6%~91.7%,且其三維構(gòu)象表現(xiàn)出具有兩親性表面的α-螺旋結(jié)構(gòu)[35]。Gisbert Schneider課題組[36]同樣使用LSTM從螺旋抗菌肽序列上捕獲數(shù)據(jù)的模式并將學(xué)習(xí)到的上下文信息運用于抗菌肽序列的生成。Aleksej Zelezniak課題組[37]提出ProteinGAN,利用GAN學(xué)習(xí)到大量天然蛋白質(zhì)序列的多樣性并進(jìn)而生成具有特定功能的酶序列。以蘋果酸脫氫酶(MDH)為例,作者在該酶家族序列上進(jìn)行訓(xùn)練并設(shè)計出具有相同功能酶的序列,其中有突變位點超過100個的設(shè)計序列,其活性與天然酶的活性相近。

    同樣,可以采用結(jié)構(gòu)約束來指導(dǎo)進(jìn)而設(shè)計氨基酸序列。這種情況下,設(shè)計的氨基酸序列能否折疊成目標(biāo)的蛋白質(zhì)結(jié)構(gòu)是至關(guān)重要的指標(biāo)。最近被稱為新一代Rosetta蛋白設(shè)計內(nèi)核的Rosetta MPNN “Mover”,突破了傳統(tǒng)的Rosetta設(shè)計范式“inside-out”模式。該方法ProteinMPNN由David Baker組提出,基于structured-Transformer[54],采用了結(jié)構(gòu)編碼-序列解碼的自回歸模型框架,將原子配對距離勢融入到邊的特征表示中,使序列恢復(fù)率提高約7.8%[39]。ProteinMPNN對根據(jù)幻想的主鏈進(jìn)行蛋白設(shè)計,其中96條蛋白質(zhì)序列在大腸桿菌體系中可以被大量可溶表達(dá),且成功結(jié)晶一個與設(shè)計結(jié)構(gòu)高度一致的設(shè)計蛋白。同時,ProteinMPNN對單體、同源二聚體、異二聚體結(jié)構(gòu)進(jìn)行設(shè)計,其序列恢復(fù)率均在50%以上,其中核心區(qū)域的恢復(fù)率高達(dá)90%~95%。中國科學(xué)技術(shù)大學(xué)劉海燕和陳泉團隊[40]提出的ABACUS-R完全基于深度學(xué)習(xí)算法實現(xiàn)給定骨架設(shè)計氨基酸序列,不再依賴于傳統(tǒng)能量項構(gòu)建,并且序列恢復(fù)率高于ABACUS計算的,在測試集上基本可以達(dá)到50%[40]。其主要思路是在給定骨架的情況下,通過編碼-解碼(encoder-decoder)框架學(xué)習(xí)在給定殘基的結(jié)構(gòu)特征以及周邊結(jié)構(gòu)環(huán)境的特性預(yù)測該殘基的序列類型(側(cè)鏈)。值得一提的是,ABACUS-R采用多任務(wù)學(xué)習(xí),不僅僅學(xué)習(xí)該殘基的類型,還同時預(yù)測其二級結(jié)構(gòu)、溶劑可達(dá)面積、B-factor以及一些結(jié)構(gòu)構(gòu)象扭轉(zhuǎn)角任務(wù)。這些輔助任務(wù)的設(shè)計不僅提高了模型設(shè)計序列的能力,還隱式地在序列設(shè)計中加入了實時的結(jié)構(gòu)約束。實驗驗證設(shè)計了3個天然骨架的蛋白序列設(shè)計并做了相應(yīng)的實驗驗證。最后通過ABACUS-R設(shè)計出了可以成功表達(dá)且折疊成相應(yīng)的三維結(jié)構(gòu)的蛋白質(zhì)序列,充分證明了繞過建模側(cè)鏈模型的蛋白質(zhì)設(shè)計是可行的。卜東波課題組[47]提出ProDesign-LE也是基于Transformer框架,通過計算序列類型是否符合給定的局部結(jié)構(gòu)環(huán)境來設(shè)計蛋白序列。在實驗中為CATⅢ酶設(shè)計的5條序列中,有3條可以成功表達(dá)且可溶。許錦波課題組[55]提出的一種基于骨架設(shè)計蛋白序列的方法,基于生成SE(3)等變模型,顯著改進(jìn)了現(xiàn)有的自回歸方法。Mostafa Karimi組[38]提出gcWGAN探索生成給定折疊條件下的序列,使序列折疊成給定的方式。構(gòu)造一個基于DeepSF[56]的快速從序列預(yù)測折疊模式的模型并實時反饋監(jiān)督序列是否可以正確折疊,這個模型被稱為“Oracle”。Po-Ssu Huang組的Namrata Anand[57]直接從蛋白質(zhì)骨架結(jié)構(gòu)信息中預(yù)測側(cè)鏈氨基酸類型,從而學(xué)習(xí)到一個基于自回歸的自動的神經(jīng)網(wǎng)絡(luò)能量來指導(dǎo)后續(xù)的序列設(shè)計。在實際的TIM-barrel設(shè)計中,設(shè)計出的序列中有兩個成功結(jié)晶且與設(shè)計的骨架高度一致。

    總的來說,對于酶的智能設(shè)計,人工智能方法的設(shè)計相比傳統(tǒng)基于力場的模式帶來更高的成功率,且更加快速(ProDesign[47]僅需30 s即可設(shè)計一條少于100長的蛋白序列)。根據(jù)不同任務(wù)需求,可以實現(xiàn)酶的全新骨架設(shè)計和酶序列的從頭設(shè)計。同時將二者結(jié)合起來可以形成一套按需從頭設(shè)計酶的流程。酶設(shè)計中直接從給定結(jié)構(gòu)建模設(shè)計序列的方法(類似于MPNN),本質(zhì)上是為了尋求一條序列使結(jié)構(gòu)能量最低。但是給定一條序列,其所能折疊成的狀態(tài)有很多,目標(biāo)結(jié)構(gòu)不一定是設(shè)計的序列所能折疊成的最低的能量結(jié)構(gòu)。因此現(xiàn)今從頭酶設(shè)計中最關(guān)鍵的是后續(xù)對新酶的折疊能力評估。設(shè)計的新酶序列在后續(xù)的實驗中評估能否折疊或者折疊成給定的目標(biāo)構(gòu)象,這是在實際應(yīng)用中最關(guān)注的問題。因此,在設(shè)計酶的過程中,利用“可折疊性”作為指標(biāo)過濾設(shè)計序列,有助于設(shè)計更高質(zhì)量的酶,減少了實驗室對酶序列的后續(xù)驗證,從而降低成本。

    2 蛋白質(zhì)結(jié)構(gòu)預(yù)測方法

    從上面的討論中我們可以看到人工智能極大促進(jìn)了酶在改造和設(shè)計方面的發(fā)展。但是對于設(shè)計或者改造后的新酶,其是否可以如期折疊成給定的結(jié)構(gòu),其實是其能否執(zhí)行相應(yīng)功能的關(guān)鍵性問題。那么,如何衡量“可折疊性”?一般是通過一系列的實驗操作觀察其最后是否折疊或者折疊后與目標(biāo)結(jié)構(gòu)的結(jié)構(gòu)相似性(TMscore得分)。但是實際上,如果在設(shè)計或者改造的過程中同時考慮“可折疊性”,就會大大提高最終酶的質(zhì)量。因此,成熟且高精度的蛋白質(zhì)結(jié)構(gòu)預(yù)測工具是極其有必要的。

    蛋白質(zhì)折疊問題是Science雜志指出的人類在21世紀(jì)需要解決的125個科學(xué)前沿問題之一。蛋白質(zhì)分子作為細(xì)胞這所天然工廠中不可或缺的主力,根據(jù)周邊環(huán)境的變化,通過展開與折疊過程的不斷轉(zhuǎn)移,實現(xiàn)結(jié)構(gòu)從變性到天然狀態(tài)下穩(wěn)定緊湊折疊結(jié)構(gòu)的變化,從而實現(xiàn)蛋白質(zhì)序列信息的解碼,發(fā)揮蛋白質(zhì)的功能。蛋白質(zhì)結(jié)構(gòu)預(yù)測問題可簡單用數(shù)學(xué)公式簡單表述為:g=f(s)。其中s表示蛋白質(zhì)序列,g表示蛋白質(zhì)結(jié)構(gòu),求解蛋白質(zhì)結(jié)構(gòu)就相當(dāng)于在求解函數(shù)f的表達(dá)式。函數(shù)f越精準(zhǔn),預(yù)測的結(jié)構(gòu)越準(zhǔn)確。顯而易見,是否能找到一個“完美”的能量打分函數(shù)f,能正確表達(dá)在折疊過程中各個原子空間之間的能量變化、位置,從而正確區(qū)分天然構(gòu)象和其他構(gòu)象,是整個蛋白質(zhì)結(jié)構(gòu)預(yù)測問題中的關(guān)鍵。本文著重從4個角度對如何構(gòu)建函數(shù)f來進(jìn)行闡述:基于物理化學(xué)打分,基于統(tǒng)計知識打分,基于深度學(xué)習(xí)預(yù)測打分以及“一步式”構(gòu)建。前三種方法均傾向于尋找完美的“能量函數(shù)”(或者稱之為“打分函數(shù)”),更好地模擬原子從雜亂而無序的狀態(tài)到相互作用進(jìn)而形成穩(wěn)定折疊狀態(tài)過程中的各種力場變化。得到具有一定規(guī)律的“打分函數(shù)”后,一種是依據(jù)熱力學(xué)系統(tǒng)中能量越低越穩(wěn)定這一基本原則,隨機模擬尋找具有最小能量的構(gòu)象,另一種是將“打分函數(shù)”轉(zhuǎn)為可微函數(shù),將蛋白質(zhì)構(gòu)象預(yù)測轉(zhuǎn)化為數(shù)學(xué)中的最優(yōu)化問題尋找最優(yōu)解(即最優(yōu)構(gòu)象)。那么這三種的差別則體現(xiàn)在構(gòu)建能量函數(shù)的規(guī)則或者手段上。一般在實際情況中會適當(dāng)從這三種方法中挑選合適的能量項組合,以尋找更加適合的復(fù)合折疊能量函數(shù)。最后一種則是直接實現(xiàn)端到端的蛋白質(zhì)序列-結(jié)構(gòu)模式的深度挖掘,一步式實現(xiàn)從蛋白質(zhì)序列到結(jié)構(gòu)的輸出。

    2.1 基于物理化學(xué)打分

    基于物理的能量項,通過描述原子在折疊過程中原子內(nèi)部之間相互作用以及蛋白質(zhì)分子與溶劑分子之間的相互作用,來模擬構(gòu)象的最終能量。一般包括成鍵作用和非成鍵作用[58]。后者主要包括氫鍵、范德華力、靜電力等,前者則包含一些二面角、鍵角、鍵長等勢能[59-61]。但是在實際過程中,由于我們對蛋白質(zhì)折疊機制尚未完全理解,例如哪些相互作用力對折疊是重要的、不同相互作用力的疊加是否是有益的,這就導(dǎo)致在設(shè)計能量函數(shù)的時候并不一定合適。

    2.2 基于統(tǒng)計知識打分

    基于知識統(tǒng)計的方法,一般要求有一個大型結(jié)構(gòu)數(shù)據(jù)集(類似于PDB[62]),從中統(tǒng)計不同原子對之間的相對位置,進(jìn)而構(gòu)造一個打分矩陣,得到原子對之間的打分函數(shù)。例如,在打分矩陣中,發(fā)現(xiàn)某種氨基酸在其相鄰的0.36 nm范圍內(nèi)經(jīng)常有一種氨基酸出現(xiàn),且對方的相鄰打分矩陣中也顯示經(jīng)常與之相鄰,則能量值打分一定是較低的。從中,其實可以看出該方法要求預(yù)測的這個蛋白質(zhì)結(jié)構(gòu)在已有的蛋白質(zhì)庫中存在相似的蛋白質(zhì)結(jié)構(gòu)區(qū)域,即局部的某些構(gòu)象出現(xiàn)的次數(shù)一定不低,否則這個能量項即使很高,也是有一定“偏見”的。美國密歇根大學(xué)張陽實驗室[63]開發(fā)的從頭預(yù)測蛋白質(zhì)結(jié)構(gòu)預(yù)測工具QUARK是典型的基于統(tǒng)計能量項的工作。QUARK分別從原子層面、殘基層面、拓?fù)鋵用娼y(tǒng)計了11種基于知識的能量項,利用副本交換的蒙特卡洛搜索算法實現(xiàn)僅從序列出發(fā)預(yù)測蛋白質(zhì)結(jié)構(gòu)的工作。另一個同樣由張陽實驗室開發(fā)的I-TASSER,采用基于統(tǒng)計的能量項迭代的基于線程結(jié)構(gòu)模板裝配方法在近幾年的Community-Wide Experiment on the Critical Assessment of Techniques for Protein Structure Prediction (CASP7-CASP15)大賽上均位列服務(wù)器組第一名[64-65]。I-TASSER采用的是基于統(tǒng)計的勢能,包含三種類型:①通用的統(tǒng)計勢能,特定方向(平行,反平行,垂直方向)的接觸特征,手性局部結(jié)構(gòu)的短程Cα原子的距離關(guān)系,相隔5個殘基的局部結(jié)構(gòu)特征規(guī)律等。②氫鍵網(wǎng)絡(luò)。③基于線程模板的約束,包含Cα原子之間的距離約束以及側(cè)鏈質(zhì)心原子的接觸距離約束。而與I-TASSER并駕齊驅(qū)的由美國華盛頓大學(xué)的David Baker組開發(fā)的Rosetta方法,則同時采用了基于物理能量項和基于統(tǒng)計的能量項,運用蒙特卡洛算法在構(gòu)象空間中基于Metropolis準(zhǔn)則隨機搜索最低能量構(gòu)象[66]。

    2.3 基于深度學(xué)習(xí)預(yù)測打分

    基于深度學(xué)習(xí)預(yù)測打分的思路其實沿襲第一種、第二種的構(gòu)造思路,只是在實現(xiàn)過程中采用的技術(shù)手段不同。其主要手段是依賴于深度學(xué)習(xí)算法在海量結(jié)構(gòu)數(shù)據(jù)中預(yù)測出不同殘基組合在折疊過程中的模式(“學(xué)習(xí)”到的能量函數(shù)),從而輔助指導(dǎo)或者約束蛋白質(zhì)的不同折疊排列方式。這里面提到的模式,在多數(shù)工作中涉及到的是殘基之間的接觸(contact)分布、距離(distance)分布、原子角度(orientation)分布等。而在折疊過程中,這些約束規(guī)則一旦定義,則類似于搭積木一樣,很容易就可以從給定的氨基酸序列出發(fā)搭建出準(zhǔn)確的三維結(jié)構(gòu)空間。學(xué)習(xí)到基于神經(jīng)網(wǎng)絡(luò)構(gòu)建的函數(shù)后,將其作為約束加入到能量項函數(shù)中,直接優(yōu)化該函數(shù)并且求解最優(yōu)構(gòu)象或者隨機尋找能量最低構(gòu)象。下面通過幾個典型方法的引入來理解通過深度學(xué)習(xí)預(yù)測不同的結(jié)構(gòu)約束作為能量項的過程。

    早期的蛋白質(zhì)折疊將蛋白質(zhì)三維結(jié)構(gòu)中的物理接觸(contact)作為約束。通過分析蛋白質(zhì)序列殘基的共進(jìn)化信息,將序列中殘基的共變關(guān)系映射到蛋白質(zhì)三維空間結(jié)構(gòu)中的物理接觸中。共進(jìn)化指的是在蛋白質(zhì)家族的進(jìn)化演變中,由于環(huán)境以及自身進(jìn)化的需要,某些殘基發(fā)生突變后,為了維持某些主要的功能或者結(jié)構(gòu)不變,其他殘基隨之發(fā)生共同變化(co-evolution)的現(xiàn)象。從蛋白質(zhì)家族的多序列比對(multiple sequence alignment,MSA)中統(tǒng)計不同位置上不同殘基對共同出現(xiàn)的頻率大小進(jìn)而估計它們之間的相互作用,根據(jù)相互作用大小判斷在空間結(jié)構(gòu)上是否接觸或排斥。主要的估計方法有:稀疏逆協(xié)方差方差估計[67],互信息最大化[68],直接耦合分析(direct coupling analysis, DCA)[69]。這樣基于概率統(tǒng)計模型得到殘基相互作用對估計量的方法,顯而易見依賴于MSA的豐富程度并且難以達(dá)到滿意的精度(主要是噪聲以及信息的不足)。但是由于結(jié)合了全局信息,相比“孤立”預(yù)測殘基對的方法,還是有了很大的突破[70-72]。隨著人工智能技術(shù)的發(fā)展,解決手段就變得更為豐富多樣起來,預(yù)測精度也有了突破性的進(jìn)展。2016年許錦波課題組[73]提出的“RaptorX-Contact”方法首次將深度神經(jīng)網(wǎng)絡(luò)應(yīng)用在蛋白質(zhì)結(jié)構(gòu)領(lǐng)域,在CASP12比賽中一舉奪冠,證明了深度學(xué)習(xí)算法在該領(lǐng)域的可行性。該方法將殘基對之間的相互作用關(guān)系看作圖像問題,提取一維的序列保守性特征、結(jié)構(gòu)特征以及二維的共進(jìn)化特征,然后采用2D深度殘差網(wǎng)絡(luò)(ResNet)塊預(yù)測殘基對是否接觸,協(xié)助蛋白質(zhì)的從頭折疊。該方法使用的ResNet網(wǎng)絡(luò)相比前面提到的早期研究方法,捕獲到了更高階(high-order)的殘基對關(guān)系,而且訓(xùn)練數(shù)據(jù)從單一到大量蛋白質(zhì)家族上挖掘,因而精度有了明顯的提升[74]。

    除了上面提到的接觸約束,CASP13上DeepMind提出的AlphaFold1,則將這一約束擴展到了殘基間的距離約束。然后將離散化的距離預(yù)測值通過采樣插值轉(zhuǎn)化成可微的殘基距離分布函數(shù),進(jìn)而通過直接優(yōu)化該函數(shù)求解距離和角度的最優(yōu)解,從而確定最終的蛋白質(zhì)三維結(jié)構(gòu)[15]。AlphaFold1的成功不僅僅是預(yù)測精度的顯著提高,更是作為一種信號:深度神經(jīng)網(wǎng)絡(luò)可以有效識別蛋白質(zhì)序列中的信號以及共進(jìn)化信息的模式,并將其轉(zhuǎn)化到高精度的距離分布上。考慮到三維空間的特性,trRosetta相比AlphaFold1還引入了5個角度的預(yù)測值來表示殘基間的相對方向,進(jìn)一步加強了殘基間的約束,并且精度提高了6.5%[16]。David T.Jones組[75]提出的DMPfold,預(yù)測的是相對殘基間的距離、主鏈氫鍵以及扭轉(zhuǎn)角。當(dāng)學(xué)習(xí)到這些約束后,類似于RaptorX,輸入到crystallography and NMR system(CNS)[76]中作為約束指導(dǎo)蛋白質(zhì)從頭折疊。在2022年的CASP15上,張陽課題組在已有的I-TASSER基礎(chǔ)上提出的D-I-TASSER算法[77],將AttentionPotential以及DeepPotential[78]兩個深度學(xué)習(xí)算法預(yù)測出的高準(zhǔn)確度的氫鍵(hydrogen-bond)網(wǎng)絡(luò)、接觸圖以及距離圖等約束加入到I-TASSER中采用的力場能量項中,然后通過蒙特卡洛模擬進(jìn)行迭代的片段組裝裝配最終的蛋白質(zhì)結(jié)構(gòu)構(gòu)象,該方法位列蛋白質(zhì)單體單結(jié)構(gòu)域比賽第一名。

    2.4 端到端一步式

    前面的三種本質(zhì)上其實還是在擬合折疊物理力場中的各種相互作用的能量。實際上基于能量設(shè)計的方法,很難找到一個“完美的”能量函數(shù)。隨著不同能量項的累積,帶來的誤差也隨之增加?;谏疃葘W(xué)習(xí)預(yù)測的方法中提到的“兩步走”方法,雖然將復(fù)雜問題簡化,但勢必會帶來信息的丟失。因此對于二維的表示會有更高的要求。對于這種復(fù)雜高維的相互作用,可以借助神經(jīng)網(wǎng)絡(luò)函數(shù),直接尋找到一個更加“完美”的能量函數(shù)去擬合蛋白質(zhì)分子折疊過程中的力場變化,而不是通過人工構(gòu)造能量項,即直接學(xué)習(xí)到深層次的序列-結(jié)構(gòu)關(guān)聯(lián)關(guān)系,是近些年一些研究者的熱點。隨著深度學(xué)習(xí)技術(shù)的逐漸純熟以及研究者對蛋白質(zhì)結(jié)構(gòu)功能的了解加深,直接基于蛋白質(zhì)原始序列端到端預(yù)測蛋白質(zhì)結(jié)構(gòu)技術(shù)也有了質(zhì)的飛躍,有力促進(jìn)了研究者對蛋白機制的研究以及未知蛋白的探索。

    2019年Mohammed AlQuraishi[79]提出RGN方法,首次嘗試使用深度學(xué)習(xí)算法端到端從蛋白質(zhì)序列直接預(yù)測最終的3D坐標(biāo),而不是通過前面介紹的“兩步式”方法。其主要思想是將每個殘基作為一個可微基元,然后從兩個方向——N端到C端、C端到N端,預(yù)測在已有的所有殘基的局部結(jié)構(gòu)下當(dāng)前殘基加入后的空間結(jié)構(gòu),從而將整個蛋白質(zhì)殘基序列串聯(lián)起來,得到最終蛋白質(zhì)結(jié)構(gòu)。這個過程中,考慮了當(dāng)前殘基與相鄰殘基之間的相互作用關(guān)系,并實現(xiàn)了“多個尺寸”的蛋白質(zhì)表示學(xué)習(xí)。實驗證明相比CASP11、CASP12上排名第一的Server組來說,該方法在對于具有新折疊的自由建模中表現(xiàn)優(yōu)異。但是該方法輸入是蛋白質(zhì)序列one-hot編碼以及位置保守性特異矩陣(position-specific scoring matrices,PSSM),然后通過LSTM去實現(xiàn)序列的編碼框架,預(yù)測出每個殘基的扭轉(zhuǎn)角參數(shù)。PSSM相比前面提到的MSA中提取的共進(jìn)化信息,并不包含殘基對間的相互作用,只著重單個殘基在單個位置上的進(jìn)化保守性。因此,該方法:①依賴PSSM矩陣的特征準(zhǔn)確性;②忽略殘基對間的相互作用(MSA中共進(jìn)化信息不是線性的,成本高,且不適合RGN的循環(huán)方法)。而之后在CASP14比賽上,DeepMind提出AlphaFold2[14],完全拋棄了AlphaFold1傳統(tǒng)的“兩步式”思路,通過圖推理的方式直接實現(xiàn)了“端到端”(end-to-end)的蛋白質(zhì)結(jié)構(gòu)預(yù)測方法,轉(zhuǎn)變了結(jié)合人工智能研究蛋白質(zhì)結(jié)構(gòu)研究新范式。因此,由該方法引發(fā)的“AI蛋白質(zhì)折疊”被MIT Technology Review評為“全球十大突破性技術(shù)”。AlphaFold2主要由神經(jīng)網(wǎng)絡(luò)EvoFormer和結(jié)構(gòu)模塊兩部分組成。EvoFormer中序列信息和從MSA中抽取的進(jìn)化特征之間進(jìn)行信息交換,直接推理出在空間和進(jìn)化關(guān)系中殘基對的配對表征。結(jié)構(gòu)模塊則用于將得到的特征轉(zhuǎn)化為三維坐標(biāo)結(jié)構(gòu)。AlphaFold2的優(yōu)勢在于信息流之間的注意力機制,包括從MSA中學(xué)習(xí)到配對特征表示與序列上每個殘基的特征表示之間的相互信息交流(基于注意力機制),通過幾何空間約束形成的具有共殘基的相互作用殘基對之間的信息交流(三角注意力機制)。得到更新后的配對殘基特征以及單殘基特征后,通過結(jié)構(gòu)模塊不斷迭代更新坐標(biāo)系預(yù)測當(dāng)前殘基和相鄰殘基之間肽鍵的角度和距離偏移,最終得到整個蛋白質(zhì)的全局笛卡爾系坐標(biāo)。平均自由建模精度(GDT打分)達(dá)到80以上,而在CASAP13(AlphaFold出現(xiàn))之前,這個值最高是40左右。

    對于AlphaFold2來說,盡管其預(yù)測精度在CASP14上表現(xiàn)驚人,但是后續(xù)研究者陸續(xù)發(fā)現(xiàn)其高度依賴共進(jìn)化信息以及模板信息,而且對于一條蛋白質(zhì)在CPU上進(jìn)行搜索需要大概30 min[80]。因此,從2022年起,陸續(xù)有工作直接從已有序列出發(fā),不再顯式利用共進(jìn)化信息,通過大規(guī)模語言預(yù)訓(xùn)練任務(wù)(一般采用的模型框架是Transformer)在海量蛋白質(zhì)序列數(shù)據(jù)庫中學(xué)習(xí)殘基的表示以及殘基對的表示關(guān)系,直接輸入到AlphaFold2的結(jié)構(gòu)模塊中,輸出蛋白質(zhì)結(jié)構(gòu)的3D坐標(biāo)[80-83]。這些方法相比基于共進(jìn)化的方法(AlphaFold2)來說最顯著的優(yōu)勢是速度上提升了一個數(shù)量級,對于宏基因數(shù)量組的蛋白質(zhì)結(jié)構(gòu)從時間尺度上成為可能。Meta-FAIR提出的ESMFold[80],不僅推理速度比AlphaFold2快,同時對于低復(fù)雜度序列的推理精度與AlphaFold2相當(dāng)。除此之外,還有Ratul Chowdhury提出的RGN2[83],華深智藥提出的OmegaFold[82],上海天壤科技開發(fā)的TRFold方法,山東大學(xué)楊建益團隊提出的trRosettaX-Single[81]等方法。上述方法基本思路差別不大,各個團隊在模型框架上存在一些技巧的差別。例如,trRosettaXSingle采用了知識蒸餾的思想,利用基于進(jìn)化的模型作為“老師”去指導(dǎo)僅基于序列的“學(xué)生”模型獲得一個比較理想的結(jié)果。這些方法預(yù)測一個蛋白根據(jù)計算資源和長度的不同,計算時間基本在毫秒到秒級,同時不依賴于共進(jìn)化信息。這種優(yōu)勢對于缺少同源信息的酶設(shè)計改造來說,是非常有必要的。

    通過上面的介紹可以發(fā)現(xiàn),現(xiàn)有蛋白質(zhì)折疊預(yù)測問題借助人工智能技術(shù),已經(jīng)取得了突破性的進(jìn)展。直接基于蛋白質(zhì)序列高精度預(yù)測蛋白質(zhì)結(jié)構(gòu)已經(jīng)成為可能。那么,如何借助這股“東風(fēng)”助力酶智能設(shè)計改造,則是結(jié)構(gòu)到功能這一新研究范式的主要研究問題。同時,我們認(rèn)為關(guān)注設(shè)計或者改造的新酶是否具有“可折疊性”,是在考慮實際改造設(shè)計酶在合成落地過程中的關(guān)鍵性問題。

    3 蛋白質(zhì)折疊在酶智能設(shè)計改造中的應(yīng)用

    第一部分中提到,對于酶的改造和設(shè)計這兩個應(yīng)用場景,設(shè)計新酶的折疊能力是至關(guān)重要的。不論是在給定結(jié)構(gòu)還是在給定功能約束下,設(shè)計的新酶如果不能正常折疊或者折疊后偏離預(yù)設(shè)結(jié)構(gòu),則減弱甚至喪失給定的功能。因此在設(shè)計過程中結(jié)合設(shè)計后新酶的折疊狀態(tài),相比不考慮再去實驗驗證篩選(幾千幾萬條),在時間和實驗成本上都占有優(yōu)勢。然而,折疊后的構(gòu)象,實際上就是蛋白質(zhì)結(jié)構(gòu)預(yù)測的目標(biāo)。結(jié)合第二部分中對蛋白質(zhì)結(jié)構(gòu)預(yù)測工具的梳理,可以看到在人工智能強大的擬合能力幫助下,最近幾年來在蛋白質(zhì)結(jié)構(gòu)預(yù)測方面獲得了突破性的進(jìn)展。許多蛋白質(zhì)結(jié)構(gòu)預(yù)測工具由于預(yù)測的高效快速被廣泛應(yīng)用,例如trRosetta[16]、RoseTTAFold[84]等。那么,從設(shè)計酶的“可折疊性”出發(fā),探索將蛋白質(zhì)結(jié)構(gòu)預(yù)測工具與現(xiàn)有的酶設(shè)計改造方法相結(jié)合,將會是一條有效的酶智能設(shè)計改造思路,有助于探索更為廣闊的蛋白質(zhì)序列空間。

    在眾多優(yōu)秀的蛋白質(zhì)結(jié)構(gòu)預(yù)測工具中,不得不提AlphaFold2[14]。AlphaFold2實現(xiàn)了對人類蛋白組58%的準(zhǔn)確性預(yù)測(pLDDT高于70,可信),36%的結(jié)構(gòu)位置預(yù)測高可信。其與歐洲生物信息研究所(EMBL-EBI)合作建立的平臺AlphaFold DB[AlphaFold蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫,AlphaFold Protein Structure Database(ebi.ac.uk)],涵蓋了幾乎98.5%的人類蛋白。因此,本文以AlphaFold2為代表,探索如何借助蛋白質(zhì)結(jié)構(gòu)預(yù)測工具增加酶設(shè)計改造的準(zhǔn)確性。其他結(jié)構(gòu)預(yù)測工具,可以根據(jù)具體研究的數(shù)據(jù)或者任務(wù)不同,替代AlphaFold2的結(jié)構(gòu)預(yù)測工作。

    3.1 折疊“監(jiān)督器”

    考慮酶的“可折疊性”,最直觀的解決辦法是快速預(yù)測設(shè)計的新酶的結(jié)構(gòu),檢驗其是否具有給定結(jié)構(gòu)。因此,第一種預(yù)測是將蛋白結(jié)構(gòu)預(yù)測工具作為一個監(jiān)督者,約束生成的序列具有折疊成給定結(jié)構(gòu)的能力[如圖1(a)][41-45,85]。這個思路實施起來的最大難點是從序列預(yù)測結(jié)構(gòu)的精度限制。但是現(xiàn)在得益于結(jié)構(gòu)預(yù)測的突破性進(jìn)展,使得這種設(shè)計新酶成為可能。其基本思路是在設(shè)計序列的時候,加入一個輔助的“監(jiān)督者”對于生成的序列是否可以折疊且具有給定的構(gòu)象進(jìn)行評分,根據(jù)得分對蛋白質(zhì)序列通過基于梯度的、梯度自由的或者神經(jīng)網(wǎng)絡(luò)構(gòu)造的優(yōu)化方法來更新序列。通過不斷重復(fù)迭代這一過程,最終得到構(gòu)象約束下的收斂序列。設(shè)計序列的時候一般遵從最小能量的原則。但是,我們不清楚給定的構(gòu)象就一定是設(shè)計的這條序列折疊后的最低能量構(gòu)象。因此結(jié)構(gòu)預(yù)測作為“監(jiān)督器”實際上計算了在給定結(jié)構(gòu)情況下蛋白質(zhì)序列的最大聯(lián)合概率。

    圖1 結(jié)構(gòu)預(yù)測工具在酶智能設(shè)計改造中的應(yīng)用方向Fig.1 Specific aspects for the application of structure prediction tools in the intelligent design and transformation of enzymes

    David T.Jones[41]嘗試將AlphaFold2引入固定骨架設(shè)計序列的過程中,以約束生成的序列能夠折疊成給定的骨架,并且正交實驗中也驗證了分子動力學(xué)方法模擬的結(jié)構(gòu)對AlphaFold2監(jiān)督后的實驗結(jié)構(gòu)高度支持。其具體流程是:①生成初始蛋白序列?;谘芯空咧疤岢龅幕谧曰貧w的Transformer蛋白質(zhì)序列生成模型[86]生成1000條初始序列。同時對于得到的序列用AlphaFold2預(yù)測其結(jié)構(gòu),并與要設(shè)計的骨架結(jié)構(gòu)用TM-align[87]做結(jié)構(gòu)比對。最后選擇結(jié)構(gòu)比對得分最高的那部分結(jié)構(gòu)的序列為初始序列,不具有高結(jié)構(gòu)置信度的序列則用丙氨酸填充。這樣做的好處是保證初始的序列是可收斂的,否則可能序列太隨機導(dǎo)致最后沒辦法折疊。②在序列空間中執(zhí)行貪婪的半隨機游走,逐步突變起始序列進(jìn)行迭代的端到端設(shè)計。這里面AlphaFold2的作用有兩個:一個是預(yù)測序列結(jié)構(gòu),比較與要設(shè)計結(jié)構(gòu)的距離直方圖損失,根據(jù)損失是否減小來判斷突變序列是否合理;另一個是確定該序列中哪一部分殘基位點要被突變、修改。舉例來說,從起始序列出發(fā)并通過AlphaFold2預(yù)測其結(jié)構(gòu)以及每一個殘基的pLDDT打分(衡量每個殘基的局部結(jié)構(gòu)合理性)。這里,計算預(yù)測結(jié)構(gòu)中的距離直方圖并與要設(shè)計的骨架結(jié)構(gòu)的直方圖計算損失。同時,利用每個殘基的pLDDT打分設(shè)置為序列位點是否要被采樣的概率。得分較高代表此處殘基是穩(wěn)定的,反之則是下一次迭代序列設(shè)計采樣的點。在下次迭代采樣中,對于選定的采樣位點進(jìn)行飽和突變,直到距離直方圖損失減小,才接受序列的突變采樣。這樣設(shè)置的好處是對于與要設(shè)計結(jié)構(gòu)的高度匹配的序列不再改變,大量減少采樣時間盡快收斂以及可能引起的負(fù)協(xié)同效應(yīng)。作者在人工設(shè)計的Top7上進(jìn)行測試,得到的序列結(jié)構(gòu)不論是通過AlphaFold2、trRosetta還是基于片段從頭折疊的方法,均被證實與要設(shè)計的骨架可能是同一種折疊。該工作應(yīng)用AlphaFold2在初始序列設(shè)計上保證了與目標(biāo)結(jié)構(gòu)的局部高結(jié)構(gòu)匹配度,同時在序列設(shè)計過程中利用AlphaFold2預(yù)測的結(jié)構(gòu)與目標(biāo)結(jié)構(gòu)的距離直方圖損失約束其設(shè)計序列保持全局結(jié)構(gòu)相似性以及利用殘基位點可信度增強局部殘基結(jié)構(gòu)穩(wěn)定性。同年,S.Kashif Sadiq[42]也在bioRxiv上提交AlphaDesign工作,基本思路也是利用AlphaFold2預(yù)測的結(jié)構(gòu)與要設(shè)計的骨架結(jié)構(gòu)的差異來限制調(diào)整序列的優(yōu)化,采用的優(yōu)化函數(shù)是基于進(jìn)化的遺傳算法來迭代生成序列。主要差別在于該方法利用預(yù)測結(jié)構(gòu)的三維坐標(biāo)信息差異構(gòu)建目標(biāo)函數(shù)優(yōu)化而不僅僅是二維的配對距離直方圖約束,可能在結(jié)構(gòu)約束上更加有效。而且該方法擴展了可能的設(shè)計任務(wù)的范圍,設(shè)計了一些長度在32~256個氨基酸、結(jié)構(gòu)穩(wěn)定、從頭設(shè)計且具有不同折疊的單體蛋白、同源二聚體、異源二聚體、同源低聚物(三聚體到六聚體)。Baker組[43]提出的trDesign是第一個提出將結(jié)構(gòu)預(yù)測工具trRosetta應(yīng)用到蛋白質(zhì)序列設(shè)計中的工作,考慮的也是二維距離直方圖的損失來更新梯度,更新被表示為PSSM的序列。但是受限于trRosetta利用的是二維的結(jié)構(gòu)約束,在正交驗證中發(fā)現(xiàn)基于這種反向傳播的方式設(shè)計序列不能很好地對三維結(jié)構(gòu)進(jìn)行編碼,且上述三個工作均是基于給定骨架設(shè)計序列,限制了實際設(shè)計酶的應(yīng)用需求。后來Baker組提出的“幻想”(hallucination)的方法[44],不從給定骨架結(jié)構(gòu)出發(fā)設(shè)計序列,而是考慮在這種目標(biāo)結(jié)構(gòu)缺失的條件下,是否能隨機產(chǎn)生結(jié)構(gòu)和序列。其實現(xiàn)是通過最大化設(shè)計序列的結(jié)構(gòu)與隨機背景序列的差異約束,從而約束該序列折疊后的結(jié)構(gòu)具有一個典型的二維結(jié)構(gòu)特性[44]。實驗中設(shè)想了2000條序列,聚類后發(fā)現(xiàn)均可以在已有的PDB結(jié)構(gòu)庫中尋找到相似的折疊。實驗驗證的時候有62條是可溶表達(dá)的(實驗驗證了129條),且CD的圓二色譜和目標(biāo)結(jié)構(gòu)的二級結(jié)構(gòu)分布吻合。相比傳統(tǒng)設(shè)計驗證的方法,僅僅129條實驗驗證且有48%的成功率,極大地減少了人工驗證的成本和時間。但是由于trRosetta精度有限以及二維結(jié)構(gòu)約束的不足,在接下來的工作中將RoseTTAFold嵌入到具有給定motif的序列設(shè)計中[45]。RoseTTAFold顯示利用SE-3 Transformer預(yù)測三維結(jié)構(gòu)坐標(biāo)以及二維距離分布,大大提高了序列設(shè)計的準(zhǔn)確性。在免疫相關(guān)蛋白中,成功設(shè)計出攜帶中和性抗體表位的蛋白以及與新冠病毒S突刺蛋白受體結(jié)合的ACE2類似物蛋白。后續(xù)提出的RFjoint,不再通過神經(jīng)網(wǎng)絡(luò)不斷迭代推理以及反向傳播來設(shè)計序列,而是將結(jié)構(gòu)預(yù)測和序列設(shè)計兩大任務(wù)結(jié)合起來,直接訓(xùn)練全新的模型[45]。這樣的好處是減少了反向推理時間,大大降低了設(shè)計的時間成本。

    總的來說,結(jié)構(gòu)預(yù)測工具作為結(jié)構(gòu)“監(jiān)督器”,在設(shè)計過程中預(yù)測設(shè)計序列的可能結(jié)構(gòu),并利用該預(yù)測結(jié)構(gòu)和目標(biāo)結(jié)構(gòu)的差異作為損失優(yōu)化模型,使模型學(xué)習(xí)到要設(shè)計的目標(biāo)結(jié)構(gòu)信息,從而設(shè)計具有折疊到給定結(jié)構(gòu)能力的酶序列。當(dāng)然根據(jù)實際設(shè)計任務(wù)的目標(biāo)不同(比如結(jié)合口袋的區(qū)域等),可以將這部分信息掩蓋,在恢復(fù)序列的同時利用結(jié)構(gòu)預(yù)測工具預(yù)測其結(jié)構(gòu),則同時還能約束設(shè)計的酶從整體結(jié)構(gòu)環(huán)境中學(xué)習(xí)到關(guān)鍵的局部結(jié)構(gòu)。

    3.2 突變“篩選器”

    結(jié)構(gòu)預(yù)測工具還可以作為突變篩選器,在酶智能改造設(shè)計中作為一種輔助的結(jié)構(gòu)評價指標(biāo)篩選有益的或者不合適的殘基突變位點[如圖1(b)所示]。接下來的工作介紹還是以AlphaFold2為例。AlphaFold2輸出的結(jié)果分析可以提供有關(guān)新設(shè)計的局部骨架結(jié)構(gòu)的準(zhǔn)確性和可折疊性的關(guān)鍵信息,指示可能錯誤折疊的區(qū)域,并以此評估可以減輕錯誤折疊的突變。

    Sarel Jacob Fleishman課題組[13]提出,現(xiàn)有功能蛋白設(shè)計方面由于錯誤折疊等導(dǎo)致的失敗使得可靠的高效酶從頭設(shè)計目標(biāo)仍然遙不可及,因此設(shè)計了一種改善設(shè)計蛋白中不是很合理的位置方法。該方法首先利用Rosetta進(jìn)行單點突變掃描,篩選有超過5種以上降低自然狀態(tài)能量突變的位置標(biāo)記為“次優(yōu)”位置。然后應(yīng)用FuncLib集中在這些低效率酶的“次優(yōu)”位置上設(shè)計突變,將催化效率提高了330倍。最后利用AlphaFold2預(yù)測的pLDDT得分和計算的RMSD標(biāo)記了可能錯誤折疊的區(qū)域,合理規(guī)避或者重新設(shè)計不合理區(qū)域,大大提高了其催化效率[13]。這種思路類似于1.1節(jié)中討論的根據(jù)殘基在當(dāng)前結(jié)構(gòu)環(huán)境中的“不合理”值,判斷是否要在此位點突變。該工作指出,AlphaFold2分析可以提供有關(guān)新設(shè)計的骨架結(jié)構(gòu)可能的準(zhǔn)確性和可折疊性的關(guān)鍵信息,指示可能錯誤折疊的區(qū)域,并評估旨在減輕錯誤折疊的突變。

    在設(shè)計領(lǐng)域,有工作通過引入pAE等來自AlphaFold2的結(jié)構(gòu)指標(biāo)作為“篩選器”,為4個靶點受體蛋白設(shè)計了2萬條伙伴(binder)序列,并且做了相應(yīng)的實驗合成[88]。最后發(fā)現(xiàn)基于pAE指標(biāo)相比傳統(tǒng)的Rosetta打分,篩選后的序列成功率在IL2RA以及LTK靶點上數(shù)量差異分別達(dá)到了8倍、30倍。這一數(shù)量變化證明了利用結(jié)構(gòu)預(yù)測工具作“篩選器”的有效性。

    3.3 結(jié)構(gòu)“分析器”

    結(jié)構(gòu)預(yù)測工具還可以作為一種輔助的結(jié)構(gòu)分析,從預(yù)測的結(jié)構(gòu)上分析其背后存在的催化機理,結(jié)合特異性等[圖1(c)右]。通過分析突變體結(jié)構(gòu)(AlphaFold2預(yù)測)與底物結(jié)合的復(fù)合物結(jié)構(gòu),來檢驗突變策略是否合適[91-94]。Martin Bartas則利用AlphaFold2成功預(yù)測蛋白質(zhì)結(jié)構(gòu)庫,通過結(jié)構(gòu)相似尋找具有Zα結(jié)構(gòu)域(高結(jié)構(gòu)保守,與Z-DNA/ZRNA結(jié)合形成)的蛋白結(jié)構(gòu)[95]。這種蛋白在相關(guān)文獻(xiàn)報道中僅有8個,但是由于AlphaFold2對蛋白結(jié)構(gòu)庫的豐富,發(fā)現(xiàn)了185個推定可能有該結(jié)構(gòu)域的蛋白質(zhì)結(jié)構(gòu)。Xin Fengjiao課題組[96]利用AlphaFold2預(yù)測出酶序列的高精確度的合理結(jié)構(gòu),從結(jié)構(gòu)角度上分析其催化性能,在與底物結(jié)合口袋附近的位點上進(jìn)行合理突變,發(fā)現(xiàn)了高催化效率和或底物偏好性擴大的突變體。

    還有研究工作利用AlphaFold2研究不同的構(gòu)象變化[圖1(c)左]。AlphaFold2雖然在單體結(jié)構(gòu)上訓(xùn)練,但是可被成功應(yīng)用在多肽與蛋白質(zhì)的復(fù)合物結(jié)構(gòu)預(yù)測中[97]。因此,合理推斷AlphaFold2學(xué)習(xí)到了蛋白質(zhì)在功能改變過程中構(gòu)象的動態(tài)集合或者是由于突變導(dǎo)致的構(gòu)象改變。有工作利用不同深度的MSA輸入到AlphaFold2中去研究這種構(gòu)象的異質(zhì)性(conformational heterogeneity)[89]。Guillem Casadevall提出了一種新的觀點,將基于AlphaFold2的新模板策略結(jié)合分子動力學(xué)模擬,發(fā)現(xiàn)不同突變的色氨酸合酶的β亞基(TrpB)結(jié)構(gòu)域的一些不同閉合模式[90]。

    4 討 論

    本文從頭梳理了酶改造設(shè)計在利用人工智能技術(shù)方面的一系列工作,指出現(xiàn)有工作中存在的錯誤折疊甚至無法折疊導(dǎo)致失敗,以及設(shè)計大量序列需要人工實驗驗證的成本問題。同時基于現(xiàn)有蛋白質(zhì)結(jié)構(gòu)預(yù)測工具的高效快速預(yù)測性,可以作為結(jié)構(gòu)“分析器”、突變“篩選器”、折疊“監(jiān)督器”在設(shè)計過程中幫助提高酶的“可折疊性”。正因為考慮“可折疊”能力,設(shè)計的新酶的質(zhì)量相比傳統(tǒng)大量序列中質(zhì)量較高,幫助后續(xù)的實驗驗證降低成本的同時又提高了成功率。值得注意的是,這里面結(jié)構(gòu)預(yù)測工具與酶設(shè)計工具共同采用,結(jié)構(gòu)預(yù)測工具本身只是作為輔助任務(wù)。我們在討論結(jié)構(gòu)預(yù)測工具應(yīng)用的時候,是以AlphaFold2[14]為代表展開介紹的。

    在介紹應(yīng)用的時候,我們歸納了三種應(yīng)用方式。這三種應(yīng)用的前提均是認(rèn)為AlphaFold2這類蛋白質(zhì)結(jié)構(gòu)預(yù)測工具學(xué)習(xí)到了蛋白質(zhì)序列到結(jié)構(gòu)的復(fù)雜關(guān)系,對蛋白質(zhì)結(jié)構(gòu)的全局以及局部結(jié)構(gòu)預(yù)測的準(zhǔn)確度是可信的。隨著越來越多結(jié)構(gòu)預(yù)測工具的開發(fā),根據(jù)不同任務(wù)(無同源序列)、不同數(shù)據(jù)類型(α螺旋結(jié)構(gòu)比例較高)等,可以將AlphaFold2替換成其他的結(jié)構(gòu)預(yù)測工具。例如上面提到的David Baker組提出的RFjoint[45]采用的就是該組提出的結(jié)構(gòu)預(yù)測工具RoseTTAFold[84]。

    關(guān)于智能方法的引用,相比傳統(tǒng)方法,既大大減少了采樣空間的計算量,又有非常優(yōu)異的計算準(zhǔn)確度,在酶的智能合成改造中的應(yīng)用是非常具有研究前景的,也是有所突破的。但同時不可忽視的是,一些問題仍然存在且限制了進(jìn)一步的酶功能研究。

    第一個難點是如何將酶在具體參與生物過程中的反應(yīng)機制等融入到智能算法的設(shè)計中。我們知道,生物反應(yīng)是十分復(fù)雜的,甚至還有一些特異性或者混雜性。如何讓模型學(xué)習(xí)到這種模式或者規(guī)則,仍然是需要繼續(xù)探索的問題。不過好在現(xiàn)有的一些工作中已經(jīng)開始嘗試探索。例如:AlphaFold2中更新殘基配對特征的時候采用的三角乘法更新,就是從我們理解的兩邊之和大于第三邊這種距離上的約束來限制殘基對在空間上的距離,從而確保更新殘基捕捉合理的結(jié)構(gòu)模式。又比如RFDesign中設(shè)計免疫相關(guān)蛋白設(shè)計,那么如何將免疫相關(guān)蛋白擁有的廣譜性結(jié)合能力這一先驗知識加入到計算蛋白設(shè)計中呢?文中考慮結(jié)合時的受體環(huán)境,設(shè)計基于三維結(jié)構(gòu)坐標(biāo)的能量項來表示吸引力、排斥力以及具有的球形形狀三種特性。

    第二個難點是對于深度學(xué)習(xí)模型來說,從海量數(shù)據(jù)中挖掘模式是合適的。但是現(xiàn)有的狀況是酶的相關(guān)數(shù)據(jù)量小,沒有統(tǒng)一的標(biāo)準(zhǔn)格式,是有冗余的。當(dāng)然這也與特定學(xué)科有關(guān)系。很多研究工作利用遷移學(xué)習(xí)來解決數(shù)據(jù)量小的問題,比如DeepET在大的蛋白質(zhì)序列-最佳生長溫度(OGT)數(shù)據(jù)集上訓(xùn)練模型,然后遷移到預(yù)測酶的最佳催化溫度和蛋白質(zhì)的熔融溫度[98]。或者利用自然語言處理(NLP)中廣泛使用的大規(guī)模語言預(yù)訓(xùn)練模型學(xué)習(xí)序列的表示,然后小數(shù)據(jù)集上微調(diào),進(jìn)行一些功能預(yù)測[21,26]。

    第三是關(guān)于蛋白質(zhì)設(shè)計方面的。在實際應(yīng)用中,研究者希望利用深度學(xué)習(xí)設(shè)計的酶序列具有可設(shè)計且可折疊性。現(xiàn)有酶序列設(shè)計的精度并不高,雖然利用智能算法有效降低實驗室實驗測定的成本,但是設(shè)計出來的序列能否被表達(dá)、能否折疊,都是需要被重點研究的。本文探討蛋白質(zhì)結(jié)構(gòu)預(yù)測工具在這方面的應(yīng)用,就是希望能幫助提高可折疊性酶的設(shè)計。對于沒有同源序列的酶設(shè)計結(jié)構(gòu),快速有效的結(jié)構(gòu)預(yù)測是有必要的。這或許可以應(yīng)用現(xiàn)有的單序列蛋白質(zhì)結(jié)構(gòu)預(yù)測工具,包括TRFold、ESMFold、trRosettaX-Single、OmegaFold等。上面的工作表明這確實是一種可行性的方法,但是僅從最后結(jié)構(gòu)的約束或者評價中利用結(jié)構(gòu)預(yù)測的指標(biāo)表明錯誤折疊的區(qū)域,還是很有限的。最近David Baker團隊提出的RFDiffusion,通過逐步對加了噪聲的結(jié)構(gòu)去噪一步步恢復(fù)其結(jié)構(gòu),提出一種新的設(shè)計可能。酶的設(shè)計不再是局限于給定結(jié)構(gòu)或者給定拓?fù)洹⒔o定功能的描述,直接設(shè)計給定功能且可靠的酶,值得期待。

    第四是針對現(xiàn)有酶結(jié)構(gòu)數(shù)據(jù)的。蛋白質(zhì)序列和結(jié)構(gòu)的數(shù)量差異是非常巨大的。不管最初的目的是什么,酶設(shè)計改造最終是希望設(shè)計出一個結(jié)構(gòu)從而發(fā)揮相應(yīng)的功能的。借助以AlphaFold2為代表的高效快速的結(jié)構(gòu)預(yù)測工具,可以大幅度擴展酶的結(jié)構(gòu)數(shù)據(jù),從而分析結(jié)構(gòu)上的差異,理解蛋白功能機制。同時海量結(jié)構(gòu)數(shù)據(jù)直接使從結(jié)構(gòu)環(huán)境中分析殘基類型成為可能。

    總之,人工智能技術(shù)的突破是驚人的,如何巧妙借助這股東風(fēng)的力量高效且快速解決酶改造設(shè)計的相關(guān)問題,是非常具有研究前景的。

    猜你喜歡
    殘基蛋白質(zhì)預(yù)測
    無可預(yù)測
    黃河之聲(2022年10期)2022-09-27 13:59:46
    基于各向異性網(wǎng)絡(luò)模型研究δ阿片受體的動力學(xué)與關(guān)鍵殘基*
    蛋白質(zhì)自由
    肝博士(2022年3期)2022-06-30 02:48:48
    選修2-2期中考試預(yù)測卷(A卷)
    選修2-2期中考試預(yù)測卷(B卷)
    人工智能與蛋白質(zhì)結(jié)構(gòu)
    海外星云(2021年9期)2021-10-14 07:26:10
    “殘基片段和排列組合法”在書寫限制條件的同分異構(gòu)體中的應(yīng)用
    不必預(yù)測未來,只需把握現(xiàn)在
    蛋白質(zhì)計算問題歸納
    蛋白質(zhì)二級結(jié)構(gòu)序列與殘基種類間關(guān)聯(lián)的分析
    女人被躁到高潮嗷嗷叫费观| 美女高潮到喷水免费观看| 在线天堂中文资源库| 男女下面插进去视频免费观看| 免费观看a级毛片全部| 高清av免费在线| 无限看片的www在线观看| 亚洲国产成人一精品久久久| 人人妻人人爽人人添夜夜欢视频| 汤姆久久久久久久影院中文字幕| 欧美大码av| 777久久人妻少妇嫩草av网站| 无遮挡黄片免费观看| 色94色欧美一区二区| 后天国语完整版免费观看| 国产精品一区二区在线不卡| 韩国高清视频一区二区三区| 久久av网站| 日韩人妻精品一区2区三区| av又黄又爽大尺度在线免费看| 丰满少妇做爰视频| 亚洲精品国产av蜜桃| 在线精品无人区一区二区三| 在线观看免费午夜福利视频| 一区二区三区四区激情视频| 日韩制服丝袜自拍偷拍| 亚洲九九香蕉| 亚洲成国产人片在线观看| 色播在线永久视频| 国产亚洲精品第一综合不卡| 亚洲国产精品一区二区三区在线| 国产成人啪精品午夜网站| 两性午夜刺激爽爽歪歪视频在线观看 | 日韩一区二区三区影片| 欧美黑人欧美精品刺激| 后天国语完整版免费观看| 欧美久久黑人一区二区| 少妇粗大呻吟视频| 成人亚洲精品一区在线观看| 国产97色在线日韩免费| www日本在线高清视频| 国产一区有黄有色的免费视频| 久久中文字幕一级| 老司机福利观看| 亚洲专区字幕在线| 精品视频人人做人人爽| 久久免费观看电影| av天堂久久9| 午夜两性在线视频| 国产欧美亚洲国产| 热99re8久久精品国产| 中文字幕高清在线视频| 午夜免费成人在线视频| 亚洲七黄色美女视频| 国产区一区二久久| a 毛片基地| 国产精品香港三级国产av潘金莲| 国产福利在线免费观看视频| 亚洲欧洲精品一区二区精品久久久| 曰老女人黄片| www.自偷自拍.com| 丁香六月天网| 99久久人妻综合| 欧美日韩黄片免| 男人爽女人下面视频在线观看| 老司机深夜福利视频在线观看 | 美女高潮到喷水免费观看| 岛国毛片在线播放| 人人妻人人爽人人添夜夜欢视频| 99re6热这里在线精品视频| 国产一区二区三区综合在线观看| 国产不卡av网站在线观看| 国产主播在线观看一区二区| 中文字幕另类日韩欧美亚洲嫩草| 亚洲成国产人片在线观看| 欧美性长视频在线观看| 国产精品久久久人人做人人爽| 久久天躁狠狠躁夜夜2o2o| 国产精品 欧美亚洲| 亚洲欧美精品综合一区二区三区| 精品乱码久久久久久99久播| 欧美日韩一级在线毛片| 99九九在线精品视频| 久久久国产欧美日韩av| 天天操日日干夜夜撸| 熟女少妇亚洲综合色aaa.| 老司机影院成人| 久久狼人影院| 免费人妻精品一区二区三区视频| 国产成人a∨麻豆精品| 老熟女久久久| 精品国产一区二区三区久久久樱花| 18禁黄网站禁片午夜丰满| 色播在线永久视频| 亚洲精品久久成人aⅴ小说| 中亚洲国语对白在线视频| 一级毛片电影观看| 热re99久久精品国产66热6| 精品少妇黑人巨大在线播放| 日本撒尿小便嘘嘘汇集6| 美国免费a级毛片| 在线观看一区二区三区激情| 丝袜人妻中文字幕| 免费一级毛片在线播放高清视频 | svipshipincom国产片| 黄色视频在线播放观看不卡| 美女高潮喷水抽搐中文字幕| 极品人妻少妇av视频| 一本大道久久a久久精品| 男人添女人高潮全过程视频| 在线观看免费日韩欧美大片| 99九九在线精品视频| 午夜影院在线不卡| 午夜福利在线观看吧| 中国国产av一级| 精品少妇一区二区三区视频日本电影| 一二三四社区在线视频社区8| av福利片在线| 天天躁日日躁夜夜躁夜夜| 精品国产一区二区三区四区第35| 亚洲激情五月婷婷啪啪| 黄色毛片三级朝国网站| 美女午夜性视频免费| 日韩人妻精品一区2区三区| 丰满人妻熟妇乱又伦精品不卡| 一级a爱视频在线免费观看| 久久av网站| 操出白浆在线播放| 两性午夜刺激爽爽歪歪视频在线观看 | 18禁黄网站禁片午夜丰满| av电影中文网址| 免费黄频网站在线观看国产| 国产成人精品无人区| 正在播放国产对白刺激| 国产在线一区二区三区精| 男女之事视频高清在线观看| 久久热在线av| 一个人免费看片子| 大香蕉久久成人网| 一本久久精品| 黄片小视频在线播放| 亚洲天堂av无毛| 亚洲av片天天在线观看| 久久中文看片网| 亚洲人成电影免费在线| 午夜激情av网站| 亚洲男人天堂网一区| 操出白浆在线播放| 9热在线视频观看99| 亚洲,欧美精品.| 欧美日韩一级在线毛片| 一二三四在线观看免费中文在| 99re6热这里在线精品视频| 性少妇av在线| 韩国高清视频一区二区三区| 午夜福利在线免费观看网站| 制服人妻中文乱码| 亚洲成人免费av在线播放| 啪啪无遮挡十八禁网站| 国产1区2区3区精品| 午夜福利视频在线观看免费| 久久性视频一级片| 亚洲国产欧美网| 国产xxxxx性猛交| 在线观看免费日韩欧美大片| 欧美性长视频在线观看| 深夜精品福利| 成人国产av品久久久| 三上悠亚av全集在线观看| 狠狠婷婷综合久久久久久88av| 多毛熟女@视频| 老汉色∧v一级毛片| 天天添夜夜摸| 久久热在线av| 97在线人人人人妻| 亚洲五月婷婷丁香| 中文字幕精品免费在线观看视频| 一二三四社区在线视频社区8| 最新在线观看一区二区三区| 黄网站色视频无遮挡免费观看| 女人久久www免费人成看片| 少妇的丰满在线观看| 亚洲五月色婷婷综合| 啦啦啦 在线观看视频| 首页视频小说图片口味搜索| 亚洲中文字幕日韩| 天堂中文最新版在线下载| 亚洲精品国产色婷婷电影| 自线自在国产av| 亚洲一码二码三码区别大吗| 91精品伊人久久大香线蕉| 美女午夜性视频免费| 黄片大片在线免费观看| 国产精品 欧美亚洲| 久久久久久久精品精品| 我要看黄色一级片免费的| 久久精品熟女亚洲av麻豆精品| 亚洲美女黄色视频免费看| av电影中文网址| 久久中文看片网| 最新在线观看一区二区三区| 亚洲三区欧美一区| 男女之事视频高清在线观看| 国产成人a∨麻豆精品| 国产主播在线观看一区二区| 在线av久久热| 三上悠亚av全集在线观看| cao死你这个sao货| 黄色毛片三级朝国网站| 久久亚洲国产成人精品v| 亚洲国产av影院在线观看| 九色亚洲精品在线播放| 黑丝袜美女国产一区| 欧美另类一区| 在线观看一区二区三区激情| 精品一区二区三区四区五区乱码| 动漫黄色视频在线观看| 伊人亚洲综合成人网| 少妇猛男粗大的猛烈进出视频| 精品视频人人做人人爽| 操美女的视频在线观看| 三上悠亚av全集在线观看| 亚洲av欧美aⅴ国产| 99国产精品99久久久久| 亚洲成av片中文字幕在线观看| 久久久久视频综合| 黑人巨大精品欧美一区二区蜜桃| 成年人黄色毛片网站| 久久精品亚洲熟妇少妇任你| 一二三四社区在线视频社区8| 中文精品一卡2卡3卡4更新| 悠悠久久av| 永久免费av网站大全| 丁香六月欧美| 亚洲久久久国产精品| 成年女人毛片免费观看观看9 | 久久国产精品人妻蜜桃| 国产精品香港三级国产av潘金莲| 99热国产这里只有精品6| 日韩 亚洲 欧美在线| 日韩熟女老妇一区二区性免费视频| www.熟女人妻精品国产| 极品少妇高潮喷水抽搐| 日韩有码中文字幕| 99热全是精品| 电影成人av| 亚洲av片天天在线观看| 欧美激情极品国产一区二区三区| 亚洲精品国产一区二区精华液| 日韩制服丝袜自拍偷拍| 黄片大片在线免费观看| 97精品久久久久久久久久精品| 欧美另类亚洲清纯唯美| 好男人电影高清在线观看| 午夜福利在线观看吧| 一本久久精品| 国产一区二区三区在线臀色熟女 | 国产精品久久久久久精品电影小说| 97精品久久久久久久久久精品| av在线app专区| 老熟妇仑乱视频hdxx| 人妻一区二区av| 老司机福利观看| 水蜜桃什么品种好| 黄色视频不卡| 青青草视频在线视频观看| 巨乳人妻的诱惑在线观看| 亚洲人成电影免费在线| 免费在线观看影片大全网站| 十八禁人妻一区二区| 在线十欧美十亚洲十日本专区| 国产三级黄色录像| 成人18禁高潮啪啪吃奶动态图| 久久国产精品男人的天堂亚洲| 成人黄色视频免费在线看| av免费在线观看网站| 亚洲九九香蕉| 午夜91福利影院| 国产在线视频一区二区| 淫妇啪啪啪对白视频 | 精品久久久久久电影网| 国产欧美日韩一区二区三区在线| 免费高清在线观看视频在线观看| 黄色视频在线播放观看不卡| 纵有疾风起免费观看全集完整版| 亚洲va日本ⅴa欧美va伊人久久 | 国产成人av激情在线播放| 日韩电影二区| 91麻豆av在线| 免费少妇av软件| 极品人妻少妇av视频| 国产成人欧美| 久9热在线精品视频| 久热爱精品视频在线9| 免费女性裸体啪啪无遮挡网站| 真人做人爱边吃奶动态| 久久久水蜜桃国产精品网| 搡老乐熟女国产| av欧美777| 亚洲成国产人片在线观看| 嫩草影视91久久| 波多野结衣一区麻豆| 一边摸一边做爽爽视频免费| 亚洲精品日韩在线中文字幕| 亚洲五月色婷婷综合| 永久免费av网站大全| 亚洲欧美清纯卡通| 精品国产乱码久久久久久男人| 久久国产亚洲av麻豆专区| 亚洲第一青青草原| 久久热在线av| 美女高潮喷水抽搐中文字幕| 久久综合国产亚洲精品| 亚洲男人天堂网一区| www.熟女人妻精品国产| 国产欧美日韩一区二区三 | 亚洲伊人色综图| 成人黄色视频免费在线看| 国产亚洲av高清不卡| 69av精品久久久久久 | 男人添女人高潮全过程视频| 大片电影免费在线观看免费| 啦啦啦免费观看视频1| 夜夜夜夜夜久久久久| 亚洲av成人不卡在线观看播放网 | 国产日韩欧美在线精品| 国产成人免费观看mmmm| 好男人电影高清在线观看| 波多野结衣一区麻豆| 一区二区三区激情视频| 在线观看免费日韩欧美大片| 超碰97精品在线观看| 久久精品成人免费网站| 国产精品一区二区精品视频观看| 亚洲av欧美aⅴ国产| 老司机影院成人| 黄频高清免费视频| 在线 av 中文字幕| 啪啪无遮挡十八禁网站| 国产精品一区二区精品视频观看| 亚洲一区二区三区欧美精品| 亚洲中文字幕日韩| 国产一区二区三区av在线| 欧美成人午夜精品| 桃红色精品国产亚洲av| 久久久久久免费高清国产稀缺| 日韩人妻精品一区2区三区| 真人做人爱边吃奶动态| 精品亚洲成国产av| 久久人妻熟女aⅴ| 国产成人一区二区三区免费视频网站| 无限看片的www在线观看| 国产欧美日韩一区二区三 | 黄色a级毛片大全视频| 黄色 视频免费看| 捣出白浆h1v1| 操出白浆在线播放| av不卡在线播放| www.999成人在线观看| 亚洲欧洲精品一区二区精品久久久| 两个人免费观看高清视频| av网站在线播放免费| 国产精品麻豆人妻色哟哟久久| 国产成人免费观看mmmm| 国产在线观看jvid| 国产精品免费大片| 久久精品国产亚洲av香蕉五月 | 中文欧美无线码| 精品高清国产在线一区| 午夜两性在线视频| 久久国产精品大桥未久av| 成人三级做爰电影| 亚洲 国产 在线| 日本a在线网址| 男男h啪啪无遮挡| 99精品欧美一区二区三区四区| 桃花免费在线播放| 国产免费一区二区三区四区乱码| 国产精品香港三级国产av潘金莲| 亚洲国产av影院在线观看| 老熟女久久久| 国产成人欧美在线观看 | 精品国产超薄肉色丝袜足j| 在线观看免费日韩欧美大片| 欧美 日韩 精品 国产| 在线观看免费午夜福利视频| 午夜免费成人在线视频| 久久久久国产一级毛片高清牌| 国产真人三级小视频在线观看| 自拍欧美九色日韩亚洲蝌蚪91| 亚洲国产看品久久| 欧美精品av麻豆av| 精品人妻熟女毛片av久久网站| 日日夜夜操网爽| 成年人免费黄色播放视频| 一区二区三区四区激情视频| 色94色欧美一区二区| 在线观看舔阴道视频| 少妇裸体淫交视频免费看高清 | 老司机影院毛片| 亚洲国产欧美网| 久久中文字幕一级| a 毛片基地| 亚洲av国产av综合av卡| 国产成人欧美| 精品久久久久久电影网| 免费少妇av软件| 亚洲avbb在线观看| 国产免费av片在线观看野外av| 欧美大码av| 99国产精品免费福利视频| 国产av国产精品国产| 日韩熟女老妇一区二区性免费视频| netflix在线观看网站| 久久人妻福利社区极品人妻图片| 免费日韩欧美在线观看| 亚洲精品一卡2卡三卡4卡5卡 | av电影中文网址| 亚洲欧美精品自产自拍| 又紧又爽又黄一区二区| 欧美成狂野欧美在线观看| 欧美亚洲日本最大视频资源| 国产国语露脸激情在线看| 精品人妻1区二区| 欧美一级毛片孕妇| kizo精华| 国产99久久九九免费精品| 性高湖久久久久久久久免费观看| 精品久久久精品久久久| 日本a在线网址| 国产精品1区2区在线观看. | av有码第一页| 夜夜骑夜夜射夜夜干| 亚洲一码二码三码区别大吗| 亚洲成人免费电影在线观看| 18禁黄网站禁片午夜丰满| 男女午夜视频在线观看| 免费久久久久久久精品成人欧美视频| 欧美激情 高清一区二区三区| 看免费av毛片| 久久中文字幕一级| 国产精品1区2区在线观看. | 五月开心婷婷网| 丰满少妇做爰视频| 伊人亚洲综合成人网| 国产精品一二三区在线看| 亚洲人成电影免费在线| 男女免费视频国产| a级毛片黄视频| 日韩大码丰满熟妇| 成人av一区二区三区在线看 | 久久精品国产亚洲av香蕉五月 | 欧美国产精品一级二级三级| 一二三四社区在线视频社区8| 午夜日韩欧美国产| 交换朋友夫妻互换小说| 激情视频va一区二区三区| 一进一出抽搐动态| 欧美精品高潮呻吟av久久| 国产精品欧美亚洲77777| 亚洲久久久国产精品| 色播在线永久视频| 国产成人精品久久二区二区91| 日韩一区二区三区影片| 热99re8久久精品国产| 在线观看一区二区三区激情| 中国国产av一级| 女人久久www免费人成看片| 无限看片的www在线观看| 色精品久久人妻99蜜桃| 狠狠精品人妻久久久久久综合| 最新在线观看一区二区三区| 在线永久观看黄色视频| 日日爽夜夜爽网站| 51午夜福利影视在线观看| 少妇 在线观看| 最黄视频免费看| 丁香六月天网| 久久ye,这里只有精品| 黄色视频不卡| 免费日韩欧美在线观看| 亚洲美女黄色视频免费看| 十八禁高潮呻吟视频| 一级片'在线观看视频| 亚洲成人国产一区在线观看| 精品少妇内射三级| 国产精品久久久久久人妻精品电影 | 国产精品久久久久久精品电影小说| 国产黄频视频在线观看| 新久久久久国产一级毛片| 欧美国产精品一级二级三级| 亚洲中文av在线| 女性被躁到高潮视频| 亚洲美女黄色视频免费看| 新久久久久国产一级毛片| 欧美另类一区| 国产免费现黄频在线看| 老司机影院成人| 亚洲美女黄色视频免费看| videos熟女内射| 男女国产视频网站| 成年人免费黄色播放视频| 国产精品久久久久成人av| 久久久久国内视频| 国产在线一区二区三区精| √禁漫天堂资源中文www| 国产一区二区三区综合在线观看| 欧美国产精品va在线观看不卡| 黄片大片在线免费观看| videos熟女内射| 成人影院久久| 亚洲人成77777在线视频| av免费在线观看网站| 国产欧美日韩综合在线一区二区| 国产真人三级小视频在线观看| 淫妇啪啪啪对白视频 | 久久国产亚洲av麻豆专区| 高清黄色对白视频在线免费看| 妹子高潮喷水视频| 久久久久视频综合| 中文字幕人妻丝袜一区二区| 又黄又粗又硬又大视频| 成年人黄色毛片网站| av在线老鸭窝| 两个人看的免费小视频| 天天添夜夜摸| 亚洲成人免费电影在线观看| 久久久久久亚洲精品国产蜜桃av| 亚洲第一青青草原| 国产在视频线精品| 久久九九热精品免费| tube8黄色片| 青青草视频在线视频观看| 狠狠婷婷综合久久久久久88av| 久久久精品区二区三区| 少妇的丰满在线观看| 久久中文看片网| 午夜福利影视在线免费观看| 免费高清在线观看视频在线观看| 中文字幕制服av| 桃花免费在线播放| 巨乳人妻的诱惑在线观看| 国产激情久久老熟女| 午夜福利一区二区在线看| √禁漫天堂资源中文www| 久久久精品免费免费高清| 2018国产大陆天天弄谢| 国产精品久久久av美女十八| 18禁裸乳无遮挡动漫免费视频| 国产在线观看jvid| 一级片'在线观看视频| 考比视频在线观看| 欧美另类亚洲清纯唯美| 久久久欧美国产精品| 丰满迷人的少妇在线观看| www.av在线官网国产| 91精品伊人久久大香线蕉| 国产男女超爽视频在线观看| 99国产精品一区二区三区| cao死你这个sao货| 一边摸一边做爽爽视频免费| 国产一区二区三区av在线| 91字幕亚洲| 少妇的丰满在线观看| av欧美777| 国产日韩一区二区三区精品不卡| 亚洲成人国产一区在线观看| 啦啦啦中文免费视频观看日本| 免费高清在线观看日韩| 不卡av一区二区三区| 亚洲精华国产精华精| 999久久久精品免费观看国产| 视频区图区小说| 亚洲成人免费av在线播放| 日本猛色少妇xxxxx猛交久久| 黄片小视频在线播放| 日日摸夜夜添夜夜添小说| 中文字幕另类日韩欧美亚洲嫩草| 岛国在线观看网站| 午夜福利在线观看吧| 亚洲精品国产区一区二| 99精品久久久久人妻精品| 嫩草影视91久久| 老司机午夜福利在线观看视频 | 久久久精品区二区三区| 99香蕉大伊视频| 新久久久久国产一级毛片| 国产精品亚洲av一区麻豆| 国产主播在线观看一区二区| 午夜老司机福利片| 久久亚洲精品不卡| av在线播放精品| 高清黄色对白视频在线免费看| 天堂俺去俺来也www色官网| 国产成人av教育| 日韩 欧美 亚洲 中文字幕| 91大片在线观看| 精品久久久久久久毛片微露脸 | 久久精品aⅴ一区二区三区四区| 国产高清videossex| 1024香蕉在线观看| 50天的宝宝边吃奶边哭怎么回事| 亚洲精品国产精品久久久不卡| 精品少妇内射三级| 久久人妻福利社区极品人妻图片| 欧美人与性动交α欧美软件| 国产黄色免费在线视频| 国产高清视频在线播放一区 | 男人舔女人的私密视频| 大片电影免费在线观看免费| 在线精品无人区一区二区三| 黑人操中国人逼视频| 亚洲黑人精品在线| 国产一级毛片在线| 成年女人毛片免费观看观看9 |