談浚杰,李明坤,2,孟子汶,2,畢美營,2,韋佳勛,2,汪朝陽,2,應(yīng)明,2*
(1.天津理工大學(xué) 化學(xué)化工學(xué)院 生物制藥工程系,天津 300384;2.天津理工大學(xué) 化學(xué)化工學(xué)院 天津市有機(jī)太陽能電池與光化學(xué)轉(zhuǎn)換重點(diǎn)實(shí)驗(yàn)室,天津 300384)
DNA是一種眾所周知的攜帶遺傳信息的天然分子。在過去的三十年中,DNA由于其可預(yù)測(cè)和可編程的構(gòu)象、A-T和C-G的Watson-Crick堿基配對(duì)原理以及存在豐富的酶等特點(diǎn),使得用工具來操縱DNA,已被普遍用作核酸納米結(jié)構(gòu)的分子構(gòu)建模塊。DNA結(jié)構(gòu)在分子水平上的可預(yù)測(cè)性優(yōu)于構(gòu)建納米結(jié)構(gòu)的任何其他生物分子。此外,DNA納米結(jié)構(gòu)還具有良好的生物相容性、柔韌性、機(jī)械穩(wěn)定性、高負(fù)載能力、高組織滲透性和足夠的生物流體穩(wěn)定性,這有利于其在體內(nèi)外的應(yīng)用。所有這些特征使得納米核酸結(jié)構(gòu)適用于仿生系統(tǒng)[1]、診斷[2]和人類健康治療[3]。例如,選擇核酸納米結(jié)構(gòu)作為強(qiáng)病毒載體材料。Anderson等人開發(fā)了具有清晰尺寸的自組裝DNA四面體納米顆粒,以將siRNA引入細(xì)胞并沉默腫瘤中的靶基因[4]。免疫系統(tǒng)還影響DNA納米結(jié)構(gòu)的體內(nèi)應(yīng)用[5]。使用模擬自身物質(zhì)的“偽裝”DNA納米結(jié)構(gòu)可以幫助它們逃離免疫系統(tǒng)[6-7]。它在疫苗研發(fā)和核酸醫(yī)用生物材料方面發(fā)揮著重要作用。
在先前研究中,SdhC雙鏈DNA用于折疊,通過核酸自組裝成功設(shè)計(jì)并獲得預(yù)期邊長19.05 nm的正四面體核酸納米錐[8]。構(gòu)建了一種新的方法,即普通基因的雙鏈DNA可以取代單鏈M13mp18核酸作為DNA折紙的核酸材料。在此基礎(chǔ)上,自主設(shè)計(jì)了核酸納米盒的組裝[9]。通過選擇citZ基因并用特定基因位點(diǎn)修飾,通過計(jì)算和自組裝獲得邊長為47.29 nm的核酸納米盒,并通過限制酶控制核酸納米盒的開關(guān)。打開的核酸納米盒與在限制位點(diǎn)修飾的質(zhì)?;旌?并在轉(zhuǎn)移到原生質(zhì)體之前與T4連接酶連接。實(shí)驗(yàn)表明,100%的包裹質(zhì)粒被轉(zhuǎn)移到革蘭氏陽性細(xì)菌中,這表明核酸納米盒有望成為一種新的藥物載體。
上述研究表明,模塊拼接核酸納米材料的構(gòu)建方法比DNA折紙更為人工,可以使用普通的雙鏈DNA序列作為納米結(jié)構(gòu)的核酸材料,甚至可以定制納米結(jié)構(gòu)并且所構(gòu)建的納米結(jié)構(gòu)更完整。因此,使用“樂高”區(qū)塊拼接將T4噬菌體分為四部分進(jìn)行區(qū)塊拼接和組裝。首先,選擇人類基因組基因PPIAP5的基因序列作為頭部15個(gè)模塊的材料,選擇HSBP1P2的基因序列為衣領(lǐng)中的9個(gè)模塊和底板中的6個(gè)模塊的素材,選擇NDUFB3P3的基因序列用作鞘中的10個(gè)模塊的材料。其次,使用DEADALUS算法,為了使設(shè)計(jì)的結(jié)構(gòu)滿足T4噬菌體的大小、構(gòu)建目標(biāo)結(jié)構(gòu)的所有頂點(diǎn)的空間坐標(biāo)、頂點(diǎn)之間的連接性以及頂點(diǎn)應(yīng)提供的表面(圖1A、B)。除了提供上述空間信息外,邊長不能小于31 bp,并且是10.5 bp的倍數(shù)。因此,T4噬菌體的最小邊長被設(shè)計(jì)為31 bp。最后,使用改進(jìn)的DEADALUS修改相應(yīng)模塊的原材料,在特定位點(diǎn)添加限制性位點(diǎn),并拼接每個(gè)位點(diǎn),從而最終形成預(yù)期的T4噬菌體結(jié)構(gòu)。
圖1 DEADALUS算法圖解
在這項(xiàng)研究中,目標(biāo)是用復(fù)雜的對(duì)稱外殼模擬T4噬菌體病毒,大多數(shù)是病毒外殼或二十面體對(duì)稱或螺旋對(duì)稱,但痘病毒和大型噬菌體病毒不屬于其中任何一種。痘病毒是最大的動(dòng)物病毒(約400 nm×240 nm×200 nm),外觀呈橢圓形或磚狀,內(nèi)部結(jié)構(gòu)非常復(fù)雜,但大型噬菌體病毒比痘病毒更復(fù)雜。對(duì)大腸桿菌T4噬菌體病毒進(jìn)行了仔細(xì)研究。它們的頭部類似于二十面體結(jié)構(gòu),尾部由套環(huán)、中空尾管、圍繞尾管的尾鞘和復(fù)雜的底板組成,頸部將頭部和尾部連接在一起。具有二十面體對(duì)稱頭部和螺旋對(duì)稱鞘,T4噬菌體病毒(頭部直徑約為85 nm,鞘直徑約為10 nm,長度約為95 nm)具有二元對(duì)稱結(jié)構(gòu)。
生成樹程序?qū)⑤斎雴捂溦郫B到目標(biāo)結(jié)構(gòu)的框架中,并生成折疊所需的訂書釘股線。為了使單個(gè)支架鏈能夠形成完整的目標(biāo)結(jié)構(gòu),必須滿足兩個(gè)條件。第一個(gè)條件是必須有一個(gè)歐拉回路,因?yàn)橹Ъ艿膬啥藢⑿纬杀舜讼噜彽闹Ъ荛g隙,并且該間隙必須由多余的縫釘填充。為了確保歐拉電路的存在,當(dāng)每個(gè)頂點(diǎn)的階數(shù)為偶數(shù)時(shí),結(jié)構(gòu)中的每條邊可以實(shí)現(xiàn)偶數(shù)個(gè)雙工。第二個(gè)條件是,即使歐拉電路存在,也不能保證所有的歐拉電路都能形成有效的支架結(jié)構(gòu)。為了形成有效的支架結(jié)構(gòu),在設(shè)計(jì)曲面屬性元素時(shí),從某個(gè)頂點(diǎn)輸入某個(gè)頂點(diǎn)。邊的腳手架鏈可以從同一頂點(diǎn)或另一頂點(diǎn)離開。因此,解決支架路徑的問題可以概括為:將邊緣劃分為一個(gè)具有零支架交叉或一個(gè)支架交叉的邊緣。具有零支架交叉的邊必須連接到每個(gè)頂點(diǎn),并且沒有循環(huán),這滿足生成樹的定義,因此使用生成樹來解決支架布線(圖1C),并且prim算法用于找到最小權(quán)重并重新生成樹(頂點(diǎn)集是V,邊集是e,X是集合V中的任何頂點(diǎn)。算法從頂點(diǎn)X開始,每次選擇一個(gè)最接近當(dāng)前頂點(diǎn)集的頂點(diǎn),并將兩個(gè)頂點(diǎn)之間的邊添加到樹t并重復(fù))。
添加偽節(jié)點(diǎn)和支架布線對(duì)于零支架交叉的邊,添加一對(duì)偽節(jié)點(diǎn)以將邊分成兩半,每一半對(duì)應(yīng)于支架交叉的一側(cè)(圖1D)。對(duì)于圖形中的每個(gè)頂點(diǎn),將添加一組偽節(jié)點(diǎn)來替換頂點(diǎn)節(jié)點(diǎn),對(duì)于每個(gè)面,將放置一個(gè)偽節(jié)點(diǎn),以連接兩個(gè)邊界邊并將其與其他邊斷開。添加偽節(jié)點(diǎn)后,定義了腳手架將通過的歐拉電路(圖1E和F),它有兩種電路:順時(shí)針布線和逆時(shí)針布線。為了最小化骨架的靜電排斥,選擇了逆時(shí)針運(yùn)行支架的路線。生成樹和偽節(jié)點(diǎn)僅與結(jié)構(gòu)相關(guān),與大小無關(guān)。然后,將邊緣的長度引入算法(圖1插圖),并將支架切口位置放置在沒有支架交叉的邊緣上,遠(yuǎn)離縫釘切口和交叉點(diǎn)的復(fù)合結(jié)構(gòu)。使用prim算法,根據(jù)邊緣的長度和布線方案對(duì)每個(gè)支架底座進(jìn)行編號(hào),并跟蹤其在邊緣上的相對(duì)位置。對(duì)于每條邊緣,一個(gè)核苷酸從5'和3'端突出,算法確定任何給定邊緣上支架片段的長度。
預(yù)測(cè)原子級(jí)3D結(jié)構(gòu)對(duì)于具有支架交叉的邊緣,將兩個(gè)31~32 nt縫釘放置在支架交叉處,以充分加強(qiáng)結(jié)合。對(duì)于邊緣的其余部分,如有必要,用42 nt縫釘、22 nt或21 nt短縫釘填充(圖1G)。每個(gè)縫釘由數(shù)字向量表示,與支架核苷酸配對(duì),然后使用輸入或生成的支架序列與相應(yīng)的支架編號(hào)匹配。采用通用算法確定邊緣端點(diǎn)的位置。Dx瓦片可以被視為兩個(gè)組合寬度為4 nm(2 nm螺旋間距和2 nm雙工直徑)的平行圓柱體,其可以進(jìn)一步簡(jiǎn)化為具有4 nm寬度的矩形。在理想情況下,這些矩形的角度相交,矩形的寬度相加形成一個(gè)N邊正多邊形。多邊形的內(nèi)徑是從邊的中心到邊的垂直距離(s是頂點(diǎn)和DX平鋪邊的起點(diǎn)之間的距離,r是由DX平鋪的寬度形成的多邊形的半徑,θtot是頂點(diǎn)的所有面角之和)。
然而,并不是所有的頂點(diǎn)都有相同的角度,會(huì)有骨干延伸或核苷酸重疊的情況,所以定義s=r為角的延伸,并創(chuàng)建一個(gè)半徑為r的球體來定義邊緣邊界(是最大的面角度,是DX-tile的寬度)。這種方法適用于所有的規(guī)則結(jié)構(gòu)。
如果設(shè)計(jì)完整的結(jié)構(gòu),T4噬菌體結(jié)構(gòu)的設(shè)計(jì)需要大于20 000 bp 的支架序列。在實(shí)際的實(shí)驗(yàn)組裝過程中,出錯(cuò)的概率太大,因此使用“樂高”塊拼接將T4噬菌體分為四個(gè)部分(頭部、頸部、尾部和底板)。它們各自產(chǎn)生的結(jié)構(gòu)通過限制酶切割和連接,以實(shí)現(xiàn)復(fù)雜結(jié)構(gòu)的模塊組裝。因此,算法的改進(jìn)可以在腳手架序列上添加限制點(diǎn),因?yàn)樗惴ň哂心_手架上的基礎(chǔ)序列號(hào),由txt文件生成以檢查基礎(chǔ)是否安排在每種情況和基礎(chǔ)序列的位置,通過查找需要替換的基礎(chǔ)序列的位置,替換相應(yīng)的酶限制位點(diǎn)序列(這里是改進(jìn)的程序)。
scaf_seq=(″);
replaced_seq=(″);
enzyme_sequence=(″);
len_enzyme=length(replaced_seq);
site_of_enzyme=strfind(scaf_seq,num2str
(replaced_seq))
[m,n]=size(site_of_enzyme);
for i=1:m;
for j=1:n;
if site_of_enzyme(i,j)==1;
scaf_seq(site_of_enzyme(i,j):1:
(len_enzyme+site_of_enzyme(i,j)-1))=enz
yme_sequence
end
end
end
通過DEADALUS算法的應(yīng)用,成功地設(shè)計(jì)了T4噬菌體四個(gè)模塊的納米結(jié)構(gòu)。根據(jù)算法流程,首先選擇目標(biāo)結(jié)構(gòu)的幾何模型。因?yàn)閷⑹删w組裝成模塊,所以完整的噬菌體被分為四個(gè)幾何模型。以頭部幾何模型為例,制作了頭部的Schlegel圖,計(jì)算了生成樹和支架路徑,添加了偽節(jié)點(diǎn)和縫釘,將A鏈折疊成噬菌體頭部結(jié)構(gòu),如圖2所示。在此基礎(chǔ)上,使用“樂高”積木拼接法,將折疊成頭部結(jié)構(gòu)的長股分成15根梁。每個(gè)梁構(gòu)成頭部結(jié)構(gòu)的一個(gè)模塊。15個(gè)模塊與算法生成的引腳組合,以模塊組裝的方式生成噬菌體頭部結(jié)構(gòu)。其他三種結(jié)構(gòu)類似。軸環(huán)由九個(gè)模塊組成,護(hù)套由十個(gè)模塊構(gòu)成,底板由六個(gè)模塊組成。由于組裝的四個(gè)模塊需要通過相應(yīng)的黏性端拼接,因此分析了包括四個(gè)模塊的梁的限制位置。因?yàn)槊總€(gè)模塊之間的連接位置和連接順序是固定的,所以必須將頭部連接到上套環(huán),下套環(huán)必須連接到上護(hù)套,下護(hù)套必須連接到基板。因此,頭部和軸環(huán)頂部、軸環(huán)下端和護(hù)套頂部、護(hù)套下端和基板的限制位置應(yīng)相同,三個(gè)連接位置的限制位置不應(yīng)相同,以確保每個(gè)模塊之間的正確連接。此外,上述三個(gè)核酸序列中必須不存在作為每個(gè)模塊束的合格限制位點(diǎn),以防止限制酶切割在每個(gè)模塊連接期間不應(yīng)斷裂的束,導(dǎo)致模塊解體。因此,需要三個(gè)不同的限制位點(diǎn),這些位點(diǎn)在三個(gè)射束中不存在,使用Snapgene軟件分析限制位點(diǎn),發(fā)現(xiàn)了三個(gè)限制位點(diǎn),AbsI(CC^TCGAGG)、BbvCI(CC^TCAGC)和XbaI(T^CTAGA)(圖s1顯示了限制位點(diǎn)的位置)。因此,使用改進(jìn)的DEADALUS算法在四個(gè)模塊上添加這些限制點(diǎn)。
(a)噬菌體頭部的算法圖流程:選擇噬菌體頭部模型,投影頭部的施萊格爾圖,計(jì)算施萊格爾圖表上的最小生成樹,將平面生成樹轉(zhuǎn)換為3D生成樹,并在非生成樹路由上添加缺口,以定義歐拉電路,根據(jù)邊緣長度和是否有刻痕,在頂點(diǎn)和邊緣添加特定的訂書釘鏈;(b)噬菌體頸部算法流程圖;(c)尾部算法流程圖;(d)底板算法流程圖圖2 模塊算法圖
對(duì)于不同的噬菌體模塊,選擇不同的核酸材料以適應(yīng)由梁組成的模塊的長度。對(duì)于噬菌體的頭部,選擇PPIAP5,PPIAP5是肽基丙酰異構(gòu)酶A假基因5。PPIAP5的基因ID為122 842,全長574 bp,位于智人14號(hào)染色體GRCh38的59 181 571~59 182 144位置,選擇了HSBP1P1,HSBP1P2是熱休克因子結(jié)合蛋白1的假基因2。HSBP1P基因的ID號(hào)為326 296,全長538 bp,位于智人4號(hào)染色體GRCh38的110 251 617~110 252 126位置,位于智人14號(hào)染色體GRCh38的53 011 929~53 012 401位置。這些核酸材料均為假基因,選擇了這三個(gè)基因以避免干擾正常轉(zhuǎn)錄。
T4噬菌體的頭部需要長度為8 190 bp的堿基序列,并選擇15個(gè)基于PPIAP5的射束。修改了五束,第一束的長度為154 bp。15個(gè)分散的射束被大量的針組合以形成噬菌體的頭部模塊。分析后,AbxI限制位點(diǎn)位于頭部E(V14-V19),E(V13-V18),E(V12-V17),E(V16-V21),E(V15-V20)的五個(gè)側(cè)面,以連接到頸部。由頭部組成的15個(gè)模塊如圖3所示。
圖3 由頭部組成的15個(gè)模塊
頸部需要長度為4 752 bp的基礎(chǔ)序列。選擇了基于HSBP1P1的九個(gè)波束。修改了六個(gè)波束,第一個(gè)波束的長度為448 bp。AbxI限制位點(diǎn)位于軸環(huán)E(V20-V29),E(V19-V28),E(V18-V27),E(V17-V26),E(V21-V30)的五側(cè),以連接至頭部,BbvCI限制位點(diǎn)位于頸部E(V25-V4),E(V24-V3),E(V23-V2),E(V22-V1)的四側(cè),以與尾部連接。由頸部組成的15個(gè)模塊如圖4所示。
圖4 由頸部組成的15個(gè)模塊
尾部需要458 4 bp長度的堿基序列。選擇了基于NDUFB3P3的十個(gè)波束。修改了七個(gè)波束,修改后的第一個(gè)波束為327 bp。BbvCI限制位點(diǎn)位于snath E(V6-V26),E(V9-V27),E(V12-V28),E(V3-V25)和E(V3-V25)的四個(gè)側(cè)面,以連接到頸部,XbaI限制位點(diǎn)位于E(V1-V21),E(V4-V22),E(V7-V23),E(V10-V24)的四側(cè),以連接到底板。
底板需要長度為3 168 bp的堿基序列。選擇了基于HSBP1P1的六個(gè)波束。修改了三個(gè)波束,第一波束的長度為478 bp。XbaI限制部位位于底板E(V15-V19),E(V14-V18),E(V13-V17),E(V16-V20)的四個(gè)側(cè)面,以連接到尾部。由底板組成的六個(gè)模塊如圖5所示。
圖5 由底板組成的六個(gè)模塊
噬菌體的四個(gè)結(jié)構(gòu)設(shè)計(jì)完成并添加限制位點(diǎn)后,應(yīng)將四個(gè)單獨(dú)設(shè)計(jì)的結(jié)構(gòu)拼接成完整的噬菌體結(jié)構(gòu)?!皹犯摺眳^(qū)塊拼接用于用限制性內(nèi)切酶切割靶結(jié)構(gòu)的限制性位點(diǎn)。由于頭部和頸部、尾部、底板對(duì)應(yīng)于粘性末端,因此可以與DNA連接酶連接。一對(duì)一連接后,可以形成完整的噬菌體結(jié)構(gòu)。
開發(fā)了一種使用“樂高”塊拼接和DNA納米結(jié)構(gòu)的計(jì)算機(jī)輔助設(shè)計(jì)來模擬T4噬菌體病毒衣殼的自組裝方法,并可以通過這種方法模擬各種形狀的病毒衣殼。基于自主開發(fā)系統(tǒng)的病毒模擬研究可以產(chǎn)生兩種效果:首先,它在DNA設(shè)計(jì)理念上取得了突破,并開發(fā)了適合光譜基因的“樂高”塊拼接,這種構(gòu)建方法將為會(huì)計(jì)納米技術(shù)提供新的學(xué)術(shù)思路;第二,DNA模擬病毒衣殼顆粒的實(shí)驗(yàn)組裝如果成功,將改變創(chuàng)傷疫苗的生產(chǎn)方式,為開發(fā)更多的核酸奠定了基礎(chǔ)。