李慧娟,蔣 犁,余章斌,韓樹萍,劉雪華
1東南大學附屬中大醫(yī)院兒科,南京 210009 2南京醫(yī)科大學附屬南京婦幼保健院兒科,南京 210004
?
·論著·
室間隔缺損相關(guān)的長鏈非編碼RNA TUC40- 的生物信息學及表達譜分析
李慧娟1,蔣犁1,余章斌2,韓樹萍2,劉雪華2
1東南大學附屬中大醫(yī)院兒科,南京 2100092南京醫(yī)科大學附屬南京婦幼保健院兒科,南京 210004
摘要:目的探討TUC40- 在人和小鼠心臟胚胎發(fā)育過程中是否發(fā)揮作用。方法應用生物信息學網(wǎng)站NCBI、UCSC、Uniprot及軟件Clustal、DNAMAN、MEGA 6等,對TUC40- 及其編碼片段uc.40- 進行分析;采用鏈特異性逆轉(zhuǎn)錄實時定量聚合酶鏈反應檢測TUC40- 與其正義鏈產(chǎn)物Pbx1 mRNA在小鼠胚胎心臟發(fā)育關(guān)鍵時間點的表達譜。結(jié)果Uc.40- 于核苷酸序列、基因組位置及轉(zhuǎn)錄因子結(jié)合位點3個水平在人和小鼠具有保守性。TUC40- 與Pbx1 mRNA在小鼠心臟胚胎發(fā)育過程中呈現(xiàn)負性趨勢。結(jié)論Uc.40- 的多水平保守性提示了TUC40- 功能的保守性。TUC40- 可能是通過調(diào)控Pbx1,在人和小鼠的心臟胚胎發(fā)育中發(fā)揮作用。
關(guān)鍵詞:長鏈非編碼RNA;生物信息學;保守性;表達譜;室間隔缺損
ActaAcadMedSin,2016,38(1):1-8
長鏈非編碼RNA(long non-coding RNA,lncRNA)TUC40- 的全稱是transcribed uc.40-,uc.40- 屬于一系列被稱作超保守片段(ultraconserved elements,UCEs)的DNA片段,這些片段的堿基序列在人、大鼠、小鼠這3個物種中是100%保守的,這種序列的高度保守性暗示了功能的保守性和重要性。本課題組前期收集了孕17周經(jīng)胎兒心臟超聲診斷室間隔缺損(室缺)的流產(chǎn)胎兒心臟標本,與同時間點正常流產(chǎn)標本,每組取3個標本混樣,進行l(wèi)ncRNA差異表達譜分析。結(jié)果顯示,在過表達的lncRNA中,uc.40- 在所有UCEs中過表達的倍數(shù)最高,為4.87倍,而其他UCEs的過表達倍數(shù)波動于2.11~3.83倍。此外,uc.40- 位于Pbx1的反義鏈上,以往研究顯示,Pbx1敲除小鼠可出現(xiàn)室缺表型[1-2]。uc.40- 與Pbx1呈現(xiàn)正反義關(guān)系,正反義基因通常有相互作用,而后者與室缺相關(guān)。因此本研究選擇uc.40- 為研究對象,擬通過對TUC40- 和uc.40- 進行生物信息學分析,檢測Pbx1/TUC40- 在小鼠胚胎發(fā)育過程中的表達譜,闡述TUC40- 與人和小鼠胚胎心臟發(fā)育的潛在關(guān)系。
材料和方法
序列保守性分析——進化樹構(gòu)建進化樹構(gòu)建流程:(1)選擇常用于構(gòu)建進化樹的物種,包括:靈長類(人、黑猩猩)、嚙齒類(大鼠、小鼠)、其他哺乳動物類(牛、豬、大象)、其他脊柱類(雞)、兩棲類(非洲爪蟾、熱帶爪蟾)及魚類(斑馬魚、大長須鯨)共12個物種(表1);(2)在NCBI Blast(http://blast. ncbi.nlm.nih.gov/Blast.cgi)中進行比對,將所得序列及人uc.40- 序列以fasta格式保存于txt文檔中;(3)將上述序列導入MEGA 6,利用CLUSTAL X進行多重比對,比對結(jié)果利用DNAMAN拼接制圖;(4)選擇最大簡約法(maximum-parsimony,MP;適合用于相似度較高的序列)構(gòu)建uc.40- 的進化樹,采用bootstrap檢驗法,次數(shù)為1000次。
表 1 進化樹包含的物種及uc.40- 序列在各個基因組中的比對結(jié)果
a:所示兩個物種比對結(jié)果顯示為uc.40,說明這兩個物種基因組中已有超保守區(qū)域的注釋;b:Un表示數(shù)據(jù)庫中顯示染色體未知
a:represent that the blast results feedback as uc.40,indicating that the UCE annotation already exist in the two species;b:Un means that the chromosome location is not for sure yet
基因組位置比對采用uc.40-序列在NCBI中應用Blast進行序列比對,獲得其在人和小鼠基因組中的位置。
轉(zhuǎn)錄因子結(jié)合位點分析在UCSC數(shù)據(jù)庫中,利用HMR conserved transcription factor binding site(http://genome.ucsc.edu/)數(shù)據(jù)庫,查找在人和小鼠中保守的轉(zhuǎn)錄因子結(jié)合位點及轉(zhuǎn)錄因子;在Uniprot數(shù)據(jù)庫中(http://www.uniprot.org/)查找轉(zhuǎn)錄因子的功能。
TUC40-、Pbx1表達譜檢測因小鼠胚胎心臟發(fā)育于胚胎10.5 d(E10.5)時完成環(huán)化,E14.5時四腔心完全形成,故選擇在E10.5、E14.5及生后(neo)3個時間點進行實驗。取心臟及肺、腦、肝、胃5個臟器。在E10.5,由于臟器體積小、取材困難,這個時間點心臟和腦的樣本數(shù)量分別有3個(每個樣本由1只孕鼠所有胎鼠的心或腦混合);此外在這個時間點由于肺、胃、肝在實驗用光鏡下不可見,即便設(shè)法取材也難以滿足后續(xù)實驗要求,因此沒有取材進行實驗。在E14.5,每種臟器的數(shù)量為4~6個(每個樣本由1只孕鼠所有胎鼠的相應臟器混合)。在neo,每種臟器數(shù)量為4~6個,并且來源于單一新生小鼠(1只新生小鼠的某種臟器足夠進行后續(xù)實驗)。
RNA提取:采用Trizol(Life Technologies,美國)法提取總RNA。動物標本取材、清洗后立即加入1 ml Trizol(單個胚胎某個臟器的標本量不足時,將同孕母胎鼠的該臟器混合);超聲勻漿機(Uibracell,Sonics and materials,美國)勻漿后加入200 μl三氯甲烷,劇烈搖晃震動15 s以上,室溫靜止15 min后,12 000×g4℃離心15 min;吸出上清,加入等體積于上清的異丙醇,翻轉(zhuǎn)混勻,稍靜置后予12 000×g4℃離心10 min,倒棄上清;加入1 ml 75%冰浴乙醇,盡量吹散團塊,7500×g4℃離心5 min(該步驟重復2次);倒掉上清,紙上瀝干,加入適量焦碳酸二乙酯(diethy pyrocarbonate,DEPC)水溶解,然后測定RNA濃度及純度。
鏈特異性逆轉(zhuǎn)錄:逆轉(zhuǎn)錄試劑盒選用RevertAid Reverse Transcriptase(Thermo Scientific,美國)。采用Primer 3(http://primer3.ut.ee/)在線引物設(shè)計軟件,從目標序列的3’端設(shè)計,TUC40-、Pbx1、GAPDH的strand-specific引物分別為5’-ACAGCCCCTCAGCTT- GTTAG- 3’、5’-GTCTGTGGGCTCCTCTTCTT- 3’、5’-TC AAGAGAGTAGGGAG GGCT- 3’。先將底物混勻:1 μg模板RNA,2 μl strand-specific primer,DEPC水補齊至12.5 μl;然后繼續(xù)加入試劑:4 μl反應緩沖液,0.5 μl RNA酶抑制劑,2 μl脫氧核糖核苷三磷酸混合物,1 μl聚合酶。反應流程為:42℃ 60 min,70℃ 10 min。以上反應所得即為TUC40-、Pbx1及GAPDH相應的cDNA模板,用于后續(xù)實驗[3]。
實時定量PCR:試劑盒采用Power SYBR?Green PCR Master Mix(Life Technologies,美國)。TUC40-、Pbx1、GAPDH的PCR引物分別為5’-TCCTACCAGACTCCCAAGCA,3’-TCTAACAAGCTGAGGGGCTG;5’-CATC GGGGACATTTTACAGCA,3’-CTCCTCTTCTTGGGCTCCC;5’-CTGCGACTTCAACAGCAACT,3’-GAGTTGGGATAGG GCCTCTC。反應體系為預混液(SYBR Green PCR Master Mix)12.5 μl,上游引物0.5 μl,下游引物0.5 μl,cDNA模板1 μl,DEPC水10.5 μl,共20 μl。反應流程為:95℃ 10 min;95℃ 15 s,60℃ 1 min,循環(huán)40次。通過熔解曲線及電泳結(jié)果確認產(chǎn)物是否正確。相對表達量通過擴增產(chǎn)物所需的循環(huán)次數(shù)(cycle threshold,CT)值來計算(2-△CT法),其中△CT=CTsample-CTGAPDH。
瓊脂糖凝膠電泳:用瓊脂糖粉(Biowest,西班牙)制成濃度為1.5%的凝膠(DNA分離范圍為0.2~4 kb),將1 μl PCR產(chǎn)物與4 μl上樣緩沖液(含核酸染料Gelred,Generay,中國)混勻后加入凝膠的點樣孔中,并同時上樣DNA marker(含核酸染料Gelred,Generay,中國)。電泳電壓為60V,時間為45 min。電泳完畢后在紫外燈下顯影。
統(tǒng)計學處理采用SPSS 20.0統(tǒng)計軟件,數(shù)據(jù)以均數(shù)±標準差表示,兩組間比較采用t檢驗,多組間比較采用單因素方差分析,組間兩兩比較采用LSD法,P<0.05為差異有統(tǒng)計學意義。
結(jié)果
生物信息學查詢結(jié)果進化樹結(jié)果顯示,人和小鼠、大長須鯨、大鼠、黑猩猩的uc.40- 之間沒有進化距離,分支點處的支持度基本在90以上(圖1)。
Uc.40- 在人基因組中位于chr1:164,668,725- 164,668,971(GRCh38/hg19);在小鼠基因組中位于chr1:168,327,865- 168,328,111(GRCm38.p3,C57BL/6J)。Uc.40-(轉(zhuǎn)錄方向為3’到5’)在兩個物種中全長均為247nt,對應著Pbx1(轉(zhuǎn)錄方向為5’到3’)的第2個內(nèi)含子(圖2)。
圖左下角的標尺長度代表進化距離為1個核苷酸,uc.40- 在物種之間的進化距離為樹枝(橫線條)長度之差,節(jié)點處(樹枝分叉點)的數(shù)字代表“支持度”,通過步展法(Bootstrap)計算得來,數(shù)字取向為50~100,數(shù)字越大表示越支持分支形成
Scale length(left corner) represents one nucleotide/site and difference between the branches(horizontal lines) represents the evolutionary distance between species, numbers under the node(branch bifurcation point) represent the support rate which is calculated by Bootstrap, the numbers vary from 50 to 100,with the higher numbers meaning stronger support for branch formation
圖1uc.40- 多重序列比對及進化樹
Fig1Multiple alignment of uc.40- and the phylogenetic tree
表達譜檢測結(jié)果在E10.5時間點,TUC40- 在心臟及腦中的表達量差異無統(tǒng)計學意義(P>0.05)。在E14.5時間點,TUC40- 在5個臟器中的表達量差異有統(tǒng)計學意義(P<0.01);其中,TUC40- 在腦與其他各臟器中的表達量差異均有統(tǒng)計學意義(P<0.01),在肝臟與胃中的表達量差異也有統(tǒng)計學意義(P<0.05)。在neo時間點,TUC40- 在5個臟器中的表達量差異有統(tǒng)計學意義(P<0.01);其中,在心臟與腦、肺、胃的表達量差異均有統(tǒng)計學意義(P<0.01),在腦與肝臟、胃的表達量差異均有統(tǒng)計學意義(P<0.01),在肝臟與肺、胃的表達量差異均有統(tǒng)計學意義(P<0.01)(圖4A)。
在小鼠胚胎心臟發(fā)育過程中,TUC40- 在E10.5與neo的表達量差異有統(tǒng)計學意義(P<0.05),呈下降趨勢,隨著TUC40- 表達量的下降,Pbx1呈上升趨勢(E10.5比E14.5,P<0.01;E10.5比neo,P<0.01;E14.5比neo,P<0.05;3組間,P<0.01)。在腦中,盡管TUC40- 的表達量在E10.5與E14.5間差異有統(tǒng)計學意義(P<0.05),且Pbx1在E10.5與E14.5(P<0.05)、E10.5與neo(P<0.01)及3組間(P<0.01)差異有統(tǒng)計學意義,但整體并沒有明顯的正性或負性變化趨勢。在肝臟和胃中,無論TUC40- 還是Pbx1,在E14.5和neo間的表達量差異均沒有統(tǒng)計學意義(P>0.05)。在肺中,僅Pbx1的表達量在E14.5和neo間差異有統(tǒng)計學意義(P<0.05),TUC40- 的表達量沒有明顯變化(圖4B)。
A.uc.40- 序列在人和小鼠基因組的比對圖;B.相應的示意圖
A. alignment picture of uc.40- in human and mouse genomes;B. the schematic diagram
圖2uc.40- 在人和小鼠基因組的比對結(jié)果
Fig2Blast results of uc.40- in human and mouse genomes
圖3保守的轉(zhuǎn)錄因子結(jié)合位點及相應的轉(zhuǎn)錄因子
Fig3Conserved transcription factor(TF) binding sites and the corresponding TFs
aP<0.05,bP<0.01
A.3個時間點及不同臟器中TUC40- 及Pbx1的相對表達量;B.胚胎心臟RNA經(jīng)逆轉(zhuǎn)錄及PCR后所得產(chǎn)物的瓊脂糖凝膠電泳條帶,第1、2、3泳道分別為TUC40-、Pbx1、GAPDH,第4泳道為隨機引物逆轉(zhuǎn)錄后生成的GAPDH(用于對照產(chǎn)物的準確性),第6泳道為DNA marker
A. expression profile of three time points and the five organs;B. the AGE of PCR product of embryonic heart, lanes 1,2,and 3 represent TUC40-,Pbx1,and GAPDH,respectively,lane 4 represents GAPDH generated from random primers initiated reverse transcription(to show the accuracy of the product),and lane 6 is the DNA marker
圖4表達譜及PCR產(chǎn)物瓊脂糖凝膠電泳
Fig4Expression profile of TUC40- /Pbx1 and the agarose gel electrophoresis(AGE) of PCR product
討論
LncRNA是一類編碼蛋白質(zhì)能力弱、長度大于200nt的非編碼RNA(non-coding RNA,ncRNA)[4]。UCEs包含481條在人、大鼠、小鼠基因組中100%保守的DNA片段(http://users.soe.ucsc.edu/~jill/ultra. html,http://users.soe.ucsc.edu/~jill/ultra.watson.fa)[5]。 UCEs(包含在ultraconserved regions,UCRs)的轉(zhuǎn)錄產(chǎn)物稱為transcribed-UCRs,即T-UCRs,這些轉(zhuǎn)錄產(chǎn)物組成了超保守lncRNA數(shù)據(jù)庫[6]。生物信息學分析結(jié)果顯示,lncRNA的保守性相對于microRNA等并不強,因此T-UCRs是lncRNA中非常特殊的一部分[7]。
20世紀60年代以來,隨著分子遺傳學資料的迅速積累,分子進化逐漸成為生物信息學的重要組成部分。通過比較物種間某一個生物分子的變化,也就是進化分析,來研究其演變,有助于理解其功能[8]。本研究中的多重序列比對及進化樹基本能夠反映uc.40-在物種之間的高度保守性,且uc.40- 在人及小鼠的基因組位置也相同。Basu等[7]利用小鼠的lncRNA基因組表達譜,在魚中找到了相應的基因組保守區(qū)域,進一步分析發(fā)現(xiàn),這些保守區(qū)域周圍的蛋白編碼基因在GO分析中呈現(xiàn)出相似的作用。與之類似的是,互為反義的一對lncRNA Pldi-AK158810在進化上出現(xiàn)于哺乳動物這一分支中,并且這一基因區(qū)域(包括其兩端的基因片段)在哺乳動物當中是保守的[9]。結(jié)合上述兩個例子筆者認為,相同的基因組位置暗示著TUC40-在人和小鼠可能發(fā)揮相似的作用。
除外核苷酸序列和基因組位置,uc.40- 在兩個物種能夠結(jié)合的與心臟發(fā)育相關(guān)的轉(zhuǎn)錄因子也是保守的。綜合上述不同層次的保守性判斷,筆者猜測,與人室缺相關(guān)的TUC40- 可能在小鼠胚胎心臟發(fā)育過程中也發(fā)揮了作用。
LncRNA種類繁多,其中一類是反義lncRNA(antisense lncRNA),即天然反義轉(zhuǎn)錄物。Antisense lncRNA能通過影響其正義鏈基因的轉(zhuǎn)錄活性或其產(chǎn)物來發(fā)揮作用[10],如著名的BACE1-AS就是通過與其sense基因BACE1(編碼致阿爾茨海默病的關(guān)鍵酶)的mRNA形成復合物,增加BACE1 mRNA的穩(wěn)定性,從而加速阿爾茨海默病的發(fā)生發(fā)展[11]。
本研究表達譜檢測結(jié)果顯示,TUC40- 在小鼠胚胎發(fā)育過程中的表達具有時空特異性,盡管TUC40- 并非心臟特異性表達,且在心臟中的表達量并非最高,但是TUC40- 在小鼠胚心發(fā)育過程中呈現(xiàn)下降趨勢,這在其他臟器中并沒有出現(xiàn),并且Pbx1/TUC40- 在小鼠胚胎心臟發(fā)育過程中呈現(xiàn)負性關(guān)系。因此結(jié)合Pbx1與室缺的相關(guān)性,筆者認為,TUC40- 可能通過調(diào)控Pbx1,進而影響小鼠胚心發(fā)育。
本研究存在以下不足:(1)文中進化樹的構(gòu)建依據(jù)的是比對所得的片段,而非已證實的完整編碼lncRNA的片段,故而這個進化樹尚不完善;(2)TUC40- 與小鼠心臟發(fā)育的相關(guān)性只有表達譜這一支持依據(jù),尚沒有功能學實驗證實。
綜上,本研究作為一個探索性實驗,通過保守性分析這個橋梁,把人和小鼠的TUC40- 聯(lián)系起來,推測TUC40- 可能與人和小鼠的胚胎心臟發(fā)育及室缺發(fā)生有關(guān),并可能是通過調(diào)控Pbx1來實現(xiàn)的,但以上推測尚需要進一步功能學實驗證明。
參考文獻
[1]Stankunas K,Shang C,Twu KY,et al. Pbx/Meis deficiencies demonstrate multigenetic origins of congenital heart disease[J]. Circ Res,2008,103(7):702- 709.
[2]Chang CP,Stankunas K,Shang C,et al. Pbx1 functions in distinct regulatory networks to pattern the great arteries and cardiac outflow tract[J]. Development,2008,135(21):3577- 3586.
[3]Ho ECH,Donaldson ME,Saville BJ. Detection of antisense RNA transcripts by strand-specific RT-PCR[J]. Methods Mol Biol,2010,630:125- 138.
[4]Kung JTY,Colognori D,Lee JT. Long noncoding RNAs:past,present,and future[J]. Genetics,2013,193(3):651- 669.
[5]Bejerano G,Pheasant M,Makunin I,et al. Ultraconserved elements in the human genome[J]. Science,2004,304(5675):1321- 1325.
[6]Calin GA,Liu C,F(xiàn)erracin M,et al. Ultraconserved regions encoding ncRNAs are altered in human leukemias and carcinomas[J]. Cancer Cell,2007,12(3):215- 229.
[7]Basu S,Muller F,Sanges R. Examples of sequence conservation analyses capture a subset of mouse long non-coding RNAs sharing homology with fish conserved genomic elements[J]. BMC Bioinformatics,2013,14 (Suppl 7):S14.
[8]Belyi VA,Ak P,Markert E,et al. The origins and evolution of the p53 family of genes[J]. Cold Spring Harb Perspect Biol,2010,2(6):a001198. doi:10.1101/cshperspect.a001198.
[9]Dai Y,Li S,Dong X,et al. The de novo sequence origin of two long non-coding genes from an inter-genic region[J]. BMC Genomics,2013,14(Suppl 8):S6. doi:10.1186/1471- 2164- 14-S8-S6.
[10]Werner A. Biological functions of natural antisense transcripts[J]. BMC Biol,2013,11:31. doi:10.1186/1741- 7007- 11- 3.
[11]Faghihi MA,Modarresi F,Khalil AM,et al. Expression of a noncoding RNA is elevated in Alzheimer’s disease and drives rapid feed-forward regulation of beta-secretase[J]. Nat Med,2008, 14(7):723- 730.
Bioinformatic and Expression Analysis of Ventricular Septal Defect-associated Long Non-coding RNA TUC40-
LI Hui-juan1,JIANG Li1,YU Zhang-bin2,HAN Shu-ping2,LIU Xue-hua2
1Department of Pediatrics,Zhongda Hospital,Southeast University,Nanjing 210009,China2Department of Pediatrics,Nanjing Maternity and Child Health Care Hospital, Nanjing Medical University,Nanjing 210004,China Corresponding author:YU Zhang-binTel/Fax:025- 52226561,E-mail:zhangbinyu@njmu.edu.cn
ABSTRACT:ObjectiveTo explore the potential role of TUC40- in human and mouse embryonic heart development. MethodsBioinformatics databases including NCBI,UCSC,and Uniprot and software including Clustal,DNAMAN,and MEGA 6 were used to collect information of TUC40- and uc.40-. The expression profile at key time points of heart development was investigated by strand-specific quantitative real time polymerase chain reaction. ResultsUc.40- was conservative in sequence,genomic location,and transcription factor binding sites across human and mouse. Pbx1/TUC40- showed negative trend during embryonic mouse heart maturation. ConclusionsVarious levels of conservation of uc.40- suggests similar functions of TUC40- in these two species. TUC40- may play its roles in human and mouse embryonic heart development by regulating Pbx1.
Key words:long non-coding RNA;bioinformatics;conservation;expression profile;ventricular septal defect
(收稿日期:2015- 03- 23)
DOI:10.3881/j.issn.1000- 503X.2016.01.001
中圖分類號:Q752
文獻標志碼:A
文章編號:1000- 503X(2016)01- 0001- 08
通信作者:余章斌電話/傳真:025- 52226561,電子郵件:zhangbinyu@njmu.edu.cn
基金項目:國家自然科學基金(81470376)、江蘇省自然科學基金(BK20141077)和南京市醫(yī)學科技發(fā)展資金(YKK14123)Supported by the National Natural Sciences Foundation of China(81470376),the Natural Science Foundation of Jiangsu Province(BK20141077),and the Medicine and Technology Development Foundation of Nanjing(YKK14123)