劉 青,潘浩研,黃家麗,JOHN Seymour Heslop Harrison
(1中國科學(xué)院 華南植物園,植物資源保護(hù)與可持續(xù)利用重點(diǎn)實(shí)驗(yàn)室,廣東 廣州 510650;2 中國科學(xué)院 核心植物園,廣東 廣州 510650;3 中國科學(xué)院大學(xué),北京 100049;4 華南農(nóng)業(yè)大學(xué) 生命科學(xué)學(xué)院,廣東 廣州 510642;5 萊斯特大學(xué) 遺傳學(xué)和基因組生物學(xué)系,英國 萊斯特 LE1 7RH)
核型分析(karyotype)是一種基于物種特有的一組或一套染色體,來構(gòu)建染色體形態(tài)學(xué)模式圖的研究方法,其在細(xì)胞遺傳學(xué)、分類學(xué)、染色體工程學(xué)中應(yīng)用廣泛[1]。常規(guī)核型分析按照體細(xì)胞分裂中期的染色體長度、臂比、著絲點(diǎn)位置以及核型表達(dá)模式來進(jìn)行分類[2-3]。然而對于染色體數(shù)目較多,或單條染色體間區(qū)別特征不明顯的物種,通過傳統(tǒng)核型分析無法識別該物種所有染色體。
隨著電子顯微鏡發(fā)明和計算機(jī)技術(shù)的進(jìn)步,其促生了染色體顯帶技術(shù)(chromosome banding)。這是一種通過顯帶染色處理,使染色體一定部位顯示出深淺不同的帶紋,從而來分辨染色體細(xì)微特征的方法[4]。常見的有Q帶[5]、C帶[6]、N帶[7]、G帶[8]。熒光原位雜交(fluorescent in situ hybridization,F(xiàn)ISH)技術(shù)是一種基于堿基互補(bǔ)配對原則,采用熒光素標(biāo)記DNA或RNA探針,再與單鏈的靶DNA或RNA分子雜交的方法[9]。染色體熒光顯帶(chromosome fluorochrome banding)技術(shù)是FISH技術(shù)的補(bǔ)充,該技術(shù)中常用復(fù)染劑的作用機(jī)理與DNA分子的堿基組成有關(guān),如4′,6-二脒基-2-苯基吲哚(4′,6-diamidino-2-phenylindole,DAPI)和色霉素A3(chromomycin A3,CMA3)可分別結(jié)合雙鏈DNA中的AT和CG堿基對,顯示染色體的特異標(biāo)記信息[10]。
目前針對葫蘆科、秋英屬(Cosmos)等部分物種已開展染色體分子核型研究[11-12]。根據(jù)染色體形態(tài)特征,已解決茄屬(Solanum)、松屬(Pinus)種間親緣關(guān)系、柚(Citrusmaxima)的基因組核型鑒定問題[13-15]。但對于基因組內(nèi)染色體小且形態(tài)相似,或者基因組間分化程度小的物種鑒定,該方法尚有缺陷。如孫桂芳等[12]對秋英屬波斯菊(Cosmosbipinnata)與硫華菊(Cosmossulphureus)物種進(jìn)行了研究,發(fā)現(xiàn)品種“風(fēng)景(Scenery)”和“優(yōu)雅(Elegant)”與“凱萊(Sensation Gloria)”和“白蛋撻(Cupcakes White)”的核型不對稱系數(shù)相似,但卻屬于2個完全不同的形態(tài)種。
基因組學(xué)技術(shù)的飛速發(fā)展使作物科學(xué)理論與技術(shù)不斷實(shí)現(xiàn)新突破。全球30%的作物增產(chǎn)得益于野生近緣種在作物育種中的應(yīng)用[16],作物野生種的遺傳多樣性呈現(xiàn)動態(tài)變化,因此一些潛在應(yīng)用價值和適應(yīng)意義,以及只有在特定環(huán)境下表達(dá)的隱藏遺傳變異很難被發(fā)現(xiàn)。研究表明,不同作物基因組大小差異較大,但其二倍體野生種中基因數(shù)量相似,均為3萬~4萬個[17],這可為植物染色體進(jìn)化研究提供遺傳標(biāo)記?;蚪M數(shù)據(jù)的積累,提供了越來越多染色體組型及帶型的DNA序列信息,也因此推動了遺傳標(biāo)記開發(fā)的研究[18]。文章綜述了利用單拷貝序列染色體涂染(single-copy sequence based chromosome painting)和寡核苷酸熒光原位雜交(oligonucleotide-FISH,Oligo-FISH)技術(shù)合成新型探針池的方法,總結(jié)其在比較基因組學(xué)研究中的應(yīng)用案例,以期為植物染色體分子核型研究提供參考。
染色體核型(karyotype)分析是指一個物種的染色體組在有絲分裂中期的表型,包括染色體數(shù)目、長度、著絲點(diǎn)位置、臂比、隨體有無等特征總和,是細(xì)胞遺傳學(xué)領(lǐng)域最基礎(chǔ)的研究內(nèi)容[2]。核型分析可以為細(xì)胞遺傳分類、物種間親緣關(guān)系以及染色體重組研究提供重要依據(jù)[19]。目前新技術(shù)正在被運(yùn)用到核型分析中,特別是它與基因組學(xué)的結(jié)合日益緊密,建立染色體核型主要有根尖壓片法和熒光原位雜交技術(shù)。
植物細(xì)胞有絲分裂中期染色體標(biāo)本的制備通常采用根尖壓片法[2,20],對根尖進(jìn)行預(yù)處理、固定、解離[21-22],在顯微鏡下觀察染色體數(shù)量和形態(tài)特征。用Adobe Photoshop[23]等軟件統(tǒng)計染色體長度、臂比、著絲粒指數(shù)及核型不對稱系數(shù)[19,24-25],以推測物種親緣關(guān)系[26]與染色體重組[27]。如張超等[20]采用根尖壓片法,發(fā)現(xiàn)三倍體在山西太行山野生萱草(Hemerocalisfulva)中廣泛存在,提出核型不對稱系數(shù)與染色體倍性無關(guān)。張穎等[26]發(fā)現(xiàn)8個樣地的假臭草(Praxelisclematidea)具有4種不對稱核型,說明地理距離影響了假臭草的核型進(jìn)化。Medeiros-Neto等[27]提出蘭科植物不對稱核型可能是染色體重組的原因之一。
采用FISH技術(shù)[28]可以鑒定作物外源遺傳物質(zhì)[29-30],判斷染色體間配對關(guān)系[31-32],闡明物種間親緣關(guān)系[33],并提高核型分析的精細(xì)程度[34-35],有助于深入了解基因組結(jié)構(gòu)和進(jìn)化關(guān)系,輔助基因組組裝積累資源,有效地推動了核型分析工作。如王坤波等[36]采用亞洲棉(Gossypiumarboreum)總DNA對海島棉(Gossypiumbarbadense)體細(xì)胞染色體進(jìn)行FISH試驗(yàn),明確了四倍體棉A與D亞基因組染色體長度的差別。Liu等[37]發(fā)現(xiàn)燕麥(Avenasativa)染色體具有C、A、D 3個亞基因組核型,且亞基因組間有頻繁易位現(xiàn)象(圖1)。
鑒定植物單條染色體是染色體進(jìn)化研究的里程碑。在植物中應(yīng)用最普遍的是物種間高度保守的基因家族核糖體RNA基因(rDNA),包括18S-5.8S-25S rDNA(簡稱45S rDNA),或其轉(zhuǎn)錄單元內(nèi)的一部分,如25S rDNA以及5S rDNA,此外還有端粒相關(guān)序列(telomere-associated sequences, TAS)、著絲粒區(qū)域特異重復(fù)序列和微衛(wèi)星序列。利用以上探針組合,黑麥(Secalecereale)、小麥(Triticumaestivum)、短柄草(Brachypodiumdistachyon)和燕麥(Avenasativa)中的部分染色體和染色體區(qū)域得以分辨[38-41]。但由于缺乏染色體水平基因組數(shù)據(jù),因此尋找單條染色體上特異的重復(fù)序列位點(diǎn)相當(dāng)困難。隨著基因組測序技術(shù)進(jìn)步和成本逐漸降低,部分植物類群已實(shí)現(xiàn)了單染色體鑒定,主要采用單拷貝基因染色體涂染技術(shù)和寡核苷酸熒光原位雜交技術(shù)完成。
單拷貝基因染色體涂染技術(shù)可為構(gòu)建細(xì)胞學(xué)圖譜提供直接證據(jù)。Lou等[42]采用單拷貝基因染色體涂染技術(shù),糾正了黃瓜(Cucumissativus)4號染色體遠(yuǎn)端約2.16 Mb的基因組組裝錯誤。Wang等[43]標(biāo)記9個單拷貝基因片段,用FISH技術(shù)完成了玉米(Zeamays)9號染色體上的基因定位。Danilova等[44]采用單拷貝基因染色體涂染技術(shù),發(fā)現(xiàn)了小麥A基因組特異的染色體間易位(T4AL/5AL和3AtL/4AtL)。這些研究均采用單拷貝基因染色體涂染技術(shù)驗(yàn)證了基因組序列組裝結(jié)果,實(shí)現(xiàn)了核型精細(xì)結(jié)構(gòu)分析。
寡核苷酸熒光原位雜交技術(shù)(Oligo-FISH)在植物基因組內(nèi)單條染色體識別和染色體特定區(qū)域鑒定中獨(dú)具優(yōu)勢[45]。最早該技術(shù)被應(yīng)用于大麥(Horedeumvulgare)和黑麥端粒序列的定位研究[46],1995年Doudrick等[47]用寡核苷酸熒光原位雜交技術(shù)開展?jié)竦厮?Pinuselliottiivar.elliottii) rDNA序列的定位研究,1996年Kamm等[48]完成了Tyl-copia反轉(zhuǎn)座子元件和rRNA序列在濕地松染色體上的定位研究。1997年在白云杉(Piceaglauca)和北美云杉(Piceasitchensis)基因組結(jié)構(gòu)研究中,首次提到分子核型(molecular karyotype)的概念[49],標(biāo)志著植物染色體進(jìn)化研究進(jìn)入分子核型時代。研究者對寡核苷酸熒光原位雜交技術(shù)進(jìn)行優(yōu)化,高分辨率多重寡核苷酸熒光原位雜交技術(shù)和非變性寡核苷酸原位雜交(non-denaturing fluorescent in situ hybridization,ND-FISH)技術(shù)逐漸得以應(yīng)用。
Cui等[50]采用多重寡核苷酸熒光原位雜交技術(shù)鑒定了小麥、中間偃麥草(Thinopyrumintermedium)單條染色體。Huang等[51]采用高分辨率多重寡核苷酸熒光原位雜交技術(shù),在148個中國小麥品種中發(fā)現(xiàn)了14個結(jié)構(gòu)重組以及167個多態(tài)染色體區(qū)域。寡核苷酸熒光原位雜交技術(shù)還推動了基因組學(xué)的進(jìn)步。Zhou等[52]對人參(Panaxginseng)開展了寡核苷酸熒光原位雜交研究,鑒定了人參基因組結(jié)構(gòu),追溯了人參的起源及分化歷史。Piperidis等[53]采用Oligo-FISH技術(shù)分析了甘蔗屬(Saccharum)不同品種及候選親本物種的基因組結(jié)構(gòu),揭示甜根子草(S.spontaneum) 5號染色體與甘蔗(S.officinarum) 8號染色體之間發(fā)生了易位事件。Liu等[45]采用Oligo-FISH技術(shù)發(fā)現(xiàn),野生稻3號染色體一個片段易位到5號染色體上,并鑒定了水稻不同品系非整倍體染色體的起源。Agrawal等[54]采用Oligo-FISH技術(shù)完成了蕓苔屬蔓菁(Brassicarapa)的單染色體鑒定。因此,Oligo-FISH技術(shù)在染色體進(jìn)化研究中逐漸成為應(yīng)用主流。
另外,也有研究采用ND-FISH方法來鑒定植物外源染色體。Fu等[55]將Oligo-1162、Oligo-pSc200和Oligo-pSc250探針用于ND-FISH研究,代替黑麥基因組DNA探針,以區(qū)分黑麥和小麥染色體。Ren等[56]采用5種寡核苷酸探針,鑒定了小麥全部染色體。An等[57]采用ND-FISH方法鑒定小麥WR35的B和D基因組以及B和A基因組之間發(fā)生的染色體易位事件。以上研究說明利用ND-FISH方法能夠鑒別染色體來源和結(jié)構(gòu)變異。
單拷貝序列染色體涂染技術(shù)對所標(biāo)記片段的長度有限制,一般應(yīng)在10 kb以下,且在實(shí)驗(yàn)操作以及探針設(shè)計上有兩點(diǎn)需要注意:一是為得到覆蓋整條染色體的遺傳標(biāo)記,須設(shè)計細(xì)菌人工染色體(bacterial artificial chromosome,BAC)片段,這需要耗費(fèi)大量時間和較高的PCR擴(kuò)增成本[58];二是對于重復(fù)序列占比較高且染色體數(shù)目較多的植物,單拷貝片段篩選往往成為技術(shù)瓶頸[4,59]。為解決上述難題,需要已知染色體水平的正確組裝序列,篩選每條染色體上足夠數(shù)量的單拷貝序列,保證篩選的序列信號達(dá)到可視化[46]。寡核苷酸熒光原位雜交技術(shù)是鑒定復(fù)雜基因組植物單染色體的前沿技術(shù),可有效解決這些問題。
與傳統(tǒng)探針相比,寡核苷酸探針庫對無參考基因組的植物具有重要應(yīng)用價值,依據(jù)某種植物基因組設(shè)計的寡核苷酸探針可在其近緣物種中得到應(yīng)用。如Han等[58]采用黃瓜(Cucumissativus) Oligos探針庫鑒定了野生黃瓜的單條染色體;Braz等[60]使用陽芋(Solanumtuberosum) Oligos探針庫,在番茄(Solanumlycopersicum)染色體上得到了特異染色體信號。Tang等[61]使用Oligo-pAs1-1探針,對小麥和小麥×黑麥雜交種進(jìn)行了FISH研究,極大地節(jié)約了成本。寡核苷酸探針庫還可用于鑒別多倍體物種同源染色體之間的親緣關(guān)系,如四倍體柳枝稷(Panicumuirgatum)染色體對4a與4b(同源序列大于90%),其寡核苷酸探針庫FISH信號強(qiáng)度大于染色體對8a與8b(同源序列大于70%)[62],證明同源序列占比高的FISH結(jié)果相對準(zhǔn)確,在異源多倍體植物染色體進(jìn)化研究中獨(dú)辟蹊徑。
寡核苷酸熒光原位雜交技術(shù)受到眾多研究者青睞,是因?yàn)槠溆腥缦聝?yōu)點(diǎn):(1) 單拷貝序列的特異性高。設(shè)計探針時可以去除基因組中的重復(fù)序列(包括同源序列、rDNA、葉綠體DNA等),不加封阻DNA也不會產(chǎn)生背景信號。(2) 可以準(zhǔn)確識別染色體精細(xì)結(jié)構(gòu)。因寡核苷酸探針短,因此可牢固地結(jié)合染色體上的目標(biāo)區(qū)域。(3) 探針庫設(shè)計靈活。通過生物信息學(xué)軟件分析染色體水平基因組數(shù)據(jù),即可獲得不同探針庫。(4) 探針庫穩(wěn)定性強(qiáng)。該技術(shù)適用于跨物種熒光原位雜交,如水稻(Oryzasativa)、黃瓜(Cucumissativus)、雷蒙德氏棉(Gossypiumraimondii)等已實(shí)現(xiàn)單染色體準(zhǔn)確鑒定[45,58,63]。因此,寡核苷酸熒光原位雜交技術(shù)成為單染色體圖譜構(gòu)建不可替代的技術(shù)[60]。
但在Oligo-FISH技術(shù)應(yīng)用中,探針數(shù)目多少決定著信號質(zhì)量的優(yōu)劣。有研究者認(rèn)為,中期染色體寡核苷酸探針密度為0.1~0.5 oligos/kb較為合適;對于小于10 kb的目標(biāo)區(qū)域需選擇盡可能多的寡核苷酸短片段[62]。對于大型基因組或者高比例重復(fù)序列的植物而言,篩選特異探針庫的難度較大。這是因?yàn)橹貜?fù)序列占比較高時,寡核苷酸探針密度下降,在染色體上的熒光強(qiáng)度也隨之下降,導(dǎo)致寡核苷酸信號檢測相對困難。如果信號放大,在非目標(biāo)基因序列中則可能出現(xiàn)背景信號(非特異雜交片段),導(dǎo)致假陽性。如劉玉玲等[63-64]采用地高辛標(biāo)記的雷蒙德氏棉D(zhuǎn)501染色體探針庫的信號結(jié)果相對彌散,某些區(qū)域可能是假陽性。因此,設(shè)計優(yōu)質(zhì)探針庫是應(yīng)用寡核苷酸原位雜交技術(shù)的關(guān)鍵。前期研究發(fā)現(xiàn),選擇目標(biāo)區(qū)域時應(yīng)遵循以下規(guī)則:(1) 盡量避開重復(fù)序列占比較高的染色體區(qū)域[37]。(2) 設(shè)計的寡核苷酸序列GC含量在30%~66%。(3) 寡核苷酸(短)片段內(nèi)相同堿基連續(xù)重復(fù)數(shù)目一般不多于6個。(4) 寡核苷酸片段與非目標(biāo)區(qū)域(或片段)的相似度不高于80%。(5) 寡核苷酸片段的退火溫度與潛在發(fā)夾結(jié)構(gòu)退火溫度之差大于10 ℃。
染色體上的編碼基因是作物改良的“密碼本”,單染色體鑒定是作物改良的基礎(chǔ),因此單染色體鑒定是染色體進(jìn)化研究的必然趨勢。單拷貝基因染色體涂染技術(shù)可用于鑒定單染色體,在重復(fù)序列占比較高的植物中應(yīng)用效果較好。如大麥基因組重復(fù)序列達(dá)80%以上[65],采用單拷貝基因染色體涂染技術(shù),分析大麥(H.vulgare)和球莖大麥(H.bulbosum) 3H染色體共線性[66],揭示了單拷貝序列探針對染色體特殊結(jié)構(gòu)鑒定的應(yīng)用價值。
除單拷貝基因染色體涂染外,植物染色體分子核型的輔助標(biāo)記還有重復(fù)DNA序列和低拷貝短序列。例如2019年楊婷等[67]用來源于黑麥近端粒區(qū)域的pSc200與pSc250重復(fù)序列進(jìn)行原位雜交,鑒定了林保小黑麥(Triticalerimpau)14條染色體。曾艷華等[68]用重復(fù)序列對自交系300玉米(Zeamays)開展熒光原位雜交試驗(yàn),發(fā)現(xiàn)了10條染色體有較強(qiáng)信號。周湘英[69]使用A基因組重復(fù)序列pAs120a鑒定了燕麥A基因組14條染色體。雖然重復(fù)序列熒光原位雜交可以有效地區(qū)分染色體組,但利用重復(fù)序列無法鑒定單條染色體。對于重復(fù)序列占比較高的植物單染色體進(jìn)行鑒定,亟待開發(fā)物種通用寡核苷酸庫,這是該領(lǐng)域未來研究的主要方向。
未來植物染色體分子核型研究需要關(guān)注的重點(diǎn)有:(1) 提高基因組裝配準(zhǔn)確度,包括重復(fù)序列庫及著絲粒和端粒區(qū)域(序列)的鑒定。(2) 提高單拷貝探針序列的特異性,前期試驗(yàn)證明,含有同源序列探針、探針密度低等均是造成探針庫特異性不高的主要原因[45,54],因此應(yīng)該選擇多于2 000個寡核苷酸片段的目標(biāo)區(qū)域,且同源序列≤80%的短片段集合設(shè)計探針庫。(3) 為鑒定染色體組間及染色體內(nèi)部的重組變異,目標(biāo)區(qū)域應(yīng)該定位在染色體重組熱點(diǎn)區(qū)域,以便提供染色體間或者染色體內(nèi)部的重組證據(jù)。(4)染色體分子核型研究亟需多物種研究的案例積累,并深入研究探針設(shè)計策略,以實(shí)現(xiàn)精準(zhǔn)識別單條染色體及染色體特定區(qū)域重組變異。
志謝:感謝揚(yáng)州大學(xué)龔志云和張韜教授提供寡核苷酸引物設(shè)計方法。