賀玉姣 胡萬軍 都玉蓉 王 婷 杜 雷 胡書立
(1.青海省青藏高原藥用動(dòng)植物資源重點(diǎn)實(shí)驗(yàn)室,青海師范大學(xué)生命科學(xué)學(xué)院,西寧,810008;2.青海師范大學(xué)體育學(xué)院,西寧,810008)
高原鼠兔(Ochotonacurzoniae)是一種小型哺乳動(dòng)物(Mammalia),隸屬于兔形目(Lagomorpha),鼠兔科(Ochotonidae),鼠兔屬,主要生活在海拔3 000—5 100 m的高寒草原和高寒草甸,是青藏高原的優(yōu)勢(shì)種[1]。高原鼠兔一方面在維持青藏高原的生物多樣性、草原生態(tài)系統(tǒng)中食物鏈的平衡等方面起到重要作用,被認(rèn)為是青藏高原生態(tài)系統(tǒng)的關(guān)鍵種[2]。另一方面,在青藏高原的一些地區(qū)由于草地退化提高了嚙齒動(dòng)物(Rodentia)生境適合度,導(dǎo)致高原鼠兔種群密度過高,造成鼠害[3]。通過對(duì)高原鼠兔的種群遺傳分析有助于了解該物種的種群結(jié)構(gòu),設(shè)立管理與保護(hù)單元,從而控制其種群數(shù)量[4]。而目前對(duì)高原鼠兔種群遺傳的分析大多是通過線粒體基因進(jìn)行的,基于核基因的相關(guān)分析則較少[5-6]。
SSR(simple sequence repeats)又稱微衛(wèi)星,是一類由幾個(gè)核苷酸(1—6 bp)組成的串聯(lián)重復(fù)DNA序列,廣泛分布于真核生物和部分原核生物的核基因中[7]。SSR標(biāo)記的高突變速率通常會(huì)產(chǎn)生高水平的多態(tài)性,同時(shí)它還具有進(jìn)化所受選擇壓力小、共顯性遺傳、易于分析、較好的重復(fù)性等特點(diǎn),使其廣泛應(yīng)用于遺傳多樣性、種群遺傳結(jié)構(gòu)等的研究中[8]。傳統(tǒng)的SSR篩選方法,如富集文庫篩選法,實(shí)驗(yàn)操作繁瑣,篩選效率往往較低[9]。Li等[10]通過磁珠富集法對(duì)高原鼠兔的SSR進(jìn)行分析僅得到13對(duì)引物。而隨著高通量測(cè)序技術(shù)的發(fā)展,可以通過基因組、轉(zhuǎn)錄組等數(shù)據(jù),對(duì)樣本的SSR進(jìn)行分析,得到大量SSR位點(diǎn)[11-13]。其中,簡(jiǎn)化基因組測(cè)序技術(shù)(RAD-seq)利用限制性內(nèi)切酶對(duì)基因組 DNA 進(jìn)行酶切,并對(duì)酶切片段進(jìn)行高通量測(cè)序,該技術(shù)極大地降低了基因組的復(fù)雜度,不受參考基因組的限制,且測(cè)序成本低、準(zhǔn)確率高[14],用此方法已經(jīng)在大刺鰍(Mastacembelusarmatus)、印尼虎魚(Datnioidespulcher)等動(dòng)物中開發(fā)出SSR標(biāo)記并應(yīng)用于遺傳研究[15-16]。本研究采用RAD-seq技術(shù)對(duì)高原鼠兔的SSR信息進(jìn)行分析,并進(jìn)行SSR引物的開發(fā),為基于SSR分子標(biāo)記開展的遺傳多樣性、種群遺傳分析等研究提供基礎(chǔ)資料。
試驗(yàn)所用8個(gè)高原鼠兔樣本采自青藏高原不同地區(qū)(表1),將鼠兔腿部肌肉組織置于2 mL離心管中,并用體積分?jǐn)?shù)95%的乙醇保存。
表1 高原鼠兔采樣位點(diǎn)信息
取約15 mg肌肉組織,用試劑盒(TIANamp Genomic DNA Kit,TIANGEN)提取基因組DNA,通過瓊脂糖檢測(cè)和NanoDrop 2000紫外分光光度計(jì)(Thermo Fisher Scientific,USA)對(duì)抽提DNA的質(zhì)量和濃度進(jìn)行檢測(cè)。
取3個(gè)檢驗(yàn)合格的基因組DNA樣本送至上海歐易生物醫(yī)學(xué)科技有限公司進(jìn)行簡(jiǎn)化基因組測(cè)序,所用的測(cè)序技術(shù)為Super GBS,試驗(yàn)流程為:限制性酶切→連接接頭→PCR擴(kuò)增→混合建庫→測(cè)序。
對(duì)原始數(shù)據(jù)進(jìn)行拼接、質(zhì)控,然后用Stacks軟件包(v 1.34)進(jìn)行聚類,根據(jù)聚類結(jié)果進(jìn)行組裝過濾,得到最終的重疊群。利用MISA軟件進(jìn)行SSR位點(diǎn)搜索,搜索標(biāo)準(zhǔn)為單堿基、二堿基、三堿基、四堿基、五堿基、六堿基,重復(fù)次數(shù)分別在10、6、5、5、5、5次以上,相鄰的SSR序列不少于100 bp。為了提高SSR的精度,取SSR與InDel的交集,條件為:①選取變異堿基數(shù)≥5的InDel;②InDel出現(xiàn)的位置位于SSR區(qū)域上下游5 bp內(nèi)。然后利用軟件Primer v3.2.5.0設(shè)計(jì)SSR引物。
從設(shè)計(jì)的引物中隨機(jī)挑選70對(duì)引物進(jìn)行合成,合成時(shí)為了減少熒光引物合成成本,在正向引物的5′端添加1個(gè)M13接頭序列。然后對(duì)8個(gè)高原鼠兔基因組DNA樣品進(jìn)行RCR擴(kuò)增。PCR擴(kuò)增體系為20.0 μL,包含2.0 μL 10×Taqbuffer(含Mg2+)(Takara,大連寶生物),5 U/μLTaqDNA聚合酶(Takara)0.2 μL,2.5 mmol/L dNTPs 2.0 μL,10 μmol/L上、下游引物各0.5 μL,0.2 μL總DNA,用滅菌超純水補(bǔ)至20.0 μL。
反應(yīng)參數(shù)設(shè)置為:95℃預(yù)變性8 min;95℃變性45 s,52—55℃退火45s,72℃延伸80s,35個(gè)循環(huán);最后72℃延伸7 min。反應(yīng)在伯樂熱循環(huán)PCR儀S1000(Bio-Rad,Hercules,CA,USA)上進(jìn)行。
對(duì)擴(kuò)增結(jié)果進(jìn)行毛細(xì)管電泳分型,利用GeneScan v3.1.2讀取數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行整理、分析。
高原鼠兔DNA的RAD-seq測(cè)序共獲得原始數(shù)據(jù)2.14 Gb,對(duì)數(shù)據(jù)進(jìn)行質(zhì)控、過濾后得到高質(zhì)量數(shù)據(jù)1.99 Gb(表2)。平均Q30(測(cè)序堿基質(zhì)量值,即測(cè)序時(shí)錯(cuò)誤識(shí)別的概率為0.1%、正確率為99.9% 的堿基比例)為89.11%,平均GC比例為50.47%,結(jié)果表明樣本的數(shù)據(jù)量足夠,測(cè)序數(shù)據(jù)的準(zhǔn)確可靠性較高,GC比例正常。
表2 高原鼠兔DNA的RAD-seq基因組測(cè)序結(jié)果
由表3可知,通過MISA軟件分析共檢測(cè)到7 064個(gè)SSR位點(diǎn),其中完全重復(fù)型(perfect)有6 806個(gè),占位點(diǎn)總數(shù)的96.35%,而復(fù)合型較少,僅有258個(gè),占總位點(diǎn)的3.65%。SSR位點(diǎn)中,單核苷酸重復(fù)基序最多,數(shù)量為3 260個(gè),占總位點(diǎn)的46.15%;其次為二核苷酸重復(fù)基序,數(shù)量為2 710個(gè),占總位點(diǎn)的38.37%;三核苷酸、四核苷酸和五核苷酸重復(fù)基序數(shù)量分別為535、256、40個(gè),分別占總位點(diǎn)的7.57%、3.62%和0.57%;六核苷酸數(shù)量最少,僅有5個(gè),占總位點(diǎn)的0.07%。在完全重復(fù)型SSR位點(diǎn)中,六核苷酸類型重復(fù)基序平均長度最長,可達(dá)到31 bp;單核苷酸類型重復(fù)基序的平均長度最短,為12 bp。在這些SSR位點(diǎn)中,單核苷酸重復(fù)SSR位點(diǎn)中A/T為優(yōu)勢(shì)基序,占該類型基序的98.22%;二核苷酸重復(fù)基序類型有11種,其中優(yōu)勢(shì)基序?yàn)锳G/TC,數(shù)量分別為392、433個(gè);三核苷酸重復(fù)基序有50種,AAC/TTG為主要基序;四核苷酸重復(fù)基序的種類數(shù)在完全重復(fù)型中最多,達(dá)83種,其中AAAC/TTTG為主要基序;五核苷酸和六核苷酸的重復(fù)基序類型數(shù)量分別為30和3,主要基序分別為AAAAC/CAAAA和CCTCAC/GCAGGA。
表3 高原鼠兔簡(jiǎn)化基因組中SSR位點(diǎn)信息
高原鼠兔基因組不同類型SSR位點(diǎn)基序的重復(fù)次數(shù)如表4所示。單核苷酸的基序重復(fù)次數(shù)主要集中在10—14次;二核苷酸基序的SSR主要集中在6—9次重復(fù);三核苷酸基序的SSR主要為5—6次重復(fù);四核苷酸、五核苷酸、六核苷酸基序的SSR均為4次重復(fù)。
表4 高原鼠兔不同類型及不同重復(fù)次數(shù)的SSR位點(diǎn)基序的分布數(shù)量
在獲得的7 064個(gè)高原鼠兔SSR位點(diǎn)中,通過取SSR與InDel的交集,獲得182處符合條件的SSR區(qū)域,并最終設(shè)計(jì)出90對(duì)引物。隨機(jī)選取70對(duì)引物,對(duì)8個(gè)高原鼠兔樣本DNA進(jìn)行擴(kuò)增,其中無條帶或主條帶不明顯的有7對(duì),有條帶但無多態(tài)性的引物有3對(duì),有18對(duì)引物在8個(gè)DNA樣本的檢測(cè)中僅有2種多態(tài)性,其余42對(duì)引物具有單一條帶,且多態(tài)性較好,占總檢測(cè)引物的60%,引物具體信息如表5所示。
表5 42對(duì)具有單一條帶的高原鼠兔多態(tài)性SSR引物信息
續(xù)表5
目前SSR標(biāo)記的篩選方法主要有比較基因組法、微衛(wèi)星富集文庫法和基于組學(xué)的篩選法等,其中比較基因組法需要先獲取近緣種微衛(wèi)星位點(diǎn)信息,且不能篩選出該物種特有的微衛(wèi)星,而富集文庫篩選法前期需要進(jìn)行SSR序列的富集及文庫構(gòu)建等復(fù)雜、繁瑣的實(shí)驗(yàn)操作流程[17-18]。本研究使用簡(jiǎn)化基因組測(cè)序技術(shù)對(duì)高原鼠兔的SSR位點(diǎn)進(jìn)行篩選,既簡(jiǎn)化了操作流程,同時(shí)位點(diǎn)的篩選效率也高于磁珠富集文庫對(duì)高原鼠兔的篩選結(jié)果[10]。同為二代測(cè)序技術(shù)的轉(zhuǎn)錄組測(cè)序也被用于SSR標(biāo)記的篩選中,通過轉(zhuǎn)錄組測(cè)序技術(shù)獲得的SSR位點(diǎn)均位于基因的編碼區(qū),而SSR標(biāo)記大多位于非編碼區(qū),且該區(qū)域的SSR標(biāo)記通常具有更高的遺傳變異,簡(jiǎn)化基因組序列可以均勻分布在物種的基因組中,通過該技術(shù)可以獲得更多具有高變異SSR標(biāo)記[19]。另外,無論與微衛(wèi)星富集文庫篩選法,還是轉(zhuǎn)錄組測(cè)序技術(shù)相比,RAD-seq所需費(fèi)用都更低,因此該方法是針對(duì)目標(biāo)物種進(jìn)行特異性SSR標(biāo)記篩選的經(jīng)濟(jì)、實(shí)用的方法。
在高原鼠兔的SSR位點(diǎn)中,數(shù)量最多的核苷酸重復(fù)基序是單核苷酸,其次是二核苷酸,這與Tóth等[20]在嚙齒類動(dòng)物中發(fā)現(xiàn)的二堿基重復(fù)基序數(shù)量最多并不一致。同時(shí),高原鼠兔重復(fù)基序的類型也表現(xiàn)出一定的偏倚性,如二核苷酸重復(fù)基序中優(yōu)勢(shì)基序?yàn)锳G/TC;三核苷酸中AAC/TTG為主要基序,這也與其他物種存在差異[16,21],而重復(fù)序列的數(shù)量與類型所表現(xiàn)出的差異可能都與物種特異性有關(guān)。Zane等[19]認(rèn)為通常不將單堿基重復(fù)序列作為微衛(wèi)星位點(diǎn),應(yīng)排除這一類型基序,但在本研究的驗(yàn)證實(shí)驗(yàn)中,有7對(duì)引物擴(kuò)增的單堿基重復(fù)序列表現(xiàn)出明顯的單一條帶以及較好的多態(tài)性。
為節(jié)省熒光引物的設(shè)計(jì)成本,在驗(yàn)證實(shí)驗(yàn)中于正向引物上添加了M13接頭,但該接頭有可能會(huì)對(duì)引物的結(jié)構(gòu)和結(jié)合特異性產(chǎn)生一定影響,導(dǎo)致擴(kuò)增的失敗[21]。同時(shí)由于驗(yàn)證樣本僅有8個(gè),使得剩余的18對(duì)引物的多態(tài)性還需要進(jìn)一步驗(yàn)證,但總體來說用RAD-seq來篩選SSR標(biāo)記時(shí),在隨機(jī)選取的70對(duì)引物中,成功獲得了具有特異性單一條帶,且多態(tài)性較好的引物有42對(duì),占總數(shù)量的60%,表明具有較高的篩選效率。獲得的42對(duì)引物足夠滿足高原鼠兔遺傳多樣性,種群遺傳結(jié)構(gòu),譜系地理等問題的研究需求。