倪守勝 楊 鈺 柳淑芳 莊志猛
?
基于高通量測序的蝦夷扇貝基因組微衛(wèi)星特征分析*
倪守勝1,2,3楊 鈺1,2,4柳淑芳1,2①莊志猛1
(1. 農(nóng)業(yè)部海洋漁業(yè)可持續(xù)發(fā)展重點實驗室 中國水產(chǎn)科學(xué)研究院黃海水產(chǎn)研究所 青島 266071; 2. 青島海洋科學(xué)與技術(shù)國家實驗室 海洋漁業(yè)科學(xué)與食物產(chǎn)出過程功能實驗室 青島 266071; 3. 上海海洋大學(xué)水產(chǎn)與生命學(xué)院 上海 201306; 4. 大連海洋大學(xué)水產(chǎn)與生命學(xué)院 大連 116023)
為全面了解蝦夷扇貝()微衛(wèi)星分布頻率和數(shù)量,深化對蝦夷扇貝基因組的認(rèn)識,本研究運用第二代高通量測序技術(shù),進(jìn)行蝦夷扇貝簡化基因組測序(RAD-seq),從基因組水平闡明蝦夷扇貝基因組微衛(wèi)星特征。結(jié)果顯示,簡化基因組測序共獲得序列總長為92,551,435 bp,經(jīng)過濾篩選,獲得259,535個contig,其中,包含微衛(wèi)星序列3618條,經(jīng)引物設(shè)計共獲得3460對微衛(wèi)星引物。統(tǒng)計微衛(wèi)星序列的重復(fù)類型,其中,三核苷酸重復(fù)單元數(shù)量最多(1587個,45.87%),其次是二核苷酸重復(fù)(1282個,37.05%),六核苷酸重復(fù)單元數(shù)量最少(20個,0.58%)。在三核苷酸重復(fù)中,以ATA重復(fù)類型所占比例最高(11.41%),共計181個。此外,蝦夷扇貝同一重復(fù)類型的微衛(wèi)星隨著重復(fù)數(shù)增加其數(shù)量相對減少,而相同重復(fù)數(shù)的微衛(wèi)星隨著重復(fù)單元長度的增加其數(shù)量也呈下降趨勢,可見微衛(wèi)星長度與其數(shù)量呈負(fù)相關(guān),表明長度較短的微衛(wèi)星變異速率較快。本研究結(jié)果為認(rèn)識蝦夷扇貝基因組特征和在基因組水平開展種群遺傳學(xué)研究提供了基礎(chǔ)數(shù)據(jù)。
蝦夷扇貝;二代測序;基因組;微衛(wèi)星
微衛(wèi)星DNA(Simple sequence repeat, SSR),是由基本單元為1~6個核苷酸所構(gòu)成的簡單重復(fù)序列,是目前應(yīng)用較為廣泛的分子標(biāo)記之一(O′Connell, 1997),其穩(wěn)定性和可重復(fù)性高,特異性和共顯性強,現(xiàn)已應(yīng)用于生物遺傳多樣性分析、全基因組相關(guān)分析、分子標(biāo)記輔助育種等諸多方面(劉志毅等, 2001; Alam, 2005; Cavagnaro, 2010; Zhu, 2012; 王日芳等, 2017)。海洋生物的微衛(wèi)星篩選及多態(tài)性分析、利用微衛(wèi)星構(gòu)建連鎖圖譜和抗病相關(guān)標(biāo)記的連鎖分析等工作已陸續(xù)開展(趙瑩瑩等, 2006a、b; 李春艷等, 2009; Hou, 2011)。
蝦夷扇貝()自20世紀(jì)80年代引入中國,經(jīng)過幾十年的培育與發(fā)展,現(xiàn)已成為我國重要的海洋養(yǎng)殖物種。目前,已有采用分子標(biāo)記開展蝦夷扇貝種群遺傳研究的報道,如同工酶電泳技術(shù)(高悅勉等, 2003、2004)、AFLP(鮑相渤等, 2009; 丁君等, 2010)、SSR(Sato, 2005; 趙瑩瑩等, 2006b; 常亞青等, 2007; 李春艷等, 2009; Hou, 2011),而對蝦夷扇貝基因組水平上的微衛(wèi)星及其分布特征還知之甚少。本研究采用第二代高通量測序技術(shù)對蝦夷扇貝進(jìn)行簡化基因組測序(Restriction-site associated DNA sequencing, RAD-seq),通過對基因組中不同類型微衛(wèi)星的統(tǒng)計與分析,了解其微衛(wèi)星分布頻率和數(shù)量,從基因組水平闡明蝦夷扇貝基因組SSR特征及組成,對進(jìn)一步利用微衛(wèi)星開展遺傳標(biāo)記輔助育種和種群遺傳學(xué)研究具有重要的參考價值。
蝦夷扇貝于2015年7月采自我國北黃海獐子島蝦夷扇貝底播養(yǎng)殖海域,冰凍保存運送至實驗室,解剖處理,取蝦夷扇貝閉殼肌組織,存于–20℃?zhèn)溆谩?/p>
采用海洋動物組織基因組DNA提取試劑盒(離心柱型) (天根,北京)進(jìn)行基因組DNA的提取,瓊脂糖凝膠電泳初步檢測提取的DNA質(zhì)量,采用核酸蛋白分析儀檢測DNA濃度與純度,選取質(zhì)量較好的DNA樣品保存于–20℃?zhèn)溆谩?/p>
將所獲取的蝦夷扇貝DNA樣品送至北京諾禾致源生物信息科技有限公司進(jìn)行測序。DNA樣品通過隨機酶切打斷,經(jīng)末端修復(fù)、加A尾、加測序接頭、純化、PCR擴增等步驟完成整個RAD文庫的制備,構(gòu)建好的文庫通過Illumina(測序儀)進(jìn)行雙末端測序,測序個數(shù)乘以測序序列長度即為原始數(shù)據(jù)值。對原始數(shù)據(jù)進(jìn)行過濾:去除帶接頭(Adapter)的reads pair;去除單端測序read中含有的N(未讀堿基)含量超過該條read長度比例的10%的reads pair;去除單端測序read中含有的低質(zhì)量(≤5)堿基數(shù)超過該條read長度比例的50%的reads pair。對所得數(shù)據(jù)樣本含有的酶識別位點reads用cd-hit-est軟件(Li, 2006)進(jìn)行聚類,并保證每類中reads支持?jǐn)?shù)在10~400之間。根據(jù)聚類結(jié)果,用Velvetopt軟件(Zerbino, 2008)進(jìn)行組裝,得到最后的組裝序列,并對125 bp以下的contig進(jìn)行過濾。
使用SR search軟件(Rozen, 2000)對過濾所得的contig進(jìn)行簡單重復(fù)序列的檢測,檢測標(biāo)準(zhǔn)如下:(1) SSR重復(fù)的最小長度為2;(2) SSR重復(fù)的最大長度為6;(3) SSR序列的最小長度為12;(4) SSR上下游序列長度為100 bp;(5) 2個SSR的最小距離為12 bp。使用Primer 3軟件(Rozen, 2000)對鑒定出的含有SSR重復(fù)基元的序列片段進(jìn)行引物設(shè)計:引物的長度范圍為20~28,最適長度為24;引物退火溫度范圍為60~65℃,最適退火溫度為63℃,且一對引物退火溫度差值不超過1℃。
SSR分布密度()計算公式為:
=/
式中,為不同重復(fù)微衛(wèi)星分布密度(ind./Mb);為蝦夷扇貝基因組重疊群(contig)總長(Mb);為各重復(fù)類型微衛(wèi)星數(shù)量(ind.)。
SSR不同長度的分布頻率()計算公式為:
=/
式中,為不同長度微衛(wèi)星的分布頻率;為各長度微衛(wèi)星數(shù)量(ind.);為微衛(wèi)星總數(shù)量(ind.)。
測序結(jié)果共產(chǎn)生原始數(shù)據(jù)2.872 G,經(jīng)過濾后共獲得有效數(shù)據(jù)2.847 G (表1)。Illumina HiSeq產(chǎn)生的序列的堿基質(zhì)量用Qphred表示,Phred值為20和30,堿基正確識別率分別為99%和99.9%。本測序中Phred數(shù)值大于20和30的堿基占所有堿基的百分比分別為96.77%和92.66%,RAD-Tag捕獲率為93.07%,數(shù)據(jù)量符合預(yù)先設(shè)定,表明建庫成功,測序質(zhì)量合格。
表1 蝦夷扇貝簡化基因組測序主要數(shù)據(jù)
Tab.1 Mean data of reduced-representation genome sequencing in P. yessoensis
通過聚類組裝獲得序列總長度為92,551,435 bp,過濾掉小于125 bp的contig后獲得259,535個contig,其中,N50(將序列從大到小排列,當(dāng)長度達(dá)到組裝總長度一半時,contig的長度)的長度為419 bp,組裝基因組的平均覆蓋深度為14.55×,其中,4×覆蓋度在86.64%以上,GC含量為35.63%,拼接結(jié)果正常,拼接序列質(zhì)量較高。
通過對蝦夷扇貝基因組的序列進(jìn)行微衛(wèi)星查找,在蝦夷扇貝的高通量測序數(shù)據(jù)庫中進(jìn)一步搜索含有2~6重復(fù)單元的SSR,從總長為92,551,435 bp的259,535個contig中篩選出3618個潛在微衛(wèi)星位點,經(jīng)引物設(shè)計共獲得3460個微衛(wèi)星引物,利用微衛(wèi)星密度計算公式可得,平均26,748.97 bp出現(xiàn)1個SSR (表2)。由表2可以看出,蝦夷扇貝微衛(wèi)星各重復(fù)類型之間SSR數(shù)量均相差較大,各類型SSR分布密度差異明顯。所獲得的3460條微衛(wèi)星序列中,分布最多的重復(fù)類型為三核苷酸重復(fù)(45.87%);其次是二核苷酸重復(fù)(37.05%)、四核苷酸重復(fù)(14.48%)、五核苷酸重復(fù)(2.02%);分布最少的是六核苷酸重復(fù)(0.58%)。
表2 蝦夷扇貝不同重復(fù)類型微衛(wèi)星所占比例及分布密度
Tab.2 The proportion and density of different repeat types in SSR database of P. yessoensis
統(tǒng)計微衛(wèi)星各重復(fù)類型中不同重復(fù)單元的數(shù)量顯示,二核苷酸重復(fù)有12種重復(fù)單元,三核苷酸重復(fù)59種,四核苷酸重復(fù)100種,五核苷酸重復(fù)47種,六核苷酸重復(fù)20種。統(tǒng)計微衛(wèi)星各重復(fù)類型中不同重復(fù)單元的百分比(表3),在二核苷酸重復(fù)微衛(wèi)星中,AT/TA重復(fù)單元所占比例最高(79.17%),共計1015個;其次是TG/GT重復(fù)單元103個(8.03%)。在三核苷酸重復(fù)的微衛(wèi)星中,ATA重復(fù)單元所占比例最高(11.41%),共計181個;AAT、TAT、ATT、TAA這4種重復(fù)單元緊隨其后,分別有155個(9.77%)、150個(9.45%)、137個(8.36%)和120個(7.56%)。四核苷酸重復(fù)中每種重復(fù)單元所占比例相對均勻,其中,數(shù)量最多的為CAAA重復(fù)單元,共計48個,所占比例為9.58%。五核苷酸重復(fù)中,數(shù)量最多的重復(fù)單元為AAACC,共計11個,占比15.71%。六核苷酸重復(fù)共計20個,每一種重復(fù)單元僅有1個。
表3 蝦夷扇貝SSR重復(fù)單元的數(shù)量及百分比
Tab.3 The numbers and percentage of SSR repeat motifs in P. yessoensis
蝦夷扇貝基因組微衛(wèi)星長度范圍為12~36 bp,平均長度為14.96 bp。微衛(wèi)星長度分布頻率計算結(jié)果顯示,微衛(wèi)星長度越長其分布頻率越低,其中,12~16 bp的微衛(wèi)星占絕對優(yōu)勢,比例高達(dá)79.35% (圖1)。
圖1 蝦夷扇貝微衛(wèi)星長度分布及不同長度微衛(wèi)星頻率
針對蝦夷扇貝基因組微衛(wèi)星數(shù)量進(jìn)行分析發(fā)現(xiàn),當(dāng)同一重復(fù)類型的微衛(wèi)星隨著重復(fù)數(shù)增加其數(shù)量相對減少(表4縱向),而相同重復(fù)數(shù)的微衛(wèi)星隨著重復(fù)單元長度的增加其數(shù)量也呈下降趨勢(表4橫向),且隨著不同重復(fù)單元長度的增加其重復(fù)數(shù)范圍逐漸減小(表4)。如,二核苷酸重復(fù)單元按照重復(fù)數(shù)多少可分成11種,其中,重復(fù)數(shù)為6的二核苷酸重復(fù)單元數(shù)量有695,隨著重復(fù)數(shù)增加其數(shù)量逐漸減少,當(dāng)重復(fù)數(shù)增加至16時該重復(fù)單元的數(shù)量降至7;當(dāng)重復(fù)單元長度增加至六核苷酸時,該重復(fù)類型數(shù)量僅有20種??梢?,隨著重復(fù)單元長度的增加,微衛(wèi)星數(shù)量和重復(fù)數(shù)范圍均呈下降趨勢,推測蝦夷扇貝基因組中長度較短的微衛(wèi)星變異速率比長度較長的微衛(wèi)星變異速率快。
表4 蝦夷扇貝SSR不同重復(fù)數(shù)及不同重復(fù)類型的數(shù)量
Tab.4 The number of SSR with different repeat types and different copy number in P. yessoensis
本研究基于蝦夷扇貝基因組獲得有效SSR數(shù)目為3460個,其中出現(xiàn)頻率最高的為三核苷酸重復(fù)(45.87%),主要以ATA(11.41%)和AAT(9.77%)重復(fù)單元為主,然后依次是TAT、ATT、TAA重復(fù)單元;而二核苷酸重復(fù)中,則是以AT最多,其次為TA。Hou等(2011)采用454測序技術(shù)對蝦夷扇貝轉(zhuǎn)錄組進(jìn)行測序,在其轉(zhuǎn)錄組中搜索到的2748個SSR中,三核苷酸重復(fù)的頻率最高(39.4%),其次是二核苷酸重復(fù)(21.1%)、四核苷酸重復(fù)(15.5%)、五核苷酸重復(fù)(14.6%)和六核苷酸重復(fù)(9.4%)。可見,無論是在轉(zhuǎn)錄組還是基因組水平上,蝦夷扇貝微衛(wèi)星三核苷酸重復(fù)類型的出現(xiàn)頻率均最高。
通過二核苷酸、三核苷酸和四核苷酸3種重復(fù)類型中各重復(fù)單元對比研究,在各種長度的重復(fù)中,A/T都較G/C含量高很多,這與多數(shù)生物基因組微衛(wèi)星具有的特點相一致,如中國對蝦()微衛(wèi)星(高煥等, 2004),紅鰭東方鲀()微衛(wèi)星(崔建洲等, 2006),三疣梭子蟹()微衛(wèi)星(宋來鵬等, 2008)。生物基因組微衛(wèi)星富含A/T的可能原因是微衛(wèi)星序列A/T含量高,則T值降低,DNA鏈容易解開,通過DNA復(fù)制滑動機制和重組機制,產(chǎn)生富含AT重復(fù)類型的機率更高。此外,Schlotterer等(1992)認(rèn)為,基因組DNA因CpG甲基化的胞嘧啶C很容易經(jīng)過脫氨基作用轉(zhuǎn)變成胸腺嘧啶T,使其具有較高的突變可能性,并且少量的GC又是維持DNA熱力學(xué)穩(wěn)定性所必需的,一定程度上可解釋生物體基因組微衛(wèi)星中G/C含量如此之少的原因(黃杰等, 2015)。還有一種可能是,統(tǒng)計結(jié)果中GC重復(fù)過少也可能與GC重復(fù)的測序工作比較困難有關(guān)(高煥等, 2004)。具體原因,現(xiàn)今仍無定論,尚有待進(jìn)一步的研究探討。
對蝦夷扇貝基因組不同重復(fù)類型微衛(wèi)星的長度變異情況進(jìn)行分析,發(fā)現(xiàn)這些微衛(wèi)星的數(shù)量與重復(fù)長度成反比,微衛(wèi)星的數(shù)量隨著重復(fù)長度的增加而降低。Samadi等(1998)的模擬分析研究認(rèn)為,重復(fù)長度越長,經(jīng)受的選擇壓力越大,則它們的重復(fù)數(shù)就越少,數(shù)量越低。此外,在中國對蝦(高煥等, 2004)、紅鰭東方鲀(崔建洲等, 2006)、枸杞 () (黨少飛等, 2016)等不同種類的動植物基因組微衛(wèi)星的研究中也得到了相同的結(jié)論。這意味著蝦夷扇貝基因組中重復(fù)長度較短的微衛(wèi)星比重復(fù)長度較長的微衛(wèi)星變異速率快,為蝦夷扇貝進(jìn)一步的多態(tài)性微衛(wèi)星標(biāo)記篩選工作提供選擇方向和依據(jù)。
目前,比較成熟的微衛(wèi)星開發(fā)與篩選技術(shù)有磁珠富集法、構(gòu)建cDNA文庫篩選EST-SSR法以及基于二代測序的轉(zhuǎn)錄組測序和簡化基因組測序法。不同方法獲得微衛(wèi)星標(biāo)記數(shù)量不同,所體現(xiàn)出的分布特征也不盡相同。傳統(tǒng)的磁珠富集法篩選微衛(wèi)星標(biāo)記,獲得率較低,每次僅能獲得百余個微衛(wèi)星標(biāo)記,因其篩選探針多用二核苷酸重復(fù)的微衛(wèi)星序列,在富集過程中,磁珠經(jīng)過多個洗滌過程將一些因重復(fù)數(shù)目較少而附著不牢固的微衛(wèi)星序列洗去,僅能獲得較長序列的微衛(wèi)星標(biāo)記,因此,不能完全反映其微衛(wèi)星的分布情況(趙瑩瑩等, 2006a;李春艷等, 2009)。李云峰等(2010)通過構(gòu)建蝦夷扇貝cDNA文庫獲得74個EST-SSR,由于EST序列僅能反映轉(zhuǎn)錄加工后的mRNA信息,除去了許多內(nèi)含子和其他序列,因此,并不能反映基因組DNA的真實信息。隨著測序技術(shù)的發(fā)展,獲取效率高、技術(shù)難度低且花費成本與傳統(tǒng)方法相近的二代測序被廣泛應(yīng)用到微衛(wèi)星引物開發(fā)中,基于轉(zhuǎn)錄組或基因組進(jìn)行全部或部分高通量測序的方法可以獲得大量的核酸序列信息,微衛(wèi)星標(biāo)記的開發(fā)也就水到渠成,而且二代測序一次性開發(fā)標(biāo)記數(shù)據(jù)量大,可以比較完整地反應(yīng)物種的微衛(wèi)星分布特征。
由蝦夷扇貝基因組微衛(wèi)星特征分析得知,其三堿基重復(fù)類型微衛(wèi)星數(shù)量最多,在已開展基因組微衛(wèi)星開發(fā)的貝類中(表5),櫛孔扇貝() (Zhang, 2008)和三角帆蚌()(Bai, 2009)微衛(wèi)星數(shù)量最多的同樣為三堿基重復(fù)類型,而在馬氏珠母貝()(王忠良等, 2015)、里氏擬石磺()(吳欣等, 2015)、菲律賓蛤仔()(閆路路等, 2015)和文蛤()(Wang, 2011)中,卻呈現(xiàn)出單核苷酸重復(fù)數(shù)量最多,二核苷酸、三核苷酸和四核苷酸重復(fù)數(shù)量依次遞減的趨勢。而長牡蠣()(張琳琳等, 2011)的EST-SSR則呈現(xiàn)六核苷酸重復(fù)數(shù)目最多(851),單核苷酸次之(805),二核苷酸、三核苷酸和四核苷酸重復(fù)依次遞減的趨勢。由此可見,在已有貝類微衛(wèi)星研究中,各重復(fù)類型的微衛(wèi)星分布并未呈現(xiàn)較明顯的規(guī)律,產(chǎn)生這樣的結(jié)果,一方面可能是微衛(wèi)星開發(fā)手段不同而導(dǎo)致結(jié)果不同,另一方面,也可能是不同物種其微衛(wèi)星組成存在較大差異,這些都有待進(jìn)一步研究。
表5 不同貝類SSR分布特征
Tab.5 The characteristics of SSR distribution in different molluscs
Alam MS, Islam MS. Population genetic structure of(Hamilton) revealed by microsatellite DNA markers. Aquaculture, 2005, 246(1–4): 151–160
Bai Z, Yin Y, Hu S,. Identification of genes involved in immune response, microsatellite, and SNP markers from expressed sequence tags generated from hemocytes of freshwater pearl mussel (). Marine Biotechnology, 2009, 11(4): 520–530
Bao XB, Dong Y, He CB,. Studies of Japanese scallop () germplasm by using AFLP markers. Biotechnology Bulletin, 2009(4): 126–129 [鮑相渤, 董穎, 赫崇波, 等. 基于AFLP技術(shù)對中國蝦夷扇貝群體種質(zhì)資源的研究. 生物技術(shù)通報, 2009(4): 126–129]
Cavagnaro PF, Senalik DA, Yang L,. Genome-wide characterization of simple sequence repeats in cucumber (L.). BMC Genomics, 2010, 11(1): 569
Chang YQ, Chen XX, Ding J,. Genetic diversity in five scallop populations of the Japanese scallop (). Acta Ecologica Sinica, 2007, 27(3): 1145–1152 [常亞青, 陳曉霞, 丁君, 等. 蝦夷扇貝() 5個群體的遺傳多樣性. 生態(tài)學(xué)報, 2007, 27(3): 1145–1152]
Cui JZ, Shen XY, Yang GP,. Extraction, purification and chemical composition studies on fucodian from. Periodical of Ocean University of China (Natural Science Edition), 2006, 36(2): 249–254 [崔建洲, 申雪艷, 楊官品, 等. 紅鰭東方鲀基因組微衛(wèi)星特征分析. 中國海洋大學(xué)學(xué)報(自然科學(xué)版), 2006, 36(2): 249–254]
Dang SF, Wang ZL, Zhang DF,. Characteristic analysis of microsatellites of. Journal of Northwest Forestry University, 2016, 31(1): 97–102 [黨少飛, 王占林, 張得芳, 等. 枸杞基因組微衛(wèi)星特征分析. 西北林學(xué)院學(xué)報, 2016, 31(1): 97–102]
Ding J, Wang T, Chang YQ,. AFLP analysis on genetic diversity and differentiation of different populations of. Journal of Yantai University (Natural Science and Engineering Edition), 2010, 23(1): 47–53 [丁君, 王婷, 常亞青, 等. 基于AFLP技術(shù)的不同群體蝦夷扇貝遺傳結(jié)構(gòu)及多樣性研究. 煙臺大學(xué)學(xué)報(自然科學(xué)與工程版), 2010, 23(1): 47–53]
Gao H, Liu P, Meng XH,. Analysis of microsatellite sequences in Chinese shrimpgenome. Oceanologia et Limnologia Sinica, 2004, 35(5): 424– 431 [高煥, 劉萍, 孟憲紅, 等. 中國對蝦()基因組微衛(wèi)星特征分析. 海洋與湖沼, 2004, 35(5): 424–431]
Gao YM, Li GX, Zhao YL. Genetic structure of Japanese scallophatched population in Dalian Sea areas. Journal of Dalian Fisheries University, 2004, 19(2): 142–145 [高悅勉, 李國喜, 趙銀麗. 大連沿海蝦夷扇貝養(yǎng)殖群體遺傳結(jié)構(gòu)的研究. 大連水產(chǎn)學(xué)院學(xué)報, 2004, 19(2): 142–145]
Gao YM, Li GX. Biochemical genetic analysis of isozymes from. Journal of Dalian Fisheries University, 2003, 18(4): 269–272 [高悅勉, 李國喜. 蝦夷扇貝同工酶的生化遺傳分析. 大連水產(chǎn)學(xué)院學(xué)報, 2003, 18(4): 269–272]
Hou R, Bao ZM, Wang S,. Transcriptome sequencing and de novo analysis for Yesso scallop () using 454 GS FLX. PLoS One, 2011, 6(6): e21560
Huang J, Zhou Y, Liu YZ,. Characteristics of microsatellites ingenome sequences using 454 GS FLX. Sichuan Journal of Zoology, 2015, 34(1): 8–14 [黃杰, 周瑜, 劉與之, 等. 基于454 GS FLX高通量測序的四川山鷓鴣基因組微衛(wèi)星特征分析. 四川動物, 2015, 34(1): 8–14]
Li CY, Ding J, Chang YQ,. Isolation of microsatellite markers in Japanese scallop and its application in genetic structure analysis. Journal of Fishery Sciences of China, 2009, 16(1): 39–46 [李春艷, 丁君, 常亞青, 等. 蝦夷扇貝微衛(wèi)星標(biāo)記的分離及其養(yǎng)殖群體的遺傳結(jié)構(gòu)分析. 中國水產(chǎn)科學(xué), 2009, 16(1): 39–46]
Li WZ, Godzik A. Cd-hit: A fast program for clustering and comparing large sets of protein or nucleotide sequences. Bioinformatics, 2006, 22(13): 1658–1659
Li YF, Liu WD, Gao XG,. Construction of cDNA libraries from mantle and kidney of Japanese scallop () and ESTs analysis. Journal of Fishery Sciences of China, 2010, 17(3): 578–585 [李云峰, 劉衛(wèi)東, 高祥剛, 等. 蝦夷扇貝外套膜和腎臟組織cDNA文庫構(gòu)建以及EST的初步分析. 中國水產(chǎn)科學(xué), 2010, 17(3): 578–585]
Liu ZY, Xiang JH. Application of the microsatellite technique for genetic analysis in marine animals. Marine Sciences, 2001, 25(6): 11–13 [劉志毅, 相建海. 微衛(wèi)星DNA分子標(biāo)記在海洋動物遺傳分析中的應(yīng)用. 海洋科學(xué), 2001, 25(6): 11–13]
O'Connell M, Wright JM. Microsatellite DNA in fishes. Reviews in Fish Biology and Fisheries, 1997, 7(3): 331–363
Rozen S, Skaletsky H. Primer3 on the WWW for general users and for biologist programmers. Methods in Molecular Biology, 2000, 132(3): 365–386
Samadi S, Artiguebielle E, Estoup A,. Density and variability of dinucleotide microsatellites in the parthenogenetic polyploid snail. Molecular Ecology, 1998, 7(9): 1233–1236
Sato M, Kawamata K, Zaslavskaya N,. Development of microsatellite markers for Japanese scallop () and their application to a population genetic study. Marine Biotechnology, 2005, 7(6): 713–728
Schlotterer C, Tautz D. Slippage synthesis of simple sequence DNA. Nucleic Acids Research, 1992, 20(2): 211–215
Song LP, Liu P, Li J,. Analysis of microsatellite sequences in genome of crab,. Journal of Fishery Sciences of China, 2008, 15(5): 738–744 [宋來鵬, 劉萍, 李健, 等. 三疣梭子蟹基因組微衛(wèi)星特征分析. 中國水產(chǎn)科學(xué), 2008, 15(5): 738–744]
Wang HX, Huan P, Lu X,. Mining of EST-SSR markers in clamlarvae from 454 shotgun transcriptome. Genes and Genetic Systems, 2011, 86(3): 197–205
Wang RF, Li J, Li JT,. Genetic analysis of 33 microsatellite loci in 3 families ofinbred line. , Progress in Fisheries Science, 2017, 38(4): 78–86 [王日芳, 李健, 李吉濤, 等. 脊尾白蝦()近交系3個家系33個微衛(wèi)星座位的遺傳分析. 漁業(yè)科學(xué)進(jìn)展, 2017, 38(4): 78–86]
Wang ZL, Ding J, Xu YH,. Polymorphism of EST-SSRs frombased on transcriptome datasets. Oceanologia et Limnologia Sinica, 2015, 46(3): 687–693 [王忠良, 丁燏, 許尤厚, 等. 基于轉(zhuǎn)錄組數(shù)據(jù)的馬氏珠母貝EST-SSR位點的信息分析及其多態(tài)性檢測. 海洋與湖沼, 2015, 46(3): 687–693]
Wu X, Shen HD, Wang DF,. Development of microsatellite markers forbased on transcriptome sequencing Illumina HiseqTM 2000. Marine Sciences, 2015, 39(11): 20–25 [吳欣, 沈和定, 王冬鳳, 等.基于Illumina HiseqTM 2000高通量轉(zhuǎn)錄組測序的里氏擬石磺SSR標(biāo)記開發(fā). 海洋科學(xué), 2015, 39(11): 20–25]
Yan LL, Qin YJ, Yan XW,. Development of microsatellite markers inusing next-generation sequencing. Acta Ecologica Sinica, 2015, 35(5): 1573–1580 [閆路路, 秦艷杰, 閆喜武等.基于轉(zhuǎn)錄組平臺的蛤仔微衛(wèi)星標(biāo)記篩選. 生態(tài)學(xué)報, 2015, 35(5): 1573–1580]
Zerbino DR, Birney E. Velvet: Algorithms for de novo short read assembly using de Bruijn graphs. Genome Research, 2008, 18(5): 821–829
Zhang LL, Bao ZM, Wang S,. FISH mapping and identification of Zhikong scallop () chromosomes. Marine Biotechnology, 2008, 10(2): 151–157
Zhang LL, Li L, Zhang GF. Bioinformatics data mining of EST- tandem repeats of the Pacific oyster (). Marine Sciences, 2011, 35(4): 9–14 [張琳琳, 李莉, 張國范. 長牡蠣()EST串聯(lián)重復(fù)序列的組成和分布. 海洋科學(xué), 2011, 35(4): 9–14]
Zhao YY, Zhu XC, Sun XW,. Microsatellite enrichment by magnetic beads in Japanese scallop,. Journal of Fishery Sciences of China, 2006a, 13(5): 749– 755 [趙瑩瑩, 朱曉琛, 孫效文, 等. 磁珠富集法篩選蝦夷扇貝微衛(wèi)星序列. 中國水產(chǎn)科學(xué), 2006a, 13(5): 749–755]
Zhao YY, Zhu XC, Sun XW,. Polymorphic microsatellite loci of the Japanese scallop. Acta Zoologica Sinica, 2006b, 52(1): 229–233 [趙瑩瑩, 朱曉琛, 孫效文, 等. 蝦夷扇貝的多態(tài)性微衛(wèi)星座位. 動物學(xué)報, 2006b, 52(1): 229–233]
Zhu H, Senalik D, McCown BH,. Mining and validation of pyrosequenced simple sequence repeats (SSRs) from American cranberry (Ait.). Theoretical and Applied Genetics, 2012, 124(1): 87–96
(編輯 馮小花)
Microsatellite Analysis ofUsing Next-Generation Sequencing Method
NI Shousheng1,2,3, YANG Yu1,2,4, LIU Shufang1,2①, ZHUANG Zhimeng1
(1. Key Laboratory of Sustainable Development of Marine Fisheries, Ministry of Agriculture, Yellow Sea Fisheries Research Institute, Chinese Academy of Fishery Sciences, Qingdao 266071; 2. Laboratory for Marine Fisheries Science and Food Production Processes, Qingdao National Laboratory for Marine Science and Technology, Qingdao 266071; 3. College of Fisheries and Life Science, Shanghai Ocean University, Shanghai 201306; 4. College of Fisheries and Life Science, Dalian Ocean University, Dalian 116023)
Microsatellite has become an important molecular marker for genetic diversity analysis and marker-assisted breeding as its unique advantages, such as high stability and repeatability, strong specificity and codominance. To understand the distribution and frequency of microsatellite ofs genome, the current study analyzed the microsatellite sequences ofgenome by establishing and sequencing a RAD library. The sequences were assembled, and SSRs were detected by bioinformatics method. The total length of the DNA sequences ofgenome is 92,551,435 bp and 3,618 contigs from all filtered 259,535 contigs containing SSR sequences. The 3460 potential SSR loci were identified with the number of repeat motif from 2 to 6 using appropriate amplifying primers. A total of 1587 trinucleotide SSRs (45.87%) were the most common motif, and ATA (11.41% of whole trinucleotide motifs) was the richest motif. The dinucleotide and the tetranucleotide types ranked the second and the third with a proportion of 37.05%(1282) and 14.48%(501), respectively, while the pentanucleotide type accounted for 2.02%(70), and the hexanucleotide type was the least amount with a proportion of 0.58%(20). Interestingly, the abundance of microsatellites of the same repeat type decreased with the increase of copy number, and the abundance of microsatellites of the same copy number decreased with the increase of the repeat unit length. The variation of length distribution frequency, copy numbers and the abundance of the microsatellite suggested that the mutation rate of shorter repeats was larger than that of the longer repeats. These results provide basic information of microsatellite of, which would be useful to study the genome and population genetics of.
; Next-generation sequencing; Genomes; Microsatellite
LIU Shufang, E-mail: liusf@ysfri.ac.cn
2016-12-09,
2016-12-28
S917
A
2095-9869(2018)01-0107-07
10.11758/yykxjz.20161209001
http://www.yykxjz.cn/
* “十二五”農(nóng)村領(lǐng)域國家科技計劃課題(2012BAD18B03)和山東省泰山學(xué)者建設(shè)工程專項共同資助 [This work was supported by "12th Five-Year" Rural Areas of National Science and Technology Project(2012BAD18B03), and The Scholars of Taishan Special Construction Project in Shandong Province]. 倪守勝,E-mail:shoushengyongji@126.com
柳淑芳,研究員,E-mail: liusf@ysfri.ac.cn
倪守勝,楊鈺,柳淑芳,莊志猛. 基于高通量測序的蝦夷扇貝基因組微衛(wèi)星特征分析. 漁業(yè)科學(xué)進(jìn)展, 2018, 39(1): 107–113
Ni SS, Yang Y, Liu SF, Zhuang ZM. Microsatellite analysis ofusing next-generation sequencing method. Progress in Fishery Sciences, 2018, 39(1): 107–113