王 丹 鄒桂偉 羅相忠
(中國水產(chǎn)科學研究院長江水產(chǎn)研究所, 武漢 430223)
鰱(Hypophthalmichthys molitrix), 是我國“四大家魚”之一, 是老百姓重要的動物蛋白來源之一。近年來, 人工近親繁殖和親本選育等問題已導致鰱的主要經(jīng)濟性狀退化、生長速度減慢、性成熟個體變小、抗逆性下降等問題, 環(huán)境污染導致鰱天然種群數(shù)量明顯下降和種質(zhì)資源破壞較嚴重[1,2]。然而利用傳統(tǒng)的育種技術培育優(yōu)良品種或品系需要進行多代選育, 費時費力。分子標記輔助育種技術可快速、準確地檢測到與性狀基因緊密連鎖的分子標記, 在親子鑒定、回交育種、雜種優(yōu)勢預測和品種鑒定等各個育種階段發(fā)揮重要作用, 從而加速育種進程, 提高育種效率[3]。開展鰱功能基因組學研究, 篩選鑒定鰱生長相關的分子標記及QTL, 對鰱的分子標記輔助育種體系具有重要的理論意義和生產(chǎn)價值。
分子標記可按有無基因功能分為Type Ⅰ與Type Ⅱ標記兩大類。Type Ⅰ標記指來源于基因編碼區(qū), 與功能基因相聯(lián)系的標記; Type Ⅱ標記則指與未知功能片段關聯(lián)的標記。Type Ⅰ標記在群體遺傳研究、比較基因組學研究、基因組進化研究、候選基因鑒定、數(shù)量性狀位點定位、分子標記輔助育種等方面比Type Ⅱ標記更具優(yōu)勢[4]。
來自EST的SSR標記通常被稱作EST-SSR標記,屬于Type Ⅰ標記, 它結合了SSR和EST標記的優(yōu)點:(1)如果發(fā)現(xiàn)某個EST-SSR標記與某個遺傳性狀相連鎖, 這個EST可能是直接影響這個性狀的基因片段。(2)EST來自基因編碼區(qū), 具有一定的保守性,因此在近緣種中有良好的通用性。(3)利用ESTSSR標記進行種群遺傳多樣性分析時, 所揭示的是在不同群體中基因的功能多樣。
在遺傳連鎖圖譜構建和分子標記輔助育種研究中, Liu等[5]報道了15個二堿基重復的EST-SSR標記用于斑點叉尾鮰(Ictalurus punctatus)的圖譜構建。Wang等[6]用數(shù)據(jù)挖掘的方法得到25個鯉(Cyprinus carpioL.)的EST-SSR標記, 其中有23條ESTSSR序列與已知基因功能相關, 如編碼新陳代謝的酶、抗病因子、結構蛋白、以及轉錄因子等。Fuji等[7]得到牙鲆(Paralichthys olivaceus)抗淋巴囊腫病的微衛(wèi)星標記, 利用這個位點輔助培育的牙鲆品種在日本市場的占有率為35%。魯翠云等[8]找到4個QTL位點與鏡鯉的體質(zhì)量、體長性狀具有相關性,可作為指導鏡鯉家系選配的首選標記用于新品系培育。郭薇等[9]研究篩選出與鯽(Carassius auratus)體重、體厚、生長相關的EST-SSRs標記及基因型,為鯽的分子標記輔助育種及目標性狀的遺傳改良提供依據(jù)。
在種質(zhì)資源研究中, Vasemg等[10]將EST-SSR標記用于分析波羅的海五個大西洋鮭(Salmo salarL.)自然群體和四個人工養(yǎng)殖群體的遺傳多樣性和遺傳分化, 結果發(fā)現(xiàn)人工養(yǎng)殖群體中有一個等位基因丟失。魯翠云等[11]用鯉的EST-SSR引物分析了長江鯉和黑龍江鯉的種群結構, 找到2個位點在長江鯉的多態(tài)信息含量明顯高于黑龍江鯉, 可以作為兩個群體的鑒別。赫崇波等[12]用EST-SSR標記對我國斑點叉尾鮰種質(zhì)資源進行評估, 認為斑點叉尾鮰的遺傳分化程度很弱。鄭國棟等[13]利用EST-SSR標記對不同地域草魚(Ctenopharyngodon idellus)群體進行鑒定和遺傳多樣性分析, 對草魚的種質(zhì)資源保存、種群鑒定和良種選育具有重要意義。
迄今, 有關鰱在遺傳連鎖圖譜構建[14—16]和種質(zhì)資源遺傳結構[1,2,17]的研究中已取得重要進展, 但是缺乏分子標記輔助育種的研究。本實驗通過鰱的卵組織轉錄組數(shù)據(jù)挖掘EST-SSR標記, 從中篩選出與生長性狀相關或連鎖的位點, 探討其用于分子標記輔助育種的應用潛力, 為鰱遺傳育種的親本選擇提供理論基礎。
用于檢測引物多態(tài)的鰱采自石首老河野生群體共16尾。轉錄組測序材料和構建全同胞家系的實驗魚由中國水產(chǎn)科學研究院長江水產(chǎn)研究所窯灣試驗場提供。轉錄組測序材料取自鰱的卵組織。TaKaRa試劑盒提取總RNA, 反轉錄得到cDNA,對cDNA片段進行末端修復并連接測序接頭, 進行Illumina HighSeq 2000高通量測序。本實驗構建鰱的全同胞家系, 隨機挑選子代共計144尾。采集的鰭條置于95%的酒精中?;蚪MDNA的提取參照鹽析法[18]。對144尾鰱的外觀性狀體長和體重進行測量, 并計算肥滿度(K=100W/L3,W為體重,L為體長)。
轉錄組測序和微衛(wèi)星的查找將測序原始數(shù)據(jù)進行初步拼接, 去除低質(zhì)量和短序列, 獲得高質(zhì)量的序列, 然后進行參考序列組裝和de novo組裝?;谵D錄組SSR檢測是以組裝出來Unigene作為參考序列, 用SSR軟件MicroSatellite (MISA)來找出所有的SSR。Primer 6設計鰱EST-SSR引物。
PCR反應條件94℃預變性5min; 94℃變性35s, 退火溫度為35s, 72℃延伸50s, 循環(huán)35次; 最后72℃終延伸10min。PCR反應體系: 總體積25 μL,包括大約20 ng總DNA, 上、下游引物各1 μL(5 μmol/L), 1 μL dNTP(10 mmol/L), 0.6UTaq聚合酶(TIANGEN), 2.5 μL緩沖液(含Mg2+1.5 mmol/L)。本實驗參照Schuelke[19]發(fā)明的單管巢式PCR擴增方法進行基因型分型研究, GeneMapper4.0分析基因型數(shù)據(jù)。
數(shù)據(jù)處理與分析多態(tài)位點和生長性狀指標的關聯(lián)性分析用SPSS軟件中的廣義線性模型(General linear model)處理。顯著性檢驗用新復極差法(Duncan’s new multiple range test)[20]。
通過Illumina Hiseq2000平臺測序, 總計產(chǎn)出28691557200nt數(shù)據(jù)。組裝結果總Unigene77129個,總長98834445nt, 平均長度1281nt, N50達到2228nt。Unigene功能注釋, 注釋到NR、NT、Swiss-Prot、KEGG、COG、GO庫的Unigene分別是46540個、64879個、41522個、35574個、16426個、30224個,所有注釋上的Unigene是66985個。預測編碼蛋白框(CDS), 比對到蛋白庫的CDS有46113個, 預測出的CDS有1512個, 共47625個。SSR共24458個, 占所測EST數(shù)據(jù)的31.7%。
鰱轉錄組微衛(wèi)星類型特征如圖1所示。鰱包含SSR的EST序列主要有二堿基、三堿基、四堿基和五堿基組成。二堿基中, AC/GT含量最豐富, CG含量最少。三堿基重復的序列最多類型是ATC和ATG。
我們從所測序列挑選175條鰱的EST進行SSR引物設計。PCR檢測結果顯示, 共有148對引物有擴增產(chǎn)物, 其中單態(tài)有60對, 雜帶有52對, 多態(tài)有36對。36對多態(tài)引物的核心重復類型、退火溫度、引物序列和Blast結果見表1。
我們一共測量了144尾鰱。體長最大值為17.0 cm,最小值為11.2 cm, 平均值為14.1 cm;體重最大值是82.3 g, 最小值為25.8 g, 平均值為49.4 g; 肥滿度最大值為2.07, 最小值為1.41, 平均值為1.7(表2)。
本研究共篩選得到兩個與鰱生長性狀有關的SCE位點, SCE26和SCE65。如表3所示, 2個SCE位點按基因型分類, SCE26位點有3種基因型, A148-148、A148-154和A154-154。其中A148-154為優(yōu)勢基因型, 基因頻率為0.68?;蛐虯148-154和A154-154與體長和體重性狀差異顯著, 而與肥滿度性狀無相關性。
SCE65有四種基因型, A149-157、A157-159、A149-159和A159-159, 與體長和體重性狀均無顯著相關性, 但基因型A149-159和A159-159與肥滿度性狀差異顯著。
圖1 鰱轉錄組數(shù)據(jù)微衛(wèi)星類型特征Fig. 1 Characterization of SSR from silver carp transcriptome data
表1 鰱36對EST-SSR引物特征Tab. 1 Characterization of 36 EST-SSR in silver carp
續(xù)表1
表2 144尾鰱測量指標Tab. 2 Measurements from 144 silver carp individuals
Serapion等[21]的方法從斑點叉尾鮰開發(fā)TypeⅠ標記(EST-SSR), 首次報道魚類用此方法研究的先例。隨后, 在其他魚類[22—24]、蝦類[25,26]和貝類[27]中也有EST-SSR標記開發(fā)報道。本研究, 我們得到的結果有31.7%的鰱EST序列包含SSR, 這個比例遠遠高于斑節(jié)對蝦(13.7%)[26]、河豚(11.5%)[28]和斑點叉尾鮰(11.2%)[21]、中國對蝦(2.2%)[29]、海灣扇貝(4%)[27]和真鯛(4%)[24]。植物包含SSR的EST序列百分比在1%—5%[30,31]??梢? 水生生物包含SSR的EST序列是非常豐富的。本研究中SSR豐富度較高, 可能是因為測序方法、序列拼接方式和計算法則更優(yōu)化, 去除了更多的冗余數(shù)據(jù), 提高了SSR的百分比。也有可能是鰱卵組織EST序列的一個自身特點, 有待我們進一步研究。
大多數(shù)動物的EST數(shù)據(jù)庫中SSR核心重復類型以二堿基居多數(shù), 而植物則是三堿基重復最豐富[30,31]。在鯉科魚中, 包括非編碼區(qū)SSR和編碼區(qū)SSR中的研究[28,32], 二堿基CA重復的序列最多[6,33,34]。也有少數(shù)學者提出相反觀點, 認為AT二堿基重復次數(shù)最常見[22]。在本研究中, 鰱EST數(shù)據(jù)中二堿基CA重復次數(shù)最多, 與大部分鯉科魚類研究相同。
多態(tài)位點不僅僅依賴于核心重復次數(shù), 有些二堿基重復五次檢測結果是多態(tài), 而重復六次甚至更多卻是單態(tài)[35,36]。編碼區(qū)的突變概率要小于非編碼區(qū), 源于基因受選擇壓力的影響[35]。與Type Ⅱ標記的SSR(來自非編碼區(qū))相比, EST-SSR的多態(tài)比例略低[25,37]。本研究的結果, 共設計了175對ESTSSR引物, 有148對有擴增產(chǎn)物, 說明測序的EST質(zhì)量是可靠的。多態(tài)有36對, 占總比例24.3%; 單態(tài)有60對, 占40.1%, 可能是源于基因的保守性。有27對無擴增產(chǎn)物, 可能是因為引物設計位點跨外顯子擴增[37]。
表3 鰱生長性狀有關的EST-SSR多態(tài)位點信息Tab. 3 Effects of EST-SSR polymorphisms on growth traits of silver carp
本研究共篩選得到兩個與鰱生長性狀有關的EST-SSR位點, SCE26和SCE65。如表3所示, 兩個位點按基因型分類, SCE26位點A148-154為優(yōu)勢基因型, 基因型頻率為0.68。A148-154與A154-154的體長和體重差異顯著, 而肥滿度無相關性。SCE65的基因型A149-159和A159-159的肥滿度差異顯著, 體長和體重則無顯著相關。群體的等位基因頻率受人工選擇、親本數(shù)目及隨機遺傳漂變的影響較大[38]。本研究的實驗材料144尾鰱不受這些情況的影響。因此, 可以排除上述可能干擾等位基因頻率的因素。
候選基因的效應可能只存在某個群體或者特定世代, 即這種數(shù)量性狀的連鎖關系需要在該群體子代、同品種不同群體及不同品種中進行驗證[39]。因此本研究對鰱微衛(wèi)星的多態(tài)位點與外觀性狀的關系將進一步驗證, 以期得到更準確的結果。這兩個標記有可能作為生長有關的候選基因, 進行鰱分子標記輔助育種研究。
有關鰱EST-SSR標記的報道比較少。Wang等[6]用鯉的EST-SSR引物對鰱進行跨種擴增研究, 得到的EST-SSR多態(tài)率偏低。Guo等[16]構建鰱的微衛(wèi)星文庫, 篩選的大部分EST-SSR引物以GT二堿基核心重復為主。本研究直接從鰱的轉錄組測序產(chǎn)物中尋找SSR進行驗證, 屬于測序的副產(chǎn)品研究, 省時省力, 且涉及的引物核心重復序列覆蓋二堿基、三堿基、四堿基和五堿基。
Blast結果顯示, 36條鰱EST-SSR序列中有10條序列確定已知基因功能, 如轉運蛋白、蛋白激酶、去甲基化酶及白細胞介素等, 有助于已知功能基因的定位。在目前的研究中, 關于鰱生長、繁殖、抗病等分子標記的相關報道較少。可根據(jù)不同的生產(chǎn)目的選擇相應的基因型標記進行標記輔助育種研究, 重點研究生長速度快、耐低氧、抗病性強的基因, 全基因組測序工作的開展, 將加快研究進程。