任潤生 李蘋芳 徐錦華 張曼 劉 廣 姚協(xié)豐 羊杏平
目的與意義: 西瓜[Citrullus lanatus (Thunb.) Matsum. et Nakai] 是重要的蔬菜作物,在全世界范圍內都廣泛種植。構建高密度的西瓜遺傳圖譜和不斷利用新開發(fā)的標記構建飽和遺傳圖譜仍然是目前西瓜基因組學研究的重要內容之一。本項研究主要以西瓜自交系‘K3和野生西瓜種‘PI 189225為親本構建F2分離群體,利用以DArTseq為基礎的SNP標記構建西瓜高密度遺傳連鎖圖譜。
材料與方法: (1)對苗期采集的母本、父本、F1、F2 單株幼嫩真葉2 g,真空干燥后,采用CTAB法進行DNA提取。(2)依照Kilian 等(2012)的方法,用限制性內切酶PstI 和MseI 將其隨機打斷,根據(jù)酶切的接頭序列,采用帶有PstI和HpaII的接頭序列進行連接并PCR擴增。根據(jù)識別標簽序列得到每個個體的測序reads,以西瓜97103為參考基因組序列進行BLAST序列比對和數(shù)據(jù)過濾等獲得親本與群體的SNP基因型。(3)根據(jù)親本與群體的基因型,采用滑動窗口法,即選擇以每15個SNP 為1個窗口,每次滑動1個SNP,確定每個窗口的基因型以及每個個體的交換位點,得到每個個體的Bin基因型。(4)使用JoinMap4.1軟件,作圖法選擇maximum likelihood(ML)算法,作圖函數(shù)選擇Kosambis 函數(shù)構建遺傳圖譜。各個染色體遺傳標記圖譜采用軟件MapChart v2.2進行作圖。
結果與分析: (1)采用DArTseq方法,共獲得了4 808個SNP標記,這些標記的平均得率為91.3%,PIC值為0.022~0.500,平均PIC值為0.454。根據(jù)SNP標記剔除的標準,共有1 343個SNP標記被剔除,剩余3 465個標記(占總數(shù)的72.1%)用來組裝相應的bin標記。(2)利用滑動窗口法和軟件JoinMap 4.1進行遺傳圖譜構建,最終獲得包含1 161個bin標記的高密度遺傳圖譜,全長1 099.2 cM,標記間平均距離為2.16 cM。單個染色體長度差異明顯,其中最短的7號染色體為61.8 cM,最長的5號染色體為140.2 cM。單個染色體上的bin標記數(shù)也差異明顯,其中bin標記數(shù)最少的為7號染色體,共含有62個bin標記;5號染色體為含有最多bin標記的染色體,共含有160個bin標記。平均每條染色體含有105.5個bin標記。大部分bin標記間的遺傳距離都小于5.0 cM,而01號染色體則有區(qū)間分別為5.5 cM和9.9 cM;03號染色體則有區(qū)間分別為6.2 cM和6.9 cM;10號染色體和11號染色體則有兩區(qū)間分別為5.4 cM和10.4 cM。整個染色體的物理長度為330.6 Mb,平均物理長度為30.0 Mb,最小的為04號染色體(24.3 Mb),而最長的為9號染色體(35.0 Mb)。(3)研究結果顯示大部分染色體的遺傳圖譜和其物理圖譜之間的關系都一致,而只有11號染色體上大約有21.2 Mb的區(qū)段則不一致。除了遺傳圖譜和其物理圖譜之間的關系外,我們還通過比較遺傳距離(cM)和物理距離(Mb)之間關系,計算了每條染色體的重組頻率,結果顯示11條染色體的重組頻率差異較明顯,重組頻率最低的為7號染色體,為2.0 cM/Mb;而重組頻率最高的為5號染色體,為4.2 cM/Mb;而11條染色體的平均重組頻率為3.3 cM/Mb。((4)卡方測驗表明,1 161個bin標記中,共有616個標記(占53.1%)表現(xiàn)出顯著偏分離(P = 0.05)。其中513個標記(占44.2%)偏向于西瓜優(yōu)良栽培品種K3,而103個標記 (占8.9%)偏向于野生西瓜種質‘PI189225。513個偏向于西瓜優(yōu)良栽培品種K3的標記都分布于除6號染色體外的其他所有的染色體上;而103個偏向于野生西瓜種質‘PI189225的標記則主要分布于5個染色體上,分別為04號染色體上 2個標記, 06號染色體上11個標記, 07號染色體上16個標記, 10號染色體上39個標記以及 11號染色體上35個標記。所有的這616個偏分離標記在11條染色體上主要以成簇分布,共形成44個偏分離標記區(qū)(Segregation distortion region,SDRs)。⑤通過對西瓜種質‘97103和‘PI 296341-FR之間基因組序列的比對,在葫蘆科基因組數(shù)據(jù)庫中共鑒定出4 335 338 SNPs 和35 197 InDels。為了確定在本研究中的偏分離的標記主要是由于西瓜栽培種和野生種之間基因組結構的差異造成,根據(jù)每個標記的物理位置,本研究將這些標記(SNPs 和InDels)和偏分離的區(qū)域進行比較分析,44個SDRs中共包含有2 289 215 SNPs 和18 023 InDels。總體上看來,位于染色體02, 04, 06, 07和09上的SDRs中的SNPs的密度(SNPs/Mb)多于位于其他非SDRs區(qū)域中或整個染色體。相反,位于染色體01, 03, 05, 08,10和11上的SDRs中的SNPs的密度(SNPs/Mb)則低于位于其他非SDRs區(qū)域中或整個染色體。同樣的趨勢也表現(xiàn)在InDels上。
結 論: 本研究中,筆者利用F2分離群體構建了西瓜遺傳連鎖圖譜,根據(jù)遺傳圖譜的構建方法以及所用的大量的SNP標記,本高密度圖譜具有很高的可信度。通過進一步對遺傳圖譜的分析,發(fā)現(xiàn)了存在有多個位于不同染色體上的偏分離區(qū)域,以及發(fā)現(xiàn)位于11號染色體上的一段區(qū)域,其遺傳位置和物理位置不一致,本研究也對這些現(xiàn)象都作了具體描述和分析。本研究所構建的具有高密度和高可信度的遺傳圖譜將對西瓜基礎和應用研究,以及對我們更進一步理解西瓜基因組結構將提供重要的幫助。