劉亞舉,胡 萌,石美森,李學(xué)博
1.河南省許昌市公安局刑事科學(xué)技術(shù)研究所,河南許昌 461000;2.鐵道警察學(xué)院公安技術(shù)系,河南鄭州 450053;3.中國政法大學(xué)刑事司法學(xué)院偵查學(xué)研究所,北京100192;4.山東省高校證據(jù)鑒識(shí)重點(diǎn)實(shí)驗(yàn)室(山東政法學(xué)院),山東濟(jì)南 250014
插入/缺失(InDel)多態(tài)性遺傳標(biāo)記是指基因組中插入或缺失不同大小的DNA片段所形成的多態(tài)性遺傳標(biāo)記。InDel在人類基因組中分布廣泛,一般平均每隔7.2 kb就會(huì)有一個(gè)InDel位點(diǎn),即約20%的DNA多態(tài)性是InDel,在法醫(yī)學(xué)應(yīng)用領(lǐng)域中,由于InDel具有突變率相對(duì)較低、擴(kuò)增片段較小(通常<200 bp)的特點(diǎn),適用于降解檢材的分析和親緣關(guān)系鑒定,同時(shí)InDel是二等位基因,不適合用于混合檢材的分析,但其兼具了短串聯(lián)重復(fù)序列(STR)和單核苷酸多態(tài)性(SNP)兩種遺傳標(biāo)記的雙重優(yōu)點(diǎn),且可以用法醫(yī)DNA實(shí)驗(yàn)室的毛細(xì)管電泳平臺(tái)進(jìn)行基因分型檢測(cè),分型方法簡(jiǎn)便、快速、準(zhǔn)確,易于在法醫(yī)DNA實(shí)驗(yàn)室進(jìn)行推廣和應(yīng)用。本研究針對(duì)貴州仡佬族和苗族人群常染色體上30個(gè)InDel位點(diǎn)的遺傳多態(tài)性進(jìn)行分析,評(píng)估其在法醫(yī)學(xué)中的應(yīng)用價(jià)值,同時(shí)為個(gè)體識(shí)別和親權(quán)鑒定、群體間遺傳分布等相關(guān)研究提供參考數(shù)據(jù)。
1.1材料來源 根據(jù)知情同意原則,從健康體檢人群中隨機(jī)采集貴州仡佬族(220例,其中男175例、女45例)和苗族(207例,其中男157例、女50例)無血緣關(guān)系個(gè)體外周血0.1 mL,滴入采血卡(武漢驥騰公司),陰干后常溫保存。本研究得到相關(guān)道德倫理委員會(huì)批準(zhǔn)。
通過中國知網(wǎng)(www.cnki.net)和NCBI(www.ncbi.nlm.nih.gov)數(shù)據(jù)庫獲得5個(gè)漢族[北京漢族(210例)、河南漢族(293例)、上海漢族(565例)、成都漢族(129例)、廣東漢族(300例)]和13個(gè)少數(shù)民族[新疆維吾爾族(223例)、西藏藏族(226例)、福建畬族(119例)、四川彝族(54例)、廣西壯族(49例)、廣西侗族(50例)、廣西苗族(50例)、四川藏族(136例)、云南彝族(122例)、新疆錫伯族(223例)、湖北土家族(236例)、新疆哈薩克族(96例)、云南白族(125例)]等18個(gè)人群的30個(gè)InDel位點(diǎn)等位基因頻率作為群體遺傳關(guān)系比較的數(shù)據(jù)。
1.2儀器與試劑 Hamilton STAR-LET自動(dòng)化工作站(AusBio公司,瑞士);平板離心機(jī)(Eppendorf公司,德國);9700型PCR擴(kuò)增儀(AB公司,美國);3500XL型遺傳分析儀和ID-X分析軟件(AB公司,美國);GeneMarker?HID分析軟件(SoftGenetics公司,美國);Investigator?DIPplex試劑盒(Qiagen公司,德國)。
1.3方法 采用5% Chelex-100快速提取法提取標(biāo)本DNA。在Eppendorf Mastercycler pro S銀座熱循環(huán)儀上進(jìn)行復(fù)合擴(kuò)增,Investigator?DIPplex試劑盒反應(yīng)體系為10 μL,其中Reaction Mix A 2.0 μL,Primer Mix 2.0 μL,Multi Taq2 DNA Polymerase 0.25 μL,純水4.75 μL,模板DNA 1.0 μL(0.5~1.0 ng/μL)。PCR擴(kuò)增條件:94 ℃預(yù)變性4 min;94 ℃變性30 s,61 ℃復(fù)性120 s,72 ℃延伸75 s,30個(gè)循環(huán);最后68 ℃延伸60 min,10 ℃保溫。取1.0 μL擴(kuò)增產(chǎn)物與DNA size standard 550(標(biāo)記橙色熒光素BTO)0.5 μL和10.0 μL去離子甲酰胺混合,95 ℃變性3 min后,冰浴3 min,置3500XL型遺傳分析儀上進(jìn)行全自動(dòng)毛細(xì)管電泳,Data Collection軟件收集數(shù)據(jù),用GeneMarker?HID分析軟件進(jìn)行等位基因分型,并采用GeneMapper ID-X v1.5分析軟件復(fù)核。每批標(biāo)本檢測(cè)均采用XX28和超純水分別作為陽性對(duì)照和陰性對(duì)照。
1.4統(tǒng)計(jì)學(xué)處理 用PowerStats v12.xls軟件統(tǒng)計(jì)分析30個(gè)InDel位點(diǎn)的等位基因頻率、個(gè)體識(shí)別率(DP)、累積個(gè)體識(shí)別率(TDP)、多態(tài)信息含量(PIC)和非父排除率(PE)等法醫(yī)學(xué)相關(guān)參數(shù);采用Cervus 3.0軟件計(jì)算三聯(lián)體累積非父排除率(CPEtrio)和二聯(lián)體累積非父排除率(CPEduo)。采用Arlequin v3.5軟件計(jì)算30個(gè)InDel位點(diǎn)的觀察雜合度(Ho)和期望雜合度(He),并進(jìn)行各位點(diǎn)的Hardy-Weinberg平衡及連鎖不平衡檢驗(yàn);采用Haploview軟件分析Hardy-Weinberg平衡P值。采用GENEPOP v4.2軟件計(jì)算各群體間遺傳距離和遺傳分化系數(shù)(Fst)等參數(shù)。
2.1貴州仡佬族和苗族人群30個(gè)InDel位點(diǎn)的群體遺傳學(xué)參數(shù) 在貴州220例仡佬族和207例苗族無關(guān)個(gè)體血樣中,Investigator?DIPplex熒光檢測(cè)試劑盒中的30個(gè)InDel位點(diǎn)都得到了有效擴(kuò)增,且各位點(diǎn)間擴(kuò)增產(chǎn)物平衡。經(jīng)Bonferroni校正,30個(gè)InDel位點(diǎn)的基因型頻率分布均符合Hardy-Weinberg平衡(P>0.05),各位點(diǎn)的群體遺傳學(xué)參數(shù)見表1。
表1 貴州仡佬族和苗族群體30個(gè)InDel位點(diǎn)的群體遺傳學(xué)參數(shù)
2.2貴州仡佬族和苗族人群30個(gè)InDel位點(diǎn)的連鎖不平衡檢驗(yàn) 經(jīng)Arlequin v3.5軟件分析后發(fā)現(xiàn),貴州仡佬族和苗族人群的30個(gè)InDel位點(diǎn)之間相互獨(dú)立,各位點(diǎn)間均不存在連鎖不平衡現(xiàn)象(P>0.05)。采用乘積定律計(jì)算,TDP分別為0.999 999 999 34和0.999 999 996 86,CPEduo分別為0.951 2和0.952 8,CPEtrio分別為0.995 6和0.995 7。
續(xù)表1 貴州仡佬族和苗族群體30個(gè)InDel位點(diǎn)的群體遺傳學(xué)參數(shù)
2.3貴州仡佬族和苗族與其他群體的遺傳分化系數(shù)Fst及遺傳距離 應(yīng)用本研究獲得的30個(gè)InDel位點(diǎn)基因頻率數(shù)據(jù)分析了貴州仡佬族和苗族人群與18個(gè)比較群體的Nei′s DA遺傳距離,見表2;通過缺失頻率進(jìn)行計(jì)算的20個(gè)群體之間的遺傳分化系數(shù)Fst值,見表3。結(jié)果顯示,仡佬族和苗族與成都漢族的遺傳距離較近,分別與新疆維吾爾族和哈薩克族的遺傳距離較遠(yuǎn)。
表2 貴州仡佬族、苗族群體與其他18個(gè)群體的遺傳距離
表3 30個(gè)InDel 遺傳標(biāo)記在20個(gè)群體中的遺傳分化系數(shù)Fst值
續(xù)表3 30個(gè)InDel 遺傳標(biāo)記在20個(gè)群體中的遺傳分化系數(shù)Fst值
續(xù)表3 30個(gè)InDel 遺傳標(biāo)記在20個(gè)群體中的遺傳分化系數(shù)Fst值
位點(diǎn)廣西苗族云南彝族云南白族新疆錫伯族湖北土家族新疆哈薩克族FstHLD770.6500.6800.5600.4840.5360.5380.013 2HLD450.2500.3440.3920.3680.3470.2800.009 0HLD1310.6300.7130.5720.6860.6650.5490.014 8HLD700.4700.4840.3560.3830.4360.4120.007 4HLD60.6500.6230.5200.4570.5320.4180.012 7HLD1110.8700.9220.8880.8770.9090.7090.137 5HLD580.5300.6230.6160.7000.5970.5880.015 7HLD560.4900.5780.4360.4010.4490.4120.011 8HLD1180.0200.1110.1080.0850.0440.3460.091 1HLD920.6300.5820.5360.5180.5440.4450.007 9HLD930.4500.3070.4600.3790.4410.4070.009 6HLD990.2100.1600.2000.1570.1360.3900.037 4HLD880.4000.4260.4720.4220.4470.4120.012 9HLD1010.6300.5040.5520.5110.5340.4560.009 7HLD670.1900.2950.3280.2850.2460.4290.026 8HLD830.6400.4920.6200.5940.6190.6480.010 8HLD1140.8200.7540.8160.6790.7650.5710.016 8HLD480.6200.6310.6360.5920.5570.5550.003 9HLD1240.5500.4060.4640.4130.4170.4180.005 4HLD1220.8600.7540.7600.7260.7670.6370.023 9HLD1250.5100.5740.5480.5920.6480.5330.009 3HLD640.1000.1020.1320.2350.1400.3080.022 8HLD810.2000.1150.1400.1570.1690.3020.017 9HLD1360.7000.6480.4880.4570.4720.5110.019 7HLD1330.7100.6760.6120.5940.6380.5490.009 4HLD970.6400.6840.6840.6260.6610.6370.014 0HLD400.4200.4300.3840.3770.3260.4670.018 3HLD1280.7500.8520.7480.6390.6500.5930.019 3HLD390.8900.9060.8320.8480.8830.7750.037 2HLD840.1800.2090.3000.1970.2390.2970.020 5
貴州是個(gè)多民族省份,現(xiàn)有少數(shù)民族49個(gè),世居17個(gè)。仡佬族是貴州最古老的民族之一,且貴州是仡佬族的發(fā)源地。貴州仡佬族和苗族人口分別占全國同一民族總?cè)丝诘?7%和50%以上,分屬于漢藏語系的壯侗語族和苗瑤語族。目前,國內(nèi)外學(xué)者對(duì)仡佬族和苗族白細(xì)胞抗原(HLA-G)、線粒體DNA和STR等遺傳標(biāo)記的多態(tài)性進(jìn)行了研究[1-8],而本研究對(duì)427例仡佬族和苗族健康無關(guān)個(gè)體的30個(gè)InDel位點(diǎn)的遺傳多態(tài)性進(jìn)行分析,同時(shí)探討其與其他群體之間的遺傳學(xué)關(guān)系,有助于分析InDel遺傳標(biāo)記在不同民族或同一民族不同群體間的遺傳、進(jìn)化的相互關(guān)系,為科學(xué)應(yīng)用InDel遺傳標(biāo)記提供理論基礎(chǔ)。
Hardy-Weinberg遺傳平衡檢驗(yàn)結(jié)果一方面可以反映基因分型的質(zhì)量,另一方面也反映研究對(duì)象的代表性是否較好。本研究結(jié)果顯示,經(jīng)過Bonferroni法校正,30個(gè)InDel位點(diǎn)的基因型頻率分布在貴州仡佬族和苗族群體中符合Hardy-Weinberg遺傳平衡,說明貴州仡佬族和苗族群體在符合隨機(jī)采樣的情況下,群體中個(gè)體的基因頻率可從一代傳到另一代且維持不變,保持遺傳的平衡穩(wěn)定性,本次標(biāo)本隨機(jī)性和采集數(shù)目符合統(tǒng)計(jì)學(xué)要求。連鎖不平衡檢驗(yàn)結(jié)果表明,30個(gè)InDel位點(diǎn)在貴州仡佬族和苗族群體中不存在連鎖不平衡現(xiàn)象(P>0.05),提示這些位點(diǎn)是相互獨(dú)立的遺傳標(biāo)記,可以應(yīng)用于法醫(yī)學(xué)鑒定。
本研究根據(jù)30個(gè)InDel位點(diǎn)的等位基因頻率進(jìn)行了貴州仡佬族和苗族與其他群體的遺傳距離分析,結(jié)果顯示,貴州仡佬族和苗族與成都漢族的遺傳距離較近,分別與新疆維吾爾族和哈薩克族的遺傳距離較遠(yuǎn)。劉亞舉等[7-8]基于常染色體STR和Y-STR遺傳標(biāo)記研究了仡佬族和苗族的遺傳結(jié)構(gòu)及與其他群體的遺傳關(guān)系,發(fā)現(xiàn)仡佬族和苗族與湖北、湖南、重慶漢族有較近的遺傳距離,與西藏藏族、甘肅裕固族、青海藏族有較遠(yuǎn)的遺傳距離。李彬彬等[3]和姚永剛等[9]調(diào)查線粒體DNA 9bp缺失頻率,結(jié)果發(fā)現(xiàn)仡佬族為25%、苗族為32.4%,與目前認(rèn)為南方民族人群的缺失頻率高于北方民族人群的觀點(diǎn)是一致的[9]。何燕等[5]基于貴州苗族等人群的線粒體DNA多態(tài)性研究表明,組成“南方譜系”的B、M7、N9、R9等在貴州苗族等3個(gè)民族中頻率為51.22%,同時(shí)構(gòu)建了20個(gè)人群mtDNA單倍群頻率主成分,分析結(jié)果表明貴州苗族是南方民族。劉烜等[10]研究了貴州仡佬族等貴州境內(nèi)多個(gè)民族個(gè)體外周血標(biāo)本Y染色體單核苷酸多態(tài)(Y-SNP),其中仡佬族H8單倍型(M134)和苗族H8(M134)、H11(M95)、H12(M88)頻率較高,也表明仡佬族和苗族均是南方民族。這些研究表明,InDel作為遺傳標(biāo)記物,以等位基因頻率計(jì)算遺傳距離可用于群體遺傳學(xué)的研究,和地域?qū)嶋H的物理距離區(qū)分度相似,與民族的起源、進(jìn)化、遷徙的研究數(shù)據(jù)結(jié)果一致[11-12]。
遺傳分化系數(shù)Fst值是進(jìn)行群體間遺傳分化概括分析最常用的方法之一,是評(píng)價(jià)基因座等位基因頻率在群體間的分布差異程度。WRIGHT認(rèn)為群體間Fst值在0.00~<0.05表示群體間不存在分化,F(xiàn)st值在0.05~<0.15則為中度分化,F(xiàn)st值在0.15~0.25則為高度分化,F(xiàn)st值>0.25則分化度極大。WEI等[13]對(duì)中國漢族、藏族、維吾爾族和哈薩克族群體30個(gè)InDel位點(diǎn)的Fst分析結(jié)果顯示,HLD111和HLD118位點(diǎn)遺傳分化貢獻(xiàn)率相對(duì)較高。LARUE等[14]對(duì)北美地區(qū)的非洲裔、高加索人、亞裔和西南部西班牙裔的Fst分析結(jié)果也證實(shí),HLD111和HLD118等位點(diǎn)遺傳分化貢獻(xiàn)率相對(duì)較高。本研究中,HLD111和HLD118位點(diǎn)Fst值分別為0.137 5、0.091 1,在20個(gè)群體中遺傳分化貢獻(xiàn)率相對(duì)較高,提示這兩個(gè)位點(diǎn)在不同民族,尤其是不同人種中基因型分布有很大的差異,反映群體差異性大,在群體遺傳學(xué)和種群識(shí)別方面有重要的應(yīng)用價(jià)值。
綜上所述,由于貴州仡佬族和苗族大多在偏遠(yuǎn)地區(qū)聚族而居,生活環(huán)境相對(duì)封閉,各民族之間隔離程度較高,民族特異性保存較好,這些遺傳特性成為人類遺傳多樣性的重要組分,可作為遺傳學(xué)上很好的研究材料。這些民族的遺傳物質(zhì)是全人類遺傳多樣性的重要組成部分,研究這些民族的起源和進(jìn)化對(duì)于探索中華民族乃至東亞人群的起源也具有重要意義。