趙聰穎,趙 銘,張?zhí)N盈,許 惠,郭瑜鑫,朱波峰,
1南方醫(yī)科大學(xué)法醫(yī)學(xué)院廣州市法醫(yī)多組學(xué)精準(zhǔn)鑒識重點實驗室,廣州 510515 2商丘普濟(jì)法醫(yī)臨床司法鑒定所,河南商丘 476600 3西安交通大學(xué)口腔醫(yī)院陜西省顱頜面精準(zhǔn)醫(yī)學(xué)研究重點實驗室,西安 710004
陜西省西安作為“古絲綢之路”的起點,為來自亞洲、歐洲的人群交往搭建橋梁,推動了歐亞大陸不同國家間的文化交流和群體遷移[1-2]。由于陜西獨特的地理優(yōu)勢,作為當(dāng)?shù)刂饕后w的漢族與其他民族不可避免的產(chǎn)生基因交流。然而,目前對于陜西漢族的研究多集中于法醫(yī)學(xué)常用的常染色體短串聯(lián)重復(fù)序列(short tandem repeat,STR)、性染色體STR、線粒體DNA遺傳標(biāo)記等[3-5],關(guān)于二等位基因插入/缺失多態(tài)性(insertion/deletion polymorphism,DIP)遺傳標(biāo)記研究相對較少。DIP是廣泛分布在人類基因組中由DNA片段的插入或缺失形成的長度多態(tài)性。2002年Weber等[6]首次報道來自人類基因組中的2000個雙等位DIP遺傳標(biāo)記,2006年Mills[7]繪制了第1張分布在人類基因組中包含415 436個DIP遺傳標(biāo)記圖譜。與傳統(tǒng)的STR遺傳標(biāo)記相比,DIP遺傳標(biāo)記突變率低且擴(kuò)增片段短,在涉及降解及混合檢材的實際案件中可以提高檢測的成功率和提供更多有價值的信息。與單核苷酸多態(tài)性遺傳標(biāo)記相比,DIP遺傳標(biāo)記分型簡單且易于在基層公安DNA實驗室推廣應(yīng)用,在法醫(yī)學(xué)個體識別及親權(quán)鑒定中具有重要作用。近年由30個常染色體DIP和1個性別鑒別位點牙釉基因組成的德國凱杰公司Investigator?DIPplex商品化試劑盒已被廣泛應(yīng)用,但是隨著研究群體的增加,學(xué)者發(fā)現(xiàn)該試劑盒中的某些位點在中國群體中的效能難以達(dá)到個體識別的要求。2020年,Liu等[8]使用德國凱杰公司Investigator?DIPplex 試劑盒評估其在陜西漢族中的多態(tài)性,結(jié)果顯示HLD39、HLD111和HLD118位點的多態(tài)信息含量均小于0.2。因此,本課題組前期篩選了在中國群體中具有較高多態(tài)性的35個DIP位點(與德國凱杰公司Investigator?DIPplex試劑盒僅有1個DIP位點rs2307433相同),基于聚合酶鏈?zhǔn)椒磻?yīng)和毛細(xì)管電泳技術(shù)成功構(gòu)建復(fù)合擴(kuò)增體系[10]。本研究針對該體系在陜西漢族中的法醫(yī)學(xué)應(yīng)用效能進(jìn)行驗證,并分析陜西漢族與29個參考群體之間的遺傳關(guān)系,揭示陜西漢族的群體遺傳學(xué)背景。
樣本收集和參考群體共采集來自陜西安康地區(qū)漢族(以下簡稱陜西漢族)305名無關(guān)健康成年個體的血樣,在對所有志愿者進(jìn)行樣本采集前均由其簽署知情同意書及填寫問卷調(diào)查表,并聲明他們3代之內(nèi)無血緣關(guān)系[9]。本研究獲得西安交通大學(xué)倫理委員會批準(zhǔn)(倫理審查編號:XJTULAC201),樣本采集和后續(xù)實驗過程均符合倫理委員會的要求。將來自國際千人基因組計劃Ⅲ期中的26個群體和既往文獻(xiàn)中已報道的我國哈薩克族[10]、柯爾克孜族[11]、蒙古族群體[12]共29個參考群體用于與陜西漢族的群體遺傳關(guān)系探究。
DNA提取、擴(kuò)增及分型應(yīng)用本課題組前期構(gòu)建的35個 DIP位點復(fù)合擴(kuò)增體系對305名個體的DNA樣本進(jìn)行直接擴(kuò)增,PCR擴(kuò)增反應(yīng)條件設(shè)置與文獻(xiàn)報道[10]一致。PCR擴(kuò)增產(chǎn)物使用3500xL基因分析儀(美國應(yīng)用生物系統(tǒng)公司)進(jìn)行毛細(xì)管電泳分離檢測。35個DIP位點使用GeneMapper ID v3.2軟件(美國應(yīng)用生物系統(tǒng)公司)進(jìn)行基因分型。
法醫(yī)學(xué)參數(shù)及群體遺傳學(xué)統(tǒng)計分析通過Genepop v4.0軟件對陜西漢族35個DIP位點進(jìn)行Hardy-Weinberg平衡檢驗以及配對位點間連鎖不平衡分析。陜西漢族35個DIP位點的插入等位基因頻率和缺失等位基因頻率、匹配概率、個體識別率、非父排除率、多態(tài)信息含量(polymorphism information content,PIC)、觀察雜合度(observed heterozygosity,Ho)和期望雜合度(expected heterozygosity,He)通過STRAF v1.0.5在線軟件進(jìn)行計算[13]。陜西漢族的35個DIP位點的法醫(yī)學(xué)參數(shù)值以及陜西漢族和29個參考群體的插入等位基因頻率熱圖,使用TBtools v1.0軟件進(jìn)行繪制[14]。使用Arlequin v3.5軟件對陜西漢族和參考群體中的35個DIP位點進(jìn)行分子方差分析[15]。陜西漢族和29個參考群體的配對群體間Nei’s遺傳距離(genetic distance,DA)和遺傳分化系數(shù)(fixation index,F(xiàn)ST)值分別通過DISPAN軟件和Arlequin v3.5軟件進(jìn)行計算[15-16]。通過MEGA v7.0軟件基于DA值,構(gòu)建陜西漢族和29個參考群體系統(tǒng)發(fā)育樹[17]。分別基于陜西漢族和29個參考群體的DA值和插入等位基因頻率值進(jìn)行多維尺度(multidimensional scaling,MDS)和主成分(principal component analysis,PCA)分析。使用STRUCTURE v2.3.4軟件對來自非洲、歐洲、美洲、南亞及東亞的30個群體進(jìn)行群體遺傳結(jié)構(gòu)分析并通過STRUCTURE HARVESTER在線軟件確定最佳K值[18-19]。
陜西漢族35個DIP位點的Hardy-Weinberg平衡檢驗和連鎖不平衡分析結(jié)果Hardy-Weinberg平衡檢驗的結(jié)果顯示,經(jīng)Bonferroni校正后,所有位點均符合 Hardy-Weinberg平衡(P>0.001)。陜西漢族35個DIP位點兩兩配對進(jìn)行連鎖不平衡分析,經(jīng)Bonferroni校正后均處于連鎖平衡狀態(tài)(P>0.001)。
陜西漢族35個DIP位點的等位基因頻率及相關(guān)法醫(yī)學(xué)參數(shù)35個DIP位點分布在除第2和16號染色體外的其他20對染色體上,每對染色體上分布有1~4個DIP位點。陜西漢族35個DIP位點插入等位基因頻率分布在0.3098(rs371194629)~0.9885(rs3054057),平均值為0.5138。為更直觀展示陜西漢族和29個參考群體的35個DIP位點等位基因頻率分布,基于陜西漢族和29個參考群體的插入等位基因頻率繪制熱圖,結(jié)果顯示陜西漢族中插入等位基因頻率分布較為均衡,除rs10629077、rs3054057位點外,其余33個DIP位點插入等位基因頻率分布在0.3~0.6。陜西漢族35個DIP位點的PIC、Ho和He范圍分別為0.0224(rs3054057)~0.3750(rs3067194、rs16678)、0.0230(rs3054057)~0.5607(rs3066543)和0.0227(rs3054057)~0.5008(rs3067194、rs16678),平均值分別為0.3588、0.4828及0.4760。除rs10629077、rs3054057位點外,其余33個DIP位點PIC值均大于0.3,Ho均大于0.4。陜西漢族35個DIP位點的累積個體識別率和非父排除概率值分別為0.999 999 999 999 991 119和0.9991。35個DIP位點在非洲群體、美洲群體、歐洲群體和南亞群體中的插入等位基因頻率均值分別為0.6198、0.5130、0.4959和0.5030。來自非洲群體、美洲群體、歐洲群體和南亞群體的累積個體識別率分別為0.999 999 999 998 084 805、0.999 999 999 999 995 974、0.999 999 999 999 971 119和0.999 999 999 999 995 435(圖1)。
陜西漢族和其他29個參考群體35個DIP位點的分子方差分析結(jié)果陜西漢族和其他29個參考群體基于35個DIP位點的分子方差分析結(jié)果顯示陜西漢族與來自東亞的中國南方漢族人(Southern Han Chinese,CHS)、中國北京漢族人(Chinese Beijing Han,CHB)和日本東京人之間不存在差異位點(P>0.001)。陜西漢族與中國西雙版納傣族人、越南胡志明市京族人和中國蒙古族人在2個位點、與中國柯爾克孜族人在7個位點、與中國哈薩克族人在14個位點中存在顯著性差異。在兩兩洲際群體的比對中,東亞群體與美洲群體、南亞群體、歐洲群體和非洲群體分別在15、21、25和30個位點中存在差異;南亞群體與美洲群體、歐洲群體和非洲群體分別在18、27、33個位點中存在差異;美洲群體與歐洲群體、非洲群體的差異位點分別為15和30個;歐洲群體和非洲群體之間存在30個差異位點(圖2)。
圖2 陜西漢族和其他8個東亞群體以及5大洲際兩兩洲際群體間基于35個DIP位點的等位基因頻率差異分析
陜西漢族和其他29個參考群體的DA、FST分析及系統(tǒng)發(fā)育分析基于35個DIP位點的等位基因分型結(jié)果計算陜西漢族和29個參考群體兩兩群體之間的DA以及FST值并繪制熱圖,結(jié)果顯示與陜西漢族之間DA值最小的參考群體為CHS(DA=0.0008),其次是CHB(DA=0.0013)。陜西漢族與美洲群體、南亞群體、歐洲群體和非洲群體的DA值分布在0.0105~0.0111、0.0090~0.0149、0.0205~0.0235 和0.0217~0.0424。FST值結(jié)果顯示陜西漢族和東亞群體之間的FST均值較小(FST<0.0163),與美洲群體、南亞群體、歐洲群體和非洲群體之間的FST均值分別為0.0321、0.0396、0.0669和0.1094(圖3)?;陉兾鳚h族和29個參考群體兩兩群體之間的DA值構(gòu)建系統(tǒng)發(fā)育樹。系統(tǒng)發(fā)育樹主要分為兩個分支,其中1個分支包括來自非洲的7個群體;另1個分支由來自東亞、南亞、美洲以及歐洲群體組成;來自南亞和歐洲的群體分別聚集在各自的子分支。陜西漢族和CHB、CHS及其他東亞群體聚集在一起,表明陜西漢族與東亞群體之間遺傳關(guān)系較近,與非洲群體遺傳關(guān)系最遠(yuǎn)(圖4)。
圖4 基于DA值構(gòu)建陜西漢族和其他29個參考群體系統(tǒng)發(fā)育樹
陜西漢族和29個參考群體間的多維尺度分析和主成分分析結(jié)果為進(jìn)一步探討陜西漢族和29個參考群體之間的群體遺傳關(guān)系,分別基于陜西漢族和29個參考群體的DA和插入等位基因頻率值進(jìn)行MDS分析和PCA分析。MDS分析顯示來自5大洲際30個群體中非洲的7個群體、歐洲的5個群體以及東亞的9個群體分別聚集在一起,在縱軸上5個南亞群體和4個美洲群體分別聚在不同的區(qū)域。陜西漢族與來自東亞群體的CHB、CHS等群體聚在一起(圖5A)。PCA分析中PC1、PC2和PC3分別可以解釋總變異的55.2%、18.7%和10.6%(圖5B、5C)。
PC:主成分
陜西漢族和29個參考群體間的遺傳結(jié)構(gòu)分析通過STRUCTURE軟件基于陜西漢族和29個參考群體的35個DIP位點的等位基因分型結(jié)果繪制K=2~7時的族群聚類圖,結(jié)果顯示最佳K值為3。當(dāng)K=2時,非洲群體主要表現(xiàn)為紅色的祖先成分;當(dāng)K=3時,非洲群體(紅色)、歐洲群體(綠色)和東亞群體(黃色)分別表現(xiàn)出不同比例的祖先成分并可以進(jìn)行區(qū)分,隨著K值增加,美洲群體和南亞群體的祖先成分比例也逐漸表現(xiàn)出差異(圖6)。三角聚類分析顯示,當(dāng)K=3時,東亞、歐洲和非洲群體中的絕大部分個體分別聚集在不同的區(qū)域,在納入陜西漢族后,來自陜西漢族的大部分個體和東亞個體重疊在一起(圖7)。
圖6 陜西漢族和其他29個參考群體基于35個DIP位點的遺傳結(jié)構(gòu)分析
圖7 K=3時應(yīng)用STRUCTURE 2.3.4軟件構(gòu)建3個洲際群體(A)、陜西漢族與3個洲際群體(B)的三角聚類圖
本研究評估了35個DIP位點在陜西漢族中的多態(tài)性和法醫(yī)學(xué)應(yīng)用效能,結(jié)果顯示陜西漢族35個DIP位點的累積個體識別率和非父排除概率值分別為0.999 999 999 999 991 119和0.9991,與既往學(xué)者通過德國凱杰公司Investigator?DIP plex試劑盒在陜西漢族(CPD=0.999 999 999 983,CPE=0.9890)[8]、成都漢族(CPD=0.999 999 999 987 8,CPE=0.9854)[20]、上海漢族(CPE=0.988)[21]群體得到的CPD、CPE值相比,這35個DIP位點表現(xiàn)出相對較高的多態(tài)性,可滿足陜西漢族的法醫(yī)學(xué)個體識別的需求,并可作為親子鑒定的有益補(bǔ)充。
此外,本研究基于35個DIP位點對陜西漢族和29個參考群體之間的群體遺傳關(guān)系進(jìn)行分析,結(jié)果顯示陜西漢族和東亞群體之間存在差異的位點數(shù)(0~14個)少于東亞群體和其他洲際群體之間存在差異的位點數(shù)(15~30個)。在與陜西漢族的比較中,DA和FST值最小的均為中國南方漢族群體。MDS和PCA分析顯示陜西漢族主要和東亞群體聚在一起。遺傳結(jié)構(gòu)分析表明陜西漢族的祖先信息組分與來自中國不同地區(qū)的漢族群體之間更為接近。本研究結(jié)果與既往學(xué)者基于30個DIP位點以及線粒體DNA遺傳標(biāo)記對于陜西漢族群體遺傳關(guān)系研究得出結(jié)論[5,8]基本相符,即陜西漢族和來自中國不同地區(qū)的漢族之間關(guān)系較密切。
本研究基于35個DIP位點對來自陜西漢族的305名個體進(jìn)行分析,結(jié)果表明大部分位點在陜西漢族中具有較高的多態(tài)性,可以作為陜西漢族個體識別的有效工具。同時,對陜西漢族的遺傳背景進(jìn)行深入分析,可為今后陜西漢族的群體遺傳研究提供生物學(xué)依據(jù)。