丁光樹,孫 輝,孫 敬,袁麗萍,莫曉婷,宋 文,尚 蕾,李萬水
(公安部鑒定中心,北京 100038)
Y-STR遺傳標(biāo)記已廣泛應(yīng)用于男性家系排查[1],對多起大案要案的偵破發(fā)揮了重要作用。由于突變的存在,利用Y-STR進(jìn)行家系排查,通常需要遵循一定的評判標(biāo)準(zhǔn)[2]。有研究人員提出,對于兩個Yfiler Plus單倍型,差異基因座不超過4個或總突變步數(shù)不超過5時,不應(yīng)排除來源于同一家系的可能性[3]。另有研究指出,當(dāng)檢驗的Y-STR基因座數(shù)量增加至30個以上且包含較多的高突變率Y-STR基因座(RM Y-STR)時,同一家系男性個體間Y-STR的分型容差可達(dá)6個/步[4]甚至7個/步[5]。當(dāng)然,這其中主要考慮的是單拷貝Y-STR基因座,其容差的產(chǎn)生往往來源于DNA復(fù)制滑動引起的等位基因突變。而對于核心重復(fù)序列結(jié)構(gòu)復(fù)雜、分布于染色體上多個位置的多拷貝Y-STR基因座[6]而言,情況可能截然不同?,F(xiàn)有一起案件,其檢材的多個多拷貝Y-STR基因座疑似存在拷貝丟失的情況,很可能源于Y染色體的片段缺失。為分析驗證,本文設(shè)計系列實驗,探討了利用內(nèi)參基因拷貝數(shù)變化輔助判斷多拷貝Y-STR基因座拷貝數(shù)的方法,提出了多拷貝Y-STR在家系排查中的初步評判方案,以期為后續(xù)有關(guān)案件的偵查提供思路。
1998年,某省某市一女性被殺。2021年,辦案機關(guān)將待排查血樣送至公安部物證鑒定中心進(jìn)行Y-STR檢驗。經(jīng)利用自制DNATyperTMY36、MCY、RMY等Y-STR試劑盒檢驗,僅從分型上看,獲得了與現(xiàn)場物證容差在3以內(nèi)的樣本69份(含0容差樣本5份)。
在向當(dāng)?shù)毓矙C關(guān)反饋家系樣本排查結(jié)果時,需要計算排查樣本與現(xiàn)場DNA分型之間存在的容差。從電泳圖譜(圖1)看,大量排查樣本與現(xiàn)場DNA在DYF399S1基因座上存在分型差異,且該基因座僅出現(xiàn)了1個“等位”基因(“等位”用以區(qū)別于常染色體上的真正等位基因,下同)(表1)。DYF399S1基因座為三拷貝基因座[7],那么,一個“等位”基因的出現(xiàn)可能是由于該基因座三個拷貝“等位”基因分型一致,也可能是出現(xiàn)了拷貝丟失。但是僅根據(jù)分型圖譜,很難判定拷貝是否丟失及其丟失的數(shù)量,因此會影響到對于現(xiàn)場物證與排查樣本是否來自于同一家系的判斷。
進(jìn)一步分析Y-STR毛細(xì)管電泳檢驗圖譜發(fā)現(xiàn),排查樣本在其他多拷貝基因座的分型似乎也存在異常(圖1)。初步比較同一基因座中不同“等位”基因的檢測峰面積發(fā)現(xiàn),大量樣本在DYS464、DYF371基因座(均為四拷貝基因座)[8-9]中分別檢測到了疑似3個拷貝(表1)。
結(jié)合多拷貝基因座DYF399S1、DYS464、DYF371 在Y染色體上的位置推測:這些樣本可能在Y染色體上存在片段缺失,在DYF399S1基因座可能只存在1~2個拷貝。
圖1 部分家系排查樣本(A、B、C)在DYF399S1、DYS464、DYF371基因座的分型圖譜Fig. 1 Profiling genotypes of three Y-STR loci (DYF399S1, DYS464, DYF371) from certain samples (A, B, C) of case
表1 部分排查樣本在多拷貝Y-STR基因座(DYF399S1、DYS464、DYF371)的分型情況Table 1 Profiled genotypes of multicopy Y-STR loci (DYF399S1, DYS464, DYF371) from certain samples of case
為進(jìn)一步驗證上述案件排查樣本中3個多拷貝Y-STR基因座的“等位”基因缺失情況,研究3個多拷貝Y-STR基因座缺失規(guī)律,在回溯近期幾起案件排查樣本的電泳圖譜后,綜合選取了疑似分型異常(圖2)的樣本40份用于后續(xù)研究。
用MCY試劑盒重復(fù)檢驗后,將這些樣本根據(jù)峰型特征初步分為4類,其中,第1類樣本10份,第2類樣本20份,第3類樣本9份,這3類樣本均各來自于同一地區(qū),第4類樣本僅1份。4類樣本在3個多拷貝Y-STR基因座的拷貝數(shù)根據(jù)分型圖譜中各“等位”基因峰面積比進(jìn)行初步推測(表2),以男性基因組標(biāo)準(zhǔn)品(9948)作為正常分型 參照。
圖2 4類多拷貝Y-STR基因座分型異常樣本的典型電泳圖譜Fig. 2 Typical electropherograms of 3 multicopy Y-STR loci from 4 kinds of abnomal profiling samples
表2 4類多拷貝Y-STR基因座分型異常樣本的推測拷貝數(shù)Table 2 Speculated copies of 3 multicopy Y-STR loci from 4 kinds of abnomal profiling samples
2.2.1 內(nèi)參基因的選擇
根據(jù)文獻(xiàn)調(diào)研,選取可用于分別表征DYF399S1、 DYS464和DYF371基因座拷貝數(shù)變化的3個內(nèi)參基因:BPY2[10]、DAZ[11]和CDY1[12],通過對此3個內(nèi)參基因拷貝數(shù)的檢測推斷相應(yīng)多拷貝Y-STR基因座的拷貝數(shù)。
內(nèi)參基因選取原則如下:1)其拷貝數(shù)與所表征的多拷貝Y-STR基因座拷貝數(shù)相同,且相應(yīng)拷貝在Y染色體上位置很近(40 kb以內(nèi))(圖3),發(fā)生缺失或重復(fù)時,二者拷貝數(shù)也應(yīng)同步變化。2)其在基因組中有相應(yīng)的同源基因且同源基因拷貝數(shù)確定并基本不變。BPY2DP[10]、DAZL[11]和CDY2[12]分別為BPY2、DAZ和CDY1的同源基因(表3)。
設(shè)計三對引物,分別擴增三個內(nèi)參基因及其同源基因:BPY2(BPY2DP)、DAZ(DAZL)、CDY1(CDY2),利用擴增片段長度差異和毛細(xì)管電泳區(qū)分內(nèi)參基因和同源基因,通過內(nèi)參基因與其同源基因檢測峰面積比(檢測值)判斷內(nèi)參基因的拷貝數(shù),進(jìn)而推斷DYF399S1、DYS464和DYF371基因座的拷貝數(shù)(表3)。
在未發(fā)生Y染色體片段缺失(或重復(fù))的樣本中(比如9948基因組標(biāo)準(zhǔn)品),理論上3個內(nèi)參基因與其同源基因經(jīng)擴增、檢測后,預(yù)期峰面積比應(yīng)分別為3∶1、4∶2、2∶2(表3)。同理,對于四類分型異常樣本,內(nèi)參基因與其同源基因的預(yù)期峰面積比(預(yù)期值)可以根據(jù)表2中的多拷貝Y-STR推測拷貝數(shù)演算。
BPY2(BPY2DP)基因的引物根據(jù)UCSC網(wǎng)站(http://genome.ucsc.edu/)參考序列設(shè)計,而DAZ(DAZL)和CDY1(CDY2)基因的引物序列則參考文獻(xiàn)[13],上游引物均用6-FAM染料進(jìn)行標(biāo)記。
2.2.2 實驗過程
研究選用10 μL擴增體系,其中2×Master Mix 5 μL,上下游引物4 μL,模板:男性基因組標(biāo)準(zhǔn)品(9948)0.2 ng、四類分型異常樣本血卡(0.5 mm直徑) 1片。PCR擴增程序如下:94 ℃、5 min;94 ℃、40 s,56 ℃、30 s,72 ℃、40 s,28個循環(huán);60 ℃、20 min。擴增產(chǎn)物以ABI 3500XL型遺傳分析儀經(jīng)毛細(xì)管電泳檢測和GeneMapper ID-X v.1.5軟件數(shù)據(jù)分析,統(tǒng)計計算各樣本關(guān)于BPY2(BPY2DP)、DAZ(DAZL)、CDY1(CDY2)基因的檢測峰面積比。
圖3 部分多拷貝Y-STR基因座及本文所用3個內(nèi)參基因的染色體位置分布示意圖[12]Fig. 3 Schematic for Y chromosomal locations of certain multicopy Y-STR loci and 3 reference genes [12] for this research
表3 9948中3個內(nèi)參基因與其同源基因預(yù)期峰面積比Table 3 Expected ratios of peak area from each of 3 reference genes to that of their respective homologous gene from 9948
通過上述實驗,獲得9948及4類分型異常樣本在BPY2(BPY2DP)、DAZ(DAZL)和CDY1(CDY2) 基因的檢測峰面積比值(檢測值),部分結(jié)果見表4??傮w而言,檢測值與預(yù)期值基本相符。因此,研究選取的BPY2、DAZ和CDY1基因,基本上可用于分別表征DYF399S1、DYS464和DYF371基因座的拷貝數(shù)變化。這或可作為將來案件排查樣本有關(guān)多拷貝基因座準(zhǔn)確判型的一種簡便 方法。
第2類20份樣本選取自本文1.1中所述的69份案件排查樣本,均來自于同一家系。對于個別樣本在DYS464基因座表現(xiàn)出的1個“等位”基因(表2),根據(jù)DAZ(DAZL)的檢測結(jié)果(表4),可以判定此類樣本在DYS464基因座僅缺失了1個拷貝,也就是說電泳圖譜表現(xiàn)出的單峰實際上代表3個拷貝,這也驗證了我們之前的推測拷貝數(shù)(表2)。根據(jù)BPY2(BPY2DP)的檢測結(jié)果,可以判定第2類樣本均在DYF399S1基因座缺失了2個拷貝,電泳圖譜(圖1)中的1個峰實際上就代表DYF399S1的1個拷貝。至此,可以確定現(xiàn)場物證與排查樣本在DYF399S1基因座的拷貝數(shù)是一致的,嫌疑人很可能來自于0容差樣本所在家系。
本研究也發(fā)現(xiàn)3份樣本(1-3號、2-2號、4-1號)在部分內(nèi)參基因的檢測值與預(yù)期值之間存在差異(表4)。如4-1號(第4類異常分型的1號)樣本在DAZ(DAZL)基因的峰面積比檢測值約為6∶2,也就是說DAZ基因可能是增加了2個拷貝,相應(yīng)地,DAZ表征的DYS464應(yīng)該也增加了2個拷貝。因此,有理由推測4-1號樣本在DYS464分型圖譜(圖2)中表現(xiàn)出的二“等位”基因型,實際上分別代表4個拷貝(AAAA)和2個拷貝(BB),而不是表2中推測的3個拷貝(AAB)。其他2份樣本的檢測結(jié)果異??赡芘c其特殊的缺失類型或者內(nèi)參基因引物結(jié)合區(qū)變異有關(guān),具體原因有待進(jìn)一步探究。
多拷貝Y-STR基因座的各“等位”基因命名方法主要有兩種:1)僅根據(jù)觀察到的“等位”基因片段大小直接命名的C型命名法(conservative approach)。2)結(jié)合觀察到的“等位”基因片段大小及其峰高比例進(jìn)行命名的E型命名法(expanded typing method)。
對于三拷貝及以上的基因座而言,兩種命名方法的結(jié)果存在較大差異,E型命名法獲得的單倍型數(shù)目往往更多,但是僅根據(jù)峰型高低判斷也更易產(chǎn)生分型誤差[6]。
表4 9948和部分多拷貝Y-STR基因座分型異常樣本的內(nèi)參基因檢測結(jié)果Table 4 Results of reference genes from both 9948 and 4 kinds of abnomal profiling samples bearing multicopy Y-STR loci
隨著多拷貝Y-STR 基因座在案件排查中的應(yīng)用越來越廣,異常分型將會更多地出現(xiàn),這對于分型結(jié)果的判定和解釋會帶來更多的困難。張文瓊等[14]對DYF387S1、DYF399S1、DYF403S1、DYF404S1四個多拷貝基因座在湖北漢族252名無關(guān)男性個體中的異常分型進(jìn)行了研究,觀測到的異常分型發(fā)生率高達(dá)7.94%,遠(yuǎn)高于傳統(tǒng)試劑盒中Y-STR多“等位”基因的發(fā)生率。
Y染色體的男性特異區(qū)域(male-specific region of the human Y chromosome, MSY)主要由八大回文序列構(gòu)成[12]。分析多拷貝Y-STR基因座的Y染色體位置(圖3),發(fā)現(xiàn)這些基因座大多分布于AZF(azoospermia factor,無精癥因子)區(qū)域中的AZFb和AZFc亞區(qū),這兩個區(qū)域主要由五大回文序列和一些反向重復(fù)序列構(gòu)成。AZFc區(qū)域缺失或重復(fù)事件的出現(xiàn),往往為非等位同源重組(non-allelic homologous recombination,NAHR)所致。在精子生成的過程中,AZFc區(qū)域中位置不同但序列相似的片段(block)之間可能發(fā)生重排,導(dǎo)致產(chǎn)生各類染色體結(jié)構(gòu)變化如缺失、重復(fù)、易位、倒位等[15],這也是多拷貝Y-STR 基因座異常分型出現(xiàn)頻率較高的潛在原因。
對于多拷貝Y-STR基因座判型標(biāo)準(zhǔn),現(xiàn)提出以下建議,供大家參考。
1)對于DYF387S1、DYS527等兩拷貝基因座,建議都采用E 型命名法,根據(jù)同一基因座內(nèi)各“等位”基因的峰型和峰高、結(jié)合不同基因座間峰高比(或峰面積比)進(jìn)行判型。
2)對 于DYF399S1、DYS464和DYF371等 三拷貝及以上的基因座,僅根據(jù)峰型高低判型,難度較大且有可能錯誤判型。根據(jù)峰高、峰型初步判斷其拷貝數(shù)可能存在異常時,建議采用其他方法(如qPCR、NGS等)對拷貝數(shù)進(jìn)行驗證,從而準(zhǔn)確判型。比如本文通過對分型異常樣本中3個內(nèi)參基因拷貝數(shù)的檢測,輔助推斷DYF399S1、DYS464、DYF371這3個多拷貝Y-STR的拷貝數(shù)。
3)基于以上兩點,建議對發(fā)生缺失(或重復(fù))的Y染色體區(qū)段進(jìn)行分析,結(jié)合各多拷貝Y-STR在Y染色體上的位置分布,綜合判定各個多拷貝Y-STR的拷貝數(shù)與分型。比如位于AZFc區(qū)域(圖3)的DYS527、DYF387S1、DYF383S1、DYF404S1、DYS459這5個兩拷貝基因座的拷貝數(shù)一般會同步增減。
Zhang等[16]對AZFc區(qū)域常見的gr/gr缺失在東亞人群的發(fā)生頻率進(jìn)行研究發(fā)現(xiàn),東亞人群中g(shù)r/gr 缺失的頻率(約8%)遠(yuǎn)高于歐美人群,并且這種AZFc區(qū)域的部分缺失通常并不影響東亞男性的生精能力。Zhang等[16]還發(fā)現(xiàn),在研究選取的我國八個不同民族群體內(nèi)部,gr/gr缺失頻率也存在顯著差異,湖南土家族和甘肅漢族群體缺失頻率最高(15.3%),而在廣西瑤族群體中沒有發(fā)現(xiàn)缺失。盡管AZFc區(qū)域部分缺失可能并不影響生育能力,但是會導(dǎo)致多拷貝Y-STR基因座出現(xiàn)異常分型,并且能遺傳給下一代。因此,在我國不同地區(qū)與不同民族間,多拷貝Y-STR基因座出現(xiàn)異常分型的頻率和類型很可能也存在較大差異。
本研究所涉多起案件排查樣本中發(fā)現(xiàn)多拷貝Y-STR基因座存在拷貝數(shù)缺失,這提示對于男性家系排查的標(biāo)準(zhǔn)應(yīng)重新審視。已報道的家系排查參考標(biāo)準(zhǔn)大多針對單拷貝Y-STR基因座,其對“等位”基因突變的考慮相對簡單?,F(xiàn)在,大量的家系排查實踐加入了對多拷貝Y-STR基因座的檢驗,由于Y染色體AZFc區(qū)域部分缺失(或重復(fù))導(dǎo)致的多拷貝Y-STR基因座異常分型出現(xiàn)概率增大,對異常分型的準(zhǔn)確解釋及利用應(yīng)引起足夠的重視,在進(jìn)行家系排查時,多拷貝Y-STR的異常分型或許可以作為一種重要的家系、民族、地域特征。
在此,我們初步提出家系排查中涉及多拷貝Y-STR基因座的判定方案:
1)現(xiàn)場檢材與排查樣本僅在某一個多拷貝Y-STR基因座分型存在差異時,建議采用不同試劑盒進(jìn)行驗證,排除引物結(jié)合區(qū)堿基突變造成拷貝數(shù)減少的可能。由于2個以上Y-STR基因座引物結(jié)合區(qū)同時發(fā)生突變的概率很低,因此建議結(jié)合其他Y-STR進(jìn)一步判定是否存在缺失。
2)現(xiàn)場檢材與排查樣本在多個多拷貝Y-STR基因座的分型均無缺失(或重復(fù)),從零容差樣本所在家系開始,按容差數(shù)依次展開排查。
3)現(xiàn)場檢材在多個多拷貝Y-STR基因座分型均無缺失(或重復(fù)),而家系排查樣本在多個多拷貝基因座中存在分型缺失(或重復(fù)),則排除該家系的可能性較大;反之亦然。
4)現(xiàn)場檢材與排查樣本的多個多拷貝Y-STR基因座分型均存在缺失(或重復(fù)),且缺失(或重復(fù))類型基本一致,那么來源于同一家系的可能性較大。
5)對于2、3、4中提到的多個多拷貝Y-STR基因座的具體個數(shù),應(yīng)綜合分析檢驗的多拷貝Y-STR基因座數(shù)量和出現(xiàn)缺失(或重復(fù))的多拷貝Y-STR在染色體上的位置分布與連鎖情況,視情況而定。
上述判定依據(jù)將在今后的實際案件中做進(jìn)一步驗證,并嘗試通過STS、SNV等標(biāo)記對不同地區(qū)、不同民族人群的多拷貝Y-STR的缺失/重復(fù)模式進(jìn)行更為精細(xì)的研究,以期能為相關(guān)案件的排查提供更具指向性的線索。