趙琪,李燃,金云舟,孫宏鈺,趙書民
(1.上海晶準(zhǔn)生物醫(yī)藥有限公司,上海 201114;2.中山大學(xué)中山醫(yī)學(xué)院法醫(yī)學(xué)系,廣東 廣州 510080;3.江蘇東南證據(jù)科學(xué)研究院有限公司,江蘇 南京 210042)
在親緣關(guān)系鑒定中,原假設(shè)H0(被鑒定人間為無關(guān)個(gè)體)與備擇假設(shè)H1(被鑒定人間存在所聲稱的親緣關(guān)系)是一對(duì)有機(jī)整體。在司法部頒布實(shí)施的《生物學(xué)全同胞關(guān)系鑒定實(shí)施規(guī)范》(SF/Z JD0105002—2014,以下簡(jiǎn)稱《規(guī)范》)中也規(guī)定,生物學(xué)全同胞(full sibling,F(xiàn)S)關(guān)系鑒定的參照系為無關(guān)個(gè)體[1]。同時(shí)《規(guī)范》中規(guī)定采用狀態(tài)一致性(identity by state,IBS)評(píng)分作為全同胞關(guān)系鑒定的判斷參數(shù)(以下簡(jiǎn)稱IBS評(píng)分)。目前已有學(xué)者[2]僅依據(jù)短串聯(lián)重復(fù)(short tandem repeat,STR)序列遺傳標(biāo)記等位基因的頻率數(shù)據(jù)對(duì)IBS評(píng)分在無關(guān)個(gè)體對(duì)人群中的概率分布特征進(jìn)行了描述,但作為邏輯推導(dǎo)過程的一個(gè)整體,仍需要對(duì)IBS評(píng)分在全同胞對(duì)人群中的概率分布特征進(jìn)行推導(dǎo),才可以形成完整的邏輯鏈條。
比較一對(duì)生物學(xué)全同胞(C與D)在某一常染色體STR基因座的分型結(jié)果,存在3種相互排斥的結(jié)果:有2個(gè)相同的等位基因、僅有1個(gè)等位基因相同、無相同等位基因,分別以a2=1、a1=1、a0=1表示。當(dāng)對(duì)C與D完成n個(gè)相互獨(dú)立的STR基因座分型后,則有A2為n個(gè)STR基因座上a2之和、A1為n個(gè)STR基因座上a1之和、A0為n個(gè)STR基因座上a0之和[1-2]。以ibs表示C與D在單個(gè)STR基因座上相同的等位基因個(gè)數(shù),依據(jù)a2、a1、a0的概念有:
依據(jù)人類現(xiàn)代婚配習(xí)俗,全同胞對(duì)C與D的生物學(xué)父母A與B為無關(guān)個(gè)體。在某常染色體STR基因座,A與B最少可檢出1種等位基因(以P表示),最多可檢出4種不同的等位基因(分別以P、Q、R、S表示)。A與B生育兩名個(gè)體為兩次獨(dú)立事件,在不考慮STR基因座自發(fā)突變的情形下,依據(jù)孟德爾遺傳規(guī)律,可得到A與B不同基因型組合對(duì)應(yīng)C與D在該常染色體STR基因座a2=1、a1=1、a0=1的概率見表1。
表1 親代不同基因型組合對(duì)應(yīng)全同胞對(duì)a2、a1或a0取值為1的概率
若以p2FS、p1FS、p0FS分別表示全同胞對(duì)C與D間a2、a1、a0取值為1的概率,則有:
即表1每一行對(duì)應(yīng)的兩名子代C與D不同基因型組合的概率和應(yīng)為1。
依據(jù)表1可將p2FS、p1FS、p0FS分解為:
設(shè)某STR基因座有m個(gè)等位基因,并以fi(i=1,2,3,…,m)表示該基因座上第i個(gè)等位基因的頻率,則有:
1.3.1 推導(dǎo)p2FS計(jì)算公式
1.3.1.1p2FS(HoHo)計(jì)算公式的推導(dǎo)
式(5)中p2FS(HoHo)指C與D基因型相同且均為純合子的概率,這一概率為表1中第4列各行概率值與相應(yīng)A與B基因型組合概率乘積之和,即p2FS(HoHo)可以寫作:
依據(jù)參考文獻(xiàn)[2]中無關(guān)個(gè)體對(duì)相應(yīng)基因型概率,可以得到:
1.3.1.2p2FS(HeHe)計(jì)算公式的推導(dǎo)
式(5)中p2FS(HeHe)指C與D基因型相同且均為雜合子的概率,這一概率為表1中第5列各行概率值與相應(yīng)A與B基因型組合概率乘積之和,即p2FS(HeHe)可以寫作:
依據(jù)參考文獻(xiàn)[2]中無關(guān)個(gè)體對(duì)相應(yīng)基因型概率,可以得到:
所以,依據(jù)式(5)可以得到:
1.3.2 推導(dǎo)p1FS計(jì)算公式
1.3.2.1p1FS(HoHe)計(jì)算公式的推導(dǎo)
式(6)中p1FS(HoHe)指C與D在該基因座只有1個(gè)相同的等位基因且兩者1個(gè)為純合子、1個(gè)為雜合子的概率,這一概率為表1中第6列各行概率值與相應(yīng)A與B基因型組合概率乘積之和,即p1FS(HoHe)可以寫作:
依據(jù)參考文獻(xiàn)[2]中無關(guān)個(gè)體對(duì)相應(yīng)基因型概率,可以得到:
1.3.2.2p1FS(HeHe)計(jì)算公式的推導(dǎo)
式(6)中p1FS(HeHe)指C與D在該基因座只有1個(gè)相同的等位基因且兩者均為雜合子的概率,這一概率為表1中第7列各行概率值與相應(yīng)A與B基因型組合概率乘積之和,即p1FS(HeHe)可以寫作:
依據(jù)參考文獻(xiàn)[2]中無關(guān)個(gè)體對(duì)相應(yīng)基因型概率,可以得到:
所以,依據(jù)式(6)可以得到:
1.3.3 推導(dǎo)p0FS計(jì)算公式
1.3.3.1p0FS(HoHo)計(jì)算公式的推導(dǎo)
式(7)中p0FS(HoHo)指C與D無相同等位基因且兩者均為純合子的概率,這一概率為表1中第8列各行概率值與相應(yīng)A與B基因型組合概率乘積之和,即p0FS(HoHo)可以寫作:
依據(jù)參考文獻(xiàn)[2]中無關(guān)個(gè)體對(duì)p2(HeHe)概率,可以得到:
1.3.3.2p0FS(HoHe)計(jì)算公式的推導(dǎo)
式(7)中p0FS(HoHe)指C與D無相同等位基因且兩者1個(gè)為純合子、1個(gè)為雜合子的概率,這一概率為表1中第9列各行概率值與相應(yīng)A與B基因型組合概率乘積之和,即p0FS(HoHe)可以寫作:
依據(jù)參考文獻(xiàn)[2]中無關(guān)個(gè)體對(duì)p1(HeHe)概率,可以得到:
1.3.3.3p0FS(HeHe)計(jì)算公式的推導(dǎo)
式(7)中p0FS(HeHe)指C與D無相同等位基因且兩者均為雜合子的概率,這一概率為表1中第10列各行概率值與相應(yīng)A與B基因型組合概率乘積之和,即p0FS(HeHe)可以寫作:
依據(jù)參考文獻(xiàn)[2]中無關(guān)個(gè)體對(duì)p0(HeHe)概率,可以得到:
所以,依據(jù)式(7)可以得到:
依據(jù)1.1節(jié)中關(guān)于a2、a1、a0的定義可知,對(duì)生物學(xué)全同胞對(duì)C與D采用包含n個(gè)相互獨(dú)立的STR基因座進(jìn)行分型檢測(cè),a2=1這樣的事件所發(fā)生的次數(shù)(即A2FS)服從總體率為p2FS的二項(xiàng)分布,可記作A2~B(n,p2FS)[3]。同樣的,A1FS服從總體率為p1FS的二項(xiàng)分布,記作A1~B(n,p1FS)[3]。其中p2FS為 1.3.1 節(jié)推導(dǎo)得到的各STR基因座p2FSl(l=1,2,…,n)的算術(shù)平均數(shù),p1FS為1.3.2節(jié)推導(dǎo)到各STR基因座p1FSl(l=1,2,…,n)的算術(shù)平均數(shù),即有:
依據(jù)式(3)和二項(xiàng)分布的可加性[3],IBS亦為服從二項(xiàng)分布的變量。對(duì)于包含n個(gè)相互獨(dú)立的STR基因座的分型系統(tǒng)而言,IBS的最大值為2n,則IBS服從總體率為π1的二項(xiàng)分布:IBS~B(2n,π1)。
全同胞對(duì)人群中IBS的期望值E(IBS)為:
全同胞對(duì)人群中IBS的總體率π1為:
1.5.1FGA等19個(gè)必檢STR基因座對(duì)應(yīng)各參數(shù)二項(xiàng)分布特征
采用參考文獻(xiàn)[4-5]中對(duì)《規(guī)范》中FGA等19個(gè)必檢STR基因座在華東漢族人群中的等位基因頻率,依據(jù)每一STR各自的等位基因頻率和1.3節(jié)推導(dǎo)得到的計(jì)算公式,可以分別計(jì)算出各個(gè)STR基因座對(duì)應(yīng)的p2FS、p1FS、p0FS值,進(jìn)而得到各參數(shù)在全同胞對(duì)人群中的分布特征(表2)。依據(jù)IBS分布特征可得到相應(yīng)參數(shù)在全同胞對(duì)人群中的分布曲線(圖1)。
表2 華東漢族人群FGA等19個(gè)STR基因座對(duì)應(yīng)各參數(shù)在不同研究人群中的二項(xiàng)分布特征
圖1 《規(guī)范》中19個(gè)必檢基因座分型系統(tǒng)對(duì)應(yīng)全同胞對(duì)與無關(guān)個(gè)體對(duì)的IBS二項(xiàng)分布
1.5.2 全同胞鑒定中遺傳學(xué)證據(jù)價(jià)值評(píng)估示例
當(dāng)兩名被鑒定人采用FGA等19個(gè)《規(guī)范》中規(guī)定的必檢STR基因座進(jìn)行分型后,依據(jù)表1可知,IBS在無關(guān)個(gè)體對(duì)人群中符合二項(xiàng)分布IBS~B(38,0.3110),在全同胞對(duì)人群中符合二項(xiàng)分布IBS~B(38,0.6280)。當(dāng)全同胞對(duì)C與D經(jīng)FGA等19個(gè)必檢STR基因座分型后,若IBS評(píng)分為10,采用Excel軟件中的二項(xiàng)分布函數(shù),輸入 BINOM.DIST(10,38,0.311 0,F(xiàn)ALSE),得到兩者為無關(guān)個(gè)體的概率為pH0=0.11812960,輸入BINOM.DIST(10,38,0.6280,F(xiàn)ALSE),得到兩者為全同胞對(duì)的概率為pH1=0.00000426。因此,兩者的生物學(xué)全同胞關(guān)系似然比(likelihood ratio,LR)為:
生物學(xué)全同胞相對(duì)概率為:
即兩者為全同胞的概率是兩者為無關(guān)個(gè)體概率的3.61×10-5倍(或兩者為無關(guān)個(gè)體的概率約是兩者為全同胞概率的27730倍),兩者的全同胞相對(duì)概率為0.000 036 06(或兩者的無關(guān)個(gè)體相對(duì)概率為0.99996394)。
1.5.3 對(duì)《規(guī)范》中FGA等19個(gè)必檢STR基因座生物學(xué)全同胞檢驗(yàn)系統(tǒng)效能的評(píng)估
依據(jù)《規(guī)范》中對(duì)檢驗(yàn)FGA等19個(gè)必檢STR基因座時(shí)的判斷閾值,采用1.5.1節(jié)中所示IBS在無關(guān)個(gè)體對(duì)人群與全同胞對(duì)人群中的二項(xiàng)分布特征可得到:
IBS≤13的真無關(guān)個(gè)體概率為:BINOMDIST(13,38,0.311 0,TRUE)≈0.726 8;近似為圖1所示無關(guān)個(gè)體對(duì)人群對(duì)應(yīng)曲線的IBS≤13的曲線下面積。
IBS≥22的真全同胞概率為:1-BINOMDIST(21,38,0.6280,TRUE)≈0.7876;近似為圖1所示全同胞對(duì)人群對(duì)應(yīng)曲線的IBS≥22的曲線下面積。
IBS≤13的全同胞(誤判為無關(guān)個(gè)體)概率為:BINOMDIST(13,38,0.628 0,TRUE)≈0.000 3;近似為圖1所示全同胞對(duì)人群對(duì)應(yīng)曲線的IBS≤13的曲線下面積。
IBS≥22的無關(guān)個(gè)體(誤判為全同胞)概率為:1-BINOMDIST(21,38,0.311 0,TRUE)≈0.000 6;近似為圖1所示無關(guān)個(gè)體對(duì)人群對(duì)應(yīng)曲線的IBS≥22的曲線下面積。
因此,檢驗(yàn)FGA等19個(gè)必檢STR基因座時(shí)能夠得到傾向性意見的概率(靈敏度,即系統(tǒng)效能)約為:(0.7268+0.7876)/2=0.7572;得到的傾向性意見的平均誤判率約為:(0.0003+0.0006)/2=0.00045。
本研究依據(jù)IBS評(píng)分在無關(guān)個(gè)體對(duì)人群中的分布規(guī)律[2]以及常染色體STR基因座的遺傳符合孟德爾遺傳規(guī)律,推導(dǎo)得到了IBS評(píng)分在生物學(xué)全同胞對(duì)人群中的二項(xiàng)分布特征。之所以能夠依據(jù)IBS評(píng)分在無關(guān)個(gè)體對(duì)人群中的二項(xiàng)分布規(guī)律來推導(dǎo)該參數(shù)在生物學(xué)全同胞對(duì)人群中的二項(xiàng)分布特征,是建立在一個(gè)相對(duì)穩(wěn)固的假設(shè)前提之上,即:依照現(xiàn)代人類社會(huì)的婚配習(xí)俗,生物學(xué)全同胞的父母間應(yīng)為無關(guān)個(gè)體。另外,對(duì)于一個(gè)足夠大的群體(如我國(guó)漢族總?cè)丝冢﹣碚f,可以認(rèn)為該群體符合Hardy-Weinberg平衡。這兩個(gè)相對(duì)穩(wěn)固的假設(shè)前提構(gòu)成了推導(dǎo)IBS評(píng)分在無關(guān)個(gè)體對(duì)人群與生物學(xué)全同胞對(duì)人群中的二項(xiàng)分布特征的基礎(chǔ)[6-11]。
從圖1可以看到,當(dāng)采用《規(guī)范》推薦的FGA等19個(gè)必檢STR基因座時(shí),IBS評(píng)分在無關(guān)個(gè)體對(duì)人群與生物學(xué)全同胞對(duì)人群中的概率分布仍有不小的重疊區(qū)間,這是《規(guī)范》在給出生物學(xué)全同胞鑒定意見時(shí),單獨(dú)給出一個(gè)“無法給出傾向性意見”區(qū)間的原因。例如,采用FGA等19個(gè)必檢STR基因座對(duì)一對(duì)個(gè)體進(jìn)行檢驗(yàn)后,當(dāng)IBS=18時(shí),依據(jù)參考文獻(xiàn)[2]和本文所給出的IBS評(píng)分在無關(guān)個(gè)體對(duì)人群和生物學(xué)全同胞對(duì)人群中的二項(xiàng)分布特征,采用Excel二項(xiàng)分布函數(shù),可得到兩者為無關(guān)個(gè)體的概率約為0.0145、為生物學(xué)全同胞的概率約為0.0200,兩者為生物學(xué)全同胞的概率僅為兩者為無關(guān)個(gè)體的概率的1.38倍。而當(dāng)IBS=13時(shí),兩者為無關(guān)個(gè)體的概率約為0.124 5,為生物學(xué)全同胞的概率約為0.000 2,兩者為無關(guān)個(gè)體的概率是兩者為生物學(xué)全同胞概率的622.5倍;當(dāng)IBS=22時(shí),兩者為無關(guān)個(gè)體的概率約為0.0004,為生物學(xué)全同胞的概率約為0.1074,兩者為生物學(xué)全同胞的概率是兩者為無關(guān)個(gè)體概率的268.5倍。這也是《規(guī)范》中當(dāng)檢驗(yàn)FGA等19個(gè)必檢基因座時(shí),分別設(shè)定IBS≤13(傾向于兩名被鑒定人為無關(guān)個(gè)體)、IBS≥22(傾向于兩名被鑒定人為生物學(xué)全同胞)兩個(gè)閾值的原因,同時(shí)這也是《規(guī)范》中8.2條款的依據(jù)。
1.5.3節(jié)對(duì)《規(guī)范》中檢驗(yàn)FGA等19個(gè)STR基因座對(duì)應(yīng)的判斷標(biāo)準(zhǔn)的系統(tǒng)效能進(jìn)行了詳細(xì)的解釋。對(duì)于一個(gè)特定的分型系統(tǒng)(一組STR基因座組合)來說,對(duì)一個(gè)給定的判斷標(biāo)準(zhǔn)均應(yīng)對(duì)其判斷的效能進(jìn)行評(píng)估,包括這一判斷標(biāo)準(zhǔn)的靈敏度和平均誤判率等指標(biāo)。但在具體個(gè)案中,因?yàn)橐褭z出特定的IBS值,則可采用IBS值在相應(yīng)人群中的二項(xiàng)分布直接計(jì)算兩種假設(shè)對(duì)應(yīng)的概率值,參照傳統(tǒng)的法醫(yī)學(xué)證據(jù)價(jià)值評(píng)估方法對(duì)個(gè)案中的遺傳學(xué)證據(jù)價(jià)值進(jìn)行評(píng)估,正如1.5.2節(jié)所示。
至此,依據(jù)參考文獻(xiàn)[2]以及本文研究結(jié)果,已得到生物學(xué)全同胞鑒定中原假設(shè)(H0,被檢驗(yàn)的兩名個(gè)體為無關(guān)個(gè)體)與備擇假設(shè)(H1,被檢驗(yàn)的兩名個(gè)體為生物學(xué)全同胞)的概率計(jì)算工具。當(dāng)檢驗(yàn)任意符合《規(guī)范》要求的STR基因座組合時(shí),依據(jù)該組計(jì)算工具以及STR基因座在相應(yīng)人群中的等位基因頻率,即可計(jì)算出任意IBS評(píng)分所對(duì)應(yīng)的兩名被鑒定人為無關(guān)個(gè)體和為生物學(xué)全同胞的概率,并能對(duì)相應(yīng)的系統(tǒng)檢驗(yàn)效能加以評(píng)估,從而實(shí)現(xiàn)《規(guī)范》的靈活應(yīng)用。