摘要:探討模擬群體數(shù)和STR對同胞似然比(LR)的影響,為法醫(yī)遺傳學(xué)中LR臨界值的確定提供依據(jù),可作為參考。用家庭S3軟件模擬100~100萬對全同胞,分別有15、19、29和39個STR,觀察似然比(LR)的分布及陽性率、陰性率、假陽性率、假陰性率的變化。事實證明當(dāng)模擬種群數(shù)量超過105個時,LR值分別為99%、95%、5%和1%,當(dāng)模擬種群數(shù)量低于104個時,LR值波動較大,并且范圍很大。當(dāng)似然比為1時,15個STR系統(tǒng)的靈敏度為98.01%~99.0%;對19個STR系統(tǒng)進(jìn)行了分析,結(jié)果為99.0% - 99.3%;29個STR系統(tǒng)占99%~99.85%;39個STR系統(tǒng)占99.93%~100%。當(dāng)似然比為1時,所有被試實驗題的假陽性率為:15個STR系統(tǒng)的假陽性率為1.7225,19個STR系統(tǒng)的假陽性率為0.7370,29個STR系統(tǒng)的假陽性率為0.1311,39個STR系統(tǒng)的假陽性率為0.0593。當(dāng)STR基因座數(shù)變化時,LR值也在變化,主要變現(xiàn)為:由15個增加到39個時,LR值的中位數(shù)、均值、最大值、最小值、99%、95%、5%、5%,1%,標(biāo)準(zhǔn)差也相應(yīng)增加。從而得出模擬種群規(guī)模是影響LR分布的重要因素;在一定數(shù)量的人群中,識別系統(tǒng)在檢測系統(tǒng)中增加STR的數(shù)目,可以獲得更好更高的LR值。
關(guān)鍵詞:模擬數(shù)量變化;全同細(xì)胞;似然比
除了傳統(tǒng)的親子鑒定,他們提供的基因信息較少和被鑒定人的特殊性,對復(fù)雜的親屬關(guān)系進(jìn)行識別細(xì)胞總數(shù)有一定差距,由于能力有限,一般無法完成更多的仿真數(shù)據(jù)。因為目前在法醫(yī)遺傳學(xué)領(lǐng)域沒有系統(tǒng)的公式和觀點,所以需要更嚴(yán)謹(jǐn)、更科學(xué)的統(tǒng)計數(shù)字來確定全體同胞之間的關(guān)系。
本研究的目的是,在大樣本數(shù)據(jù)的基礎(chǔ)上進(jìn)行模擬和親合方法遺傳學(xué)中,評價不同STR系親緣關(guān)系概率的計算,總模擬量對全民辨識似然比的影響。家族3是根據(jù)DNA數(shù)據(jù)推斷親子鑒定概率計算的自由軟件,利用傳統(tǒng)的似然比可以計算和模擬最大項數(shù),可以模擬106對數(shù)據(jù)。本文采用家族3軟件模塊,共提出100至100萬對全同胞,分別為15人、19人、29人和39人STR系統(tǒng)識別同胞時,不同模擬數(shù)的似然比的差異。
1.材料及方法
1.1建立假設(shè)實驗
本研究采用家庭3軟件對四種不同的STR,進(jìn)行分析模擬了100到100萬對全同胞數(shù)據(jù),它們是:15個STR系統(tǒng)(ABI標(biāo)識符),19個STR系統(tǒng);29 STR系統(tǒng);39 個STR系統(tǒng),這些系統(tǒng)全部是商用的. 在模擬試驗中,設(shè)置相應(yīng)的全參數(shù)同胞個體和無關(guān)個體。到目前為止,可以建立以下兩個測試假設(shè):
原始假設(shè)H0:個體1和2是同胞(在生物學(xué)方面,他們有同一個生父和同一個生母。)
備選假設(shè):個體1和個體2沒有任何關(guān)系,就是兩者之間不會同一個生父。
1.2、參數(shù)設(shè)置
模擬實驗前,在軟件家族3中設(shè)定以下這幾個參數(shù):①忽略系統(tǒng)中等位基因的檢測突變;②群體遺傳指數(shù)設(shè)為0;③在軟件中,將先驗參數(shù)設(shè)置為默認(rèn)值;④設(shè)定可能性比值(LR)的范圍為0.1到1×108.模擬次數(shù)為100,1×103,1×104,1×105和1×106。收集統(tǒng)計所有的模擬數(shù)據(jù),結(jié)果包括單個1和2的輸入數(shù),根據(jù)數(shù)據(jù)和模擬數(shù)據(jù)得到的平均值、中值、最大值、最小值,99%、95%、5%、1%,以及%,STEDV的LR值。當(dāng)設(shè)置在LR閾值時,家族3將產(chǎn)生相應(yīng)的陽性(敏感性)結(jié)果和假陽性(1-特異性)結(jié)果。對于每個系統(tǒng),當(dāng)LR閾值在1到106之間時(表5-8),我們記錄了和比較了該方法的靈敏度和假陽性率。
1.3、結(jié)果分析
為了分析似然比的分布情況,對得到的LR值進(jìn)行分類,LR的擬合線圖生成,主要由IBM SPSS 22.0.R.和Graphpad 5.0生成。K-S是用來檢測研究LR的分布情況。
2.結(jié)果
2.1、LR值的統(tǒng)計學(xué)參數(shù)和STR數(shù)量的關(guān)系
能夠看到個體1和個體2的全同胞指數(shù)(全同胞指數(shù)、FSD和LR值)。發(fā)現(xiàn)當(dāng)STR基因座數(shù)從15個增加到39個時,LR值增加,包括中位數(shù)、平均值、最大值、最小值、99%,95%、5%、1%和標(biāo)準(zhǔn)偏差相應(yīng)增加(見圖1)。
結(jié)果表明,增加檢測系統(tǒng)中STR的數(shù)目,可以提高檢測效率,可以得到更高的LR均值和一個更大的極點。STDEV值隨LR的增加而增加。(表1-4)
2.2、LR值和模擬人群數(shù)量之間的關(guān)系
在一定的情況下時,并且模擬種群的數(shù)量都超過1×106時(表1-4),LR的中位數(shù)、平均值和標(biāo)準(zhǔn)差增加。隨著模擬種群數(shù)量的增加,LR的最大值和最小值都會增加或減少。當(dāng)模擬總體數(shù)較少時(100到10000),盡管LR中值的差異很小(在相同的數(shù)量級上),然而,LR的平均差異非常顯著,見圖2。但當(dāng)模擬人口超過105,99%,95%和,5%和1%的LR值保持相同的數(shù)量級。除此之外,LR最大值和最小值的分布表明,隨著模擬種群規(guī)模的增大和模擬量的膨脹,LR將有一個極值(圖2)。考慮到這個世界真正的人口,極值問題就會出現(xiàn)在真正的人口中,并且可能大于表1-4中的數(shù)據(jù)。
3.討論
由于軟件和計算機(jī)仿真能力的限制,我們無法進(jìn)行仿真超過106數(shù)據(jù)。STDEV值隨時間的增加而增加,模擬次數(shù)增加了10-1000倍,這反映了LR值和極值的很大變化。同時,平均數(shù)和平均數(shù)字變異沒有太大的變化,約為10倍。這反映了當(dāng)模擬次數(shù)超過104時,系統(tǒng)被認(rèn)為是穩(wěn)定的。此外,系統(tǒng)中STR的數(shù)量越多,靈敏度和假陽性率也越高。
3.1、STR數(shù)量的影響
閾值的靈敏度是在設(shè)定一定的閾值時能夠被檢測到兩組的假陽性率均為0。根據(jù)LR的定義,當(dāng)LR大于1時,支持H0,反之支持H1。實際上,例如當(dāng)LR大于100時,更可能選擇更高的LR閾值來降低誤判率。因此,在一定的閾值情況下,真陽性率和假陰性率就會產(chǎn)生。其中,誤判率是假陽性率和假陰性率之和。隨著閾值的增大,系統(tǒng)的靈敏度降低,假陽性率會隨著假陰性率的增加而降低。根據(jù)本文得到的數(shù)據(jù),統(tǒng)計分析得出,設(shè)定適當(dāng)?shù)腖R閾值可以檢測出系統(tǒng)的判斷能力,遺傳標(biāo)記的數(shù)目可以提高系統(tǒng)的靈敏度,同樣的人口規(guī)模,總體趨勢是,隨著遺傳標(biāo)記數(shù)量的增加以及隨著閾值的增大,會降低假陽性出現(xiàn)的概率。
3.2、模擬全同細(xì)胞數(shù)量的影響
通過模擬103-104個系譜,法醫(yī)科學(xué)家找到了10個親屬的LR在體內(nèi)的分布。我們發(fā)現(xiàn)這種模擬會降低LR閾值和存在一定程度的假陽性。本文由39哥STR組成檢測過程中,LR閾值設(shè)置為1-108,模擬量為1000對全同細(xì)胞,未在所有兄弟姐妹中發(fā)現(xiàn)假陽性。值得注意的是,模擬數(shù)量是1× 104時或者LR閾值0.1時假陽性率也會出現(xiàn)。
在實際情況中,如果兩個人在識別過程中得到L當(dāng)數(shù)據(jù)值超過100000時,可以100%確定整個同級關(guān)系。當(dāng)LR大于105時,假陽性率變?yōu)?。但是,我們應(yīng)該警惕假陽性的出現(xiàn)。根據(jù)現(xiàn)實世界中,對于大量的兄弟姐妹來說,假陽性的概率應(yīng)該很低。因為現(xiàn)在還沒出現(xiàn)具有更大的模擬功能的軟件,因此,我們只能根據(jù)實驗得到的數(shù)據(jù)進(jìn)一步計算了同胞的數(shù)量,并由此進(jìn)行推斷。
結(jié)語:
在本文中,我們模擬了大量的全同胞數(shù)據(jù),找到了其LR分布存在的一定規(guī)律,然而,并沒有被考慮基因和基因座之間的聯(lián)系,并且還會出現(xiàn)STR基因座突變的存在。雖然建立了5種突變模型,但本研究未進(jìn)行突變模擬。這種突變確實存在,而且在LR值分布中起著重要作用。另外,有報道稱我們的模擬基因vWA-D12S391、D5S818-CSFIP0、D21S11之間的聯(lián)系較弱,但由于其在法醫(yī)遺傳學(xué)中的作用,它廣泛應(yīng)用于免疫分析試劑盒中,他們之間的聯(lián)系可以不作為參考。本研究的模擬結(jié)果可為法醫(yī)遺傳學(xué)和辨識似然率臨界值的確定提供了參考,更為準(zhǔn)確的分析親屬關(guān)系準(zhǔn)備了做出了一定的貢獻(xiàn),能起到一定的作用。
參考文獻(xiàn):
陳子翔,王福振,陸惠玲,等,判別函數(shù)在同胞鑒定中的應(yīng)用[J],中國法醫(yī)學(xué)雜志,2012,27(2):129—132
個人簡介
宋翠芹,出生年月日:1992年4月21日,女,漢,江蘇徐州人,本科,助理,目前在南京鑒云技術(shù)咨詢有限公司從事DNA實驗室相關(guān)工作
南京鑒云技術(shù)咨詢有限公司 210000