摘要:利用指紋特征分析人的性別及年齡,一直是法醫(yī)學(xué)和人類學(xué)領(lǐng)域的挑戰(zhàn)性項目。現(xiàn)有研究因統(tǒng)計樣本量少、特征利用率低、模型學(xué)習(xí)能力低等不足,導(dǎo)致利用指紋特征分析性別及年齡的準(zhǔn)確率低。本文從多種分類及回歸機(jī)器學(xué)習(xí)模型比對分析的角度,對2980 份拇指及食指指紋捺印樣本(男性1500 份,女性1480 份)的指紋特征進(jìn)行統(tǒng)計測量,并在拇指及食指不同指紋特征相互組合的情況下,觀察各機(jī)器學(xué)習(xí)模型的性別分類、年齡回歸的準(zhǔn)確率。結(jié)果表明,同時使用拇指及食指指紋特征進(jìn)行學(xué)習(xí)的性別分類、年齡回歸的準(zhǔn)確率高于使用單一手指指紋特征的準(zhǔn)確率。其中,使用指紋特征對性別進(jìn)行分類的結(jié)果中,F(xiàn)1 衡量指標(biāo)值最高為0.979;對男性指紋樣本進(jìn)行年齡回歸的結(jié)果中最高準(zhǔn)確率為86.7%,女性指紋樣本年齡回歸的最高準(zhǔn)確率為85.3%,證明使用拇指及食指指紋特征綜合進(jìn)行學(xué)習(xí),可提高性別分類及年齡回歸準(zhǔn)確率思路的有效性。
關(guān)鍵詞:指紋;機(jī)器學(xué)習(xí);性別;年齡
1 引言
指紋具有“人各不相同,終身基本不變”的特性,是案件現(xiàn)場最常見的物證之一,被譽(yù)為證據(jù)之首[1]。近年來,利用指紋特征進(jìn)行個體識別在法醫(yī)人類學(xué)領(lǐng)域發(fā)揮了重要作用。隨著年齡增長和皮膚老化,指頭乳突花紋及其結(jié)構(gòu)會發(fā)生相應(yīng)改變[2],這種變化為判斷手印遺留者的年齡提供了支撐。同時,由于男性和女性在生理學(xué)上存在差異,指紋中的乳突紋線、指紋白線等特征亦有所不同,因此,確定指紋遺留者的性別對進(jìn)一步估計其年齡至關(guān)重要。但實際案件中技術(shù)人員一般是綜合現(xiàn)場情況側(cè)面刻畫犯罪嫌疑人進(jìn)而估計其性別及年齡區(qū)間,故通過指紋科學(xué)準(zhǔn)確地分析年齡,是目前手印工作亟待解決的問題之一。
利用指紋特征分析性別的研究集中在兩方面,一方面是研究指紋細(xì)節(jié)特征尤其是乳突紋線的寬窄和密度在兩性之間的差異,另一方面是通過分析指紋遺留化學(xué)成分判斷遺留者性別[3]。本文著重于前者的研究。Mundorff 等通過實驗證明乳突紋線寬度存在顯著的性別二型性[4];Nayak 和Sánchez-Andrés 等研究結(jié)果顯示,在整個成年期,女性的乳突紋線密度高于男性[5,6]。相較于指紋性別研究的體系化[7],利用指紋特征分析年齡的研究工作仍處于初步探索階段,如Ceyhan 等基于K 最臨近分類算法(K Nearest Neighbors, KNN)分類算法對指紋圖像進(jìn)行處理并進(jìn)行年齡段劃分[8];宋煥庭等通過測量指紋特征建立年齡與指紋的線性回歸模型[9];Falohun 等使用反向傳播(Back Propagation, BP) 神經(jīng)網(wǎng)絡(luò)系統(tǒng)對性別分類,而后利用離散小波變換和主成分分析來確定年齡范圍[10]。
現(xiàn)有對指紋特征的性別及年齡分析研究存在著特征利用率低、樣本使用量少、分類或回歸準(zhǔn)確率低等問題。例如Jayakala 等利用殘差人工神經(jīng)網(wǎng)絡(luò)(ResNet50) 模型對1000 張指紋圖像進(jìn)行年齡段四分類的訓(xùn)練及測試[11],準(zhǔn)確率雖達(dá)到了93%,但樣本量偏少、年齡段劃分跨度大,不能夠精確定位指紋遺留者的具體年齡;宋煥庭等嘗試使用多元線性回歸模型確定具體年齡,但回歸的準(zhǔn)確率僅為31.5%。為了解決上述問題,提高利用指紋特征推斷性別及年齡的準(zhǔn)確率,本文使用多種機(jī)器學(xué)習(xí)模型,對收集到的2900 余份男女拇指及食指指紋樣本特征進(jìn)行分析,觀察不同指紋特征組合對性別分類、年齡回歸準(zhǔn)確率的影響。
2 材料與方法
2.1 樣本采集
樣本材料可分為三部分:第一部分是8 名男性志愿者分別在20 世紀(jì)90 年代和2021年捺印的十指指紋信息卡,用來初步探究指紋隨年齡增長產(chǎn)生的變化;第二部分是20 世紀(jì)末中國東北地區(qū)已解密的犯罪檔案中獲取的1500 份男性嫌疑人(11~70 歲)的十指指紋信息卡;第三部分是20 世紀(jì)90 年代在中國東北地區(qū)收集的1480 份女性(10~70 歲)十指指紋調(diào)查卡。后兩部分用于研究不同年齡指紋的特點和具體變化,并嘗試?yán)弥讣y特征建立年齡回歸模型。本文使用的樣本均按照公安指紋信息采集標(biāo)準(zhǔn),指紋信息質(zhì)量良好,且都經(jīng)過指紋提供者本人口頭知情同意。
2.2 特征標(biāo)注及測量
考慮到犯罪現(xiàn)場嫌疑人遺留指紋的常見指別,本文選取右手拇指及食指指紋作為研究對象。測量對象從指紋中與年齡相關(guān)的6 個特征中選擇,分別是乳突紋線、小犁溝、皺紋、細(xì)點線、屈肌褶紋和脫皮。
乳突紋線 乳突紋線是手指、手掌表面的皮膚組織結(jié)構(gòu)按某種特定順序排列形成的凸起線條。本文所測量的乳突紋線密度(dr) 用指印中心點(O) 左側(cè)5 mm 內(nèi)穿過的乳突紋線條數(shù)來表示;乳突紋線寬度(br) 測量中心乳突紋線的寬度(圖1)。
小犁溝 小犁溝是與乳突紋線相間并行的凹下線條。小犁溝寬度(bv) 測量中心乳突紋線附近小犁溝的寬度。
皺紋 皺紋是由于皮膚松弛和堆積活動所形成的細(xì)小、淺表的溝紋。指頭皺紋主要由兩部分組成,一是橫向皺紋,多位于正面指印的兩側(cè)邊緣。二是縱向皺紋,位于手指兩側(cè)面的中下區(qū)、多呈平行分布。本文測量印痕中橫向皺紋數(shù)量(nh) 和縱向皺紋數(shù)量(nv) 以及皺紋最大長度(L)。
細(xì)點線 細(xì)點線是出現(xiàn)于小犁溝中的細(xì)點線狀組織結(jié)構(gòu)。細(xì)點線數(shù)量(ni) 測量以指紋中心點為圓心、半徑5 mm 的圓內(nèi)細(xì)點線總數(shù)。
屈肌褶紋 屈肌褶紋是手指、手掌關(guān)節(jié)及手掌面一定部位上固有的粗大、明顯的溝紋。屈肌褶紋測量指頭與第二指節(jié)之間關(guān)節(jié)處的第一組屈肌褶紋的分支數(shù)量(nf)。
脫皮 脫皮是指由于重摩擦、病變等因素引起的皮膚角化層的局部脫落,根據(jù)產(chǎn)生的原因分為生理性和病理性脫皮,隨年齡而發(fā)生變化的脫皮現(xiàn)象屬于前者,因此本文觀測指印中有無生理性脫皮(P)。
上述特征測量示例如圖1 所示。測量過程為:將收集的拇指及食指指紋樣本在LeicaM125 體視顯微鏡下觀察,使用Image J 軟件對每個特征數(shù)據(jù)進(jìn)行多次測量,長度單位設(shè)為mm(保留三位小數(shù))。對乳突寬度等特征進(jìn)行多次測量時,使用95% 置信區(qū)間對多次測量的結(jié)果x 進(jìn)行衡量。如公式(1),其中,σ 為標(biāo)準(zhǔn)差,n 為測量結(jié)果x 的測量次數(shù),xi 為每個測量數(shù)值,μ 為均值。若μ-2σ≤x≤μ+2σ,即表示x 測量數(shù)據(jù)全部位于95% 置信區(qū)間,則該組數(shù)據(jù)測量有效,將其中值xm 作為實驗數(shù)據(jù)在SPSS 軟件中進(jìn)行統(tǒng)計分析。
2.3 指紋特征隨年齡的變化規(guī)律
通過追蹤8 名男性志愿者分別在20 世紀(jì)90 年代左右和2021 年的指紋捺印樣本,對其拇指、食指指紋上與年齡相關(guān)的特征進(jìn)行觀察測量,如圖2 所示:
圖2 中,A 和B 分別反映了兩名男性拇指和食指指紋相同部位乳突紋線和小犁溝寬度的變化。測量結(jié)果表明,由青年至老年,兩名男性指紋測量部位的乳突紋線加寬、小犁溝變窄。C 反映了同一人指紋相同部位皺紋和屈肌褶紋分支數(shù)量的變化情況。隨年齡增加,指紋中出現(xiàn)多條新皺紋,原有皺紋變長加粗;屈肌褶紋由窄變寬、由短變長、分支增多。D、E 反映了同一人拇指和食指指紋中心點兩側(cè)及上側(cè)5 mm 內(nèi)經(jīng)過乳突紋線條數(shù)(即乳突紋線密度)的變化,其中 D、E 各代表兩名男性。由圖可知,中心區(qū)域乳突紋線密度隨年齡增長整體呈下降趨勢。 F 反映了同一人指紋相同部位細(xì)點線的變化情況。從青年到老年時期,細(xì)點線的反映逐漸增強(qiáng),原有的部分細(xì)點線演變成小棒。以上發(fā)現(xiàn)印證了隨年齡增長指紋會發(fā)生不同程度的改變。
為使后續(xù)研究工作更加科學(xué)準(zhǔn)確,本文從1500 份男性樣本和1480 份女性樣本中挑選捺印質(zhì)量較高的指紋樣本,即指紋卡上各部位捺印位置準(zhǔn)確、乳突紋線清晰不變形,且捺印壓力適中的指紋,共篩選出男性(M) 拇指樣本1286 份、食指樣本1394 份以及女性(F)拇指樣本1010 份、食指樣本1175 份?;诤Y選后的樣本,分別測量dr、br、bv、nh、nv、L、ni、nf、P 共9 個特征指標(biāo),得到的有效測量數(shù)據(jù)如圖3 所示。其中,乳突紋線密度、乳突和小犁溝寬度是每個指紋都具有的特征信息,因此三者所測得的數(shù)據(jù)總量相同,且各年齡分布均勻充分。對于皺紋、細(xì)點線、屈肌褶紋和脫皮統(tǒng)計篩選后樣本中能觀察到此類特征的總樣本量,可以發(fā)現(xiàn),此類特征的出現(xiàn)率均隨年齡增長呈上升趨勢。
根據(jù)測量結(jié)果,得到男女拇指和食指指紋中各特征隨年齡的變化規(guī)律如圖4 所示。觀察圖4: a,手紋具有較強(qiáng)的相對穩(wěn)定性,指紋上乳突紋線的總數(shù)始終不變。雖然乳突紋線總數(shù)與年齡無關(guān)[12],但隨著人體的生長發(fā)育和衰老進(jìn)程,第一指節(jié)長寬及皮膚面積會發(fā)生改變,導(dǎo)致乳突紋線密度(dr) 發(fā)生相應(yīng)變化。男性和女性的拇指和食指指紋中心點左側(cè)5 mm 內(nèi)經(jīng)過的乳突紋線條數(shù)(即乳突紋線密度)隨年齡增大整體呈下降趨勢。男性的拇指和食指dr 中值基本均小于同齡女性,對于個體而言,食指中心區(qū)域dr 一般比拇指大。
觀察圖4: b-c 可知,11~25 歲時,個體處于生長發(fā)育期,男性和女性的拇指和食指乳突紋線和小犁溝都在變寬;因男女生長速度差異,男性br 和bv 的增長速率比女性快。從生理學(xué)上講,男性的衰老方式不同于女性,男性皮膚中的膠原蛋白含量會持續(xù)下降,而女性皮膚老化則會因激素水平下降而加速[13]。對于女性而言,26~45 歲時身體發(fā)育成熟,拇指和食指br 和bv 相對穩(wěn)定;40~55 歲進(jìn)入更年期,雌激素水平的下降加速與年齡相關(guān)的退化[14],皮膚彈性變低,導(dǎo)致乳突紋線加寬,擠壓小犁溝變窄。對于男性來說,26~35 歲時拇指和食指br 和bv 略有上升,可能是身材發(fā)福所致;35~45 歲期間br 和bv 相對穩(wěn)定,變化不明顯;45~55 歲時因膠原蛋白流失乳突紋線變扁容易相互粘連,導(dǎo)致br 變大、bv 變小。
55 歲之后,男性和女性的乳突紋線因皮膚老化嚴(yán)重而皺縮,此時bv 略有上升。同時,由于女性手較為細(xì)長,指頭長寬的比值高于男性[15],在紋線上表現(xiàn)為同手指女性br 中值小于男性,且乳突紋線和小犁溝的相對寬窄表現(xiàn)為女性更窄。對比圖4: b-c 發(fā)現(xiàn),無論男女,青少年時期,印痕中br 中值大于bv;壯年和中年階段,br 和bv 中值相近;老年時期有的指紋中甚至出現(xiàn)bv 大于br 的現(xiàn)象。
從整體上分析圖4: d-f,可以發(fā)現(xiàn)隨著年齡增大,皺紋表現(xiàn)為從無到有、從短到長、從少變多的變化趨勢。從整體上來看,11~25 歲時,男性和女性的皺紋較少,即使少數(shù)部位出現(xiàn),也比較短??;25 歲后,舊皺紋變粗變長,新皺紋明顯增加,尤其是60 歲之后,皮膚高度松弛,皺紋數(shù)量和平均長度都顯著增加。由圖4: d-e 可知,同齡女性nh 中值大于男性,食指大于拇指;nv 在不同性別和指頭之間區(qū)別不大。由圖4: f 可知,年齡相同時,最長皺紋長度中值男性大于女性、拇指大于食指。這體現(xiàn)出女性皺紋細(xì)密、總數(shù)較多的特點,男性皺紋粗大、總數(shù)較少的特點。
圖4: g 表明,在11~17 歲時,指紋中心區(qū)域出現(xiàn)的細(xì)點線數(shù)量較少;18~25 歲,細(xì)點線數(shù)量略有上升;25 歲后,細(xì)點線數(shù)量持續(xù)上漲。同齡中,拇指的ni 大于食指。由于出現(xiàn)細(xì)點線的樣本有限,無法從統(tǒng)計結(jié)果中找到準(zhǔn)確的男女細(xì)點線數(shù)量差異規(guī)律。
圖4: h 表明,屈肌褶紋的變化與皺紋趨向一致,隨年齡增長,手指屈曲活動累加,同時手指開始發(fā)扁,導(dǎo)致屈肌褶紋由較少分支變?yōu)檩^多分支。觀察指紋圖像發(fā)現(xiàn),隨年齡增加,屈肌褶紋反映更長更寬??傮w上來看,男性拇指和食指的nf 中值多大于同齡女性。
對于生理性脫皮現(xiàn)象,從圖4: i 可以看出,11~25 歲,個體生理機(jī)能旺盛,表皮角化較慢,自然脫落現(xiàn)象較少;26~50 歲,個體表皮角化過程加快,脫皮現(xiàn)象明顯增多。50 歲以后,表皮角化過程更快、脫皮分布范圍更廣。女性拇指和食指的P 中值大體上大于男性。
3 實驗結(jié)果與分析
本文選用了男性、女性的拇指和食指指紋特征對年齡進(jìn)行回歸,考慮到年齡回歸結(jié)果在男女性別上有所差異,為使年齡回歸得到更佳效果,本文設(shè)計兩個環(huán)節(jié):首先對男女性別進(jìn)行分類,然后在特定性別下對年齡進(jìn)行回歸。
3.1 性別分類
本文為更精確地對性別進(jìn)行分類,同時研究不同手指及指紋特征對分類結(jié)果的影響,將拇指特征(Thumb)、食指特征(Forefinger) 以及拇指和食指的組合特征(Thumb amp;Forefinger) 分別進(jìn)行訓(xùn)練與回歸。為綜合考慮準(zhǔn)確率與召回率,本文使用衡量二分類模型精確度的一種指標(biāo)F1 分值(F1 score),即精確率和召回率的調(diào)和平均數(shù),對分類方法性能進(jìn)行評估[16]。在正式實驗前,本文首先使用10 類方法對每一參與性別分類的特征進(jìn)行預(yù)實驗,觀察每一特征的性別分類效果,這10 種分類方法分別為:隨機(jī)森林算法(RandomForest, RAF)[17]、自適應(yīng)增強(qiáng)算法(AdaBoost, ADB)[18]、CatBoost(CTB)[19]、極端隨機(jī)樹(ExtraTrees, EXT)[20]、KNN[21]、BP 神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network, BPN)[22]、支持向量機(jī)(Support Vector Machines, SVM)[23]、極端梯度增強(qiáng)算法(Extreme GradientBoosting, XGB)[24]、輕量級梯度提升機(jī)(Light Gradient Boosting Machine, LGB)[25]、樸素貝葉斯算法 (Na?ve Bayes, BYS)[26]。
之后發(fā)現(xiàn),同一特征在不同分類方法中所得分類效果即F1 相似。為進(jìn)一步發(fā)現(xiàn)不同特征組合對分類效果的影響,本文按照預(yù)實驗中F1 對特征進(jìn)行排序:L、dr、P、nh、bv、br、ni、nv、nf。并按照排序結(jié)果,將特征分為1~ 9 共9 組,分別是1(L)、2(L、dr)、3(L、dr、P)、4(L、dr、P、nh)、5(L、dr、P、nh、bv)、6(L、dr、P、nh、bv、br)、7(L、dr、P、nh、bv、br、ni)、8(L、dr、P、nh、bv、br、ni、nv)、9(L、dr、P、nh、bv、br、ni、nv、nf)。仍以拇指特征為例,使用各類方法默認(rèn)參數(shù),觀察不同特征組合對分類效果的影響,如表1。
通過表1 可以發(fā)現(xiàn),使用特征組合所得結(jié)果都優(yōu)于僅使用L 特征的第1 組,這表明了本文使用特征組合進(jìn)行性別分類的有效性。在參與學(xué)習(xí)的特征數(shù)量逐漸減少的情況下,總體F1 呈下降趨勢,多個方法(如RAF、ADB 等)在第9 組特征組合中F1 最高,其他方法如EXT、XGB 在第8 組特征組合中F1 最高;KNN、BYS 在第7 組特征組合中F1 最高;SVM 在第6 組特征組合中F1 最高。為研究不同方法的分類性能,從而選擇最合適的方法,本文對每種方法,選擇其對應(yīng)最高F1 時的特征組合對Thumb、Forefinger、Thumbamp; Forefinger 這3 類特征進(jìn)行學(xué)習(xí),并參與最終的分類性能對比,結(jié)果如表2。
通過觀察表2 中的性能對比結(jié)果可以發(fā)現(xiàn),RAF 分類方法在Thumb、Forefinger、Thumb amp; Forefinger 這3 類特征都取得了最優(yōu)的分類效果,在僅使用Thumb 特征的情況下, 所得F1 高達(dá)0.975; 僅使用Forefinger特征的情況下,F(xiàn)1 為0.966; 使用Thumbamp; Forefinger 特征的情況下, 所得F1 最高為0.979,幾乎能夠完美的對男女的性別進(jìn)行分類,高于使用單一手指特征進(jìn)行性別分類的結(jié)果,表明了本文選用Thumb amp;Forefinger 特征同時輸入模型進(jìn)行性別分類的有效性。其他分類方法雖在性能評估中稍遜于RAF,但在實際中因環(huán)境影響,提取到的指紋特征往往是有殘缺的,結(jié)合表1 實驗結(jié)果可知,此時使用其他方法對指紋特征進(jìn)行性別分類能取得更好的效果。由于本研究所用指紋均為理想條件下獲得,無指紋特征殘缺情況,故以下相關(guān)內(nèi)容研究中使用的性別分類方法為RAF。
在對指紋捺印者進(jìn)行性別分類的時候,會出現(xiàn)分類錯誤的問題,如圖5 中,B 行男性指紋表現(xiàn)出的乳突紋線密度、乳突和小犁溝寬度等特征與A 行指紋存在明顯差異,與C 行女性指紋特征表現(xiàn)較相似,因此,B 行男性指紋會被誤分類至女性指紋類型。這種情況多發(fā)生于青少年或體型瘦小的男性。
3.2 年齡回歸
經(jīng)過性別分類后的指紋特征,能夠更為精確地對年齡進(jìn)行回歸,為此,本文以RAF回歸方法為例設(shè)計消融實驗,從而驗證本文提出的性別分類對提高年齡回歸準(zhǔn)確率思路的有效性, RAF 回歸方法中的參數(shù)設(shè)置均采用默認(rèn)值。實驗結(jié)果表明,在未進(jìn)行性別分類的情況下,僅使用拇指、僅使用食指、使用拇指食指組合特征達(dá)到的年齡回歸準(zhǔn)確率分別為67.2%、65.4%、68.5%;經(jīng)過性別分類后,男性使用拇指、食指、拇指食指組合特征年齡回歸準(zhǔn)確率分別為73.2%、69.7%、78.4%,女性使用拇指、食指、拇指食指組合特征年齡回歸準(zhǔn)確率分別為74.7%、70.2%、80.6%(見附屬材料)。因此,經(jīng)過性別分類后的男女指紋,在僅使用拇指、僅使用食指、使用拇指食指組合 3 類特征中的年齡回歸準(zhǔn)確率都取得了較大提高,證明了本文所提出的性別分類對提升年齡回歸準(zhǔn)確率的有效性。同時,為方便研究不同指紋特征對年齡回歸準(zhǔn)確率的影響,本文使用RAF 多次對指紋特征重要性進(jìn)行排序,各特征重要性取其中值作為結(jié)果展示。根據(jù)實驗結(jié)果,特征重要性從大至小分別為L、ni、dr、br、nh、bv、P、nv、nf。經(jīng)實驗,單個特征對年齡回歸的影響程度較差,準(zhǔn)確率過低。L、ni、dr、br 這4 種特征重要性所占比之和達(dá)到80%,對年齡回歸的影響程度較高,能夠達(dá)到年齡回歸的目的,因此在本文設(shè)定的特征組合中,本文以這4 種特征為基礎(chǔ),設(shè)定A~F 共6 種特征組合,觀察不同特征組合對年齡回歸所帶來的影響,所包含特征分別為A(L、ni、dr、br、nh、bv、P、nv、nf)、B(L、ni、dr、br、nh、bv、P、nv)、C(L、ni、dr、br、nh、bv、P)、D(L、ni、dr、br、nh、bv)、E(L、ni、dr、br、nh)、F(L、ni、dr、br)。
參數(shù)設(shè)置對于回歸方法的準(zhǔn)確率有著重要影響,在正式實驗前,需要對不同的回歸方法進(jìn)行參數(shù)尋優(yōu)。本文選用的回歸方法有RAF、ADB、EXT、CTB、KNN、支持向量回歸(Support Vector Regression, SVR)[27]、LGB、多元線性回歸(Multiple Linear Regression,MLR)[28]。本文使用網(wǎng)格尋優(yōu),對不同回歸方法進(jìn)行最優(yōu)參數(shù)設(shè)置,以RAF 方法在女性拇指指紋特征中的回歸過程為例,如圖6。
圖6: A~F 分別表示的是RAF 方法在 6 種特征組合下回歸準(zhǔn)確率隨參數(shù)變化的情況,記錄每組特征組合下最高準(zhǔn)確率及對應(yīng)的參數(shù)設(shè)置(見附屬材料)。相應(yīng)的,對其余回歸方法進(jìn)行網(wǎng)格尋優(yōu),統(tǒng)計各回歸方法在不同手指及指紋特征組合下對應(yīng)的最高準(zhǔn)確率及參數(shù)設(shè)置,以拇指指紋特征下統(tǒng)計的信息為例(見附屬材料)。
統(tǒng)計不同手指及指紋特征組合下的回歸方法參數(shù)設(shè)置時,由于拇指、食指使用的指紋特征一致,為方便計算,進(jìn)行年齡回歸分析時使用的參數(shù)設(shè)置也相同。根據(jù)得到的不同特征組合下最優(yōu)的參數(shù)設(shè)置,分別使用8 種方法進(jìn)行年齡回歸,結(jié)果如圖7。
其中,橫坐標(biāo)1~6 分別表示A~F 的特征組合,各折線表示男性拇指、食指及拇指+食指等手指特征。根據(jù)圖7,可以發(fā)現(xiàn)無論在哪種手指特征下,不同的回歸方法年齡回歸的準(zhǔn)確率,總體上會隨著指紋特征組合中特征數(shù)量的減少而減少,即A 特征組合包含的指紋特征數(shù)量最多,對應(yīng)的回歸準(zhǔn)確率也最高。
年齡的8 種回歸方法對應(yīng)不同手指特征下的最高準(zhǔn)確率,統(tǒng)計結(jié)果見表3??梢园l(fā)現(xiàn),RAF 回歸方法在僅使用拇指指紋特征進(jìn)行回歸分析的過程中,準(zhǔn)確率最高;男性拇指指紋特征中準(zhǔn)確率為75.8%,女性拇指指紋特征中準(zhǔn)確率為78.5%。在僅使用食指指紋特征進(jìn)行回歸分析的過程中,ADB 方法回歸準(zhǔn)確率最高,男性食指指紋特征中準(zhǔn)確率為72.3%,女性食指指紋特征中準(zhǔn)確率為74.5%。在使用拇指和食指兩種指紋特征進(jìn)行回歸分析的過程中,ADB 方法回歸準(zhǔn)確率仍是最高,男性中準(zhǔn)確率高達(dá)86.7%,女性中準(zhǔn)確率高達(dá)85.3%。
對指紋圖像進(jìn)行年齡回歸分析時,也會出現(xiàn)回歸不準(zhǔn)確的情況,如圖8 中,真實年齡為17 歲和32 歲的各4 個樣本,進(jìn)行年齡預(yù)測時,由于指紋圖像質(zhì)量較好,皺紋、細(xì)點線與脫皮等出現(xiàn)較少,預(yù)測年齡較真實值偏低;而指紋圖像質(zhì)量較差,相比同齡人有更多的脫皮、皺紋等,預(yù)測年齡較真實值偏高。這些現(xiàn)象都會影響回歸方法的準(zhǔn)確率。
4 結(jié)束語
本文提出使用機(jī)器學(xué)習(xí)模型對拇指和食指的指紋特征進(jìn)行學(xué)習(xí),從而達(dá)到對指紋捺印者的性別、年齡進(jìn)行分類與回歸的目的,其中,使用RAF 分類方法對男女二分類的準(zhǔn)確率達(dá)到97.8%,使用ADB 回歸算法對性別分類后的指紋年齡進(jìn)行回歸分析的準(zhǔn)確率高達(dá)86.7%,可以有效的對指紋捺印者的性別、年齡進(jìn)行分析。
在實際工作過程中,收集到的指紋特征不會很全面,如案發(fā)現(xiàn)場僅能提取到包含dr、br、bv 等特征的一枚殘缺指紋,雖能根據(jù)本文方法對性別及年齡進(jìn)行分析,但尚難以達(dá)到本文在理想條件下分析出的準(zhǔn)確率?;诖?,下一步研究重點應(yīng)著力于研究案發(fā)現(xiàn)場等特殊環(huán)境下收集到的殘缺指紋,建立殘缺指紋與性別、年齡、民族[29]、職業(yè)等信息之間的關(guān)系。此外,在研究過程中,發(fā)現(xiàn)現(xiàn)代人(尤其在17~35 歲人群)的指紋相較于幾十年前的同齡人,細(xì)點線、皺紋數(shù)量明顯增多,故在指紋回歸分析過程中,得到的結(jié)果與真實年齡差距較大。究其原因可能與長期使用電子設(shè)備等因素有關(guān)。針對此情況,下一步工作重點可著力于研究電子設(shè)備等外部因素對現(xiàn)代年輕人與上世紀(jì)同齡人指紋特征差異的影響,進(jìn)而對年齡回歸模型進(jìn)行數(shù)據(jù)庫的調(diào)整,使之更適用于當(dāng)今社會。
參考文獻(xiàn)
[1] Champod C, Lennard CJ, Margot P, et al. Fingerprints and other ridge skin impressions [M]. La Paz: CRC Press, 2004
[2] Monson KL, Roberts MA, Knorr KB, et al. The permanence of friction ridge skin and persistence of friction ridge skin and impressions: A comprehensive review and new results [J]. Forensic science international, 2019, 297: 111-131
[3] Gorka M, Thomas A, Bécue A. Chemical composition of the fingermark residue: Assessment of the intravariability over one year using MALDI-MSI [J]. Forensic Science International, 2022, 338: 111380
[4] Mundorff AZ, Bartelink EJ, Murad TA. Sexual dimorphism in finger ridge breadth measurements: a tool for sex estimation from fingerprints [J]. Journal of forensic sciences, 2014, 59(4): 891-897
[5] Nayak VC, Rastogi P, Kanchan T, et al. Sex differences from fingerprint ridge density in Chinese and Malaysian population [J].Forensic science international, 2010, 197(1-3): 67-69
[6] Sánchez-andrés A, Barea JA, Rivaldería N, et al. Impact of aging on fingerprint ridge density: Anthropometry and forensic implications in sex inference [J]. Science amp; justice, 2018, 58(5): 323-334
[7] Kanchan T, Krishan K. Anthropometry of hand in sex determination of dismembered remains-A review of literature [J]. Journal of Forensic and Legal Medicine, 2011, 18(1): 14-17
[8] Ceyhan EB, Sa?iro?lu ?, Tato?lu S, et al. Age estimation from fingerprints. Examination of the population in Turkey[A]. In: Wani M(Ed.).proceedings of the 2014 13th International Conference on Machine Learning and Applications[C]. Detroit: IEEE, 2014, 478-481
[9] 宋煥庭,唐瑋,張麗梅,等.指紋與年齡相關(guān)性的量化分析 [J].人類學(xué)學(xué)報,2022, 41(6): 1047-1057
[10] Falohun A, Fenwa O, Ajala F. A fingerprint-based age and gender detector system using fingerprint pattern analysis [J].International Journal of Computer Applications, 2016, 136(4): 0975-8887
[11] Jayakala G, Sudha L. Fingerprint analysis for age estimation using deep learning models (ResNet50 and VGG-16) [J]. International Journal of Health Sciences, 2022,6(S3): 6781-6789
[12] Rivaldería N, Gutiérrez-Redomero E. Interpopulational differences in the frequency and distribution of delta types [J]. Forensic Science International, 2021, 322: 110749
[13] Dao JRH, Kazin RA. Gender differences in skin: a review of the literature [J]. Gender medicine, 2007, 4(4): 308-328
[14] Farage MA, Miller KW, Elsner P, et al. Characteristics of the aging skin [J]. Advances in wound care, 2013, 2(1): 5-10
[15] Da Silva Carvalho D, De Alecrim MMV, De Sousa Júnior R T, et al. Outcome of sex determination from ulnar and radial ridge densities of Brazilians' fingerprints: applying an existing method to a new population [J]. Science amp; Justice, 2022, 62(2): 181-192
[16] Goutte C, Gaussier E. A Probabilistic Interpretation of Precision, Recall and F-Score, with Implication for Evaluation[A]. In: Losada (Ed.). Advances in Information Retrieval. ECIR 2005. Lecture Notes in Computer Science[C]. Heidelberg: Springer, 2005:345-359
[17] Patil A, Singh S. Differential private random forest[A]. In: Prakash C(Ed.). proceedings of the 2014 International Conference on Advances in Computing, Communications and Informatics (ICACCI)[C]. Delhi: IEEE, 2014, 2623-2630
[18] Schapire RE. Explaining adaboost [J]. Empirical Inference: Festschrift in Honor of Vladimir N Vapnik, 2013, 37-52
[19] Prokhorenkova L, Gusev G, Vorobev A, et al. CatBoost: unbiased boosting with categorical features [J]. Advances in neural information processing systems, 2018, doi:10.48550/arXiv.1706.09516
[20] Geurts P, Ernst D, Wehenkel L. Extremely randomized trees [J]. Machine learning, 2006, 63: 3-42
[21] Peterson LE. K-nearest neighbor [J]. Scholarpedia, 2009, 4(2): 1883
[22] Buscema M. Back propagation neural networks [J]. Substance use amp; misuse, 1998, 33(2): 233-270
[23] Hearst MA, Dumais ST, Osuna E, et al. Support vector machines [J]. IEEE Intelligent Systems and their applications, 1998, 13(4): 18-28
[24] Chen T, Guestrin C. Xgboost: A scalable tree boosting system[J]. ACM, 2016. doi:10.1145/2939672.2939785
[25] Ke G, Meng Q, Finley T, et al. Lightgbm: A highly efficient gradient boosting decision tree [A]. In: Von Luxburg U(Ed.). Advances in neural information processing systems 30 (niP2017)[C]. Long Beach: Neural Information Processing Systems Foundation, 2017
[26] Rish I. An empirical study of the naive Bayes classifier [J].Journal of Universal Computer Science, 2001, 1(2): 127
[27] Smola AJ, Sch?lkopf B. A tutorial on support vector regression [J]. Statistics and computing, 2004, 14: 199-222
[28] Eberly LE. Multiple linear regression [J]. Topics in Biostatistics, 2007, 165-187
[29] 陸宏,霍正浩,鐘慧軍,等.寧夏回、漢族指紋白線的研究 [J].人類學(xué)學(xué)報,2005, 24(1): 77-81
基金項目:公安部科技強(qiáng)警應(yīng)用基礎(chǔ)項目(2022JC04)