張 云, 李育革, 石 惠
(1.北京市刑事科學(xué)技術(shù)研究所, 北京 100054; 2.中國(guó)政法大學(xué), 北京 100088)
?
漢字筆跡間不同人相似度和同一人穩(wěn)定度的量化實(shí)驗(yàn)研究
張?jiān)?,李育革1,石惠2
(1.北京市刑事科學(xué)技術(shù)研究所, 北京100054; 2.中國(guó)政法大學(xué), 北京100088)
摘要對(duì)200人書寫的漢字筆跡進(jìn)行分析研究,通過對(duì)筆跡鑒定工作者所依據(jù)的筆跡特征進(jìn)行選取、賦值、量化比對(duì),統(tǒng)計(jì)得出了不同人筆跡的單字相似度和多字相似度情況,以及同一人筆跡的單字穩(wěn)定度和多字穩(wěn)定度情況,發(fā)現(xiàn)有不同人書寫單字的相似度會(huì)高于同一人書寫單字的穩(wěn)定度的情況出現(xiàn)。但隨著組合單字?jǐn)?shù)量的增多,不同人筆跡的相似度會(huì)降低,而同一人筆跡的穩(wěn)定度會(huì)提高,當(dāng)組合單字?jǐn)?shù)量達(dá)到一定的量時(shí),穩(wěn)定度要遠(yuǎn)高于相似度。實(shí)驗(yàn)的統(tǒng)計(jì)結(jié)果為筆跡鑒定的科學(xué)性提供了一定的數(shù)據(jù)支持,也擴(kuò)展了筆跡鑒定量化研究的思路。
關(guān)鍵詞筆跡特征; 相似度; 穩(wěn)定度; 量化實(shí)驗(yàn)
0引言
在筆跡的同一認(rèn)定過程中,無論是不同人書寫的筆跡間,還是同一人書寫的筆跡間都會(huì)存在符合特征,如何判斷符合特征是不同人筆跡的相似[1],還是來自于同一人的筆跡?目前,筆跡鑒定工作者大多是根據(jù)自己長(zhǎng)期積累的經(jīng)驗(yàn)對(duì)筆跡特征進(jìn)行分析,從而認(rèn)定同一或否定同一。但是不同人書寫的筆跡間其特征到底相似到何種程度?同一人書寫的筆跡間其特征相同到什么程度??jī)H憑主觀分析判斷是否會(huì)影響同一認(rèn)定的準(zhǔn)確性?筆者收集了不同書寫水平、不同文化程度的200人正常書寫的漢字筆跡樣本,對(duì)樣本筆跡中所反映出的筆跡鑒定工作者所依據(jù)的特征進(jìn)行了量化賦值比對(duì)[2],得出了不同人筆跡相似程度和同一人筆跡穩(wěn)定程度的科學(xué)數(shù)據(jù),為漢字筆跡的同一認(rèn)定提供了科學(xué)依據(jù)[3]。
1實(shí)驗(yàn)?zāi)康?/p>
為筆跡鑒定工作者判斷兩份漢字筆跡是否由同一人書寫提供數(shù)據(jù)支持,避免漢字筆跡鑒定出現(xiàn)錯(cuò)誤意見。
2實(shí)驗(yàn)設(shè)計(jì)
書寫工具:市場(chǎng)上常見的晨光牌0.5 mm黑色簽字筆。
承載客體:打印有自制表格的A4打印紙。
本次實(shí)驗(yàn)選取了漢字筆跡鑒定中出現(xiàn)頻率相對(duì)較高的10個(gè)漢字:中、國(guó)、政、法、大、學(xué)、張、王、李、貳。
選擇對(duì)象共計(jì)200人,其中大學(xué)文化50名,碩士研究生文化130名,博士研究生文化20名;其中女性124名,男性76名。
要求書寫人在書寫樣本文字時(shí),使用其平時(shí)正常書寫的字體,按照平時(shí)正常書寫速度書寫,字跡不要過于潦草,不要刻意寫大字或?qū)懶∽帧?/p>
200名書寫者每人在相同的條件下書寫相同的樣本文字,用于不同人漢字筆跡間相似度的實(shí)驗(yàn)研究樣本。其中選擇個(gè)別書寫人相隔7日后,再次在相同的條件下書寫相同的樣本筆跡,用于同一人書寫漢字筆跡穩(wěn)定度的實(shí)驗(yàn)研究樣本。
(1)選定一段樣本文字,隨機(jī)選擇實(shí)驗(yàn)對(duì)象200名。
(2)要求每個(gè)實(shí)驗(yàn)對(duì)象在A4紙表格中用黑色簽字筆書寫樣本文字,并填寫書寫者的性別和文化程度。
(3)整理全部樣本,根據(jù)書寫水平分成高、低兩個(gè)檔次。運(yùn)筆規(guī)范,結(jié)構(gòu)合理,布局得當(dāng)且美觀的,視為書寫水平高的樣本,共計(jì)142份;其余樣本在運(yùn)筆、結(jié)構(gòu)及布局方面相對(duì)較差,視為書寫水平低樣本,共計(jì)58份。對(duì)高低檔次選取的筆跡樣本分別以A、B標(biāo)示,并對(duì)每檔中的所有樣本分別編號(hào)為A1…A142和B1…B58。
(4)選擇1份書寫水平高的筆跡樣本A1和1份書寫水平低的筆跡樣本B1,作為標(biāo)準(zhǔn)樣本。逐個(gè)單字選取筆跡鑒定中所依據(jù)的字形、寫法、筆順、搭配、比例及運(yùn)筆等特征[4]。每個(gè)單字盡量多選取特征。
(5)將其余樣本筆跡在同檔次范圍內(nèi)逐一與標(biāo)準(zhǔn)樣本筆跡進(jìn)行量化比對(duì),并對(duì)實(shí)驗(yàn)結(jié)果數(shù)據(jù)統(tǒng)計(jì)分析。
(6)選擇標(biāo)準(zhǔn)樣本(A1和B1)的書寫人,再次書寫樣本文字,與先前本人書寫的樣本筆跡分別進(jìn)行量化比對(duì),并對(duì)實(shí)驗(yàn)結(jié)果數(shù)據(jù)統(tǒng)計(jì)分析。
(7)總結(jié)并得出實(shí)驗(yàn)結(jié)論。
為了便于進(jìn)行統(tǒng)計(jì)分析,本文引入概念“相似度”和“穩(wěn)定度”。相似度和穩(wěn)定度是指比對(duì)樣本特征點(diǎn)和標(biāo)準(zhǔn)樣本特征點(diǎn)之間的整體符合情況。當(dāng)標(biāo)準(zhǔn)樣本與比對(duì)樣本是不同人的筆跡時(shí),稱為相似度;當(dāng)標(biāo)準(zhǔn)樣本與比對(duì)樣本是同一人的筆跡時(shí),稱為穩(wěn)定度。
在不同人筆跡相似度的統(tǒng)計(jì)中,筆者在書寫水平高、低兩個(gè)檔次各取一份樣本作為標(biāo)準(zhǔn)樣本,對(duì)其每個(gè)字進(jìn)行特征點(diǎn)選取并賦值。對(duì)于相對(duì)特征價(jià)值一般的特征,賦值1,一些非常特殊的特征可以適當(dāng)增加權(quán)重,根據(jù)特征的特殊情況加大賦值為2或3。其余樣本作為比對(duì)樣本,與標(biāo)準(zhǔn)樣本按照選定的特征點(diǎn)進(jìn)行分別比對(duì),統(tǒng)計(jì)出相同特征點(diǎn)數(shù)值占總特征點(diǎn)數(shù)值的比例,計(jì)算出單字的相似度。
同一人筆跡穩(wěn)定度的統(tǒng)計(jì),筆者對(duì)書寫水平高、低兩個(gè)檔次各取一份樣本,以標(biāo)準(zhǔn)樣本書寫人1個(gè)星期后再次書寫的樣本作為比對(duì)樣本,比對(duì)統(tǒng)計(jì)方法與相似度比對(duì)統(tǒng)計(jì)方法相同。
單字相似度(穩(wěn)定度)=單字的相同特征點(diǎn)數(shù)值之和/標(biāo)準(zhǔn)樣本單字所有特征點(diǎn)數(shù)值之和百分比。
兩個(gè)單字組合,3個(gè)單字組合,以此類推,計(jì)算出多字的相似度(穩(wěn)定度)。
計(jì)算公式為:r=(a+b+…+n)÷m
r為多字相似度(穩(wěn)定度),a,b…n代表各單字符合特征點(diǎn)數(shù)值之和,m為標(biāo)準(zhǔn)樣本中各單字所有特征點(diǎn)數(shù)值總和。
3不同人筆跡相似度的實(shí)驗(yàn)結(jié)果數(shù)據(jù)統(tǒng)計(jì)分析
本次實(shí)驗(yàn)結(jié)果數(shù)據(jù)統(tǒng)計(jì)分析,主要根據(jù)書寫水平不同分成高低兩種類型進(jìn)行討論。
3.1.1書寫水平高者漢字筆跡相似度
書寫水平高者筆跡樣本共142份,其中標(biāo)準(zhǔn)樣本1份,比對(duì)樣本141份,相似度統(tǒng)計(jì)結(jié)果如表1。
表1 10個(gè)單字的142份書寫水平高群體樣本筆跡間相似度情況
3.1.2書寫水平低者漢字筆跡相似度
書寫水平低者筆跡樣本共58份,其中標(biāo)準(zhǔn)樣本1份,比對(duì)樣本57份,相似度統(tǒng)計(jì)結(jié)果如表2。
3.1.3小結(jié)
(1)書寫水平較高群體間筆跡的相似度高于書寫水平較低群體間筆跡的相似度。如80%以上相似度最高的單字份數(shù)比,較高群體為28.4%,較低群體為21.1%。10個(gè)單字中達(dá)到90%以上相似度的樣本份數(shù),較高群體為49份,占總份數(shù)的34.8%,而較低群體的樣本份數(shù)僅為7份,占總份數(shù)的12.3%。
表2 10個(gè)單字的58份書寫水平低群體樣本筆跡間相似度情況
(2)對(duì)于一些筆畫少,字形結(jié)構(gòu)簡(jiǎn)單的字,其平均相似度相對(duì)較高,相對(duì)容易出現(xiàn)相似度在90%以上的情況;而對(duì)于一些筆畫較多,字形結(jié)構(gòu)較為復(fù)雜的字,其平均相似度與字形結(jié)構(gòu)簡(jiǎn)單的字相比平均相似度相對(duì)較低,相似度高于90%的情況不多。
(3)在個(gè)別樣本、個(gè)別單字中,有與標(biāo)準(zhǔn)樣本所選特征點(diǎn)完全符合的情況。如在書寫水平較高群體中,有3份比對(duì)樣本分別在“中”、“大”、“王”單字上,相似度達(dá)到了100%。
(4)大多數(shù)筆跡的單字相似度集中在50%~80%之間,筆畫較為簡(jiǎn)單的單字相似度略有升高。
3.2.1書寫水平高者漢字筆跡相似度
書寫水平高者筆跡樣本共142份,其中標(biāo)準(zhǔn)樣本1份,比對(duì)樣本141份,相似度統(tǒng)計(jì)結(jié)果如表3。
表3 多字組合的142份樣本筆跡間相似度情況
3.2.2書寫水平低者漢字筆跡相似度
書寫水平低者筆跡樣本共58份,其中標(biāo)準(zhǔn)樣本1份,比對(duì)樣本57份,相似度統(tǒng)計(jì)結(jié)果如表4。
表4 多字組合的58份樣本筆跡間相似度情況
3.2.3小結(jié)
(1)多字間較高相似度樣本的份數(shù)明顯少于單字的數(shù)量,并且隨著字?jǐn)?shù)的增多,高相似度的份數(shù)逐漸降低,低相似度的數(shù)量逐漸升高。
(2)多字相似度的整體呈下降趨勢(shì),其中書寫水平低者較書寫水平高者明顯,下降幅度大。
(3)當(dāng)多字字?jǐn)?shù)為2、3時(shí),相似度達(dá)到80%的只有極個(gè)別樣本,而隨著字?jǐn)?shù)的不斷增加,到達(dá)4~6個(gè)字時(shí),已經(jīng)完全沒有相似度較高的樣本。
4同一人書寫筆跡穩(wěn)定度的實(shí)驗(yàn)結(jié)果數(shù)據(jù)統(tǒng)計(jì)分析
筆者在一個(gè)星期后讓標(biāo)準(zhǔn)樣本A1和B1的書寫者再次書寫樣本筆跡,與標(biāo)準(zhǔn)樣本進(jìn)行量化比對(duì),計(jì)算同一人書寫筆跡的穩(wěn)定度。
書寫水平高低的兩個(gè)標(biāo)準(zhǔn)樣本(A1和B1)的兩名書寫者,其筆跡的單字穩(wěn)定度統(tǒng)計(jì)結(jié)果如表5。
表5 書寫水平高、低兩人的筆跡單字穩(wěn)定度情況表 (單位:%)
書寫水平高低的兩個(gè)標(biāo)準(zhǔn)樣本(A1和B1)的兩名書寫者,其筆跡的多個(gè)漢字的穩(wěn)定度統(tǒng)計(jì)結(jié)果如表6。
表6 書寫水平高、低兩人筆跡的多字穩(wěn)定度情況表 %
(1)無論是書寫水平高者還是書寫水平低者,除個(gè)別單字外,其單字穩(wěn)定度總體保持在較高的水平,其中書寫水平高者的穩(wěn)定度要略高于書寫水平低者。
(2)雖然在個(gè)別單字上沒有達(dá)到高穩(wěn)定度,但是隨著字?jǐn)?shù)的增加,整體穩(wěn)定度逐漸趨于平緩,基本保持在相對(duì)較高的水平。書寫水平低者的總體穩(wěn)定性在80%周圍浮動(dòng),書寫水平高者的整體穩(wěn)定性略高于書寫水平低者,在84%周圍浮動(dòng)。
5結(jié)論
(1)不同人書寫的筆跡中,一個(gè)單字存在相似度較高的情況,尤其是結(jié)構(gòu)簡(jiǎn)單、筆畫較少的單字,但多個(gè)單字的特征總和的相似度逐漸變低。
(2)同一人書寫的筆跡中,存在個(gè)別單字的穩(wěn)定度較低的情況,但多個(gè)單字的特征總和的穩(wěn)定度逐漸變高。
(3)有不同人書寫單字的相似度高于同一人書寫單字的穩(wěn)定度的情況發(fā)生。但隨著字?jǐn)?shù)的增多,不同人筆跡的相似度要遠(yuǎn)低于同一人筆跡的穩(wěn)定度。
(4)在筆跡鑒定過程中,面對(duì)少量字,尤其是筆畫較少、結(jié)構(gòu)簡(jiǎn)單的漢字時(shí),在沒有高價(jià)值的符合特征的情況下,少量字的同一認(rèn)定,如果出具明確性意見,存在著錯(cuò)誤意見風(fēng)險(xiǎn)。
參考文獻(xiàn)
[1]張娟. 相似性在筆跡鑒定中的運(yùn)用研究[J]. 山西警官高等??茖W(xué)校學(xué)報(bào),2007,15(3):76-78.
[2]唐啟明. 量化數(shù)據(jù)分析:通過社會(huì)研究檢驗(yàn)想法[M]. 北京:社會(huì)科學(xué)文獻(xiàn)出版社,2012:20-44,184-212.
[3]黃建同,梁立崢,等. 文件的科學(xué)檢驗(yàn):方法與技術(shù)[M]. 北京:中國(guó)人民公安大學(xué)出版社,2012:35-44.
[4]賈玉文,鄒明理. 中國(guó)刑事科學(xué)技術(shù)大全文件檢驗(yàn)[M]. 北京:中國(guó)人民公安大學(xué)出版社,2002:109-176.
(責(zé)任編輯陳小明)
作者簡(jiǎn)介張?jiān)?1963—),女,北京人,高級(jí)工程師。研究方向?yàn)槲募z驗(yàn)。
中圖分類號(hào)D918.92