俞 文, 馬曉贇
(1.甘肅政法學院, 甘肅蘭州 730070; 2.中國刑事警察學院, 遼寧沈陽 110035)
2016年10月11日,最高人民法院等五部委提出并實施《關于推進以審判為中心的刑事訴訟制度改革的意見》,這一重大改革意味著鑒定人的任務不單單是要為偵查破案提供線索,更要以強有力的證據將嫌疑人送上法庭,依法宣判。
筆跡檢驗研究的重要性在于通過對紙張或其他書寫介質上記錄字跡的研究,使筆跡可以作為法庭證據來使用,最常見的就是認定筆跡書寫人。目前,特別是在國內,在絕大多數的法庭審判中,法官及公訴人都希望文檢鑒定人能給出“認定同一人書寫”或“否定同一人書寫”的明確鑒定意見,以增強證據效力,加速審判進程。但是,受到鑒定人水平、檢材損壞、時間久遠、花費較大等主客觀因素的影響,檢材筆跡與樣本筆跡之間總會存在不同程度的差異,這就從某種程度上決定了文檢鑒定人要明確地做出認定同一或否定同一的鑒定意見幾乎不可能。同時,從法庭科學證據的發(fā)展歷程來看,即便被譽為“證據之王”的DNA,在同一認定中也出現過錯誤,因此,依靠經驗積累所作出的筆跡檢驗鑒定意見的科學性也受到了質疑。
隨著科學技術的發(fā)展,對于法庭證據的認識也愈加深刻,法庭證據評估體系隨之有了極大的提升。其中,基于統(tǒng)計學中似然比的法庭證據評估體系得到了國內外的廣泛認同。其在邏輯上和法律上都是正確的,因此可以向法官提供準確的證據效力評估結論[1]。本文嘗試將似然比檢驗引入到筆跡量化檢驗中,為筆跡檢驗鑒定探求新的方法與思路。
設由n個觀察值X1,X2,…,Xn組成的隨機樣本屬于密度函數f(X,θ)的總體,其中θ為未知參數。要檢驗的原假設是H0:θ=θ0,備擇假設是H1:θ≠θ0;檢驗水準為α。則似然函數在θ=θ0處的值與在θ=θ(極大點)處的值(即極大值)之比,記作LR,亦稱為似然比[2]。本文談及的似然比為廣義似然比。
似然比檢驗(Likelihood ratio test)是反映事件真實性的一種指標,同時具備靈敏性和特異性以反映事件性態(tài)。其實際上是貝葉斯決策理論(Bayes’ theorem)的推廣,而貝葉斯決策理論基于條件概率的概率推理。條件概率是指在兩個事件彼此獨立的前提下,事件A在另一個事件B已經發(fā)生條件下的發(fā)生概率,記為P(A|B)。這一基礎使得貝葉斯決策理論包括3個部分,即先驗概率、似然比和后驗概率[3]。假定在一檢驗鑒定中,除去現場勘查過程中發(fā)現的手印、足跡、DNA等物質性物證E外,還有現場走訪調查中取得的被害人陳述、其家屬及其他目擊者證言等言語證據F。則先驗概率為假定無物證E發(fā)現時,僅考慮言語證據F所得到支持原假設H0成立的概率。后驗概率為先驗概率與似然比之積,即同時考慮物證E與言語證據F的情況下,支持原假設H0成立的概率。似然比是假定現場提取到的犯罪證據由罪犯形成的概率與該證據由其他人形成的概率之比,以此將證據強度數字化,量化證據對檢驗鑒定結論的支持力度。似然比公式為:
其中,E為現場物證,定義現場物證E為犯罪嫌疑人所留的假設為H0,為其他人員所留的假設為H1。P(E|H0)為H0假設條件下的概率,表示相似性;P(E|H1)為H1假設條件下的概率,表示典型性。也就是說似然比LR為相似性與典型性的比。在檢驗鑒定中,P(E|H0)近似于1,通常情況下假定為1;P(E|H1)則需要收集犯罪區(qū)域關聯總體的樣本,并建立相關數據庫統(tǒng)計求取。似然比LR的值與1的距離從側面反映了證據力度的強弱;LR越遠離1,則該證據的證據力度越強;LR越逼近1,則該證據的證據力度越弱[4]。
(1)實驗對象
收集某警院300名師生的筆跡樣本。其中男性152名,女性148名,男女比例較均衡。實驗對象身體健康,無習慣于左手書寫者。
(2)實驗材料
①書寫工具。鋼筆、中性筆、簽字筆、圓珠筆等硬筆書寫工具。
②書寫紙張。A4打印紙、草稿紙。
③實驗儀器。佳能700D單鏡頭反光相機、放大鏡。
(1)樣本收集
第一步,記錄實驗對象的性別、年齡,以便對數據統(tǒng)計、分析。
第二步,令實驗對象使用給定的書寫工具書寫。
根據國家語言文字工作委員會、國家教育委員會發(fā)布的《現代漢語常用字表》,使用頻率前十的漢字分別為“的、一、是、了、我、不、人、在、他、有”。故將其組合,令受試者在紙張上書寫語句“他不在的時候,我一個人,是有些害怕了”兩遍,以保證實驗樣本特征的普遍性(由于“一、人、了”筆畫較為簡單,不具備比對條件,因此只選擇“他、不、在、的、我、是、有”7個字作為特征字)。
第三步,收集所有樣本并編號,分析其筆跡特征。
(2)特征選取
不同的人書寫技能和書寫習慣既有共同性又有特殊性的雙重屬性[5]。筆跡區(qū)別于其他物證的一個重要特點就是任意兩份筆跡,必然是既有符合、又有差異。筆跡檢驗就是通過檢材筆跡與樣本筆跡之間系統(tǒng)的對比分析,尋找其特殊性,發(fā)現其內在的聯系和本質的不同,以此來認定同一人書寫或非同一人書寫。由于筆跡特征能反映個體的書寫技能和書寫習慣,它是筆跡檢驗鑒定的根本因素,故恰當地選取筆跡特征尤為重要。檢驗中一定要吃透檢材,從整體到局部、從宏觀到微觀、由外及里、由表及內,在一定深度和廣度上選取特征。筆跡特征包括概貌特征、局部安排特征、寫法特征、錯別字特征、搭配比例特征、筆順特征、運筆特征和筆痕特征[6]。檢驗中應重點把握和挖掘特征字的結構、偏旁部首間的搭配比例關系、筆畫先后次序、運筆過程中彎筆的弧度大小、起收筆時的細微筆痕和相交筆畫的交角位置和大小等。
由于似然比在筆跡檢驗鑒定中反映的是筆跡特征相似性與典型性的比值,故在似然比檢驗中不是所有的筆跡特征均能采用。筆跡檢驗多年的研究和實踐表明,較為穩(wěn)定和典型的特征如特征字筆畫的長度、寬度、角度,字的大小和字形,字行間距,字間、字內搭配組合,運筆速度,筆尖壓力等。對于特征字的筆畫長、寬、角、字的大小和字形、字行間距等可直觀測量或明顯看出的特征,通常使用量角器、刻度尺或直接觀察得出。而對于特征字字間和字內搭配組合關系、運筆速度、筆尖壓力大小等只能定性研究的筆跡特征,實際上無法通過相應的工具測量,可按其特征反映的強弱轉換為等級形式表達。即將各特征依照本身的性質建立為由弱至強的3個等級的評價體系,并按樣本所反映特征的情況歸類,由此實現筆跡特征從定性到定量的轉化。為便于統(tǒng)計分析,將各特征分別以T1(特征字筆畫長度)、T2(特征字筆畫寬度)、T3(特征字筆畫角度)、T4(特征字的大小)、T5(特征字字形)、T6(字行間距)、T7(特征字字間、字內搭配組合關系)、T8(運筆速度)、T9(筆尖壓力大小)表示。表1顯示了各選取特征定量分組標準。
表1 筆跡特征定量分組標準
(3)建立數據庫
研究過程中共收集到總計300份實驗樣本,統(tǒng)計實驗樣本中以上幾種特征的頻數,并建立相應的數據庫,并分別計算該9種特征在樣本總體中的概率。
針對似然比值,Association of Forensic Science Providers (AFSP)將其按等級轉換成言語形式表達[7],即表2所示的6個似然比等級[8]。將得到的似然比值與表2比較分析,獲得各筆跡特征在同一認定中的支持力度。
表2 似然比等級
對300份筆跡樣本進行統(tǒng)計,得到表3的統(tǒng)計結果??梢钥闯觯瑢τ诠P畫長、寬特征,樣本筆跡均表現出中等長、寬居多,筆畫很長或很寬的出現較少;對于筆畫角度來說,大多數特征字書寫筆畫均呈現出一定角度的傾斜,這是人的書寫習慣決定的,個體很難長時間控制筆畫橫平豎直,與此同時,書寫機能又受到大腦神經中樞的限制,不會產生較大斜率的傾斜筆畫,因此筆畫平緩和出現極大斜率的頻率較低;對于特征字的大小,樣本筆跡中中等字和大字占絕大多數,而小字極少;對于特征字字形,觀察發(fā)現方形、長形字最多,扁形字次之,而圓形字更少,超長、超扁字則微乎其微,特別是極不規(guī)則字出現率為0,究其原因,應是本實驗在某警院內部進行,受試者均有本科以上文化程度,受過長期規(guī)范的書寫訓練,導致這幾種類型的字形出現率可能低于實際情況,但差距并非很大;對于3種字行間距分組出現率基本持平。對于字間、字內搭配組合,整體來看一般和整齊的較多,出現凌亂的較少,這亦是受到受試者文化程度的影響;運筆速度中等及偏快較多,較慢的很少,應是由于實驗對象均為人民警察或預備警官,他們在入警或入校前都經過了嚴格的體檢,因此反應快、協(xié)調性好,且實際情況與樣本總體差距應不大;在筆尖壓力大小的統(tǒng)計數據中,中等筆壓分布最多,輕微和較重筆壓出現概率較少,并且基本持平,這也與實際情況是吻合的。
(1)獨立性檢驗
基于似然比檢驗實際上是貝葉斯決策理論的推廣,故應服從條件概率的假設前提,即保證相關的各個事件均相互獨立。利用上述實驗中的筆跡特征統(tǒng)計數據,可統(tǒng)計出9種筆跡特征的頻數以及每份筆跡中各特征的組合關系,以此來測試9種特征是否相互獨立。利用SPSS ( Statistical Program for Social Sciences ) 19.0統(tǒng)計分析軟件在Windows 10操作環(huán)境下對數據庫進行交叉列聯表分析,在顯著性水平下,對9種筆跡特征進行卡方檢驗及Fisher精確檢驗,所得到的Sig雙尾檢驗概率P值均小于0.05,證明各筆跡特征之間相互獨立,可以用于似然比檢驗鑒定。
表3 特征典型性
(2)案例應用
下面以具體實例說明利用似然比進行筆跡量化檢驗的方法。圖1為檢材筆跡a,圖2為樣本筆跡b,需要檢驗鑒定a與b是否系同一人書寫。對檢材和樣本筆跡特征字逐個對應于9種筆跡特征,通過比較分析,得到表4所示的結果。
圖1 檢材筆跡a
圖2 樣本筆跡b
表4 檢材樣本特征字筆跡特征比較分析結果
可以看出,對于特征字“他”而言,T2(筆畫寬度)、T5(特征字字形)、T6(字行間距)、T7(字間字內搭配組合)4個特征指標表現一致。分別計算出筆畫寬度、特征字字形、字行間距、字間字內搭配組合4個特征的似然比值,即:
LR(T2)=1/0.26=3.85
LR(T5)=1/0.17=5.88
LR(T6)=1/0.373 3=2.68
LR(T7)=1/0.146 7=6.82
累積似然比值LR(“他”)=LR(T2)×LR(T5)×LR(T6)×LR(T7)=3.85×5.88×2.68×6.82=413.77。屬于100~1 000的范圍內,為第三級似然比等級,即中等以上強度的支持。
對于特征字“不”而言,T1(筆畫長度)、T5(特征字字形)、T7(字間字內搭配組合)、T9(筆尖壓力大小)4個特征表現一致。分別計算出筆畫長度、特征字字形、字間字內搭配組合、筆尖壓力大小4個特征的似然比值,即:
LR(T1)=1/0.113 3=8.83
LR(T5)=1/0.396 7=2.52
LR(T7)=1/0.496 7=2.01
LR(T9)=1/0.453 3=2.21
累積似然比值LR(“不”)=LR(T1)×LR(T5)×LR(T7)×LR(T9)=8.83×2.52×2.01×2.21=98.84。屬于10~100的范圍內,為第二級似然比等級,即中等強度的支持。
對于特征字“在”而言,T1(筆畫長度)、T2(筆畫寬度)、T3(筆畫角度)、T4(特征字大小)、T7(字間字內搭配組合)5個特征表現一致。分別計算出筆畫長度、筆畫寬度、筆畫角度、特征字大小、字間字內搭配組合5個特征的似然比值,即:
LR(T1)=1/0.833 3=1.20
LR(T2)=1/0.26=3.85
LR(T3)=1/0.23=4.35
LR(T4)=1/0.43=2.33
LR(T7)=1/0.496 7=2.01
累積似然比值LR(“在”)=LR(T1)×LR(T2)×LR(T3)×LR(T4)×LR(T7)=1.20×3.85×4.35×2.33×2.01=94.12。屬于10~100的范圍內,為第二級似然比等級,即中等強度的支持。
對于特征字“的”而言,T1(筆畫長度)、T4(特征字大小)、T6(字行間距)、T7(字間字內搭配組合)、T9(筆尖壓力大小)5個特征表現一致。分別計算出筆畫長度、特征字大小、字行間距、字間字內搭配組合、筆尖壓力大小5個特征的似然比值,即:
LR(T1)=1/0.113 3=8.83
LR(T4)=1/0.43=2.33
LR(T6)=1/0.373 3=2.68
LR(T7)=1/0.496 7=2.01
LR(T9)=1/0.296 7=3.37
累積似然比值LR(“的”)=LR(T1)×LR(T4)×LR(T6)×LR(T7)×LR(T9)=8.83×2.33×2.68×2.01×3.37=373.49。屬于100~1 000的范圍內,為第三級似然比等級,即中等以上強度的支持。
對于特征字“我”而言,T1(筆畫長度)、T2(筆畫寬度)、T3(筆畫角度)、T4(特征字大小)、T6(字行間距)5個特征表現一致。分別計算出筆畫長度、筆畫寬度、筆畫角度、特征字大小、字行間距5個特征的似然比值,即:
LR(T1)=1/0.833 3=1.20
LR(T2)=1/0.26=3.85
LR(T3)=1/0.23=4.35
LR(T4)=1/0.43=2.33
LR(T6)=1/0.373 3=2.68
累積似然比值LR(“我”)=LR(T1)×LR(T2)×LR(T3)×LR(T4)×LR(T6)=1.20×3.85×4.35×2.33×2.68=125.49。屬于100~1 000的范圍內,為第三級似然比等級,即中等以上強度的支持。
對于特征字“是”而言,T2(筆畫寬度)、T3(筆畫角度)、T4(特征字大小)、T5(特征字字形)、T6(字行間距)5個特征表現一致。分別計算出筆畫寬度、筆畫角度、特征字大小、特征字字形、字行間距5個特征的似然比值,即:
LR(T2)=1/0.26=3.85
LR(T3)=1/0.23=4.35
LR(T4)=1/0.43=2.33
LR(T5)=1/0.396 7=2.52
LR(T6)=1/0.373 3=2.68
累積似然比值LR(“有”)=LR(T2)×LR(T3)×LR(T4)×LR(T5)×LR(T6)=3.85×4.35×2.33×2.52×2.68=263.54。屬于100~1 000的范圍內,為第三級似然比等級,即中等以上強度的支持。
對于特征字“有”而言,T2(筆畫寬度)、T4(特征字大小)、T5(特征字字形)、T6(字行間距)、T7(字間字內搭配組合)5個特征表現一致。分別計算出筆畫寬度、特征字大小、特征字字形、字行間距、字間字內搭配組合5個特征的似然比值,即:
LR(T2)=1/0.26=3.85
LR(T4)=1/0.43=2.33
LR(T5)=1/0.396 7=2.52
LR(T6)=1/0.373 3=2.68
LR(T7)=1/0.496 7=2.01
累積似然比值LR(“有”)=LR(T2)×LR(T4)×LR(T5)×LR(T6)×LR(T7)=3.85×2.33×2.52×2.68×2.01=121.77。屬于100~1 000的范圍內,為第三級似然比等級,即中等以上強度的支持。
綜合評斷,支持檢材筆跡與樣本筆跡系同一人書寫的力度極強,結合其它證據(先驗優(yōu)勢),本案可作出認定同一的檢驗意見(后驗優(yōu)勢),即a與b系同一人書寫。
本文針對利用似然比檢驗對筆跡進行同一認定進行了研究嘗試,結果證明該方法在筆跡檢驗領域是可行的。但仍存在諸多待完善之處,例如選取特征較少、主觀誤差較大等,下一步將完善實驗數據,保證定量分析的數據準確率,并結合其他關聯物證,對筆跡同一認定做進一步的系統(tǒng)量化檢驗,從而得到更精確的分析結果。