田師思,姜 紅*,齊恒慧,王一端,滿 吉
(1.中國人民公安大學(xué) 偵查與刑事科學(xué)技術(shù)學(xué)院,北京 100038;2.中國人民大學(xué) 統(tǒng)計(jì)學(xué)院,北京 100044; 3.北京華儀宏盛技術(shù)有限公司,北京 100123)
橡膠物證的檢驗(yàn)是理化物證的一項(xiàng)重要工作。在交通肇事案件中,橡膠顆粒與輪胎的同一認(rèn)定往往能成為公安機(jī)關(guān)偵查破案的關(guān)鍵線索,因而探索橡膠輪胎與品牌的關(guān)聯(lián)對(duì)于案件的偵破有著重要意義。根據(jù)對(duì)汽車輪胎成分的分析,其主要組成大致為生膠、硫化劑、填充補(bǔ)強(qiáng)劑、防護(hù)劑和其他一些添加劑。
目前,在司法鑒定領(lǐng)域,國內(nèi)外常見的橡膠輪胎檢驗(yàn)方法主要有紅外光譜法[1]、熱重分析法[2]、裂解氣相色譜法[3]、拉曼光譜法[4]等。其中紅外光譜法具有檢驗(yàn)速度快、用量小的優(yōu)勢(shì),應(yīng)用最為廣泛;熱重分析法定量準(zhǔn)確但操作復(fù)雜;裂解氣相色譜法分析靈敏度高,但屬于有損分析。X射線熒光光譜法目前應(yīng)用于測(cè)定土壤[5]、塑料、橡膠[6]等,是一種快速便捷,操作簡(jiǎn)單且對(duì)樣品無損的檢驗(yàn)方法。
英國牛津公司生產(chǎn)的X-MET8000新型手持式X射線熒光光譜儀,濾光片為6位濾光轉(zhuǎn)換器,IP54防護(hù)等級(jí)(NEMA3),電壓45 kV,電流40 μA,測(cè)試時(shí)間80s。
實(shí)驗(yàn)樣本:不同品牌的輪胎樣本30個(gè)(見表1)。
表1 輪胎樣本表
切下汽車橡膠輪胎樣本,脫脂棉簽蘸取乙醇后擦拭輪胎樣本待其完全晾干后置于探測(cè)器和X射線管下,檢測(cè)樣本。如是重復(fù),最終得到30個(gè)輪胎樣本的各元素含量數(shù)據(jù)。
從30個(gè)樣本中隨機(jī)抽取1#樣本進(jìn)行預(yù)實(shí)驗(yàn),以30 s為起始時(shí)間,120 s為最終時(shí)間,10 s為間隔,梯度時(shí)間依次對(duì)1#樣本可測(cè)定元素含量進(jìn)行記錄。綜合元素檢出種類和檢出元素含量兩個(gè)數(shù)值的穩(wěn)定程度,最終確定實(shí)驗(yàn)時(shí)間在80 s時(shí)為優(yōu)。依此方法將各個(gè)實(shí)驗(yàn)樣本在最優(yōu)實(shí)驗(yàn)時(shí)間條件下依此測(cè)定元素含量,平行測(cè)定3次取平均值。
面對(duì)30個(gè)輪胎樣本,數(shù)十種不同品牌,結(jié)合五種主要元素含量,這樣龐大的數(shù)據(jù)量單純憑借某兩種元素的比例或者某一種元素的有無進(jìn)行樸素的分類難免有失科學(xué)性。故此本文希望借助數(shù)學(xué)工具以構(gòu)建一種解決龐大樣本量問題的模型。
2.1.1 Power K-Means聚類分析[7]
目前,K-Means算法被廣泛應(yīng)用于解決各種聚類分析的問題,但其過于依賴于初始值的正確確立與高維度下較差的表現(xiàn)力導(dǎo)致人們開始尋找更為有效的算法。本文選擇了Jason Wu在2019年提出的Power K-Means聚類分析來尋求突破K-Means算法的限制。
首先根據(jù)SSE值的變化用手肘法[6]確定K的值,如圖1可知,當(dāng)SSE的值在K=2時(shí)出現(xiàn)拐點(diǎn),即判定簇的數(shù)量應(yīng)當(dāng)為1。
圖1 SSE與簇的數(shù)量關(guān)系圖
2.1.2 聚類結(jié)果與分析
聚類結(jié)果如表2所示。
表2 30個(gè)橡膠輪胎樣本的分組結(jié)果
2.1.3 驗(yàn)證Pearson系數(shù)[8]
Pearson系數(shù)用以評(píng)估兩個(gè)變量之間的相關(guān)程度,為驗(yàn)證同一組內(nèi)的變量相關(guān)程度,測(cè)定類別2中樣本的組內(nèi)Pearson系數(shù)。由表3可見,類別2的組內(nèi)Pearson系數(shù)均在0.001水平上呈現(xiàn)顯著相關(guān)。故而,本聚類分組效果較為理想。
表3 樣本矩積相關(guān)系數(shù)結(jié)果
利用R語言計(jì)算DBI和DI,借助這兩個(gè)指標(biāo)通過衡量組間相似度與組內(nèi)相似度,達(dá)到對(duì)聚類效果進(jìn)行評(píng)價(jià)的目的。DBI指標(biāo)為1.029831,說明每個(gè)簇樣本之間的平均值較小,即簇內(nèi)樣本距離都比較近;DI指數(shù)為0.115539,說明任意兩個(gè)簇之間最近的距離的最小值較大,即簇間樣本距離相互都比較遠(yuǎn)。故,此聚類算法的結(jié)果類內(nèi)聚集程度高,類間離散程度大。
圖2中,同樣品牌的橡膠輪胎樣本具有同樣的陰影背景。由此可見在30個(gè)樣本中,只有3#輪胎樣本是CONTINENTAL輪胎,同樣也只有8#和28#輪胎樣本源自PIRELLI品牌。由3#樣本獨(dú)立一組,8#和29#樣本被歸為一組的分組結(jié)果可知,CONTINENTAL輪胎和PIRELLI輪胎分別具有較強(qiáng)的品牌關(guān)聯(lián)性,即依據(jù)五種主要元素作為衡量維度可以有效的將該兩種品牌的輪胎從眾多品牌輪胎中區(qū)分出來。在第二組中,包含了所有DUNLOP和GOOD YEAR品牌的輪胎,表明這兩種輪胎原材料的元素含量有很高的相似性,但該組中除這兩種品牌的輪胎外仍有其他品牌的輪胎。第三組中,包含了大部分的HANKOOK品牌和其余品牌的輪胎。綜上,在本實(shí)驗(yàn)中,CONTINENTAL和PIRELLI輪胎可以被獨(dú)立區(qū)分,DUNLOP和GOOD YEAR這兩種品牌可與其他品牌區(qū)分開來。同樣,該結(jié)果也從側(cè)面驗(yàn)證了分組結(jié)果的可靠性。
圖2 11種品牌分布圖
本實(shí)驗(yàn)采用Power K-Means聚類分析結(jié)合X射線熒光光譜法對(duì)不同品牌的橡膠輪胎進(jìn)行研究,將輪胎樣本依據(jù)五種元素的含量不同進(jìn)行分類,使用矩積相關(guān)系數(shù)和DBI、DB指數(shù)共同驗(yàn)證聚類效果。最終的分類結(jié)果中,只有1個(gè)樣本與異品牌樣本分為一類,分類效果理想。由此可知,通過X射線熒光光法測(cè)定橡膠輪胎中主要元素含量,再進(jìn)行聚類分析可以作為部分品牌橡膠輪胎進(jìn)行識(shí)別的依據(jù)。該方法避免了主觀判斷的干擾,更加客觀、合理,是一種可行的分類模型,具有一定借鑒意義。日后若能擴(kuò)大樣本量,有望構(gòu)建一種快速、高效鑒別橡膠輪胎的方法,為公安實(shí)際工作中解決汽車橡膠輪胎有關(guān)案件提供新思路。