李海燕 蔡潔云 李 鄲 馬慧宇 肖 燕
(云南省煙草質(zhì)量監(jiān)督檢測站,云南 昆明 650104)
真品卷煙商標印刷都由授權(quán)印刷企業(yè)承印,非授權(quán)企業(yè)不得印刷[1],所用的油墨組分穩(wěn)定,技術(shù)保密[2],科技含量高[3]。制假分子為了追求利潤最大化[4]僅通過簡單的掃描仿制等手段和簡陋設備來印制商標,因此根據(jù)印刷品的印刷方式和圖像分布可以發(fā)展出不同的鑒別手段。張冀鵬等[5]基于近紅外光譜對濃度的敏感性,建立了基于近紅外光譜法的卷煙包裝材料色差分析模型,應用于包裝材料外觀質(zhì)量檢驗及成品卷煙的工藝控制。潘昵琥等[6]利用紫外燈、放大鏡和顯微鏡等可見光學儀器,對印刷圖文、防偽處理和后加工技術(shù)處理等方面進行真假比對。聶磊等[7]基于紅外光譜中衰減全反射(ATR)方法通過對多個鑒別點的光譜測試和比較,使用相關系數(shù)法和QC比較法進行相似度分析,建立了多個品牌卷煙的鑒別模型,實現(xiàn)了對假冒卷煙樣品的定性鑒別。然而,隨著經(jīng)濟的發(fā)展,大量的假冒卷煙[8]以指數(shù)的倍率增長并涌向質(zhì)檢,使用傳統(tǒng)的依靠測試人員經(jīng)驗的可見光觀察分析法,工作量巨大,效率不高且主觀性強。
卷煙材料紅外光譜雖容易獲得,但品牌不同,就要重新確定鑒別點,需要在10個鑒別點中找到至少一個分辨力較強的鑒別點[7]。即使同一品牌不同批次的樣品,因承印廠不同,其油墨紅外光譜也會有所差異。因此,如何合理地利用數(shù)據(jù)庫模型對真品光譜進行聚類,快速區(qū)分真假樣品,減少誤判率是現(xiàn)在質(zhì)檢工作迫切需要解決的問題。
紅色油墨在大部分卷煙包裝紙印刷中均有使用。鑒于紅外光譜衰減全反射(ATR)是一種無損、快速的采集方式,受啟發(fā)于近紅外光譜對一些農(nóng)產(chǎn)品產(chǎn)地溯源的研究[9]及產(chǎn)品的鑒別[10],結(jié)合馬氏距離法[11],研究擬基于3個品牌香煙包裝紙上的同一顏色油墨的紅外光譜圖建立辨假模型,以期建立快捷、準確的卷煙包裝紙真假鑒別方法,為追蹤制假卷煙包裝紙來源渠道及鑒別卷煙真?zhèn)翁峁┬碌臋z驗方法。
1.1.1 樣品采集 研究中使用的卷煙包裝紙選擇承印企業(yè)較多的3個產(chǎn)品:云煙(軟珍品)、玉溪(軟)和紅塔山(軟經(jīng)典)。真品樣品由不同承印企業(yè)提供,假煙樣品由云南省煙草質(zhì)量監(jiān)督檢測站提供。編號J代表假煙樣品,編號Z代表真品樣品。樣品區(qū)域分別選擇3種卷煙包裝紙中的紅色油墨部分。
1.1.2 主要儀器設備 傅里葉變換紅外光譜儀:Thermo Fisher Nicolet iS50型,配備內(nèi)置的金剛石晶體衰減全反射(ATR)采集附件、氘化處理后的硫酸三甘肽晶體DTGS檢測器、溴化鉀分束器,光譜采集范圍為400~4 000 cm-1,賽默飛世爾科技(中國)有限公司。
1.2.1 測試方法 云煙(軟珍品)包裝紙檢測條形碼下方紅色區(qū)域,玉溪(軟)包裝紙檢測底版紅點,紅塔山(軟經(jīng)典)包裝紙檢測“紅”字正中,如圖1所示。
紅外光譜的采集使用傅里葉變換紅外光譜儀,在圖1中所確定的鑒別點上采集紅外光譜,光譜分辨率為4 cm-1,每個樣品掃描16次取平均值。
將測試區(qū)域的紅色油墨面向ATR晶體表面,使用壓頭使測試樣品緊緊貼在晶體表面,采集測試直徑2 mm區(qū)域(與晶體緊緊接觸)的傅里葉變換紅外光譜圖。將獲得的紅外光譜圖按照品牌真假進行賦值,利用馬氏距離公式計算出每一類別的協(xié)方差矩陣,進行聚類計算形成該類型的數(shù)學投影,即形成辨假模型。再將需要判別的包裝紙上同樣位置采集的紅外光譜使用相同的算法處理后,計算其馬氏距離,該距離值用來判別一個未知樣品到已知材料類別的匹配程度。
1.2.2 馬氏距離計算[12]馬氏距離是一種有效計算兩種未知樣本集相似性的算法,是一種獨立于測量尺度表征各種特性之間聯(lián)系的計算方法。馬氏距離也可以定義為兩個服從同一分布并且其協(xié)方差矩陣為M的隨機變量之間的差異程度。
(1) 真品平均譜計算:
(1)
式中:
Aij——光譜矩陣元素;
n——光譜數(shù)量。
(2) 去中心化:
(2)
式中:
Au——去中心化后的光譜矩陣;
A——樣品光譜;
(3) 協(xié)方差計算:
(3)
式中:
M——標準光譜集的協(xié)方差矩陣;
Au——去中心化后的光譜矩陣;
n——光譜數(shù)量。
(4) 馬氏距離計算:
(4)
式中:
D——馬氏距離;
M——標準光譜集的協(xié)方差矩陣;
Ai——校正集光譜;
A——樣品光譜。
將分別收集的云煙、玉溪、紅塔山3個品牌中的真品,其中云煙真品樣本14個、玉溪真品樣本18個以及紅塔山真品樣品24個。按照圖1的鑒別點分別采集紅外光譜圖,依據(jù)文獻[7]中所提及的QC比較法進行相似度比對,結(jié)果如表1所示。
由表1可知,同一品牌的真品因為印刷廠不同、印刷批次不同,光譜相似度都有比較明顯的差別。其中,云煙的平均相似度為84.27%,玉溪的平均相似度為77.51%,紅塔山的平均相似度為64.96%。由此可見,即使同一品牌的樣品,因為承印的印刷廠不同,批次之間的差異也很大,印刷廠的數(shù)量越多,批次間的相似性越離散。說明QC比較法更適合于承印廠不多、油墨配方固定的品牌,對于生產(chǎn)量巨大,承印廠分布多的品牌而言,QC比較法批次間差異較大,無法有效和快速地進行辨假。因此,引入馬氏距離算法,將真品光譜進行聚類模型的建立,使用光譜數(shù)據(jù)的數(shù)學投影,達到區(qū)分真假光譜的目的。
表1 云煙、玉溪、紅塔山3個品牌真品包裝之間的相似度Table 1 The similarity results of real packaging the 3 brands including Yunyan, Yuxi and Hongtashan%
2.2.1 三品牌紅色油墨一致性考察 如圖2所示,云煙、玉溪和紅塔山3個品牌的紅外光譜圖呈現(xiàn)出不同的出峰位置和分子振動吸收。其中,3 700~3 500 cm-1的吸收峰為環(huán)境中水蒸氣的羥基的吸收峰和少量的磷酸鹽中羥基的振動;3 500~2 800 cm-1的吸收峰為C—H鍵的吸收振動峰,峰位和峰型的不同,表明油墨的有機碳鏈的長短和支化類型不同;1 800~1 640 cm-1的吸收峰大多為酯基、羧基峰,此位置往往出現(xiàn)整個紅外光譜中最強和最尖銳的吸收峰,根據(jù)該位置的峰位可以推斷出所連基團的類型;1 500~800 cm-1的吸收峰為整個油墨和紙張混合譜的指紋峰,其中1 510~1 390 cm-1的吸收峰為碳酸根的吸收峰,碳酸根來自于紙張的添加劑。
因為不同品牌所使用的紅色油墨的化學結(jié)構(gòu)不同,所以在設計模型的過程中,采用先分步對單一品牌建模,分別驗證單一品牌模型的鑒別效果。為了提高鑒別效率,將3個品牌真品光譜的集合設計為粗糙集,建立混合模型。在驗證步驟中,使用60個從市場上收集來的3個品牌的贗品,每個品牌各20張以及3個品牌中隨機的2張真品分別對云煙、玉溪、紅塔山3個單獨模型和混合模型進行驗證。
圖3為3個品牌贗品的紅外光譜圖,與圖2相比,贗品的光譜圖的峰位和峰型更加雜亂,說明贗品的油墨結(jié)構(gòu)差異性相當大。
圖2 不同品牌紅色油墨紅外光譜Figure 2 Red ink FTIR spectrum of different brand
圖3 贗品紅色油墨紅外光譜Figure 3 Red ink FTIR spectrum of fake
2.2.2 建模及模型驗證 為了除去CO2[13]和紙張中CaCO3[14]的干擾,光譜范圍選取3段:3 200~2 700,1 800~1 580,801~720 cm-1,光譜經(jīng)二階導降維處理后進行聚類建模,以降維真品光譜數(shù)據(jù)的數(shù)學投影作為真集,再將驗證降維光譜與真集的馬氏距離代入聚類模型(見圖4)。以馬氏距離判定真假,當與真集的距離為0時,判定為真;當距離不為0時,判定為假。
圖4 3個品牌香煙包裝紙紅色油墨的單獨辨假模型Figure 4 The 3 brands’ separate anti-counterfeit models of cigarette packaging paper
模型的驗證集由收集到的贗品組成,其中云煙、玉溪、紅塔山贗品各20個,隨機抽取3個品牌的真品各兩個加入到驗證集中。如表2所示,3個品牌單獨建模的準確率均為100%。
表2 云煙、玉溪、紅塔山3個品牌單獨辨假模型驗證結(jié)果 Table 2 Verification results of the 3 brands’ separate anti-counterfeit model including Yunyan, Yuxi and Hongtashan
為提高工作效率,將14個云煙真品、18個玉溪真品和24個紅塔山真品的二階導降維光譜載入專業(yè)的TQ analyst模型計算軟件中,加入種類的維度,使用距離判別對樣品進行聚類模型(見圖5)的建立,光譜范圍選擇:3 200~2 700,1 800~1 580,801~720 cm-1。準確性的判定基于同類型的馬氏距離和種類的歸屬,只有當兩項均滿足符合條件時才可判定樣品是否為真品。將云煙、玉溪、紅塔山贗品各20個包裝紙油墨的紅外光譜圖代入模型計算,結(jié)果如表3所示,其判定結(jié)果準確率達到100%。說明使用該模型可以對云煙、玉溪和紅塔山3個品牌的樣品進行快速的篩分,迅速確定未知樣品的真?zhèn)巍?/p>
圖5 3個品牌香煙包裝紙紅色油墨的混合辨假模型Figure 5 The 3 brands’ mix anti-counterfeit model
表3 混合辨假模型驗證結(jié)果Table 3 Verification results of the 3 brands’ mix Anti-counterfeit model
研究從承印廠較多的3個品牌的卷煙包裝紙上的紅色油墨入手,采用衰減全反射(ATR)方式對紅色油墨部分進行紅外光譜采集,使用馬氏距離法分別建立了3個品牌的聚類模型和混合模型,通過每品牌各20個贗品驗證其準確性后,準確率均達到100%。與傳統(tǒng)的QC比較法相比,該組模型具有更高的準確性。
研究建立了一組具有普適性,可自動學習的辨假模型,實現(xiàn)了未知樣品粗篩,為提高質(zhì)檢的工作效率提供了一種便捷的途徑。在將來的工作中,可以用新品牌紅色油墨的紅外光譜圖不斷校正和擴大模型,通過模型轉(zhuǎn)移和修正擴大到更廣闊的品牌覆蓋和質(zhì)檢第一線,進一步地大量采集不同廠家真品樣品及不同批次假煙包裝紙紅外光譜,通過機器監(jiān)督學習對給定的已知類別標號樣本建立多分類模型,為在制售假煙新型網(wǎng)絡案件中查獲的卷煙及輔料的關聯(lián)性鑒定、追蹤假煙包裝紙印刷窩點提供新方法。