張根偉, 彭思龍, 郭騰霄, 楊 杰, 楊俊超, 張 旭, 曹樹亞*, 黃啟斌*
1. 國民核生化災(zāi)害防護(hù)國家重點(diǎn)實(shí)驗(yàn)室, 北京 102205 2. 中國科學(xué)院自動(dòng)化研究所, 北京 100190 3. 中國科學(xué)院大學(xué), 北京 100190
離子遷移譜(ion mobility spectrometry, IMS)技術(shù)是基于氣相中不同的離子在電場中遷移速率的差異來對化學(xué)離子物質(zhì)進(jìn)行分離表征的一項(xiàng)分析技術(shù), 是目前最為廣泛使用的痕量化學(xué)物質(zhì)檢測技術(shù)之一。 離子遷移譜檢測儀具有常壓下檢測、 分析靈敏度高、 響應(yīng)時(shí)間短、 成本低等突出優(yōu)點(diǎn), 廣泛應(yīng)用于化學(xué)戰(zhàn)劑、 爆炸物、 毒品和代謝組學(xué)等檢測領(lǐng)域[1-3]。
離子遷移譜儀采集到的原始信號(hào)為微弱電流信號(hào), 微弱信號(hào)容易淹沒在噪聲中而無法檢測, 嚴(yán)重影響化學(xué)物質(zhì)種類識(shí)別的準(zhǔn)確性。 因此, 在進(jìn)行化學(xué)物質(zhì)種類定性分析之前需對譜圖進(jìn)行重構(gòu)。 國內(nèi)學(xué)者采用多項(xiàng)式數(shù)據(jù)平滑、 傅里葉變換和小波分析等方法用于離子遷移譜譜圖去噪重構(gòu)[4-5]。 離子遷移譜特征峰表征了待分析樣品的化學(xué)組成和含量信息, 進(jìn)行特征峰提取是信號(hào)處理中很基礎(chǔ)也至關(guān)重要的一個(gè)環(huán)節(jié)。 導(dǎo)數(shù)法是當(dāng)前應(yīng)用最普遍的一種特征峰提取方法, 按照原理不同可分為一階、 二階導(dǎo)數(shù)法及其結(jié)合方法等[6-7]。 導(dǎo)數(shù)法的步驟簡單易實(shí)現(xiàn), 對于信噪比好的數(shù)據(jù)能獲得很好的尋峰效果, 但其在應(yīng)對噪聲和背景的干擾、 重疊峰以及峰形畸變等情形時(shí)有明顯缺陷。
現(xiàn)有的離子遷移譜譜圖特征峰提取是在譜圖去噪重構(gòu)后進(jìn)行, 需采用不同的算法實(shí)現(xiàn)。 本文通過構(gòu)造一種可同時(shí)實(shí)現(xiàn)離子遷移譜譜圖重構(gòu)和特征峰提取的優(yōu)化目標(biāo)函數(shù), 采用稀疏表示算法進(jìn)行求解。 常用稀疏表示求解算法包括匹配追蹤、 交替方向乘子算法、 最小角回歸法、 替代函數(shù)法, 迭代重加權(quán)最小二乘算法等[8-11]。 替代函數(shù)算法具有運(yùn)行速度快的優(yōu)點(diǎn), 在此用于求解優(yōu)化目標(biāo)函數(shù)。
若下述條件成立, 則φ(x,x0)稱為f(x)的替代函數(shù):
(1):φ(x,x0)≥f(x)對于任意的x成立;
(2):φ(x0,x0)=f(x0)。
離子遷移譜信號(hào)x一般認(rèn)為由純譜s和噪聲n組成, 純譜s可以由字典Φ線性表示, 存在表示系數(shù)α使得
s=Φα
(1)
帶電離子群在弱電場遷移管中運(yùn)動(dòng)時(shí)會(huì)受到庫倫斥力、 擴(kuò)散和碰撞等因素的影響, 一般認(rèn)為形成的特征峰是高斯分布[12], 故采用高斯分布函數(shù)擬合離子遷移譜特征峰函數(shù), 離子遷移譜譜圖可以看成由不同的高斯分布函數(shù)擬合而成, 字典Φ由高斯函數(shù)構(gòu)造。 基于稀疏表示, 提出了一種可同時(shí)實(shí)現(xiàn)離子遷移譜譜圖重構(gòu)及特征峰提取的優(yōu)化目標(biāo)函數(shù)如式(2)所示
(2)
λ1為正則化參數(shù)用來調(diào)節(jié)懲罰項(xiàng)在優(yōu)化過程中的比例。α(k)表示第k次迭代值, 對于L(α), 構(gòu)造如式(3)替代函數(shù)
(3)
將Q(α,α(k-1))化簡并且將關(guān)于α的項(xiàng)配方得
λ1‖α‖1+const
(4)
式(4)中的const部分與α的優(yōu)化無關(guān), 所以
α(k)=argminαQ(α,α(k-1))
(5)
Sλ(ν)=max(ν-λ1, 0)-max(-ν-λ1, 0)
(6)
利用軟閾值函數(shù)得到
(7)
由于α的非負(fù)性約束, 需要將α(k)往其正部投影。 算法的終止條件是: 達(dá)到最大的迭代次數(shù)或者重構(gòu)后譜圖均方根誤差低于設(shè)定的閾值。 通過替代函數(shù)算法得到的s=Φα就是重構(gòu)后的離子遷移譜譜圖, 特征峰提取則通過稀疏表示系數(shù)α實(shí)現(xiàn)。
使用高斯函數(shù)的線性疊加來仿真純凈的離子遷移譜信號(hào), 仿真數(shù)據(jù)由六個(gè)不同高斯函數(shù)字典原子和高斯白噪聲組成。 高斯白噪聲標(biāo)準(zhǔn)差為0, 幅值為譜圖信號(hào)最大幅值的1%。 計(jì)算機(jī)配置和編程語言如下: CPU: i7-4790S, 3.20 GHz; 內(nèi)存: 8 GB; 操作系統(tǒng): 64bit-Windows 7 Home Edition; 編程語言: MATLAB R2014a (MathWorks, Inc.)。 采用替代函數(shù)算法, 對仿真譜圖進(jìn)行了重構(gòu)和特征峰提取, 實(shí)驗(yàn)結(jié)果如圖1所示。
圖1 (a)純凈譜圖信號(hào); (b)疊加高斯噪聲后譜圖信號(hào); (c)重構(gòu)后譜圖信號(hào); (d)特征峰提取
圖2 (a)小波軟閾值算法; (b)小波硬閾值算法; (c)S-G算法; (d)替代函數(shù)算法
為了評估替代函數(shù)算法重構(gòu)效果, 我們同小波軟閾值、 小波硬閾值和S-G平滑濾波等去噪重構(gòu)算法進(jìn)行了比較, 仿真譜圖重構(gòu)結(jié)果如圖2所示。
重構(gòu)后的IMS譜圖采用均方根誤差(RMSE)和信噪比(SNR)兩種指標(biāo)來評估方法性能, RMSE和SNR計(jì)算公式分別為式(8)和式(9)。 實(shí)驗(yàn)結(jié)果如表1所示。 采用替代函數(shù)算法提取的特征峰信息結(jié)果如表2所示。 從表1可以看出, 基于替代函數(shù)算法的譜圖重構(gòu)效果最好, 小波硬閾值和小波軟閾值次之, S-G算法最差。 從表2可以看出, 基于替代函數(shù)算法提取的特征峰信息, 特征峰峰位與真實(shí)峰峰位完全一致, 特征峰峰高與真實(shí)峰峰高略有差距。
(8)
表1 采用不同算法后RMSE和SNR指標(biāo)對比
表2 替代函數(shù)算法提取的特征峰信息
(9)
實(shí)驗(yàn)采用63Ni離子源離子遷移譜檢測儀。 樣本為甲基磷酸二甲酯(dimethyl methylphosphonate, 國藥集團(tuán)化學(xué)試劑有限公司, 99%), DMMP常被用作離子遷移譜檢測儀校準(zhǔn)物, DMMP濃度低時(shí)出現(xiàn)質(zhì)子化單體特征峰, 隨著濃度的增大出現(xiàn)二聚體特征峰。 通過動(dòng)態(tài)配氣儀(CPR001, 北京康爾興)將DMMP與氮?dú)庠跉獯谢旌希?樣本濃度為1 mg·m-3。
采集到的原始DMMP譜圖中一共有三個(gè)特征峰, 空氣中水合離子峰出現(xiàn)在3.9 ms處, DMMP在5.85和10.54 ms處出現(xiàn)質(zhì)子化單體峰和二聚體特征峰, 信號(hào)中噪聲波動(dòng)大、 噪聲幅值約為最大幅值的2%。 經(jīng)過替代函數(shù)求解優(yōu)化目標(biāo)函數(shù)后, 重構(gòu)后的DMMP譜圖及特征峰提取實(shí)驗(yàn)結(jié)果如圖3所示, 小波軟閾值、 小波硬閾值、 S-G算法及替代函數(shù)算法去噪后重構(gòu)譜圖如圖4所示。 從圖3可以看出替代函數(shù)算法同時(shí)實(shí)現(xiàn)了譜圖重構(gòu)和特征峰提取, 提取的特征峰峰高和峰位誤差都在3%以內(nèi)。 圖4中替代化數(shù)算法譜圖重構(gòu)效果明顯優(yōu)于其他三種算法。
圖3 (a)替代函數(shù)算法重構(gòu)DMMP譜圖; (b)替代函數(shù)算法提取的特征峰
圖4 (a)小波軟閾值算法; (b)小波硬閾值算法; (c)S-G算法; (d)替代函數(shù)算法
對離子遷移譜譜圖重構(gòu)及特征峰提取算法進(jìn)行了研究, 提出了一種可同時(shí)實(shí)現(xiàn)離子遷移譜譜圖重構(gòu)及特征峰提取的優(yōu)化目標(biāo)函數(shù), 采用替代函數(shù)算法就行求解。 仿真和真實(shí)樣本實(shí)驗(yàn)表明, 采用優(yōu)化目標(biāo)函數(shù)及替代函數(shù)算法得到的實(shí)驗(yàn)結(jié)果相比其他三種算法有了顯著性能提升。 離子遷移譜譜圖經(jīng)過重構(gòu)及特征峰提取后, 可以實(shí)現(xiàn)化學(xué)物質(zhì)種類的準(zhǔn)確識(shí)別, 為定量研究提供了基礎(chǔ)。