何偉健, 程良倫, 鄧廣水
廣東工業(yè)大學(xué)自動化學(xué)院, 廣東 廣州 510006
大部分物質(zhì)的振動和轉(zhuǎn)動能級都處于太赫茲波段范圍, 不同物質(zhì)在該波段的吸收光譜位置、 形狀存在差異。 同時(shí)太赫茲光子的能量很低, 一般不會破壞被檢測物質(zhì)。 因此太赫茲光譜是進(jìn)行物質(zhì)識別的重要手段, 在食品安全、 醫(yī)藥健康、 公共安全等方面有重要應(yīng)用[1-3]。
目前太赫茲光譜提取特征常用的方法有主成分分析、 偏最小二乘法、 神經(jīng)網(wǎng)絡(luò)、 深度置信網(wǎng)絡(luò)等方法, 然后再使用學(xué)習(xí)器對提取到的特征進(jìn)行學(xué)習(xí)[4]。 雖然這些方法在進(jìn)行物質(zhì)種類較少時(shí)的物質(zhì)識別有效, 但提取到的特征并沒有明確的物理意義, 很難用于對成分含量不同的混合物進(jìn)行成分檢測。 由于分子內(nèi)原子的三維排列、 低頻運(yùn)動以及非共價(jià)化學(xué)鍵的影響, 許多物質(zhì)的太赫茲吸收譜在特定頻率上會出現(xiàn)吸收峰[5]。 吸收峰特征由分子內(nèi)部結(jié)構(gòu)引起, 是物質(zhì)的固有屬性, 可以作為混合物成分檢測時(shí)的重要特征, 有效準(zhǔn)確地提取這些特定吸收峰的參數(shù), 是提高識別率的關(guān)鍵。
曲線擬合是進(jìn)行吸收峰提取的重要方法。 多峰擬合算法可以將復(fù)雜曲線擬合成多個(gè)標(biāo)準(zhǔn)峰函數(shù)之和, 如高斯函數(shù)、 洛倫茲函數(shù)等, 從而提取到光譜曲線中存在的吸收峰參數(shù)[6]。 純凈物的吸收峰參數(shù)容易提取, 但混合物的光譜曲線是多類物質(zhì)光譜的近似線性疊加, 可能會出現(xiàn)吸收峰相互重疊的情況。 目前多峰擬合算法以各種尋峰算法結(jié)果為基礎(chǔ)確定吸收峰所在的大致位置和數(shù)量, 在混疊光譜中很難準(zhǔn)確定位吸收峰[7-8]。
為了提高混疊狀態(tài)的吸收峰定位精確度, 可以分別對尋峰和擬合兩個(gè)過程進(jìn)行優(yōu)化。 Cui等[9]利用遺傳算法對高斯擬合進(jìn)行優(yōu)化, 得到葡萄糖水溶液近紅外光譜的吸收峰參數(shù)。 Mukoyama[10]在X光譜中成功利用模擬退火算法優(yōu)化高斯擬合算法。 通過引入遺傳或退火算法進(jìn)行優(yōu)化, 確定吸收峰參數(shù)的最優(yōu)值, 能夠有效減少多峰擬合的誤差。 但這些方法需要在優(yōu)化前事先指定吸收峰的數(shù)目, 無法實(shí)現(xiàn)對各種光譜曲線的自適應(yīng)處理。 另一方面可以優(yōu)化尋峰算法的準(zhǔn)確性, 有研究使用基于小波變換的脊線尋峰法和一種新型脊線校正方法, 能夠更準(zhǔn)確地提取出激光光譜中的混疊峰。 而畢云峰等先用對稱零面積變換尋峰方法確定吸收峰的個(gè)數(shù)和初步的峰參數(shù), 再以Levenberg-Marquardt方法對獲得的參數(shù)進(jìn)行擬合優(yōu)化。 上述方法先尋找到吸收峰的位置, 再進(jìn)行高斯峰擬合, 通過優(yōu)化尋峰方法提高了對混疊峰的分辨能力。 但這些方法分成了尋峰和擬合兩個(gè)步驟, 尋峰過程中得到的吸收峰信息不一定是最優(yōu)的擬合結(jié)果。
為了更準(zhǔn)確地識別定位混疊峰, 研究中利用了遺傳算法, 但與其他文獻(xiàn)中使用遺傳算法直接求解最優(yōu)擬合參數(shù)的方法不同, 是將尋峰和擬合兩個(gè)步驟融合。 首先以大幅度平滑后的曲線波谷為分界點(diǎn)分割光譜曲線, 通過遺傳算法選擇最佳的區(qū)間組合進(jìn)行擬合, 得到吸收峰頻率近似值, 擬合時(shí)用峰數(shù)遞增條件計(jì)算每個(gè)區(qū)間內(nèi)最佳峰數(shù)。 最后對吸收峰頻率進(jìn)行微調(diào)優(yōu)化, 輸出吸收峰頻率、 峰高參數(shù)。 使用太赫茲光譜儀測量10類純凈物及其構(gòu)成的混合物并處理。 結(jié)果表明, 該算法能夠提高在混疊光譜中吸收峰的分辨能力, 對吸收峰的定位更加準(zhǔn)確, 且具有一定對不同物質(zhì)自適應(yīng)處理的能力。
光譜儀測量得到的頻譜曲線是一條由離散數(shù)據(jù)點(diǎn)組成的曲線。 多峰擬合算法是光譜曲線擬合的常用算法, 通常使用高斯峰或洛倫茲峰對光譜曲線進(jìn)行擬合。 本文采用高斯峰對光譜曲線進(jìn)行擬合, 但本文算法對洛倫茲峰和其他峰型也同樣適用。 通過一系列單個(gè)高斯峰去擬合光譜曲線, 單個(gè)高斯峰方程為
(1)
式(1)中Ai,bi和ci分別是第i個(gè)高斯峰的峰高、 頻率位置、 峰寬。 由于未知的參數(shù)較多, 直接擬合所有參數(shù)計(jì)算復(fù)雜。 傳統(tǒng)的高斯多峰算法需要先用尋峰算法找到高斯峰的大致位置, 確定高斯峰的數(shù)目, 以尋峰結(jié)果為起點(diǎn)迭代優(yōu)化使得擬合誤差最小。
由于本算法在進(jìn)行擬合前, 先用尋峰算法確定高斯峰大致位置及數(shù)量, 尋峰算法的結(jié)果不一定是擬合的最優(yōu)解。 而且尋峰算法通常忽視了峰之間的相互關(guān)系, 導(dǎo)致對混疊峰的辨別能力和定位能力較弱, 峰高、 峰寬等參數(shù)存在較大偏差。
將尋峰過程和擬合過程融合在一起, 可以有效地提高多峰擬合提取吸收峰的精度。 但是在未確定吸收峰數(shù)和吸收峰位置的情況下, 對整個(gè)光譜同時(shí)進(jìn)行處理計(jì)算相當(dāng)復(fù)雜。 將光譜劃分成若干個(gè)子區(qū)間, 分別進(jìn)行曲線擬合是個(gè)比較好的方法。
假設(shè)所有高斯峰幅值均為正值, 光譜曲線中不含有噪聲, 當(dāng)曲線中每兩個(gè)高斯峰之間均沒有重疊的時(shí)候, 兩個(gè)高斯峰可以通過曲線的波谷(幅值相同的多個(gè)極小點(diǎn)在本文中只算作一個(gè)波谷點(diǎn))進(jìn)行劃分。 因此提出以光譜曲線波谷作為分界點(diǎn), 將曲線劃分成一個(gè)個(gè)子區(qū)間。 然后子區(qū)間之間再進(jìn)行組合, 相互依賴關(guān)系較大的區(qū)間組合一起進(jìn)行高斯多峰擬合, 使用遺傳算法得到最佳的子區(qū)間組合, 即獲取擬合誤差最小的區(qū)間組合。
有相關(guān)文獻(xiàn)在光譜特征提取中使用遺傳算法, 但大多都是用來選擇其中若干個(gè)特征最明顯的區(qū)間或頻率點(diǎn)[11-12]。 也有文獻(xiàn)采用遺傳算法直接最優(yōu)化高斯峰參數(shù), 實(shí)現(xiàn)擬合誤差的最小化, 這類方法需要事先指定吸收峰的個(gè)數(shù)[9]。 由于不同物質(zhì)的光譜曲線吸收峰個(gè)數(shù)一般不同, 直接指定吸收峰個(gè)數(shù)無法實(shí)現(xiàn)對物質(zhì)特征的自適應(yīng)提取。 而本方法與這些方法有所不同, 通過波谷將光譜區(qū)間分成若干子區(qū)間, 再通過遺傳算法找到子區(qū)間的最優(yōu)組合, 實(shí)現(xiàn)高斯多峰擬合最優(yōu)區(qū)間的選擇。 詳細(xì)算法如下
(1) 種群初始化。 基因序列S初始化即長度為r的全1二進(jìn)制序列, 其中r為光譜曲線的波谷數(shù)。r個(gè)波谷加上光譜曲線的兩端一共將曲線分成r+1個(gè)子區(qū)間。 每個(gè)二進(jìn)制數(shù)字分別依次代表一個(gè)子區(qū)間的狀態(tài)(第一個(gè)或最后一個(gè)子區(qū)間的狀態(tài)固定, 組合后至少要有一個(gè)子區(qū)間), 1代表該子區(qū)間獨(dú)立作為擬合區(qū)間, 0代表該子區(qū)間與上一子區(qū)間合并作為一個(gè)整體擬合區(qū)間。 全1序列代表初始狀態(tài)是直接以波谷劃分區(qū)間, 區(qū)間無任何組合。
(2) 個(gè)體變異。 每段基因序列的每一個(gè)基因都有一定概率進(jìn)行取反運(yùn)算。 不同于傳統(tǒng)的遺傳算法, 由于種群初始化不是隨機(jī)值, 而是相同的值。 因此首先進(jìn)行基因變異運(yùn)算。
(3) 種群交叉。 每段基因序列之間有一定概率交換范圍隨機(jī)的若干片段。 為保證最優(yōu)個(gè)體的存在, 每次變異之后加入上一代的最優(yōu)基因序列, 最優(yōu)基因序列初始化為全1序列。
(4) 基因譯碼。 將基因序列轉(zhuǎn)換為子區(qū)間組合。 設(shè)L為組合后的子區(qū)間分界點(diǎn), 若某個(gè)基因?yàn)?, 則將對應(yīng)的分界點(diǎn)加入到L中, 若為0則跳過。
(5) 計(jì)算適應(yīng)度。 使用高斯多峰擬合算法對每一種區(qū)間組合進(jìn)行測試, 每個(gè)子區(qū)間在擬合時(shí)使用1.3節(jié)所述的最優(yōu)吸收峰數(shù)判斷方法確定峰數(shù)。 設(shè)在某一區(qū)間組合下擬合得到的均方根誤差為RMSE, 則適應(yīng)度fit[見式(2)]
(2)
判斷是否已經(jīng)達(dá)到迭代最大次數(shù), 若是則輸出當(dāng)前最佳適應(yīng)度對應(yīng)的區(qū)間組合和對應(yīng)的吸收峰頻率值, 遺傳算法結(jié)束。
(6) 自然選擇。 根據(jù)每個(gè)基因片段適應(yīng)度與所有基因片段適應(yīng)度之和的比例確定每個(gè)基因片段的復(fù)制次數(shù), 同時(shí)限制復(fù)制最大值、 最小值。 當(dāng)新一代種群個(gè)體數(shù)不足時(shí), 復(fù)制當(dāng)前最好個(gè)體至固定數(shù)目。 跳回到第(2)步進(jìn)行下一代的變異。
通過波谷可以將光譜曲線劃分為若干個(gè)子區(qū)間, 但每個(gè)子區(qū)間內(nèi)的擬合吸收峰數(shù)并不確定。 一般來說, 吸收峰越多, 擬合精度越高, 但越有可能使吸收峰的信息受損。 例如將一個(gè)峰高較大的高斯峰拆分成兩個(gè)較小的高斯峰。 一般做法是通過尋峰算法確定高斯峰數(shù), 但結(jié)果不一定是擬合的最優(yōu)解。
由于峰高較大的高斯峰結(jié)果較為可信, 因此研究中采用了包含峰高在內(nèi)的復(fù)合判據(jù)判斷最優(yōu)吸收峰數(shù)。 通過下列峰數(shù)遞增最優(yōu)化方法確定每個(gè)子區(qū)間內(nèi)的擬合高斯峰數(shù), 即通過改變實(shí)際擬合的高斯峰數(shù)m使得式(3)取最大值
(3)
式(3)中Ai表示第i個(gè)高斯峰的峰高, error是擬合誤差,n和m分別是該子區(qū)間在大幅度平滑情況下的波峰數(shù)和實(shí)際擬合的波峰數(shù)。k1,k2和k3是給定常數(shù)。
在未確定峰位置時(shí)進(jìn)行高斯多峰擬合, 擬合高斯峰的中心位置有可能嚴(yán)重偏離擬合區(qū)間, 因此在式(3)的基礎(chǔ)上, 還需要根據(jù)偏離程度進(jìn)行衰減, 通過改變m使得P2取最大值, 見式(4)—式(6)
(4)
(5)
(6)
式(4)中fstart和fend分別為該擬合區(qū)間的起始頻率和結(jié)束頻率, 式(5)中g(shù)1(di)是在[1, 2]內(nèi)單調(diào)遞減的函數(shù), 研究中采用線性遞減函數(shù)。 0≤Ci≤1。
特征提取算法整體流程圖如圖1所示。 首先采用懲罰最小二乘法平滑光譜曲線, 得到大幅度平滑情況下的曲線波谷點(diǎn)和波峰數(shù)。 然后通過非對稱最小二乘法得到基線, 用小幅度平滑時(shí)得到的曲線減去基線并去掉其他光譜測量中的異常數(shù)據(jù), 得到預(yù)處理后的光譜曲線。
以上述曲線波谷點(diǎn)為分界點(diǎn)將預(yù)處理后的曲線劃分為若干個(gè)區(qū)間, 光譜幅值取對數(shù)后通過遺傳算法不斷多峰擬合測試得到最優(yōu)的子區(qū)間組合, 同時(shí)得到各個(gè)區(qū)間內(nèi)的吸收峰頻率近似值。 擬合時(shí)每個(gè)區(qū)間內(nèi)的擬合峰數(shù)通過最優(yōu)峰數(shù)判斷方法確定。 最后用預(yù)處理后的光譜數(shù)據(jù)對吸收峰頻率、 峰高等參數(shù)進(jìn)行微調(diào)優(yōu)化, 得到最終擬合的吸收峰參數(shù)。
圖1 本文特征提取算法流程圖
由于每個(gè)物質(zhì)的吸收峰數(shù)目不等, 很難將從光譜曲線提取到的特征直接輸入常用分類器中進(jìn)行處理。 本文提出一種吸收峰匹配識別算法, 實(shí)現(xiàn)了不同吸收峰數(shù)目間光譜曲線的匹配。
依次取出標(biāo)準(zhǔn)物質(zhì)的第i個(gè)吸收峰信息, 找到待定物質(zhì)中頻率位置最近的吸收峰, 即使得式(7)成立
(7)
其中ε0為給定常數(shù), 當(dāng)找不到fj使式(7)成立時(shí), 該吸收峰匹配程度為0, 繼續(xù)計(jì)算下一吸收峰。 否則該吸收峰的匹配程度計(jì)算如式(8)
(8)
其中g(shù)2(x,y)是單調(diào)遞減函數(shù), 研究中采用橢圓函數(shù), 見式(9)
(9)
循環(huán)直至該標(biāo)準(zhǔn)物質(zhì)的所有吸收峰均判斷完畢, 待定物質(zhì)與該標(biāo)準(zhǔn)物質(zhì)的相似度計(jì)算如式(10)
(10)
式中Cmatch是待定物質(zhì)中已經(jīng)被匹配的吸收峰數(shù)目。 依次將該待定物質(zhì)與數(shù)據(jù)庫中的標(biāo)準(zhǔn)物質(zhì)比較, 待定物質(zhì)即為相似度最大的標(biāo)準(zhǔn)物質(zhì)。
實(shí)驗(yàn)選用日本愛德萬公司的TAS7400太赫茲光譜儀系統(tǒng), 如圖2所示。 光譜儀頻率范圍為0~5 THz, 頻率分辨率為7.6 GHz。 在25 ℃、 8%相對濕度的相對穩(wěn)定環(huán)境下進(jìn)行實(shí)驗(yàn)。 實(shí)驗(yàn)中所用的化學(xué)試劑均采購于廣州東巨實(shí)驗(yàn)儀器等專業(yè)化學(xué)試劑公司, 純度均在99%以上。 固體粉末樣品制備過程如下:
(1)取樣。 用電子分析天平稱量一定量粉末。
(2)研磨。 用瑪瑙研缽研磨粉末, 充分研細(xì)。
(3)烘干。 將固體粉末和其他工具置入烘干機(jī)中, 在45 ℃下烘干1~2 h。
(4)混合。 將待混合的固體粉末置于試管中, 將試管固定在旋渦混合器上5 min, 充分混合均勻。
(5)壓片。 使用10 t千斤頂壓片機(jī)和壓片模具對固體粉末加壓2 min, 壓成厚度約1.5 mm, 直徑約13 mm的固體壓片。
(6)測量厚度。 用電子游標(biāo)卡尺測量壓片厚度, 在不同位置測量三次取平均值。
圖2 TAS7400太赫茲光譜儀實(shí)物圖
取葡萄糖、 乳糖、 果糖等10種常見純凈物按照上述制樣方法制作壓片, 重復(fù)測量30次。 隨機(jī)選取20次測量數(shù)據(jù)作為訓(xùn)練集, 其余10次數(shù)據(jù)作為測試集。 采用1.5節(jié)提出的算法對光譜數(shù)據(jù)進(jìn)行處理, 由于純凈物的吸收峰一般沒有混疊, 用較少的標(biāo)準(zhǔn)峰去擬合即可, 式(3)中的參數(shù)設(shè)置為k1=0.4,k2=3,k3=10。 其中乳糖單次測量的吸收系數(shù)譜擬合結(jié)果如圖3所示, 截取其中信噪比較高的頻段[0.3, 2], 可以看到在預(yù)處理后乳糖的吸收系數(shù)譜主要由四個(gè)吸收峰組成。 擬合后可以同時(shí)得到吸收峰頻率、 峰高、 峰寬等吸收峰信息。
圖3 本算法處理乳糖吸收系數(shù)譜的結(jié)果
Fig.3 The result of the algorithm in the thesis for processing the lactose absorption coefficient spectrum
由于在測量中存在各種誤差, 同一物質(zhì)每次測量時(shí)提取到的吸收峰特征不盡相同, 吸收峰的位置、 參數(shù)可能會出現(xiàn)不同程度的漂移, 甚至出現(xiàn)峰高較大的假峰。 為了確定某一物質(zhì)的特征吸收峰數(shù)量, 并盡可能精確地確定純凈物光譜中的吸收峰, 提出使用密度聚類算法確定同一物質(zhì)在多次測量中的共同吸收峰。 由于吸收峰峰高波動較大, 僅根據(jù)吸收峰頻率位置確定吸收峰之間的密度關(guān)系, 當(dāng)兩個(gè)吸收峰頻率差值小于0.01 THz時(shí), 則認(rèn)為它們密度相連。 乳糖20次測量的吸收峰聚類效果如圖4所示, 取同一類吸收峰的平均頻率作為該物質(zhì)的特征吸收峰。 通過這一方法可以得到純凈物的吸收峰平均頻率、 平均峰高、 平均頻率距離等參數(shù), 其中吸收峰頻率匯總?cè)绫?所示。 由于光譜儀設(shè)備所限, 頻率較高、 吸收性較強(qiáng)的吸收峰難以檢測。 表中所列吸收峰頻率與太赫茲光譜數(shù)據(jù)庫(http://thzdb.org/)中的吸收峰頻率在誤差允許范圍內(nèi)一致[13]。
圖4 乳糖吸收峰密度聚類結(jié)果
表1 純凈物吸收峰匯總
Table 1 Summary of pure substances absorption peak
物質(zhì)吸收峰頻率/THz葡萄糖1.281, 1.435, 2.080乳糖0.530, 1.192, 1.370, 1.814果糖1.303蔗糖1.442麥芽糖1.094, 1.587, 1.990山梨酸鉀0.937苯甲酸0.629, 0.876, 1.083苯甲酸鈉0.833叔丁基氫醌0.857, 1.047滑石粉1.152
以表1中所列的數(shù)據(jù)作為標(biāo)準(zhǔn)吸收峰數(shù)據(jù), 采用1.5節(jié)所述的吸收峰匹配識別算法對測試集進(jìn)行識別, 識別結(jié)果匯總?cè)绫?所示。 表中的物質(zhì)含量如果為100%, 說明該樣本僅由該物質(zhì)組成, 不含有聚乙烯。 麥芽糖、 山梨酸鉀、 滑石粉等物質(zhì)由于吸收性太強(qiáng)或者不易壓片成型, 需要加入一定量的聚乙烯, 這些樣本的剩余含量均為聚乙烯。 聚乙烯對太赫茲波的透過性很強(qiáng), 只起到稀釋、 粘結(jié)的作用, 基本不影響被測物質(zhì)的吸收峰頻率。 表2中還列出了10次識別過程平均相似度前二的物質(zhì), 由于葡萄糖、 蔗糖具有相似的吸收峰: 1.435和1.442 THz, 使得兩者的相似度相當(dāng)高, 但吸收峰匹配算法均能將兩者識別開來。 總體來說, 對10種純凈物(不考慮聚乙烯)的識別率為100%, 最大相似度均在90%以上, 證明了所提出吸收峰特征的準(zhǔn)確性和吸收峰匹配算法的有效性。
表2 純凈物識別結(jié)果匯總
取上述純凈物若干按照特定的比例制作若干種二元混合物壓片, 重復(fù)測量20次。 首先對混合物光譜進(jìn)行預(yù)處理, 然后分別采用本文算法和二階導(dǎo)數(shù)尋峰算法進(jìn)行處理。 式(3)中的參數(shù)設(shè)置為k1=0.7,k2=0.5,k3=50, 以盡可能分辨混疊光譜中的吸收峰。 圖5為本文算法處理40%葡萄糖40%乳糖壓片的結(jié)果, 剩余含量為聚乙烯; 圖6是將同樣預(yù)處理后的光譜導(dǎo)入Origin9.4中, 采用二階導(dǎo)數(shù)尋峰和高斯多峰擬合后剔除明顯假峰的擬合結(jié)果。 兩種方法提取的吸收峰結(jié)果統(tǒng)計(jì)如表3所示, 表中二階導(dǎo)數(shù)法簡稱為導(dǎo)數(shù), 由于光譜儀頻率分辨率為7.6 GHz, 所以平均偏差在8GHz左右均為正常范圍。 光譜中沒有混疊的峰很容易被識別出來, 對于這種吸收峰兩種方法得到的頻率非常接近, 但二階導(dǎo)數(shù)法存在的假峰更多(圖6中的1.794和2.127 THz)。 而葡萄糖1.280 THz的小峰被乳糖1.370 THz的吸收峰所掩蓋, 一般方法難以檢測。 二階導(dǎo)數(shù)法只能檢測出70%的混疊峰, 且定位精度較差; 而本算法不僅提高對該混疊峰的識別率至95%, 而且精確到了1.281 THz, 與葡萄糖純凈物的提取結(jié)果1.280 THz非常接近。
圖5 對葡萄糖-乳糖混合物的多峰擬合結(jié)果
圖6 二階導(dǎo)數(shù)法尋峰后葡萄糖-乳糖混合物的多峰擬合結(jié)果
Fig.6 Multi-peak fitting result of glucose-lactose mixture after peak finding by second derivative method
表3 不同方法提取的吸收峰頻率結(jié)果對比
表4 混合物識別結(jié)果匯總
對混合物的其他識別結(jié)果匯總?cè)绫?所示。 表中6類混合物光譜均存在不同程度的混疊, 同時(shí)列舉了20次測量結(jié)果平均相似度前三的物質(zhì)以及前二、 前三識別率。 由于能夠檢測到的蔗糖吸收峰只有一個(gè)且與葡萄糖非常接近, 很難在混合物中確定是否含有蔗糖, 導(dǎo)致葡萄糖-麥芽糖的前二識別率偏低。 綜上所述, 對6類混合物的平均前二、 三識別率分別達(dá)到90.8%和98.3%, 證明了提取到的吸收峰特征能夠有效應(yīng)用于混合物成分檢測。
傳統(tǒng)多峰擬合算法難以檢測和精確定位混疊狀態(tài)的吸收峰。 為了解決上述問題, 提出以大幅度平滑后的曲線波谷為分界點(diǎn)將曲線劃分成若干個(gè)子區(qū)間, 然后通過遺傳算法獲得多峰擬合的最優(yōu)子區(qū)間組合和吸收峰頻率, 在每個(gè)子區(qū)間內(nèi)通過峰數(shù)遞增最優(yōu)化方法確定擬合的最優(yōu)峰數(shù)。 最后以純凈物吸收峰參數(shù)為標(biāo)準(zhǔn)數(shù)據(jù), 通過基于吸收峰特征的光譜匹配識別算法對物質(zhì)進(jìn)行識別。 實(shí)驗(yàn)結(jié)果表明, 本算法對混疊光譜中混疊吸收峰的分辨能力和定位精度比二階導(dǎo)數(shù)尋峰后擬合的傳統(tǒng)算法更優(yōu), 提取到的吸收峰特征能夠準(zhǔn)確識別在光譜混疊情況下的混合物成分。 該算法對于太赫茲光譜混合物成分檢測有重要意義。
但是該方法僅將吸收峰頻率特征用于物質(zhì)識別, 很難區(qū)分含有頻率接近的吸收峰的物質(zhì)。 下一步工作需要研究如何更精確提取混疊狀態(tài)下的峰高、 峰寬等吸收峰其他特征, 并設(shè)計(jì)包含吸收峰頻率、 峰高、 峰寬等特征的物質(zhì)成分檢測算法。