于 雷, 陳金浩, 李龍飛, 李 超 , 張怡卓
東北林業(yè)大學(xué)機(jī)電工程學(xué)院, 黑龍江 哈爾濱 150040
木材密度是木材的重要物理性能指標(biāo), 與木材力學(xué)性能有著密切的聯(lián)系。 木材密度可分為基本密度、 氣干密度和絕干密度, 三種密度之間可以通過公式相互轉(zhuǎn)換。 其中, 絕干狀態(tài)下的樣本質(zhì)量和體積相對穩(wěn)定, 絕干密度測試結(jié)果更精確。 木材密度的檢測方法有稱重法、 機(jī)械力密度檢測法和射線密度檢測法[1]。 傳統(tǒng)稱重法測量結(jié)果準(zhǔn)確, 但是操作過程復(fù)雜, 耗時長; 機(jī)械力密度檢測法快速有效, 但屬于破壞性實驗; 射線密度檢測方法能夠快速無損檢測木材密度, 但是實驗環(huán)境要求嚴(yán)格, 射線會對操作人員產(chǎn)生危害。
近紅外光譜分析技術(shù)具有操作過程簡單、 方便、 時間快且無損等優(yōu)點, 近年來已被應(yīng)用到木材密度檢測中[2-4]。 Alves利用近紅外光譜建立了海岸松和落葉松密度的偏最小二乘法回歸模型[5]。 Isik結(jié)合近紅外分析與最小二乘支持向量機(jī)建立了木材密度、 力學(xué)強(qiáng)度的快速預(yù)測[6]。 Takkaaki運用近紅外光譜分析出影響木材密度的敏感光譜波點, 并運用偏最小二乘建立了不同含水率下的木材密度預(yù)測模型[7]。 李耀翔等研究楓樺木材密度時, 探討了小波壓縮的近紅外光譜處理方法, 并利用偏最小二乘回歸方法對數(shù)據(jù)進(jìn)行了建模[8]。 盡管國內(nèi)外學(xué)者已經(jīng)開展木材密度的近紅外光譜預(yù)測方法研究, 但是, 多數(shù)研究是在含水率一定條件下建立的木材密度預(yù)測模型, 此外, 在建模過程由于缺少合理的樣本集優(yōu)選、 光譜預(yù)處理、 特征優(yōu)選以及非線性建模等環(huán)節(jié), 木材密度建模精度有待于進(jìn)一步提升。
以柞木(Xylosmaracemosum)絕干密度預(yù)測為例, 首先采集不同含水率下的柞木樣本表面光譜數(shù)據(jù), 并通過SPXY樣本劃分方法得到校正集與預(yù)測集; 然后, 對光譜進(jìn)行預(yù)處理消除基線漂移、 散射影響和噪聲; 最后, 運用SPA對光譜數(shù)據(jù)進(jìn)行特征降維, 并運用IPSO-BP網(wǎng)絡(luò)建立任意含水率條件下光譜信息與絕干密度間的聯(lián)系。 具體建模過程如圖1所示。
圖1 木材絕干密度建模流程
柞木樣本來自于黑龍江省五常市林業(yè)局沖河林場, 按照國家標(biāo)準(zhǔn)(GB1929—2009)制作20 mm×20 mm×20 mm的密度標(biāo)準(zhǔn)樣本, 選出其中100個無明顯顏色差異且無缺陷的樣本進(jìn)行密度預(yù)測研究, 圖2、 圖3、 圖4分別為加工的柞木樣本試件、 樣本干燥及稱重過程。
選用德國INSION近紅外光纖光譜儀, 運用SPEC view 7.1軟件對木材密度樣本進(jìn)行光譜信息采集。 該光譜儀分辨率小于16 nm, 光譜范圍為900~1 700 nm, 共117個波長點。 在采集過程中, 溫度控制在20 ℃, 平均相對濕度為50%。 為了采集不同含水率的柞木樣本近紅外光譜, 首先將樣本充分浸泡在水中, 取出后, 從樣本集中隨機(jī)采集10個樣本的光譜信息并記錄其編號, 然后按照表1時間間隔, 從剩余樣本中再隨機(jī)選擇10個樣本采集光譜信息, 直到最終采集完全部試件光譜信息。 在采集絕干密度光譜信息時, 由于絕干材在空氣中會很快地吸收水分而達(dá)到平衡含水率, 所以在測量木材絕干密度時要足夠快。 實驗證明, 1 s的時間差, 柞木樣本含水率變化非常小, 可以忽略不計。 實測樣本絕干密度和含水率分布如表2、 表3所示。 在光譜采集過程中, 探頭高度保持1 mm不變, 分別在柞木樣本的上下兩個橫切面采集4點, 并取其平均值。
圖2 部分樣本實拍圖
圖3 試樣烘干
圖4 試樣全干狀態(tài)質(zhì)量測量
表1 不同含水率樣本制備
表2 樣本絕干密度分布
表3 樣本含水率分布
為了避免樣本分布不均勻所帶來的校正集不具備代表性的弊端, 選用SPXY樣本劃分方法提高模型的泛化性和穩(wěn)健性。 由于樣本光譜數(shù)據(jù)x和真值y對建模結(jié)果都有影響, 在考慮樣本之間的距離時, 將自變量和因變量同時考慮在內(nèi); 此外, 為了確保x和y在空間具有同樣的權(quán)重, 分別除以它們自己距離的最大值。 具體公式如式(1)—式(3)
(1)
(2)
p,q∈[1,N]
(3)
特征波長選擇會影響建模的精度和速度, 連續(xù)投影算法(SPA)是一種前向變量選擇算法, 它能夠使矢量空間的共線性達(dá)到最小化[9]。 SPA的工作原理是通過迭代對原始數(shù)據(jù)投影映射, 構(gòu)造新的變量集, 建立回歸模型評價預(yù)測效果。 該算法所篩選出的敏感特征波段具有重要性順序, 能直接反映所篩選變量與因變量之間的定量關(guān)系。
運用一種改進(jìn)的粒子群優(yōu)化(IPSO)算法優(yōu)化BP網(wǎng)絡(luò), 并建立柞木絕干密度近紅外預(yù)測模型, 以克服BP網(wǎng)絡(luò)容易陷入局部優(yōu)化, 且訓(xùn)練的速度過慢的問題。 傳統(tǒng)PSO算法可以描述為一個D維的潛在解空間中, 由n個粒子組成的種群x=(x1,x2, …xn), 其中第i個粒子表示為一個D維的向量xi=(xi1,xi2, …,xid), 代表第i個粒子在D維搜索空間中的一個潛在解。 根據(jù)目標(biāo)函數(shù)可計算出每個粒子位置xi對應(yīng)的適應(yīng)度值。 第i個粒子的速度為vi=(vi1,vi2, …,vid), 其個體極值的位置pg=(pg1,pg1,pg2, …,pgd)。 在每一次迭代過程中, 粒子通過個體極值和全局極值更新自身的速度和位置, 更新公式如式(4)和式(5)
(4)
(5)
式中,ω為慣性重,d=1,2,…,D;i=1,2,…,n;k為當(dāng)前迭代次數(shù);vid為粒子的速度;c1和c2為加速因子;r1和r2為分布于[0, 1]上的隨機(jī)數(shù)。
針對粒子群優(yōu)化算法中慣性權(quán)重線性遞減策略影響收斂速度等一系列的問題, 彌補算法的不足, 采用一種對ω非線性遞減策略減少的群算法(IPSO)[10], 算法公式如式(6)
ωk=ωmax-(ωmax-ωmin)k/Tmax
(6)
式中,ωmax和ωmin分別為最大慣性權(quán)重和最小慣性權(quán)重,k為算法當(dāng)前迭代次數(shù);Tmax為最大迭代次數(shù), 通常ωmax和ωmin取0.9和0.4時算法的性能會獲得較大的提升。
100個柞木樣本以2∶1的比例劃分為校正集67個, 預(yù)測集33個。 為驗證樣本集劃分的重要性, 在采集柞木表面近紅外光譜數(shù)據(jù)后, 運用SPXY方法取處校正集和預(yù)測集, 運用PLS模型來評價預(yù)測結(jié)果有效性。 表4為運用SPXY和隨機(jī)選擇樣本建模的比較, 參數(shù)表明: 基于SPXY方法的PLS模型的指標(biāo)參數(shù)都有所改善。
表4 SPXY與隨機(jī)樣本選擇建模比較
采用多元散射校正(MSC)、 二階導(dǎo)數(shù)光譜加S-G平滑三種方法相結(jié)合對樣本光譜進(jìn)行預(yù)處理, 數(shù)據(jù)處理工具為MATLAB 7.0, 原始光譜如圖5所示。 經(jīng)過MSC預(yù)處理后, 原始光譜的散射光得以減弱, 光譜變得集中, 更能看出光譜走向和趨勢, 但光譜依然存在信息強(qiáng)度不足和吸收峰不明顯現(xiàn)象。 在此, 加入二階導(dǎo)數(shù)操作, 并加入平滑處理, 以減弱噪聲信號。 三種方法結(jié)合的預(yù)處理結(jié)果如圖6所示。
圖5 原始光譜圖
對近紅外光譜的117個波長使用SPA進(jìn)行篩選, 運用PLS進(jìn)行優(yōu)選結(jié)果分析。 在變量個數(shù)不斷增加的過程中, RMSE值大幅度降低, 當(dāng)變量個數(shù)為16時, RMSE值達(dá)到最小, 為0.014 6。 當(dāng)選取變量繼續(xù)增加時, SMSE也有所上升。 優(yōu)選光譜中的位置如圖7所示, 不同變量數(shù)的與RMSE的關(guān)系如圖8所示。
圖7 選擇變量在光譜中的位置
圖8 選擇變量與RMSE之間的關(guān)系
利用SPA提取的16個特征, 分別建立PLS模型、 BP神經(jīng)網(wǎng)絡(luò)、 PSO-BP神經(jīng)網(wǎng)絡(luò)以及IPSO-BP神經(jīng)網(wǎng)絡(luò)模型, 并對33組數(shù)據(jù)進(jìn)行驗證, 預(yù)測結(jié)果如表5所示。 BP, PSO-BP和IPSO-BP均采用三層結(jié)構(gòu), 光譜優(yōu)選波長為輸入, 隱層節(jié)點數(shù)為10, 柞木絕干密度為輸出, 隱含層為transing S型傳輸函數(shù), 輸出層為purelin線性函數(shù), 訓(xùn)練函數(shù)為traingd梯度下降型函數(shù), 學(xué)習(xí)速率設(shè)置為0.01, 學(xué)習(xí)訓(xùn)練次數(shù)為10 000次。 圖9為PSO-BP模型預(yù)測值與真值散點分布圖、 圖10為IPSO-BP預(yù)測與真值散點分布圖。
圖10 IPSO-BP預(yù)測值與真值散點分布圖
表5 四種建模方法的比較
從表5可以看出, PLS模型校正集與預(yù)測集的結(jié)果較穩(wěn)定, 說明近紅外光譜與絕干密度間存在一定的線性關(guān)系; BP網(wǎng)絡(luò)預(yù)測結(jié)果相對較低, 可能因為BP網(wǎng)絡(luò)陷入了局部尋優(yōu); PSO-BP網(wǎng)絡(luò)相對BP的結(jié)果較好, 但I(xiàn)PSO-BP網(wǎng)絡(luò)得出的結(jié)果最好, 通過圖11和圖12可知, 相比較PSO-BP, IPSO-BP達(dá)到全局最優(yōu)的速度更快, 預(yù)測集相關(guān)系數(shù)達(dá)到0.938, 預(yù)測均方根誤差為0.012 9。
圖11 PSO迭代次數(shù)曲線
圖12 IPSO迭代次數(shù)曲線
從提高木材預(yù)測密度精準(zhǔn)度入手, 分別就樣本優(yōu)選、 光譜預(yù)處理、 特征優(yōu)選以及光譜數(shù)據(jù)特征的非線性建模等部分環(huán)節(jié)進(jìn)行了深入研究。 研究結(jié)果表明: SPXY保證了校正集樣本的均勻分布, 提高了模型泛化能力; MSC、 二階導(dǎo)數(shù)和S-G卷積平滑相結(jié)合的方法能夠很好的抑制原始光譜中噪聲高頻信號, 同時使得峰值更加突出, 消除了基線漂移、 消弱了散射光的影響; SPA可以有效優(yōu)選出光譜波段, 進(jìn)而提高預(yù)測精度縮短預(yù)測時間; IPSO-BP網(wǎng)絡(luò)在近紅外光譜與柞木絕干密度建模上具有更好的結(jié)果, 對近紅外光譜預(yù)測木材密度提供了新的思路。