呂俊霄 陳金浩 張怡卓 王克奇
(東北林業(yè)大學(xué),哈爾濱,150040)
蒙古櫟(Quercusmongolica)是中國東北林區(qū)主要的次生林樹種,其堅(jiān)硬耐腐,常作為結(jié)構(gòu)木材??箯潖椥阅A?MOE)是木材一項(xiàng)最重要和最具特征的力學(xué)性質(zhì),代表了木材力學(xué)性能的綜合情況,也是實(shí)現(xiàn)木材分級的重要參數(shù)和依據(jù)[1]。傳統(tǒng)的木材力學(xué)檢測方法易造成浪費(fèi),且操作復(fù)雜,無法滿足實(shí)際工程需要。近紅外光譜是一種可靠無污染的分析方法,可對木材力學(xué)性質(zhì)進(jìn)行快速、準(zhǔn)確地測定。Tong et al.[2]利用近紅外光譜,建立了熱改性南方松木彈性模量的偏最小二乘模型,橫切面的預(yù)測決定系數(shù)為0.89;Shi et al.[3]使用近紅外光譜結(jié)合PF-PLS模型對五角楓、樺樹和柞櫟的抗壓強(qiáng)度進(jìn)行預(yù)測,預(yù)測相關(guān)系數(shù)分別為0.89,0.92和0.90;Liang et al.[4]將近紅外光譜與BP神經(jīng)網(wǎng)絡(luò)結(jié)合對蒙古櫟彈性模量進(jìn)行預(yù)測,預(yù)測相關(guān)系數(shù)為0.91。盡管近紅外光譜具有快速、穩(wěn)定、高效等特點(diǎn),但在光譜特征提取過程中,仍存在檢測到的信號微弱,大量的冗余信息使得光譜圖不清晰等問題,從而影響建模精度。
二維相關(guān)譜將光譜信號擴(kuò)展到第二維上,可以區(qū)分出在一維光譜上被覆蓋的小峰和弱峰,從而提高了光譜的分辨率;通過譜線之間相關(guān)性的分析,可以詳細(xì)地研究不同分子間或分子內(nèi)的相互作用[5]。加入一定的外擾可以引起的光譜變化,進(jìn)行相關(guān)分析得到二維同步相關(guān)譜和二維異步相關(guān)譜。通常二維同步相關(guān)譜表示頻帶強(qiáng)度變化的相對方向,二維異步相關(guān)譜表示頻帶強(qiáng)度變化的順序[6]。雖然二維相關(guān)譜技術(shù)已廣泛應(yīng)用于食品檢測[7]、環(huán)境科學(xué)[8]、生物學(xué)[9]等領(lǐng)域,但并未見二維相關(guān)譜預(yù)測木材力學(xué)性質(zhì)的相關(guān)報(bào)道。
近年來,卷積神經(jīng)網(wǎng)絡(luò)(CNN)在光譜分析[10]、圖像分類[11]、目標(biāo)檢測[12]和語音識別[13]等領(lǐng)域得到了廣泛的應(yīng)用。偏最小二乘法(PLS)方法多用于處理線性問題,BP神經(jīng)網(wǎng)絡(luò)易出現(xiàn)局部最優(yōu)解現(xiàn)象。卷積神經(jīng)網(wǎng)絡(luò)可以隱性地從訓(xùn)練數(shù)據(jù)中進(jìn)行網(wǎng)絡(luò)學(xué)習(xí),避免了手工提取特征過程導(dǎo)致誤差累積的缺點(diǎn),可通過權(quán)值共享減少需要訓(xùn)練的權(quán)值個數(shù),降低了網(wǎng)絡(luò)的計(jì)算復(fù)雜度;池化操作使得網(wǎng)絡(luò)對輸入的局部變換具有一定的不變性,提升了模型的泛化能力和魯棒性。
本文以蒙古櫟為研究對象,應(yīng)用二維相關(guān)譜建立蒙古櫟抗彎彈性模量卷積神經(jīng)網(wǎng)絡(luò)預(yù)測模型。首先對原始光譜進(jìn)行多元散射校正、Savitzyk-Golay和一階導(dǎo)數(shù)(MSC-SG-FD)預(yù)處理,使散射光的影響因素減弱,光譜的聚集度增強(qiáng),且能夠消除基線漂移和平緩背景的干擾以及高頻噪聲的影響,其次經(jīng)二維相關(guān)分析得到二維同步相關(guān)譜和二維異步相關(guān)譜,最后將卷積神經(jīng)網(wǎng)絡(luò)與經(jīng)MSC-SG-FD預(yù)處理后的二維同步相關(guān)譜進(jìn)行建模,預(yù)測蒙古櫟抗彎彈性模量(MOE)。
蒙古櫟木材采自黑龍江省沖河林場,按照國家標(biāo)準(zhǔn)GB1927~1943—2009制取300 mm×20 mm×20 mm的抗彎力學(xué)試樣,并挑選出無疵試樣115條并編號,在進(jìn)行光譜掃描后,完成力學(xué)性能破壞性測試得到相應(yīng)真值。
實(shí)驗(yàn)室內(nèi)進(jìn)行近紅外采集,室內(nèi)溫度保持在(20±1)℃,平均相對濕度保持50%。近紅外光譜儀采用德國INSION公司生產(chǎn)的One-chip微型集成光纖光譜儀,波長范圍900~1 900 nm,光譜分辨率<16 nm。采用兩分叉光纖探頭對試樣進(jìn)行徑、弦面近紅外光譜采集,每個切面均勻采集8個樣點(diǎn),每點(diǎn)掃描30次自動平均為1個光譜,記錄保存。每個試樣取徑切面和弦切面的16組光譜平均成1條光譜。
采用木材萬能力學(xué)試驗(yàn)機(jī),參照國家標(biāo)準(zhǔn)《木材抗彎彈性模量測定方法》(GB1936.2—2009)測定蒙古櫟木材的彈性模量。從115個蒙古櫟樣品中建立蒙古櫟數(shù)據(jù)集,將全部樣本隨機(jī)劃分為校正集和預(yù)測集,其中86個訓(xùn)練樣本用于建立模型,另外29個預(yù)測樣本用于檢驗(yàn)?zāi)P皖A(yù)測性能。兩樣本集蒙古櫟抗彎彈性模量測定結(jié)果如表1所示。
表1 蒙古櫟校正集和預(yù)測集抗彎彈性模量的測定結(jié)果
廣義二維相關(guān)譜是對樣本施加外部干擾,通過收集一系列光譜獲得動態(tài)光譜,然后通過相關(guān)分析得到二維相關(guān)譜。動態(tài)光譜被定義為:
(1)
對于在等間隔t的m步長處測得的光譜,波長v處的動態(tài)光譜強(qiáng)度被表示為列向量y:
(2)
同步光譜強(qiáng)度(Φ(v1,v2))等于在(v1,v2)處動態(tài)光譜的向量積,表示為:
Φ(v1,v2)=[1/(m-1)]y(v1)T·y(v2)。
(3)
異步光譜強(qiáng)度ψ(v1,v2)等于(v1,v2)處動態(tài)光譜強(qiáng)度的Hilbert-Noda矩陣的向量積,表示為:
ψ(v1,v2)=[1/(m-1)]y(v1)T·N·y(v2)。
(4)
式中:N為Hilbert-Noda矩陣的第j行第k列的元素,表示為:
(5)
采集115個樣本的近紅外光譜,波長范圍為907~1 864 nm。由公式(3)得到的原始二維同步相關(guān)譜(見圖1),由公式(4)得出的原始二維異步相關(guān)譜(見圖2)。
圖1 原始二維同步相關(guān)譜
圖2 原始二維異步相關(guān)譜
卷積神經(jīng)網(wǎng)絡(luò)(CNN)通常包括卷積層、池化層和全連接層。卷積神經(jīng)網(wǎng)絡(luò)可以通過卷積運(yùn)算提取輸入數(shù)據(jù)的不同特征。卷積計(jì)算公式為:
(6)
池化層又稱下采樣層,該層可以有效地減小參數(shù)矩陣的大小、參數(shù)的數(shù)量和模型的大小,提高計(jì)算速度,并提高特征數(shù)據(jù)的魯棒性。線性整流函數(shù)(RELU)與其他激活函數(shù)相比,其具有更高的執(zhí)行速度。線性整流函數(shù)保持激活的正區(qū)域,同時將所有負(fù)值轉(zhuǎn)換為0。應(yīng)用線性整流層后,池化層執(zhí)行參數(shù)縮減以結(jié)合卷積層的特定特征,從而避免過度擬合確保穩(wěn)定的卷積過程。
采用MATLAB R2019a建立卷積神經(jīng)網(wǎng)絡(luò)預(yù)測模型,利用樣本數(shù)據(jù)對網(wǎng)絡(luò)參數(shù)進(jìn)行調(diào)整,具體模型參數(shù)設(shè)置見表2。兩層卷積層卷積核大小均為2×2,數(shù)量為16,步長為1,擴(kuò)充值為1;兩層池化層采用平均池化方法,大小為2×2,步長為2;全連接層將輸入數(shù)據(jù)從二維矩陣縮減為一維向量,并且識別輸入數(shù)據(jù)中的特定特征,將其調(diào)整為輸出層;輸出層有一個神經(jīng)元,用于實(shí)值回歸。卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)見圖3。
表2 CNN模型參數(shù)設(shè)置
圖3 卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)
二維同步相關(guān)譜以對角線為對稱軸,出現(xiàn)在對角線上的相關(guān)峰稱為自相關(guān)峰,一般為正值,表示不同區(qū)域相關(guān)光譜變化的靈敏度;對角線兩側(cè)的峰稱為交叉峰,交叉峰可正可負(fù),表示不同波長上光譜信號的同步變化。若兩個不同波長的峰同時增加或減少,則交叉峰為正,否則為負(fù)。
由圖4可知,為解決原始光譜存在散射光、基線漂移和高頻噪聲等,分別采用MSC和MSC-SG-FD方法對原始光譜進(jìn)行預(yù)處理。采用MSC對原始光譜進(jìn)行預(yù)處理后(見圖4(a)),散射光的影響因素減弱,光譜的聚集度增強(qiáng),但同步譜圖中的自相關(guān)峰和交叉峰仍不明顯,信息強(qiáng)度依然較低。采用一階導(dǎo)數(shù)結(jié)合SG平滑,不僅能夠消除基線漂移和平緩背景的帶來的干擾,而且可以抑制高頻噪聲。MSC-SG-FD對原始光譜進(jìn)行預(yù)處理后(見圖4(b)),與原始光譜相比,預(yù)處理后解決了散射光、平緩背景和高頻噪聲等問題,使自相關(guān)峰和交叉峰更加清晰。對角線上有2個較強(qiáng)的自相關(guān)峰,它們的位置分別在1 418 nm和1 691 nm處;7個較弱的自相關(guān)峰的位置分別在931、1 138、1 336、1 484、1 608、1 649、1 732 nm處,自相關(guān)峰表明了光譜強(qiáng)度動態(tài)漲落的程度;對角線兩側(cè)有7個正交叉峰和11個負(fù)交叉峰,交叉峰表明了不同波長上光譜信號的同步變化。
由圖5可知,二維異步相關(guān)譜表示在v1和v2的光譜強(qiáng)度變化的差異,其不存在自相關(guān)峰。當(dāng)v1和v2的光譜強(qiáng)度變化的相位不同時,就會產(chǎn)生交叉峰,可用來判斷光譜強(qiáng)度變化的順序。
經(jīng)MSC-SG-FD預(yù)處理后的二維異步相關(guān)譜,交叉峰更清晰,具有更多的譜圖信息。將二維同步相關(guān)譜與二維異步相關(guān)譜進(jìn)行比較,不難看出同步相關(guān)譜的峰較清晰,且具有自相關(guān)峰,可提供更多的光譜特征。而異步相關(guān)譜較為復(fù)雜,易受到噪聲等其他因素的影響。
由圖6可知,不同預(yù)處理下的CNN模型預(yù)測集的真實(shí)值和預(yù)測值,二維同步相關(guān)譜與二維異步相關(guān)譜相比,經(jīng)相同預(yù)處理方法的二維同步相關(guān)譜的真實(shí)值和預(yù)測值更為接近,預(yù)測效果更好;經(jīng)MSC-SG-FD預(yù)處理后的二維同步相關(guān)譜預(yù)測精度最高。
圖4 不同預(yù)處理二維相關(guān)同步譜
圖5 不同預(yù)處理二維相關(guān)異步譜
(a)二維同步相關(guān)原始光譜;(b)二維異步相關(guān)原始光譜;(c)MSC處理的二維同步相關(guān)譜;(d)MSC處理的二維異步相關(guān)譜;(e)MSC-SG-FD處理的二維同步相關(guān)譜;(f)MSC-SG-FD處理的二維異步相關(guān)譜。
由表3可知,采用不同預(yù)處理方法的CNN模型預(yù)測蒙古櫟抗彎彈性模量的結(jié)果,二維同步相關(guān)譜的建模效果均優(yōu)于二維異步相關(guān)譜的建模效果。經(jīng)MSC預(yù)處理后的二維相關(guān)譜建模效果優(yōu)于原始的二維相關(guān)譜的建模效果;經(jīng)MSC-SG-FD預(yù)處理后的二維同步相關(guān)譜建模效果最佳,校正集和預(yù)測集的決定系數(shù)分別為0.996 4和0.980 2,均方根誤差分別為0.113 3和0.270 4。
表3 不同預(yù)處理下的CNN模型建立結(jié)果
為驗(yàn)證CNN模型建模效果,分別建立了PLS模型和BP模型作為對比實(shí)驗(yàn)。PLS模型和BP神經(jīng)網(wǎng)絡(luò)運(yùn)行環(huán)境均為MATLAB R2019a,輸入均為經(jīng)MSC-SG-FD預(yù)處理后的二維光譜矩陣,輸出均為蒙古櫟抗彎彈性模量的預(yù)測值。PLS模型采用全因子回歸,主成分因子設(shè)置為10;BP神經(jīng)網(wǎng)絡(luò)設(shè)置為隱含層含有9個神經(jīng)元的單隱層結(jié)構(gòu),最大迭代次數(shù)為1 000,目標(biāo)誤差為0.001,學(xué)習(xí)速率為0.01。對經(jīng)MSC-SG-FD預(yù)處理后的二維同步相關(guān)譜進(jìn)行建模,將3種模型的預(yù)測結(jié)果與真實(shí)值進(jìn)行比較。
由圖7可知,CNN模型與PLS模型和BP模型相比,CNN模型對蒙古櫟木材彈性模量預(yù)測效果最佳,絕大部分樣本均擁有很好的預(yù)測效果。
圖7 3種模型預(yù)測值與真實(shí)值
由表4可知,3種模型預(yù)測集上的評價指標(biāo),PLS模型的預(yù)測性能較差,決定系數(shù)為0.805 6,均方根誤差為0.874 8。因?yàn)镻LS模型是一種線性模型,無法充分反映光譜與木材力學(xué)性質(zhì)之間復(fù)雜的非線性關(guān)系;BP模型和PLS模型相比,其評價指標(biāo)具有一定的提升,決定系數(shù)為0.920 7,均方根誤差為0.477 9,但預(yù)測精度仍然不高;CNN模型的決定系數(shù)為0.980 2,均方根誤差為0.270 4,在3種模型中預(yù)測精度最高。因此,利用CNN模型對蒙古櫟木材彈性模量的預(yù)測效果優(yōu)于傳統(tǒng)的PLS和BP模型。
表4 不同模型對蒙古櫟木材彈性模量預(yù)測的精度
以蒙古櫟樣本為研究對象,將卷積神經(jīng)網(wǎng)絡(luò)用于二維相關(guān)譜預(yù)測蒙古櫟木材彈性模量與原始二維相關(guān)譜和經(jīng)MSC預(yù)處理后的二維相關(guān)譜相比,經(jīng)MSC-SG-FD預(yù)處理后的二維相關(guān)譜建模效果最佳;二維同步相關(guān)譜與二維異步相關(guān)譜相比,二維同步相關(guān)譜更利于結(jié)合卷積神經(jīng)網(wǎng)絡(luò)對蒙古櫟木材彈性模量進(jìn)行預(yù)測;CNN模型可用于二維相關(guān)譜預(yù)測蒙古櫟木材彈性模量,CNN模型與傳統(tǒng)的PLS、BP模型相比具有最高的預(yù)測精度;CNN模型的建模方法可為預(yù)測木材力學(xué)彈性模量提供一種新思路。