李超 陳勛 張立新 馬心雨 黃英來
(東北林業(yè)大學,哈爾濱,150040)
竹子(Bambusoideae)是地球上生長最快、用途最廣的植物,是一種豐富的可持續(xù)資源。竹林約占世界森林總面積的1%,全球共有3 150萬hm2的竹林,其中60%集中在中國、印度和巴西等快速發(fā)展的國家。我國竹子資源豐富,材質優(yōu)異,生長快,有顯著的經濟、生態(tài)和社會效益,可以代替木材作為建筑材使用[1]。建筑材的力學強度決定了建筑的承載力和牢固性,所以本試驗以展平竹為研究對象展開分析?,F(xiàn)有的力學性能檢測方法一般是傳統(tǒng)的彎曲機械測量法,通過機械彎曲得到評價竹材產品性能最重要的兩個力學性能指標——斷裂模量(MOR)和彈性模量(MOE)。這種方法雖然準確可靠,但它耗時、具有破壞性,并且造成了材料浪費。因此提出一種可靠、準確和快速的計算機判別竹材力學強度的方法,對竹材的分析有重要的指導意義。
近紅外光譜技術(NIR)是現(xiàn)在國際上公認的最有應用價值的分析技術之一,在分析竹材的物理性能方面前途廣闊。近紅外光譜主要是由于分子振動的非諧振性使分子振動從基態(tài)向高能級躍遷時產生的,記錄的主要是含氫基團振動的倍頻和合頻吸收,不同基團或不同化學環(huán)境中的近紅外吸收波長與強度都有明顯差別,所以近紅外光譜具有豐富的結構和組成信息[2]。20世紀80年代后,計算機技術飛速發(fā)展,使得近紅外光譜技術開始慢慢地應用于實際問題中,近紅外光譜也可以結合現(xiàn)代計算機技術、光譜分析技術、數(shù)理統(tǒng)計以及化學計量學等多個領域,其獨特性得到日益廣泛的應用。發(fā)展到現(xiàn)在,近紅外光譜儀器越來越小型化,相關技術越來越成熟,逐漸應用在農業(yè)生產、石油化工、食品制藥、林業(yè)應用等許多方面[3]。例如,李耀翔[4]等利用近紅外光譜結合非線性偏最小二乘法對落葉松(Larixgmelinii(Rupr.) Kuzen)密度進行了精準預測;江澤慧[5]等分別對杉木(Cunninghamialanceolata(Lamb.) Hook.)的3個切面采集近紅外光譜進行研究,最終得到基于橫切面的密度預測精度最高;Tham et al.[6]應用電容法與近紅外光譜法對實木的密度和含水量進行了預測;Hwang et al.[7]使用近紅外光譜技術對韓國的建筑常用樹木松樹進行了分類識別。在竹材的研究中,有很多學者采用近紅外方法進行分析,孫柏玲等[8]通過不同偏最小二乘法對慈竹(Neosinocalamusaffinis)纖維素結晶度進行建模分析,模型的相關系數(shù)達到0.88;Yang et al.[9]建立了偏最小二乘模型對竹子組分中纖維素、木聚糖和木質素進行預測,模型相關系數(shù)達到了0.994、0.990和0.996,能夠很好地對竹材的不同部位進行區(qū)分;劉君良等[10]用反向區(qū)間偏最小二乘法優(yōu)選光譜區(qū)間建立了慈竹密度、抗彎強度和順紋抗拉強度模型,其相關系數(shù)分別為0.85、0.88、0.88;莫軍前等[11]采集3種不同溫度熱處理的毛竹試件的近紅外光譜,利用偏最小二乘法對竹材進行分類,建立抗彎強度預測模型,其MOR和MOE預測模型的決定系數(shù)別分為0.82和0.55。本文對經高溫軟化后展平的竹板進行了多點、多面的近紅外光譜數(shù)據(jù)采集,使用深度學習和淺層學習模型相結合的方法,對展平竹的力學性能做出預測,由于傳統(tǒng)的力學性能檢測方法耗時耗力,且具有破壞性,基于近紅外光譜建立竹材力學性能預測模型,近紅外光譜采集方法簡便且快速,能夠實現(xiàn)對竹材的力學強度進行無損、快速預測的目的。
深度置信網(wǎng)絡(DBN)是一種深度網(wǎng)絡模型,與傳統(tǒng)神經網(wǎng)絡相比,它的優(yōu)點主要體現(xiàn)在可以通過逐層預訓練對網(wǎng)絡里每個神經元中參數(shù)的初值進行優(yōu)化,避免了由于隨機初始化參數(shù)與理想結果偏差過大而導致的局部最優(yōu)值的風險。輸入特征經過多層網(wǎng)絡模型的計算進行多次特征變換之后,會得到更加準確的特征。但是在多層神經網(wǎng)絡的訓練中,模型復雜度高,難以收斂,深度置信網(wǎng)絡解決了這一難題,通過逐層預訓練避免了對多層神經網(wǎng)絡直接進行訓練所帶來的高復雜度的問題[12]。局部支持回歸向量(LSVR)是對每一個測試樣本分別構造單獨的模型,并且選用不同的局部訓練樣本構造模型,很好地改善了近紅外分析法中模型非線性度不夠的缺點,是當前淺層學習中預測能力較為準確的模型[8]。
根據(jù)以上背景,本文將深度置信網(wǎng)絡與局部支持向量回歸相結合,建造DBN_LSVR預測模型,并根據(jù)算法原理與實驗條件合理的設置整體網(wǎng)絡模型的參數(shù),用于竹材力學性能的預測。
本文采用的竹材是毛竹(Phyllostachysheterocycla(Carr.) Mitford cv. Pubescens),通過對毛竹進行展平加工得到平直狀的竹片,竹片尺寸為長2 m、寬140 mm、厚8 mm,再經過對其表面拋光,得到厚度為6 mm的板材。
由于竹子的結構與木材不同,竹干為空心圓柱形,不能通過鋸切直接得到大而平的表面板,要對竹子進行展平加工,加工過程如圖1所示,將一定長度范圍內的原竹開槽處理后,先對其進行高溫軟化處理,軟化使竹簡的展開槽增大并具有了暫時的塑性,然后將竹簡在機械壓力的作用下展成平直狀的竹片。相對于原竹材,竹展平板的靜曲強度和彈性模量都有所下降,但展平竹板的力學性能符合質量要求,基本不影響其后續(xù)的加工利用[13]。
圖1 扁平化竹材生產工藝
本試驗采用的展平竹為2 m(長)×140 mm(寬)×8 mm(厚)的板材。因含水率高,需經干燥后再加工。先將展平竹長度切削至1 280 mm,如圖2所示。展平竹的硬度較高,不適宜機器直接縱向切削,試驗采用刨光機對展平竹2面刨光。刨光后再次進行砂磨,砂磨至厚度為6 mm。此時紅色消去,竹節(jié)仍舊清晰可見。從切削好的試件中選出500個樣本作為試驗樣本。由于試驗材料是展平竹板,厚度小,竹板在受力過程中主要是切向平面受力,縱向平面對竹材的力學性能影響小,因此在展平竹板的力學性能研究中,只考慮展平竹板切向平面的力學性能。
圖2 展平竹板材
試驗選用美國Ocean Optical公司生產的光譜儀收集近紅外光譜。光譜儀配有光纖探針,其波長范圍為900~1 700 nm,分辨率為3.0 nm。通過直徑約5 mm的光纖探針獲得實驗所用展平竹的NIR光譜。在環(huán)境溫度、濕度相對穩(wěn)定的條件下采集光譜數(shù)據(jù)。測定固體樣品的NIR光譜時,一般要測定樣品不同面的光譜以減少測定誤差并獲得可靠的信息,有時可以進行光譜的重復測定以提高光譜圖的信噪比,信噪比就是光譜數(shù)據(jù)中信號與噪聲的比例,信噪比越大,光譜數(shù)據(jù)的噪聲越小。
SPEC View 7.1用于收集和記錄光譜,在實驗中采集竹材切向采集面的紅外光譜數(shù)據(jù),對于每個掃描點,收集30次掃描并將其平均為單個光譜。如圖3所示,采集樣本切向采集面上的8個光譜,這樣的8個光譜作為這一樣本的光譜數(shù)據(jù),在竹材力學性能的預測模型中作為影響因子使用。近紅外光譜的測量過程如圖4所示。
圖3 探頭光譜采集點示意圖
圖4 近紅外光譜測量過程
由于光譜數(shù)據(jù)除了純光譜之外還包含基線漂移、噪聲等信號,與此同時存在著因樣本自身因素以及環(huán)境等因素帶來的譜線偏移,采集到的光譜數(shù)據(jù)需要經過處理之后才能使用[14]。在近紅外光譜數(shù)據(jù)的處理中,采用了Savitzky-Golay平滑濾波的方法,核心思想是通過k階多項式擬合某個長度窗口中的數(shù)據(jù)點,然后得到擬合結果在離散化之后,S-G濾波實際上是移動窗口的加權平均算法,但其加權系數(shù)不是簡單的常數(shù)窗口,而是通過滑動窗口中給定高階多項式的最小二乘擬合[15]。
彈性模量(MOE)與靜曲強度(也叫斷裂模量MOR)是兩種典型的力學性能常量,它們可以有效反應木材的力學性能。
本次試驗采用萬能試驗機,對單元材料試驗樣本分別進行4點彎曲試驗,采集其MOR、MOE分別記錄。竹材力學性能參數(shù)如表1所示,500個樣本的力學性能的數(shù)據(jù)統(tǒng)計:彈性模量均值5 424 MPa、彈性模量最大值9 462 MPa、彈性模量最小值3 704.17 MPa、斷裂模量均值82.48 MPa、斷裂模量最大值132.15 MPa、斷裂模量最小值26.44 MPa。
表1 試件力學性能參數(shù)
深度學習在回歸預測領域的研究相比于分類問題研究較少,當前主流的深度學習回歸預測,其隱藏層層數(shù)一般設置2到3層。原因主要有兩個,一是如果模型的層數(shù)增多,模型內部和模型外部設置的參數(shù)也會增多,所需的數(shù)據(jù)量將會變多。二是當構建大多數(shù)結構化的數(shù)據(jù)集時,已經預先進行了特征的選擇,所以不需要使用層數(shù)很多的模型對特征進行高度抽象。本文中單一板材近紅外光譜和力學性能數(shù)據(jù)量較少,因此綜合考慮,只選取了有兩個隱藏層的深度置信網(wǎng)絡學習特征。
本文的模型采用的深度置信網(wǎng)絡是由多個受限玻爾茲曼機層和一層BP神經網(wǎng)絡構成的一種深度網(wǎng)絡模型[16]。使用多個隱藏層的網(wǎng)絡模型能夠對輸入特征進行多次特征變換,得到更有效的特征[17],逐層預訓練有效地避免了對多層神經網(wǎng)絡直接進行訓練所帶來的高復雜度的問題,深度置信網(wǎng)絡結構如圖5所示。
基于DBN_LSVR的單一板材的MOR與MOE預測過程如下:
(1)近紅外光譜預處理。將近紅外光譜數(shù)據(jù)進行歸一化與去噪處理。
(2)設置DBN輸入層節(jié)點個數(shù)即影響因子數(shù)為16,輸出節(jié)點個數(shù)設置為2,隱藏層設置為2層,每層節(jié)點個數(shù)為8個。
(3)逐層預訓練。使用訓練集的數(shù)據(jù)對DBN的兩個RBM逐個進行無監(jiān)督學習,讓每個RBM的參數(shù)達到局部最優(yōu)。
(4)有監(jiān)督微調。將輸出層與訓練完成的兩個RBM組成一個4層的BP神經網(wǎng)絡,對其進行有監(jiān)督訓練,并將誤差逐層反向傳播,調整各層參數(shù),直至收斂。
(5)提取出第二個隱藏層的特征。訓練好的DBN對數(shù)據(jù)集的影響因子進行特征學習,令最后一個隱藏層的數(shù)據(jù)為得到的新特征。
(6)構建預測模型。使用新特征和LSVR構建竹材力學性能預測模型,對預測集進行預測。
流程如圖6所示。
v0為輸入數(shù)據(jù),V0為輸入層,H為隱藏層,W為兩層之間的連接權重,Y為輸出層,y為輸出值,BP為深度置信網(wǎng)絡中的BP神經網(wǎng)絡,RBM1為深度置信網(wǎng)絡中的RBM模型,n為網(wǎng)絡中的總層數(shù)。
圖6 DBN-LSVR預測流程圖
為了檢驗預測模型對竹材力學性能預測能力以及模型的泛化能力,本文使用已經構建的預測模型對預測集樣本進行預測。使用平均絕對誤差(EMA)、均方根誤差(ERMS)作為發(fā)生程度的評價指標,表達公式如下所示:
為驗證DBN_LSVR預測模型的預測效果,將DBN_LSVR預測模型與DBN、LSVR、BP3種預測模型的預測效果進行對比,根據(jù)模型的預測值和真實值,分別計算幾種模型的平均絕對誤差和均方根誤差,比較模型平均絕對誤差和均方根誤差的大小來檢驗模型的力學性能預測能力。
鑒于試驗數(shù)據(jù)采集過程中存在系統(tǒng)噪聲和測量噪聲,而噪聲的存在不利于后續(xù)數(shù)據(jù)分析,因此本文采用Savitzky-Golay平滑濾波對光譜數(shù)據(jù)的測量值進行濾波。如圖7所示,給出了一個竹材樣本取的3個點的波長—吸光度曲線,當波長范圍在1 400~1 700 nm時,由于近紅外光譜受到噪聲干擾,光譜信號強度出現(xiàn)嚴重的“毛刺”現(xiàn)象。利用Matlab的sgolayfilt函數(shù),設置多項式階次為3,窗口框長度為7,在相同波長范圍下、同一竹材經S-G濾波處理后得到的近紅外光譜曲線如圖8所示,相較于濾波前,近紅外光譜的輪廓更加清晰,吸收峰更加明顯,這有利于后續(xù)預測模型的分析。
圖7 原始光譜圖
將每個竹材的8個光譜數(shù)據(jù)堆疊成高維矩陣作為數(shù)據(jù)集的原始數(shù)據(jù)部分,將對應力學數(shù)據(jù)作為數(shù)據(jù)集的標簽,進而組成竹材的近紅外光譜數(shù)據(jù)集。本文采集了500組近紅外光譜數(shù)據(jù),隨機抽取330個樣本組成訓練集,170個樣本組成測試集。
使用DBN_LSVR預測模型對單一板材的MOR與MOE進行預測,將預測值與真實值進行對比,繪制出真實值曲線和預測值曲線,比較兩條曲線的擬合效果,試驗結果如圖9所示。
圖8 預處理后的光譜
圖9 模型預測值與真實值對比
從圖9可以看出,對于測試集樣本,DBN_LSVR預測值與實際值擬合較好,預測值曲線與真實值曲線擬合較好,可以較為有效地對展平竹的力學性能進行預測。
為了進一步驗證DBN_LSVR對竹材的MOR與MOE的預測能力,將該預測方法的預測結果與DBN、LSVR、BP等模型進行對比試驗,使用均方根誤差、平均絕對誤差對各個模型的預測能力進行評價(表2和表3)。
表2 平竹MOR預測誤差
表3 平竹MOE預測誤差
根據(jù)表2、表3可以看出,通過預測模型誤差的對比,DBN_LSVR模型的平均絕對誤差和均方根誤差明顯小于其他幾種模型的預測誤差,DBN-LSVR模型的預測效果較好,這說明構建深度學習建立預測模型的預測效果較好,模型的預測數(shù)據(jù)較為準確,對特征進行學習可以有效地降低預測誤差。DBN_LSVR是所有模型中預測誤差最低的,因為該模型使用DBN進行特征的自動提取,學習到的新特征優(yōu)于原特征,并使用新特征在LSVR進行建模,充分發(fā)揮LSVR的優(yōu)勢,提高預測準確率。
計算預測模型的相關系數(shù),MOR和MOE預測模型的相關系數(shù)分別為0.85和0.80,預測效果較好,模型的預測值與真實值吻合較好,由此可知,利用該預測模型可以預測單一板材的MOR、MOE。
針對現(xiàn)有主流竹材力學性能彎曲機械測量檢測方法耗時、且具有破壞性的問題,本文提出了一種基于近紅外光譜的DBN_LSVR竹材力學強度無損預測方法。
首先,對竹材進行展平加工獲得展平竹,并對每個展平竹進行8點紅外光譜數(shù)據(jù)采集和彈性模量、斷裂模量測試。其次,針對實驗過程中系統(tǒng)噪聲和測量噪聲擾動嚴重的問題,對紅外光譜數(shù)據(jù)進行Savitzky-Golay平滑濾波,并以濾波后紅外光譜數(shù)據(jù)作為主體,彈性模量和斷裂模量作為標簽,構建近紅外光譜竹材力學性能數(shù)據(jù)集。最后,在上述數(shù)據(jù)集的基礎上,分別構建DBN_LSVR深層神經網(wǎng)絡進行彈性模量、斷裂模量性能預測。選用DBN的原因是其多隱藏層可以對特征進行更好的學習,選用LSVR的原因是其泛化能力強,從而進行更精準的預測。
基于DBN_LSVR的深層神經網(wǎng)絡模型對竹材MOR和MOE的均方根預測誤差分別為716.23、17.54,平均絕對預測誤差分別為524.40、16.82;MOR和MOE預測模型的相關系數(shù)分別為0.85和0.80。實驗結果表明DBN_LSVR預測模型相較于單獨使用DBN、LSVR、BP神經網(wǎng)絡,預測效果更優(yōu),可有效預測竹材的力學性能。本文提出的預測方法在不對竹材造成破壞的基礎上,縮短了判別竹材物理性能的時間和成本,為竹材力學性能的理論分析提供了技術支持。