郭海如,崔雪梅,李春生,萬 興,成 俊,但小娜
(1.湖北工程學院計算機與信息科學學院/湖北省新農村發(fā)展研究院智慧農業(yè)重點實驗室,湖北 孝感 432000;2.湖北工程學院生命科學技術學院,湖北 孝感 432000;3. 湖北理工學院計算機學院,湖北 黃石 435003)
【研究意義】我國的油菜種植面積和總產量均居世界首位。油產量在國產食用植物油中占 50 % 以上[1]。營養(yǎng)元素硼(B)和重金屬元素銅(Cu)均是高等植物生長發(fā)育所必需的微量元素,是影響油菜產量和品質的重要元素。我國土壤普遍缺B,油菜缺B會導致花而不實和返花現(xiàn)象,因而要及時施B肥補充,但是B適合作物生長的范圍非常窄,控制不當就容易出現(xiàn)缺硼與硼毒害現(xiàn)象[2]。Cu對植物正常的生理代謝、生長發(fā)育和產量形成起著重要作用,但如果土壤中Cu過量,就會抑制植物對N、P、K、Ca、Mg、S及微量元素的吸收[3],抑制酶的活性,加劇植株體內膜脂過氧化,導致植物生理代謝紊亂,對植物產生毒性作用。 【前人研究進展】土壤環(huán)境中存在離子的頡頏或促進作用,目前國內外研究B、Cu對油菜生長的影響主要集中在單一元素的脅迫上,而缺乏兩種元素同時作用于油菜的生理響應研究。在信息處理方面,大多數(shù)采用傳統(tǒng)的數(shù)理統(tǒng)計方法[4-5],主要對油菜指標數(shù)據(jù)進行方差分析[6-7]、顯著性分析[8-9]、多重比較[10]等。主成分分析法可以在原始大量指標中抽取部分不相關的新指標,但新指標包含原始指標的絕大多數(shù)信息,采用主成分分析法可以對油菜各指標進行綜合評價,并分析出各指標的影響程度[11-13]。也有少數(shù)文獻采用模糊數(shù)學隸屬函數(shù)法[14]對油菜各指標的耐鹽性進行綜合評價?!颈狙芯壳腥朦c】本研究提出一種PCA-GA-BP(主成分遺傳神經網絡)評價方法,綜合主成分分析和遺傳神經網絡的優(yōu)點,在B、Cu共同脅迫下對油菜的各項指標進行綜合分析?!緮M解決的關鍵問題】采用PCA-GA-BP網絡(主成分遺傳神經網絡)分析不同B、Cu處理下各指標的變化規(guī)律,找出B、Cu的最佳施用濃度,為油菜種植提供一種更加科學高效的智能化評價方法。
供試油菜品種為油霸旺,2015-2017年期間四川某公司在其實驗基地進行實驗,平均每667 m2產298.78 kg。實驗選取油菜種子中質量飽滿、大小均勻的種子。
選用5種不同濃度的銅溶液和3種不同濃度的硼溶液交叉處理盆栽油菜幼苗,處理結束后測定油菜幼苗的葉綠素、蛋白質、硝態(tài)氮、淀粉酶、丙二醛含量以及過氧化物酶活性等指標。用0.525 %的NaClO溶液浸泡25 min,清水洗凈后用去離子水浸泡過夜,次日挑選沉于下方的種子進行催芽。將種子均勻放置在鋪有兩層濾紙的托盤中,用蒸餾水浸潤濾紙,以濾紙上積累的水量恰好不流動為宜。將托盤放入25℃,光照強度為4,型號是MJX-250B-Z的恒溫培養(yǎng)箱中培養(yǎng),每隔8 h澆1次水,水量均等。3 d后種子露白,將種子移入裝有沙土的45個花盆中繼續(xù)培養(yǎng)(10株/盆),開始改澆1/2霍格蘭營養(yǎng)液,時間間隔與蒸餾水一致。21 d后,待幼苗長出5~6片子葉,幼莖較硬時,將45盆油菜隨機分成3組,每組3個重復,進行B、Cu脅迫處理。銅溶液用CuSO4配制,濃度設置為0、25、75、100、200 mg/L,B溶液用Na2B4O7配制,濃度設置為:0、0.5、1.0 mg/L。B、Cu濃度配置如表1所示。脅迫處理20 d后,取油菜樣品測定各項生理指標。
表1 B、Cu濃度配置
注:B1、B2表示硒濃度為0.5、1.0 mg/L;T25、T75、T100、T200分別代表銅濃度為25、75、100、200 mg/L;CK為對照。下同。
Note:B1, B2:The selenium concentration of 0.5 and 1.0 mg/L;T25, T75, T100, T200:The copper concentration of 25, 75,100, 200 mg/L; CK: The contrast. The same as below.
所有數(shù)據(jù)均為 3 次重復的平均值,在 MATLAB環(huán)境下采用PCA-GA-BP網絡處理數(shù)據(jù)[15-17]。首先采用主成分分析法對各項指標進行優(yōu)化,并分析得到評價結果。然后將主成分分析法優(yōu)化后的指標作為BP網絡的輸入,將主成分分析法的評價結果作為神經網絡的輸出。對樣本進行訓練學習,并選定幾個典型樣本作為測試樣本。在神經網絡訓練學習過程中,擬合精度很高,但測試樣本的測試誤差比較大,BP網絡的泛化能力不強。為增強BP網絡的泛化能力,采用GA(遺傳算法)對BP網絡的權閾值進行優(yōu)化,經過優(yōu)化后的神經網絡,泛化能力得到大大提高。
1.3.1 主成分分析優(yōu)化樣本 主成分分析主要過程如下:對原始數(shù)據(jù)進行標準化處理,計算相關系數(shù)矩陣,求出各個指標之間的相關系數(shù),計算特征值和特征向量,選擇幾個主成分,計算綜合評價值,計算各指標在主成分中的權重。
采用主成分法優(yōu)化神經網絡的樣本時,根據(jù)各指標之間的相關系數(shù)值確定是否刪除某些不必要的指標,若某些指標相關系數(shù)很大,再比較指標的權重,刪除權重比較小的指標。刪除其中的幾項指標后,再重新用新的指標進行分析,若分析結果跟優(yōu)化指標之前的結果一致,則采用優(yōu)化后的指標作為神經網絡的樣本。
1.3.2 GA優(yōu)化BP神經網絡 采用GA優(yōu)化BP神經網絡權閾值的主要過程:①確定訓練樣本和測試樣本,并根據(jù)樣本確定神經網絡結構。建立神經網絡,確定神經網絡的訓練步數(shù)、誤差要求等。求測試值的均方誤差,并將其作為遺傳算法的適應度函數(shù)。②確定遺傳算法代溝、二進制編碼長度、初始種群等參數(shù)。其中初始種群的維數(shù)根據(jù)神經網絡神經元的權閾值個數(shù)確定。遺傳算法的代數(shù)gen=0。③將遺傳算法的初始種群個體作為神經網絡的權閾值賦值給BP網絡。進行神經網絡訓練,訓練后根據(jù)適應度函數(shù)值記下神經網絡的最優(yōu)權閾值。④選擇、重組、變異遺傳操作,將遺傳算法個體值作為權閾值重新賦值給神經網絡,重新進行神經網絡訓練。⑤訓練后判斷新的適應度值是否最優(yōu),若最優(yōu)則記下當前權閾值。遺傳算法代數(shù)gen+1,進入第四步,即下一代遺傳。⑥遺傳代數(shù)達到要求,遺傳算法停止。
該優(yōu)化方法難點在于適應度函數(shù)的確定,神經網絡的權閾值由遺傳算法隨機產生,經過神經網絡學習訓練之后,再跟測試樣本比較,求其均方誤差,并將測試值的均方誤差作為適應度函數(shù)值。由于第五步中,每次都記下最優(yōu)權閾值,所以,遺傳算法結束后,將得到最優(yōu)適應度值,即測試值的均方誤差最小。當測試結果滿足要求時,表示神經網絡建模成功,可以采用該模型對油菜指標進行綜合評價。
用不同濃度的B、Cu交叉處理油菜幼苗,測定油菜幼苗各項生理指標結果見表2。單獨供銅時,油菜葉綠素a/b、總葉綠素含量、蛋白質含量、硝態(tài)氮含量均是先增加后降低;而淀粉酶活性則先降低再增加后又降低,但均低于對照;過氧化物酶活性隨著銅濃度的增加而降低;丙二醛含量隨著銅濃度的增加而增加。單獨供B時,與對照相比油菜葉綠素含量差異不明顯;蛋白質質量分數(shù)隨著B濃度的增加先降低再增加,但均低于對照;硝態(tài)氮含量、淀粉酶活性隨B濃度先增加后降低,均高于對照;過氧化酶活性則隨著B濃度的增加而降低;丙二醛量隨著B濃度的增加而增加。與對照相比,油菜各項生理指標的變化差異不明顯。
B、Cu配合施用時,葉綠素含量、蛋白質質量分數(shù)、淀粉酶、過氧化酶活性均是低濃度B(0.5 mg/L)和Cu組合明顯高于高濃度B(1.0 mg/L)和Cu的組合;當0.5 mg/L的B和200 mg/L的Cu配施時,油菜的葉綠素含量、蛋白質質量分數(shù)、淀粉酶活性、過氧化物酶活性均高于單施200 mg/L Cu的情況,丙二醛含量則明顯低于單施200 mg/L Cu的情況,說明B對高濃度的Cu有較好的緩解作用;硝態(tài)氮含量、丙二醛含量在低濃度B(0.5 mg/L)和Cu組合高于高濃度B和銅配施的組合,說明高濃度B和Cu配施可以減少硝態(tài)氮、丙二醛的產生。
從實驗數(shù)據(jù)很難得出不同濃度的B、Cu脅迫處理對油菜各項指標的綜合影響。采用主成分分析法對實驗數(shù)據(jù)進行分析處理。在MATLAB環(huán)境下編寫程序,采用zscore()對表2中的數(shù)據(jù)進行標準化,并且采用corrcoef()函數(shù)求出標準化后的相關系數(shù)矩陣,相關系數(shù)矩陣如表3所示。
表2 B、Cu脅迫下油菜各指標統(tǒng)計結果
表3 相關系數(shù)矩陣
注:x1~x8分別代表:葉綠素a、葉綠素b、總葉綠素、蛋白質、硝酸氮含量、淀粉酶活性、過氧化物酶活性、丙二醛含量。
從相關系數(shù)可以看出:葉綠素b和總葉綠素相關性很強,葉綠素與總葉綠素、硝酸氮含量變化與過氧化物酶活性相關性比較強,丙二醛含量變化與硝酸氮含量變化、過氧化物酶活性負相關性比較強,其他指標相關性一般。
采用pcacov()函數(shù)計算表4中相關系數(shù)矩陣的特征值、方差貢獻率和累積貢獻率。前4個主成分累計貢獻率達到89.76819 %,濃縮了源數(shù)據(jù)的大部分信息,因此提取前4個成分作為分析不同B、Cu處理下各指標的特征。分別以4個主成分的貢獻率為權重,構建主成分綜合模型表達式如下:
Z=0. 4733179y1+0.1912162y2
+0.147591y3+0.08555678y4
把不同硼、銅處理下的4個主成分值代入上式,以各自的貢獻率為權數(shù)進行加權求和,求出不同硼、銅處理下各指標的綜合排名。從表5中可以看出,T200B1組合時綜合權重最高,排第1名,說明當200 mg/L的Cu和0.5 mg/L 的B配施時對各項指標最好,其次是T100B1、T75,分別是第2、3名;對照組排名13,最差的是T25B1組合,說明低濃度的B、Cu產生了相互抑制作用。
表4各成分的特征值、貢獻率和累計貢獻率
Table 4 Characteristic root,contribution rate and cumulative contribution rate of each main components
特征根yCharacteristic root y貢獻率z(%)Contribution rate z累計貢獻率(%)Cumulative contribution rate3.78654347.3317947.331791.52972919.1216266.453411.18072814.759181.212510.6844548.55567889.768190.42335.29124895.059440.2493143.11642398.175860.1267421.58427799.760140.0191890.239863100
最后,進一步計算各指標在主成分中的權重,并對各指標的權重進行排序,反過來可以分析不同硼、銅處理濃度對各指標的影響程度。各指標在主成分中的權重及排序如表6所示,不同硼銅濃度對葉綠素影響最大。其次是蛋白質含量,對硝酸氮含量變化影響最小。
表5不同硼、銅處理下各指標綜合排名
Table 5 Comprehensive ranking of various indexes from different treatment of boron and copper
不同處理Treatment綜合權重Comprehensive weight排名RankingCK-1.00612213T250.6248445T750.85160453T1000.70641184T2000.40236557B1-1.45596714T25B1-1.67121315T75B10.44016016T100B10.87775992T200B11.79729461B2-0.88032512T25B2-0.0956329T75B2-0.48848711T100B2-0.33885910T200B20.23616438
表6 各指標權重及排序
根據(jù)表3中相關矩陣數(shù)據(jù),葉綠素b和總葉綠素相關性很強達到0.91,可以刪除其中的1個指標,再根據(jù)表6中指標權重的排序,總葉綠素權重為3.182114,排名第一,葉綠素b權重為2.682663排名第三。因此,選擇權重比較小的指標葉綠素b刪除,以達到優(yōu)化指標的目的。
刪除指標葉綠素b后,重新采用主成分法分析數(shù)據(jù),得到不同B、Cu處理下各指標的新的綜合排名,如表7所示。對比表5和7中的排名順序,可以看出,綜合權重排名最高的2個組合沒變,其他組合排名順序變動比較小,變化規(guī)律基本上相同。因此,可以采用優(yōu)化后的指標作為神經網絡樣本。
結合表2(刪除指標葉綠素b)和表5中的數(shù)據(jù)(也可以選擇表7的數(shù)據(jù)),構建神經網絡的訓練樣本和測試樣本,將表2中的數(shù)據(jù)作為神經網絡的輸入,表5中數(shù)據(jù)作為神經網絡的輸出。典型數(shù)據(jù)(表5中綜合權重排名第1和2名)作為測試樣本,測試誤差的大小是衡量神經網絡建模是否成功的標準。對表2和5中數(shù)據(jù)進行無量綱化后,得到神經網絡的訓練樣本和測試樣本,如表8和9所示,其中表9中的數(shù)據(jù)不參與神經網絡的訓練。根據(jù)油菜指標個數(shù)以及評價結果,BP網絡的輸入層節(jié)點數(shù)為7,每個節(jié)點代表一個油菜指標,輸出層節(jié)點數(shù)為1,表示指標綜合評價的權重。中間層節(jié)點數(shù)根據(jù)實際實驗設為3比較合適。因此,建立BP網絡結構如圖1所示。其中輸入層x1~x7代表油菜生長的7個指標,y表示評價結果。采用newff()函數(shù)創(chuàng)建BP神經網絡,傳遞函數(shù)均采用S型正切函數(shù),采用Levenberg-Marquardt BP訓練函數(shù),訓練步數(shù)設為200,均方誤差為10-6。
表7不同硼、銅處理下各指標新的綜合排名
Table 7 New comprehensive ranking of various indexes from different treatment of boron and copper
不同處理Treatment綜合權重Comprehensive weight排名RankingCK-1.1078314T250.8358614T750.8464093T1000.8062175T2000.0057558B1-1.699315T25B1-0.966612T75B10.6249556T100B10.8549042T200B11.5242111B2-1.0975413T25B20.1526337T75B2-0.3055410T100B2-0.4453411T200B2-0.028799
表8 神經網絡訓練樣本
表9 神經網絡測試樣本
根據(jù)神經網絡各層節(jié)點的個數(shù),得到遺傳算法種群的維數(shù)為(7+1+1)×3+1=28個,種群個體數(shù)為40個,遺傳算法變量二進制位數(shù)設為20,代溝為0.9,遺傳代數(shù)為20。采用crtbp()函數(shù)隨機產生初始種群,將初始種群每個個體的28個數(shù)據(jù)作為BP網絡的權閾值。神經網絡得到權閾值后,對訓練樣本進行學習訓練。經過學習之后,神經網絡對測試樣本進行測試,求出測試樣本的均方誤差,并將均方誤差作為遺傳算法的適應度函數(shù)。經過遺傳算法20代遺傳,一共訓練800次,找出適應度函數(shù)值最小的數(shù)據(jù),并記下此時神經網絡的權閾值。
在遺傳算法每一代遺傳中分別采用select()、recombin ()和mut () 3個函數(shù)進行 選擇 、交叉和變異操作,其中交叉概率選擇0.7。經過20代遺傳后,得到各代種群的最優(yōu)解和均值的變化如圖2所示。從圖中可以看出,在第13代即得到最優(yōu)解,隨著遺傳代數(shù)的增加,種群均值變化逐漸減小并趨于穩(wěn)定。
圖1 BP網絡結構Fig.1 Structure of BP neural network
圖2 各代種群最優(yōu)解和種群均值的變化Fig.2 Changes of optimal solution and mean value from each generation population
經過遺傳算法優(yōu)化神經網絡后,最終得到神經網絡的最優(yōu)權閾值,將權閾值賦值給神經網絡對表8中的訓練樣本進行擬合,擬合結果如圖3所示,擬合誤差如表10所示,從圖3和表10中可以看出神經網絡學習能力非常強,基本上是100 %擬合。
最后,將表9中測試樣本的輸入作為神經網絡的輸入,得到2個測試結果,其測試誤差分別為-1.93 %、2.85 %,最大測試誤差為2.85 %,說明可以用該神經網絡模型評價油菜生長情況。
圖3 神經網絡擬合曲線圖Fig.3 Fitting curve of neural network
序號Serial number誤差Error序號Serial number誤差Error10.000222738-0.000732-0.001108890.0003653-0.0008899100.0030764-0.0003699110.0004545-0.0016354120.00061668.72E-0513-0.002957-6.89E-05
為證明遺傳算法優(yōu)化神經網絡權閾值的效果,不采用遺傳算法,隨機產生初始權閾值,重復試驗3000次,記下最優(yōu)測試誤差,得到最大測試誤差為18.92 %。再次隨機產生初始權閾值,重復訓練10 000次以上,最大測試誤差為15.31 %。通過遺傳算法優(yōu)化神經網絡權閾值后,神經網絡泛化能力能得到很大地提高。
實際應用該模型時,在種植油菜過程中,檢測神經網絡輸入神經元的相關油菜指標,將得到的輸出結果跟綜合權重值進行比較,進而可以判斷油菜種植的B、Cu配置情況,然后根據(jù)最佳配置情況進行動態(tài)調整。
(1)單獨供Cu時,油菜各指標變化規(guī)律說明適量Cu對葉綠素、蛋白質硝態(tài)氮含量及過氧化酶活性均有促進作用,且能抑制丙二醛的產生,提高油菜的抗逆性。單獨供B時,與對照相比,油菜各項生理指標的變化差異不明顯。B、Cu配合施用時,油菜各指標變化規(guī)律說明B對高濃度的Cu有較好的緩解作用,高濃度B和Cu配施可以減少硝態(tài)氮、丙二醛的產生。
(2)采用主成分分析確定評價等級,可以避免人工主觀干預,能夠更加客觀地對B、Cu脅迫下油菜各項指標進行綜合評價。T200B1組合時綜合權重最高,即0.5 mg/L的B 和200 mg/L 的Cu配施時對各項指標最好,說明適量的B、Cu施用對油菜生長有很好的促進作用; T25B1組合效果最差,表明低濃度的B、Cu產生了相互抑制作用。
(3)PCA-GA-BP網絡跟單純的主成分分析評價相比具有自適應能力,可以采用該模型用于指導實際的油菜種植實踐。該模型除了可以進行評價之外,還能夠根據(jù)結果自動識別B、Cu配置情況,在實際油菜種植過程中,只要檢測出油菜生長的相關指標數(shù)據(jù),可以根據(jù)評價結果確定B、Cu的配置情況,進而優(yōu)化種植,用此模型指導油菜種植將更加科學高效。
(4)主成分分析能夠優(yōu)化評價指標,減少神經網絡輸入層節(jié)點數(shù),進而可以優(yōu)化神經網絡的結構,給出如何采用主成分分析優(yōu)化神經網絡結構的方法。神經網絡訓練學習過程中,采用遺傳算法優(yōu)化其權閾值,能夠大大提高BP網絡的泛化能力。
采用PCA-GA-BP網絡對不同B、Cu處理下油菜指標進行綜合評價,結果客觀科學,測試效果較好,為油菜種植提供一種更加科學高效的智能化評價方法。