王鵬新 馮明悅 孫輝濤 李 俐 張樹(shù)譽(yù) 景毅剛
(1.中國(guó)農(nóng)業(yè)大學(xué)信息與電氣工程學(xué)院, 北京 100083; 2.陜西省氣象局, 西安 710014)
?
基于主成分分析和Copula函數(shù)的干旱影響評(píng)估研究
王鵬新1馮明悅1孫輝濤1李俐1張樹(shù)譽(yù)2景毅剛2
(1.中國(guó)農(nóng)業(yè)大學(xué)信息與電氣工程學(xué)院, 北京 100083; 2.陜西省氣象局, 西安 710014)
干旱是關(guān)中平原主要的農(nóng)業(yè)災(zāi)害之一,準(zhǔn)確地評(píng)估干旱的影響,對(duì)抗旱減災(zāi)及作物穩(wěn)產(chǎn)具有重要意義?;陉P(guān)中平原2008—2013年冬小麥主要生育期旬尺度的條件植被溫度指數(shù)(VTCI)干旱監(jiān)測(cè)結(jié)果,將Copula函數(shù)用于評(píng)估冬小麥主要生育時(shí)期干旱對(duì)其產(chǎn)量的影響。針對(duì)多元變量導(dǎo)致Copula函數(shù)參數(shù)求解困難的問(wèn)題,采用主成分分析法(PCA)提取主要生育時(shí)期的VTCI的主成分因子,形成新的相互獨(dú)立的指標(biāo),進(jìn)而結(jié)合Copula函數(shù)建立PCA-Copula法,確定關(guān)中平原主要生育時(shí)期的綜合VTCI,并構(gòu)建其與冬小麥單產(chǎn)間的線性回歸模型,評(píng)估干旱對(duì)產(chǎn)量的影響。結(jié)果表明,應(yīng)用PCA-Copula法得到的綜合VTCI與單產(chǎn)間的相關(guān)性達(dá)到極顯著水平(P<0.001),所建回歸模型的擬合度與熵值法的結(jié)果相比有所提高,決定系數(shù)由0.39提高到0.49,且對(duì)應(yīng)模型的估測(cè)單產(chǎn)與實(shí)測(cè)單產(chǎn)間的均方根誤差較熵值法的結(jié)果降低了30.2 kg/hm2,平均相對(duì)誤差降低了0.66%,表明PCA-Copula法能較好地應(yīng)用于評(píng)估冬小麥主要生育時(shí)期干旱對(duì)其產(chǎn)量的影響。
主成分分析; Copula函數(shù); 干旱影響評(píng)估; 綜合VTCI
干旱一直是制約農(nóng)業(yè)發(fā)展最主要的因素之一。中國(guó)是一個(gè)農(nóng)業(yè)大國(guó),干旱對(duì)農(nóng)業(yè)的影響較大,每年由各種自然災(zāi)害造成的糧食作物減產(chǎn)的損失中,旱災(zāi)的影響占一半以上[1]。同時(shí)農(nóng)業(yè)干旱是影響面積最廣、造成農(nóng)業(yè)損失最大、研究也最為復(fù)雜的一種因素。近年來(lái),人們?cè)絹?lái)越關(guān)注如何有效地監(jiān)測(cè)和評(píng)估干旱影響,從而提前采取有效的抗旱減災(zāi)策略和措施以減輕干旱災(zāi)害可能造成的損失。目前,國(guó)內(nèi)外主要應(yīng)用歸一化植被指數(shù)(NDVI)和地表溫度(LST)等參數(shù)進(jìn)行農(nóng)業(yè)干旱遙感監(jiān)測(cè),王鵬新等[2-3]在NDVI和LST的散點(diǎn)圖呈三角形區(qū)域分布的基礎(chǔ)上,提出了基于條件植被溫度指數(shù)(VTCI)的干旱監(jiān)測(cè)方法,并成功應(yīng)用于干旱的實(shí)時(shí)監(jiān)測(cè)、預(yù)測(cè)和影響評(píng)估等研究[4-7]。
以往的干旱影響評(píng)估研究方法主要依靠主觀賦權(quán)法和客觀賦權(quán)法[6-7]。主觀賦權(quán)法具有一定的主觀色彩,受一定的人為因素影響;客觀賦權(quán)法根據(jù)各指標(biāo)的初始信息量來(lái)確定權(quán)重,其中,主成分分析(Principal component analysis, PCA)方法能夠通過(guò)線性變換從多元隨機(jī)變量中提取出相互獨(dú)立的少數(shù)幾個(gè)重要變量[8-11]。本文對(duì)冬小麥越冬后4個(gè)生育時(shí)期的VTCI進(jìn)行降維處理,便于與Copula函數(shù)相結(jié)合構(gòu)建干旱影響評(píng)估模型。
Copula函數(shù)不受單變量服從何種邊緣分布的限制,可以通過(guò)邊緣分布和相關(guān)性結(jié)構(gòu)兩部分來(lái)構(gòu)造多元隨機(jī)變量之間的聯(lián)合分布[12],國(guó)內(nèi)外學(xué)者將Copula函數(shù)廣泛應(yīng)用于描述多種隨機(jī)變量間的相關(guān)性研究[13-15]。干旱是一種包含多種隨機(jī)變量的復(fù)雜事件,傳統(tǒng)的多變量頻率分析方法在干旱研究中受到限制,Copula函數(shù)正是構(gòu)建多元隨機(jī)變量聯(lián)合分布的一種有效途徑。SONG等[16]基于Meta-elliptical、GH、AMH、Frank和Clayton等連接函數(shù)研究了干旱歷時(shí)、干旱烈度和干旱時(shí)間間隔的聯(lián)合分布。MISHRA等[17]通過(guò)Copula函數(shù)研究了干旱的持續(xù)時(shí)間和嚴(yán)重程度之間的關(guān)系,進(jìn)而分析地表和地下干旱在不同時(shí)間尺度的特征。建立Copula函數(shù)的關(guān)鍵是確定參數(shù),常用的參數(shù)求解方法包括極大似然法、相關(guān)性指標(biāo)法、邊際函數(shù)推斷法等[18]。但是,針對(duì)評(píng)估時(shí)構(gòu)建的多元隨機(jī)變量間的聯(lián)合分布,參數(shù)計(jì)算一般需要建立多元偏微分方程組,求解非常困難。本文基于主成分分析方法對(duì)關(guān)中平原2008—2013年冬小麥主要生育時(shí)期的VTCI進(jìn)行降維處理,形成相互獨(dú)立的指標(biāo),采用Copula函數(shù)構(gòu)建PCA-Copula評(píng)估模型,便于獲取冬小麥主要生育時(shí)期的綜合VTCI值,并結(jié)合此綜合值評(píng)估冬小麥主要生育時(shí)期的干旱監(jiān)測(cè)效果,為評(píng)價(jià)冬小麥主要生育期干旱對(duì)單產(chǎn)的影響和制定抗旱減災(zāi)策略提供科學(xué)依據(jù)。
1.1研究區(qū)域概況
陜西省中部的關(guān)中平原位于渭河流域,西起寶雞大散關(guān),東至渭南潼關(guān),北到陜北黃土高原,南止秦嶺,地理坐標(biāo)為106°22′~110°24′E,33°57′~35°39′N(xiāo)。該地區(qū)土壤肥沃,地勢(shì)平坦,水源豐富,機(jī)耕條件好,土地利用率高,盛產(chǎn)小麥,是陜西省的農(nóng)業(yè)基地,也是我國(guó)重要的商品糧產(chǎn)區(qū),種植模式主要為冬小麥與夏玉米輪作。關(guān)中平原屬大陸性季風(fēng)半濕潤(rùn)氣候區(qū),是氣候變化的敏感區(qū),年均溫度6~13℃,屬于生態(tài)環(huán)境脆弱地帶,降水量較少,年平均降水量為500~700 mm,多集中在夏季,并存在明顯的波動(dòng)性。關(guān)中平原整體上氣候暖干化特征顯著,干旱已成為研究區(qū)域內(nèi)普遍而重大的氣象災(zāi)害之一[19]。
1.2試驗(yàn)數(shù)據(jù)
采用的遙感數(shù)據(jù)包括Aqua-MODIS的日地表溫度產(chǎn)品(MYD11A1)和日地表反射率產(chǎn)品(MYD09GA),所用的冬小麥單產(chǎn)來(lái)自陜西省統(tǒng)計(jì)局發(fā)布的關(guān)中平原5市2008—2013年的數(shù)據(jù)。由于銅川市位于關(guān)中平原向陜北黃土高原的過(guò)渡地帶,冬小麥面積相對(duì)較小,且主要分布在其南部的渭北旱塬,因此選用關(guān)中平原2008—2013年其余4市的冬小麥單產(chǎn)和主要生育期的VTCI進(jìn)行相關(guān)研究。
VTCI是基于遙感反演的NDVI和LST特征空間呈三角形區(qū)域分布的特點(diǎn)提出的,主要用于監(jiān)測(cè)旱情?;谌誑DVI和日LST,應(yīng)用最大值合成技術(shù)分別生成旬NDVI和旬LST最大值合成產(chǎn)品,并以此計(jì)算VTCI[2,20],生成2008—2013年每年3—5月份以旬為單位的關(guān)中平原4市的VTCI數(shù)據(jù)。結(jié)合關(guān)中平原冬小麥的生長(zhǎng)情況,將冬小麥越冬后的生育時(shí)期劃分為返青期(3月上旬—中旬)、拔節(jié)期(3月下旬—4月中旬)、抽穗-灌漿期(4月下旬—5月上旬)和乳熟期(5月中旬—下旬),并將這4個(gè)生育時(shí)期稱(chēng)為冬小麥主要生育期[6-7]。依據(jù)關(guān)中平原的行政邊界圖,取各市區(qū)內(nèi)所包含像素的VTCI平均值作為該區(qū)域該年該旬的VTCI值。再根據(jù)各生育時(shí)期包含的多旬VTCI平均值作為該年該生育時(shí)期的VTCI值。
1.3PCA-Copula法
主成分分析又稱(chēng)主分量分析,是一種將多個(gè)變量通過(guò)線性變換選出幾個(gè)重要變量的多元統(tǒng)計(jì)方法,旨在利用降維的思想,將原來(lái)數(shù)量較多的、具有一定相關(guān)性的變量,重新組合成一組新的、互相無(wú)關(guān)的綜合指標(biāo),使新變量盡可能多地保留原始變量信息,且在保證主要信息的前提下,避開(kāi)變量之間的線性相關(guān)[21]。由于主成分因子是新的互相獨(dú)立的變量,因此在建立Copula函數(shù)時(shí)無(wú)需求解參數(shù),計(jì)算簡(jiǎn)便。本文利用主成分分析方法將關(guān)中平原冬小麥4個(gè)生育時(shí)期的VTCI組合成一組新的互相獨(dú)立的指標(biāo),再基于Copula函數(shù)進(jìn)行干旱影響評(píng)估研究。
1.3.1主成分分析
由于VTCI的取值范圍為[0,1],因此直接對(duì)原始VTCI數(shù)據(jù)進(jìn)行主成分分析。應(yīng)用關(guān)中平原2008—2013年冬小麥越冬后4個(gè)生育時(shí)期的VTCI數(shù)據(jù)構(gòu)建矩陣An×4,獲得相關(guān)系數(shù)矩陣R4×4,并計(jì)算特征值λi(i=1,2,3,4)及其對(duì)應(yīng)的特征向量Q(qi),進(jìn)而求解各主成分貢獻(xiàn)率si并確定主成分個(gè)數(shù)m,即
(1)
第r個(gè)主成分的線性表達(dá)式為
(2)
式中Fnr——關(guān)中平原4市第n年第r個(gè)主成分的因子值
βri——第i個(gè)生育時(shí)期的VTCI在第r個(gè)主成分線性組合中的系數(shù)
ani——關(guān)中平原4市第n年第i個(gè)生育時(shí)期對(duì)應(yīng)的VTCI值
k——VTCI的主要生育期個(gè)數(shù),取k=4
1.3.2Copula函數(shù)
SKLAR在1959年指出可以將一個(gè)g元聯(lián)合分布函數(shù)分解為g個(gè)邊緣分布函數(shù)和一個(gè)Copula函數(shù),其中的Copula函數(shù)可以用來(lái)描述變量間的相關(guān)關(guān)系[22]。Copula是在[0,1]區(qū)間上服從均勻分布的聯(lián)合分布函數(shù),可以通過(guò)邊緣分布和相關(guān)性結(jié)構(gòu)兩部分來(lái)構(gòu)造聯(lián)合分布以描述變量間的相依性[12]。Copula函數(shù)形式為
F(x1,x2,…,xj)=Cθ(F1(x1),F2(x2),…,Fj(xj))=
C(u1,u2,…,uj)
(3)
其中
uj=Fj(xj)
式中F——隨機(jī)變量分布函數(shù)
j——樣本容量C——Copula函數(shù)
θ——Copula參數(shù)
uj——隨機(jī)變量Xj的邊緣分布函數(shù)
采用PCA方法提取VTCI數(shù)據(jù)m個(gè)主成分因子,各因子之間無(wú)相關(guān)性,即主成分因子所構(gòu)建的新變量之間相互獨(dú)立,則可以得到相應(yīng)的乘積Copula(又稱(chēng)為獨(dú)立Copula)為
C(u1,u2,…,um)=u1u2…um
(4)
式中um——第m個(gè)主成分因子對(duì)應(yīng)的邊緣分布函數(shù)
1.3.3邊緣分布函數(shù)
目前常用的分布線型有皮爾遜III型分布、正態(tài)分布、Gamma分布、指數(shù)分布、對(duì)數(shù)分布、廣義極值分布等[11]。其中,針對(duì)廣義極值分布的研究源于20世紀(jì)20年代,F(xiàn)ISHER等[23]在對(duì)獨(dú)立同分布的極大值漸進(jìn)分布進(jìn)行理論研究時(shí),提出了3種極值分布,第I型為指數(shù)型原始分布,又稱(chēng)Gumbel分布;第II型為柯西型原始分布,即Frechet分布;第III型為有界型分布,即Weibull分布。JENKINSON[24]從理論上證明了3種分布模型可概括成一個(gè)通式,即具有3個(gè)參數(shù)的極值分布函數(shù)。后來(lái)稱(chēng)極值I型、II型和III型分布為廣義極值(Generalized extreme value,GEV)分布,其標(biāo)準(zhǔn)化分布函數(shù)為
FX(x)=P(X (5) 式中ε——形狀參數(shù)μ——位置參數(shù) σ——尺度參數(shù) 通過(guò)形狀參數(shù)判斷極值類(lèi)型,ε=0為極值Ⅰ型;ε>0為極值Ⅱ型;ε<0為極值Ⅲ型。 1.3.4邊緣分布的優(yōu)度評(píng)價(jià) 首先通過(guò)Kolmogorov-Smirnov (K-S)方法檢驗(yàn)邊緣分布函數(shù)擬合效果,再通過(guò)比較理論頻率與經(jīng)驗(yàn)頻率之間的均方根誤差(RMSE)以及信息準(zhǔn)則值 (Akaike information criterion,AIC)優(yōu)選邊緣分布函數(shù),邊緣分布優(yōu)選的原則是RMSE值及AIC值越小擬合效果越好[12]。GRINGORTEN[25]在研究水文極值的無(wú)偏估計(jì)量時(shí),給出的一維隨機(jī)分布經(jīng)驗(yàn)頻率計(jì)算公式為 (6) 式中Ps——累計(jì)經(jīng)驗(yàn)頻率,定義為在N個(gè)觀測(cè)值中小于第s個(gè)最小觀測(cè)值的概率 RMSE的計(jì)算公式為 (7) 式中Peir——第i年第r個(gè)主成分的數(shù)據(jù)對(duì)應(yīng)的經(jīng)驗(yàn)頻率值 Pir——第i年第r個(gè)主成分的數(shù)據(jù)對(duì)應(yīng)的理論頻率值 t——第r個(gè)主成分因子中數(shù)據(jù)的個(gè)數(shù),即關(guān)中平原4市對(duì)應(yīng)的年總數(shù) AIC的計(jì)算公式為 VAIC=tlnVRMSE+2η (8) 式中η——所選模型參數(shù)的個(gè)數(shù) 2.1主要生育時(shí)期VTCI的主成分分析 通過(guò)主成分分析方法對(duì)冬小麥主要生育時(shí)期的VTCI進(jìn)行降維處理,根據(jù)主成分對(duì)應(yīng)的特征根大于1、且相應(yīng)累計(jì)貢獻(xiàn)率達(dá)到80%以上的原則,提取出主要生育時(shí)期的VTCI前3個(gè)主成分因子,并建立各主成分的線性表達(dá)式為 PC1=0.502VTCI1+0.324VTCI2+0.555VTCI3+0.579VTCI4 (9) PC2=-0.055VTCI1+0.927VTCI2-0.126VTCI3- 0.348VTCI4 (10) PC3=0.808VTCI1-0.07VTCI2-0.547VTCI3-0.109VTCI4 (11) 式中PC1、PC2、PC3——前3個(gè)主成分因子 VTCI1、VTCI2、VTCI3、VTCI4——4個(gè)生育時(shí)期的VTCI值 可以發(fā)現(xiàn),4個(gè)不同生育時(shí)期的VTCI在各主成分系數(shù)的絕對(duì)值存在差異,4個(gè)生育時(shí)期中,拔節(jié)期VTCI在第1主成分的系數(shù)最小,而拔節(jié)期VTCI在第2主成分的系數(shù)達(dá)到最大,返青期VTCI與抽穗-灌漿期VTCI在第3主成分的系數(shù)絕對(duì)值較大。基于此,根據(jù)各主成分的方差貢獻(xiàn)率獲取前3個(gè)主成分的綜合線性表達(dá)式為 PC=0.468VTCI1+0.406VTCI2+0.328VTCI3+0.359VTCI4 (12) 式中PC——前3個(gè)主成分因子的綜合值 可以看出,返青期VTCI的系數(shù)最大,而抽穗-灌漿期VTCI的系數(shù)最低,但依據(jù)相關(guān)的農(nóng)學(xué)知識(shí)和專(zhuān)家的主觀判斷可知,拔節(jié)期是干旱對(duì)冬小麥生長(zhǎng)影響的關(guān)鍵時(shí)期,其次為抽穗-灌漿期,返青期和乳熟期相對(duì)不重要[6-7],因此僅采用主成分方法分析主要生育時(shí)期的VTCI,并基于前3個(gè)主成分的綜合線性模型存在不足,該模型的構(gòu)建沒(méi)有考慮3個(gè)主成分因子各自的分布特征,僅是將3個(gè)主成分因子進(jìn)行綜合,且獲取的各生育時(shí)期干旱對(duì)產(chǎn)量的影響程度與農(nóng)學(xué)先驗(yàn)知識(shí)不相符,難以準(zhǔn)確反映冬小麥生長(zhǎng)各生育時(shí)期的相對(duì)重要程度。而將主成分分析與Copula函數(shù)相結(jié)合的方法能夠根據(jù)各主成分因子對(duì)應(yīng)的分布特征建立聯(lián)合分布,同時(shí)不受各單因子變量邊緣分布的影響,因此嘗試將其用于干旱影響評(píng)估研究。 2.2基于PCA-Copula法的干旱影響評(píng)估 對(duì)于2008—2013年研究區(qū)域的VTCI數(shù)據(jù),通過(guò)主成分分析法提取了3個(gè)因子作為主成分因子,通過(guò)確定3個(gè)主成分因子的邊緣分布函數(shù),采用乘積Copula(式(4))獲取研究區(qū)每年的綜合VTCI值。 2.2.1邊緣分布函數(shù)的確定 基于目前常用的分布線型,選取正態(tài)分布、對(duì)數(shù)分布和廣義極值分布分別擬合關(guān)中平原冬小麥4個(gè)生育時(shí)期的VTCI的主成分因子值,應(yīng)用極大似然法獲得對(duì)應(yīng)的邊緣分布函數(shù)的參數(shù),利用K-S檢驗(yàn)對(duì)各主成分因子的邊緣分布函數(shù)進(jìn)行擬合優(yōu)度評(píng)價(jià),結(jié)果表明,3個(gè)主成分的對(duì)數(shù)分布均不能通過(guò)K-S檢驗(yàn),廣義極值分布和正態(tài)分布均能通過(guò)K-S檢驗(yàn),其中,利用廣義極值分布擬合各生育時(shí)期的VTCI的前3個(gè)主成分因子時(shí),前2個(gè)主成分的形狀參數(shù)小于零,屬于極值III型,即Weibull分布;第3個(gè)主成分的形狀參數(shù)大于零,屬于極值II型,即Frechet分布。 基于正態(tài)分布及各主成分相對(duì)應(yīng)的極值分布類(lèi)型,進(jìn)一步獲取各邊緣分布對(duì)應(yīng)的RMSE和AIC(表1),可以看出,基于Weibull分布獲取的第1個(gè)主成分的RMSE和AIC最??;基于正態(tài)分布獲取的第2個(gè)主成分的RMSE和AIC最?。换贔rechet分布獲取的第3個(gè)主成分的RMSE和AIC最小。依據(jù)邊緣分布的RMSE及AIC越小擬合效果越好的優(yōu)選原則,最終確定2008—2013年關(guān)中平原4市主要生育時(shí)期的VTCI的3個(gè)主成分因子值的最優(yōu)邊緣分布。結(jié)果表明,第1主成分因子值優(yōu)選Weibull分布;第2主成分因子值優(yōu)選正態(tài)分布;第3主成分因子值優(yōu)選Frechet分布。盡管3個(gè)主成分的邊緣分布存在差異,但Copula函數(shù)具有不受單變量服從何種邊緣分布的優(yōu)越性,使其能較好地用于構(gòu)建3個(gè)主成分間的聯(lián)合分布。 表1 冬小麥主要生育時(shí)期的VTCI主成分因子的分布線型擬合效果Tab.1 Distribution fitting results of principle components of VTCI at the main growth stages of winter wheat 2.2.2PCA-Copula法與熵值法建立的綜合VTCI與冬小麥單產(chǎn)間的線性回歸模型比較 基于冬小麥主要生育時(shí)期的VTCI的3個(gè)主成分因子優(yōu)選的邊緣分布,結(jié)合乘積Copula函數(shù)建立主成分因子間的連接函數(shù),獲取綜合VTCI,建立其與單產(chǎn)間的一元線性回歸模型,并將其作為冬小麥單產(chǎn)的估測(cè)模型。以往研究[6]表明,熵值法是干旱影響評(píng)估的最佳客觀賦權(quán)法,通過(guò)熵值法確定冬小麥不同生育時(shí)期的VTCI權(quán)重,并將其用于建立的加權(quán)VTCI與單產(chǎn)間的線性回歸模型,再與PCA-Copula法建立的模型的結(jié)果進(jìn)行對(duì)比(表2)??梢钥闯?,盡管PCA-Copula法確定的綜合VTCI、熵值法確定的加權(quán)VTCI與單產(chǎn)間的相關(guān)性均達(dá)到極顯著水平(P<0.01),但基于PCA-Copula法構(gòu)建的回歸模型的決定系數(shù)(R2=0.49)高于熵值法確定的回歸模型的決定系數(shù) (R2=0.39)。基于熵值法確定回歸模型的估測(cè)單產(chǎn)與實(shí)測(cè)單產(chǎn)之間的均方根誤差為358.1 kg/hm2,相對(duì)誤差的范圍為0.39%~28.13%,平均相對(duì)誤差為7.10%,而PCA-Copula法確定回歸模型的估測(cè)單產(chǎn)與實(shí)測(cè)單產(chǎn)的均方根誤差為327.9 kg/hm2,相對(duì)誤差范圍為0.33%~25.20%,平均相對(duì)誤差為6.44%,表明PCA-Copula法確定的模型估測(cè)精度較高。為了進(jìn)一步驗(yàn)證該估測(cè)模型的精度,將PCA-Copula法確定的估產(chǎn)模型用于分析2008—2013年4市估測(cè)單產(chǎn)與實(shí)際單產(chǎn)的平均相對(duì)誤差,結(jié)果表明,寶雞市的平均相對(duì)誤差為6.21%,西安市的平均相對(duì)誤差為5.74%,咸陽(yáng)市的平均相對(duì)誤差為4.39%,渭南市的平均相對(duì)誤差為9.44%,表明PCA-Copula法可用于開(kāi)展關(guān)中平原干旱對(duì)冬小麥生產(chǎn)及其產(chǎn)量的影響評(píng)估研究。 遙感定量反演的VTCI是綜合地表主要參數(shù)——NDVI和LST的干旱指標(biāo),其與土壤淺層水分存在較強(qiáng)的相關(guān)性[26],能夠較為準(zhǔn)確地監(jiān)測(cè)干旱、反映作物水分脅迫信息,作物長(zhǎng)勢(shì)和最終產(chǎn)量與其不同生育期發(fā)生的干旱程度密切相關(guān)。相比傳統(tǒng)的多變量頻率分析方法,Copula函數(shù)作為一種相關(guān)性度量工具,在構(gòu)建多元隨機(jī)變量聯(lián)合分布時(shí)不受各單因子變量邊緣分布的影響。本文基于冬小麥越冬后不同生育時(shí)期VTCI的干旱監(jiān)測(cè)結(jié)果,嘗試將Copula函數(shù)應(yīng)用于建立冬小麥主要生育時(shí)期的干旱影響評(píng)估模型,若直接建立Copula函數(shù)與冬小麥單產(chǎn)間的線性回歸模型,首先需要確定4個(gè)生育時(shí)期VTCI變量對(duì)應(yīng)的最優(yōu)邊緣分布,由于不同形式的Copula函數(shù)對(duì)變量的相關(guān)性有不同的要求,因而需要根據(jù)各變量之間的相關(guān)關(guān)系特點(diǎn)選擇可行的四維Copula模型,并基于所選Copula函數(shù)的密度函數(shù)和各邊緣分布的密度函數(shù)獲取Copula函數(shù)的參數(shù),對(duì)于所選Copula函數(shù)是否合適還需進(jìn)一步的分布擬合檢驗(yàn),確定最優(yōu)Copula函數(shù),從而獲取綜合VTCI。然而利用主成分分析法具有提取主成分因子的客觀性,在提取的主要生育時(shí)期的VTCI的主成分因子中,所選的前3個(gè)主成分因子的累計(jì)貢獻(xiàn)率高達(dá)98%,新變量不僅幾乎保留了全部原始變量信息,而且可以直接通過(guò)用于獨(dú)立變量的乘積Copula獲取綜合VTCI,在建立聯(lián)合分布過(guò)程中僅需優(yōu)選3個(gè)主成分因子的邊緣分布,無(wú)需求解參數(shù),計(jì)算簡(jiǎn)便。 表2 PCA-Copula法與熵值法確定的綜合VTCI與 單產(chǎn)之間的回歸模型的對(duì)比Tab.2 Comparison of linear regression models between wheat yields and comprehensive values of the VTCIs determined by PCA-Copula and entropy value methods 注:回歸模型中x為綜合VTCI值;y為單產(chǎn),單位為kg/hm2。 現(xiàn)有的干旱影響評(píng)估研究方法主要有主觀賦權(quán)法和客觀賦權(quán)法2類(lèi),其權(quán)重的確定對(duì)干旱影響評(píng)估結(jié)果均有很大影響。針對(duì)以往客觀賦權(quán)法根據(jù)VTCI的客觀數(shù)據(jù)差異來(lái)確定權(quán)重、得到不同生育時(shí)期干旱對(duì)冬小麥生長(zhǎng)影響程度相當(dāng)?shù)慕Y(jié)論與農(nóng)學(xué)先驗(yàn)知識(shí)不相符[6-7]的問(wèn)題,本文采用主成分分析方法提取出冬小麥越冬后主要生育時(shí)期的VTCI的前3個(gè)主成分因子作為新的相互獨(dú)立的變量,而根據(jù)各主成分方差貢獻(xiàn)率獲取的綜合線性模型反映的各生育時(shí)期相對(duì)重要程度與農(nóng)學(xué)先驗(yàn)知識(shí)仍然不相符。因此,嘗試基于獲取的3個(gè)主成分因子,通過(guò)構(gòu)造各主成分因子的邊緣分布,進(jìn)而采用Copula函數(shù)建立的PCA-Copula法,最終獲取綜合VTCI值,并建立其與單產(chǎn)之間的線性回歸模型,結(jié)果表明,PCA-Copula法能較好地用于開(kāi)展關(guān)中平原干旱對(duì)冬小麥生產(chǎn)及其產(chǎn)量的影響評(píng)估研究。 (1)采用主成分分析法提取關(guān)中平原2008—2013年4市冬小麥主要生育時(shí)期VTCI的3個(gè)因子作為主成分,將依據(jù)各主成分貢獻(xiàn)率獲取的前3個(gè)主成分的綜合線性模型與PCA-Copula法的結(jié)果進(jìn)行對(duì)比,結(jié)果表明,基于前3個(gè)主成分,僅通過(guò)各主成分的方差貢獻(xiàn)率建立的綜合線性模型難以準(zhǔn)確反映冬小麥生長(zhǎng)相對(duì)重要生育時(shí)期,而通過(guò)優(yōu)選各主成分相應(yīng)的邊緣分布,進(jìn)而通過(guò)乘積Copula函數(shù)建立3個(gè)主成分聯(lián)合分布的方法能有效評(píng)估關(guān)中平原干旱對(duì)冬小麥產(chǎn)量的影響。 (2)基于熵值法建立加權(quán)VTCI與單產(chǎn)之間的線性回歸模型,并將其與PCA-Copula法構(gòu)建的線性回歸模型進(jìn)行對(duì)比分析。結(jié)果表明,采用PCA-Copula法確定的綜合VTCI與單產(chǎn)之間回歸模型的決定系數(shù)達(dá)到0.49,相比于熵值法的結(jié)果提高了0.10,且PCA-Copula法對(duì)應(yīng)模型的估測(cè)單產(chǎn)與實(shí)測(cè)單產(chǎn)之間的均方根誤差較熵值法的結(jié)果降低了30.2 kg/hm2,平均相對(duì)誤差降低了0.66%。 1史舟, 梁宗正, 楊媛媛, 等. 農(nóng)業(yè)遙感研究現(xiàn)狀與展望[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2015, 46(2): 247-260. SHI Zhou, LIANG Zongzheng, YANG Yuanyuan, et al. Status and prospect of agricultural remote sensing[J]. Transactions of the Chinese Society for Agricultural Machinery, 2015, 46(2): 247-260. (in Chinese) 2王鵬新, 龔健雅, 李小文. 條件植被溫度指數(shù)及其在干旱監(jiān)測(cè)中的應(yīng)用[J]. 武漢大學(xué)學(xué)報(bào): 信息科學(xué)版, 2001, 26(5): 412-418. WANG Pengxin, GONG Jianya, LI Xiaowen. Vegetation temperature condition index and its application for drought monitoring[J]. Geomatics and Information Science of Wuhan University, 2001, 26(5): 412-418. (in Chinese) 3王鵬新, WAN Zhengming, 龔健雅, 等. 基于植被指數(shù)和土地表面溫度的干旱監(jiān)測(cè)模型[J]. 地球科學(xué)進(jìn)展, 2003, 18(4): 527-533. WANG Pengxin, WAN Zhengming, GONG Jianya, et al. Advances in drought monitoring by using remotely sensed normalized difference vegetation index and land surface temperature products[J]. Advances in Earth Science, 2003, 18(4): 527-533. (in Chinese) 4陳陽(yáng), 范建容, 郭芬芬, 等. 條件植被溫度指數(shù)在云南干旱監(jiān)測(cè)中的應(yīng)用[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2011, 27(5): 231-236. CHEN Yang, FAN Jianrong, GUO Fenfen, et al. Application of the vegetation temperature condition index to drought monitoring in Yunnan Province[J]. Transactions of CSAE, 2011, 27(5): 231-236. (in Chinese) 5田苗, 王鵬新, 韓萍, 等. 基于SARIMA模型和條件植被溫度指數(shù)的干旱預(yù)測(cè)[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2013, 44(2): 109-116. TIAN Miao, WANG Pengxin, HAN Ping, et al. Drought forecasts based on SARIMA models and vegetation temperature condition index[J]. Transactions of the Chinese Society for Agricultural Machinery, 2013, 44(2): 109-116. (in Chinese) 6李艷, 王鵬新, 劉峻明, 等. 基于條件植被溫度指數(shù)的冬小麥主要生育時(shí)期干旱監(jiān)測(cè)效果評(píng)價(jià)——I.因子權(quán)重排序法和熵值法組合賦權(quán)[J]. 干旱地區(qū)農(nóng)業(yè)研究, 2013, 31(6): 159-163. LI Yan, WANG Pengxin, LIU Junming, et al. Application of temperature condition index to evaluate the drought monitoring effect in main growing period of winter wheat: I. Factor weight sorting method and entropy method[J]. Agricultural Research in the Arid Areas, 2013, 31(6): 159-163. (in Chinese) 7李艷, 王鵬新, 劉峻明, 等. 基于條件植被溫度指數(shù)的冬小麥主要生育時(shí)期干旱監(jiān)測(cè)效果評(píng)價(jià)——Ⅱ.改進(jìn)層次分析法和變異系數(shù)法組合賦權(quán)[J]. 干旱地區(qū)農(nóng)業(yè)研究, 2014, 32(1): 236-239, 262. LI Yan, WANG Pengxin, LIU Junming, et al. Application of temperature condition index to evaluate the drought monitoring effect in main growing period of winter wheat: II. Improved analytic hierarchy process and variation coefficient method[J]. Agricultural Research in the Arid Areas, 2014, 32(1): 236-239, 262. (in Chinese) 8HAO Z C, SINGH V P. Drought characterization from a multivariate perspective: A review[J]. Journal of Hydrology, 2015, 527: 668-678. 9李靖華, 郭耀煌. 主成分分析用于多指標(biāo)評(píng)價(jià)的方法研究——主成分評(píng)價(jià)[J]. 管理工程學(xué)報(bào), 2002, 16(1): 39-43. LI Jinghua, GUO Yaohuang. Principal component evaluation: a multivariate evaluate method expanded from principal component analysis[J]. Journal of Industrial Engineering and Engineering Management, 2002, 16(1): 39-43. (in Chinese) 10劉春景, 唐敦兵, 何華, 等. 基于灰色關(guān)聯(lián)和主成分分析的車(chē)削加工多目標(biāo)優(yōu)化[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2013, 44(4): 293-298. LIU Chunjing, TANG Dunbing, HE Hua, et al. Multi-objective optimization of turning based on grey relational and principal component analysis[J]. Transactions of the Chinese Society for Agricultural Machinery, 2013, 44(4): 293-298. (in Chinese) 11李浩鑫, 邵東國(guó), 尹希, 等. 基于主成分分析和Copula函數(shù)的灌溉用水效率評(píng)價(jià)方法[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2015, 31(11): 96-102. LI Haoxin, SHAO Dongguo, YIN Xi, et al. Evaluation method for irrigation-water use efficiency based on principle component analysis and copula function[J]. Transactions of CSAE, 2015, 31(11): 96-102. (in Chinese) 12KAO S C, GOVINDARAJU R S. A copula-based joint deficit index for droughts[J]. Journal of Hydrology, 2010, 380(1): 121-134. 13INDU J, KUMAR D N. Copula-based modeling of TMI brightness temperature with rainfall type[J]. IEEE Transactions on Geoscience and Remote Sensing, 2014, 52(8): 4832-4845. 14郭愛(ài)軍, 暢建霞, 王義民, 等. 近50年涇河流域降雨-徑流關(guān)系變化及驅(qū)動(dòng)因素定量分析[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2015, 31(14): 165-171. GUO Aijun, CHANG Jianxia, WANG Yimin, et al. Variation characteristics of rainfall-runoff relationship and driving factors analysis in Jinghe river basin in nearly 50 years[J]. Transactions of CSAE, 2015, 31(14): 165-171. (in Chinese) 15劉招, 田智, 喬長(zhǎng)錄, 等. 基于Copula函數(shù)的關(guān)中河流水文豐枯遭遇特征分析[J]. 干旱地區(qū)農(nóng)業(yè)研究, 2013, 31(4): 245-248. LIU Zhao, TIAN Zhi, QIAO Changlu, et al. Analysis on coincidence characteristics of high and low stream flow in central Shaanxi based on Copula function[J]. Agricultural Research in the Arid Areas, 2013, 31(4): 245-248. (in Chinese) 16SONG S, SINGH V. Meta-elliptical copulas for drought frequency analysis of periodic hydrologic data[J]. Stochastic Environmental Research and Risk Assessment, 2009, 24(3): 425-444. 17MISHRA A K, INES A V M, DAS N N, et al. Anatomy of a local-scale drought: application of assimilated remote sensing products, crop model, and statistical methods to an agricultural drought study[J]. Journal of Hydrology, 2015, 526: 15-29. 18HAO Z C, SINGH V P. Integrating entropy and Copula theories for hydrologic modeling and analysis[J]. Entropy, 2015, 17(4): 2253-2280. 19王鵬新, 孫輝濤, 王蕾, 等. 基于4D-VAR和條件植被溫度指數(shù)的冬小麥單產(chǎn)估測(cè)[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2016, 47(3): 263-271. WANG Pengxin, SUN Huitao, WANG Lei, et al. Winter wheat yield estimation based on 4D variational assimilation method and remotely sensed vegetation temperature condition index[J]. Transactions of the Chinese Society for Agricultural Machinery, 2016, 47(3): 263-271. (in Chinese) 20孫威, 王鵬新, 韓麗娟, 等. 條件植被溫度指數(shù)干旱監(jiān)測(cè)方法的完善[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2006, 22(2): 22-26. SUN Wei, WANG Pengxin, HAN Lijuan, et al. Further improvement of the approach to monitoring drought using vegetation and temperature condition indexes from multi-years’ remotely sensed data[J]. Transactions of CSAE, 2006, 22(2): 22-26. (in Chinese) 21李順?lè)? 張麗華, 劉興華, 等. 基于主成分分析的蘋(píng)果霉心病近紅外漫反射光譜判別[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2011, 42(10): 158-161. LI Shunfeng, ZHANG Lihua, LIU Xinghua, et al. Discriminant analysis of apple moldy core using near infrared diffuse reflectance spectroscopy based on principal component analysis[J]. Transactions of the Chinese Society for Agricultural Machinery, 2011, 42(10): 158-161. (in Chinese) 22NELSEN R B. An introduction to copulas[M]. New York: Springer, 2006. 23FISHER R A, TIPPETT L H C. Limiting forms of the frequency distribution of the largest or smallest member of a sample[J] . Proceedings of the Cambridge Philosophical Society, 1928, 24(2): 180-190. 24JENKINSON A F.The frequency distribution of the annual maximum (or minimum) values of meteorological elements[J] . Quarterly Journal of the Royal Meteorological Society, 1955, 81(348): 158-171. 25GRINGORTEN I I. A plotting rule for extreme probability paper[J]. Journal of Geophysical Research, 1963, 68(3): 813-814. 26楊鶴松, 王鵬新, 孫威. 條件植被溫度指數(shù)在華北平原干旱監(jiān)測(cè)中的應(yīng)用[J]. 北京師范大學(xué)學(xué)報(bào): 自然科學(xué)版, 2007, 43(3): 314-318. YANG Hesong, WANG Pengxin, SUN Wei. Application of the vegetation temperature condition index to drought monitoring in North China Plain[J]. Journal of Beijing Normal University: Natural Science, 2007, 43(3): 314-318. (in Chinese) Drought Impact Assessment Based on Principal Component Analysis and Copula Function Wang Pengxin1Feng Mingyue1Sun Huitao1Li Li1Zhang Shuyu2Jing Yigang2 (1.CollegeofInformationandElectricalEngineering,ChinaAgriculturalUniversity,Beijing100083,China>2.ShaanxiProvincialMeteorologicalBureau,Xi’an710014,China) Drought is one of the most important agricultural disasters in the Guanzhong Plain, China. Assessing the influence of the droughts in the plain accurately can provide reference for drought mitigation and maintaining stable crop yields. Based on remotely sensed vegetation temperature condition index (VTCI) which was calculated at ten-day intervals for monitoring droughts in the years of 2008—2013 in the plain, the Copula function method was used to assess the effect of drought at the main growth stages of winter wheat on the yields. The mutually independent principal factors were extracted from the VTCIs at the main growth stages of winter wheat by using principal component analysis (PCA), overcoming difficulty of parameter estimation for multivariate Copula, and then incorporated into the Copula function to establish a PCA-Copula method. The comprehensive values of VTCIs at the main growth stages were determined by the PCA-Copula method, and then linear regression model between the comprehensive VTCIs and wheat yields was established to assess the effect of drought on the yields. The results showed that the linear correlation coefficient between the wheat yields and comprehensive VTCIs was at the extremely significant level (P<0.001). Compared with the linear regression model based on the entropy value method, the determination coefficient of the model with the PCA-Copula method reached 0.49 from 0.39, which indicated that the fitting degree of the model was improved, and the root mean square error and average relative error between the estimated and measured yields reduced by 30.2 kg/hm2and 0.66%, respectively. These results indicated that the PCA-Copula method was a better approach for accessing the impact of droughts at the main growth stages of winter wheat on the yield. principal component analysis; Copula function; impact assessment of drought; comprehensive vegetation temperature condition index 10.6041/j.issn.1000-1298.2016.09.045 2016-02-29 2016-03-28 國(guó)家自然科學(xué)基金項(xiàng)目(41371390) 王鵬新(1965—),男,教授,博士生導(dǎo)師,主要從事定量遙感及其在農(nóng)業(yè)中的應(yīng)用研究,E-mail: wangpx@cau.edu.cn S127 A 1000-1298(2016)09-0334-072 結(jié)果與分析
3 討論
4 結(jié)論