梁慧玲,王文輝,郭福濤,林芳芳,林玉蕊,*
1 福建農(nóng)林大學(xué)計(jì)算機(jī)與信息學(xué)院,福州 350002 2 福建農(nóng)林大學(xué)林學(xué)院,福州 350002 3 漳州理工職業(yè)學(xué)院,漳州 363000
?
比較邏輯斯蒂與地理加權(quán)邏輯斯蒂回歸模型在福建林火發(fā)生的適用性
梁慧玲1,2,3,王文輝2,郭福濤2,林芳芳1,林玉蕊1,*
1 福建農(nóng)林大學(xué)計(jì)算機(jī)與信息學(xué)院,福州 350002 2 福建農(nóng)林大學(xué)林學(xué)院,福州 350002 3 漳州理工職業(yè)學(xué)院,漳州 363000
林火預(yù)測(cè)預(yù)報(bào)是科學(xué)有效進(jìn)行林火管理的前提,是林業(yè)管理部門(mén)和科研工作者的廣泛關(guān)注的領(lǐng)域。邏輯斯蒂回歸(Logistic Regression, LR)是目前國(guó)內(nèi)外廣泛應(yīng)用于森林火災(zāi)預(yù)測(cè)的模型方法,然而近年來(lái)有學(xué)者發(fā)現(xiàn)該方法沒(méi)有充分考慮林火影響因子的空間相關(guān)性和異質(zhì)性,從而導(dǎo)致模型擬合結(jié)果偏差。地理加權(quán)邏輯斯蒂回歸(Geographically weighted logistic regression, GWR)模型考慮到了模型變量之間的空間相關(guān)性,有效提高的模型的擬合能力。為探討GWLR模型在福建林火預(yù)測(cè)上的適用性,本研究應(yīng)用LR和GWLR兩種方法分別建立福建省森林火災(zāi)與氣象因子的預(yù)測(cè)模型,通過(guò)模型擬合能力對(duì)比,判斷在GWLR的適用性。研究以2000—2005年福建地區(qū)森林火災(zāi)衛(wèi)星火點(diǎn)數(shù)據(jù)和每日氣象因子為基礎(chǔ),將全樣本分為60%的建模數(shù)據(jù)和40%的校驗(yàn)數(shù)據(jù),并重復(fù)5次,建立5個(gè)樣本組。選擇在5個(gè)樣本組中3個(gè)及以上表現(xiàn)顯著的變量進(jìn)入最終模型。研究結(jié)果表明GWLR在模型擬合度、模型殘差、空間自相關(guān)性以及預(yù)測(cè)準(zhǔn)確率等方面均優(yōu)于LR模型,說(shuō)明充分考慮模型變量的空間異質(zhì)性有助于提高模型的預(yù)測(cè)精度,同時(shí)也驗(yàn)證了GWLR在福建地區(qū)林火預(yù)測(cè)上的適應(yīng)性。此外,模型參數(shù)結(jié)果顯示,“日最高地表氣溫”、“日最低地表氣溫”、“日平均風(fēng)速”、“24小時(shí)降水量”、“日最高本站氣壓”、“日照時(shí)數(shù)”、“日最高氣溫”和“日最小相對(duì)濕度”8個(gè)因子對(duì)福建省林火發(fā)生有顯著影響,研究結(jié)論為福建地區(qū)林火預(yù)測(cè)預(yù)報(bào)提供了新的方法。
林火預(yù)測(cè);空間異質(zhì)性;邏輯斯蒂回歸;地理加權(quán)邏輯斯蒂回歸
林火是是森林生態(tài)系統(tǒng)的重要影響因子,對(duì)森林資源與環(huán)境造成破壞也會(huì)威脅人類(lèi)生命財(cái)產(chǎn)安全[1- 3]。判定林火發(fā)生的影響因子,建立準(zhǔn)確的林火預(yù)測(cè)預(yù)報(bào)模型對(duì)林火管理工作至關(guān)重要。目前,國(guó)內(nèi)外有關(guān)林火發(fā)生的預(yù)測(cè)模型和影響因子分析已大量開(kāi)展,主要模型方法為人工神經(jīng)網(wǎng)絡(luò)[4]、最大熵算法[5,6]、分類(lèi)樹(shù)[7]、泊松回歸、負(fù)二項(xiàng)回歸、零膨脹泊松、零膨脹負(fù)二項(xiàng)以及邏輯斯蒂回歸模型[8- 11]等,其中邏輯斯蒂模型應(yīng)用最為廣泛。然而以上所有模型均假設(shè)因變量與自變量之間的關(guān)系是空間平穩(wěn)的,即模型參數(shù)在整個(gè)研究區(qū)域上是一個(gè)不變的常數(shù),通常建模的結(jié)果是一套模型參數(shù)應(yīng)用于整個(gè)研究區(qū)域,也稱(chēng)之為全局模型。然而,隨著研究的深入,很多學(xué)者發(fā)現(xiàn)區(qū)域的空間異質(zhì)性是不容忽略的。林火與影響因子之間的關(guān)系在空間上是非平穩(wěn)的,具有很強(qiáng)的異質(zhì)性[12- 14],因此,以往的全局模型在林火預(yù)測(cè)預(yù)報(bào)上可能會(huì)產(chǎn)生較大誤差。
地理加權(quán)回歸模型(GWR)考慮了地理空間因素的影響,該模型將一個(gè)大的數(shù)據(jù)集分成了若干小區(qū)域,減少了各個(gè)模型間的差異性,有助于提高模型精度,可以用來(lái)解決空間的平穩(wěn)性問(wèn)題。目前,地理加權(quán)回歸模型主要應(yīng)用在生態(tài)學(xué)、經(jīng)濟(jì)學(xué)和社會(huì)科學(xué)等領(lǐng)域[15- 19]。近年來(lái),國(guó)外已有少數(shù)學(xué)者將該模型的拓展模型即地理加權(quán)邏輯斯蒂模型(GWLR)應(yīng)用于森林火災(zāi)的預(yù)測(cè)預(yù)報(bào)及林火影響因子的空間分析上,并且表現(xiàn)出較好的擬合效果[12- 14]。由于該模型強(qiáng)調(diào)自變量與因變量關(guān)系的空間異質(zhì)性,因此模型在不同區(qū)域的適用性可能有較大差異。為了探討GWLR模型對(duì)我國(guó)亞熱帶地區(qū)林火預(yù)測(cè)預(yù)報(bào)的適用性,且由于2000—2005年福建省的林火發(fā)生既不是太多,也不是很少,比較有代表性,因此本文以福建省2000—2005年衛(wèi)星火點(diǎn)數(shù)據(jù)為基礎(chǔ),選取每日氣象數(shù)據(jù)為自變量因子,對(duì)模型的擬合能力進(jìn)行分析,并與傳統(tǒng)全局邏輯斯蒂回歸模型進(jìn)行對(duì)比,探討地理加權(quán)回歸模型在林火預(yù)測(cè)預(yù)報(bào)上的適用性。
1.1 研究區(qū)域概況
圖1 研究區(qū)域示意圖Fig.1 The study area
福建省位于我國(guó)東南沿海地區(qū),介于北緯23°33′—28°20′、東經(jīng)115°50′—120°40′之間(圖1)。根據(jù)第八次全國(guó)森林資源清查結(jié)果顯示,福建省林業(yè)用地面積926.82萬(wàn)hm2,森林面積801.27萬(wàn)hm2,人工林面積377.69萬(wàn)hm2,森林覆蓋率65.95%,森林蓄積量60796.15萬(wàn)m3[20],是我國(guó)南方重點(diǎn)林區(qū)的省份之一。但是,也是我國(guó)森林火災(zāi)的高發(fā)區(qū)。1951—1987年,全省共發(fā)生6.2萬(wàn)次的森林火災(zāi),受害山林面積有150萬(wàn)hm2,平均每年森林火災(zāi)0.1萬(wàn)次,受害山林面積4萬(wàn)hm2,占全省年平均造林面積的25%—33.3%[21];1998—2007年間,福建省共發(fā)生森林火災(zāi)4504起,火場(chǎng)面積累計(jì)達(dá)79,572hm2,受害森林面積累計(jì)達(dá)55485.6 hm2,共損失了97萬(wàn)m3的林木蓄積量,其中2004年發(fā)生了1164次火災(zāi),1998年林火發(fā)生次數(shù)最少,為156次;僅10年就發(fā)生了40次重大火災(zāi)[22]。福建省森林火災(zāi)問(wèn)題尤為嚴(yán)峻。
1.2 數(shù)據(jù)來(lái)源與處理
1.2.1 數(shù)據(jù)來(lái)源
福建省2000—2005年的林火發(fā)生數(shù)據(jù)(包括起火時(shí)間、起火原因、起火地理坐標(biāo)等)來(lái)源于林業(yè)科學(xué)數(shù)據(jù)中心(http://www.cfsdc.org/indexAction.action?classId=1)提供的衛(wèi)星火點(diǎn)解譯數(shù)據(jù);歷史氣象數(shù)據(jù)來(lái)源于中國(guó)氣象數(shù)據(jù)共享網(wǎng)絡(luò)(http://cdc.cma.gov.cn/),為2000—2005年福建省內(nèi)22個(gè)國(guó)家級(jí)氣象站的每日氣象數(shù)據(jù),一共包22個(gè)氣象因子。由于儀器設(shè)備和氣象站點(diǎn)變化等原因,造成部分?jǐn)?shù)據(jù)缺失,且無(wú)法修補(bǔ)。因此,本研究對(duì)氣象數(shù)據(jù)進(jìn)行預(yù)處理,剔除部分缺失數(shù)據(jù),剩下的氣象因子包括日平均地表氣溫(℃),日最高地表氣溫(℃),日最低地表氣溫(℃),日平均風(fēng)速(m/s),日最大風(fēng)速(m/s),24小時(shí)降水量(mm),日平均本站氣壓(hPa),日最高本站氣壓(hPa),日最低本站氣壓(hPa),日照時(shí)數(shù)(hour),日平均氣溫(℃),日最高氣溫(℃),日最低氣溫(℃),日平均相對(duì)濕度(%),日最小相對(duì)濕度(%)共15個(gè)氣象因子。
1.2.2 數(shù)據(jù)處理
本文以2000—2005年的衛(wèi)星火點(diǎn)數(shù)據(jù)為基礎(chǔ),從中隨機(jī)選取60%的訓(xùn)練樣本(5210個(gè)林火數(shù)據(jù))來(lái)構(gòu)建模型,剩下40%的測(cè)試樣本(3473個(gè)林火數(shù)據(jù))用來(lái)檢驗(yàn)?zāi)P?。同時(shí),為了避免樣本分布對(duì)試驗(yàn)結(jié)果的影響,本文重復(fù)5次試驗(yàn),即重復(fù)5次訓(xùn)練樣本和測(cè)試樣本的隨機(jī)劃分,選擇5次試驗(yàn)中出現(xiàn)3次或以上的顯著變量進(jìn)入全樣本數(shù)據(jù)擬合。
本文分別應(yīng)用SPSS 19.0和GWR4軟件對(duì)邏輯斯蒂回歸模型和地理加權(quán)邏輯斯蒂回歸模型進(jìn)行擬合,并應(yīng)用Rookcase軟件對(duì)模型殘差進(jìn)行空間自相關(guān)分析。
1.3 研究方法
1.3.1 二項(xiàng)邏輯斯蒂回歸模型
(1)多重共線性(Multicollinearity)是指在線性回歸模型中,自變量之間存在精確的相關(guān)關(guān)系或者高度相關(guān)關(guān)系的現(xiàn)象。
本文運(yùn)用方差膨脹因子(the variance inflation factor,VIF)診斷法對(duì)林火發(fā)生的驅(qū)動(dòng)因子進(jìn)行共線性檢驗(yàn)。方差膨脹因子最早是由Marquardt于1960年引入的,第i個(gè)變量的方差膨脹系數(shù)的表達(dá)式為
(3)
(2)邏輯斯蒂回歸模型屬于廣義線性回歸模型,對(duì)于只有兩種分類(lèi)結(jié)果的分類(lèi)因變量,可以應(yīng)用二元邏輯斯蒂回歸模型進(jìn)行建模分析,其預(yù)測(cè)值為在[0,1]之間的預(yù)測(cè)概率。邏輯斯蒂模型是目前國(guó)內(nèi)外應(yīng)用最廣的用于預(yù)測(cè)林火發(fā)生概率的模型。設(shè)有林火發(fā)生(Y=1)的概率為P,則無(wú)林火發(fā)生(Y=0)的概率為(1-P),則有林火發(fā)生的概率
(1)
式中,z為解釋變量x1,x2,...,xn的線性函數(shù),
z=α0+α1x1+α2x2+...+αnxn
(2)
式中,α0,α1,α2,...,αn為各個(gè)解釋變量的回歸系數(shù)。
對(duì)P進(jìn)行Logit變換,即將P變換為ln[P/(1-P)],則有
(3)
最后,運(yùn)用極大似然估計(jì)法可求得模型的參數(shù)估計(jì)系數(shù)α0,α1,α2,...,αn[23- 25]。
1.3.2 地理加權(quán)邏輯斯蒂回歸模型
由于地理位置的不同而引起變量之間的關(guān)系或者結(jié)構(gòu)發(fā)生變化的現(xiàn)象稱(chēng)為空間非平穩(wěn)性(spatialnonstationarity)。地理加權(quán)邏輯斯蒂回歸模型是傳統(tǒng)邏輯斯蒂回歸模型的擴(kuò)展,考慮了空間位置因素,利用加權(quán)最小二乘法對(duì)每一個(gè)坐標(biāo)點(diǎn)進(jìn)行參數(shù)估計(jì),對(duì)參數(shù)的估計(jì)是局部而非全局的,每一個(gè)位置均有相應(yīng)的參數(shù)估計(jì)系數(shù)[26-27]。地理加權(quán)邏輯斯蒂回歸模型(GWLR)的表達(dá)式為:與邏輯斯蒂模型相同,位置i有林火發(fā)生(Y=1)的概率為P,則無(wú)林火發(fā)生(Y=0)的概率為(1-P),則位置i有林火發(fā)生概率
式中,z=α0(ui,vi)+α1(ui,vi)xi1+α2(ui,vi)xi2+...+αn(ui,vi)xin。
經(jīng)Logit變換,有
最后,運(yùn)用加權(quán)最小二乘法可求得位置i的局部回歸模型的參數(shù)估計(jì)系數(shù),即
1.3.3 模型預(yù)測(cè)準(zhǔn)確率計(jì)算
本文根據(jù)ROC曲線分析法所計(jì)算出來(lái)的敏感性值和特異性值,可求得約登指數(shù),即約登指數(shù)=敏感性值+特異性值-1,進(jìn)而計(jì)算出福建省林火發(fā)生的最佳臨界值(cut-off值),如果林火發(fā)生的預(yù)測(cè)概率大于該臨界值則認(rèn)為有林火發(fā)生,小于該臨界值則認(rèn)為無(wú)林火發(fā)生,從而根據(jù)模型所計(jì)算出來(lái)的林火發(fā)生次數(shù)與實(shí)際值進(jìn)行比較,進(jìn)而計(jì)算出LR模型和GWLR模型模型對(duì)林火發(fā)生與否的正確判別率。
1.3.4 模型空間自相關(guān)檢驗(yàn)Moran′sI
本文應(yīng)用全局Moran′sI指數(shù)計(jì)算殘差(殘差=觀測(cè)值-預(yù)測(cè)值)的空間自相關(guān)來(lái)對(duì)模型進(jìn)行評(píng)價(jià),全局Moran′sI指數(shù)的值越小,說(shuō)明殘差的空間依賴程度越低,模型考慮了更多的空間結(jié)構(gòu)問(wèn)題,模型的效果越好。
全局Moran′sI指數(shù)的計(jì)算公式為:
2.1 模型擬合結(jié)果與分析
2.1.1 多重共線性診斷結(jié)果
多重共線性診斷結(jié)果顯示,變量“日平均地表氣溫”、“日平均本站氣壓”、“日最低本站氣壓”、“日平均氣溫”、“日最低氣溫”等5個(gè)變量均存在共線性關(guān)系,將這5個(gè)變量剔除之后,用剩下的10個(gè)自變量構(gòu)建LR模型和GWLR模型。
2.1.2 LR模型擬合結(jié)果
本文應(yīng)用LR模型和“wald向前”原則對(duì)5個(gè)訓(xùn)練樣本進(jìn)行擬合計(jì)算,得到5個(gè)不同的特征變量子集,然后在5個(gè)特征變量子集中選擇出現(xiàn)3次或3次以上的特征變量進(jìn)入全樣本數(shù)據(jù)的擬合計(jì)算(表1)。
表1 LR模型特征變量選擇結(jié)果
+表示變量在模型里面;-表示變量不在模型里面
由表1可知,“日最高地表氣溫”、“日最低地表氣溫”、“日平均風(fēng)速”、“日降水量”、“日最高本站氣壓”、“日照時(shí)數(shù)”、“日最高氣溫”和“日最小相對(duì)濕度”等8個(gè)變量進(jìn)入了全樣本數(shù)據(jù)的擬合階段,且除了“日最高本站氣壓”和“日最小相對(duì)濕度”在5個(gè)中間模型特征變量選擇結(jié)果中出現(xiàn)4次以外,其他6個(gè)變量均出現(xiàn)了5次。表2為8個(gè)顯著變量的全樣本數(shù)據(jù)擬合結(jié)果,結(jié)果顯示各變量與林火發(fā)生具有顯著相關(guān)性。其中“日最高地表氣溫”、“日平均風(fēng)速”、“日最高本站氣壓”、“日照時(shí)數(shù)”和“日最高氣溫”等5個(gè)氣象因子與森林火災(zāi)呈正相關(guān)關(guān)系,“日最低地表氣溫”、“日降水量”和“日最小相對(duì)濕度”3個(gè)氣象因子與森林火災(zāi)呈負(fù)相關(guān)關(guān)系,且這8個(gè)氣象因子對(duì)林火發(fā)生均有顯著的影響。
表2 全樣本數(shù)據(jù)的LR模型參數(shù)擬合結(jié)果
2.1.3 GWLR模型擬合結(jié)果
首先假設(shè)模型的數(shù)據(jù)結(jié)構(gòu)是空間非平穩(wěn)的,對(duì)5個(gè)訓(xùn)練樣本進(jìn)行模型擬合,然后對(duì)因變量與解釋變量之間的關(guān)系的空間非平穩(wěn)性進(jìn)行檢驗(yàn)。如果“某解釋變量的估計(jì)系數(shù)的四分位數(shù)范圍大于LR模型中該解釋變量的估計(jì)系數(shù)的±1標(biāo)準(zhǔn)差范圍”[13,29],則認(rèn)為該解釋變量是顯著空間非平穩(wěn)變量(以樣本1為例,LR模型和GWLR模型系數(shù)估計(jì)結(jié)果見(jiàn)附表1)。最后在5個(gè)訓(xùn)練樣本中選擇出現(xiàn)3次或3次以上的非平穩(wěn)變量進(jìn)入全樣本數(shù)據(jù)的擬合階段,并作為全樣本數(shù)據(jù)模型的非平穩(wěn)項(xiàng),而其他平穩(wěn)變量則作為全樣本數(shù)據(jù)模型的平穩(wěn)項(xiàng)。檢驗(yàn)結(jié)果顯示除了“日最低相對(duì)濕度”在5個(gè)中間模型中有1次被檢驗(yàn)為空間平穩(wěn)變量之外,其他9個(gè)氣象因子在5個(gè)中間模型中均被檢驗(yàn)為空間非平穩(wěn)變量(附表2)。全樣本數(shù)據(jù)的GWLR模型參數(shù)擬合結(jié)果如表3所示。
表3 全樣本數(shù)據(jù)的GWLR模型參數(shù)估計(jì)
注:系數(shù)的最大和最小值若符號(hào)相同表示該變量在整個(gè)研究區(qū)域上與林火的相關(guān)性一致,反之表示變量在整個(gè)區(qū)域上與林火的相關(guān)性具有正負(fù)差異
表3顯示,除“日最低地表氣溫”在整個(gè)研究區(qū)域上均與林火發(fā)生呈負(fù)相關(guān)關(guān)系之外,其他9個(gè)氣象因子在整個(gè)研究區(qū)域上均在正相關(guān)和負(fù)相關(guān)之間變化。為更好體現(xiàn)GWLR模型各變量系數(shù)的局部變化,本文運(yùn)用ArcGIS 10.2對(duì)各變量模型估計(jì)系數(shù)進(jìn)行空間插值(圖2)。圖2表明GWLR模型的估計(jì)系數(shù)隨空間位置變化而變化,具有明顯的空間異質(zhì)性。
圖2 變量系數(shù)分布圖Fig.2 Variable coefficient distribution
此外,對(duì)各變量估計(jì)系數(shù)的t檢驗(yàn)值進(jìn)行空間插值,若估計(jì)系數(shù)t檢驗(yàn)值的絕對(duì)值小于1.96,則表示估計(jì)系數(shù)在研究區(qū)域上不顯示,若t檢驗(yàn)值小于-1.96或大于1.96,說(shuō)明估計(jì)系數(shù)顯著。圖3表明模型變量的估計(jì)系數(shù)的顯著性也具有很強(qiáng)的空間異質(zhì)性。
圖2,圖3綜合顯示“日最低地表氣溫”在整個(gè)研究區(qū)域上均與林火發(fā)生呈負(fù)相關(guān)關(guān)系,且該因子的估計(jì)系數(shù)在整個(gè)研究區(qū)域上均顯著;“24小時(shí)降水量”與林火發(fā)生呈顯著負(fù)相關(guān)系數(shù);“日照時(shí)數(shù)”和“日最高氣溫”與林火發(fā)生呈顯著正相關(guān)關(guān)系;“日最高本站氣壓”與林火發(fā)生存在正負(fù)兩種相關(guān)性,但以正相關(guān)為主,主要分布在福建北部和南部地區(qū);“日平均相對(duì)濕度”在南平市北部地區(qū)和龍巖市大部分地區(qū)與林火呈顯著的負(fù)相關(guān)關(guān)系,僅在三明與南平市交界處存在小塊正相關(guān)區(qū)域;“日最小相對(duì)濕度”在龍巖市西南地區(qū)存在顯著正相關(guān)系數(shù),在三明市和永安市交界處及廈門(mén)市和漳州市的小部分沿海地區(qū)存在顯著的負(fù)相關(guān)系數(shù);“日平均風(fēng)速”在福建省西部和中部地區(qū)與林火發(fā)生呈顯著正相關(guān),而“日最大風(fēng)速”在西部和中部地區(qū)與林火發(fā)生則呈顯著負(fù)相關(guān)。
2.2 模型評(píng)價(jià)
本文將全樣本分成60%的訓(xùn)練樣本(用于建模)和40%的測(cè)試樣本(模型檢驗(yàn))。應(yīng)用最小信息準(zhǔn)則(AIC)、殘差平方和(SSE)和ROC曲線(ROC)下的面積AUC值(AUC)等統(tǒng)計(jì)量和模型的預(yù)測(cè)準(zhǔn)確率對(duì)LR和GWLR模型進(jìn)行對(duì)比評(píng)價(jià)。
模型擬合統(tǒng)計(jì)結(jié)果表明,對(duì)比傳統(tǒng)邏輯斯蒂回歸模型,地理加權(quán)邏輯斯蒂回歸模型具有更小的AIC和SSE值,和更大的AUC值以及更高的模型預(yù)測(cè)準(zhǔn)確率(表4)。表4顯示,LR模型的預(yù)測(cè)準(zhǔn)確率為74.2%—76.2%小于GWLR模型(77.1%—78.6%)。
圖3 變量系數(shù)顯著性分布圖Fig.3 Significant distribution of variable coefficient正顯著相關(guān)性用暖色調(diào)表示,負(fù)顯著相關(guān)性用冷色調(diào)表示
樣本Sample模型Model赤池信息準(zhǔn)則Akaikeinformationcriterion(AIC)殘差平方和SumofSquaresforError(SSE)ROC曲線下的面積AreaunderCurve(AUC)臨界值Cut-off預(yù)測(cè)正確率Predictionaccuracy/%訓(xùn)練樣本(60%)Trainingdata(60%)測(cè)試樣本(40%)Validation(40%)樣本1LR5256.368872.6790.8220.50103075.574.7Sample1GWLR4999.887785.6560.8570.52458778.676.8樣本2LR5307.347883.8820.8220.50108075.275.2Sample2GWLR5054.525795.8510.8550.46660878.576.9樣本3LR5304.786883.6940.8190.47923075.175.9Sample3GWLR5116.377822.7630.8430.51395377.677.3樣本4LR5342.380891.8130.8150.50312574.975.5Sample4GWLR5072.533800.3210.8530.54029177.877.1樣本5LR5401.440905.1020.8100.50197574.276.2Sample5GWLR5172.060820.5540.8450.52282777.679.0全樣本LR8792.5251464.8120.8210.50231075.1CompletesampleGWLR8323.4961328.2740.8530.50520578.4
2.3 殘差分析
根據(jù)兩個(gè)模型對(duì)5樣本和全樣本數(shù)據(jù)的擬合結(jié)果,分別繪制模型的殘差圖(圖4)。圖4表明GWLR模型具有更小的殘差。
圖4 模型殘差箱形圖Fig.4 Box figure the model residuals
全樣本模型的殘差空間自相關(guān)(圖5)結(jié)果顯示GWLR模型的Moran′s I值比LR模型小,說(shuō)明與LR模型相比,GWLR模型在福建省林火發(fā)生與否的判別問(wèn)題中考慮了更多的空間自相關(guān)問(wèn)題,GWLR模型對(duì)福建省林火發(fā)生的擬合效果較好。
圖5 全樣本模型的殘差空間自相關(guān)Fig.5 Final sample of residual spatial autocorrelation
氣候條件的變化對(duì)森林火災(zāi)的發(fā)生具有重要的影響,因此,本文基于氣象因子應(yīng)用傳統(tǒng)的邏輯斯蒂回歸模型和地理加權(quán)邏輯斯蒂回歸模型對(duì)福建省2000—2005年的林火數(shù)據(jù)進(jìn)行分析,對(duì)兩種模型的預(yù)測(cè)能力以及對(duì)模型在森林火災(zāi)應(yīng)用方面的適用性進(jìn)行分析。模型變量選擇結(jié)果顯示,“日最高地表氣溫”、“日最低地表氣溫”、“日平均風(fēng)速”、“24小時(shí)降水量”、“日最高本站氣壓”、“日照時(shí)數(shù)”、“日最高氣溫”和“日最低相對(duì)濕度”等8個(gè)變量均是LR模型和GWLR模型的全樣本特征變量,說(shuō)明這8個(gè)氣象因子是福建省森林火災(zāi)的主要影響因子。氣溫的變化會(huì)使可燃物的濕度發(fā)生變化,改變火災(zāi)的氣候條件,從而對(duì)森林火災(zāi)產(chǎn)生影響。我們的研究結(jié)果顯示,“氣溫”對(duì)森林火災(zāi)的發(fā)生具有重要的影響,這與Liu[32]和Hu和Zhou[33]的研究結(jié)果一致;相對(duì)濕度是反應(yīng)林內(nèi)可燃物含水量的一個(gè)重要指標(biāo),對(duì)林火發(fā)生有重要影響。我們的研究結(jié)果表明“相對(duì)濕度”對(duì)林火發(fā)生有重要的影響,與Zhang[24]的研究結(jié)果一致。通常一個(gè)地區(qū)重特大火災(zāi)的發(fā)生,與最大風(fēng)速是相關(guān),但是,本文在對(duì)氣象因子進(jìn)行分析時(shí),邏輯斯蒂回歸模型卻將“日最大風(fēng)速”剔除,而地理加權(quán)邏輯斯蒂回歸模型回歸模型則顯示“日最大風(fēng)速”是一個(gè)空間非平穩(wěn)變量,因此,模型變量的選擇是否理想與模型的選擇相關(guān)。此外,本研究并沒(méi)有考慮地形、植被類(lèi)型、人為活動(dòng)等條件對(duì)森林火災(zāi)的影響,因此可能會(huì)對(duì)研究結(jié)果產(chǎn)生偏差。
傳統(tǒng)的邏輯斯蒂回歸模型假設(shè)空間變量都是平穩(wěn)變量,忽略了模型變量的空間異質(zhì)性,模型的擬合結(jié)果無(wú)法全面反映變量的空間關(guān)系,而本文的研究結(jié)果顯示,影響福建省林火發(fā)生的氣象因子具有明顯的空間異質(zhì)性,且模型評(píng)價(jià)結(jié)果顯示與傳統(tǒng)的邏輯斯蒂回歸模型相比,地理加權(quán)邏輯斯蒂回歸模型的擬合效果較好,這與Saefuddin[31]、Koutsias[12]、Wu和Zhang[28]等前人的研究結(jié)果一致,表明在對(duì)具有空間結(jié)構(gòu)的數(shù)據(jù)進(jìn)行擬合分析時(shí),應(yīng)考慮空間地理位置變化對(duì)因變量結(jié)果的影響。
本文應(yīng)用邏輯斯蒂回歸模型和地理加權(quán)邏輯斯蒂回歸模型對(duì)福建省森林火災(zāi)空間格局和氣象影響因子進(jìn)行分析,并對(duì)兩種模型的擬合效果進(jìn)行研究,結(jié)果表明:(1)“日最高地表氣溫”、“日最低地表氣溫”、“日平均風(fēng)速”、“24小時(shí)降水量”、“日最高本站氣壓”、“日照時(shí)數(shù)”、“日最高氣溫”和“日最低相對(duì)濕度”等8個(gè)變量是3個(gè)模型的共同變量,是影響福建省林火發(fā)生的主要?dú)庀笠蜃樱?2)在福建省林火發(fā)生的分類(lèi)判別中,與傳統(tǒng)的邏輯斯蒂回歸模型相比,地理加權(quán)邏輯斯蒂回歸模型的擬合效果更好,更適合福建省森林火災(zāi)的數(shù)據(jù)結(jié)構(gòu)。
[1] Grogan P, Burns T D, Chapin F S. Fire effects on ecosystem nitrogen cycling in a Californian bishop pine forest. Oecologia, 2000, 122(4): 537- 544.
[2] Liu H P, Rerson J T, Lindfors J, Chapin F S. Changes in the surface energy budget after fire in boreal ecosystems of interior Alaska: An annual perspective. Journal of Geophysical Research Atmospheres, 2005, 110(D13): D13101.
[3] Chas-Amil M L, Touza J, Prestemon P. Spatial distribution of human-caused forest fires in Galicia (NW Spain). Ecology and the Environment, 2010, 137: 247- 258.
[4] Bisquert M, Caselles E, Sánchez J M, Caselles. Application of artificial neural networks and logistic regression to the prediction of forest fire danger in Galicia using MODIS data. International Journal of Wildland Fire, 2012, 21(8): 1025- 1029.
[5] Parisien M A, Snetsinger S, Greenberg J A, Nelson C R, Schoennagel T, Dobrowski S Z, Moritz M A. Spatial variability in wildfire probability across the western United States. International Journal of Wildland Fire, 2012, 21(4): 313- 327.
[6] Renard Q, Pélissier R, Ramesh B R, Kodandapani N. Environmental susceptibility model for predicting forest fire occurrence in the Western Ghats of India. International Journal of Wildland Fire, 2012, 21(4): 368- 379.
[7] Lozano F J, Suárez-Seoane S, Kelly M, Luis E. A multi-scale approach for modeling fire occurrence probability using satellite data and classification trees: A case study in a mountainous Mediterranean region. Remote Sensing of Environment, 2008, 112(3): 708- 719.
[8] 郭福濤, 蘇漳文, 馬祥慶, 宋禹輝, 孫龍, 胡海清, 楊婷婷. 大興安嶺塔河地區(qū)雷擊火發(fā)生驅(qū)動(dòng)因子綜合分析. 生態(tài)學(xué)報(bào), 2015, 35(19): 6439- 6448.
[9] 郭福濤, 胡海清, 金森, 馬志海, 張揚(yáng). 基于負(fù)二項(xiàng)和零膨脹負(fù)二項(xiàng)回歸模型的大興安嶺地區(qū)雷擊火與氣象因素的關(guān)系. 植物生態(tài)學(xué)報(bào), 2010, 34(5): 571- 577.
[10] 秦凱倫, 郭福濤, 邸雪穎, 孫龍, 宋禹輝, 吳瑤, 潘建峰. 大興安嶺塔河地區(qū)林火發(fā)生的優(yōu)勢(shì)預(yù)測(cè)模型選擇. 應(yīng)用生態(tài)學(xué)報(bào), 2014, 25(3): 731- 737.
[11] 郭福濤, 胡海清, 馬志海, 張揚(yáng). 不同模型對(duì)擬合大興安嶺林火發(fā)生與氣象因素關(guān)系的適用性. 應(yīng)用生態(tài)學(xué)報(bào), 2010, 21(1): 159- 164.
[12] Koutsias N, Martínez J, Chuvieco E, Allig?wer B. Modeling wildland fire occurrence in southern europe by a geographically weighted regression approach // Proceedings of the 5th International Workshop on Remote Sensing and GIS Applications to Forest Fire Management: Fire Effects Assessment. Spain: Universidad de Zaragoza, 2005: 57- 60.
[13] Martínez-Fernández J, Chuvieco E, Koutsias N. Modelling long-term fire occurrence factors in Spain by accounting for local variations with geographically weighted regression. Natural Hazards and Earth System Sciences, 2013, 13(2): 311- 327.
[14] Rodrigues M, De La Riva J, Fotheringham S. Modeling the spatial variation of the explanatory factors of human-caused wildfires in Spain using geographically weighted logistic regression. Applied Geography, 2014, 48: 52- 63.
[15] Wang Q, Ni J, Tenhunen J. Application of a geographically-weighted regression analysis to estimate net primary production of Chinese forest ecosystems. Global Ecology and Biogeography, 2005, 14(4): 379- 393.
[16] Tu J. Spatially varying relationships between land use and water quality across an urbanization gradient explored by geographically weighted regression. Applied Geography, 2011, 31(1): 376- 392.
[17] Propastin P. Modifying geographically weighted regression for estimating aboveground biomass in tropical rainforests by multispectral remote sensing data. International Journal of Applied Earth Observation and Geoinformation, 2012, 18: 82- 90.
[18] Freedman R, Roy S S. Spatial patterning ofMantabirostrisin United States east coast offshore habitat. Applied Geography, 2012, 32(2): 652- 659.
[19] Aguilar G D, Farnworth M J. Stray cats in Auckland, New Zealand: discovering geographic information for exploratory spatial analysis. Applied Geography, 2012, 34: 230- 238.
[20] 國(guó)家林業(yè)局. 第八次全國(guó)森林資源清查結(jié)果. 林業(yè)資源管理, 2014, (1): 1- 2.
[21] 李兆明, 高兆蔚. 福建森林火險(xiǎn)天氣等級(jí)預(yù)測(cè)預(yù)報(bào)方法. 福建林學(xué)院學(xué)報(bào), 1989, 9(2): 172- 176.
[22] 朱學(xué)平, 何東進(jìn), 丁福立, 洪偉, 游巍斌, 紀(jì)志榮. 基于突變級(jí)數(shù)法的福建省森林火災(zāi)評(píng)價(jià)分析. 福建林學(xué)院學(xué)報(bào), 2011, 31(4): 295- 299.
[23] Garcia C V, Woodard P M, Titus S J, Adamowicz W L, Lee B S. A logit model for predicting the daily occurrence of human caused forest-fires. International Journal of Wildland Fire, 1995, 5(2): 101- 111.
[24] Zhang Z X, Zhang H Y, Zhou D W. Using GIS spatial analysis and logistic regression to predict the probabilities of human-caused grassland fires. Journal of Arid Environments, 2010, 74(3): 386- 393.
[25] del Hoyo L V, Isabel M P M, Vega F J M. Logistic regression models for human-caused wildfire risk estimation: analysing the effect of the spatial accuracy in fire occurrence data. European Journal of Forest Research, 2011, 130(6): 983- 996.
[26] 郭含茹, 張茂震, 徐麗華, 袁振花, 陳田閣. 基于地理加權(quán)回歸的區(qū)域森林碳儲(chǔ)量估計(jì). 浙江農(nóng)林大學(xué)學(xué)報(bào), 2015, 32(4): 497- 508.
[27] 肖燕婷, 田錚, 魏岳嵩. 時(shí)空地理加權(quán)回歸模型的時(shí)空非平穩(wěn)性檢驗(yàn). 系統(tǒng)工程理論與實(shí)踐, 2013, 33(6): 1537- 1542.
[28] Wu W, Zhang L J. Comparison of spatial and non-spatial logistic regression models for modeling the occurrence of cloud cover in northeastern Puerto Rico. Applied Geography, 2013, 37: 52- 62.
[29] Zhang H J, Qi P C, Guo G M. Improvement of fire danger modelling with geographically weighted logistic model. International Journal of Wildland Fire, 2014, 23(8): 1130- 1146.
[30] Rodrigues M, De La Riva J. An insight into machine-learning algorithms to model human-caused wildfire occurrence. Environmental Modelling & Software, 2014, 57: 192- 201.
[31] Saefuddin A, Setiabudi N A, Fitrianto A. On comparison between logistic regression and geographically weighted logistic regression: with application to Indonesian poverty data. World Applied Sciences Journal, 2012, 19(2): 205- 210.
[32] Liu Z H, Yang J, Chang Y, Weisberg P J, He H S. Spatial patterns and drivers of fire occurrence and its future trend under climate change in a boreal forest of Northeast China. Global Change Biology, 2012, 18(6): 2041- 2056.
[33] Hu T Y, Zhou G S. Drivers of lightning-and human-caused fire regimes in the Great Xing′an Mountains. Forest Ecology and Management, 2014, 329: 49- 58.
附表:
Comparing the application of logistic and geographically weighted logistic regression models for Fujian forest fire forecasting
LIANG Huiling1,2,3, WANG Wenhui2, GUO Futao2, LIN Fangfang1, LIN Yurui1,*
1CollegeofComputerandInformationScience,FujianAgricultureandForestryUniversity,Fuzhou350002,China2CollegeofForestry,FujianAgricultureandForestryUniversity,Fuzhou350002,China3ZhangzhouInstituteOfScience&Engineering,Zhangzhou363000,China
Forest fire forecasting is a key component of effective and science-based forest management and has been comprehensively addressed in the scientific literature. The logistic regression (LR) technique has been used in forest fire prediction models. However, some scholars have recently reported that the technique does not adequately consider the spatial correlation and heterogeneity of fire impact factors, which results in poorly fitting models. In contrast, geographically weighted logistic regression (GWR) models consider the spatial correlation of model variables, which improves the model′s goodness of fit. In order to explore the applicability of the GWLR model in Fujian forest fire forecasting, the present study used both the LR and GWLR methods to establish forecast model for forest fires and meteorological factors in Fujian Province, and the model fitting ability of two models were compared. Based on the forest fire and meteorological data for Fujian from 2000 to 2005, the original dataset was randomly divided into training (60%) and validation (40%) samples, with five replications and five sample groups, and predictors that were significant (ɑ=0.05) for at least three of the five sample groups were included in the final models. The goodness of fit, residual error, spatial autocorrelation, and prediction accuracy of the GWLR model were all better than those of the LR model, and the GWLR comprehensively explained the spatial heterogeneity of model variables and helped to improve the prediction accuracy of the model. The study also verified the suitability of the GWLR model on the forest fire forecasting in Fujian area. In addition, the results also indicated that the occurrence of Fujian forest fires is significantly affected by eight parameters, including minimum and maximum surface temperature, daily average wind speed, daily precipitation, highest station pressure, hours of sunshine, daily maximum temperature, and daily minimum relative humidity. Therefore, the GWLR model may provide a new technique for the prediction of forest fires in Fujian Province.
forest fire forecast; spatial heterogeneity; logistic regression; geographically weighted logistic regression(GWLR)
附表1 LR模型和GWLR模型的系數(shù)估計(jì)(樣本1)
附表2 GWLR模型空間(非)平穩(wěn)變量檢驗(yàn)結(jié)果
+表示該變量是空間非平穩(wěn)變量;-表示該變量是空間平穩(wěn)變量
國(guó)家自然科學(xué)基金(31400552);福建省自然科學(xué)基金(2015J05049);福建省教育廳資助省屬高校專(zhuān)項(xiàng)(JK2014012)
2016- 05- 01;
2017- 01- 16
10.5846/stxb201605010828
*通訊作者Corresponding author.E-mail: yrlin@fafu.edu.cn
梁慧玲,王文輝,郭福濤,林芳芳,林玉蕊.比較邏輯斯蒂與地理加權(quán)邏輯斯蒂回歸模型在福建林火發(fā)生的適用性.生態(tài)學(xué)報(bào),2017,37(12):4128- 4141.
Liang H L, Wang W H,Guo F T, Lin F F, Lin Y R.Comparing the application of logistic and geographically weighted logistic regression models for Fujian forest fire forecasting.Acta Ecologica Sinica,2017,37(12):4128- 4141.