劉 暢, 張 紅, 張霄羽, 楊國(guó)婷, 劉 勇,3
(1.山西大學(xué)黃土高原研究所,山西太原030006; 2.山西大學(xué)環(huán)境與資源學(xué)院,山西太原030006;3.山西省黃河實(shí)驗(yàn)室,山西太原030006)
日益加快的城市化導(dǎo)致土地覆蓋和土地利用變化(Land Use and Land Cover Change,LUCC)波動(dòng)明顯[1],土地覆蓋和土地利用的變化會(huì)造成當(dāng)?shù)厣鷳B(tài)環(huán)境的破壞,進(jìn)而使整個(gè)區(qū)域的生態(tài)系統(tǒng)逐漸不平衡[2]。目前,對(duì)于土地利用變化的研究逐步從現(xiàn)象描述走向機(jī)制解析,從定性分析走向定量模擬,土地利用變化模型可以分析土地利用變化的成因、探索土地利用格局演變以及預(yù)測(cè)未來土地利用的需求和分布[3]。因此,對(duì)土地利用變化動(dòng)力學(xué)機(jī)制以及提高土地利用變化預(yù)測(cè)能力的研究成為目前研究的焦點(diǎn)。土地利用變化模型主要包括基于經(jīng)驗(yàn)統(tǒng)計(jì)原理的模型如多元回歸模型、地理加權(quán)回歸、CLUE-S 模型等[4-5],基于元胞自動(dòng)機(jī)(Cellular Automata,CA)原理的模型如SLEUTH 模型、GEOMOD 模型等[6],基于機(jī)器學(xué)習(xí)原理的模型如神經(jīng)網(wǎng)絡(luò)模型、遺傳算法模型等[7],基于多智能體的模型如多智能體系統(tǒng)(Multi-Agent System,MAS)模型[8]等。經(jīng)驗(yàn)統(tǒng)計(jì)和機(jī)器學(xué)習(xí)模型可以很好的結(jié)合遙感數(shù)據(jù),根據(jù)歷史土地利用變化,建立土地變化與時(shí)空要素之間的關(guān)系,但由于假設(shè)驅(qū)動(dòng)力不變,所以不合適長(zhǎng)時(shí)間段的預(yù)測(cè),并且會(huì)出現(xiàn)擬合過度問題[9]?;贑A 原理的模型采用離散的空間單元進(jìn)行模擬[10],可以更好的處理空間性信息,適用于復(fù)雜地理空間格局的模擬和預(yù)測(cè)[11]。
以往CA 研究多是以邏輯回歸為轉(zhuǎn)換規(guī)則進(jìn)行,邏輯回歸的優(yōu)勢(shì)在于運(yùn)算方便可以輸出權(quán)重便于理解,但精度不夠高[12];之后,楊青生等[13]學(xué)者提出以人工智能和機(jī)器算法為轉(zhuǎn)換規(guī)則,精度提高了但無法輸出權(quán)重。隨著研究者和決策者對(duì)土地利用分類、未來格局模擬預(yù)測(cè)、適宜性概率獲取的精度產(chǎn)生了更高的追求,隨機(jī)森林模型結(jié)合自身可以平衡誤差、復(fù)雜度適中、分析驅(qū)動(dòng)因子權(quán)重等優(yōu)點(diǎn)被廣泛應(yīng)用于土地利用研究之中。例如,張大川等[14]借助隨機(jī)森林模型的優(yōu)勢(shì)與CA模型結(jié)合模擬東莞市土地利用變化,分析不同土地利用類型分布的各因子影響重要程度。馬惠娟等[15]在青海省湟水流域復(fù)雜地形區(qū)采用隨機(jī)森林分類方法對(duì)土地利用類型進(jìn)行了分類研究。陳凱[16]等利用隨機(jī)森林方法的優(yōu)勢(shì)結(jié)合元胞自動(dòng)機(jī)模型通過對(duì)影響城市空間分析的重要性判別來研究復(fù)雜非線性的城市擴(kuò)展。
土地利用變化是一個(gè)受到自然條件以及社會(huì)經(jīng)濟(jì)因素綜合影響的地理變化過程,由于礦區(qū)的區(qū)位、地形地貌、開采方式和規(guī)模、社會(huì)經(jīng)濟(jì)水平等不同,影響礦區(qū)土地利用變化的因素也存在很大差異[17]。大同礦區(qū)位于半干旱區(qū),受自然本底條件的限制,區(qū)內(nèi)本身土地承載力小,煤炭資源開發(fā)固有的時(shí)間持續(xù)性、空間擴(kuò)展性和強(qiáng)干擾性不僅會(huì)占用和破壞大量土地,還會(huì)使其脆弱的生態(tài)環(huán)境更加嚴(yán)重。如段語鳳等[18]發(fā)現(xiàn)礦區(qū)井工開采改變了干旱荒漠區(qū)植物的群落結(jié)構(gòu)和植被蓋度。史曉瓊等[19]研究高強(qiáng)度采煤造成的地下水位下降、地面沉降等生態(tài)環(huán)境問題。鄒雅婧等[20]研究發(fā)現(xiàn)黃土高原渭北礦區(qū)開采使土壤侵蝕更加嚴(yán)重。
本研究基于1985—2015 年每10 a 時(shí)間序列的遙感影像,結(jié)合礦區(qū)具體的環(huán)境特征和開采歷史,對(duì)大同礦區(qū)近30 a的時(shí)空格局、演變特征及驅(qū)動(dòng)力進(jìn)行分析,對(duì)未來2025 年土地利用格局進(jìn)行預(yù)測(cè)。為揭示受自然條件和人為影響的作用下礦區(qū)土地變化的規(guī)律,引入隨機(jī)森林的方法提高模型精度更加準(zhǔn)確預(yù)測(cè)未來土地格局演變,對(duì)于理解土地利用格局的復(fù)雜動(dòng)態(tài)演變機(jī)制有一定理論意義,同時(shí)對(duì)于探索礦區(qū)土地資源管理和優(yōu)化、實(shí)施生態(tài)調(diào)控策略具有重要實(shí)際意義。
大同礦區(qū)位于山西省大同市的西南方,地理位置為39°43′~40°10′N,112°31′~113°14′E,地形為向斜構(gòu)造的平緩丘陵,海拔高度為1031~1964 m。礦區(qū)內(nèi)有十里河以及“V”字形溝谷發(fā)育。大同礦區(qū)位于干旱半干旱區(qū)脆弱地帶,礦區(qū)內(nèi)晝夜溫差大,降水集中在夏季,全年氣候干燥,年均蒸發(fā)量遠(yuǎn)大于年均降雨量,水域面積小。礦區(qū)主要含煤層為侏羅系和石炭-二疊系,侏羅紀(jì)煤層除西南邊角已全部開發(fā)利用。石炭-二疊系采空區(qū)主要分布在東部和南部。大同礦區(qū)煤質(zhì)有害元素含量低,焦油產(chǎn)率較高,發(fā)熱量較高,是中國(guó)重要的優(yōu)質(zhì)動(dòng)力煤生產(chǎn)基地,開采方式以井工開采為主。研究區(qū)地理位置如圖1所示。
圖1 研究區(qū)示意圖Fig.1 Diagram of the study area
數(shù)據(jù)類型包括土地利用數(shù)據(jù)以及影響因子數(shù)據(jù),影響因子數(shù)據(jù)包括自然因子、社會(huì)因子以及距離因子(表1)。土地利用數(shù)據(jù)是由30 m 分辯率的Landsat系列遙感影像數(shù)據(jù)解譯獲取,并按照國(guó)家標(biāo)準(zhǔn)重分類為六類。高程數(shù)據(jù)由中國(guó)科學(xué)院資源環(huán)境科學(xué)數(shù)據(jù)中心(http://www.resdc.cn)獲取,并從中提取出坡向和坡度。氣溫和降水?dāng)?shù)據(jù)由中國(guó)氣象數(shù)據(jù)網(wǎng)(http://data.cma.cn)氣溫和降水站點(diǎn)數(shù)據(jù)進(jìn)行空間插值獲得。煤礦生產(chǎn)能力由實(shí)地調(diào)查獲得。人口數(shù)據(jù)在Ye 等[21]研究基礎(chǔ)上將精度提升到30 m。距離因子通過采用ArcGIS 10.5 中歐氏距離算法計(jì)算得出,POI數(shù)據(jù)采用網(wǎng)絡(luò)爬蟲技術(shù)獲得。
表1 數(shù)據(jù)來源Tab.1 Data source
1.3.1 FLUS 模型 FLUS 模型耦合了系統(tǒng)動(dòng)力學(xué)模型和元胞自動(dòng)機(jī)模型,并在元胞自動(dòng)機(jī)模型原有基礎(chǔ)上引入人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)構(gòu)建轉(zhuǎn)換規(guī)則,具有耦合人類活動(dòng)與自然效應(yīng)的各類土地類型之間相互競(jìng)爭(zhēng)和轉(zhuǎn)化的模擬優(yōu)勢(shì)[22]。FLUS模型包括如下兩個(gè)部分:
第一部分是通過ANN 模塊訓(xùn)練樣本數(shù)據(jù)并構(gòu)建本區(qū)域的土地利用類型空間發(fā)生概率。人工神經(jīng)網(wǎng)絡(luò)的優(yōu)勢(shì)在于能夠通過多次迭代學(xué)習(xí)和擬合輸入數(shù)據(jù)與訓(xùn)練目標(biāo)之間的復(fù)雜關(guān)系[23]。在ANN的輸入層中,神經(jīng)元與輸入變量相對(duì)應(yīng);輸出層中的神經(jīng)元代表特定地類在網(wǎng)格單元內(nèi)的發(fā)生概率,在特定單元格內(nèi)該值越高表示目標(biāo)地類的發(fā)生概率越高[24]。根據(jù)公式可得出,在k時(shí)刻第i種地類在柵格d上發(fā)生的概率:
第二部分是基于輪盤賭選擇機(jī)制的自適應(yīng)慣性競(jìng)爭(zhēng)機(jī)制融合CA 的空間運(yùn)算功能,調(diào)整宏觀土地需求與當(dāng)前現(xiàn)有土地之間的數(shù)量并達(dá)到目標(biāo)值,解決了以往模型在處理復(fù)雜地類間的相互影響[25]。公式為:
綜上可以將綜合適宜性概率計(jì)算公式表示為:
1.3.2 RF-FLUS模型 隨機(jī)森林模型是一個(gè)在數(shù)據(jù)挖掘能力、轉(zhuǎn)換規(guī)則準(zhǔn)確性及其穩(wěn)定性方面具有自身優(yōu)勢(shì)的利用多個(gè)決策樹生成的集成智能算法。只需要對(duì)給定樣本進(jìn)行訓(xùn)練,克服神經(jīng)網(wǎng)絡(luò)過度擬合的問題[26]。采用RF代替ANN在FLUS模型內(nèi)的轉(zhuǎn)換規(guī)則,構(gòu)造24棵決策樹,變量數(shù)為4,每個(gè)樣本抽取2/3 的數(shù)據(jù)作為袋內(nèi)數(shù)據(jù)用來訓(xùn)練模型,剩余1/3 的數(shù)據(jù)用作袋外數(shù)據(jù)來估算誤差并驗(yàn)證決策樹的精度,袋外數(shù)據(jù)越小精度越高。樣本和變量的選擇可以降低各決策樹之間相關(guān)性,為之后更準(zhǔn)確的對(duì)大同礦區(qū)土地利用變化進(jìn)行模擬和預(yù)測(cè)提供基礎(chǔ)。
1.3.3 平均基尼系數(shù)下降法 選用平均基尼系數(shù)下降法來計(jì)算并分析影響大同礦區(qū)土地利用格局不同因素的影響程度。平均基尼系數(shù)下降法是對(duì)每顆決策樹按照基尼的不純度(Gini Impurity)對(duì)特征進(jìn)行排序,特征的重要性直接反映了該特征參與模型計(jì)算過程中的重要性。每個(gè)特征的重要性為0~1之間的浮點(diǎn)數(shù),數(shù)值越大表明該特征對(duì)于整個(gè)模型越重要。通過遍歷全部樹節(jié)點(diǎn),計(jì)算選入的每個(gè)特征變量的基尼系數(shù)下降總和表示該變量對(duì)最終格局的影響程度[27]。
1.3.4 模型精度驗(yàn)證 模型精度驗(yàn)證采用混淆矩陣Kappa系數(shù)檢驗(yàn)[28]定量分析驗(yàn)證模型精度。混淆矩陣對(duì)角線百分比越高,代表精度越高。
由1985—2015 年大同礦區(qū)土地利用格局空間變化和面積變化圖可知(圖2,圖3),1985—1995 年礦區(qū)處于成長(zhǎng)階段,耕地面積增加了40.75 km2;草地廣泛分布于研究區(qū)內(nèi),變化率為-2.87%;林地主要分布在中部以及東部邊緣,面積增加3.37 km2,林草地?cái)?shù)量?jī)H次于耕地面積;水域主要分布在研究區(qū)西北部的十里河,呈帶狀分布水量較多,面積增加了3.53 km2;建設(shè)用地和其他類型多分布在北部地勢(shì)平坦處,面積增加了0.27%。
圖2 1985—2015年大同礦區(qū)土地利用空間分布Fig.2 Spatial distribution of land use in Datong coal mining area from 1985 to 2015
圖3 大同礦區(qū)不同時(shí)期土地類型面積變化Fig.3 Changes of land type area in Datong coal mining area in each year
1995—2005年礦區(qū)走向成熟階段,生產(chǎn)過程逐漸機(jī)械化,開采規(guī)模進(jìn)一步擴(kuò)大。耕地主要零散分布于礦區(qū)邊緣,該時(shí)期耕地面積減少約20%;隨著退耕還林還草政策的推行,草地成為礦區(qū)所占比例最大的土地利用類型,占總面積的60%;水域面積急劇下降,由1.04%減少至0.1%;建設(shè)用地減少0.67%,其他類型增加0.35%。
2005—2015年礦區(qū)處于轉(zhuǎn)型期,政府政策扶持生產(chǎn)全面改造,礦井生產(chǎn)逐漸規(guī)?;?,同時(shí)礦區(qū)城市工業(yè)化程度不斷加快,因此該期土地利用特點(diǎn)主要表現(xiàn)為建設(shè)用地面積大幅增加,由3.09%增加到7.09%。耕地、林地、草地以及水域地類由于人類活動(dòng)的影響面積都有所下降,其他類型面積略微上升,增加0.29%。
由1985—2015 年大同礦區(qū)的土地利用轉(zhuǎn)移可知(表2),1985—1995 年由于采礦活動(dòng)和人類生活的影響,土地利用轉(zhuǎn)移主要為水域大面積轉(zhuǎn)變?yōu)榱值?、草地和耕地,建設(shè)用地有6.72%轉(zhuǎn)向林地;1995—2005 年礦區(qū)開始大規(guī)模開采,毀林采礦、修筑公路實(shí)現(xiàn)晉煤外運(yùn),大量占用耕地和林地,土地利用的變化主要表現(xiàn)為各土地利用類型向草地的轉(zhuǎn)移,耕地向草地轉(zhuǎn)移高達(dá)72.58%,林地向草地發(fā)生轉(zhuǎn)移55.93%,水域、建設(shè)用地和其他用地向草地轉(zhuǎn)移均為30%以上。水域面積向耕地轉(zhuǎn)移較多,達(dá)33.39%;2005—2015年土地利用類型轉(zhuǎn)移主要表現(xiàn)為水域轉(zhuǎn)為其他類型,轉(zhuǎn)移94.35%,少量耕地和水域轉(zhuǎn)為草地。其余土地利用類型幾乎沒有發(fā)生轉(zhuǎn)移。30 a間大同礦區(qū)土地利用的變化趨勢(shì)是各土地利用類型向草地轉(zhuǎn)移,其中,林地向草地轉(zhuǎn)移最多,其次是耕地。
表2 1985—2015年大同礦區(qū)土地利用轉(zhuǎn)移概率矩陣Tab.2 Land use transfer probability matrix in Datong coal mining area from 1985 to 2015 /%
根據(jù)土地利用變量的重要性,進(jìn)一步分析大同煤礦區(qū)土地利用變化的影響因子(圖4),林草地的分布主要受到氣候、距水系和設(shè)施點(diǎn)距離影響;耕地分布受到礦區(qū)DEM、氣候、距水系、設(shè)施點(diǎn)以及居民點(diǎn)的距離等因素影響。這主要由于干旱區(qū)氣候干燥,耕地需要便利的灌溉條件,而且農(nóng)民為方便耕種將耕地分布在距離居民點(diǎn)較近的地方;水域最重要的影響因子是降水因子,降水條件直接決定水域分布范圍;建設(shè)用地很大程度上受到生產(chǎn)能力和距設(shè)施點(diǎn)距離的影響,礦區(qū)煤炭生產(chǎn)能力越高,各種廠房、排土道路、煤礦職工辦公住宿區(qū)均相應(yīng)增加。餐館、學(xué)校、醫(yī)院、休閑娛樂場(chǎng)所等設(shè)施點(diǎn)的距離也直接決定建設(shè)用地分布。其他類型分布受到距水系距離的影響,水系周圍的用地極易被改變?yōu)槠渌愋汀?/p>
圖4 2015年大同礦區(qū)土地利用類型影響因子的重要性Fig.4 The importance of different types of influencing factors in Datong coal mining area in 2015
分別采用FLUS 和RF-FLUS 模型,對(duì)大同礦區(qū)土地利用變化進(jìn)行建模,采用Kappa 系數(shù)對(duì)比精度結(jié)果。首先對(duì)2015 年大同煤礦區(qū)土地利用格局進(jìn)行擬合,結(jié)果表明,F(xiàn)LUS 模型和RF-FLUS 模型模擬得到的2015年礦區(qū)土地利用格局與2015年影像解譯得到的實(shí)際土地利用格局相比(圖5a~圖5c),擬合程度均較高。將模擬結(jié)果與實(shí)際土地利用做混淆矩陣精度驗(yàn)證(表3)。FLUS 模型Kappa 系數(shù)為0.92,OA 系數(shù)為0.95;RF-FLUS 模型Kappa 系數(shù)為0.93,OA 系數(shù)為0.96,就模擬精度而言,RF-FLUS 模型擬合效果更好,更加符合實(shí)際土地利用格局。
表3 RF-FLUS模型與FLUS模型混淆矩陣Tab.3 Confusion matrix of RF-FLUS model and FLUS model /%
圖5 2015年大同礦區(qū)土地利用格局與模型模擬結(jié)果Fig.5 Land use pattern and model simulation results in Datong coal mining area in 2015
以2015年為基準(zhǔn)年,采用RF-FLUS模型模擬礦區(qū)2025 年的土地利用空間分布結(jié)果可知(圖6)。2025 年大同煤礦區(qū)林地、草地和耕地均呈下降態(tài)勢(shì),林地、草地和耕地面積分別下降了3.01 km2、14.97 km2和12.7 km2,水域面積基本保持不變,建設(shè)用地與其他類型面積穩(wěn)態(tài)上升,建設(shè)用地由2015年的130.75 km2增 加 到2025 年 的157 km2,增 加 了26.26 km2,其他類型面積預(yù)計(jì)增加44.12 km2。
圖6 大同礦區(qū)2015年和2025年土地利用分布格局Fig.6 Distribution pattern of land use in Datong coal mining area in 2015 and 2025
本文通過研究大同礦區(qū)不同階段土地利用格局的時(shí)空變化,進(jìn)一步探討不同土地利用模型的模擬精度優(yōu)勢(shì)以及影響土地利用格局變化的主要驅(qū)動(dòng)因素,并進(jìn)行了預(yù)測(cè)分析,得到如下結(jié)論:
(1)大同礦區(qū)侏羅系煤層已基本全部開發(fā)利用,石炭-二疊系煤層開采范圍主要在北部和南部,受采礦影響,1985—2015年大同礦區(qū)土地利用格局發(fā)生劇烈轉(zhuǎn)變,主要表現(xiàn)為草地、建設(shè)用地以及其他類型增加,林地和耕地先增加后減少,以減少為主,水域面積基本被侵占。礦區(qū)土地利用變化是以資源開采為原動(dòng)力的動(dòng)態(tài)時(shí)空演變過程,采掘資源的同時(shí)造成對(duì)土地的破壞,從而改變了土地利用結(jié)構(gòu)。
(2)礦區(qū)內(nèi)不同土地利用類型的驅(qū)動(dòng)因素不同。林地、草地主要受氣候影響以及距水系和設(shè)施點(diǎn)的距離影響;耕地分布受到高程、氣候及距水系、設(shè)施點(diǎn)、居民點(diǎn)的距離等多因素綜合影響;水域最重要的驅(qū)動(dòng)因素是降水。建設(shè)用地受到生產(chǎn)能力和距設(shè)施點(diǎn)的距離的影響。其他類型主要受距水系距離的影響。礦產(chǎn)資源開發(fā)是土地利用變化的主要驅(qū)動(dòng)力,此外氣候地形等自然因素也影響著土地利用變化。
(3)RF-FLUS 模型的應(yīng)用,可以更加準(zhǔn)確的預(yù)測(cè)未來土地利用格局。相比于FLUS模型中ANN模塊出現(xiàn)過度擬合的現(xiàn)象,RF-FLUS 模型能發(fā)揮隨機(jī)森林算法精度高的優(yōu)勢(shì),提高預(yù)測(cè)未來土地利用格局變化的能力,對(duì)預(yù)測(cè)小尺度區(qū)域的土地利用格局具有重要借鑒意義。