趙 強 ,景 羅 ,趙光俊 ,劉二濤
(1.華北電力大學 控制與計算機工程學院,北京 102206;2.國電普迅電力信息技術有限公司,天津 300384)
空間負荷預測 SLF(Spatial Load Forecasting)是電網(wǎng)規(guī)劃的基礎[1]。近年來,人們提出了許多空間負荷預測模型[2-9],其中,用地仿真法是目前精度最高的一種空間負荷預測模型,它通過建立用地仿真模型模擬小區(qū)未來的發(fā)展情況,最終將負荷總量預測結(jié)果分配到各小區(qū)。然而在用元胞自動機模擬用地類型變化時,往往假設在整個元胞空間內(nèi)所有元胞都按相同的轉(zhuǎn)換規(guī)則演化,采用統(tǒng)一的轉(zhuǎn)換規(guī)則來驅(qū)動元胞自動機模型中所有元胞的演化,進而來模擬用地類型的變化,所以這種方式忽略了用地類型變化的空間異質(zhì)性,從而影響了元胞自動機模型的模擬精度,而負荷預測的準確性直接影響著電網(wǎng)系統(tǒng)投資及運行的合理性。針對該問題,本文研究了按照空間變異系數(shù)的大小對元胞空間進行不規(guī)則區(qū)域劃分的方法,分區(qū)的大小隨著變異系數(shù)的不同而變化,這樣每一個分區(qū)內(nèi)具有相對一致的元胞轉(zhuǎn)換規(guī)則,用元胞自動機模擬演化的結(jié)果也將更加準確??紤]到影響負荷預測的許多因素存在于不同的尺度[10]之中,單一的尺度可能會導致影響負荷預測精度的一些因素、甚至是重要因素的缺失。由于不同尺度的區(qū)域劃分方式會對地理信息表達的正確與否產(chǎn)生影響,很多地理現(xiàn)象和規(guī)律只有在特定的尺度下才會出現(xiàn)。因而,本文提出了多尺度區(qū)域劃分的方法,按照相鄰分區(qū)相似度對利用變異系數(shù)大小劃分得到的分區(qū)進行聚類融合,相似度閾值不同,則得到不同尺度的區(qū)域劃分,而每一尺度下各個分區(qū)都有各自獨立的元胞轉(zhuǎn)換規(guī)則,最后將每一尺度得到的結(jié)果進行疊加分析,提高了元胞自動機模型的運用有效性和時空模擬精度。
所謂空間異質(zhì)性,是指區(qū)域化變量在不同空間位置上由于空間數(shù)據(jù)受到總的條件或規(guī)律的制約而存在明顯差異的屬性。在進行空間負荷預測時,經(jīng)常需要對用地類型進行預測,然而由于受到周圍環(huán)境的影響程度不同,不同空間位置轉(zhuǎn)換為不同用地類型的概率就會有很大的區(qū)別,因此采用統(tǒng)一的元胞區(qū)間劃分方法忽略了空間位置的這種差異。
通常采用變異函數(shù)來表示兩點之間區(qū)域化變量值的相關性。當空間點在一維x軸上變化時,區(qū)域化變量在 xi和 xi+h 處的值為 Z(xi)和 Z(xi+h),兩者之差的方差的一半定義為區(qū)域化變量在x軸方向上的變異函數(shù),其中xi是x軸上某一點的取值。變異函數(shù)記為[11]:
其中,N(h)為間隔距離是h的樣點數(shù)。
元胞自動機具有模擬復雜系統(tǒng)時空演化過程的能力,它包含4個基本要素:元胞、狀態(tài)、鄰域和轉(zhuǎn)換規(guī)則,可以用形式語言表示為[2]:
其中,CA為元胞自動機;C為元胞,是研究區(qū)域的最小面積單元;S為元胞狀態(tài),本文中元胞狀態(tài)有4種,即居民生活用地、工業(yè)用地、商業(yè)用地、市政用地,某時刻t元胞狀態(tài)只可能是有限狀態(tài)中的一種;N為鄰域即元胞的鄰居,本文采用比較穩(wěn)定的Moore型鄰域,如圖1所示,圖中黑色元胞為中心元胞,灰色元胞為其鄰居;R為轉(zhuǎn)換規(guī)則,轉(zhuǎn)換規(guī)則的定義是元胞自動機的核心,傳統(tǒng)的轉(zhuǎn)換規(guī)則只考慮鄰域的影響,本文中的轉(zhuǎn)換規(guī)則綜合考慮了空間異質(zhì)性和尺度等因素的影響。
圖1 Moore型鄰域Fig.1 Moore neighborhood
簡單而言,元胞自動機可視為由一個元胞空間和定義于該空間的變換函數(shù)所組成。元胞的狀態(tài)隨著時間根據(jù)一個局部規(guī)則來進行更新變化,即一個元胞在某時刻的狀態(tài)取決于且僅取決于上一時刻該元胞的狀態(tài)以及該元胞的所有鄰居元胞的狀態(tài)。元胞空間內(nèi)的元胞依照這樣的局部規(guī)則進行同步的狀態(tài)更新,整個元胞空間則表現(xiàn)為在離散的時間維上的變化,非常容易在計算機中建模與仿真。元胞自動機采用“自下而上”的建模方法,通過元胞之間、元胞與環(huán)境之間的交互來進行時空演化,這種不同于以往純數(shù)學建模的新計算范型思想是用局部作用規(guī)則控制元胞的行為,最終使系統(tǒng)呈現(xiàn)出宏觀上的穩(wěn)定秩序。
為了下文描述的方便,本文中引入2個新概念,即變異系數(shù)與尺度,其詳細定義如下。
定義1:在空間變異函數(shù)中,假設區(qū)域化變量Z(xi)為空間實體對周邊環(huán)境的影響程度,則稱 ω(h)=為 到 的空間變異xixi+h系數(shù),并用它來表示空間變異性的大小,如果該值大則說明空間變異性程度較大,顯然ω(h)的取值范圍為[0,1]。
定義2:假設研究區(qū)域的總面積為D,劃分各元胞小區(qū)的面積分別為 D1、D2、D3、…、Dn,n 為元胞空間中元胞的總數(shù)目,令 rn=(1 /D1,1 /D2,…,1/Dn),則稱該區(qū)域劃分方式為rn尺度區(qū)域劃分。此時rn是一個數(shù)據(jù)序列,用來表示一組大小不等、非規(guī)則的小區(qū)。
顧及空間異質(zhì)性的多尺度空間負荷預測模型的建模流程見圖2,建模過程具體如下。
圖2 顧及空間異質(zhì)性的多尺度空間負荷預測模型的建模流程Fig.2 Flowchart of modeling for multi-scale spatial load forecasting considering spatial heterogeneity
首先,用于空間負荷預測的數(shù)據(jù)在地理信息系統(tǒng)中經(jīng)過數(shù)據(jù)預處理、對齊與裁剪等處理后,轉(zhuǎn)換成多尺度分析以及不規(guī)則小區(qū)劃分可以識別和處理的數(shù)據(jù)[12];其次,按照空間變異系數(shù)的大小對元胞空間進行不規(guī)則的區(qū)域劃分,這樣每一分區(qū)具有了相對一致的轉(zhuǎn)換規(guī)則,并以此不規(guī)則區(qū)域劃分為基礎,對不規(guī)則分區(qū)進一步聚類融合以得到更高尺度下的分區(qū)結(jié)果,即進行多尺度的區(qū)域劃分,在多尺度劃分的過程中,本文引入了粗糙集理論來對影響分區(qū)融合的眾多因素進行屬性約簡,從而減少了數(shù)據(jù)量使結(jié)果更加高效可靠;然后采用C5.0決策樹算法,將不同尺度下的每一分區(qū)分別構(gòu)建動態(tài)的轉(zhuǎn)換規(guī)則,并將分區(qū)結(jié)果和各分區(qū)的轉(zhuǎn)換規(guī)則輸入到元胞自動機中進行土地類型的變化模擬,將得到的模擬結(jié)果與實際區(qū)域的土地類型進行對比評估,如果模擬結(jié)果與實際類型相比達到了指定的精準度要求,就可以將模型應用于空間負荷預測,否則重新進行多尺度下對每個分區(qū)采樣從而獲取新的轉(zhuǎn)換規(guī)則,重復上述過程直到精度滿足要求;接著對歷史負荷數(shù)據(jù)進行分類負荷預測,并計算出分類負荷密度,由于現(xiàn)階段分類負荷預測模型已經(jīng)比較成熟,模擬得到的結(jié)果已具有相當高的精準度,因此本文重點研究對空間異質(zhì)性的處理,即如何在多尺度下對研究區(qū)域進行不規(guī)則劃分以及模擬結(jié)果的多尺度疊加分析;最后,將空間負荷預測的模擬結(jié)果送回到地理信息系統(tǒng)中顯示[13]。
考慮到空間的異質(zhì)性特征對區(qū)域現(xiàn)象和規(guī)律模擬的影響,同一個轉(zhuǎn)換規(guī)則不可能適用于整個元胞空間。因此本文中按照空間變異系數(shù)的大小,對元胞空間進行不規(guī)則的區(qū)域劃分,使得每一區(qū)域具有相對一致的元胞轉(zhuǎn)換規(guī)則,從而驅(qū)動元胞自動機的時空演化,該步驟也是多尺度分析的核心部分。具體操作過程如下。
a.在研究區(qū)域內(nèi)隨機選取重要地點,如重要居民小區(qū)、商業(yè)網(wǎng)點以及交匯點等,將這些重要地點都標識為未標記。其他所有地點如綠地、湖泊、高山等都作為空間中的一個點,初始時空間中的所有點都未被標記。
b.以重要地點為初始中心出發(fā)點,從空間中該中心點向周圍各個方向的其他所有點計算未標記點的空間變異系數(shù)ω(h),不斷增大h的值,如果ω(h)的值大于閾值α,則停止該中心點向該方向的空間變異系數(shù)計算,并對該點做標記處理。
c.如對已標記的同一空間點計算得到多個空間變異系數(shù)值ω(h),則取其最小值,并歸入到相應的初始中心點。
d.以重要地點為中心點,向各個方向找到最近的已標記的空間點,并將這些空間點圍成的區(qū)域作為一個單獨的分區(qū)。
e.重復上述所有步驟,直到元胞空間中所有的點都劃分到一定的分區(qū)中,此時完成單一尺度下的不規(guī)則元胞區(qū)域的劃分。
通常利用空間變異系數(shù)對元胞空間進行不規(guī)則劃分時,初始閾值α置為1。在實驗過程中,需要不斷調(diào)整閾值α,使預測結(jié)果更接近實際情況。
不同的尺度會對地理信息的正確與否產(chǎn)生影響,因為影響負荷預測的許多因素存在于不同的尺度之間,僅考慮單一的尺度可能會忽略一些重要的因素,從而影響負荷預測的準確率,而且很多地理現(xiàn)象和規(guī)律只有在特定的尺度下才會出現(xiàn)。因而選擇不同的尺度,可能會導致對空間過程及其相互作用規(guī)律不同程度的把握,最終將影響到研究成果的科學性和實用性。因此本文提出了多尺度的區(qū)域劃分方法,該方法的操作過程如下。
a.找到影響元胞分區(qū)相似度的因素。影響2個分區(qū)相似程度的因素非常多,一般包括交通通達程度、公共設施便利性、教育資源、自然環(huán)境質(zhì)量、住房價格、經(jīng)濟能力、職業(yè)、家庭結(jié)構(gòu)(有無小孩)、年齡、受教育程度、居民生活質(zhì)量、科教水平等。
b.利用粗糙集理論來對眾多的影響因素進行屬性約簡。為了找到影響元胞分區(qū)相似度的重要因素,忽略不太重要的影響因素,本文中引入了粗糙集理論來對眾多的影響因素進行屬性約簡,粗糙集約簡方法詳見文獻[13],最后得到了最重要的4種影響因素,如表1所示。
c.聚類融合得到更大尺度的區(qū)域劃分。以基于變異系數(shù)得到的不規(guī)則元胞空間劃分區(qū)域為基礎,將不規(guī)則元胞分區(qū)按照相似程度閾值β來進行聚類融合,這樣分區(qū)的數(shù)目將進一步縮小,即得到更大尺度下的空間負荷預測結(jié)果。
表1 影響分區(qū)融合的主要因素及其權重Tab.1 Main affecting factors on partition integration and corresponding weights
d.調(diào)整閾值得到多尺度下的區(qū)域劃分。當相鄰2個分區(qū)的相似度超過β(首次取β=0.8)時,將2個分區(qū)融合為1個分區(qū),最終得到該尺度下的區(qū)域劃分。依此類推,可以得到β值為0.6、0.4、0.2等多種尺度下的區(qū)域劃分,直到分區(qū)數(shù)量為1時停止。如此即可得到多尺度下的不規(guī)則分區(qū)。不規(guī)則區(qū)域的劃分結(jié)果與實際情況相符合,以此為基礎提取元胞自動機規(guī)則也將更加準確。
決策樹是按照不同的特征,以樹型結(jié)構(gòu)來表示決策集合或者分類,最終產(chǎn)生規(guī)則并發(fā)現(xiàn)規(guī)律。C5.0是經(jīng)典的決策樹模型算法之一,可生成多分支的決策樹。它的主要作用在于揭示數(shù)據(jù)中的結(jié)構(gòu)化信息,所建立的樹型結(jié)構(gòu)直觀、易于理解,而且便于處理非線性數(shù)據(jù)的描述數(shù)據(jù),能提取數(shù)據(jù)中隱藏的知識規(guī)則。因此,C5.0決策樹模型可以用于元胞自動機模型轉(zhuǎn)換規(guī)則的挖掘。本文中的目標變量即為土地類型分類變量,使用C5.0算法可以生成相應的決策樹或者規(guī)則集。首先將經(jīng)過多尺度劃分處理后的空間數(shù)據(jù)及劃分得到的不規(guī)則分區(qū)作為訓練樣本輸入到C5.0決策樹模型進行學習,對于對模型值沒有顯著貢獻的樣本子集將被剔除或者修剪,通過不斷調(diào)整模型參數(shù)最終建立起土地類型分類規(guī)則;然后依據(jù)分類規(guī)則,實現(xiàn)對其他新輸入樣本數(shù)據(jù)的分類;最后將建立好的樣本規(guī)則以及不規(guī)則的分區(qū)數(shù)據(jù),輸入到元胞自動機模型來模擬土地類型的時空演化[14]。本文中采用C5.0決策樹算法來對多尺度下不規(guī)則的分區(qū)分別提取元胞轉(zhuǎn)換規(guī)則,有了上述基于空間變異系數(shù)的不規(guī)則區(qū)域的劃分,每一分區(qū)便具有了相對一致的轉(zhuǎn)換規(guī)則,因而元胞自動機規(guī)則的提取將變得十分容易而且提高了空間演化模擬的精準度。
在不同尺度下分別對用地類型進行預測,然后將不同尺度下得到的預測結(jié)果進行疊加,示例效果如圖3所示,其中第1層為r1尺度劃分方式,第2層為r4尺度劃分方式,第3層為r16尺度劃分方式,每個尺度上的觀測數(shù)據(jù)以及不同數(shù)據(jù)之間的關系反映了土地的利用類型以及不同尺度對土地利用類型轉(zhuǎn)換的影響。目前將不同尺度的數(shù)據(jù)很好地整合到一起的方法主要有“緊”整合和“松”整合?!熬o”整合要求不同尺度的區(qū)域范圍是一致的,而“松”整合則沒有這樣的要求,因而適用于任何尺度的數(shù)據(jù)整合[15]。本文主要借鑒文獻[15]“松”整合的思想方法,通過經(jīng)緯度將不同尺度下的數(shù)據(jù)疊加來實現(xiàn)預測結(jié)果的疊加分析,如果某點轉(zhuǎn)化為某種用地的數(shù)量多于其他用地類型,則該點區(qū)域用地類型轉(zhuǎn)換為相應用地類型的可能性越大。
圖3 多尺度疊加示意圖Fig.3 Schematic diagram of multi-scale superposition
最后,根據(jù)模擬區(qū)域的每一類土地的使用情況,按照式(2)預測出每一類負荷密度:
其中,Ii表示第i種用地類型的負荷預測值,Ai表示第 i種用地類型的總面積,i=1,2,…,m,m 為用地類型總數(shù)。對于劃分的每個小區(qū),它的預測負荷值Wj等于該預測的小區(qū)土地使用面積 Lj(j=1,2,…,n,其中n為劃分小區(qū)的總數(shù))乘以該小區(qū)的預測負荷密度 Pi(i=1,2,…,m),其計算公式為:
本文針對某市的實際情況,對其電力負荷在空間上的分布做了詳細研究。本實驗的基礎數(shù)據(jù)包括該市2005年至2010年負荷歷史數(shù)據(jù),2005年、2006年和2010年該市中心城區(qū)TM遙感影像圖、交通圖、地圖,以及該市分區(qū)人口統(tǒng)計數(shù)據(jù)、土地利用總體規(guī)劃圖、行政界線圖、地形圖、DMS饋線用電負荷歷史統(tǒng)計、營銷信息系統(tǒng)用戶的報裝信息等。通常在能夠滿足配電網(wǎng)規(guī)劃的要求下把用地類型簡單地分為工業(yè)、商業(yè)、居民、市政4類,這樣就極大降低了工作量和難度。之所以要對用地類型進行劃分,是因為不同的用地類型具有不同的負荷密度曲線,會影響分類負荷密度的計算。
本文采用顧及空間異質(zhì)性的多尺度空間負荷預測模型,從研究區(qū)域選取重要地點共計366個,其中重要居民小區(qū)58個、商業(yè)網(wǎng)點236個、交匯點23個,其他重要地點49個。以這些重要地點為初始中心出發(fā)點,按照空間變異系數(shù)的公式計算各個點的空間變異性大小,將點區(qū)域劃分歸并到變異性最小的中心點,這樣每一分區(qū)便具有了相對一致的轉(zhuǎn)換規(guī)則。接著用C5.0決策樹算法分別獲取每一不規(guī)則分區(qū)的元胞轉(zhuǎn)換規(guī)則,以此驅(qū)動不同分區(qū)的元胞進行時空演化。然后根據(jù)用粗糙集理論對所選擇的眾多影響相鄰分區(qū)的因素進行屬性約簡,得到4種最重要影響因素及其權重,接著按照不同權重計算得到相鄰分區(qū)之間的相似度,并按照相似度閾值β將相鄰的分區(qū)進行融合,初始β=0.8,這樣分區(qū)的數(shù)量將變少,即得到該尺度下的分區(qū)劃分。不斷調(diào)整相似度閾值直到分區(qū)數(shù)目變?yōu)?為止,如此便得到了多尺度下的分區(qū)劃分結(jié)果。本研究區(qū)域按照相似度閾值β=1、β=0.8、β=0.6、β=0.4、β=0.2、β=0.09 以及 β=0共得到7種不同尺度的區(qū)域劃分,分別為r214、r176、r131、r87、r45、r8和 r1尺度,其中 r214表示由 214 塊不規(guī)則分區(qū)組成的尺度劃分,其他依此類推,圖4所示為r8尺度的分區(qū)結(jié)果。不同尺度下的空間負荷預測結(jié)果因為受不同尺度下各影響因素作用的不同而產(chǎn)生差異,本文根據(jù)“松”整合的思想,按照經(jīng)緯度對不同尺度下的分區(qū)結(jié)果進行分層疊加,如果不同層相同經(jīng)緯度下的某一點區(qū)域轉(zhuǎn)換為某種用地類型的數(shù)據(jù)量較多,則該點區(qū)域轉(zhuǎn)換為相應的用地類型。2010年該市實際土地利用分布情況與本文模擬預測土地分布結(jié)果如圖5、6所示,可以看出模擬結(jié)果與實際土地類型基本一致,因此可以將本文模型進一步應用于空間負荷預測。利用式(2)與式(3)計算即可求得空間負荷預測結(jié)果,圖7、8分別為2010年該市實際空間負荷分布與本文模型得到的空間負荷預測結(jié)果,圖中深色點的密集程度表示負荷密度的大小。可以看出,2010年該區(qū)域的實際負荷分布主要集中在西北部一帶,因為該區(qū)域有大規(guī)模的工業(yè)園區(qū),用電量會較其他區(qū)域要大,而其他的一些用電量主要集中在大型的商場、市政辦公樓、高層建筑、學校以及寫字樓等區(qū)域,使用本文提出的模型來預測該區(qū)域2010年的負荷分布情況同實際負荷分布情況大體一致。
圖4 r8尺度的分區(qū)結(jié)果Fig.4 Regional divisions of r8scale
圖5 2010年該市實際土地利用分布Fig.5 Actual distribution of municipal land use in 2010
圖6 本文模擬預測土地利用分布Fig.6 Distribution of land use forecasted by proposed model
圖7 2010年實際空間負荷分布Fig.7 Actual distribution of special load in 2010
圖8 2010年顧及空間異質(zhì)性的負荷分布Fig.8 Load distribution considering spatial heterogeneity in 2010
為了驗證顧及空間異質(zhì)性的多尺度空間負荷預測模型的有效性,本文將該模型得到的預測結(jié)果與實際負荷分布結(jié)果進行了對比,結(jié)果如表2所示。由表2可見,顧及空間異質(zhì)性的空間負荷預測模型的模擬結(jié)果,更接近實際的負荷利用總體結(jié)構(gòu)和形態(tài)。
表2 2010年空間負荷預測結(jié)果對比Tab.2 Comparison of forecasted spatial load for 2010MW/km2
此外,本文采用元胞自動機模型精度評估最常用的逐點對比法對本文元胞自動機模型精度進行檢驗,該方法通過逐像元對比元胞自動機模型的模擬結(jié)果與實際的分布來衡量元胞自動機模型的模擬精度。本文在程序中分別對實際分布和模擬分布的每一像元是否有負荷分布進行標識并計數(shù),最后通過計數(shù)比值即可得到模擬分布的精度值。如圖7和圖8結(jié)果所示,與2010年該市空間負荷實際分布狀況對比,采用顧及空間異質(zhì)性的多尺度空間負荷預測模型的精度達98.86%。因此,顧及空間異質(zhì)性的多尺度空間負荷預測模型模擬精準度更高,具有很強的實用性。
采用統(tǒng)一的元胞轉(zhuǎn)換規(guī)則驅(qū)動元胞自動機進行時空演化,是在假設所有分區(qū)中地理現(xiàn)象服從某單一均質(zhì)性的前提下進行的,從而忽略了地理現(xiàn)象的空間異質(zhì)性,因而影響了空間負荷預測的精度。本文針對以上問題,提出了顧及空間異質(zhì)性的多尺度空間負荷預測模型,該模型按照空間變異系數(shù)的大小將元胞空間進行不規(guī)則劃分,使每一分區(qū)具有相對一致的轉(zhuǎn)換規(guī)則,同時再對已有的不規(guī)則分區(qū)按照相鄰分區(qū)的相似度進行聚類融合,由于影響因素較多,本文中引入了粗糙集理論來對眾多因素進行屬性約簡,根據(jù)不同的相似度閾值,得到了多尺度的區(qū)域劃分。在此基礎上,對不規(guī)則的分區(qū)采用C5.0決策樹算法,挖掘每一個子區(qū)域的元胞轉(zhuǎn)換規(guī)則來驅(qū)動元胞自動機模型模擬區(qū)域土地類型的變化,最后將每一尺度下得到的模擬結(jié)果進行疊加,經(jīng)過實例驗證本文模型可以獲得與實際非常接近的模擬效果。