• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      顧及時空異質(zhì)性的缺失數(shù)據(jù)時空插值方法

      2016-05-16 08:14:08樊子德龔健雅李佳霖
      測繪學(xué)報 2016年4期
      關(guān)鍵詞:分區(qū)異質(zhì)性

      樊子德,龔健雅,劉 博,李佳霖,鄧 敏

      1. 中南大學(xué)地球科學(xué)與信息物理學(xué)院,湖南 長沙 410083; 2. 武漢大學(xué)測繪遙感信息工程國家重點(diǎn)實驗室,湖北 武漢 430079; 3. 日電(NEC)中國研究院,北京 100084

      ?

      顧及時空異質(zhì)性的缺失數(shù)據(jù)時空插值方法

      樊子德1,龔健雅2,劉博3,李佳霖1,鄧敏1

      1. 中南大學(xué)地球科學(xué)與信息物理學(xué)院,湖南 長沙 410083; 2. 武漢大學(xué)測繪遙感信息工程國家重點(diǎn)實驗室,湖北 武漢 430079; 3. 日電(NEC)中國研究院,北京 100084

      摘要:時空插值方法被廣泛應(yīng)用于缺失時空數(shù)據(jù)集的插值與估計。時空插值是時空建模與分析的一個重要內(nèi)容,當(dāng)前該研究關(guān)注的熱點(diǎn)之一是異質(zhì)條件下的時空插值與估計問題。因此,本文從時空數(shù)據(jù)的異質(zhì)性出發(fā),提出了一種顧及時空異質(zhì)性的缺失數(shù)據(jù)時空插值方法。該方法首先對數(shù)據(jù)集進(jìn)行時空分區(qū),然后分別在時間和空間按照異質(zhì)協(xié)方差模型計算缺失數(shù)據(jù)的估計值,進(jìn)而利用相關(guān)系數(shù)確定時空權(quán)重、融合時間和空間估計值得到缺失數(shù)據(jù)的最終估計結(jié)果。最后通過兩組氣象數(shù)據(jù)集進(jìn)行交叉驗證對比分析試驗。試驗結(jié)果表明本文方法對比其他插值方法具有更高的精度和適用性。

      關(guān)鍵詞:時空插值;分區(qū);異質(zhì)性;缺失數(shù)據(jù)

      大自然的演變、人類的生產(chǎn)活動、社會經(jīng)濟(jì)的發(fā)展都是時空過程,可以用時空數(shù)據(jù)表示。然而時空數(shù)據(jù)由于各種原因存在數(shù)據(jù)缺失的現(xiàn)象[1]。數(shù)據(jù)缺失降低了時空數(shù)據(jù)的完整性,可能會導(dǎo)致人們作出不合理的推斷和決策。因此時空缺失數(shù)據(jù)的插值與估計對于時空數(shù)據(jù)挖掘和建模具有重要意義[2-3]。

      為了解決時空數(shù)據(jù)的缺失問題,一系列時空數(shù)據(jù)插值方法被提出用以插值缺失時空數(shù)據(jù)。其中大多數(shù)方法將時空數(shù)據(jù)簡化為連續(xù)的空間數(shù)據(jù)序列進(jìn)行空間插值[4]。然而,使用空間插值方法處理時空數(shù)據(jù)會造成數(shù)據(jù)時間維度信息的丟失[5]。為了解決這一問題,近年來一些學(xué)者提出時空插值的方法并廣泛應(yīng)用于時空缺失數(shù)據(jù)的插值與估計[6-8]。

      目前時空數(shù)據(jù)的插值方法,主要包括基于回歸的方法、時空反距離加權(quán)方法以及時空克里金方法等[9-15]。分析現(xiàn)有時空插值方法,可以發(fā)現(xiàn)現(xiàn)有方法插值時空數(shù)據(jù)時,大都假設(shè)時空過程的空間和時間平穩(wěn)性。由于時空數(shù)據(jù)存在異質(zhì)性,現(xiàn)有插值方法的精度仍然不能令人滿意。在時空數(shù)據(jù)插值時,最大程度消除時空異質(zhì)性的影響,有效融合時空維度數(shù)據(jù)成為時空插值研究的難點(diǎn)之一。因此,本文提出一種顧及時空異質(zhì)性的缺失數(shù)據(jù)時空插值方法解決這一問題。

      1相關(guān)研究回顧及本文研究策略

      基于回歸的方法利用周圍監(jiān)測站的記錄和相關(guān)資料計算回歸方程,進(jìn)而估計缺失的數(shù)據(jù)。近年來,一些學(xué)者顧及空間異質(zhì)性提出地理加權(quán)回歸方法并應(yīng)用于許多領(lǐng)域。例如,文獻(xiàn)[16]利用非歐幾里德距離地理加權(quán)回歸估計歐洲房價的分布,文獻(xiàn)[17]則利用地理加權(quán)回歸對我國深圳的房價進(jìn)行建模分析。然而基于回歸的方法處理缺失數(shù)據(jù)時存在一定的局限性,在數(shù)據(jù)缺失較多的情況下插值結(jié)果不理想[18]。

      反距離加權(quán)方法通過計算周圍監(jiān)測站點(diǎn)對缺失站點(diǎn)的反距離權(quán)重估計站點(diǎn)的缺失數(shù)據(jù)[19]。一些學(xué)者將其擴(kuò)展至?xí)r空,提出時空反距離加權(quán)插值方法。時空反距離加權(quán)方法計算三維時空距離,并以此距離的倒數(shù)為參數(shù)定權(quán)估計缺失的數(shù)據(jù)。時空反距離加權(quán)方法易于實現(xiàn),但它是有偏的,精度相比其他方法較低。

      另一類廣泛應(yīng)用的插值方法是基于地統(tǒng)計學(xué)的克里金方法(Kriging)[20]??死锝鸱椒ㄊ褂米儺惡瘮?shù)或協(xié)方差函數(shù)進(jìn)行插值估計??死锝鸱椒òㄔS多擴(kuò)展,例如簡單克里金方法、普通克里金方法、協(xié)同克里金方法等。近年來一些學(xué)者將克里金方法擴(kuò)展至?xí)r空,耦合時間和空間記錄對缺失數(shù)據(jù)進(jìn)行插值[21]。在此基礎(chǔ)上,文獻(xiàn)[9,22]提出了時空積和協(xié)方差模型,并將其成功應(yīng)用于空氣污染物濃度數(shù)據(jù)的時空插值建模。

      此外,文獻(xiàn)[23—24]提出了一種時空數(shù)據(jù)的三明治估計模型。該模型采用層次策略,將研究區(qū)域分為采樣層、分區(qū)層和報告層。三明治模型能夠很好地顧及空間異質(zhì)性,所得結(jié)果精度高于其他相關(guān)模型。另一種顧及空間異質(zhì)性的插值方法是點(diǎn)最優(yōu)線性無偏插值方法(簡稱P-Bshade)[4,25-26]。該方法顧及空間異質(zhì)性提出了一種站點(diǎn)期望比指標(biāo),對比傳統(tǒng)克里金方法,P-Bshade方法具有更高的精度和效率。但該算法也具有一定的局限性,未能同時顧及時空異質(zhì)性融合空間和時間數(shù)據(jù)對缺失數(shù)據(jù)進(jìn)行估計。

      分析上述國內(nèi)外研究方法可以得出:

      (1) 現(xiàn)有缺失數(shù)據(jù)插值方法大都單純從空間或者時間角度進(jìn)行插值,主要原因是時空插值對比單純的空間插值或時間插值計算更復(fù)雜。此外,單純使用時間或空間維度數(shù)據(jù)估計缺失數(shù)據(jù)勢必會丟失采樣數(shù)據(jù)的部分信息,從而降低插值的精度。

      (2) 現(xiàn)有缺失數(shù)據(jù)時空插值方法,對于異質(zhì)性的顧及大都只是單獨(dú)考慮時間或者空間維度。由于時空異質(zhì)性,即空間和時間非平穩(wěn)的影響,研究區(qū)域不同子區(qū)域間可能存在較大的差異,因此有必要同時考慮時空異質(zhì)性進(jìn)行插值計算。

      鑒于以上兩點(diǎn),本文提出一種顧及時空異質(zhì)性的缺失數(shù)據(jù)時空插值方法。該方法首先對時空數(shù)據(jù)進(jìn)行缺失數(shù)據(jù)檢測,進(jìn)而顧及時空異質(zhì)性對數(shù)據(jù)集進(jìn)行時空分區(qū),在時空子區(qū)域內(nèi)分別選取n個相關(guān)性最大的空間周圍數(shù)據(jù)和m個相關(guān)性最大的時間周圍數(shù)據(jù)用以估計缺失數(shù)據(jù),最后利用相關(guān)系數(shù)計算時空維度插值結(jié)果的貢獻(xiàn)權(quán)重,融合時空維度插值結(jié)果得到缺失數(shù)據(jù)的最終估計結(jié)果。算法的流程圖如圖1所示。

      2顧及時空異質(zhì)性的缺失數(shù)據(jù)時空插值方法

      2.1缺失數(shù)據(jù)時空異質(zhì)分區(qū)

      本研究首先對時空數(shù)據(jù)集進(jìn)行檢測,找到缺失數(shù)據(jù)的位置,進(jìn)而對時空數(shù)據(jù)進(jìn)行異質(zhì)分區(qū),包括空間聚類分區(qū)和時間切片選取兩部分。下面分別對其進(jìn)行介紹。

      圖1 本文方法流程圖Fig.1 The flowchart of this method

      首先在空間采用聚類分區(qū)的策略對數(shù)據(jù)集進(jìn)行異質(zhì)劃分,將時空數(shù)據(jù)按照內(nèi)部均質(zhì)劃分為不同的子區(qū)域,本研究采用REDCAP聚類方法對研究區(qū)域進(jìn)行異質(zhì)分區(qū)[27]。該方法首先按照鄰接約束構(gòu)建研究區(qū)域的鄰接樹,然后計算最小方差增量距離并利用全局鄰接約束對整個研究區(qū)域按照空間鄰接樹進(jìn)行空間劃分,最后按照初始規(guī)定的聚類數(shù)目進(jìn)行空間聚類分區(qū),聚類的數(shù)目由歷史經(jīng)驗和聚類評價指標(biāo)綜合確定。

      空間異質(zhì)分區(qū)后對時空數(shù)據(jù)顧及時間異質(zhì)性進(jìn)行時間分區(qū)。本文采用時間切片的期望值進(jìn)行時間維度分區(qū),首先對于每個時間切片求期望并排序,進(jìn)而對排序后的時間切片期望值畫圖并尋找拐點(diǎn),以此劃分時間切片。時空分區(qū)可以有效降低時空異質(zhì)性對時空插值的影響,使同一子區(qū)域內(nèi)的時空數(shù)據(jù)相對平穩(wěn)。在時空子區(qū)域中進(jìn)行時空插值,不僅可以提高插值精度,而且可以縮短計算時間。

      數(shù)據(jù)集進(jìn)行時空分區(qū)處理后,對每個缺失數(shù)據(jù)選取參與插值計算的空間維度和時間維度采樣數(shù)據(jù)。首先在空間維度選取缺失數(shù)據(jù)周圍空間的n個相關(guān)性最大的采樣數(shù)據(jù),本文選擇相關(guān)系數(shù)R描述站點(diǎn)之間的相關(guān)性,具體計算為:對于一個缺失數(shù)據(jù),計算其周圍空間點(diǎn)的數(shù)據(jù)序列和缺失數(shù)據(jù)點(diǎn)的數(shù)據(jù)序列的相關(guān)系數(shù)R(yi,y0)。其中,yi表示缺失數(shù)據(jù)周圍空間點(diǎn)的數(shù)據(jù)序列,y0表示缺失數(shù)據(jù)點(diǎn)的數(shù)據(jù)序列。當(dāng)某一序列中存在其他缺失數(shù)據(jù)時則去除另一序列中的相應(yīng)數(shù)據(jù)繼續(xù)進(jìn)行計算。同樣對于時間維度,在同一子區(qū)域內(nèi)選取缺失數(shù)據(jù)前后時間的m個相關(guān)性最大的采樣數(shù)據(jù),其中的相關(guān)性計算為:對于一個缺失數(shù)據(jù),計算缺失數(shù)據(jù)周圍時間切片的空間點(diǎn)序列和缺失數(shù)據(jù)所在時間切片的空間點(diǎn)序列的相關(guān)系數(shù)R(tj,t0)。其中,tj表示缺失數(shù)據(jù)周圍時間切片的空間點(diǎn)序列,t0表示缺失數(shù)據(jù)所在時間切片的空間點(diǎn)序列。最后,分別在空間維度選擇n個、時間維度選擇m個相關(guān)系數(shù)最大的周圍數(shù)據(jù)進(jìn)行缺失點(diǎn)的插值計算。對于n和m的取值,可以根據(jù)現(xiàn)有研究和聚類結(jié)果具體設(shè)置,文獻(xiàn)[4]建議周圍站點(diǎn)數(shù)目可以設(shè)置為5、10、15。

      2.2顧及異質(zhì)性的時空維度插值

      (1)

      式中,yi表示第i個空間周圍采樣數(shù)據(jù)的觀測值;wi表示第i個空間周圍采樣數(shù)據(jù)對缺失數(shù)據(jù)的空間貢獻(xiàn)權(quán)重;wi可以用下式計算求得

      (2)

      式中,方程中間的矩陣為待求矩陣;μ為拉格朗日系數(shù)。方程左邊的矩陣中C(yi,yi′)表示第i個空間周圍采樣點(diǎn)的時間序列與第i′個空間周圍采樣點(diǎn)的時間序列的協(xié)方差,bi表示第i個空間周圍采樣點(diǎn)的時間序列與缺失數(shù)據(jù)點(diǎn)的時間序列的期望比。方程右邊的矩陣中C(yi,y0)表示第i個空間周圍采樣點(diǎn)的時間序列與缺失數(shù)據(jù)點(diǎn)的時間序列的協(xié)方差,并滿足1≤i≤n,1≤i′≤n??臻g維度插值算法的思想如圖2所示,其中y0代表缺失數(shù)據(jù)點(diǎn),yi代表第i個空間周圍采樣點(diǎn)數(shù)據(jù),T1、T2、…、Ti、…、Tm代表時間層切片,虛線內(nèi)區(qū)域即為一個異質(zhì)子區(qū)域,連接已知點(diǎn)的線表示協(xié)方差,上下垂直的虛線表示時間序列,連接缺失點(diǎn)與采樣點(diǎn)的線表示采樣點(diǎn)對缺失點(diǎn)的空間貢獻(xiàn)權(quán)重。

      (3)

      式中,tj表示第j個周圍時間采樣數(shù)據(jù);φj表示第j個周圍時間采樣數(shù)據(jù)對缺失數(shù)據(jù)的時間貢獻(xiàn)權(quán)重,φj可以用下式計算得出

      圖2 空間維度插值示意圖Fig.2 The chart of space dimension interpolation

      (4)

      式中,方程中間的矩陣為待求矩陣,υ為拉格朗日系數(shù)。左邊矩陣中C(tj,tj′)表示第j個周圍時間切片的空間點(diǎn)序列與第j′個周圍時間切片的空間點(diǎn)序列的協(xié)方差,aj表示第j個周圍時間切片的空間點(diǎn)序列與缺失數(shù)據(jù)時間切片的空間點(diǎn)序列的期望比。右邊矩陣中C(tj,t0)表示第j個周圍時間切片的空間點(diǎn)序列與缺失數(shù)據(jù)時間切片的空間點(diǎn)序列的協(xié)方差,并滿足1≤j≤m,1≤j′≤m。時間維度插值算法的思想如圖3所示,其中t0表示缺失數(shù)據(jù)點(diǎn),tj表示缺失數(shù)據(jù)周圍時間維度選擇的采樣數(shù)據(jù)點(diǎn),T1、…、Ti、…、Tm表示時間切片,上下垂直的虛線表示時間序列,虛線矩形框表示選擇的異質(zhì)時間分區(qū),連接采樣點(diǎn)的虛線表示協(xié)方差。

      圖3 時間維度插值示意圖Fig.3 The chart of time dimension interpolation

      2.3時空維度插值結(jié)果加權(quán)融合

      求得缺失數(shù)據(jù)在時間和空間維度的估計值后,采用線性加權(quán)的方法對其進(jìn)行融合。由于時空協(xié)方差模型分為可分離和不可分離兩種,相應(yīng)時空插值結(jié)果的融合也分為可分離和不可分離兩種[28-29]。不可分離時空協(xié)方差模型通常計算復(fù)雜,例如積和協(xié)方差模型需要計算一系列參數(shù)擬合時空變異曲面。而可分離時空協(xié)方差模型對于時空維度插值結(jié)果的融合大多采用線性融合的方法。根據(jù)所求缺失數(shù)據(jù)的空間維度估值和時間維度估值,利用下式(5)計算缺失數(shù)據(jù)的最終時空估計結(jié)果Y0

      (5)

      式中,A表示空間維度權(quán)重;B表示時間維度權(quán)重。對于權(quán)重的確定,本文利用上文中的相關(guān)系數(shù)進(jìn)行計算

      (6)

      求解公式(6)即可得到時空維度的貢獻(xiàn)權(quán)重。公式(6)在一定程度上考慮了時間維度和空間維度的貢獻(xiàn)率,使得時空維度計算結(jié)果的融合更加合理。最后將時空維度估計結(jié)果和時空維度權(quán)重代入公式(5)即可得到缺失數(shù)據(jù)的最終時空估計結(jié)果。

      3試驗分析

      為了驗證本文方法的優(yōu)越性與適用性,共設(shè)計了兩組試驗。試驗1采用我國554個氣象監(jiān)測站點(diǎn),歷時312個月(1984年1月至2009年12月)的氣象數(shù)據(jù)集,包括月平均氣溫數(shù)據(jù)和月累計降雨數(shù)據(jù)。試驗數(shù)據(jù)不存在缺失,使用不同方法對每個時空點(diǎn)進(jìn)行插值估計,然后采用留一法對不同方法進(jìn)行交叉驗證對比分析,驗證本文方法的優(yōu)越性。試驗2采用我國930個氣象監(jiān)測站點(diǎn),歷時53年(1961年至2013年)的年平均氣溫數(shù)據(jù)集,數(shù)據(jù)存在一定的缺失,包括監(jiān)測的隨機(jī)缺失和早期未建站點(diǎn)的大量連續(xù)缺失。同樣使用不同方法對每個時空點(diǎn)進(jìn)行插值估計,進(jìn)而采用留一法對不同方法進(jìn)行交叉驗證對比分析,驗證本文方法在實際應(yīng)用中適用性。試驗數(shù)據(jù)集來源于國家氣象信息中心。

      3.1試驗1:模擬驗證

      對于試驗1數(shù)據(jù),對比分析本文方法即異質(zhì)分區(qū)時空插值方法、P-Bshade方法、未分區(qū)本文方法、時空Kriging方法以及空間Kriging方法。試驗選取平均絕對誤差(MAE)和均方根誤差(RMSE)兩個常用指標(biāo)分析不同插值方法結(jié)果的精度。

      試驗中554個氣象監(jiān)測站點(diǎn)及其異質(zhì)分區(qū)如圖4和圖5所示,相同的顏色表示同一空間分區(qū),分區(qū)方法為REDCAP聚類方法,聚類分區(qū)的數(shù)目分別為:氣溫數(shù)據(jù)集為12個,降水?dāng)?shù)據(jù)集為8個。聚類分區(qū)數(shù)目的確定依據(jù)我國氣溫分帶及降水分區(qū)經(jīng)驗數(shù)據(jù)和聚類評價指標(biāo),并對單點(diǎn)的聚類結(jié)果進(jìn)行合并處理。時空分區(qū)處理在一定程度上可以降低時空插值中異質(zhì)性的影響,然而就分區(qū)而言存在兩個問題:其一是分區(qū)數(shù)目的確定,通常需要結(jié)合歷史數(shù)據(jù)及經(jīng)驗知識,并且滿足聚類的評價指標(biāo)綜合確定。其二是分區(qū)后位于區(qū)域邊界的數(shù)據(jù)計算精度會下降,而在一些點(diǎn)數(shù)較少的分區(qū)中,這種區(qū)域邊界效應(yīng)更為明顯。

      圖4 氣溫監(jiān)測點(diǎn)異質(zhì)分區(qū)圖Fig.4 The chart of temperature observation stations heterogeneity subareas

      圖5 降水監(jiān)測點(diǎn)異質(zhì)分區(qū)圖Fig.5 The chart of precipitation observation stations heterogeneity subareas

      對5種插值方法的結(jié)果進(jìn)行交叉驗證得到誤差指標(biāo)MAE和RMSE如表1所示。其中本文方法和P-Bshade方法的參數(shù)n和m,依據(jù)聚類結(jié)果將其均設(shè)置為10,空間Kriging采用普通Kriging方法,時空Kriging方法采用積和模型進(jìn)行計算。

      表1 5種插值方法的試驗結(jié)果

      將表1數(shù)據(jù)展示為直方圖形式如圖6和圖7所示??梢钥闯霰疚姆椒ㄔ诰壬蟽?yōu)于其他4種方法。相比于P-Bshade方法,本文方法由于進(jìn)行時空分區(qū)并顧及時間維度信息進(jìn)行插值,降低了時空異質(zhì)性的影響,插值精度有所提高。對比未分區(qū)的本文方法,分區(qū)可以有效降低異質(zhì)性影響,提高插值精度。但是,未分區(qū)本文方法對比P-Bshade方法精度有所下降,這可能是由于在融合時間維度信息時,未分區(qū)導(dǎo)致每個時間切片的監(jiān)測站數(shù)量多且數(shù)值差異大,使得計算時間維度周圍數(shù)據(jù)的權(quán)重精度下降,然而時空分區(qū)可以有效解決這一問題。本文方法同樣優(yōu)于時空Kriging和普通Kriging方法,且精度提高較為明顯。

      圖6 5種插值方法的氣溫試驗結(jié)果Fig.6 The results of temperature dataset used

      圖7 5種插值方法的降水試驗結(jié)果Fig.7 The results of precipitation dataset used

      3.2試驗2:實際應(yīng)用驗證

      從試驗1可以發(fā)現(xiàn),本文方法的插值精度優(yōu)于其他幾種方法。試驗2采用一組具有不同類型缺失的數(shù)據(jù)進(jìn)一步對比分析本文方法和P-Bshade方法的精度及適用性。試驗數(shù)據(jù)的缺失情況如圖8所示。圖中散點(diǎn)表示缺失數(shù)據(jù)的位置, 折線表示每年缺失數(shù)據(jù)的變化情況??梢园l(fā)現(xiàn),圖8左上角存在連續(xù)的數(shù)據(jù)缺失,這是由于在建站初期一些站點(diǎn)還未建成導(dǎo)致的。數(shù)據(jù)的最大缺失出現(xiàn)在1968年,共68個站點(diǎn)缺失,并在之后急速減少,在1980年后趨于穩(wěn)定。

      圖8 數(shù)據(jù)缺失示意圖Fig.8 The chart of missing data number and distribution

      對試驗數(shù)據(jù)2進(jìn)行異質(zhì)分區(qū),所得聚類分區(qū)的數(shù)目為19個,如圖9所示。對實際缺失數(shù)據(jù)采用本文方法和P-Bshade方法進(jìn)行插值估計,交叉驗證結(jié)果為:本文方法的MAE為0.149℃,RMSE為0.531℃;P-Bshade方法的MAE為0.192℃,RMSE為1.164℃。本文方法優(yōu)于P-Bshade方法。對插值結(jié)果進(jìn)行逐年精度分析如圖10和圖11所示??梢钥闯霰疚姆椒▽Ρ萈-Bshade方法具有更高的精度和適用性。在1960年至1970年缺失數(shù)據(jù)較多且存在大量連續(xù)缺失的情況下,兩種方法都具有較大的誤差,而本文方法誤差相對更小。在1970年后缺失數(shù)目減少并趨于穩(wěn)定,本文方法精度同樣優(yōu)于P-Bshade方法。

      圖9 氣溫數(shù)據(jù)異質(zhì)分區(qū)圖Fig.9 The chart of temperature observation stations heterogeneity subareas

      圖10 年均氣溫插值MAE圖Fig.10 Yearly MAEs from 1961 to 2013 for two methods

      圖11 年均氣溫插值RMSE圖  Fig.11 Yearly RMSEs from 1961 to 2013 for two methods

      4結(jié)論

      本文針對時空數(shù)據(jù)存在缺失的情況,提出了一種基于時空異質(zhì)性的缺失數(shù)據(jù)時空插值方法。該方法顧及時空異質(zhì)性,首先對時空數(shù)據(jù)進(jìn)行異質(zhì)分區(qū),進(jìn)而在時間維度和空間維度分別采用異質(zhì)協(xié)方差模型估計缺失數(shù)據(jù),最后對時空維度插值結(jié)果進(jìn)行融合。該方法對時空序列缺失數(shù)據(jù)插值具有良好效果,與已有方法相比提高了插值結(jié)果的精度。然而本文方法依然存在一定的局限性,表現(xiàn)在對于時空分區(qū)模糊的數(shù)據(jù),分區(qū)會比較困難。未來研究主要集中在跨分區(qū)樣本單元分區(qū),以及時空非線性不可分離模型插值等方面,以期進(jìn)一步提高時空插值的精度。

      參考文獻(xiàn):

      [1]SIMOLO C, BRUNETTI M, MAUGERI M, et al. Improving Estimation of Missing Values in Daily Precipitation Series by a Probability Density Function-Preserving Approach[J]. International Journal of Climatology, 2010, 30(10): 1564-1576.

      [2]王勁峰, 葛詠, 李連發(fā), 等. 地理學(xué)時空數(shù)據(jù)分析方法[J]. 地理學(xué)報, 2014, 69(9): 1326-1345.

      WANG Jinfeng, GE Yong, LI Lianfa, et al. Spatiotemporal Data Analysis in Geography[J]. Acta Geographica Sinica, 2014, 69(9): 1326-1345.

      [3]葉近天, 季世民, 楊勇. 時空地統(tǒng)計學(xué)方法研究及進(jìn)展[J]. 測繪與空間地理信息, 2014, 37(1): 38-43.

      YE Jintian, JI Shimin, YANG Yong. Spatio-Temporal Geotatistics Method Research and Progress[J]. Geomatics & Spatial Information Technology, 2014, 37(1): 38-43.

      [4]XU Chengdong, WANG Jinfeng, HU Maogui, et al. Interpolation of Missing Temperature Data at Meteorological Stations Using P-BSHADE[J]. Journal of Climate, 2013, 26(19): 7452-7463.

      [5]DE CESARE L, MYERS D E, POSA D. Estimating and Modeling Space-time Correlation Structures[J]. Statistics & Probability Letters, 2001, 51(1): 9-14.

      [6]KYRIAKIDIS P C, JOURNEL A G. Geostatistical Space-Time Models: a Review[J]. Mathematical Geology, 1999, 31(6): 651-684.

      [8]WANG Jinfeng, XU Chengdong, HU Maogui, et al. A New Estimate of the China Temperature Anomaly Series and Uncertainty Assessment in 1900-2006[J]. Journal of Geophysical Research: Atmospheres, 2014, 119(1): 1-9.

      [9]DE IACO S,MYERS D E,POSA D.Space-Time Variograms and a Functional Form for Total Air Pollution Measurements[J]. Computational Statistics & Data Analysis, 2002, 41(2): 311-328.

      [10]LI Lixin, REVESZ P. Interpolation Methods for Spatio-Temporal Geographic Data[J]. Computers, Environment and Urban Systems, 2004, 28(3): 201-227.

      [11]HUANG Bo, WU Bo, BARRY M. Geographically and Temporally Weighted Regression for Modeling Spatio-Temporal Variation in House Prices[J]. International Journal of Geographical Information Science, 2010, 24(3): 383-401.

      [12]楊朝暉, 余潔, 陳江平. 基于聚類與空間自回歸模型的缺失數(shù)據(jù)填補(bǔ)方法[C]∥亞太環(huán)境科學(xué)研究中心. 2010年國際遙感會議論文集. [S.l.]: 智能信息技術(shù)應(yīng)用學(xué)會, 2010, 3: 4.

      YANG Zhaohui, YU Jie, CHEN Jiangping. A Missing Data Imputation Method Based on Cluster and Spatial Autoregressive Model[C]∥Asia Pacific Environmental Science Research Center. Proceedings of 2010 International Conference on Remote Sensing (ICRS 2010). [S.l.]: Application of Intelligent Information Technology Institute, 2010, 3: 4.

      [13]李正泉, 吳堯祥. 顧及方向遮蔽性的反距離權(quán)重插值法[J]. 測繪學(xué)報, 2015, 44(1): 91-98. DOI: 10.11947/j.AGCS.2015.20130349.

      LI Zhengquan, WU Yaoxiang. Inverse Distance Weighted Interpolation Involving Position Shading[J]. Acta Geodaetica et Cartographica Sinica, 2015, 44(1): 91-98. DOI: 10.11947/j.AGCS.2015.20130349.

      [14]張錦明, 游雄, 萬剛. DEM插值參數(shù)優(yōu)選的試驗研究[J]. 測繪學(xué)報, 2014, 43(2): 178-185, 192. DOI: 10.13485/j.cnki.11-2089.2014.0026

      ZHANG Jinming, YOU Xiong, WAN Gang. Experimental Research on Optimization of DEM Interpolation Parameters[J]. Acta Geodaetica et Cartographica Sinica, 2014, 43(2): 178-185, 192. DOI: 10.13485/j.cnki.11-2089.2014.0026

      [15]董箭, 彭認(rèn)燦, 鄭義東, 等. 局部動態(tài)最優(yōu)Voronoi圖的NNI算法及其在格網(wǎng)數(shù)字水深模型中的應(yīng)用[J]. 測繪學(xué)報, 2013, 42(2): 284-289, 303.

      DONG Jian, PENG Rencan, ZHENG Yidong, et al. An Algorithm of Natural Neighbor Interpolation Based on Local Dynamic Optimal Voronoi Diagram and Its Application in Grid Digital Depth Model[J]. Acta Geodaetica et Cartographica Sinica, 2013, 42(2): 284-289, 303.

      [16]LU Binbin, CHARLTON M, HARRIS P, et al. Geographically Weighted Regression with a Non-Euclidean Distance Metric: A Case Study Using Hedonic House Price Data[J]. International Journal of Geographical Information Science, 2014, 28(4): 660-681.

      [17]WU Bo, LI Rongrong, HUANG Bo. A Geographically and Temporally Weighted Autoregressive Model with Application to Housing Prices[J]. International Journal of Geographical Information Science, 2014, 28(4): 1186-1204.

      [18]HUBBARD K G, YOU Jinsheng. Sensitivity Analysis of Quality Assurance Using the Spatial Regression Approach-A Case Study of the Maximum/Minimum Air Temperature[J]. Journal of Atmospheric and Oceanic Technology, 2005, 22(10): 1520-1530.

      [19]LU G Y, WONG D W. An Adaptive Inverse-Distance Weighting Spatial Interpolation Technique[J]. Computers & Geosciences, 2008, 34(9): 1044-1055.

      [20]徐愛萍, 圣文順, 舒紅. 時空積和模型的數(shù)據(jù)插值與交叉驗證[J]. 武漢大學(xué)學(xué)報(信息科學(xué)版), 2012, 37(7): 766-769.

      XU Aiping, SHENG Wenshun, SHU Hong. Spatiotemporal Interpolation and Cross Validation Based on Product-Sum Model[J]. Geomatics and Information Science of Wuhan University, 2012, 37(7): 766-769.

      [21]BILONICK R A. The Space-Time Distribution of Sulfate Deposition in the Northeastern United States[J]. Atmospheric Environment (1967), 1985, 19(11): 1829-1845.

      [22]DE IACOS S,MYERS D E,POSA D.Space-Time Analysis Using a General Product-Sum Model[J]. Statistics & Probability Letters, 2001, 52(1): 21-28.

      [23]WANG Jinfeng, HAINING R,LIU Tiejun,et al.Sandwich Estimation for Multi-Unit Reporting on a Stratified Heterogeneous Surface[J]. Environment and Planning A, 2013, 45(10): 2515-2534.

      [24]WANG Jinfeng, HAINING R, CAO Zhidong. Sample Surveying to Estimate the Mean of a Heterogeneous Surface: Reducing the Error Variance through Zoning[J]. International Journal of Geographical Information Science, 2010, 24(4): 523-543.

      [25]WANG Jingfeng, REIS B Y, HU Maogui, et al. Area Disease Estimation Based on Sentinel Hospital Records[J]. PLoS One, 2011, 6(8): e23428.

      [26]HU Maogui, WANG Jinfeng, ZHAO Yu, et al. A B-SHADE Based Best Linear Unbiased Estimation Tool for Biased Samples[J]. Environmental Modelling & Software, 2013, 48: 93-97.

      [27]GUO D. Regionalization with Dynamically Constrained Agglomerative Clustering and Partitioning (REDCAP)[J]. International Journal of Geographical Information Science, 2008, 22(7): 801-823.

      [28]MA Chunsheng. Spatio-temporal Covariance Functions Generated by Mixtures[J]. Mathematical Geology, 2002, 34(8): 965-975.

      [29]MA Chunsheng. Recent Developments on the Construction of Spatio-Temporal Covariance Models[J]. Stochastic Environmental Research and Risk Assessment, 2008, 22(1): 39-47.

      (責(zé)任編輯:宋啟凡)

      修回日期: 2016-02-02

      First author: FAN Zide(1988—),male,PhD candidate,majors in spatial data interpolation and modeling.

      E-mail: fanzide@msn.com

      E-mail: dengmin208@tom.com

      A Space-time Interpolation Method of Missing Data Based on Spatio-temporal Heterogeneity

      FAN Zide1,GONG Jianya2,LIU Bo3,LI Jialin1,DENG Min1

      1. School of Geosciences and Info-Physics, Central South University, Changsha 410083, China; 2. State Key Laboratory of Information Engineering in Surveying, Mapping and Remote Sensing, Wuhan University, Wuhan 430079, China; 3. NEC Labs, Beijing 100084, China

      Abstract:Space-time interpolation is widely used to estimate missing data in a dataset integrating both spatial and temporal records. Although space-time interpolation plays a key role in space-time modeling, it is still challenging to model heterogeneity of space-time data in the interpolation model.To overcome this limitation, in this study, a novel space-time interpolation method based on spatio-temporal heterogeneity is proposed to estimate missing data of space-time datasets. Firstly, space partitioning and time slicing of space-time data was implemented. Then the estimates of missing data are computed using space-time surrounding records with heterogeneous spatio-temporal covariance model.Further the weights of space and time are determined using the correlation coefficient and the finally estimates of missing data is combined integrating time and space estimates. Finally, two datasets are selected to verify the accuracy of this method. Experimental results show that the proposed method outperforms the four state-of-the-art methods with higher accuracy and applicability.

      Key words:spatio-temporal interpolation; partitioning; heterogeneity; missing data

      Corresponding author:DENG Min

      通信作者:鄧敏

      第一作者簡介:樊子德(1988—),男,博士生,研究方向為時空數(shù)據(jù)插值與建模。

      收稿日期:2015-03-09

      基金項目:國家863計劃(2013AA122301);湖南省博士生優(yōu)秀學(xué)位論文(CX2014B050);中南大學(xué)研究生創(chuàng)新項目(2015zzts067)

      中圖分類號:P208

      文獻(xiàn)標(biāo)識碼:A

      文章編號:1001-1595(2016)04-0458-08

      Foundation support: The National High Technology Research and Development Program of China (863 Program) (No.2013AA122301); The Hunan Funds for Excellent Doctoral Dissertation (No.CX2014B050); The Central South University Funds for Excellent Doctoral Dissertation (No.2015zzts067)

      引文格式:樊子德,龔健雅,劉博,等.顧及時空異質(zhì)性的缺失數(shù)據(jù)時空插值方法[J].測繪學(xué)報,2016,45(4):458-465. DOI:10.11947/j.AGCS.2016.20150123.

      FAN Zide,GONG Jianya,LIU Bo,et al.A Space-time Interpolation Methodof Missing Data Based on Spatio-temporal Heterogeneity[J]. Acta Geodaetica et Cartographica Sinica,2016,45(4):458-465. DOI:10.11947/j.AGCS.2016.20150123.

      猜你喜歡
      分區(qū)異質(zhì)性
      上海實施“分區(qū)封控”
      基于可持續(xù)發(fā)展的異質(zhì)性債務(wù)治理與制度完善
      浪莎 分區(qū)而治
      現(xiàn)代社區(qū)異質(zhì)性的變遷與啟示
      基于偏好異質(zhì)性的市場契約設(shè)計及其治理
      區(qū)域異質(zhì)性:農(nóng)村人力資本與農(nóng)民收入增長
      基于SAGA聚類分析的無功電壓控制分區(qū)
      電測與儀表(2015年8期)2015-04-09 11:50:16
      基于多種群遺傳改進(jìn)FCM的無功/電壓控制分區(qū)
      電測與儀表(2015年7期)2015-04-09 11:40:16
      VTS“分區(qū)-分時-分類-定責(zé)”管理模式分析
      1949年前譯本的民族性和異質(zhì)性追考
      龙川县| 习水县| 西城区| 元江| 西吉县| 盐城市| 德庆县| 高安市| 孟津县| 灵璧县| 大港区| 白河县| 汾阳市| 思南县| 浦东新区| 淮南市| 同德县| 新龙县| 乌兰察布市| 奉节县| 阿拉善盟| 房产| 普定县| 蒲城县| 苍溪县| 泸定县| 墨江| 馆陶县| 宁乡县| 大理市| 太仆寺旗| 永平县| 浮梁县| 安泽县| 新津县| 图木舒克市| 日照市| 娄底市| 通海县| 大方县| 磐石市|