倪婷
摘 要 進(jìn)入信息時(shí)代以來(lái),很多先進(jìn)的地理信息科學(xué)技術(shù)在城鎮(zhèn)建設(shè)、土地規(guī)劃、科研等領(lǐng)域發(fā)揮了巨大的促進(jìn)作用。當(dāng)前,時(shí)空數(shù)據(jù)的研究已從通用數(shù)據(jù)模型轉(zhuǎn)向面向應(yīng)用領(lǐng)域的研究;從離散時(shí)空數(shù)據(jù)模型轉(zhuǎn)向連續(xù)時(shí)空數(shù)據(jù)模型的研究;從單一尺度、單一維度時(shí)空數(shù)據(jù)的研究轉(zhuǎn)向多尺度多維度時(shí)空數(shù)據(jù)的研究;時(shí)空數(shù)據(jù)查詢(xún)、管理、表達(dá)、分析和挖掘?qū)⑹侨蘸笱芯康臒狳c(diǎn)問(wèn)題。
關(guān)鍵詞 地理信息科學(xué);時(shí)空數(shù)據(jù);數(shù)據(jù)挖掘
1時(shí)空數(shù)據(jù)研究概述
近30年來(lái),隨著地理信息科學(xué)的發(fā)展、GIS技術(shù)的普及應(yīng)用,GIS空間數(shù)據(jù)量正以空前的速度增長(zhǎng),并且GIS空間數(shù)據(jù)呈現(xiàn)出動(dòng)態(tài)變化的特征,為了應(yīng)對(duì)管理不斷增加的動(dòng)態(tài)空間數(shù)據(jù)的需求,許多GIS學(xué)者致力于時(shí)空數(shù)據(jù)的研究,包括如何表達(dá)、分析和預(yù)測(cè)空間信息隨著時(shí)間變化的過(guò)程。Langran出版了第一本正式介紹時(shí)態(tài)GIS的書(shū)籍,該書(shū)較為系統(tǒng)地論述了時(shí)空數(shù)據(jù)的概念模型和實(shí)現(xiàn),這標(biāo)志了時(shí)空數(shù)據(jù)逐漸成為GIS研究的熱點(diǎn)問(wèn)題[1]。
2大數(shù)據(jù)GIS驅(qū)動(dòng)下的時(shí)空數(shù)據(jù)挖掘研究
網(wǎng)絡(luò)和通信技術(shù)的發(fā)展,傳感器設(shè)備的普及,使得GIS走向大數(shù)據(jù)時(shí)代。如何將GIS大數(shù)據(jù)空間特性和時(shí)間特性有機(jī)結(jié)合,分析并發(fā)現(xiàn)更多有意義的信息將是大數(shù)據(jù)時(shí)代地理信息科學(xué)研究的前沿問(wèn)題,是時(shí)空數(shù)據(jù)挖掘所需要解決的主要科學(xué)問(wèn)題。
雖然GIS時(shí)空數(shù)據(jù)體量在飛速增長(zhǎng),但大量時(shí)空數(shù)據(jù)提供給我們的信息量卻很少,因此需要我們從大量的GIS時(shí)空數(shù)據(jù)中挖掘發(fā)現(xiàn)所需要或有意義的信息。劉大有(2013)等對(duì)時(shí)空數(shù)據(jù)挖掘的定義“從具有海量、高維、高噪聲和非線(xiàn)性等特性的時(shí)空數(shù)據(jù)中提取出隱含的、人們事先不知道的、但又潛在有用的信息及知識(shí)的過(guò)程”。時(shí)空數(shù)據(jù)挖掘研究的主要內(nèi)容包括:時(shí)空自相關(guān)、時(shí)空預(yù)測(cè)、時(shí)空聚類(lèi)和時(shí)空可視化等。
2.1 時(shí)空自相關(guān)與時(shí)空預(yù)測(cè)
地理對(duì)象具有很強(qiáng)的時(shí)空依賴(lài)性,為了發(fā)現(xiàn)這些時(shí)空依賴(lài)性特征,GIS研究者們對(duì)GIS時(shí)空數(shù)據(jù)的自相關(guān)性做了廣泛深入的研究。Cheng(2012)通過(guò)對(duì)公路網(wǎng)數(shù)據(jù)的時(shí)空自相關(guān)結(jié)構(gòu)的分析,建立一個(gè)合適的時(shí)空預(yù)測(cè)模型。該研究使用了倫敦的路網(wǎng)數(shù)據(jù),對(duì)其時(shí)空自相關(guān)性進(jìn)行了探索性的分析。通過(guò)全球和區(qū)域尺度的分析,發(fā)現(xiàn)路網(wǎng)結(jié)構(gòu)的時(shí)空自相關(guān)性是動(dòng)態(tài)、不均勻的。全球尺度的時(shí)空自相關(guān)性無(wú)法解釋路網(wǎng)的結(jié)構(gòu),而區(qū)域動(dòng)態(tài)的則可以進(jìn)行時(shí)空數(shù)據(jù)建模和預(yù)測(cè)[2]。
2.2 時(shí)空聚類(lèi)
時(shí)空數(shù)據(jù)挖掘另一個(gè)十分重要的任務(wù)是從大量的不明確的時(shí)空數(shù)據(jù)中,抽取有意義的模式和關(guān)系。因此我們希望在沒(méi)有任何先驗(yàn)的假設(shè)下從海量的時(shí)空數(shù)據(jù)中搜索到一定的結(jié)構(gòu),然后再據(jù)此結(jié)果形成、歸納提煉我們的假設(shè)。這就是所謂的非監(jiān)督分類(lèi),在時(shí)空數(shù)據(jù)挖掘中最重要的非監(jiān)督分類(lèi)的方式就是聚類(lèi)。這涉及對(duì)時(shí)空數(shù)據(jù)進(jìn)行分組,相似的數(shù)據(jù)在同一個(gè)簇中,不同的簇之間有較高的差異性。時(shí)空聚類(lèi)是一種檢測(cè)海量時(shí)空數(shù)據(jù)中異常值的常見(jiàn)方法。
2.3 時(shí)空可視化
大多數(shù)的地理現(xiàn)象和地理對(duì)象都在隨著時(shí)間變化而變化著,如:森林火災(zāi)、臺(tái)風(fēng)移動(dòng)、海洋污染、河流水位變化、交通擁堵情況等。隨著物聯(lián)網(wǎng)技術(shù)的發(fā)展,人們可輕易捕獲這些動(dòng)態(tài)變化的過(guò)程,如何通過(guò)地圖對(duì)這些動(dòng)態(tài)變化的地理過(guò)程進(jìn)行可視化表達(dá),成為當(dāng)今GIS研究的前沿問(wèn)題。
俞肇元(2012)等基于幾何代數(shù)對(duì)多維時(shí)空?qǐng)鰯?shù)據(jù)組織方法進(jìn)行了構(gòu)建,基于時(shí)空立方體設(shè)計(jì)了數(shù)據(jù)的存儲(chǔ)結(jié)構(gòu),提出了基于張量算子的地學(xué)時(shí)空?qǐng)鰯?shù)據(jù)分析方法。Bachthaler(2012)等基于時(shí)空立方體的方法提出了一種新的時(shí)間變換序列的排序方法,該方法將時(shí)空立方體轉(zhuǎn)換成一種新的可視化方式—軌跡墻,該法可快速有效地對(duì)軌跡屬性進(jìn)行可視化表達(dá),將這一方法應(yīng)用在大城市出租車(chē)軌跡的表達(dá)上,并在表達(dá)方式中加入了時(shí)域透鏡,使其能夠進(jìn)行更高層次的時(shí)空分析。時(shí)域透鏡為交互式定義的空間查詢(xún)顯示出了時(shí)間聚合信息,如圖1:
圖中表示了時(shí)空立方體對(duì)出租車(chē)軌跡時(shí)空數(shù)據(jù)的表達(dá),時(shí)空立方體中,較高速的綠色區(qū)域通常表現(xiàn)為聚集在一起的簇,而紅色和黃色的點(diǎn)為異常數(shù)據(jù),這些點(diǎn)通常聚集在一起,指示著某一區(qū)域存在交通阻塞。
3時(shí)空數(shù)據(jù)研究展望
傳統(tǒng)的GIS重視空間數(shù)據(jù)而往往忽視了數(shù)據(jù)的時(shí)態(tài)性,在未來(lái)快速更新GIS數(shù)據(jù)的環(huán)境下,數(shù)據(jù)的時(shí)態(tài)性將越來(lái)越重要,時(shí)空數(shù)據(jù)的研究雖然已獲得了諸多客觀(guān)的成果,但還遠(yuǎn)不能滿(mǎn)足GIS應(yīng)用的需求,目前對(duì)于高維度、連續(xù)性的時(shí)空數(shù)據(jù)的研究仍存在很多不足,幾何代數(shù)為時(shí)空數(shù)據(jù)的統(tǒng)一表達(dá)和分析開(kāi)辟了一個(gè)全新的領(lǐng)域,但其實(shí)用性仍需進(jìn)一步探討。GIS海量時(shí)空數(shù)據(jù)的積累帶來(lái)了數(shù)量的成倍增長(zhǎng),但我們從中獲取的信息方式仍較為單一,對(duì)于復(fù)雜多樣的時(shí)空數(shù)據(jù)的組織、分析、表達(dá)、查詢(xún)等,還需要不斷提高GIS方法和手段的應(yīng)用研究,這將是未來(lái)GIS研究的前沿問(wèn)題[3]。
總體上看,時(shí)空數(shù)據(jù)經(jīng)歷了一個(gè)理論研究到應(yīng)用研究的過(guò)程,當(dāng)前正是時(shí)空數(shù)據(jù)大爆炸的時(shí)代,各種基于軌跡的時(shí)空數(shù)據(jù)廣泛存在于我們的日常生活中,大數(shù)據(jù)概念的提出將時(shí)空數(shù)據(jù)研究的進(jìn)一步推向GIS研究的熱點(diǎn)。
參考文獻(xiàn)
[1] 劉大有,陳慧靈,齊紅,等.時(shí)空數(shù)據(jù)挖掘研究進(jìn)展[J].計(jì)算機(jī)研究與發(fā)展,2013,50(2):225.
[2] Tao C,James H,Wang J.Spatio-temporal autocorrelation of road network data [J].Journal of Geographical Systems,2012,14(4):389-413.
[3] 俞肇元,袁林旺,羅文,等.基于張量的地學(xué)時(shí)空?qǐng)鰯?shù)據(jù)組織與分析方法[J].遙感技術(shù)與應(yīng)用,2012,27(5):699-705.