李 喆,譚德寶,程學軍,汪朝暉,宋 麗
基于GeoDatabase的長江流域生態(tài)環(huán)境信息庫模型
李 喆,譚德寶,程學軍,汪朝暉,宋 麗
(長江科學院空間信息技術應用研究所,武漢 430010)
從空間數(shù)據(jù)庫模型的角度出發(fā),深入分析長江流域生態(tài)環(huán)境數(shù)據(jù)的主要種類及其特點,引入GeoDatabase模型的基本概念,嘗試使用GeoDatabase模型來組織和管理這些數(shù)據(jù),并分別給出長江流域生態(tài)環(huán)境信息庫中特征數(shù)據(jù)集、柵格數(shù)據(jù)集和TIN數(shù)據(jù)集的組織方式,討論空間數(shù)據(jù)與屬性數(shù)據(jù)的連接方法,最后進行了模型評價。
長江流域生態(tài)環(huán)境信息庫;空間數(shù)據(jù)模型;GeoDatabase模型
長江是我國第一大河流,流域范圍覆蓋了全國18%的國土面積,它集中了全國30%的人口和40%的國內(nèi)生產(chǎn)總值,具有豐富的自然資源和區(qū)位優(yōu)勢[1]。當前,長江流域面臨著洪澇災害、突發(fā)性水污染、水體富營養(yǎng)化、水土流失等突出問題,對于流域生態(tài)環(huán)境保護提出了更高的要求。在“3S”技術的支持下,通過衛(wèi)星、飛機、船舶、潛艇、浮標等立體對地觀測網(wǎng)絡,構建覆蓋整個長江流域的生態(tài)環(huán)境信息庫,實現(xiàn)長江流域生態(tài)環(huán)境快速監(jiān)測,對于全流域經(jīng)濟可持續(xù)發(fā)展具有重要的意義。這一信息庫中的數(shù)據(jù)具有不同來源、不同時相、不同類型等特點,如何有效地進行數(shù)據(jù)組織成為急需解決的一個重要難題。
在地理信息系統(tǒng)中,數(shù)據(jù)主要分為空間數(shù)據(jù)和屬性數(shù)據(jù)兩大類型。在地理信息系統(tǒng)發(fā)展的早期,采用的空間數(shù)據(jù)模型主要是矢量數(shù)據(jù)模型和柵格數(shù)據(jù)模型[2],僅能表達簡單的平面拓撲關系,對客觀世界的表達只是簡單的點、線、面,具有很大的局限性。隨著面向對象思想的引入,采用面向對象方法設計的數(shù)據(jù)模型越來越受到關注,出現(xiàn)針對特定現(xiàn)象的數(shù)據(jù)模型。裴相斌等[3]研究大連灣水污染擴散問題,提出GIS-SD相結合的數(shù)據(jù)模型,并建立大連灣水污染時空模擬與調控系統(tǒng)。邵全琴[4]針對第三類海洋現(xiàn)象,例如:躍層、渦旋、鋒面、水團等,提出了場對象的概念,并給出面向場對象的時空數(shù)據(jù)模型。該模型具有雙層結構:下層為基于海洋過程的基礎數(shù)據(jù)組織;上層為基于時空三域方法的場對象數(shù)據(jù)表達。但是水文過程具有復雜、模糊、不確定等特點,針對某種特定現(xiàn)象建立的數(shù)據(jù)模型可能不適用于其他現(xiàn)象,很難構成統(tǒng)一的能夠處理所有現(xiàn)象的通用數(shù)據(jù)模型。
隨著數(shù)據(jù)容量的不斷增大,空間數(shù)據(jù)組織方法以及數(shù)據(jù)庫技術的不斷發(fā)展,空間數(shù)據(jù)庫模型成為GIS數(shù)據(jù)模型發(fā)展的一個新方向[5,6]。GeoDatabase模型是美國ERSI推出的空間數(shù)據(jù)庫模型,可以較好地建立對象之間的拓撲關系,描述現(xiàn)實世界不同對象的空間、屬性信息以及相互關系。
為了滿足建設長江流域生態(tài)環(huán)境信息庫的基本需要,保證數(shù)據(jù)完全覆蓋和數(shù)據(jù)質量,盡可能減少數(shù)據(jù)冗余,必須收集以下幾類數(shù)據(jù)[7]。
(1)基礎地理信息數(shù)據(jù):包括整個長江流域1∶50 000DLG,1∶50 000DEM以及1∶50 000DOM、重點區(qū)域的高分辨率遙感數(shù)據(jù)。
(2)專題地理信息:包括土地利用、水雨情、工情、水文、水質、水土保持、河流生態(tài)指標、河流形態(tài)特征結構、河岸帶狀況等。
(3)人口社會經(jīng)濟數(shù)據(jù):包括長江流域的全省各縣市的社會經(jīng)濟統(tǒng)計信息。
(4)多媒體音像資料:包括靜態(tài)影像(工程照片等)、聲音數(shù)據(jù)、錄像等。
長江流域生態(tài)環(huán)境信息庫的數(shù)據(jù)分類見表1。
表1 長江流域生態(tài)環(huán)境信息庫的數(shù)據(jù)分類表Table 1 Data classification of the Yangtze River eco-environment in formation database
從整體上分析,這些數(shù)據(jù)具有如下的特點:
(1)數(shù)據(jù)內(nèi)容廣泛,種類繁雜,數(shù)據(jù)存儲格式不一致。由于數(shù)據(jù)獲取方式不同,每一種格式的內(nèi)部結構各不相同,使得各類數(shù)據(jù)存在著各自不同的存儲方式。目前,大部分數(shù)據(jù)是基于文件管理的,如基礎地理信息數(shù)據(jù)就有ArcInfo、Mapinfo、AutoCAD等,其他類型的存儲格式更多,如Excel格式、Word格式、文本格式、AVI格式等,不支持直接共享。
(2)需要提供海量數(shù)據(jù)獲取、處理和管理的技術支持。長江流域生態(tài)環(huán)境數(shù)據(jù)是大量不同歷史、不同尺度、不同區(qū)域的時空數(shù)據(jù)和非時空數(shù)據(jù)的積累。早期數(shù)據(jù)有以年為周期的,近期數(shù)據(jù)有以月、天或小時為周期的,數(shù)據(jù)量龐大。如何將已經(jīng)有的和在不斷建設中的數(shù)據(jù)進行整合和管理,實現(xiàn)數(shù)據(jù)的高效檢索已經(jīng)成為一個急需解決的問題。
GeoDatabase模型是ESRI公司在ArcGIS 8.0中推出的一種面向對象的地理數(shù)據(jù)模型[8,9],可以較好地建立對象之間的拓撲關系,能夠更好地描述現(xiàn)實世界不同對象的空間信息、屬性信息及其相互關系。GeoDatabase模型的對象關系框架圖如圖1所示。從圖1可知,GeoDatabase模型包括如下4種地理數(shù)據(jù)。
圖1 GeoDatabase模型的對象關系框架Fig.1 Object-relational fram ework of GeoDatabasemodel
(1)特征數(shù)據(jù)集:特征數(shù)據(jù)集是存儲空間對象(特征)、非空間對象(對象)及其關系的容器,拓撲關系用網(wǎng)絡和平面圖等描述。GeoDatabase也存儲一些有效的規(guī)則和域,當特征數(shù)值被創(chuàng)建或更新時,用來確保它們的屬性在與它們相關聯(lián)的特征和對象中繼續(xù)有效。
(2)柵格數(shù)據(jù)集:用柵格表示網(wǎng)格離散化的數(shù)據(jù),如多分辨率遙感影像、規(guī)則網(wǎng)格格式的數(shù)字高程模型(DEM)以及各種專題圖等。
(3)TIN(不規(guī)則三角網(wǎng))數(shù)據(jù)集:將TIN作為一個帶有高程值的節(jié)點和帶有邊的三角形整體來對待,可以支持各種空間分析,如通視分析等。
(4)定位器:定位器是一種將地址轉換成空間位置的操作方法,可以直接找到任意點在地圖上相應的空間位置等特征。
GeoDatabase模型利用如下方式規(guī)范化描述空間數(shù)據(jù),即:利用矢量特征建模離散對象;利用柵格特征建模連續(xù)對象;利用TIN建模地球表面;利用定位器和地址建模位置索引。
除了空間拓撲關系之外,該模型建立一套完整的拓撲特征,能夠定義對象和特征之間的關系。通過域和檢查規(guī)則,該模型強制實現(xiàn)對象屬性的整體約束性,并將自然的特征行為綁定在存儲特征里。該模型還提供了多版本支持,以便眾多用戶編輯和索引同樣的數(shù)據(jù)。
4.1 空間數(shù)據(jù)組織
空間數(shù)據(jù)主要分為圖形數(shù)據(jù)和屬性數(shù)據(jù)兩部分。圖形數(shù)據(jù)采用矢量數(shù)據(jù)模型來管理,以點、線、面表示研究區(qū)域內(nèi)的空間對象,采用一系列坐標予以描述。圖形數(shù)據(jù)中每個地物均有其對應的唯一的標識(ID號),以此為索引建立該地物的屬性數(shù)據(jù)。空間數(shù)據(jù)通過將圖形數(shù)據(jù)記錄的關鍵字設為圖形文件中該地物唯一的標識(ID號),建立起屬性數(shù)據(jù)與圖形數(shù)據(jù)之間的聯(lián)系。這種聯(lián)系被稱作“空間對象+空間索引”的拓撲關系,基于這種關系的數(shù)據(jù)模型可以規(guī)范描述為“對象-關系”模型。
4.1.1 特征數(shù)據(jù)集
特征數(shù)據(jù)集包括空間數(shù)據(jù)及其對應的屬性信息??臻g數(shù)據(jù)主要采用Shapefile模型,其數(shù)據(jù)組織方式如表2所示。
表2 特征數(shù)據(jù)集組織方式Table 2 Feature database organization
屬性數(shù)據(jù)中包含該要素的常規(guī)信息(如名稱、編碼等),還包括與該要素相關聯(lián)的其他編碼。以河道邊界線為例,屬性表部分結構如表3所示。
表3 河道邊界屬性表結構Table 3 Boundary attribute structure
4.1.2 柵格數(shù)據(jù)集
柵格數(shù)據(jù)主要采用Coverage模型,其數(shù)據(jù)表部分結構如表4所示。
表4 柵格數(shù)據(jù)表結構Table 4 Raster database structure
4.1.3 TIN數(shù)據(jù)集
TIN數(shù)據(jù)表部分結構如表5所示。
表5 TIN數(shù)據(jù)表部分結構Table 5 TIN database structure
4.2 屬性數(shù)據(jù)組織
屬性數(shù)據(jù)是在關系數(shù)據(jù)庫Oracle/SQL Server中,采用ERA模型進行設計[7]。系統(tǒng)中的空間對象是客觀存在并可相互區(qū)分的實物,如沙洲、河道邊界線;屬性是對象所具有的特征,如沙洲的名稱、沙洲的面積等;關系是獨立對象相互之間的聯(lián)系,如河流和沙洲之間是河流包含沙洲的關系。ERA模型就是一系列的二維表,表中行(記錄)代表對象,列(字段)代表屬性,表本身就代表著關系。
構建屬性數(shù)據(jù)庫的關鍵是表體結構和表與表之間的關系。設計表結構時,必須遵循的規(guī)則有:①表間不應該有重復信息,每條信息只保存在一個表內(nèi);②每個表應該只包含關于一個主題的信息,這樣可以獨立于其他主題維護每個主題的信息。首先確定表中需要的字段,其次明確主鍵,隨后確定表之間的關系,最后導入各種數(shù)據(jù)。
按照上述原則,建立地表水的水質監(jiān)測表部分結構見表6。
表6 水質監(jiān)測表結構Table 6 Water quality table structure
數(shù)據(jù)庫內(nèi)表與表之間的聯(lián)系可以通過主鍵和外鍵的設定來實現(xiàn)。多個屬性表之間則通過外鍵(即統(tǒng)一標識碼)來相互連接。圖2以水質監(jiān)測表、氣象信息表與斷面信息表之間的關聯(lián)為例,展示了多個屬性數(shù)據(jù)表之間的關聯(lián)。
圖2 水質監(jiān)測表、氣象表與水文斷面表之間的關聯(lián)Fig.2 The relationship among water quality table,meteorology table and hydrology section
4.3 空間數(shù)據(jù)與屬性數(shù)據(jù)的連接
GeoDatabase模型對于空間數(shù)據(jù)和屬性數(shù)據(jù)分開進行管理。其中屬性數(shù)據(jù)采用成熟的關系數(shù)據(jù)庫(如Oracle,SQL Server等)管理,空間數(shù)據(jù)與屬性數(shù)據(jù)的關聯(lián)是由ArcSDE等空間數(shù)據(jù)引擎負責??臻g數(shù)據(jù)與屬性數(shù)據(jù)的連接見圖3所示。
圖3 空間數(shù)據(jù)與屬性數(shù)據(jù)的連接Fig.3 The link between spatial data and attribute data
本文將GeoDatabase引入長江流域生態(tài)環(huán)境信息庫中,利用Oracle/SQL Server等來管理各種屬性數(shù)據(jù),并通過ArcSDE進行空間數(shù)據(jù)與屬性數(shù)據(jù)之間的連接,可以方便地管理種類繁雜、格式不一致的多種數(shù)據(jù),并可提供海量數(shù)據(jù)處理的功能。該方案在長江流域生態(tài)環(huán)境信息庫中得到了初步應用,并取得一定的成果。
由于空間數(shù)據(jù)容量過于龐大、數(shù)據(jù)種類復雜、計算機處理能力有限,在實際應用中,GeoDatabase仍然存在不足之處。例如,GeoDatabase并不提供LOD(Level of Details)多分辨率層次結構[10]。LOD模型在地表建模時,充分考慮人的視覺特點,對于處于視覺不同區(qū)域的模型采用不同的分辨率,在近處觀察物體時采用精細模型,在遠處采用較為粗糙的模型。GeoDatabase數(shù)據(jù)組織時,只是建立了一個分辨率結構,并沒有建立多個層次,因此難以構建LOD結構。另外,GeoDatabase是基于地圖投影建立的平面模型,地球表面是一個不規(guī)則橢球面,很難找到一種適宜于全球范圍的等面積(或等距離)地圖投影,因此它難以支持大范圍乃至全球數(shù)據(jù)一體化組織。下一步的工作是在GeoDatabase框架的基礎上,研發(fā)多分辨率層次數(shù)據(jù)結構,構建大尺度多層次空間數(shù)據(jù)模型,為全球無縫空間數(shù)據(jù)庫、數(shù)字流域、長江流域整體數(shù)字模型等提供技術支撐。
[1] 長江水利委員會技術委員會.長江流域綜合利用規(guī)劃研究[M].北京:中國水利水電出版社,2003.(Changjiang Water Resource Commission.Comprehen-sive utilization planning of the Yangtze River Basin[M].Beijing:Water Resources and Hydropower Press,2003.(in Chinese))
[2] 陳述彭,魯學軍,周成虎.地理信息系統(tǒng)導論[M].北京:科學出版社,1999.(CHEN Shu-peng,LU Xue-jun,ZHOU Cheng-hu.The introduction to geographical infor- mation system[M].Beijing:Science Press,1999.(in Chinese))
[3] 裴相斌,趙冬至.基于GIS-SD的大連灣水污染時空模擬與調控策略研究[J].遙感學報,2000,4(2):118-123.(PEIXiang-bin,ZHAO Dong-zhi.Dalian day water pollution sptio-temporal simulation and control strategy based on GIS-SD[J].Chinese Journal of Remote Sens-ing,2000,4(2):118-123.(in Chinese))
[4] 邵全琴.海洋地理信息系統(tǒng)時空數(shù)據(jù)表達研究[D].北京:中科院地理科學與資源研究所,2001.(SHAO Quan-qin.Spatio-temporal data description of marine GIS[D].Beijing:Chinese Academy of Sciences,2001.(in Chinese))
[5] 趙儒生,楊崇俊.空間數(shù)據(jù)倉庫的技術與實踐[J].遙感學報,2000,4(2):157-160.(ZHAO Ru-sheng,YANG Cong-jun.Spatial data warehouse technology[J].Chinese Journal of Remote Sensing,2000,4(2):157-160.(in Chinese))
[6] 王 珊,陳 紅.數(shù)據(jù)庫系統(tǒng)原理教程[M].北京:清華大學出版社,2003.(WANG Shan,CHEN Hong.Principal of database system[M].Beijing:Tsinghua Uni-versity Press,2003.(in Chinese))
[7] 程學軍,譚德寶,汪朝輝,等.長江流域生態(tài)環(huán)境信息庫總體方案設計與示范區(qū)建立[J].長江科學院院報,2009,(2):48-52.(CHENG Xue-jun,TAN De-bao,WANG Zhao-hui,et al.General design of Changjiang River Basin Eco-environmental information database and demonstration area establishment[J].Journal of Yangtze River Scientific Research Institute,2009,(2):48-52.(in Chinese))
[8] 宋 楊,萬幼川.一種新型空間數(shù)據(jù)模型GeoDatabase[J].測繪通報,2004,(11):31-33.(SONG Yang,WAN You-chuan.A new spatial data model-geodatabase[J].Surveying and Mapping Bulletin,2004,(11):31-33.(in Chinese))
[9] 程昌秀,周成虎,陸 鋒.Arc/Info 8中面向對象空間數(shù)據(jù)模型的應用[J].地球信息科學,2002,(3):113-117.(CHEN Chang-xiu,ZHOU Cheng-hu,LU Feng.Application of object-oriented spatial datamodel in arcIn-fo 8[J].Geo-information Science,2002,(3):113-117.(in Chinese))
[10]方 裕,周成虎,景貴飛,等.第四代GIS軟件研究[J].中國圖象圖形學報,2001,(9):817-823.(FANG Yu,ZHOU Cheng-hu,JING Gui-fei,et al.The fourth generation of GIS software[J].Chinese Journal of Image and Graphics,2001,(9):817-823.(in Chi-nese) )
(編輯:羅玉蘭)
Spatial Data M odel of Yangtze River Eco-environment Information Database Based on GeoDatabase
LIZhe,TAN De-bao,CHENG Xue-jun,WANG Zhao-hui,SONG Li
(Spatial Information Technology Application Institute,Yangtze River Scientific Research Institute,Wuhan 430010,China)
From the perspective of the recent advance of spatial database modeling technology,this paper deeply analyses data classification and their characters of the Yangtze River Eco-environment Information Database(YREID),introduces basic concepts of GeoDatabasemodel,and attempts tomanage and organize these data using GeoDatabasemodel.Then it provides data organization of feature dataset,raster datasetand TIN dataset in YREID,and discusses the links between spatial database and attribute database.Finally,model evaluation and its future ad-vance are also presented.
Yangtze River Eco-environment Information Database(YREID);spatial data modeling;GeoDatabase
P208
A
1001-5485(2010)01-0004-05
2009-06-09;
2009-11-24
長江科學院中央級公益性科研院所基本科研業(yè)務費項目(YWF0718/KJ01);長江科學院博士啟動課題(YJJ0910/KJ02)資助
李 ?(1980-),男,湖北監(jiān)利人,工程師,理學博士,博士后,主要從事水旱災情監(jiān)測、生態(tài)環(huán)境監(jiān)測與評估、數(shù)字流域、“3S”技術在水利中的應用工作,(電話)027-82926550(電子信箱)lizhe@m(xù)ail.crsri.cn。