徐道柱,焦洋洋,金 澄
(1.信息工程大學(xué) 地理空間信息學(xué)院,河南 鄭州 450052;2 地理信息工程國家重點實驗室,陜西 西安 710054;3.西安測繪研究所,陜西 西安 710054)
分布式空間數(shù)據(jù)庫中矢量數(shù)據(jù)多級空間索引方法研究
徐道柱1,2,3,焦洋洋2,3,金 澄1,2,3
(1.信息工程大學(xué) 地理空間信息學(xué)院,河南 鄭州 450052;2 地理信息工程國家重點實驗室,陜西 西安 710054;3.西安測繪研究所,陜西 西安 710054)
隨著網(wǎng)格計算、云計算等技術(shù)在地理信息領(lǐng)域的應(yīng)用,海量空間數(shù)據(jù)的高效組織與管理成為提供各種數(shù)據(jù)和功能服務(wù)的基礎(chǔ),空間索引是其中的關(guān)鍵問題,文中在分布式空間數(shù)據(jù)庫系統(tǒng)架構(gòu)基礎(chǔ)上,提出一種適應(yīng)分布式環(huán)境下的分層+分塊的矢量數(shù)據(jù)存儲組織模型,設(shè)計包括矢量數(shù)據(jù)面片索引、矢量數(shù)據(jù)層索引、矢量數(shù)據(jù)塊索引以及數(shù)據(jù)塊內(nèi)索引在內(nèi)的多級空間索引。實現(xiàn)表明,文中設(shè)計的空間索引支持并發(fā)創(chuàng)建和高并發(fā)條件下的數(shù)據(jù)高效訪問。
分布式;空間數(shù)據(jù)庫;多級索引;矢量數(shù)據(jù);HHCode索引
面對飛速增長的海量空間數(shù)據(jù),傳統(tǒng)的數(shù)據(jù)管理方式已經(jīng)顯得力不從心。隨著網(wǎng)格計算、云計算等技術(shù)在地理信息領(lǐng)域的應(yīng)用,分布式系統(tǒng)架構(gòu)與并行處理技術(shù)可大大提高地理信息管理、分析和應(yīng)用的性能,已經(jīng)成為研究的熱點。
海量空間數(shù)據(jù)的高效組織與管理是提供各種數(shù)據(jù)和功能服務(wù)的基礎(chǔ),空間索引是其中的關(guān)鍵問題??臻g索引方法大致可分為線性索引、網(wǎng)格索引和樹形索引三大類[1],這幾類索引特點不同,適用場合也各不相同。線性索引是將索引項組織為線性結(jié)構(gòu),結(jié)構(gòu)直觀簡單,但對海量空間數(shù)據(jù)的管理效率較低。網(wǎng)格索引結(jié)構(gòu)簡單,效率較高,當(dāng)實體增加導(dǎo)致實體分布不均勻需重構(gòu)索引[2]。樹形索引是應(yīng)用較為廣泛的空間索引結(jié)構(gòu),衍生索引結(jié)構(gòu)比較多,高維索引大都基于樹形索引實現(xiàn)[3-4]。隨著分布式系統(tǒng)研究逐漸成為熱點,分布式、并行索引成為空間索引的研究熱點,文獻[5-6] 研究了ArcSDE在基礎(chǔ)地理信息數(shù)據(jù)庫存儲和設(shè)計的應(yīng)用;文獻[7-10]研究了MR-tree、R 樹和多級R-tree等空間索引的并行化實現(xiàn);文獻[11]對四叉樹進行面向列式存儲擴展改進,文獻[12-14]將VoR-Tree、雙層倒排網(wǎng)格索引、空間k近鄰查詢與MapReduce編程模型相結(jié)合進行分布式改造。
本文結(jié)合分布式環(huán)境下矢量數(shù)據(jù)的存儲組織模型,設(shè)計了一種多級空間索引,并對相關(guān)索引進行并行化改造提升索引效率,并針對數(shù)據(jù)存儲、索引構(gòu)建、查詢訪問進行相關(guān)實驗。
分布式空間數(shù)據(jù)庫系統(tǒng)架構(gòu)是矢量數(shù)據(jù)存儲組織模型以及空間索引設(shè)計的基礎(chǔ),在進行矢量數(shù)據(jù)存儲組織模型和空間索引設(shè)計時需要充分考慮分布式架構(gòu)下矢量數(shù)據(jù)的使用特點,有的放矢,才能充分發(fā)揮分布式架構(gòu)在存儲量、吞吐量以及并發(fā)性等方面的優(yōu)勢。分布式空間數(shù)據(jù)庫系統(tǒng)架構(gòu)由存儲層和矢量數(shù)據(jù)訪問引擎組成。如圖1所示。
圖1 分布式空間數(shù)據(jù)庫系統(tǒng)
1)存儲層。存儲層作為分布式空間數(shù)據(jù)庫的物理存儲中心,由關(guān)系型數(shù)據(jù)庫和分布式數(shù)據(jù)庫組成,其中關(guān)系型數(shù)據(jù)庫用于存儲矢量數(shù)據(jù)層的屬性數(shù)據(jù)、元數(shù)據(jù),資源目錄等結(jié)構(gòu)化信息;分布式數(shù)據(jù)庫由于存儲矢量數(shù)據(jù),等半結(jié)構(gòu)化數(shù)據(jù)文件。
2)矢量數(shù)據(jù)訪問引擎。矢量數(shù)據(jù)訪問引擎主要為上層應(yīng)用提供統(tǒng)一的矢量數(shù)據(jù)存儲訪問接口。其內(nèi)部使用數(shù)據(jù)調(diào)度緩存、多級空間索引查詢等手段實現(xiàn)對矢量數(shù)據(jù)的高效存儲與訪問。
2.1 分布式存儲組織模型
傳統(tǒng)的矢量數(shù)據(jù)模型,采用將矢量圖層和地理目標進行集中組織存儲,如果一個圖層的地理目標眾多,會帶來數(shù)據(jù)訪問慢、空間索引維護困難、建立空間索引耗費時間長等一系列問題,很難支持多尺度數(shù)據(jù)的快速獲取、網(wǎng)絡(luò)環(huán)境下的“漸進式”傳輸以及地理信息客戶端的“自適應(yīng)”動態(tài)可視化等應(yīng)用。
結(jié)合分布式空間數(shù)據(jù)庫系統(tǒng)架構(gòu)下的矢量數(shù)據(jù)的使用特點,面向矢量數(shù)據(jù)并行入庫、高效訪問的應(yīng)用需求,采用關(guān)系數(shù)據(jù)庫和分布式半結(jié)構(gòu)化數(shù)據(jù)庫相結(jié)合的技術(shù)思路,提出了一種適應(yīng)分布式環(huán)境下的分層+分塊的矢量數(shù)據(jù)存儲組織模型,具體結(jié)構(gòu)如圖2所示。
該矢量數(shù)據(jù)存儲組織模型從結(jié)構(gòu)上由存儲層、調(diào)度層和應(yīng)用層組成:
1)存儲層。描述了矢量數(shù)據(jù)的物理存儲環(huán)境,即將矢量數(shù)據(jù)通過網(wǎng)格剖分生成的所有矢量數(shù)據(jù)面片以小文件的形式存儲于分布式存儲環(huán)境下的各個數(shù)據(jù)節(jié)點上,實現(xiàn)了對海量矢量數(shù)據(jù)的分布式存儲需求;
2)調(diào)度層。描述進行矢量數(shù)據(jù)訪問時,矢量數(shù)據(jù)從存儲層調(diào)度的方式。即根據(jù)調(diào)度條件(如空間范圍),首先確定當(dāng)前調(diào)度的矢量數(shù)據(jù)所在的矢量面片文件并從存儲層讀取,然后根據(jù)矢量面片文件中的矢量數(shù)據(jù)層索引信息,快速獲取需要訪問的矢量數(shù)據(jù)層,并根據(jù)矢量數(shù)據(jù)層中的空間索引信息,計算符合條件的矢量數(shù)據(jù)標識和對應(yīng)的矢量數(shù)據(jù)塊,最后根據(jù)數(shù)據(jù)塊內(nèi)索引獲取所有的矢量數(shù)據(jù),構(gòu)成目標集并緩沖到內(nèi)存,為應(yīng)用層訪問做好數(shù)據(jù)準備。通過數(shù)據(jù)調(diào)度緩存、多級空間索引查詢,調(diào)度層極大地提高矢量數(shù)據(jù)的訪問效率;
3)應(yīng)用層。提供面向用戶的矢量數(shù)據(jù)的存儲訪問方式。當(dāng)調(diào)度層完成矢量數(shù)據(jù)的調(diào)度后,會將符合調(diào)度條件的數(shù)據(jù)以目標集的形式分批加載到應(yīng)用層。
通過分布式空間數(shù)據(jù)庫系統(tǒng)架構(gòu)下矢量數(shù)據(jù)的存儲組織模型設(shè)計,解決了海量矢量數(shù)據(jù)并行入庫和高效訪問的應(yīng)用需求。針對海量矢量數(shù)據(jù)并行入庫應(yīng)用需求,將海量矢量數(shù)據(jù)依據(jù)網(wǎng)格部分規(guī)則(如:Google剖分等)將海量矢量數(shù)據(jù)根據(jù)空間范圍劃分若干個矢量數(shù)據(jù)網(wǎng)格,而一個矢量數(shù)據(jù)網(wǎng)絡(luò)對應(yīng)一個物理上的矢量數(shù)據(jù)面片文件,每個矢量數(shù)據(jù)面片文件中包括某個空間范圍內(nèi)的所有矢量數(shù)據(jù)層的矢量數(shù)據(jù)。通過這種剖分規(guī)則將海量矢量數(shù)據(jù)化整為零,以矢量面片文件的形式存儲在分布式數(shù)據(jù)庫的各個數(shù)據(jù)節(jié)點上,以實現(xiàn)多客戶端并行存儲。通過分布式技術(shù)解決了海量矢量數(shù)據(jù)的存儲以及高并發(fā)訪問的問題,但是其對單用戶的矢量數(shù)據(jù)訪問效率并未有幫助,甚至?xí)档驮L問效率,為此本文設(shè)計了一種多級空間索引機制,以提高矢量數(shù)據(jù)的單次訪問效率。
圖2 矢量數(shù)據(jù)存儲組織模型
2.2 多級空間索引
根據(jù)矢量數(shù)據(jù)的分布式存儲組織模型,矢量數(shù)據(jù)是以矢量數(shù)據(jù)面片的形式組織存儲的,矢量數(shù)據(jù)面片是矢量數(shù)據(jù)物理調(diào)度的最小單元,為了提高矢量面片的訪問效率,設(shè)計以矢量數(shù)據(jù)面片對應(yīng)的矢量網(wǎng)格行列號作為其文件名,當(dāng)進行空間范圍查詢時,可以快速計算該范圍覆蓋的行列號集,從而快速定位符合條件的矢量面片文件。而在矢量數(shù)據(jù)面片內(nèi)部通過矢量數(shù)據(jù)層索引、矢量數(shù)據(jù)塊索引以及數(shù)據(jù)塊內(nèi)索引等多級索引提高矢量數(shù)據(jù)的命中率,極大地提高矢量數(shù)據(jù)的單次訪問效率。其結(jié)構(gòu)如圖3所示。
圖3 矢量數(shù)據(jù)面片結(jié)構(gòu)
由矢量數(shù)據(jù)面片結(jié)構(gòu)圖可以看出,矢量數(shù)據(jù)面片由矢量數(shù)據(jù)層索引信息和若干矢量數(shù)據(jù)層組成,其中在每個矢量數(shù)據(jù)層又由空間索引節(jié)點信息、矢量數(shù)據(jù)塊信息等構(gòu)成;
矢量數(shù)據(jù)層索引信息記錄了該矢量數(shù)據(jù)面片包含的每個矢量數(shù)據(jù)層的名稱,以及在矢量數(shù)據(jù)面片內(nèi)的存儲位置等信息;
空間索引節(jié)點信息是用于描述創(chuàng)建空間索引時生成的所有空間索引節(jié)點,一個空間索引節(jié)點包括節(jié)點信息(節(jié)點Code、級別等)、包含的矢量目標個數(shù)、每個矢量目標的標識、范圍、幾何類型、分級編碼等信息。一個矢量數(shù)據(jù)桶里包括1~N個空間索引節(jié)點;
矢量數(shù)據(jù)塊和空間索引節(jié)點一一對應(yīng),空間索引節(jié)點中只包含矢量目標的標識、幾何類型等信息,而矢量數(shù)據(jù)塊將一個空間索引節(jié)點覆蓋的相鄰矢量目標數(shù)據(jù)以數(shù)據(jù)塊的形式打包,主要包括矢量目標塊內(nèi)索引信息、包含的矢量目標個數(shù)、每個矢量目標幾何信息、拓撲信息、屬性信息等。
2.2.1 矢量數(shù)據(jù)層索引
矢量數(shù)據(jù)層索引信息記錄了該矢量數(shù)據(jù)面片包含的每個矢量數(shù)據(jù)層在矢量數(shù)據(jù)面片內(nèi)部的存儲偏移量,當(dāng)需要訪問該矢量面片中某個矢量數(shù)據(jù)層時,可以通過該索引信息快速定位矢量數(shù)據(jù)層在矢量數(shù)據(jù)面片內(nèi)的存儲位置,實現(xiàn)了矢量數(shù)據(jù)層隨機訪問的能力。
2.2.2 矢量數(shù)據(jù)空間索引
矢量數(shù)據(jù)空間索引是在HHCode(Helical Hyper-spatial Code)的索引機制的基礎(chǔ)上進行了改造,即將HHCODE空間索引數(shù)據(jù)塊化。每個HHCODE空間索引對應(yīng)一定空間范圍內(nèi)的目標集合,并將跨HHCODE空間索引的目標進行升級,提升至上一級HHCODE空間索引節(jié)點,構(gòu)建空間索引節(jié)點樹,實現(xiàn)矢量數(shù)據(jù)按塊查詢調(diào)度,以滿足對矢量數(shù)據(jù)的高效空間查詢需求。
HHCode(Helical Hyper-spatial Code)是目前國際上空間數(shù)據(jù)索引采用的主要技術(shù)之一。 它是由CHS(Canadian Hydrographic Service)于1990年開發(fā)的將多維數(shù)據(jù)轉(zhuǎn)換為一個整數(shù)值的一種編碼技術(shù)。
一維HHCode是對一維矢量數(shù)據(jù)進行二分形成的二進制編碼,m維HHCode是對m維矢量進行二分形成的二進制編碼。以二維地圖為例,HHCode編碼方法如下:
首先,對二維地圖所在的地圖范圍進行逐級四分,每次劃分用2個1比特標識所選區(qū)域,分別標識北/南、西/東方向。這樣,經(jīng)過n級劃分就得到2個n比特串,從高位到低位依次代表從小到大的級別。然后,將這兩個位串按位交叉存儲成一個2n比特的值,所得的二進制編碼即為區(qū)域的n級HHcode編碼值。設(shè)1標識北和東,0標識南和西,2維空間的2級與3級HHCode的編碼如圖4所示。
圖4 二維空間的HHCode編碼
基于HHCode編碼技術(shù)的空間索引本文用HHCODE索引表示。地理目標的HHCODE索引由它所在區(qū)域的HHCode編碼表示,索引值為HHCode編碼值,索引級別為HHCode編碼的級別,一個完整的HHCODE索引表示為<值,級>()。例如,對于圖5中的點P,經(jīng)過4級遞歸劃分后,其北/南方向上的二進制位串位為0011,東/西方向上的二進制位串位為1001,將兩個位串交叉存儲后得到點P的HHCODE索引的值為01001011,HHCODE索引的級為4,點P的完整的HHCODE索引為<01001011,4>。
圖5 地理目標的HHCODE索引
對于線目標和面目標,由于它們都具有大小,所以可能需要不同劃分級別上的多個HHCODE索引才能完整的覆蓋整個目標。例如,在圖5中,面B的索引為<101100,3>,面A的完整的索引如下:
<100010,3>、<100011,3>、<100111010,4>、<100111011,4>、<101000,3>、<101001,3>、<101011,3>、<10101001,4>、<101100,3>、<101110,3>、<10110100,4>、<10110110,4>、<10111000,4>。
一個HHCODE索引對應(yīng)整個空間范圍中的一個空間區(qū)域,通過HHCODE索引可以檢索到這個空間區(qū)域,稱這個空間區(qū)域為相應(yīng)的HHCODE的索引區(qū)域。盡管HHCODE僅以一對整數(shù)值定位空間區(qū)域,但它卻包含了豐富的空間關(guān)系信息,具體表現(xiàn):
1)HHCODE索引能夠體現(xiàn)空間數(shù)據(jù)之間的相等關(guān)系。如果的索引區(qū)域與
的索引區(qū)域相同,則level 1 = level 2,且code 1 = code 2;
2)HHCODE索引能夠體現(xiàn)空間數(shù)據(jù)之間的包含關(guān)系。如果的索引區(qū)域包含
的索引區(qū)域,則level 1 ≤ level 2,且code 2由高到低第1位到第2level 1位與code 1相等;
3)HHCODE索引能夠體現(xiàn)空間數(shù)據(jù)之間的相交關(guān)系。如果的索引區(qū)域與
的索引區(qū)域相交,兩個索引的索引區(qū)域相等或具有包含關(guān)系。
由于HHCODE本身包含豐富的空間關(guān)系信息,因此,利用HHCODE索引可以快速判斷符合某一個范圍的所有HHCODE索引區(qū)域,而每個HHCODE索引區(qū)域都對應(yīng)一個以HHCODE索引的level和code唯一標識的空間索引節(jié)點,空間索引節(jié)點里記錄了對應(yīng)的HHCODE索引范圍內(nèi)所有矢量目標的標識、范圍、主屬性等信息,當(dāng)進行空間條件查詢時,根據(jù)空間范圍條件可以快速計算出其覆蓋所有HHCODE索引范圍,進而獲取到對應(yīng)的所有空間索引節(jié)點和矢量數(shù)據(jù)塊,然后從這些空間索引節(jié)點中提取符合條件的矢量目標標識,根據(jù)矢量目標標識和矢量數(shù)據(jù)塊內(nèi)索引快速從矢量數(shù)據(jù)塊中提取矢量目標數(shù)據(jù),通過這種方式極大地提高矢量數(shù)據(jù)的訪問效率。
2.2.3 矢量數(shù)據(jù)塊內(nèi)索引
矢量數(shù)據(jù)塊內(nèi)索引記錄了該塊內(nèi)每個矢量目標在矢量數(shù)據(jù)塊內(nèi)的存儲位置,其由矢量目標標識和矢量目標在塊內(nèi)的偏移量構(gòu)成,通過需要獲取的矢量目標標識,獲取該矢量目標在矢量數(shù)據(jù)塊內(nèi)的偏移量,達到矢量目標快速加載、隨機訪問的目的。
3.1 實驗環(huán)境和實驗數(shù)據(jù)
本文在實驗環(huán)境中對提出的矢量數(shù)據(jù)存儲組織模型和多級空間索引進行了實驗驗證,實驗硬件環(huán)境包括43臺存儲服務(wù)器用于部署分布式文件系統(tǒng)和分布式數(shù)據(jù)庫,6臺存儲服務(wù)器用于部署關(guān)系數(shù)據(jù)庫,25臺客戶端機器用于部署待入庫數(shù)據(jù)和并行入庫、并發(fā)訪問程序;實驗軟件環(huán)境包括改進后的分布式文件系統(tǒng)HDFS、分布式數(shù)據(jù)庫HBase、達夢關(guān)系數(shù)據(jù)庫(DM7 MPP版本)和并行入庫、并發(fā)訪問實驗軟件。實驗數(shù)據(jù)包括多比例尺、多源矢量數(shù)據(jù)300 GB。
3.2 實驗案例和結(jié)果分析
3.2.1 數(shù)據(jù)入庫和多級索引建立
將試驗數(shù)據(jù)分攤部署在并行客戶端機器上,啟動并行入庫程序,表1為分布式矢量數(shù)據(jù)入庫和傳統(tǒng)數(shù)據(jù)庫管理系統(tǒng)入庫效率對比實驗結(jié)果。
表1 分布式矢量數(shù)據(jù)入庫和傳統(tǒng)數(shù)據(jù)庫管理系統(tǒng)入庫效率比較
實驗結(jié)果分析:
1)通過分布式矢量數(shù)據(jù)入庫、多級索引創(chuàng)建實驗結(jié)果可以看出,隨著數(shù)據(jù)量的增長,在客戶端數(shù)量不變的情況下,入庫時間呈線性增長趨勢,單臺客戶端入庫速度保持穩(wěn)定。
2)通過傳統(tǒng)數(shù)據(jù)庫管理系統(tǒng)入庫、索引創(chuàng)建實驗結(jié)果可以看出,隨著數(shù)據(jù)量的增長,在客戶端數(shù)量不變的情況下,入庫時間呈線性增長趨勢,單臺客戶端入庫速度略有下降。
3)通過對兩者實驗結(jié)果相比較可以看出,通過分布式矢量數(shù)據(jù)入庫,雖然矢量數(shù)據(jù)平均入庫效率沒有提升,反而下降,但總體矢量數(shù)據(jù)裝載時間大大縮短,且可管理數(shù)據(jù)量大大提升。
3.2.2 數(shù)據(jù)并發(fā)訪問效率
在25臺客戶端部署并發(fā)訪問程序,每臺客戶端上分別模擬若干個并發(fā)訪問用戶,并為每個測試執(zhí)行者分配參數(shù)文件序號,執(zhí)行并發(fā)訪問5 min,記錄每個并發(fā)訪問用戶5 min內(nèi)向系統(tǒng)發(fā)送請求的個數(shù)、系統(tǒng)成功處理請求的個數(shù)、系統(tǒng)處理請求成功率,以及成功處理請求的最小、最大、平均響應(yīng)速度。表2為矢量數(shù)據(jù)并發(fā)訪問測試記錄表。
實驗結(jié)果分析:
1)通過分布式矢量數(shù)據(jù)訪問實驗結(jié)果可以看出,隨著并發(fā)訪問量的增加,5 min訪問時間內(nèi)系統(tǒng)處理請求成功率沒有發(fā)生明顯變化,矢量數(shù)據(jù)并發(fā)訪問成功率都達到99%以上;但是矢量數(shù)據(jù)并發(fā)訪問單位時間內(nèi)獲取的要素個數(shù)卻呈逐步下降的趨勢,這與矢量數(shù)據(jù)的屬性數(shù)據(jù)需要使用關(guān)系數(shù)據(jù)庫進行管理有關(guān),當(dāng)訪問量增加時,關(guān)系數(shù)據(jù)庫的響應(yīng)效率將有所下降。
表2 矢量數(shù)據(jù)并發(fā)訪問測試記錄表
2)通過基于傳統(tǒng)數(shù)據(jù)庫的矢量數(shù)據(jù)訪問實驗結(jié)果可以看出,隨著并發(fā)訪問量的增加,5 min訪問時間內(nèi)系統(tǒng)處理請求成功率呈現(xiàn)下降趨勢,而且在矢量數(shù)據(jù)并發(fā)訪問單位時間內(nèi)獲取的要素個數(shù)呈現(xiàn)逐步下降趨勢,說明傳統(tǒng)數(shù)據(jù)庫在并發(fā)訪問量增大的情況下,其處理能力在逐漸下降。
空間索引是海量空間數(shù)據(jù)的高效組織與管理的關(guān)鍵問題,本文在分布式空間數(shù)據(jù)庫系統(tǒng)架構(gòu)基礎(chǔ)上,結(jié)合矢量數(shù)據(jù)的使用特點和應(yīng)用需求,采用關(guān)系數(shù)據(jù)庫和分布式半結(jié)構(gòu)化數(shù)據(jù)庫相結(jié)合的技術(shù)思路,提出了一種適應(yīng)分布式環(huán)境下的分層+分塊的矢量數(shù)據(jù)存儲組織模型,在此基礎(chǔ)上設(shè)計了包括矢量數(shù)據(jù)面片索引、矢量數(shù)據(jù)層索引、矢量數(shù)據(jù)塊索引以及數(shù)據(jù)塊內(nèi)索引在內(nèi)的多級空間索引,并針對數(shù)據(jù)存儲、索引構(gòu)建、查詢訪問進行了相關(guān)實驗。實現(xiàn)表明,本文設(shè)計的空間索引支持并發(fā)創(chuàng)建和高并發(fā)條件下的數(shù)據(jù)高效訪問。在多級索引中矢量數(shù)據(jù)分片、矢量數(shù)據(jù)空間索引數(shù)據(jù)塊化改造等方面還需進一步深入研究、優(yōu)化參數(shù),以期進一步提高數(shù)據(jù)管理效率。
[1] 何珍文,鄭祖芳,劉剛,等.動態(tài)廣義表空間索引方法[J]. 地理與地理信息科學(xué),2011,27(5):9-15.
[2] 周勇. 改進的層次網(wǎng)格空間索引技術(shù)研究與實現(xiàn)[D]. 福州:福州大學(xué),2004.
[3] 蓋森,張心悅,喻峰,等.多尺度位置鍵空間索引方法[J]. 測繪科學(xué),2015,40(8):147-151.
[4] 龔俊,朱慶,張葉廷,等.顧及多細節(jié)層次的三維R 樹索引擴展方法[J].測繪學(xué)報,2011,40(2):249-255.
[5] 孫朝犇,馬學(xué)民,路軒軒,等. ArcSDE在基礎(chǔ)地理信息數(shù)據(jù)庫更新中的應(yīng)用[J].測繪與空間地理信息,2016,39(1):79-81.
[6] 李德元,姚文龍,楊二龍,等. 基于ArcSDE文件地理數(shù)據(jù)庫存儲和設(shè)計的應(yīng)用研究[J].測繪與空間地理信息,2016,39(1):82-84.
[7] 付仲良,劉思遠.MR-tree空間索引的Voronoi圖改進及其并行空間查詢方法[J]. 武漢大學(xué)學(xué)報(信息科學(xué)版),2012,37(12):1490-1494.
[8] 趙園春,李成名,趙春宇.基于R 樹的分布式并行空間索引機制研究[J]. 地理與地理信息科學(xué),2007,23(6):38-81.
[9] 付仲,劉思遠,田宗舜,等.基于多級R-tree的分布式空間索引及其查詢驗證方法研究[J]. 測繪通報,2012 (12):42-46.
[10] 鄭祖芳.分布式并行時空索引技術(shù)研究[D]. 武漢:中國地質(zhì)大學(xué),2014
[11] 涂振發(fā).云計算環(huán)境下海量空間數(shù)據(jù)高效存儲關(guān)鍵技術(shù)研究[D]. 武漢:武漢大學(xué),2012.
[12] 楊文奇,劉 杰,陳飛輪.基于MapReduce 的并行VoR-Tree 索引[J].地理空間信息,2013,11(6):109-111.
[13] 趙敏超,杜震洪,張豐,等.基于MapReduce和雙層倒排網(wǎng)格索引的KNN算法[J].浙江大學(xué)學(xué)報(理學(xué)版),2014,41(6):703-708.
[14] 陳飛輪.基于MapReduce的VoR_Tree索引并行構(gòu)建技術(shù)研究[D].江西贛州:江西理工大學(xué),2012.
[責(zé)任編輯:李銘娜]
Research on multilevel spatial index method of vector data in the distributed spatial database
XU Daozhu1,2,3,JIAO Yangyang2,3,JIN Cheng1,2,3
(1.School of Surveying and Mapping, Information Engineering University, Zhengzhou 450052, China;2.State Key Laboratory of Geo-information Engineering, Xi’an 710054, China;3.Xi’an Station of Surveying and Mapping, Xi’an 710054, China)
Distributed computing and cloud computing technology have been applied to the field of geographic information, offering a variety of data and function services based on the efficient organization and management of massive spatial data. Spatial index is the key problem. Based on distributed spatial database system architecture, the paper proposes a layered and blocked vector data storage organization model which adapts to the distributed environment, along with a multilevel spatial index that included patch index, layer index, block index and inside block index of the vector data. The experiments illustrate that the model designed in the paper supports the concurrent create spatial index and efficient data access under the condition of high concurrency.
distributed; spatial database; multilevel index; vector data;HHCode index
著錄:徐道柱,焦洋洋,金澄.分布式空間數(shù)據(jù)庫中矢量數(shù)據(jù)多級空間索引方法研究[J].測繪工程,2017,26(10):1-6.
10.19349/j.cnki.issn1006-7949.2017.10.001
2016-07-18
國家自然科學(xué)基金資助項目(41201469)
徐道柱(1982-),男,助理研究員,博士研究生.
TP391
A
1006-7949(2017)10-0001-06