樂 恒,高 峰,張偉偉
(1.寧波市規(guī)劃與地理信息中心,浙江 寧波 315040)
空間數(shù)據(jù)質(zhì)檢軟件的設(shè)計(jì)與實(shí)現(xiàn)
樂 恒1,高 峰1,張偉偉1
(1.寧波市規(guī)劃與地理信息中心,浙江 寧波 315040)
空間數(shù)據(jù)質(zhì)量檢查軟件可有效提升數(shù)據(jù)檢查的效率和正確率,保障空間數(shù)據(jù)質(zhì)量。根據(jù)空間數(shù)據(jù)處理應(yīng)用工作的實(shí)踐,設(shè)計(jì)了空間數(shù)據(jù)質(zhì)檢軟件的總體框架,介紹了實(shí)現(xiàn)過程中的關(guān)鍵技術(shù),并建立了從后端數(shù)據(jù)規(guī)則配置到前臺質(zhì)量檢查和檢查結(jié)果評價(jià)等一整套工作流程。
空間數(shù)據(jù);質(zhì)檢軟件;質(zhì)檢規(guī)則;數(shù)據(jù)質(zhì)量元素
數(shù)字城市、地理空間數(shù)據(jù)框架等概念的相繼提出,意味著空間數(shù)據(jù)的發(fā)展方向逐漸從單純的制圖表示向分析決策轉(zhuǎn)變[1]。為了符合這種發(fā)展趨勢,空間數(shù)據(jù)建立了如實(shí)體、空間關(guān)系、屬性關(guān)聯(lián)等一系列的基本概念,這種圖屬一體的數(shù)據(jù)組織方式也對空間數(shù)據(jù)質(zhì)量提出了更高的要求??臻g數(shù)據(jù)質(zhì)量作為數(shù)據(jù)的生命線,直接影響分析應(yīng)用的正確性和可靠性[2],因此亟需建立一套完善的數(shù)據(jù)檢查機(jī)制。傳統(tǒng)的數(shù)據(jù)檢查方法多以人工方式完成,在面對海量空間數(shù)據(jù)的檢查時(shí),不易保證檢查效率和結(jié)果準(zhǔn)確率。開發(fā)一套規(guī)范的、通用的、自動的、高效的數(shù)據(jù)質(zhì)量檢查軟件[3],能夠解決人工檢查步驟繁瑣和耗時(shí)長的問題,也能減少因人工干預(yù)而造成的疏忽和遺漏。
1.1 設(shè)計(jì)思路
本文充分研究了國內(nèi)外空間數(shù)據(jù)質(zhì)量的基本特性和發(fā)展方向,結(jié)合質(zhì)檢工作的實(shí)際情況,形成的設(shè)計(jì)思路為:
1) 滿足海量空間數(shù)據(jù)的檢查需求,并保證整個(gè)檢查過程的精確和高效;
2)滿足多種空間數(shù)據(jù)格式的檢查需求,能支持shapefile、ArcSDE、Personal Geodatabase、File Geodatabase等ESRI公司主要數(shù)據(jù)格式;
3)設(shè)計(jì)一套滿足不同內(nèi)容數(shù)據(jù)(地下管線、各種比例尺基礎(chǔ)地形、各級規(guī)劃編制數(shù)據(jù)等)檢查需求的質(zhì)檢規(guī)則體系,避免因數(shù)據(jù)種類增加、數(shù)據(jù)標(biāo)準(zhǔn)改變等原因而造成的軟件再次開發(fā)和投入;
4)提供科學(xué)、合理、注重用戶體驗(yàn)的數(shù)據(jù)檢查方式和檢查結(jié)果展現(xiàn)方式,并形成以空間數(shù)據(jù)質(zhì)量模型為基礎(chǔ)的質(zhì)量評價(jià)體系。
1.2 總體框架
質(zhì)檢軟件采用兩層框架體系,按照功能和使用人員不同可分為規(guī)則配置端和數(shù)據(jù)檢查端。規(guī)則配置端是質(zhì)檢規(guī)則的創(chuàng)建和調(diào)整工具。由于質(zhì)檢規(guī)則都是以數(shù)據(jù)標(biāo)準(zhǔn)為基礎(chǔ),以數(shù)據(jù)生產(chǎn)過程中的經(jīng)驗(yàn)為補(bǔ)充而形成的,這就要求使用人員必須深入了解數(shù)據(jù)標(biāo)準(zhǔn)和數(shù)據(jù)生產(chǎn)流程。數(shù)據(jù)檢查端是質(zhì)量檢查和結(jié)果評價(jià)的工具。其要求使用人員能正確判斷檢查結(jié)果,但并不要求完全掌握規(guī)則形成的原理。質(zhì)檢軟件的總體框架如圖1所示。
圖1 質(zhì)檢軟件總體框架
空間數(shù)據(jù)質(zhì)檢軟件以ArcGIS Engine+ File Geodatabase為平臺進(jìn)行開發(fā),不僅充分利用了ArcGIS在空間數(shù)據(jù)分析中的優(yōu)勢,同時(shí)還能發(fā)揮File Geodatabase在數(shù)據(jù)存儲和讀寫效率上的特長。
2.1 可配置的質(zhì)檢規(guī)則和任務(wù)體系
在規(guī)則配置端設(shè)計(jì)了基礎(chǔ)規(guī)則、質(zhì)檢規(guī)則和質(zhì)檢方案3層結(jié)構(gòu),通過層層定制的方式實(shí)現(xiàn)可配置的質(zhì)檢規(guī)則和任務(wù)體系。
2.1.1 可配置的質(zhì)檢規(guī)則
質(zhì)檢規(guī)則并不是一成不變的,它可能因數(shù)據(jù)種類的增加而增加,也可能因數(shù)據(jù)標(biāo)準(zhǔn)的調(diào)整而調(diào)整。若質(zhì)檢規(guī)則變化只能通過修改源代碼來完成,將大大降低程序的持續(xù)性、穩(wěn)定性和可用性。因此設(shè)計(jì)一套可配置的質(zhì)檢規(guī)則對軟件有著重要意義。
規(guī)則配置人員首先通過數(shù)據(jù)認(rèn)知轉(zhuǎn)換為物理模型表達(dá)的方法[4]將文字性描述信息轉(zhuǎn)變?yōu)橘|(zhì)檢軟件的基礎(chǔ)規(guī)則,然后對規(guī)則進(jìn)行排列組合和參數(shù)調(diào)整,最終實(shí)現(xiàn)規(guī)則的可配置?;A(chǔ)規(guī)則一般是指數(shù)據(jù)的本質(zhì)特性,是通過沉淀、抽象和總結(jié)多類型、多格式、海量空間數(shù)據(jù)的內(nèi)在邏輯關(guān)系而形成的。經(jīng)過不斷積累和反復(fù)驗(yàn)證,目前質(zhì)檢軟件采用的質(zhì)檢規(guī)則包括:庫體結(jié)構(gòu)質(zhì)檢規(guī)則、拓?fù)滟|(zhì)檢規(guī)則、屬性質(zhì)檢規(guī)則、懸掛點(diǎn)質(zhì)檢規(guī)則和線連通性質(zhì)檢規(guī)則等。
以大比例尺基礎(chǔ)地形圖的高程檢查為例,該質(zhì)檢規(guī)則的文字性描述可表達(dá)為:一般高程點(diǎn)附近都有高程注記,且標(biāo)注的高程值必須正確。通過拓?fù)滟|(zhì)檢規(guī)則(點(diǎn)和注記的空間最近關(guān)系)和屬性質(zhì)檢規(guī)則(高程點(diǎn)的Altitude字段值等于高程注記的TextString字段值)的組合來實(shí)現(xiàn)可配置的質(zhì)檢規(guī)則(表1)。
表1 高程檢查規(guī)則模型表達(dá)
2.1.2 可配置的任務(wù)體系
同一套數(shù)據(jù)面向不同的應(yīng)用時(shí),對質(zhì)量的要求也不盡相同。當(dāng)側(cè)重于制圖表達(dá)時(shí)會注重圖形質(zhì)量,當(dāng)側(cè)重于空間分析時(shí)則更偏向于屬性質(zhì)量。因此在質(zhì)檢規(guī)則層的基礎(chǔ)上設(shè)計(jì)了質(zhì)檢任務(wù)層,可針對不同的檢查需要定制不同的質(zhì)檢任務(wù)。質(zhì)檢任務(wù)體系的定制流程見圖2。
圖2 質(zhì)檢任務(wù)定制流程圖
2.2 支持多種數(shù)據(jù)格式的檢查方式
質(zhì)檢軟件以File Geodatabase作為進(jìn)行數(shù)據(jù)檢查的中間載體,通過把其他格式數(shù)據(jù)轉(zhuǎn)換為File Geodatabase后再進(jìn)行檢查的方法來實(shí)現(xiàn)對多種數(shù)據(jù)格式的檢查。
保證信息在格式轉(zhuǎn)換過程中的完整性是實(shí)現(xiàn)多種數(shù)據(jù)格式檢查的關(guān)鍵。數(shù)據(jù)格式轉(zhuǎn)換從本質(zhì)上講是數(shù)據(jù)模型之間的轉(zhuǎn)換[5],質(zhì)檢軟件采用了ArcGIS支持的OGR技術(shù)。OGR是開源矢量空間數(shù)據(jù)轉(zhuǎn)換技術(shù),它利用抽象數(shù)據(jù)模型來表達(dá)所支持的各種文件格式,同時(shí)提供一系列命令行工具來進(jìn)行數(shù)據(jù)轉(zhuǎn)換和處理。
空間數(shù)據(jù)通過主鍵管理的方式對要素進(jìn)行唯一識別,但格式轉(zhuǎn)換后的數(shù)據(jù)會重新生成主鍵。為了保證格式轉(zhuǎn)換前后兩套空間數(shù)據(jù)能通過主鍵建立一一對應(yīng)關(guān)系,轉(zhuǎn)換后的數(shù)據(jù)添加了OID字段來記錄原始數(shù)據(jù)的主鍵。
以shapefile數(shù)據(jù)為例,介紹質(zhì)檢軟件支持多數(shù)據(jù)格式的檢查方式,具體見圖3。
圖3 支持多種數(shù)據(jù)格式的檢查方式
2.3 基于空間數(shù)據(jù)質(zhì)量模型的評價(jià)體系
空間數(shù)據(jù)質(zhì)量模型是用于標(biāo)識和評定質(zhì)量信息的形式結(jié)構(gòu),是各種質(zhì)量元素共同作用的結(jié)果。國內(nèi)外學(xué)者對采用哪些質(zhì)量元素來描述模型展開了深入研究,基于不同的觀點(diǎn),提出了很多評價(jià)空間數(shù)據(jù)的質(zhì)量元素和指標(biāo),目前尚無統(tǒng)一的空間數(shù)據(jù)質(zhì)量模型[6]。
本文在研究了國內(nèi)外有關(guān)成果的基礎(chǔ)上,結(jié)合工作實(shí)際,通過層次化抽象方法建立了空間數(shù)據(jù)質(zhì)量模型??臻g數(shù)據(jù)一級質(zhì)量元素可歸納為數(shù)據(jù)組織、圖形質(zhì)量、屬性精度和邏輯一致性等,具體如表2所示。
表2 空間數(shù)據(jù)質(zhì)量模型與質(zhì)量元素
空間數(shù)據(jù)質(zhì)量模型中各質(zhì)量元素對綜合評價(jià)結(jié)果的貢獻(xiàn)大小采用權(quán)重系數(shù)表示[7]。在評價(jià)體系中,質(zhì)量元素的權(quán)重系數(shù)并不是固定的,使用人員可根據(jù)質(zhì)檢任務(wù)的要求對權(quán)重系數(shù)進(jìn)行調(diào)整。評價(jià)方法采用系數(shù)累加的方式,即把未發(fā)現(xiàn)錯誤的質(zhì)量元素權(quán)重系數(shù)進(jìn)行累加,得到最終評價(jià)結(jié)果。例如,大比例尺基礎(chǔ)地形的大面積修測項(xiàng)目和單個(gè)竣工測量項(xiàng)目對權(quán)重系數(shù)的側(cè)重就不同。根據(jù)項(xiàng)目的特點(diǎn),大面積修測項(xiàng)目應(yīng)適當(dāng)上調(diào)數(shù)據(jù)組織、圖形質(zhì)量方面的權(quán)重系數(shù),而單個(gè)竣工測量項(xiàng)目應(yīng)適當(dāng)上調(diào)屬性精度、邏輯一致性方面(特別是接邊精度)的權(quán)重系數(shù)。
本文論述了空間數(shù)據(jù)質(zhì)檢軟件的總體框架和實(shí)現(xiàn)過程中的關(guān)鍵技術(shù),設(shè)計(jì)并實(shí)現(xiàn)了從后端數(shù)據(jù)規(guī)則配置到前臺質(zhì)量檢查和檢查結(jié)果評價(jià)等一整套工作流程。使用質(zhì)檢軟件可以有效提高質(zhì)量檢查的自動化水平和正確率,為地理信息的空間分析和決策提供優(yōu)質(zhì)的數(shù)據(jù)保障。
數(shù)據(jù)質(zhì)量檢查應(yīng)該貫穿空間數(shù)據(jù)的全生命周期,本文論述的質(zhì)檢軟件主要在數(shù)據(jù)成果階段提供了質(zhì)量控制的手段。質(zhì)檢軟件今后的發(fā)展方向,可以嘗試將質(zhì)量控制環(huán)節(jié)由數(shù)據(jù)成果階段前移至數(shù)據(jù)生產(chǎn)階段,并以此為切入點(diǎn),進(jìn)一步加深對空間數(shù)據(jù)質(zhì)檢軟件的理解。
[1] 佟林,秦超.數(shù)字城市地理空間框架相關(guān)概念分析[J].大科技·科技天地,2010(6):316-317
[2] 王帆飛.空間數(shù)據(jù)庫數(shù)據(jù)質(zhì)量評測與質(zhì)量控制體系研究[D].成都:四川大學(xué),2005
[3] 孫炎,羅曉沛.RSTT模型在空間數(shù)據(jù)檢查軟件中的應(yīng)用[J].計(jì)算機(jī)工程,2008,34(9):50-51,54
[4] 鄔倫,王曉明,高勇,等.基于地理認(rèn)知的GIS數(shù)據(jù)元模型研究[J].遙感學(xué)報(bào),2005,9(5):583-588
[5] 黃晨暉.數(shù)據(jù)轉(zhuǎn)換平臺的設(shè)計(jì)方案及初步實(shí)現(xiàn)[D].廣州:華南理工大學(xué),2005
[6] 曾衍偉.空間數(shù)據(jù)質(zhì)量控制與評價(jià)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].測繪與空間地理信息,2003,26(3):4-8
[7] 鄭曉娟,趙素霞.空間數(shù)據(jù)質(zhì)量綜合評價(jià)方法的探討[J].地理空間信息,2006,4(6):47-49
P208
:B
:1672-4623(2016)11-0041-03
10.3969/j.issn.1672-4623.2016.11.015
樂恒,工程師,研究方向?yàn)榈乩硇畔⑾到y(tǒng)。
2015-01-20。