方睿紅,謝三五
(1.自然資源部第一地理信息制圖院,陜西 西安 710054)
數(shù)字線劃圖是現(xiàn)有地形圖要素的矢量數(shù)據(jù)集,保存各要素空間關(guān)系和屬性[1]?;A(chǔ)測繪地理信息數(shù)據(jù)產(chǎn)品中,數(shù)字線劃圖(DLG)是應(yīng)用最廣泛、作用最突出的一項。在生產(chǎn)中,涉及多個工序,且技術(shù)指標復(fù)雜,大量的編輯處理及建庫工作需要人工完成[2],因此也更容易在生產(chǎn)過程中留下質(zhì)量缺陷和錯誤。當今海量的地理信息數(shù)據(jù)呈現(xiàn)出大數(shù)據(jù)的特征,在計算機軟件越來越人工智能化的進程中,如何利用計算機來盡可能最大化地解決DLG這類空間矢量數(shù)據(jù)的自動質(zhì)量檢驗問題,是測繪和地理信息領(lǐng)域關(guān)注的熱點?,F(xiàn)常用的矢量數(shù)據(jù)質(zhì)量檢查類的軟件,基本均能實現(xiàn)拓撲關(guān)系、數(shù)據(jù)層屬性等質(zhì)量項的檢查,但是很少深入到更為詳細的研究。并且很多質(zhì)檢類軟件均是以圖幅或者個體作為單位進行單個樣本的檢查,如基于ArcEngine的DLG數(shù)據(jù)質(zhì)量檢查系統(tǒng)[3]等,無法在海量圖幅的標準DLG生產(chǎn)中實現(xiàn)批量化的質(zhì)量 檢查。
根據(jù)生產(chǎn)中的這些實際需要,依托陜西省1∶10 000基礎(chǔ)地理信息更新DLG生產(chǎn)和其他一些省級DLG生產(chǎn)與更新項目,設(shè)計了從基礎(chǔ)拓撲檢查到根據(jù)項目技術(shù)要求細化的質(zhì)量子元素檢查,這樣一套完整的質(zhì)檢方案,同時也滿足批量化的檢查要求。并根據(jù)設(shè)計方案開發(fā)質(zhì)量檢查程序,實現(xiàn)DLG數(shù)據(jù)的自動化質(zhì)檢,應(yīng)用于標準DLG數(shù)據(jù)生產(chǎn)。
DLG成果數(shù)據(jù)庫均根據(jù)項目的要求有統(tǒng)一的分層和屬性設(shè)計,數(shù)據(jù)結(jié)構(gòu)的正確與否是首要的質(zhì)檢重點。檢查的內(nèi)容包括幾何類型、完整性、字段屬性、字段名稱和順序。
由于各個項目對于具體內(nèi)容的要求會存在差異,為方便程序質(zhì)檢,設(shè)計了可更改的配置文件來進行靈活的設(shè)置,包括圖層列表、各圖層字段順序表、屬性項定義表。以屬性項定義表為例,其具體可配置內(nèi)容見表1。
表1 屬性項定義表
DLG各層的數(shù)據(jù)內(nèi)容存在一些共有的特點:比如都具有嚴格的拓撲規(guī)則,某些屬性具有一樣的填寫約束。同時,即使各個項目生產(chǎn)標準存在差異,但在例如國標值的合理性、等高值高程點的咬合等方面,具有一樣的技術(shù)要求。因此,在檢查中,將此類通用性質(zhì)的質(zhì)量子元素進行整合封裝,可應(yīng)用于多個具體生產(chǎn)項目實例。
DLG數(shù)據(jù)的分層按照地理信息類別有完整的分類,在目視檢查中,檢查人員均習(xí)慣于按照類別進行。為了更直觀地體現(xiàn)檢查內(nèi)容,將計算機自動檢查的子元素進行歸類,部分子元素歸類見表2。
表2 部分子元素歸類表
分層數(shù)據(jù)自動化檢查時,為了解決各個不同生產(chǎn)項目之間的標準差異,設(shè)計按項目進行了區(qū)分,程序可根據(jù)具體項目進行添加,同時把各個子元素設(shè)計為自定義選擇,可根據(jù)具體需要進行取舍。
ArcEngine是美國ESRI公司發(fā)布的一款 GIS二次開發(fā)產(chǎn)品,它是目前GIS業(yè)界最為著名的組件式 GIS 開發(fā)產(chǎn)品[4]。ArcEngine開發(fā)組件提供了嵌入式的GIS組件庫與工具庫來讓用戶在開發(fā)中獲得強大的地理信息數(shù)據(jù)處理功能,設(shè)計的DLG質(zhì)檢方案可以使用該組件來進行軟件上的實現(xiàn)[5-6]。
除了實現(xiàn)基本的要素拓撲關(guān)系、通用性的屬性內(nèi)容等質(zhì)量項的檢查外,軟件需要設(shè)計好針對比如流向與水系方向的正確性、植被層地類界的合理性、特殊地物咬合等更加細化的質(zhì)量子元素的自動檢查技術(shù)方案。軟件編寫中需要設(shè)計針對性的算法,由于面向海量數(shù)據(jù),不僅效率要高、且誤報情況要少。
在生產(chǎn)中,各個項目的質(zhì)檢規(guī)則并不是一成不變的,可能因數(shù)據(jù)類型的增加而增加,也可能因數(shù)據(jù)標準或技術(shù)要求的調(diào)整而調(diào)整[7]。出于可維護性的考慮,應(yīng)設(shè)計完整的配準文件體系,對一些變化性規(guī)則進行調(diào)整,提高軟件的可維護和可擴展性,同時,針對各個質(zhì)量子元素也給出圖形界面,使用戶可自行進行組合選擇,針對性地進行全面檢查或重點項檢查。
3.1.1 配 置
開始檢查前,通過配置文件進行數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)內(nèi)容兩方面的一些自定義條件設(shè)置。數(shù)據(jù)結(jié)構(gòu)包括圖層、屬性項、字段順序等。數(shù)據(jù)內(nèi)容包含諸如坐標精度、拓撲容差、要素關(guān)系容差等要求。配置完成以規(guī)范化檢查條件,設(shè)置界面見圖1。為了方便用戶的選擇,對于各個質(zhì)量子元素也給出圖形界面可進行自定義選擇,圖形界面見圖2。
圖1 檢查條件配置界面
圖2 質(zhì)量子元素選擇界面
3.1.2 批量檢查
制定好DLG數(shù)據(jù)的上層路徑后,即可進行一鍵批量檢查,輸出結(jié)果為點、線、面3個shape記錄文件,用以記錄錯誤的空間位置和具體的錯誤說明。檢查界面設(shè)計應(yīng)簡約易操作,界面部分截圖見圖3。
圖3 檢查操作界面
3.2.1 流向方向檢查
流向是DLG數(shù)據(jù)中數(shù)量比較多的地理要素之一。而以往的質(zhì)檢中大多是依靠符號化處理后進行目視解譯。本軟件設(shè)計了一個檢查方法,針對每個流向要素首先計算出方向值,然后設(shè)計緩沖方法和距離,在位置對應(yīng)的水系上取兩個距離靠近的點計算方向值。兩個方向值的較差在限差范圍外即視為流向方向錯誤。部分關(guān)鍵代碼如下:
3.2.2 地類界檢查
第一步:篩選出需要地類界的植被面要素;第二步:建立拓撲工作數(shù)據(jù)集,將植被面要素、地類界要素、替代地類界的各線狀要素導(dǎo)入;第三步:進行拓撲檢查,計算出除開地類界要素以及能替代地類界的各要素外,未組成植被面要素的邊線,即為缺失的地類界。第四步:計算地類界和能替代地類界的各要素的重疊部分,即為多余的地類界。
除了通用性的常規(guī)拓撲、屬性檢查外,創(chuàng)新性地設(shè)計了根據(jù)具體的項目數(shù)據(jù)產(chǎn)品進行細化的特殊質(zhì)量子元素的自動化檢查,并針對目前生產(chǎn)中質(zhì)量檢查的情況,解決了造成的耗費人力、操作重復(fù)的問題。目前設(shè)計完成的質(zhì)檢軟件已廣泛應(yīng)用于多個省級 1∶10 000 DLG生產(chǎn)與更新項目中,可以很好地提高作業(yè)和質(zhì)檢效率。
軟件使用簡易快捷,通過開放的可配置文件形式,給使用者提供了方便的定制途徑,具有良好的需求普遍性和通用性。