陳建偉,陳繼山
(1.蘇州盛景信息科技股份有限公司,江蘇 蘇州 215006;2.蘇州市規(guī)劃編制信息中心,江蘇 蘇州 215006)
空間數(shù)據(jù)的質(zhì)量是多種因素共同影響的結(jié)果,高質(zhì)量的空間數(shù)據(jù)是地理信息系統(tǒng)成功應(yīng)用的基礎(chǔ)之一。隨著地理信息系統(tǒng)應(yīng)用的日益廣泛,如何保障空間數(shù)據(jù)質(zhì)量也愈受重視??臻g數(shù)據(jù)加工的多元性導(dǎo)致數(shù)據(jù)質(zhì)量參差不齊,新技術(shù)的不斷發(fā)展也使得空間數(shù)據(jù)的規(guī)模不斷擴大。采用傳統(tǒng)的人機結(jié)合或集中式數(shù)據(jù)檢查已不能滿足時代發(fā)展的需要,基于數(shù)據(jù)規(guī)則的檢查正逢其時。
如何集成空間數(shù)據(jù)的質(zhì)量檢查規(guī)則并將其動態(tài)集成至現(xiàn)有的GIS 服務(wù)中,完成用戶特定的任務(wù)目標(biāo)成為研究的熱點。OGC 和ISO/TC211 提出了服務(wù)鏈的基本概念,其中的流程管理鏈就是利用工作流技術(shù)進(jìn)行GIS 服務(wù)聚合操作??臻g數(shù)據(jù)質(zhì)量檢查中使用工作流技術(shù),具有實時性、高效性,提升空間數(shù)據(jù)的服務(wù)品質(zhì),提高數(shù)據(jù)檢查的速度和可及性,使得傳統(tǒng)集中匯總式的業(yè)務(wù)流程向分布式并行處理方式的改變成為可能。
空間數(shù)據(jù)的質(zhì)量檢查就是依據(jù)數(shù)據(jù)標(biāo)準(zhǔn),采用一定的方法,直接或間接地對數(shù)據(jù)做出評價??臻g數(shù)據(jù)質(zhì)量檢查可采用“規(guī)則-檢查項-方案-質(zhì)量檢查-評價”的體系結(jié)構(gòu)(如圖1)。提煉規(guī)則是工作的第一步。規(guī)則是空間數(shù)據(jù)的內(nèi)在聯(lián)系及準(zhǔn)則,是質(zhì)量檢查的依據(jù),檢查項則是規(guī)則的具體實現(xiàn)。檢查方案是多個檢查項的集合,體現(xiàn)了用戶對空間數(shù)據(jù)的要求。用戶選擇方案對空間數(shù)據(jù)進(jìn)行質(zhì)量檢查并做出評價。
傳統(tǒng)的空間數(shù)據(jù)的質(zhì)量檢查側(cè)重于幾何表達(dá)。但實際應(yīng)用中,要素幾何特性與要素間的邏輯聯(lián)系是并重的,甚至要素間的邏輯聯(lián)系超越了幾何特性。比如,控制性詳細(xì)規(guī)劃指標(biāo)應(yīng)符合總體規(guī)劃,土地利用規(guī)劃紅線不能交叉,高架鐵路與地面道路只能虛相交而不能實相交等。從提交成果方面而言,地理信息數(shù)據(jù)一般以圖形、屬性文件、關(guān)聯(lián)文檔等來表達(dá)。于是,空間數(shù)據(jù)質(zhì)量檢查規(guī)則由可以分成幾何規(guī)則和屬性規(guī)則,前者表現(xiàn)為空間拓?fù)?,后者為屬性合法性驗證。通過規(guī)則解析,將空間數(shù)據(jù)幾何規(guī)則與屬性規(guī)則的組合起來,解析為可執(zhí)行的空間數(shù)據(jù)規(guī)則??臻g數(shù)據(jù)質(zhì)量檢查可使用產(chǎn)生式規(guī)則。產(chǎn)生式規(guī)則的基本形式為:
P 是產(chǎn)生式(即規(guī)則)的前提,也稱為前件,它給出產(chǎn)生式可否使用的先決條件,由邏輯組合來構(gòu)成。Q 是結(jié)論或操作,也稱為產(chǎn)生式的后件,它指出當(dāng)P滿足時,應(yīng)該推出的結(jié)論或執(zhí)行的動作。
例如,對土地利用規(guī)劃紅線,相互間檢查規(guī)則如下:
IF Geometry1 intersect Geometry2 THEN OUTPUT_Geo
產(chǎn)生式系統(tǒng)中滿足前提條件的規(guī)則被激活后,不一定被立即執(zhí)行,能否執(zhí)行將取決于沖突消解策略。在土地利用規(guī)劃紅線質(zhì)量檢查中,如果沒有過濾到相交的紅線,交操作檢查要素輸出將被停止。
圖1 空間數(shù)據(jù)質(zhì)量檢查邏輯圖
從內(nèi)容方面看,空間數(shù)據(jù)包括空間位置、屬性特征、時域特征及元數(shù)據(jù)。從生產(chǎn)方面看,空間數(shù)據(jù)的生產(chǎn)具有影響因素多、因素模糊性強和一定的主觀性的特點。制定完善的規(guī)則是質(zhì)量檢查的關(guān)鍵??臻g數(shù)據(jù)的錯誤一般可分為幾何錯誤、語法錯誤、語義錯誤和邏輯錯誤。
空間要素的幾何錯誤包括打拆線錯誤、線或面自相交、面裂隙、微小面、微短線等,這類錯誤常根據(jù)要素的坐標(biāo)點串間的關(guān)系進(jìn)行計算判斷??臻g要素的語法錯誤是一類比較明顯的錯誤。比如,建筑的層高、地塊的容積率、地下管線的埋設(shè)年代等總是有一定的范圍,要素類的編碼長度總是固定值。而空間要素的語義錯誤則比較難發(fā)現(xiàn),此類錯誤與要素填寫的屬性值與空間屬性是關(guān)聯(lián)的。比如,管線連接的附屬物為三通時,其連接的管段不可能超過三條。對邏輯錯誤的判斷,則需要知識和經(jīng)驗的歸納。比如,在同一個空間范圍,不能同時存在2 幢不同的建筑,給水管線不可能與污水管線相連通等。為此,質(zhì)量檢查規(guī)則可以按以下幾類進(jìn)行劃分:
1)引用完整性規(guī)則。定義要素屬性值與外部引用表關(guān)鍵字之間的關(guān)系,它不允許屬性值引用不存在的關(guān)鍵值。
2)數(shù)值規(guī)則。它包含兩部分:一部分是與要素的空間位置相關(guān)聯(lián)。比如地籍?dāng)?shù)據(jù)中的地下室標(biāo)高應(yīng)該為負(fù)值。一部分是填寫規(guī)范。比如屬性值的字符長度、空值的填寫方式等。
3)審核規(guī)則。要素間以及不同要素間在空間分布(相連、包含、相鄰、相交等)是有一定規(guī)則的。比如對地下管線,已存在或設(shè)計的管線需要進(jìn)行最小水平間距、最小垂直間距、最小覆土深度等分析,審核是否符合國家管線設(shè)計標(biāo)準(zhǔn)。
4)復(fù)合規(guī)則。當(dāng)多類空間數(shù)據(jù)進(jìn)行整體檢查時,需要檢查多個要素類之間的關(guān)系,常使用復(fù)合規(guī)則。比如檢查修建性詳規(guī)紅線數(shù)據(jù),首先要檢查是否滿足總規(guī)各項指標(biāo);其次要檢查專項規(guī)劃數(shù)據(jù),其是否與專項規(guī)劃不相符合;再次要檢查管線數(shù)據(jù),檢查其是否與國家或省級管線線位有沖突;最后還要檢查紅線與綠線、紫線、灰線的關(guān)系是否滿足要求,復(fù)合規(guī)則常是多種規(guī)則的結(jié)合。
工作流技術(shù)可以實現(xiàn)業(yè)務(wù)過程建模、業(yè)務(wù)過程優(yōu)化及過程管理與集成,從而實現(xiàn)業(yè)務(wù)過程的自動化。與普通數(shù)據(jù)的檢查相比,空間數(shù)據(jù)檢查具有計算密集和數(shù)據(jù)密集的特點。數(shù)據(jù)越多元,規(guī)則越多,流程會越復(fù)雜。數(shù)據(jù)質(zhì)量檢查中的任何異常和錯誤都可以造成服務(wù)流程的失敗,從而造成計算的中斷和資源的浪費。
傳統(tǒng)空間數(shù)據(jù)質(zhì)量檢查一般會采用集中式處理系統(tǒng)(如圖2),一個任務(wù)失敗常會導(dǎo)致整個檢查方案的失敗,甚至?xí)<跋到y(tǒng)的正常運行。整體而言,空間數(shù)據(jù)的質(zhì)量檢查策略相對穩(wěn)定,因此基于工作流的空間數(shù)據(jù)檢查采用分布式體系,可以將任務(wù)分散化。各個任務(wù)對應(yīng)于不同的規(guī)則實現(xiàn)不同的目標(biāo),并通過過程定義進(jìn)行固定。過程定義完成后即可發(fā)布出來,實現(xiàn)檢查規(guī)則的實例化。最后用戶確定順序,形成一條按次序可執(zhí)行的服務(wù)鏈并提供使用。由于各任務(wù)是獨立的,單個任務(wù)發(fā)生異常并不會影響另一任務(wù)的執(zhí)行,從而保證一次檢查均能將所有任務(wù)按順序執(zhí)行一次,系統(tǒng)的容錯和穩(wěn)定性得到很大的提高。
空間數(shù)據(jù)具有多元性,目前廣泛應(yīng)用的空間數(shù)據(jù)格式有DWG、Shape、ArcSDE、Oracle Spatial、SDB等,使用工作流技術(shù),可以將應(yīng)用邏輯和過程邏輯相分離,解決不同數(shù)據(jù)格式互操作的問題,實現(xiàn)驗證加載數(shù)據(jù)與數(shù)據(jù)分析的互不干擾。
圖2 檢查規(guī)則及服務(wù)實現(xiàn)圖
工作流的優(yōu)勢是對流程的控制,工作流本身不能操作空間數(shù)據(jù)。質(zhì)量檢查是以數(shù)據(jù)為中心的數(shù)據(jù)密集型應(yīng)用,檢查邏輯直接決定了工作流的形式(如圖3)??臻g數(shù)據(jù)質(zhì)量檢查中使用工作流,主要側(cè)重于不同格式數(shù)據(jù)的讀取、數(shù)據(jù)分發(fā)、數(shù)據(jù)存儲、版本管理等方面,以解決傳統(tǒng)的集中式處理帶來的性能瓶頸和復(fù)雜性,其中的過程模型是核心。
考慮到空間數(shù)據(jù)的特點,可將復(fù)雜的質(zhì)量檢查分成多個簡單的事務(wù),各個事務(wù)相互獨立,按流水線的方式執(zhí)行,只有上一事務(wù)完成后才開始執(zhí)行下一事務(wù)。
圖3 一個簡單流程處理圖
要提高空間數(shù)據(jù)質(zhì)量檢查系統(tǒng)的穩(wěn)定性,首先要做好業(yè)務(wù)邏輯與應(yīng)用邏輯的分離,發(fā)揮單個檢查事務(wù)松耦合特性,單個事務(wù)即可視為一個獨立的微工作流(如圖4)。微工作流是一種輕量級的工作流,數(shù)據(jù)質(zhì)量檢查中使用微工作流,可以高效代替或替換現(xiàn)在模塊,實現(xiàn)即插即用。
由于空間數(shù)據(jù)檢查的多樣性,使用微工作流可以很好地實現(xiàn)檢查項的獨立,增加服務(wù)的可及性及復(fù)用性,大幅降低系統(tǒng)的復(fù)雜度。
圖4 工作流與微工作流
地下管線數(shù)據(jù)是城市基礎(chǔ)地理信息數(shù)據(jù)的重要組成部分,在蘇州市地下管線數(shù)據(jù)質(zhì)量檢查中應(yīng)用了基于規(guī)則及工作流的檢查方法。蘇州市地下管線數(shù)據(jù)分成兩種形式:mdb 格式和dwg 格式。mdb 格式對應(yīng)管線的屬性數(shù)據(jù),dwg 格式是管線的圖形數(shù)據(jù),均為1∶500 的分幅數(shù)據(jù),且圖形數(shù)據(jù)與屬性數(shù)據(jù)一一對應(yīng)。接管理要求,地下管線數(shù)據(jù)按月提交。對提交的數(shù)據(jù),第三方需要及時進(jìn)行質(zhì)量檢查,檢查結(jié)果返回給探測單位。檢查合格后的數(shù)據(jù)更新至SDE 管線數(shù)據(jù)庫。據(jù)此將地下管線質(zhì)量檢查規(guī)則分成22 個檢查子項,如表1 所示。
表1 地下管線檢查項子項
檢查子項確定后,將其發(fā)布成REST 服務(wù),用戶自行選擇發(fā)布的服務(wù)組合形成方案供調(diào)用。具體使用過程如圖5 所示。
1)用戶通過瀏覽器完成地下管線數(shù)據(jù)(DWG 圖形數(shù)據(jù)、MDB 屬性數(shù)據(jù))上傳。
2)用戶選擇發(fā)布的檢查服務(wù),確定流程,形成聚合方案。
3)待檢數(shù)據(jù)空間化,并連接已有數(shù)據(jù)庫。
4)根據(jù)確定的方案進(jìn)行數(shù)據(jù)質(zhì)量檢查。檢查結(jié)果以DWG 圖、Access 報表、Excel 統(tǒng)計表形式反饋給探測單位。
整個過程使用的服務(wù)有數(shù)據(jù)上傳下載服務(wù)、檢查規(guī)則服務(wù)、任務(wù)調(diào)度服務(wù)等。
圖5 服務(wù)聚合方案
從使用方面看,基于規(guī)則及工作流的空間數(shù)據(jù)質(zhì)量檢查賦予用戶自助服務(wù)的權(quán)利。從軟件角度看,簡化了代碼維護(hù),用戶只需更新或增加相應(yīng)的服務(wù)即可實現(xiàn)功能的變化,提高了系統(tǒng)的應(yīng)變能力。工作流的應(yīng)用使用戶的操作流程一目了然。自2015 年以來,蘇州市地形圖、地下管線、規(guī)劃圖等的質(zhì)量檢查均采用以上方法,取得了很好的效果,產(chǎn)生了良好的經(jīng)濟效益和社會效益。