曹伏天,劉朝功
(國家自然資源督察北京局,北京 100032)
2013年,國務(wù)院部署第一次全國地理國情普查工作。經(jīng)過7年多的發(fā)展,地理國情監(jiān)測工作進(jìn)入常態(tài)化階段,其成果應(yīng)用范圍也越來越廣泛。2017年,“三調(diào)”工作全面開展?!叭{(diào)”工作是國家根據(jù)社會發(fā)展和國民經(jīng)濟(jì)的需要,在2008年第二次全國土地調(diào)查基礎(chǔ)上,全面細(xì)化和完善全國土地利用狀況的一次全覆蓋土地調(diào)查[1-3]。為貫徹落實(shí)“三調(diào)”工作有關(guān)文件精神和工作要求,自然資源督察機(jī)構(gòu)緊緊圍繞“三調(diào)”成果數(shù)據(jù)的真實(shí)性,對提交的“三調(diào)”成果真實(shí)性開展督察,督促地方嚴(yán)格落實(shí)責(zé)任,確?!叭{(diào)”成果的準(zhǔn)確可靠。
在“三調(diào)”成果真實(shí)性督察工作的前期準(zhǔn)備中,督察機(jī)構(gòu)需要在短時(shí)間內(nèi)比對大量的“三調(diào)”成果數(shù)據(jù),提取出疑似問題圖斑并進(jìn)行判讀和現(xiàn)場核查。按照往年督察工作的經(jīng)驗(yàn),疑似問題圖斑的提取方法相對單一,借助ArcGIS、MapGIS等專業(yè)軟件或開發(fā)定制的數(shù)據(jù)分析平臺比對各類基礎(chǔ)與管理數(shù)據(jù),提取疑似問題圖斑[4-5]。整個(gè)過程人工交互較多,流程固定且重復(fù),費(fèi)時(shí)費(fèi)力。
加拿大Safe Software公司推出的FME軟件,在空間和非空間數(shù)據(jù)處理方面特點(diǎn)鮮明,可以較好地整合督察業(yè)務(wù)涉及的多格式、多類型數(shù)據(jù)。FME軟件可以實(shí)現(xiàn)將整個(gè)從輸入到寫出的比對流程模塊化、簡潔化,提高工作效率,減少出錯(cuò)情況,也降低了更新維護(hù)的頻率與成本,將所有重復(fù)操作交給計(jì)算機(jī)進(jìn)行自動處理[6-7]。
本文根據(jù)地理國情監(jiān)測和“三調(diào)”的相似特點(diǎn)[8],借助FME平臺,創(chuàng)新性地提出構(gòu)建自動化比對模型。經(jīng)過實(shí)際工作的驗(yàn)證,督察效率實(shí)現(xiàn)了翻倍增長,為自然資源督察機(jī)構(gòu)比對疑似問題圖斑提供了新思路和新方法。
地理國情監(jiān)測數(shù)據(jù)中的地表覆蓋數(shù)據(jù)按“所見即所得”的原則開展調(diào)查監(jiān)測,與“三調(diào)”數(shù)據(jù)在空間上存在對象可比性。2019年,地理國情監(jiān)測與“三調(diào)”初始調(diào)查同期開展,具有調(diào)查時(shí)點(diǎn)可比性。通過比較地理國情監(jiān)測與“三調(diào)”工作的調(diào)查原則、技術(shù)標(biāo)準(zhǔn),發(fā)現(xiàn)兩者既有結(jié)果的統(tǒng)一性,又有合理的差異性。因此,本文提出可以合理利用兩類成果數(shù)據(jù)的差異,作為“三調(diào)”成果真實(shí)性督察的參考靶區(qū),相比逐圖斑的“大海撈針式”篩查,該方法有助于提高發(fā)現(xiàn)問題的精準(zhǔn)性和效率。本文按照督察重點(diǎn)關(guān)注地理國情監(jiān)測數(shù)據(jù)與“三調(diào)”數(shù)據(jù)的地類,制定了兩類數(shù)據(jù)轉(zhuǎn)換的映射表,將“三調(diào)”數(shù)據(jù)的地類與地理國情監(jiān)測數(shù)據(jù)的地類分別關(guān)聯(lián)對應(yīng)[9-12]。地理國情監(jiān)測數(shù)據(jù)與“三調(diào)”數(shù)據(jù)主要地類編碼對應(yīng)表如表1所示。
表1 地理國情監(jiān)測與“三調(diào)”主要地類編碼對應(yīng)表
加拿大Safe Software公司基于“語義轉(zhuǎn)換”的概念,推出了一款數(shù)據(jù)處理與轉(zhuǎn)換的軟件產(chǎn)品FME(Feature Manipulate Engine,簡稱 FME)。FME軟件通過在轉(zhuǎn)換過程中重構(gòu)數(shù)據(jù)的功能,實(shí)現(xiàn)超過250種數(shù)據(jù)格式(模型)的轉(zhuǎn)換,可以讀寫、存儲和轉(zhuǎn)換各種空間數(shù)據(jù)。利用FME平臺,可以直觀、有效地構(gòu)建數(shù)據(jù)處理模型,在大量的數(shù)據(jù)轉(zhuǎn)換處理過程中,可以在任一節(jié)點(diǎn)查看數(shù)據(jù),實(shí)時(shí)檢查并修改整個(gè)分析流程,最后高效、保質(zhì)地完成各種復(fù)雜的數(shù)據(jù)處理任務(wù)。
本文利用FME平臺制作并逐步完善59種差異圖斑類型模型。前期利用第三次全國國土調(diào)查領(lǐng)導(dǎo)小組辦公室核查發(fā)現(xiàn)的錯(cuò)誤數(shù)據(jù),使用等距抽樣再人工核查的模式,進(jìn)行模型準(zhǔn)確率測試。后期納入第二次全國濕地資源調(diào)查、土地整治和歷年耕地等用地管理信息數(shù)據(jù),豐富交叉驗(yàn)證信息,根據(jù)測試結(jié)果調(diào)整閾值參數(shù),提高差異圖斑的精準(zhǔn)率??傮w比對框架主要包括源數(shù)據(jù)輸入、數(shù)據(jù)預(yù)處理、比對與問題歸類、結(jié)果輸出4個(gè)部分,如圖1所示。完成總體比對框架搭建后,將框架封閉到循環(huán)模型,最終實(shí)現(xiàn)自動處理目標(biāo)數(shù)據(jù)流。
圖1 總體比對框架
為了實(shí)現(xiàn)比對流程的自動化,便于前期的測試和后期的模型更新維護(hù),本研究需要通過設(shè)置一個(gè)或多個(gè)參數(shù),讓參數(shù)控制變量,達(dá)到修改一個(gè)或多個(gè)參數(shù)就可以調(diào)整整個(gè)模型的目的。不同的參數(shù)設(shè)置可以實(shí)現(xiàn)不同的目的,例如:設(shè)置輸入輸出參數(shù),可以實(shí)現(xiàn)相同格式、不同數(shù)據(jù)源的數(shù)據(jù)輸入和相同格式、不同路徑的成果輸出;設(shè)置條件參數(shù),實(shí)現(xiàn)比對后不同類型、不同難易問題的篩選;設(shè)置屬性值參數(shù),可以控制屬性內(nèi)容等。通過在FME充分設(shè)置這些參數(shù),可以使自動化程度達(dá)到較好的地步,實(shí)現(xiàn)不同督察業(yè)務(wù)的個(gè)性化定制。
本文共設(shè)置了輸入輸出的路徑參數(shù)、條件控制參數(shù)和面積閾值參數(shù)等29個(gè)參數(shù)。
坐標(biāo)系是地理信息行業(yè)最重要的基礎(chǔ),所有地理數(shù)據(jù)的比對,第一步就要核對坐標(biāo)系,確認(rèn)各數(shù)據(jù)的投影帶是否相同。雖然“三調(diào)”成果數(shù)據(jù)全部采用2000國家大地坐標(biāo)系,但地理國情監(jiān)測數(shù)據(jù)及其他管理類數(shù)據(jù)的坐標(biāo)系并不一致。為了統(tǒng)一輸入輸出的數(shù)據(jù)坐標(biāo)系或投影,避免因源數(shù)據(jù)坐標(biāo)系或投影的差異和可能存在的幾何錯(cuò)誤導(dǎo)致的數(shù)據(jù)不匹配或錯(cuò)位問題,本文借助FME軟件完備的坐標(biāo)系庫和強(qiáng)大的轉(zhuǎn)換功能,在FME Workbench中提供的Reprojector和GeometryValidator兩個(gè)轉(zhuǎn)換器(FME軟件中的所有操作都需要通過代表不同功能的不同類型轉(zhuǎn)換器得以實(shí)現(xiàn)),對輸入的地理數(shù)據(jù)進(jìn)行重新投影和幾何特征糾正,保證輸入的數(shù)據(jù)具有一致的空間坐標(biāo)系,避免在比對中產(chǎn)生誤差,影響分析結(jié)果。
數(shù)據(jù)預(yù)處理后,利用AreaOnAreaOverlayer轉(zhuǎn)換器對數(shù)據(jù)進(jìn)行比對。由于地理國情監(jiān)測數(shù)據(jù)和“三調(diào)”數(shù)據(jù)存在縣級矢量范圍不一致的情況,本文去除范圍外未疊加的無效部分,根據(jù)比對結(jié)果默認(rèn)字段overlaps篩選出疊加地塊。隨后,需要對地類疊加時(shí)產(chǎn)生的細(xì)小、狹長的地塊進(jìn)行去除,利用AttributeManager和CircularityCalculator轉(zhuǎn)換器計(jì)算狹長率(長度/面積)和圓度值,通過TestFilter轉(zhuǎn)換器調(diào)用條件參數(shù),篩選并去除狹長的圖斑,再通過Aggregator轉(zhuǎn)換器根據(jù)疊加后的保留字段(字段可自由選擇),對“三調(diào)”圖斑內(nèi)的同一類差異地塊進(jìn)行合并,之后借助AreaCalculator或AttributeManager轉(zhuǎn)換器計(jì)算合并后的面積,再利用Test轉(zhuǎn)換器調(diào)用面積參數(shù)去除面積較小的圖斑。
根據(jù)往年督察比對經(jīng)驗(yàn),本文首先確定了59種問題類型。借助字段管理AttributeManager轉(zhuǎn)換器,在數(shù)據(jù)屬性中建立一個(gè)問題類型字段,利用其中的條件判斷功能,區(qū)分問題圖斑類型,對屬性進(jìn)行賦值,問題類型賦值如圖2所示。然后,按照督察任務(wù)方案,進(jìn)一步細(xì)化差異圖斑與問題類型,同時(shí)利用土地整治數(shù)據(jù)、歷年耕地?cái)?shù)據(jù)和第二次全國濕地資源調(diào)查數(shù)據(jù)對“三調(diào)”成果數(shù)據(jù)進(jìn)行二次交叉驗(yàn)證。
圖2 問題類型賦值
比對后形成疑似問題成果,選擇所需要的輸出格式,F(xiàn)ME軟件支持常見的SHP、GDB、MDB等地理空間數(shù)據(jù)格式無損輸出。本文基于前一步所建立的問題類型字段,利用輸出中的Fanout Dateset功能,對結(jié)果數(shù)據(jù)進(jìn)行扇出,界面如圖3所示。這樣扇出的好處在于無需對不同類型問題及不同縣(市)的數(shù)據(jù)進(jìn)行再次篩選和分割操作,直接進(jìn)行精分析及專項(xiàng)核查。同時(shí),使用StatisticsCalculator轉(zhuǎn)換器對問題數(shù)量、問題面積等進(jìn)行統(tǒng)計(jì),可以輸出Excel格式的成果文件,省去再利用Excel等相關(guān)軟件進(jìn)行統(tǒng)計(jì)匯總的分析操作。
圖3 結(jié)果扇出
整個(gè)框架中數(shù)據(jù)的輸入輸出、問題類型的判斷、問題面積的篩選等關(guān)鍵環(huán)節(jié)都由參數(shù)控制,這些參數(shù)設(shè)置就是通過修改參數(shù)而達(dá)到修改整個(gè)模型的目的,但是所有參數(shù)本身需要人工輸入。因此,我們需要對變化的參數(shù)進(jìn)行輸入設(shè)計(jì)。本文在FME Workbench中重新建立了一個(gè)工作空間,輸入一個(gè)Excel文檔,文檔包含所有變化的參數(shù)(未變化部分的參數(shù)可不列舉),使用WorkspaceRunner轉(zhuǎn)換器,連接到前面的整個(gè)比對流程工作空間,為已經(jīng)設(shè)計(jì)好的比對框架包一個(gè)“殼”,形成一個(gè)簡單的循環(huán),如圖4所示。這樣做的目的就是將設(shè)計(jì)好的整個(gè)流程封閉起來,不斷對變化的參數(shù)賦值,讓機(jī)器按流程循環(huán)比對,最終實(shí)現(xiàn)自動化比對的目的。
圖4 循環(huán)體系
國家自然資源督察北京局將以往內(nèi)外業(yè)結(jié)合的工作方式轉(zhuǎn)變?yōu)槿珒?nèi)業(yè)核查加遠(yuǎn)程舉證,確保疫情期間的督察工作取得預(yù)期成果。內(nèi)業(yè)過程通過建立差異圖斑比對模型,實(shí)現(xiàn)了比對流程自動化、過程模塊化的預(yù)期目標(biāo)。
經(jīng)過前期測試,在所有數(shù)據(jù)準(zhǔn)備齊全的情況下,半個(gè)小時(shí)可以完成一個(gè)擁有5萬個(gè)“三調(diào)”圖斑的華北五省份的區(qū)(縣)全部比對工作,4個(gè)小時(shí)可以完成北京或天津市全部比對工作。同時(shí),生成差異圖斑和對應(yīng)的統(tǒng)計(jì)結(jié)果。駐點(diǎn)督察與實(shí)地核查完成后,從形成的督察成果看,利用此技術(shù)方法所發(fā)現(xiàn)的問題占全部發(fā)現(xiàn)問題的73.1%,效率較往年提高了2.04倍,“三調(diào)”督察最終發(fā)現(xiàn)的問題圖斑數(shù)量占核查圖斑數(shù)量的8%,初步實(shí)現(xiàn)了精準(zhǔn)督察的目標(biāo)。
督察信息化一直都是自然資源督察的實(shí)現(xiàn)目標(biāo)。本文主要介紹了督察數(shù)據(jù)自動化分析的思路,借助FME軟件通過設(shè)置多個(gè)參數(shù)控制比對流程,再將建立的比對流程封閉到循環(huán)中,通過輸入一個(gè)文檔對所有的參數(shù)進(jìn)行控制,最終形成自動化的比對模型。本文探討了一種將大量重復(fù)、簡單變化的地理信息數(shù)據(jù)比對操作交給計(jì)算機(jī)的技術(shù)方法,在時(shí)間有限的情況下,可以利用多臺設(shè)備進(jìn)行同步處理,在較短時(shí)間內(nèi)提供所需的疑似問題結(jié)果。
本文模型比對的差異問題質(zhì)量取決于地理國情數(shù)據(jù)質(zhì)量、“三調(diào)”數(shù)據(jù)質(zhì)量及模型參數(shù)設(shè)置等多個(gè)因素,不具有地域普適性。今后的應(yīng)用還需要探索如何消除技術(shù)路線中存在的“客觀誤差”。下一步的研究將會根據(jù)不同的業(yè)務(wù)種類,增加不同的管理類數(shù)據(jù)、專項(xiàng)調(diào)查類數(shù)據(jù),通過細(xì)化問題類型等工作提高模型的穩(wěn)定性,高質(zhì)量地完成不同類型的自然資源督察業(yè)務(wù)保障工作。