程益聯(lián) ,劉九夫
(1.水利部水利信息中心,北京 100053;2.南京水利科學(xué)研究院,江蘇 南京 210029)
水利普查是一項(xiàng)重大的國(guó)情國(guó)力調(diào)查,是國(guó)家資源環(huán)境調(diào)查的重要組成部分。為保障普查工作的順利進(jìn)行,提高工作效率及普查數(shù)據(jù)的質(zhì)量,對(duì)普查對(duì)象及對(duì)象指標(biāo)進(jìn)行編碼是通行和有效的做法,編碼工作在普查工作中占有極其重要的位置,編碼的適應(yīng)性將直接影響到普查的順利進(jìn)行,乃至成敗。
水利普查編碼的目的是以數(shù)字和字母代表水利普查對(duì)象和指標(biāo),準(zhǔn)確地識(shí)別和管理水利普查對(duì)象與指標(biāo),通過(guò)編碼簡(jiǎn)化對(duì)象之間關(guān)系的描述,方便基層普查工作的開(kāi)展及人工和計(jì)算機(jī)處理,提高數(shù)據(jù)處理工作效率,保障審核與匯總分析的順利開(kāi)展和最終普查數(shù)據(jù)的質(zhì)量。
水利普查編碼任務(wù)是根據(jù)各專(zhuān)業(yè)提出的普查對(duì)象和指標(biāo),制定編碼體系、對(duì)象編碼規(guī)則(含部分對(duì)象編碼)、指標(biāo)編碼規(guī)則及所有指標(biāo)的編碼。
首先,必須根據(jù)各專(zhuān)業(yè)提出的普查對(duì)象和指標(biāo),綜合考慮普查數(shù)據(jù)處理的需要,確定水利普查編碼體系,通過(guò)編碼體系的制定明確編碼所涉及的對(duì)象與指標(biāo)及其編碼規(guī)則,達(dá)到統(tǒng)一體系、簡(jiǎn)化規(guī)則和方便使用的目的。
編碼體系包括對(duì)象和指標(biāo)編碼 2 部分。對(duì)象編碼用來(lái)標(biāo)識(shí)水利普查對(duì)象,作為水利普查對(duì)象指標(biāo)數(shù)據(jù)管理的唯一代碼,在整個(gè)水利普查數(shù)據(jù)庫(kù)中,所有對(duì)象編碼唯一,根據(jù)不同對(duì)象特點(diǎn)和管理需要編碼。對(duì)象編碼采用數(shù)字串,可采用定長(zhǎng)或變長(zhǎng)編碼,除河流湖泊對(duì)象編碼外,其他對(duì)象編碼采用行政區(qū)劃代碼加行政區(qū)內(nèi)同類(lèi)對(duì)象順序號(hào)組成對(duì)象編碼。指標(biāo)編碼類(lèi)型歸納為位置型、時(shí)間型、數(shù)值型、枚舉型和文字型 5 種。
主要是制定對(duì)象編碼規(guī)則,部分河流 1 級(jí)區(qū)的編碼編制。制定的對(duì)象編碼規(guī)則要方便基層水利普查單位能夠獨(dú)立完成自己所普查對(duì)象的編碼,并在全國(guó)范圍內(nèi)做到對(duì)象編碼唯一。河流和湖泊因不能與基層普查單位建立簡(jiǎn)單關(guān)聯(lián)關(guān)系,存在其內(nèi)在聯(lián)系,因此編碼只根據(jù)按照流域匯總需要給出編碼規(guī)則,由具體承擔(dān)河流湖泊普查的單位和部門(mén)統(tǒng)一編制全國(guó) 50 km2以上流域和 1 km2以上湖泊的編碼。
主要參考已有國(guó)家、行業(yè)、國(guó)際等標(biāo)準(zhǔn)和習(xí)慣做法對(duì)水利普查對(duì)象指標(biāo)進(jìn)行編碼。同時(shí),要根據(jù)指標(biāo)分類(lèi)制定相應(yīng)的規(guī)則,指導(dǎo)具體指標(biāo)編碼,方便將來(lái)軟件對(duì)指標(biāo)的統(tǒng)一處理,提高軟件的可靠性和數(shù)據(jù)的質(zhì)量。
水利普查數(shù)據(jù)的后處理和資料深加工,除按照對(duì)象分別管理好對(duì)象指標(biāo)外,還應(yīng)該為不同對(duì)象之間存在的關(guān)系描述制定方案,方便資料匯總和深加工。
水利普查對(duì)象編碼僅限于信息系統(tǒng)內(nèi)部對(duì)象標(biāo)識(shí),除位置視角以外不捆綁其它任何屬性信息。
賦碼過(guò)程根據(jù)不同主題普查技術(shù)方案,分別采用業(yè)內(nèi)集中統(tǒng)一編碼或各級(jí)水利普查機(jī)構(gòu)并行賦碼 2 種方式,其成果在全國(guó)范圍內(nèi)唯一標(biāo)識(shí)水利普查對(duì)象。
對(duì)象在域內(nèi)順序編碼,因各種原因造成對(duì)象修改、調(diào)整時(shí),順序賦予新號(hào),使用過(guò)的域內(nèi)順序碼不允許重復(fù)使用;
對(duì)象跨行政區(qū)的,其行政區(qū)劃代碼使用上一級(jí)行政機(jī)構(gòu)的區(qū)劃代碼,跨省級(jí)行政區(qū)的全國(guó)行政區(qū)劃代碼約定使用 888888。
水利普查需要普查的自然類(lèi)對(duì)象有流域、河流、湖泊、土壤侵蝕單元、侵蝕溝道 5 類(lèi)。
2.2.1 流域與河流編碼
河流是流域水流自然形成的,河流與流域之間存在一一對(duì)應(yīng)關(guān)系,因此,在編碼中,采用河流編碼與之相應(yīng)的流域編碼一致的辦法描述河流與流域之間的對(duì)應(yīng)關(guān)系。天然流域不同匯流區(qū)之間存在一定的空間和水流組合關(guān)系,而且天然流域與子流域之間存在確定的包含和被包含關(guān)系,據(jù)此,擬采用一定的編碼自然描述流域與子流域之間的這種關(guān)系,方便將來(lái)按照流域的數(shù)據(jù)審核與匯總,對(duì)于河川下游河網(wǎng)地區(qū)水流關(guān)系不定的情況,可以視情況指定河流之間的匯流關(guān)系。
河流編碼采用 11 位定長(zhǎng)的數(shù)字和字母字符串,格式為 BTFFFFFFFFF,其中第 1~2 位(即 BT)為2 級(jí)流域編碼,根據(jù)流域自然分形統(tǒng)一編碼。
第 3~11 位(即 FFFFFFFFF)為河流(區(qū)間)編碼,首先針對(duì) 3 級(jí)流域,根據(jù)流域面積(流域面積大于等于 50 km2)等屬性挑選屬性比較接近的較大支流 n 條(n ≤ 8),這樣水系內(nèi) n 條支流把干流河段分為(n + 1)個(gè)河段。第 3 位(即第 1 個(gè) F)的編碼如下:
干流河段編碼,從上游到下游,分別編碼為 1,2,3,…,n + 1;
被選支流編碼,從上游到下游,分別編碼為 A,B,C,…(到第 n 條結(jié)束,最多編到 H)。
其次,針對(duì)第 4 位的干流河段或被選支流,再看作 1 個(gè)水系,重復(fù)前述的編碼過(guò)程,完成對(duì)第 5 位的編碼,余此類(lèi)推。
最后,若流域內(nèi)再無(wú)子流域面積達(dá)到 50 km2,則編碼結(jié)束,余下的位填 0。
目前河流編碼方案,最多可對(duì) 11 級(jí)河流進(jìn)行編碼。
2.2.2 湖泊編碼
湖泊編碼采用湖泊最小包含流域編碼加流域內(nèi)順序碼構(gòu)成。
2.2.3 土壤侵蝕單元
土壤侵蝕單元編碼采用該侵蝕單元所在流域代碼加流域內(nèi)不同侵蝕單元的順序碼構(gòu)成。土壤侵蝕單元跨流域和縣級(jí)行政區(qū)的按不同侵蝕單元分別編碼。
2.2.4 侵蝕溝道
侵蝕溝道編碼采用該侵蝕溝道所在流域代碼加流域內(nèi)不同侵蝕溝道的順序碼構(gòu)成。
水利普查需要普查的跨行政區(qū)類(lèi)對(duì)象有地表和地下水水源地、引(調(diào))水工程和灌區(qū) 4 類(lèi)。其對(duì)象編碼格式為 XXXXXXDDDD,其中XXXXXX 為普查對(duì)象范圍所涉行政區(qū)劃代碼,跨行政區(qū)的采用上一級(jí)行政區(qū)劃代碼;DDDD 為普查對(duì)象在所屬分類(lèi)中的順序編號(hào),字母 D 位數(shù)僅用于示意,實(shí)際應(yīng)用時(shí)根據(jù)每類(lèi)對(duì)象的總個(gè)數(shù)確定。
水利普查需要普查的縣級(jí)行政區(qū)內(nèi)類(lèi)對(duì)象有獨(dú)立工程(水庫(kù)、水電站、水閘、泵站、堤防等工程,以及河湖取水口、入河湖排污口和水井)、社會(huì)經(jīng)濟(jì)用水戶(hù)(城鎮(zhèn)和鄉(xiāng)村居民用水戶(hù)、公共供水戶(hù)和獨(dú)立用水戶(hù))、行業(yè)能力單位(水利機(jī)關(guān)、事業(yè)、社團(tuán)、企業(yè)和經(jīng)營(yíng)活動(dòng)單位)。這些普查對(duì)象的編碼基本類(lèi)似,編碼格式為XXXXXXDDDD,其中 XXXXXX 為普查對(duì)象范圍所涉縣級(jí)行政區(qū)劃代碼;DDDD 為普查對(duì)象在所屬分類(lèi)中的順序編號(hào),實(shí)際應(yīng)用時(shí)根據(jù)每類(lèi)對(duì)象的總個(gè)數(shù)確定位數(shù)。
水利普查需要普查的縣級(jí)捆綁類(lèi)對(duì)象遍布各個(gè)專(zhuān)題,如水利工程設(shè)施專(zhuān)題中的塘壩、雨水集蓄利用工程(水窖、水柜等),水土保持專(zhuān)題中的水土保持措施(淤地壩、梯田)等。其對(duì)象編碼格式為 XXXXXXDDDD,其中 XXXXXX 為普查對(duì)象所在地所屬縣行政區(qū)劃代碼,DDDD為以縣級(jí)行政區(qū)劃為單元與流域嵌套后分割出的地理單元的順序編號(hào),實(shí)際應(yīng)用時(shí)根據(jù)每類(lèi)對(duì)象的總個(gè)數(shù)確定位數(shù)。
水利普查所有指標(biāo)除名稱(chēng)和地址外一律使用數(shù)字進(jìn)行編碼,部分單位名稱(chēng)采用編碼方式進(jìn)行處理。
水利普查所有指標(biāo)項(xiàng)編碼,相關(guān)標(biāo)準(zhǔn)有明確規(guī)定的,嚴(yán)格按照已頒標(biāo)準(zhǔn)執(zhí)行,無(wú)明確規(guī)定的,按類(lèi)型規(guī)定考慮。
本次普查所有涉及對(duì)象地理坐標(biāo)位置描述的信息,均采用國(guó)家 2000 坐標(biāo)系下的經(jīng)緯度坐標(biāo)表示,東經(jīng)、北緯均按六十進(jìn)制表示到秒。示例:東經(jīng)112° 21′ 32″,北緯 38° 45′ 34″。
水利普查所有涉及絕對(duì)時(shí)刻的指標(biāo)描述格式為YYYY/MM/DD/HH/MI,其中 YYYY 為公元紀(jì)年年號(hào); MM 為月份數(shù),取值 01~12; DD 為日期數(shù),取值 01~31;HH 為鐘點(diǎn)數(shù),取值 00~23; MI 為分鐘數(shù),取值 00~59;/為連接字符。
若水利普查時(shí)間指標(biāo)只需精確到日,其格式為 YYYY/MM/DD,只需精確到月時(shí),其格式為 YYYY/MM。
數(shù)值型是指用數(shù)值方式對(duì)普查對(duì)象屬性進(jìn)行表達(dá),根據(jù)具體需要可分為整型、實(shí)型和雙精度等。
枚舉型是指用限制性選擇方式對(duì)普查對(duì)象屬性進(jìn)行表達(dá),根據(jù)枚舉指標(biāo)可選數(shù)量決定編碼長(zhǎng)度,單一視角枚舉可選項(xiàng)少于 10 項(xiàng)的采用 1 位定長(zhǎng)編碼,枚舉項(xiàng)少于 100 項(xiàng)的采用 2 位定長(zhǎng)編碼,余此類(lèi)推。
枚舉項(xiàng)數(shù)少于 10 項(xiàng)的,從 1 開(kāi)始,按照枚舉次序順序編碼,有其它選擇的,其它編為 9;枚舉項(xiàng)數(shù)在 9~100 項(xiàng)之間 ,從 01 開(kāi)始,按照枚舉次序順序編碼,有其它選擇的,其它編為 99,余此類(lèi)推。
對(duì)于枚舉維度大于 1 維的復(fù)選枚舉項(xiàng),采用分字段逐一枚舉方式表達(dá),不允許將多個(gè)視角排列組合后復(fù)合枚舉。
文字型編碼只能采用自由文本方式對(duì)普查對(duì)象屬性進(jìn)行表達(dá),在確有需要時(shí),應(yīng)限制其文本長(zhǎng)度,并遵從《信息交換用漢字編碼字符集基本集的擴(kuò)充》(GB18030-2000)規(guī)定。
水利普查基本工作單元是縣級(jí)行政區(qū),這就意味著當(dāng)普查開(kāi)始時(shí),全國(guó) 2859 個(gè)(截至 2008 年底)縣級(jí)行政單元要同時(shí)開(kāi)展普查工作,給各自的對(duì)象進(jìn)行編碼,支持對(duì)水利普查對(duì)象的管理和對(duì)對(duì)象之間關(guān)系的描述,要求水利普查對(duì)象編碼必須簡(jiǎn)單,易于操作。本對(duì)象編碼僅僅限于水利普查工作,簡(jiǎn)化對(duì)象編碼程序,提高工作效率。本文是作者參與水利普查數(shù)據(jù)處理有關(guān)工作過(guò)程中產(chǎn)生的,得到許多同事正反 2 方面意見(jiàn)的初步驗(yàn)證,在此對(duì)他們給予的貢獻(xiàn)表示由衷的感謝和敬意。
[1]中華人民共和國(guó)民政部. 中華人民共和國(guó)行政區(qū)劃手冊(cè)(2009)[M]. 北京:中國(guó)底圖出版社,2009.
[2]Verdin K.L. , Verdin J.P. A topological system for delineation and codif i cation of the Earth’s river basins[J]. Journal of Hydrology, 1999, 218:1-12.