路文海 劉書明 楊 翼
(國家海洋信息中心,天津 300171)
海洋生態(tài)環(huán)境保護(hù)信息化建設(shè)是我國海洋信息化的重要內(nèi)容,對推動我國海洋事業(yè)發(fā)展和生態(tài)文明建設(shè)具有重要作用。近年來,隨著我國海洋生態(tài)環(huán)境監(jiān)測體系的基本建成,每年執(zhí)行環(huán)境狀況、環(huán)境風(fēng)險、環(huán)境監(jiān)管、公益服務(wù)等四大類二十多項監(jiān)測與評價任務(wù),獲取和積累了海量海洋生態(tài)環(huán)境保護(hù)信息,對我國海洋環(huán)境保護(hù)管理的輔助決策和科學(xué)研究等工作發(fā)揮了重要支撐作用。但是,因為海洋生態(tài)環(huán)境保護(hù)信息具有多來源、多層次、多時態(tài)、多格式和多學(xué)科的基本特點,隨著信息量幾何級地增長,僅憑現(xiàn)有的人工模式進(jìn)行管理勢必難以為繼。因此,只有通過深入推進(jìn)海洋生態(tài)環(huán)境保護(hù)信息化建設(shè),實現(xiàn)海洋生態(tài)環(huán)境保護(hù)信息采集、傳輸和管理的數(shù)字化、智能化、網(wǎng)絡(luò)化,才能從大量繁雜的生態(tài)環(huán)境信息中發(fā)現(xiàn)趨勢、把握重點,使生態(tài)環(huán)境保護(hù)各項工作體現(xiàn)時代性、把握規(guī)律性、賦予創(chuàng)造性,推動各類海洋環(huán)境問題的有效解決。對海洋生態(tài)環(huán)境保護(hù)信息進(jìn)行分類與編碼是實現(xiàn)信息存儲、交換、集成與共享的關(guān)鍵步驟,是海洋生態(tài)環(huán)境保護(hù)信息化建設(shè)的基礎(chǔ)性工作,制定我國海洋生態(tài)環(huán)境保護(hù)信息分類與編碼標(biāo)準(zhǔn)體系已十分緊迫。
海洋生態(tài)環(huán)境保護(hù)信息分類與編碼不僅項具有基礎(chǔ)性、綜合性、復(fù)雜性的特征,還具有很強(qiáng)的科學(xué)性,需要正確的理論與方法指導(dǎo)。當(dāng)前,從國家到地方,從政府到企業(yè)都在開展信息分類和編碼的研究和制訂工作[1-7],為海洋生態(tài)環(huán)境保護(hù)信息分類與編碼積累了有許多值得借鑒的經(jīng)驗。本文從海洋生態(tài)環(huán)境保護(hù)信息的基本特征和管理、應(yīng)用的需求出發(fā),結(jié)合其他領(lǐng)域信息分類編碼的研究成果,提出了我國海洋生態(tài)環(huán)境保護(hù)信息分類與編碼的原則、方法,確定了我國海洋生態(tài)環(huán)境保護(hù)信息五級類目的分類體系,并對其編寫了代碼。
信息分類就是把大的信息集合劃分成小的信息集合,是根據(jù)事物的特征,將信息按一定的原則和方法進(jìn)行區(qū)分和歸類,并建立起一定的分類系統(tǒng)和排列順序,以便管理和使用。劃分的結(jié)果稱為分類項,或稱類目[8-9]。編碼是在信息分類的基礎(chǔ)上,用一種易于被計算機(jī)和人識別的符號體系給分類結(jié)果賦予代碼的過程。分類是人類認(rèn)識世界的工具,它把客觀對象按照一定的概念組織起來,成為一個有條理的、便于理解的系統(tǒng),編碼所用的標(biāo)識系統(tǒng)要能準(zhǔn)確反映分類系統(tǒng)的邏輯關(guān)系。
信息分類的基本方法有線分類法和面分類法。線分類法也稱為層級分類法,這種方法將編碼對象按選定的屬性或規(guī)則(作為分類的劃分基礎(chǔ))逐次地分成若干層次類別,并排成一個有層次、逐級展開的分類體系[10]。在這個體系中,同位類類目之間存在并列關(guān)系,下位類與上位類類目之間存在隸屬關(guān)系。同位類類目不重復(fù)、不交叉。面分類法是將編碼對象的若干屬性或特征視為若干個“面”,每個面中又可分成許多彼此獨立的若干類目。使用時,可根據(jù)需要將這些“面”的類目組合在一起,形成一個復(fù)合類目。各面之間是平行的,沒有隸屬關(guān)系。不同面內(nèi)的類目沒有交叉和重復(fù)。面的位置有嚴(yán)格的固定位置,具體位置根據(jù)實際需要確定。實踐證明線分類法和面分類法各有優(yōu)、缺點。線分類法雖簡單實用,但由于其要求類目間有嚴(yán)格的上下級隸屬關(guān)系,不利于在復(fù)雜系統(tǒng)中應(yīng)用。面分類法雖然可以處理復(fù)雜對象,但對復(fù)雜對象中某一具體方面的層次關(guān)系反映不夠。
由于要表達(dá)事物的復(fù)雜程度不同,信息編碼時一般不采用單一的代碼符號來標(biāo)識信息,而往往用一組符號來表示,就形成了代碼符號與符號之間的關(guān)系,符號間的關(guān)系就是編碼系統(tǒng)的結(jié)構(gòu)。根據(jù)編碼目的的要求,一般將編碼結(jié)構(gòu)分為幾個碼段,包括分類標(biāo)識碼和特征碼,分類標(biāo)識碼又可以分為分類碼和標(biāo)識碼,特征碼也可以按特征進(jìn)一步分段,如圖1 所示。每一信息的編碼根據(jù)需要可以保持完整的結(jié)構(gòu),也可以按需要保留部分結(jié)構(gòu)。
圖1 編碼系統(tǒng)總體結(jié)構(gòu)
編碼結(jié)構(gòu)主要有5 種[11]。①鏈?zhǔn)浇Y(jié)構(gòu):其代碼之間是并列關(guān)系,每一碼位的代碼有其固定不變的含義,與前后碼位無關(guān)。②樹式結(jié)構(gòu):編碼后雖然也按順序線性排列,但是它的每一個代碼與上位代碼是隸屬關(guān)系,在一組代碼中相同的碼位與碼值由于上一碼位碼值的不同就會有不同的含義,整個編碼系統(tǒng)構(gòu)成一種樹狀結(jié)構(gòu)。③矩陣結(jié)構(gòu):代碼之間存在有矩陣關(guān)系,在一組代碼中幾個碼位按矩陣聯(lián)用。④混合結(jié)構(gòu):由于在應(yīng)用中各種結(jié)構(gòu)均有各自的優(yōu)缺點,所以一個實用的編碼系統(tǒng)可以根據(jù)需要靈活地采用各種結(jié)構(gòu)。⑤柔性編碼結(jié)構(gòu):整個編碼系統(tǒng)無固定的碼位,描述的事物復(fù)雜,碼位就多,反之則少。
3.2.1 分類原則
①科學(xué)性原則:按照海洋生態(tài)環(huán)境保護(hù)信息最穩(wěn)定的屬性及其中存在的邏輯關(guān)聯(lián)作為信息分類的依據(jù),并考慮信息的特征與發(fā)展。②實用性原則:海洋生態(tài)環(huán)境保護(hù)信息隨著海洋科學(xué)和信息技術(shù)的發(fā)展不斷變化和更新,因此,在進(jìn)行分類時,類目設(shè)置要全面、實用,受關(guān)注的、重要的海洋生態(tài)環(huán)境信息作為一級、二級類目列出,突出重點、檢索方便。③穩(wěn)定性原則:分類時,結(jié)合我國多年來海洋生態(tài)環(huán)境保護(hù)信息工作積累的成果,并考慮一些部門正在采用的分類與編碼。④可擴(kuò)展性原則:在類目的擴(kuò)展上預(yù)留空間,保證分類體系有一定彈性,可在本分類體系上進(jìn)行延拓細(xì)化。在保持分類體系的前提下,允許在最后一級分類下制定適用的分類細(xì)則。⑤兼容性原則:與國內(nèi)已有的相關(guān)信息分類標(biāo)準(zhǔn)相協(xié)調(diào),保持繼承性和實際實用的延續(xù)性,同時也與相關(guān)國際標(biāo)準(zhǔn)相符。⑥針對性原則:為了方便查找,對一些重要和適用頻率較高的類目單獨列出,有針對性地進(jìn)行分類。⑦業(yè)務(wù)服務(wù)于管理原則:以海洋生態(tài)環(huán)境保護(hù)管理和海洋生態(tài)環(huán)境保護(hù)信息化建設(shè)需求為導(dǎo)向,業(yè)務(wù)信息中能滿足管理決策需求的類目單獨列出,突出業(yè)務(wù)信息的應(yīng)用性。
3.2.2 基本類型框架
海洋生態(tài)環(huán)境保護(hù)信息可以按數(shù)據(jù)來源、使用目的、數(shù)據(jù)特征等多種方式分類??紤]到目前輔助管理決策、信息系統(tǒng)運(yùn)行和科研支撐的實際需要,結(jié)合海洋生態(tài)環(huán)境保護(hù)信息種類繁雜、綜合性強(qiáng)等特點,采用面分類法與線分類法相結(jié)合的方法對海洋生態(tài)環(huán)境保護(hù)信息進(jìn)行分類較為適宜,對屬性層次分明、隸屬關(guān)系明確的信息使用線分類法,否則重點考慮采用面分類法。
綜合考慮上述因素,將海洋生態(tài)環(huán)境保護(hù)信息,按照數(shù)據(jù)獲取方式和在信息系統(tǒng)中應(yīng)用對象的不同,分成海洋生態(tài)環(huán)境監(jiān)測與調(diào)查、海洋生態(tài)環(huán)境保護(hù)管理和海洋生態(tài)環(huán)境保護(hù)輔助信息3 個一級類目。海洋生態(tài)環(huán)境監(jiān)測與調(diào)查按照數(shù)據(jù)在海洋生態(tài)環(huán)境保護(hù)活動中產(chǎn)生的階段,又分成3 個二級類目,海洋生態(tài)環(huán)境保護(hù)管理則根據(jù)行政管理的業(yè)務(wù)劃分了14 個二級類目,海洋生態(tài)環(huán)境保護(hù)輔助信息按照數(shù)據(jù)來源和應(yīng)用層次的不同分成了6 個二級類目。這樣就形成了表1 所示的海洋生態(tài)環(huán)境保護(hù)信息基本類型框架。
3.2.3 類型細(xì)分
列出海洋生態(tài)環(huán)境保護(hù)信息基本類型框架后,須在此框架下進(jìn)行信息實體類型以及實體屬性的細(xì)化分類,不僅為信息系統(tǒng)的數(shù)據(jù)庫建設(shè)奠定基礎(chǔ),而且使得數(shù)據(jù)存儲、管理更加明確。在細(xì)化分類層面上,本文進(jìn)一步根據(jù)信息產(chǎn)生的階段、數(shù)據(jù)類型、應(yīng)用對象等特征將海洋生態(tài)環(huán)境保護(hù)信息分到五級類目。其中,四級類目代表具體的信息實體,對應(yīng)信息系統(tǒng)數(shù)據(jù)庫中的表、文檔和圖片等,例如海水水質(zhì)監(jiān)測表。五級類目為信息實體的屬性,表現(xiàn)在數(shù)據(jù)庫中就是數(shù)據(jù)表的字段,例如海水水質(zhì)監(jiān)測站位位置、監(jiān)測時期等。三級類目多數(shù)情況是四級類目的歸納概括。因篇幅所限,本文只列出了表2所示的海洋生態(tài)環(huán)境保護(hù)信息類型細(xì)劃分的一個實例。
類型細(xì)分的結(jié)果和基本類型框架一起構(gòu)成海洋生態(tài)環(huán)境保護(hù)信息的五級分類體系。
表1 海洋生態(tài)環(huán)境保護(hù)信息基本類型框架
表2 海洋生態(tài)環(huán)境保護(hù)信息類型細(xì)劃分實例
3.3.1 編碼原則①唯一性:在一個分類體系中,每一個海洋生態(tài)環(huán)境保護(hù)信息類目僅有一個代碼,一個代碼僅表示一個海洋生態(tài)環(huán)境保護(hù)信息類目,也就是說代碼數(shù)值必須與指定的信息類目一一對應(yīng)。②合理性:代碼結(jié)構(gòu)與分類體系相適應(yīng)。③可擴(kuò)展性:預(yù)留有適當(dāng)?shù)暮髠淇臻g,以適應(yīng)不斷擴(kuò)充的信息需要。④簡明性:代碼結(jié)構(gòu)盡量簡明,在保證提供一定信息的前提下,盡可能縮短代碼長度,以節(jié)省計算機(jī)處理時間和存儲空間,降低代碼的出錯率。⑤穩(wěn)定性:海洋生態(tài)環(huán)境保護(hù)信息類目的代碼一經(jīng)確定,未經(jīng)許可,任何單位和個人不得隨意改變,以保持編碼體系的完整性、嚴(yán)肅性和權(quán)威性。⑥無含義性:海洋生態(tài)保護(hù)環(huán)境信息分類代碼中的每一位數(shù)字不表示任何與海洋生態(tài)環(huán)境相關(guān)的特定信息。⑦規(guī)范性:代碼的類型、結(jié)構(gòu)以及編寫格式統(tǒng)一。
3.3.2 類型編碼
對應(yīng)前節(jié)海洋生態(tài)環(huán)境保護(hù)信息的五級分類體系,編寫代碼亦分為五級,即一級類目、二級類目、三級類目、四級類目和五級類目,代碼結(jié)構(gòu)見圖2。類目代碼用阿拉伯?dāng)?shù)字表示,同級類采用線性的十進(jìn)制方法進(jìn)行排序,每層代碼均采用2 位阿拉伯?dāng)?shù)字,即01-99。一級類目代碼由第一層代碼組成,二級及以上類目代碼加本層代碼組成??梢姾Q笊鷳B(tài)環(huán)境保護(hù)信息代碼結(jié)構(gòu)分為三段:大類碼、實體碼、信息特征碼,即代碼結(jié)構(gòu)為大類碼+實體碼+信息特征碼。前4 層在系統(tǒng)中唯一標(biāo)識信息實體(數(shù)據(jù)庫的表),最后一段是實體屬性特征,即實體屬性(字段)的枚舉。
3.3.3 擴(kuò)展編碼
圖2 代碼結(jié)構(gòu)圖
針對海洋生態(tài)環(huán)境保護(hù)信息多學(xué)科領(lǐng)域整合和共享要求,以及保證信息的安全,在信息類型劃分的基礎(chǔ)上還應(yīng)區(qū)分信息的數(shù)據(jù)類型、數(shù)據(jù)格式、所屬學(xué)科和安全級別等方面的特征,這些特征作為擴(kuò)展編碼,與類型碼共同使用。擴(kuò)展編碼與類型編碼相似,同樣用十進(jìn)制阿拉伯?dāng)?shù)字方法進(jìn)行排序,每類代碼采用1 或2 位阿拉伯?dāng)?shù)字。需要說明的是擴(kuò)展碼主要針對第四級類目使用。
表3 擴(kuò)展編碼一覽
海洋生態(tài)環(huán)境保護(hù)信息化建設(shè)是我國海洋信息化的重要內(nèi)容,對推動我國海洋事業(yè)發(fā)展和生態(tài)文明建設(shè)具有重要作用。近年來,隨著我國海洋生態(tài)環(huán)境監(jiān)測體系的基本建成,每年執(zhí)行環(huán)境狀況、環(huán)境風(fēng)險、環(huán)境監(jiān)管、公益服務(wù)等四大類二十多項監(jiān)測與評價任務(wù),獲取和積累了海量海洋生態(tài)環(huán)境保護(hù)信息,對我國海洋環(huán)境保護(hù)管理的輔助決策和科學(xué)研究等工作發(fā)揮了重要支撐作用。但是,因為海洋生態(tài)環(huán)境保護(hù)信息具有多來源、多層次、多時態(tài)、多格式和多學(xué)科的基本特點,隨著信息量幾何級地增長,僅憑現(xiàn)有的人工模式進(jìn)行管理勢必難以為繼。
建立科學(xué)合理的海洋生態(tài)環(huán)境保護(hù)信息分類系統(tǒng)并編寫代碼,是海洋生態(tài)環(huán)境保護(hù)信息化建設(shè)的關(guān)鍵步驟,也是對海洋生態(tài)環(huán)境進(jìn)行科學(xué)管理、保護(hù)和研究的重要基礎(chǔ)和前提,雖然目前我國已有學(xué)者開展此方面的研究,但直到現(xiàn)在也沒有一個能為所有學(xué)者和管理者都認(rèn)同的分類原則和分類系統(tǒng)。本文討論的分類體系和編碼方法,從管理和信息化建設(shè)的角度出發(fā),考慮了海洋生態(tài)環(huán)境保護(hù)信息的基本情況、特點和實踐經(jīng)驗。但由于海洋生態(tài)環(huán)境保護(hù)信息是具有多來源、多層次、多時態(tài)、多格式和多學(xué)科特點的海量數(shù)據(jù),對它的分類和編碼具有很強(qiáng)的理論性、邏輯性,同時又強(qiáng)調(diào)實用性,是一項復(fù)雜的系統(tǒng)工程。因此,本文給出的分類與編碼難免還存在一些不足與缺點,例如對于四類級目中數(shù)據(jù)類型為非報表數(shù)據(jù)的信息,彼此間五級類目具有大量相同屬性信息,造成五級類目重名率較高。還有就是在海洋生態(tài)環(huán)境保護(hù)信息應(yīng)用層次上,管理部門和業(yè)務(wù)部門間存在明顯區(qū)別,如何同時滿足兩個應(yīng)用層次的需求,并實現(xiàn)在兩個層次間的信息共享和互通,也是一個需要進(jìn)一步研究的方面。在以后編制海洋生態(tài)環(huán)境保護(hù)信息分類編碼標(biāo)準(zhǔn)時,應(yīng)盡快制定國家標(biāo)準(zhǔn),使海洋生態(tài)環(huán)境保護(hù)信息分類體系規(guī)范化,在規(guī)范化分類基礎(chǔ)上編制標(biāo)準(zhǔn)編碼,并依此實現(xiàn)海洋生態(tài)環(huán)境保護(hù)信息化。
[1]楊安生.企業(yè)精細(xì)化管理要科學(xué)運(yùn)用信息分類與編碼[J].現(xiàn)代情報,2007,07:197-199.
[2]陳良貴,陳巳康,趙勇.上海城市交通基礎(chǔ)信息分類與編碼研究[J].城市公用事業(yè),2008,03:33-36+67.
[3]張育潤,江洲.生物信息資源分類與編碼標(biāo)準(zhǔn)化研究[J].標(biāo)準(zhǔn)科學(xué),2009,03:21-23.
[4]吳伯杰,李功強(qiáng),秦士存.通用編碼分類系統(tǒng)工具軟件的研究開發(fā)[J].機(jī)械設(shè)計與制造,1999,01:10-11.
[5]張茂震,宋鐵英,唐小明,黃水生,劉鵬舉,謝陽生.森林資源信息分類編碼方法[J].福建林學(xué)院學(xué)報,2005,25(2):147-152.
[6]崔麗娟,張曼胤,何春光.中國濕地分類編碼系統(tǒng)研究[J].北京林業(yè)大學(xué)學(xué)報,2007,29(3):87-92.
[7]何建邦,李新通,畢建濤,曹彥榮.資源環(huán)境信息分類編碼及其與地理本體關(guān)聯(lián)的思考[J].地理信息世界,2003,01(5):6-11.
[8]王丙義.信息分類與編碼[M].北京:國防工業(yè)出版社,2003:22-25.
[9]陳宗舜.制造業(yè)信息化與信息編碼.北京:清華大學(xué)出版社,2003:87-90.
[10]周建勤,張鐸.物流信息分類編碼標(biāo)準(zhǔn)體系探討[J].物流技術(shù),2000,(2):372-391.
[11]張丹,企業(yè)信息編碼及其管理系統(tǒng)的研究與開發(fā)[D].南京:南京航空航天大學(xué),2007:12-13.