封 麗,趙又霖
(1.河海大學(xué) 商學(xué)院,江蘇 南京 211100;2.河海大學(xué) 圖書(shū)館,江蘇 南京 210098)
國(guó)際河流一般是指流經(jīng)兩個(gè)或兩個(gè)以上國(guó)家的河流。21世紀(jì),國(guó)際河流的爭(zhēng)端由水資源的爭(zhēng)奪而爆發(fā)。國(guó)際河流的水資源通過(guò)自然越境而打破流域各國(guó)領(lǐng)土的完整性與封閉性,國(guó)際河流的爭(zhēng)端對(duì)于任何一個(gè)流域國(guó)都是不可避免而又復(fù)雜多樣的難題,如何應(yīng)對(duì)和解決該問(wèn)題,既是各主權(quán)國(guó)家間博弈的過(guò)程,也是多種渠道并行不悖的合作過(guò)程。因此,對(duì)國(guó)際河流流域的水文、水質(zhì)、水量、生態(tài)、工程建設(shè)、經(jīng)濟(jì)等生態(tài)與工程信息的監(jiān)測(cè)與預(yù)警,是流域規(guī)劃設(shè)計(jì)、水災(zāi)風(fēng)險(xiǎn)防范、應(yīng)急預(yù)案制定的基礎(chǔ)依據(jù)與支撐,也是外交談判的重要基礎(chǔ)資料。然而,如今尚未形成一套針對(duì)國(guó)際河流爭(zhēng)端的預(yù)警體系。水電開(kāi)發(fā)作為水資源利用的重要領(lǐng)域,其對(duì)周邊國(guó)家的產(chǎn)業(yè)發(fā)展與生態(tài)環(huán)境的影響意義深遠(yuǎn)。以瀾滄江-湄公河為例,水電開(kāi)發(fā)的迅速發(fā)展,已經(jīng)成為推動(dòng)流域下游國(guó)家經(jīng)濟(jì)發(fā)展的重要產(chǎn)業(yè)之一。但在水電開(kāi)發(fā)的過(guò)程中可能會(huì)對(duì)河流生態(tài)系統(tǒng)的結(jié)構(gòu)和功能帶來(lái)不利影響,同時(shí)對(duì)湄公河下游漁業(yè)的發(fā)展產(chǎn)生一定的影響。因此,要想推動(dòng)河流服務(wù)功能的協(xié)調(diào)發(fā)展,需要在滿足生態(tài)系統(tǒng)穩(wěn)定的基礎(chǔ)上進(jìn)行水電開(kāi)發(fā)。
跨界水資源的利益分配常常關(guān)系到國(guó)家的生存和發(fā)展。近年來(lái),世界各地跨界水糾紛有增無(wú)減,國(guó)際河流爭(zhēng)端成為國(guó)際社會(huì)中矛盾最多、最不穩(wěn)定的領(lǐng)域之一[1]。由于我國(guó)的地理位置特殊,多居于國(guó)際河流的上游,對(duì)河流的利用和開(kāi)發(fā)擁有天然的控制權(quán),然而水資源的開(kāi)發(fā)利用會(huì)或多或少地對(duì)下游產(chǎn)生影響,水資源的污染也可能被延伸到下游國(guó)家。因此,下游國(guó)家對(duì)中國(guó)開(kāi)發(fā)利用水資源的一舉一動(dòng)都保持高度的警惕和敏感。中國(guó)在瀾滄江上的水電梯級(jí)開(kāi)發(fā)、新疆國(guó)際河流上實(shí)施的“635計(jì)劃”及論證中的大西線調(diào)水工程,都引發(fā)了一些相關(guān)鄰國(guó)不同程度的異議。因此,我國(guó)在國(guó)際河流開(kāi)發(fā)過(guò)程中應(yīng)考慮建立與之有效的信息服務(wù)體系,從信息服務(wù)的角度研究國(guó)家間的合作、水資源的利用和經(jīng)濟(jì)政治的發(fā)展等服務(wù),而空間數(shù)據(jù)則是這一空間信息服務(wù)體系的基礎(chǔ)和根本。隨著我國(guó)社會(huì)經(jīng)濟(jì)的持續(xù)發(fā)展和周邊國(guó)家環(huán)境的變化,各流域國(guó)逐步進(jìn)入快速開(kāi)發(fā)階段,由于缺乏必要的基礎(chǔ)數(shù)據(jù)指導(dǎo)水資源開(kāi)發(fā)活動(dòng),在不同流域利益訴求存在差異的背景下,由開(kāi)發(fā)引起的矛盾也會(huì)逐漸增多甚至激化。積累國(guó)際河流流域空間數(shù)據(jù),并對(duì)這些數(shù)據(jù)加以知識(shí)組織處理,是對(duì)爭(zhēng)端事件加以預(yù)警的有效途徑,也是目前國(guó)際河流研究的核心議題。
有效的國(guó)際河流管理必然建立在大量的基礎(chǔ)數(shù)據(jù)信息之上,國(guó)際河流合作爭(zhēng)端解決和合作開(kāi)發(fā)各方的談判也必須借助基礎(chǔ)數(shù)據(jù),因此,各個(gè)國(guó)家均將相關(guān)水文、環(huán)境、社會(huì)經(jīng)濟(jì)等數(shù)據(jù)視為重要的戰(zhàn)略資源。目前國(guó)外關(guān)于國(guó)際河流基礎(chǔ)數(shù)據(jù)的管理較為成熟,其高度重視國(guó)際河流信息系統(tǒng)建設(shè)與跨界影響監(jiān)測(cè)[2-5]。國(guó)外研究主要集中在監(jiān)測(cè)途徑(如文本數(shù)據(jù)、調(diào)查訪問(wèn)、社會(huì)網(wǎng)絡(luò)和網(wǎng)絡(luò)數(shù)據(jù)等監(jiān)測(cè)途徑)和監(jiān)測(cè)與分析技術(shù)兩個(gè)方面[6-8]。國(guó)內(nèi)對(duì)一般河流的數(shù)據(jù)管理研究較多,但針對(duì)國(guó)際河流的數(shù)據(jù)管理和情報(bào)監(jiān)測(cè)的研究相對(duì)較少。綜上所述,研究主要包括:①一般河流的數(shù)據(jù)管理和監(jiān)測(cè)研究主要在水資源領(lǐng)域,如水庫(kù)發(fā)電、航運(yùn)數(shù)據(jù)的采集和分析、防洪決策系統(tǒng)、水功能的基礎(chǔ)數(shù)據(jù)管理等。在眾多的信息化技術(shù)和現(xiàn)代科技中使用最為廣泛的是GIS,其他技術(shù)主要是一些技術(shù)融合方案[9-10]。②國(guó)際河流數(shù)據(jù)管理主要集中在數(shù)據(jù)庫(kù)結(jié)構(gòu)和功能、數(shù)據(jù)信息交換等方面[11],但對(duì)國(guó)際河流涉及到的數(shù)據(jù)界定并不完善。③國(guó)際河流數(shù)據(jù)共享管理方面的研究?jī)H涉及流域組織合作機(jī)制框架下的小部分?jǐn)?shù)據(jù)共享[12]。目前,我國(guó)對(duì)國(guó)際河流爭(zhēng)端事件涉及到的利益主體及利益需求的研究關(guān)注不夠,在語(yǔ)義標(biāo)注、高維空間知識(shí)單元的關(guān)聯(lián)計(jì)算和空間異構(gòu)數(shù)據(jù)的融合方面在知識(shí)單元與知識(shí)內(nèi)容的層面也面臨一定的挑戰(zhàn)性。筆者研究的空間數(shù)據(jù)知識(shí)組織即是對(duì)特定領(lǐng)域的大數(shù)據(jù)的知識(shí)組織。知識(shí)描述的主要研究?jī)?nèi)容包括編目、元數(shù)據(jù)和本體等,語(yǔ)義化描述是知識(shí)描述的發(fā)展趨勢(shì)。筆者擬采用空間元數(shù)據(jù)、本體與關(guān)聯(lián)數(shù)據(jù)等地理語(yǔ)義資源對(duì)空間數(shù)據(jù)加以語(yǔ)義標(biāo)注,進(jìn)而實(shí)現(xiàn)語(yǔ)義化的知識(shí)描述。
國(guó)際河流水資源開(kāi)發(fā)爭(zhēng)端事件主要是指人類(lèi)活動(dòng)對(duì)自然和社會(huì)產(chǎn)生影響,進(jìn)而對(duì)各利益主體在經(jīng)濟(jì)、政治、工程、生態(tài)等方面產(chǎn)生的作用。因此需要對(duì)國(guó)際河流流域利益主體及利益訴求方面加以確定,并在此基礎(chǔ)上構(gòu)建與其相對(duì)應(yīng)的信息需求體系。信息需求模型如圖1所示。
圖1 信息需求模型
流域空間數(shù)據(jù)是指與河流流域相關(guān)的一系列空間數(shù)據(jù)。以我國(guó)的爭(zhēng)端事件為例,主要包括西南的水電開(kāi)發(fā)引起的爭(zhēng)端事件、西北的水資源配置引發(fā)的爭(zhēng)端事件和東北的水污染引發(fā)的爭(zhēng)端事件,而不同的爭(zhēng)端事件背后所對(duì)應(yīng)的空間數(shù)據(jù)關(guān)聯(lián)有所不同。因此,需要在明確國(guó)際河流空間數(shù)據(jù)類(lèi)型和特征的基礎(chǔ)上,確定與之對(duì)應(yīng)的國(guó)際河流空間數(shù)據(jù)的內(nèi)容體系。
流域空間數(shù)據(jù)范圍是面向水電開(kāi)發(fā)的國(guó)際河流流域空間數(shù)據(jù)范圍的基礎(chǔ),流域空間數(shù)據(jù)范圍規(guī)劃如表1所示。
表1 流域空間數(shù)據(jù)范圍規(guī)劃
然而,面向水電開(kāi)發(fā)的國(guó)際河流流域空間數(shù)據(jù)較流域空間數(shù)據(jù)有其特殊性,其主要關(guān)注于水工程、水需求與水利用層面,因此,這一類(lèi)數(shù)據(jù)的空間分析效果將直接影響到水電開(kāi)發(fā)所引發(fā)爭(zhēng)端事件的預(yù)警效果,如表2所示。
表2 面向水電開(kāi)發(fā)的國(guó)際河流流域空間數(shù)據(jù)內(nèi)容規(guī)劃
(1)空間數(shù)據(jù)內(nèi)容??臻g數(shù)據(jù)的內(nèi)容主要分為水資源、工程、水組織、水事件、水需求與水利用、經(jīng)濟(jì)等GIS專(zhuān)題層。
(2)空間數(shù)據(jù)結(jié)構(gòu)。首先,研究顯式描述的矢量數(shù)據(jù)結(jié)構(gòu)與隱式描述的柵格數(shù)據(jù)所對(duì)應(yīng)的專(zhuān)題層數(shù)據(jù)所需的數(shù)據(jù)編碼方式;其次,借鑒“數(shù)字黃河”、“數(shù)字長(zhǎng)江”和“數(shù)字清江”等地理信息系統(tǒng)專(zhuān)題數(shù)據(jù)庫(kù)設(shè)計(jì)的內(nèi)容,設(shè)計(jì)數(shù)據(jù)字段與數(shù)據(jù)結(jié)構(gòu);最后,研究如何實(shí)現(xiàn)數(shù)據(jù)字段與地理信息系統(tǒng)中空間數(shù)據(jù)結(jié)構(gòu)的匹配與映射。
(3)數(shù)據(jù)模型。首先,采用基于關(guān)系的空間數(shù)據(jù)模型實(shí)現(xiàn)空間數(shù)據(jù)中位置數(shù)據(jù)與屬性數(shù)據(jù)的處理;其次,采用面向?qū)ο蟮臄?shù)據(jù)模型方法實(shí)現(xiàn)概念實(shí)體的模型化;最后,采用GIS數(shù)據(jù)模型的方法處理不確定描述對(duì)象的近似表達(dá),從而構(gòu)建目標(biāo)模型和域模型。
(4)空間數(shù)據(jù)可視化??臻g數(shù)據(jù)存在自然層次結(jié)構(gòu),可以以不同的粒度進(jìn)行探索研究。因此需要利用可視化的方式將人類(lèi)開(kāi)發(fā)活動(dòng)數(shù)據(jù)及影響與空間展示進(jìn)行映射,實(shí)現(xiàn)模塊化展示。
空間數(shù)據(jù)的類(lèi)型復(fù)雜多樣,依據(jù)應(yīng)用需求的不同,在前期需要通過(guò)矢量結(jié)構(gòu)和柵格結(jié)構(gòu)表述其不同類(lèi)型的空間數(shù)據(jù)并做相應(yīng)的存儲(chǔ)處理。首先,GIS表達(dá)的是現(xiàn)實(shí)世界的時(shí)間和空間現(xiàn)象,具有空間自相關(guān)性。其次,空間數(shù)據(jù)中,同一地點(diǎn)的不同現(xiàn)象之間存在相關(guān)性,如兩個(gè)場(chǎng)的數(shù)值之間、一個(gè)離散對(duì)象集的兩個(gè)屬性之間、相互交疊的離散對(duì)象的屬性之間都具有相關(guān)性。最后,空間數(shù)據(jù)具有唯一性,GIS的目標(biāo)是在不同的具體地理參照的數(shù)據(jù)之間建立因果聯(lián)系,多元回歸模型提供了一種關(guān)聯(lián)空間變量及從樣本推斷出總體特征的重要手段,將空間數(shù)據(jù)用于建立空間分析的上層框架,對(duì)空間數(shù)據(jù)性質(zhì)加以理解,可以利用歸納(從觀察來(lái)推理)和演繹(從原則和理論來(lái)推理)的方法建立正確的空間描述表達(dá)模型。該體系的具體構(gòu)建思路如圖2所示。
圖2 國(guó)際河流流域空間數(shù)據(jù)知識(shí)組織體系
(1)知識(shí)描述。空間數(shù)據(jù)具有空間信息領(lǐng)域的特點(diǎn),比如在深度數(shù)據(jù)分析上,需要同時(shí)在空間和時(shí)間兩個(gè)維度發(fā)掘數(shù)據(jù)之間的關(guān)聯(lián),進(jìn)行時(shí)間軸和空間軸上的數(shù)據(jù)預(yù)測(cè)等。①采用基于概念的語(yǔ)義描述方法對(duì)空間元數(shù)據(jù)進(jìn)行描述,確定空間元數(shù)據(jù)的描述標(biāo)準(zhǔn),包括數(shù)字地理標(biāo)識(shí)、覆蓋范圍、事件模式及空間參照系等信息。②地理語(yǔ)義資源的描述與演化模型的構(gòu)建。首先,基于現(xiàn)有本體庫(kù)、關(guān)聯(lián)開(kāi)放數(shù)據(jù)等資源,構(gòu)建地理語(yǔ)義資源本體知識(shí)庫(kù);其次,基于形式化的描述實(shí)現(xiàn)地理語(yǔ)義有關(guān)空間關(guān)系的表達(dá);最后,基于語(yǔ)義網(wǎng)服務(wù)發(fā)現(xiàn)方法,構(gòu)建地理語(yǔ)義本體知識(shí)庫(kù)更新演化算法及模型,實(shí)現(xiàn)語(yǔ)義資源的實(shí)時(shí)更新和動(dòng)態(tài)維護(hù)。③空間數(shù)據(jù)與地理語(yǔ)義本體知識(shí)庫(kù)的匹配與映射。首先,采用自然語(yǔ)言處理技術(shù)、知識(shí)單元抽取、關(guān)聯(lián)識(shí)別技術(shù)實(shí)現(xiàn)空間數(shù)據(jù)與地理語(yǔ)義資源本體知識(shí)庫(kù)的匹配;其次,研究解決匹配過(guò)程中的沖突與集成問(wèn)題,并解決匹配過(guò)程中的質(zhì)量控制問(wèn)題。④空間數(shù)據(jù)語(yǔ)義標(biāo)注。首先,整合ConnectME、Annomation等語(yǔ)義標(biāo)注工具研究空間數(shù)據(jù)的標(biāo)注方法、模型和具體的技術(shù)方案;其次,研究空間數(shù)據(jù)語(yǔ)義標(biāo)注的集成方案;最后,研究空間數(shù)據(jù)語(yǔ)義標(biāo)注的動(dòng)態(tài)匹配機(jī)制。
(2)知識(shí)整序。知識(shí)組織的目的是序化,空間數(shù)據(jù)知識(shí)組織的最終目標(biāo)是從有序的數(shù)據(jù)中發(fā)現(xiàn)知識(shí)。①知識(shí)單元的特征分析和知識(shí)單元抽取方法與模型。從復(fù)雜系統(tǒng)理論、知識(shí)結(jié)構(gòu)和有序性原理出發(fā),根據(jù)知識(shí)序化理論,按照空間數(shù)據(jù)的不同類(lèi)型,分析其相對(duì)應(yīng)的各類(lèi)知識(shí)單元特征;結(jié)合人工智能、機(jī)器學(xué)習(xí)和自然語(yǔ)言處理等信息抽取技術(shù),研究空間數(shù)據(jù)中各知識(shí)單元抽取的關(guān)鍵技術(shù),提出適用于空間數(shù)據(jù)的知識(shí)單元抽取模型與方法。②空間數(shù)據(jù)的異構(gòu)融合。采用基于映射模板的元數(shù)據(jù)集成方法對(duì)異構(gòu)的空間數(shù)據(jù)加以集成,實(shí)現(xiàn)多格式、多類(lèi)型、多尺度、海量分布式數(shù)據(jù)的集成。③空間數(shù)據(jù)的關(guān)聯(lián)計(jì)算?;趥鹘y(tǒng)的知識(shí)關(guān)聯(lián)計(jì)算方法,通過(guò)文獻(xiàn)調(diào)研和專(zhuān)家訪談研究空間數(shù)據(jù)知識(shí)關(guān)聯(lián)的難點(diǎn)與關(guān)鍵性問(wèn)題;采用多重關(guān)系建模、仿真的方法,研究高維空間數(shù)據(jù)中基于矩陣計(jì)算和知識(shí)關(guān)聯(lián)計(jì)算之間的關(guān)系;基于傳統(tǒng)的相似性、距離等關(guān)聯(lián)計(jì)算方法研究適用于空間數(shù)據(jù)度量距離效應(yīng)、空間尺度和空間距離的知識(shí)單元整合方法與模型。
(3)知識(shí)深度關(guān)聯(lián)。①基于歸納學(xué)習(xí)的空間分布規(guī)則獲取相關(guān)專(zhuān)題層的數(shù)據(jù)知識(shí),實(shí)現(xiàn)知識(shí)單元因子事件的關(guān)聯(lián)分析;②基于空間數(shù)據(jù)聚類(lèi)的方法,將各專(zhuān)題層中知識(shí)對(duì)象間的相互作用與組織特征對(duì)應(yīng)的數(shù)據(jù)集進(jìn)行處理,實(shí)現(xiàn)各專(zhuān)題層之間的關(guān)聯(lián)分析;③基于空間關(guān)聯(lián)規(guī)則發(fā)現(xiàn)領(lǐng)域相關(guān)知識(shí),實(shí)現(xiàn)多種形式空間數(shù)據(jù)的規(guī)則與算法效率的提高。
(4)多重表達(dá)的可視化。對(duì)爭(zhēng)端事件現(xiàn)象的多重表達(dá),即利用多源、多時(shí)空、多尺度地理信息,從不同層次、不同角度分析與認(rèn)知地理現(xiàn)象,可以為GIS用戶(hù)提供由整體到局部、由抽象到具體的事件關(guān)聯(lián)空間關(guān)系,其也是地理空間信息服務(wù)質(zhì)量(quality of geospatial information service, QoGIS)的基本要求。
目前,要實(shí)現(xiàn)對(duì)國(guó)際河流水電開(kāi)發(fā)與合作中爭(zhēng)端事件的預(yù)警,需要對(duì)國(guó)際河流流域空間數(shù)據(jù)進(jìn)行知識(shí)組織研究。通過(guò)空間數(shù)據(jù)知識(shí)組織的研究實(shí)現(xiàn)空間關(guān)聯(lián)分析,從而達(dá)到預(yù)警的目的。然而該研究存在一些新的問(wèn)題:如國(guó)際河流流域數(shù)據(jù)積累量的薄弱、數(shù)據(jù)相對(duì)分散及利用的不合理、各流域國(guó)利益主體及利益需求的差異等,這些問(wèn)題大大降低了國(guó)際河流流域水電開(kāi)發(fā)規(guī)劃的合理性程度,進(jìn)而無(wú)法有效避免可能出現(xiàn)的爭(zhēng)端事件。
空間數(shù)據(jù)是實(shí)現(xiàn)國(guó)際河流流域爭(zhēng)端事件預(yù)警監(jiān)測(cè)的基礎(chǔ)條件。數(shù)據(jù)是資產(chǎn)和戰(zhàn)略資源,但失去控制和無(wú)組織的數(shù)據(jù)、信息、知識(shí)卻不再是一種資源。國(guó)際河流水資源管理過(guò)程中會(huì)產(chǎn)生海量有價(jià)值的空間數(shù)據(jù),但由于水資源管理各業(yè)務(wù)領(lǐng)域數(shù)據(jù)格式和編碼的不同,從而難以實(shí)現(xiàn)空間數(shù)據(jù)的共享與利用。因此,規(guī)劃國(guó)際河流流域空間數(shù)據(jù)的結(jié)構(gòu)體系、描述空間數(shù)據(jù)、序化空間數(shù)據(jù)顯得迫在眉睫。
(1)各流域國(guó)之間爭(zhēng)端動(dòng)因、爭(zhēng)端需求和爭(zhēng)端演化的研究是實(shí)現(xiàn)空間信息服務(wù)的基礎(chǔ)。從信息服務(wù)的角度來(lái)看,影響國(guó)際河流流域整體開(kāi)發(fā)和管理的根本原因在于各流域國(guó)利益主體間利益訴求的差異性。因此,分析清楚這些利益主體關(guān)注的焦點(diǎn),便可以從根本上有效控制或者減少爭(zhēng)端事件的發(fā)生。
(2)國(guó)際河流流域空間數(shù)據(jù)是實(shí)現(xiàn)爭(zhēng)端事件誘發(fā)原因關(guān)聯(lián)分析的基礎(chǔ)。國(guó)際河流流域空間數(shù)據(jù)較一般的流域數(shù)據(jù)有其特殊性,因此,明確其結(jié)構(gòu)體系,才能進(jìn)一步從特定的水電開(kāi)發(fā)爭(zhēng)端預(yù)警角度對(duì)其進(jìn)行空間關(guān)聯(lián)分析。
(3)知識(shí)組織是實(shí)現(xiàn)空間數(shù)據(jù)描述與序化的有效手段,也是實(shí)現(xiàn)爭(zhēng)端因素間關(guān)聯(lián)分析的前提條件??臻g數(shù)據(jù)較一般的數(shù)據(jù)而言,有其特有性,因此,構(gòu)建一套適合于空間數(shù)據(jù)的知識(shí)組織體系,是實(shí)現(xiàn)爭(zhēng)端預(yù)警的關(guān)鍵環(huán)節(jié)。