魏震方,耿利川,陳 峰
(1.中國人民解放軍海軍陸戰(zhàn)學院,廣東 廣州 510430;2.許昌學院 城鄉(xiāng)規(guī)劃與園林學院,河南 許昌 461000;3.中國人民解放軍75833部隊,廣東 廣州 510510)
船舶碰撞案例庫的應用有著非常廣泛的現(xiàn)實意義.比如:支持航海人員的訓練學習,服務航海事故的司法鑒定,以及應用在基于案例推理(Case-Based Reasoning, CBR)的船舶避碰決策系統(tǒng)的案例檢索等[1].但是關于船舶碰撞案例庫設計與構建領域的研究成果目前仍顯欠缺,工程化應用范圍有待進一步提高.
當前在工程實踐領域,船舶碰撞案例的描述、設計及構建等方面存在很大差異,尤其是語義上的不明確與異構,因此實際應用中難以根據(jù)動態(tài)過程來實現(xiàn)相似檢索和知識發(fā)現(xiàn),很難查找和抽取有用的信息,給船舶碰撞案例的高效利用帶來了障礙.基于此,迫切需要設計和實現(xiàn)一種能夠最大限度共享上述資源的碰撞案例庫,實現(xiàn)快捷準確的相似檢索與知識發(fā)現(xiàn),高效服務于船舶碰撞案例的各項具體應用.近幾年來,本體技術已經(jīng)成為國內外研究熱點,基于本體的CBR系統(tǒng)研究成果頗豐.但是,將本體引入到船舶碰撞案例庫建設領域的研究鮮有出現(xiàn),其工程化應用成功的案例則更少.英國利物浦理工大學研究的避碰專家系統(tǒng)、東京商船大學練習船“汐路丸”上的避碰決策系統(tǒng)等都是將神經(jīng)網(wǎng)絡、遺傳算法和模糊數(shù)學先后引入到船舶避碰的研究當中,多采用傳統(tǒng)的數(shù)據(jù)庫技術進行案例庫結構設計、信息檢索,公開文獻鮮見將本體與基于案例推理的方法應用在船舶碰撞案例建設領域.
本研究設計基于本體的數(shù)字化船舶碰撞案例庫,對船舶碰撞案例進行形式化、規(guī)范化的描述,進而構建標準化的集成案例庫,實現(xiàn)對海量船舶碰撞案例信息的高效管理和便捷共享.研究成果對于指導航海實踐、培養(yǎng)訓練航海人員以及海事審判的借鑒參考等方面具有重要的現(xiàn)實意義.
基于本體的數(shù)字化船舶避碰案例庫構建的工程實踐是建立在對國內外典型本體系統(tǒng)、本體構建方法以及相關描述語言和構建工具研究實驗的基礎上.在構建方法上,參考IDEF5方法和七步法,兼顧與國外IEEE標準頂層本體SUMO的復用和嫁接;在構建方式上采取了基于現(xiàn)有知識源構建船舶避碰案例領域知識,以自動 (或半自動)方式構造本體,并結合領域專家知識共同建立可快速檢索、高效利用的案例知識庫.
在系統(tǒng)架構上,基于本體的船舶碰撞案例庫系統(tǒng)分為數(shù)據(jù)層、本體層和知識服務層,并設有本體索引服務器[2],系統(tǒng)架構如圖1所示.數(shù)據(jù)層規(guī)范了船舶避碰案例元數(shù)據(jù)的描述和表示,將分布式數(shù)據(jù)資源、不同數(shù)據(jù)模型、數(shù)據(jù)格式等資源進行封裝,提供統(tǒng)一的數(shù)據(jù)訪問接口.
圖1 基于本體的數(shù)字化船舶碰撞案例庫系統(tǒng)邏輯結構圖
本體層定義了本體模塊、描述邏輯模塊、描述邏輯封裝模塊、本體注冊/注銷模塊、本體與數(shù)據(jù)間的映射模塊、本體查詢模塊,通過本體模塊對封裝好的數(shù)據(jù)進行語義描述定義;描述邏輯封裝模塊則將不同的本體描述語言定義的本體統(tǒng)一轉換為邏輯描述定義語言相同的本體.通過本體與數(shù)據(jù)間的映射模塊實現(xiàn)用戶描述語義到底層數(shù)據(jù)的訪問;本體查詢模塊為上層提供本體訪問服務,通過知識服務層可以查詢本體及其概念、角色定義,概念間關系;本體注冊/注銷模塊通過向本體索引服務器注冊本地資源,并提供其描述信息:包括本體所涉及的領域、提供者的信息、訪問的方式和權限等,對外提供資源訪問;他可以將資源描述更新信息發(fā)送到本體索引服務器,也可以注銷本體信息,取消資源訪問服務.
知識服務層定義了本體的目錄管理模塊、本體間映射模塊、本體集成模塊、 查詢轉換模塊、損失評價模塊、用戶查詢處理模塊和本體封裝模塊.用戶的查詢請求經(jīng)由用戶查詢處理模塊接收,進而通過本體目錄管理模塊查找能夠滿足用戶要求的本體資源.如果由于本體異構性使查詢到的本體不能滿足要求,則通過本體間映射模塊將用戶需求遷移到其他本體資源查詢,這期間也將通過查詢轉換模塊實現(xiàn)新遷移到的本體資源所有的詞匯組成表達式能夠表達用戶查詢請求.損失評價模塊則對這次查詢轉換損失的信息量進行評估.本體封裝模塊則將用戶查詢請求進行封裝傳送給本體層,當然本體層的查詢結果也通過本體封裝模塊返回到知識服務層.
本體索引服務器管理本體注冊/注銷模塊、本體查詢模塊、本體目錄管理模塊、本體間映射模塊、本體集成模塊.服務器是實體存在的,而本體層和知識服務層則是在虛擬環(huán)境中定義的.
基于本體的數(shù)字化船舶避碰案例庫設計,抽取船舶碰撞案例的基本特征、數(shù)據(jù)模型作為體系的基本功能模塊.依據(jù)CBR 推理周期“4R”(Retrieve、Reuse、Revise 和 Retain),具體研究:船舶碰撞案例庫資源獲取問題、船舶避碰案例庫元數(shù)據(jù)的描述和表示方法、船舶碰撞案例推理分析、基于本體的案例修正和保留等內容;根據(jù)本體、數(shù)據(jù)源在集成整合過程中遇到的異構性問題,將重點研究解決:本體間映射問題、本體集成問題、本體與數(shù)據(jù)間的映射問題;并且將對本體集成和案例檢索過程中的相似度計算算法進行深入研究,以期提高相似度計算的執(zhí)行效率和精度.分項表述如下:
1.2.1 船舶避碰案例庫元數(shù)據(jù)的描述和表示
本研究在數(shù)據(jù)層規(guī)范了船舶避碰案例元數(shù)據(jù)的描述和表示.將案例所包含的數(shù)據(jù)信息分為靜態(tài)信息、動態(tài)信息和結論信息.其中案例概要、環(huán)境信息等可歸為靜態(tài)信息;船舶碰撞過程信息,隨時序不斷變化的運動要素、會遇狀態(tài)、避碰行動等相關信息可歸為動態(tài)信息;事故后果、責任認定及處罰可歸為結論信息.案例庫依據(jù)其“會遇水域”、“船舶類型”、“會遇局面”等特征項進行分類,并細化案例庫為多個子案例庫.
1.2.2 基于本體的船舶避碰案例表示
本體可以構建形式化的概念模型,其建模描述語言和開發(fā)工具都發(fā)展比較成熟,使用本體表示的案例,檢索和修改也比較容易,可降低維護成本.基于本體的船舶避碰案例表示通過邏輯描述語言對案例結構、案例實例、船舶避碰案例相關知識進行定義.將船舶避碰案例定義為三元組[3],
Case=
其中D為船舶避碰案例的結構定義集合,C為案例對象庫,K為船舶避碰案例相關知識集合.
根據(jù)描述邏輯知識庫定義,本體可定義為一個三元組
1.2.3 船舶碰撞案例庫資源獲取問題
基于本體的船舶碰撞案例庫資源的獲取主要涉及如何在海量的數(shù)據(jù)資源中進行選擇,如何借助領域專家和計算機交互式溝通等方式獲取資料,并對其進行建模,建立該領域的概念、概念之間的關系、領域實例、領域規(guī)則、公理等;通過選擇邏輯表達能力強的本體建模語言構建本體,進而選擇良好的本體開發(fā)工具和支持環(huán)境實現(xiàn)對基于本體的數(shù)字化船舶避碰案例庫構建.
1.2.4 本體間映射問題
不同部門間可能采用不同的描述語言對同一個資源定義本體.同一個資源,不同的部門可能用不同的詞匯表述;或者同一詞匯,在不同部門對應不同的資源.因此,異構性是本體的固有屬性,并且本體本身并不能協(xié)調這種異構性.
簡單地說,本體映射就是給定兩個本體O1和O2,對于其中一個本體中的每個本體元素(概念、屬性或關系),可以從另一個本體中找到與之相對應的本體元素,使兩者在語義上具有相同或相似的含義,反之亦如此.
根據(jù)本體元素的不同,將本體映射分為概念映射、關系映射和實例映射.也可以根據(jù)映射函數(shù)的不同,而將本體映射分為一對一映射、一對多映射、多對一映射和多對多映射等類型.
1.2.5 本體集成問題
領域本體構造是一項極其復雜的系統(tǒng)工程,采用半自動本體獲取方法,以結構化(關系數(shù)據(jù)庫、知識庫)、半結構化(Web 表格、XML 文件)和無結構(文本文件)材料為船舶碰撞案例庫獲取來源,經(jīng)過預處理和學習過程,通過領域專家的確認,獲得適用的領域本體,緩解本體知識獲取瓶頸[4].進而將船舶碰撞案例領域內存在的幾個本體集成在一起,消除重疊的和不協(xié)調的部分.
1.2.6 本體與數(shù)據(jù)間的映射問題
不同的資源擁有者可能采用不同的本體描述語言對自己的數(shù)據(jù)資源進行本體定義,通過描述邏輯封裝功能將用具體語言描述的本體轉換成采用描述邏輯定義的具有相同語義內容的本體.進而通過描述邏輯本體與底層數(shù)據(jù)的映射實現(xiàn)本體到數(shù)據(jù)的映射,實際上就是建立描述邏輯系統(tǒng)中概念和角色的外延.映射對于封裝不同數(shù)據(jù)源在結構上的異構性至關重要,使用戶僅關心本體所描述的語義內容,而不用考慮底層數(shù)據(jù)的真實結構.
系統(tǒng)通過對大量典型的船舶碰撞案例進行研究,構建數(shù)字化的船舶碰撞案例庫,實現(xiàn)不同部門間在分布式環(huán)境下資源動態(tài)的、跨平臺的共享和信息檢索.
構建基于本體的船舶碰撞案例庫就是在浩如煙海的數(shù)據(jù)資源中進行選擇,借助領域專家和計算機交互式溝通等方式獲取資料,并對其進行建模,建立該領域的概念、概念之間的關系、領域實例、領域規(guī)則、公理等;通過選擇邏輯表達能力強的本體建模語言構建本體,進而選擇良好的本體開發(fā)工具和支持環(huán)境實現(xiàn)對基于本體的數(shù)字化船舶避碰案例庫構建.
一是在案例檢索中實現(xiàn)本體集成相似度計算.在本體集成過程中,涉及到語義相似度計算,例如文檔資源和研究領域之間的相似度計算;在案例檢索時涉及到案例相似度計算,包括局部相似度計算和整體相似度計算.
語義相似度的計算主要從概念詞匯和關系詞匯兩方面進行計算,而概念相似度的計算不僅僅涉及概念自身的語義,還包括概念的屬性和關系等概念描述信息.
在案例相似度計算中,局部相似度計算根據(jù)案例的特征值類型進行相似度計算,最后根據(jù)各特征的計算權重進行整體相似度計算.通過對相似度計算算法的研究,提高相似度計算的執(zhí)行效率和精度,實現(xiàn)基于本體的案例檢索.
二是實現(xiàn)基于本體的案例修正和保留.例修正一直是CBR中的難點,也是本項目研究探索的難點之一.基于本體的船舶碰撞案例檢索通過將新案例和舊案例進行相似度計算,判斷案例修正和保留結果.如果舊案例與新案例相差很大,不能直接作為結果指導應用,則對舊案例進行修正.如果新案例與舊案例相似度小于閾值,則進行保留,充實到案例庫中.案例的推理是一個不斷積累的過程,隨著案例庫中的案例不斷增多,案例推理解決問題的能力也將不斷增強.
本文集中在船舶碰撞案例庫的元數(shù)據(jù)描述和表示方法,本體、數(shù)據(jù)源在集成整合過程中遇到的異構性問題,本體集成和案例檢索過程中的相似度計算算法的執(zhí)行效率和精度問題.其在船舶碰撞案例庫建設領域的應用,解決了傳統(tǒng)CBR系統(tǒng)的不足,為實現(xiàn)不同部門間,在分布式環(huán)境下資源動態(tài)的、跨平臺的共享和信息檢索提供了可能.
參考文獻:
[1] 盧小校,吳 唏,施平安.數(shù)字化船舶碰撞案例庫構建[C].海洋船舶避碰論文集,2005.
[2] 黃 河,程 勇,史忠植,等.語義Web中開放知識服務體系的研究[J].計算機工程,2006(11):58-60.
[3] 陳 英, 徐 罡, 顧國昌.一種本體和上下文知識集成化的數(shù)據(jù)挖掘方法[J].軟件學報,2007(18):2 507-2 515.
[4] 程 勇.基于本體的不確定性知識管理研究[D].北京:中國科學院,2005.