王小紅, 徐建良??, 洪騰龍, 卜文瑞, 候成飛
(1.中國海洋大學(xué)信息科學(xué)與工程學(xué)院,山東 青島 266100; 2.國家海洋局第一海洋研究所,山東 青島 266061)
隨著數(shù)據(jù)資源體量、復(fù)雜性和異構(gòu)性的增加,科學(xué)家越來越需要數(shù)據(jù)集成和共享平臺來獲取分布式的跨學(xué)科數(shù)據(jù)。數(shù)據(jù)集成平臺目前存在多種體系結(jié)構(gòu),主要可以分為兩類:虛擬集成方法和物化集成方法[1]。物化集成系統(tǒng)是指在數(shù)據(jù)集成過程中將需要集成的數(shù)據(jù)復(fù)制裝載到公共的數(shù)據(jù)集合中[2]。虛擬集成方法是采用虛擬視圖來實(shí)現(xiàn)的數(shù)據(jù)集成的系統(tǒng)結(jié)構(gòu),當(dāng)用戶提交查詢請求時(shí),系統(tǒng)根據(jù)用戶命令訪問不同數(shù)據(jù)源中的數(shù)據(jù)并返回結(jié)果[3]。上述的虛擬集成方法和物化集成方法在體系架構(gòu)上提出了兩類數(shù)據(jù)集成平臺的解決方案,然而在實(shí)際應(yīng)用中,數(shù)據(jù)異構(gòu)性是阻礙數(shù)據(jù)集成的困難之一[4]。因此,處理異構(gòu)數(shù)據(jù)首先要理解數(shù)據(jù)的語義。本體作為一種領(lǐng)域知識模型,為數(shù)據(jù)底層的互操作提供了規(guī)范化的語義表示和準(zhǔn)確的語義協(xié)同。
為了解決多信息源的不同詞匯和服務(wù)的互操作,本體模型應(yīng)該更加廣泛的應(yīng)用在支持知識相關(guān)操作(如數(shù)據(jù)集成、獲取、推理、和檢索)的互操作平臺或應(yīng)用系統(tǒng)。利用數(shù)據(jù)互操作平臺,科學(xué)家能夠輕松地獲取數(shù)據(jù)、讀懂?dāng)?shù)據(jù),基于這些跨學(xué)科異構(gòu)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)、分析,產(chǎn)生更精確的數(shù)據(jù)和更高層次的知識。
隨著對海底資源的勘察和開發(fā),各國獲取了大量的實(shí)物樣品和分析測試數(shù)據(jù)。這些數(shù)據(jù)能夠幫助海洋科學(xué)家重現(xiàn)數(shù)千年以來海洋動態(tài)變化的過程。
以巖心沉積物樣品為例,水動力、物源、植被、氣候、溫度在時(shí)間軸上的不斷變化,造成了巖心沉積物在不同層位所體現(xiàn)的地質(zhì)時(shí)代和地球環(huán)境背景信息各不相同。因此,海洋學(xué)家對于巖心沉積物樣品的研究,常常經(jīng)過分割、剖分、分層、取小樣等操作,分配到不同的實(shí)驗(yàn)室,由不同的實(shí)驗(yàn)員用不同的儀器進(jìn)行分析測試(見圖1)。同一巖心樣品通常會產(chǎn)生不同測試指標(biāo)的實(shí)驗(yàn)結(jié)果(見表1)。然而這些實(shí)驗(yàn)結(jié)果的組織模式又各不相同(見圖2)。依靠人工很難完成不同層位的巖心測試結(jié)果的集成和共享。因此,海洋領(lǐng)域更需要實(shí)現(xiàn)大規(guī)模的多源異構(gòu)數(shù)據(jù)的互操作。
目前,海洋領(lǐng)域主流的數(shù)據(jù)互操作方法有兩類:第一類是依賴于匯交規(guī)范的數(shù)據(jù)互操作方法。例如:拉蒙特-多爾蒂地球觀測中心的EarthChem地球化學(xué)數(shù)據(jù)庫[5]和國際海底管理局的中央數(shù)據(jù)存儲庫CDR(Central Data Repository)[6]。這種方法是面向數(shù)據(jù)內(nèi)容的一種簡單的數(shù)據(jù)組織模式轉(zhuǎn)化,不僅增加了人工勞動量,而且很容易造成數(shù)據(jù)內(nèi)容的丟失和語義的誤解。第二類方法是基于semantic web技術(shù)的數(shù)據(jù)互操作方法。例如:地球與環(huán)境術(shù)語語義網(wǎng)[7](The Semantic Web for Earth and Environmental Terminology,SWEET)和海洋元數(shù)據(jù)互操作項(xiàng)目 (Marine Metadata Interoperability Project,MMI)[8]。該方法通過構(gòu)建領(lǐng)域本體、術(shù)語集、敘詞表,或者開發(fā)語義管理工具來進(jìn)行語義互操作和數(shù)據(jù)集成。
圖1 樣品切割和分配情況
小樣Subsample 樣品使用人Sample user 測試指標(biāo)Test parameter樣品化驗(yàn)員Analyst 儀器Instrument1使用人A主量元素1AAS2使用人B微量元素2ICP-MS3使用人C同位素3MC-ICP-MS4使用人A主量元素4XRF5使用人B微量元素5ICP-MS6使用人F稀土元素6XRF7使用人W同位素7TIMS8使用人X有機(jī)污染物5GC-MS9使用人D無機(jī)碳6總無機(jī)碳分析儀
圖2 分析測試結(jié)果的元數(shù)據(jù)異構(gòu)性示例
雖然MMI項(xiàng)目所涉及的數(shù)據(jù)學(xué)科和調(diào)查范圍非常廣泛,但是由于語義映射過程完全依賴人工操作,因此該方法并為得到廣泛推廣。截至目前,MMI項(xiàng)目注冊的244個詞匯集中,僅有10對語義映射。為了能更好的解決海洋地球化學(xué)數(shù)據(jù)集成和共享的問題,我們借鑒MMI的語義協(xié)同思想,在EarthChem的數(shù)據(jù)匯集規(guī)范基礎(chǔ)上,設(shè)計(jì)了基于本體的海洋地球化學(xué)數(shù)據(jù)互操作系統(tǒng),支持多模式異構(gòu)數(shù)據(jù)采集、融合、推理和共享。
本文提出的基于領(lǐng)域本體的海洋地質(zhì)化學(xué)數(shù)據(jù)互操作系統(tǒng)的框架,由數(shù)據(jù)層、語義層、應(yīng)用層三部分組成(見圖3)。
圖3 基于本體的數(shù)據(jù)互操作框架
數(shù)據(jù)層主要完成元數(shù)據(jù)標(biāo)準(zhǔn)構(gòu)建、數(shù)據(jù)匯交模板定制等功能,為多源異構(gòu)的海洋地球化學(xué)數(shù)據(jù)集,提供了元數(shù)據(jù)標(biāo)準(zhǔn)和語義規(guī)范。
2.1.1 海洋地球化學(xué)數(shù)據(jù)元數(shù)據(jù)標(biāo)準(zhǔn)的構(gòu)建 由于海洋調(diào)查領(lǐng)域缺少統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn),多源異構(gòu)數(shù)據(jù)沒有數(shù)據(jù)匯交的模式和語義規(guī)范。為了實(shí)現(xiàn)大洋樣品全生命周期的數(shù)據(jù)溯源和集成,我們參照《科技平臺元數(shù)據(jù)標(biāo)準(zhǔn)化基本原則與方法》[9],分三步完成了海洋地球化學(xué)元數(shù)據(jù)標(biāo)準(zhǔn)的建設(shè)。
(1) 分析資源特點(diǎn) 通過參與我國“國際海域資源調(diào)查”樣品屬性數(shù)據(jù)匯交,認(rèn)識和分析了大量地質(zhì)化學(xué)元數(shù)據(jù)。
(2) 調(diào)研相關(guān)元數(shù)據(jù)標(biāo)準(zhǔn) 經(jīng)過對Marine Community Profile of ISO 19115[10]、數(shù)字地理空間元數(shù)據(jù)內(nèi)容標(biāo)準(zhǔn)(Content Standard for Digital Geospatial Metadata)[11]、國家標(biāo)準(zhǔn)《GB/T 12763.7-2007海洋調(diào)查規(guī)范海洋調(diào)查資料交換第7部分》[12]和《GBT 12763.8-2007 海洋調(diào)查規(guī)范第8部分海洋地質(zhì)地球物理調(diào)查》[13]的查閱,結(jié)合我國海洋地質(zhì)調(diào)查業(yè)務(wù)特點(diǎn),初步制定了海洋地質(zhì)化學(xué)元數(shù)據(jù)標(biāo)準(zhǔn)。
(3) 確定元數(shù)據(jù)內(nèi)容 經(jīng)過與我國海洋領(lǐng)域?qū)<业亩啻斡懻摚_定了海洋地質(zhì)化學(xué)元數(shù)據(jù)標(biāo)準(zhǔn)的元素和元素之間的層次關(guān)系,按照SKOS (Simple Knowledge Organization System)提供的知識組織模式,初步構(gòu)建了海洋地球化學(xué)元數(shù)據(jù)標(biāo)準(zhǔn)。海洋地球化學(xué)元數(shù)據(jù)標(biāo)準(zhǔn)包括樣品(Sample)、測試數(shù)據(jù)(TestData)、主要分析性元數(shù)據(jù)(PrimaryAnalyticalMetadata)、機(jī)構(gòu)(Institution)、人員(Person)、位置(Location)6個主要模塊。
為了海洋科學(xué)家使用方便,將部分元數(shù)據(jù)標(biāo)準(zhǔn)嵌入Excel電子表格,組成數(shù)據(jù)匯交模板[14]。大洋樣品屬性數(shù)據(jù)匯交模板由樣品信息、測試數(shù)據(jù)、申請書、分析性元數(shù)據(jù)、詞匯集(受控詞匯集)、填表說明等6張子表組成。子表間通過外鍵(箭頭上的字)互相連接(見圖4)。數(shù)據(jù)匯交模板相當(dāng)于語義中介,作為數(shù)據(jù)匯交規(guī)范與其他異構(gòu)數(shù)據(jù)進(jìn)行語義映射。
圖4 數(shù)據(jù)匯交模板
2.1.2 數(shù)據(jù)匯交模板定制 由于大洋調(diào)查數(shù)據(jù)涉及多學(xué)科的數(shù)據(jù),僅地球化學(xué)分析測試就有18種不同的分析測試指標(biāo),其產(chǎn)生的分析測試數(shù)據(jù)組織模式也不同。因此,開發(fā)了匯交模板生成器(見圖5),它能夠從海洋地球化學(xué)、生物化學(xué)、海水化學(xué)元數(shù)據(jù)標(biāo)準(zhǔn)中,抽取相應(yīng)學(xué)科的元數(shù)據(jù)標(biāo)準(zhǔn),為用戶定制數(shù)據(jù)匯交模板。
模版生成器的上方有“航次”(Cruise)和“申請人”(Applicant)選項(xiàng),左側(cè)列表框里列出了64種分析測試指標(biāo),包括地球化學(xué)測試指標(biāo)18種,海水化學(xué)測試指標(biāo)24種,生物化學(xué)測試指標(biāo)22種。位于工具中間的“〉〉〉”按鈕,可以幫助用戶將其需要的分析測試指標(biāo),添加到右側(cè)的列表框中。同時(shí)用戶也可以使用“〈〈〈”按鈕,從右側(cè)列表框中刪除不需要的分析測試指標(biāo)。
圖5 數(shù)據(jù)匯交模板生成器
大洋樣品本體作為一種規(guī)范化的概念模型,為多數(shù)據(jù)源提供了一致的語義描述和類層次結(jié)構(gòu)。語義層以大洋樣品本體模型為基礎(chǔ),完成了語義抽取和語義映射。
首先,在海洋地球化學(xué)元數(shù)據(jù)標(biāo)準(zhǔn)的基礎(chǔ)上,用Protégé建模工具構(gòu)建了大洋樣品本體(MSO)[15]。其次,開發(fā)元數(shù)據(jù)抽取工具和元數(shù)據(jù)映射工具,在大洋樣品本體的配合下,完成了用戶元數(shù)據(jù)與元數(shù)據(jù)標(biāo)準(zhǔn)之間的語義映射[14]。
2.2.1 語義抽取和語義映射 語義抽取是異構(gòu)數(shù)據(jù)集成、共享和互操作的第一步。語義抽取,指用不同技術(shù)去識別和抽取實(shí)體、事實(shí)、屬性、概念和事件,用它們來填充元數(shù)據(jù)字段[16]。語義映射,就是為源文本中抽取的術(shù)語和本體或知識庫中的概念建立連接,給每個術(shù)語一個正確的概念[17]。
為了完成數(shù)據(jù)模式和語義轉(zhuǎn)換,首先通過元數(shù)據(jù)抽取工具抽取用戶Excel表格中的元數(shù)據(jù),再利用元數(shù)據(jù)映射工具,將多數(shù)據(jù)源的語義模式與大洋樣品本體模型進(jìn)行映射,從而完成多個模式之間的語義協(xié)同和數(shù)據(jù)復(fù)用。詳細(xì)步驟如圖6所示:
圖6 面向Excel數(shù)據(jù)源的語義模式轉(zhuǎn)換和存儲
①針對Excel格式的數(shù)據(jù),我們首先借助元數(shù)據(jù)抽取工具(見圖7),抽取用戶數(shù)據(jù)的元數(shù)據(jù)[14]。使用這個工具,用戶只需要提供電子表格的列標(biāo)題(“title”)所在的行號,用戶的元數(shù)據(jù)就可以自動從列標(biāo)題中抽取出來。這個工具為用戶提供了一個友好的界面,來編輯一些特殊的信息。例如:當(dāng)測試數(shù)據(jù)的單位在獨(dú)立行時(shí),用戶需要輸入其所在行“unit”的行號。除此之外,用戶還需要輸入分析測試數(shù)據(jù)的數(shù)值(“data”)起始行行號,以便于后續(xù)將用戶數(shù)據(jù)加載入模板。
圖7 元數(shù)據(jù)抽取工具
②借助元數(shù)據(jù)映射工具(見圖8),為用戶數(shù)據(jù)模型與領(lǐng)域本體模型之間建立語義映射[14]。在工具左側(cè)列出的是用戶元數(shù)據(jù)的層次結(jié)構(gòu),右側(cè)是數(shù)據(jù)匯交模板的層次結(jié)構(gòu)。工具中間有‘=’、 ‘<’、和 ‘>’3個按鈕控件,分別對應(yīng)‘exact-match’、‘narrow-match’、和 ‘broad-match’3種匹配關(guān)系。
圖8 元數(shù)據(jù)映射工具
為了自動建立語義映射,我們采取了基于本體的自動匹配機(jī)制。成功匹配的結(jié)果有兩種類型,一對一匹配和一對多匹配。一對一匹配(藍(lán)色字體標(biāo)記)由本體模型中的等同關(guān)系產(chǎn)生。一對多匹配(紅色字體標(biāo)記)通常由本體模型中的等級關(guān)系產(chǎn)生。例如:‘Fe’能夠自動與它的3個子類‘FeT’, ‘Fe2O3’, ‘FeO’匹配,當(dāng)用戶數(shù)據(jù)中出現(xiàn)‘Fe’時(shí),其子類將以紅色字體顯示,提示用戶選擇其中之一與之對應(yīng)。由于大洋樣品本體模型更新總是滯后于海洋調(diào)查、分析測試技術(shù)的發(fā)展,有一些新興術(shù)語無法與數(shù)據(jù)匯交模板中的元數(shù)據(jù)自動匹配。此時(shí),就需要人工干預(yù),用工具中提供的3種 ‘=’、 ‘<’、和 ‘>’按鈕控件,為新術(shù)語與模板的元數(shù)據(jù)建立語義關(guān)系,或者將無法匹配的新術(shù)語添加到右側(cè)‘ExtraSheet’,以供后期的模板更新。
③將用戶數(shù)據(jù)源導(dǎo)入?yún)R交模板。通過元數(shù)據(jù)映射工具,能夠完成信息源和大洋樣品本體模型之間的語義映射,根據(jù)元數(shù)據(jù)映射關(guān)系,和Excel電子表格中的數(shù)據(jù)起始位置,將數(shù)據(jù)導(dǎo)入?yún)R交模板。
④最后按照匯交模板的數(shù)據(jù)模式構(gòu)建關(guān)系型數(shù)據(jù)庫,將分散異構(gòu)的Excel數(shù)據(jù)集,存儲到統(tǒng)一模型的數(shù)據(jù)庫中。
2.2.2 關(guān)系型數(shù)據(jù)庫模型中的語義協(xié)同 針對關(guān)系型數(shù)據(jù)庫,我們利用D2RQ[18-20]生成一個描述關(guān)系型數(shù)據(jù)庫的RDF模型(見圖9)。并且開發(fā)了網(wǎng)站(見圖10),為RDB和MSO之間建立語義映射。
圖9 面向關(guān)系型數(shù)據(jù)庫的語義模式轉(zhuǎn)換
在數(shù)據(jù)庫語義映射網(wǎng)站中,首先,我們鍵入數(shù)據(jù)庫地址(Connect string),來連接數(shù)據(jù)庫;其次,在彈出的窗口中選擇需要映射的數(shù)據(jù)庫表和字段(見圖10(a));再次,選中的數(shù)據(jù)庫表和字段將會顯示在數(shù)據(jù)映射網(wǎng)站的左側(cè),大洋樣品本體模型的結(jié)構(gòu)顯示在右側(cè)(見圖10(b));最后,為數(shù)據(jù)庫和大洋樣品本體模型建立語義映射。經(jīng)過字符串比較,能夠?yàn)槠磳懲耆嗤淖侄谓⒂成?。剩余字段需要管理員使用“=”按鈕,為其建立語義映射。
2.2.3 查詢轉(zhuǎn)化模塊 為了實(shí)現(xiàn)SPARQL查詢的轉(zhuǎn)換,我們開發(fā)了查詢轉(zhuǎn)換模塊Transfer。該模塊根據(jù)大洋樣品本體模型和語義映射,獲取用戶RDB和MSO兩個RDF模式之間的推理關(guān)系(包括類層次和屬性層次),從而將面向MSO模式的SPARQL查詢,轉(zhuǎn)換成面向數(shù)據(jù)庫模式的SPARQL查詢。
(a) 語義映射網(wǎng)站彈窗Popup window of semantic mapping website
(b) 數(shù)據(jù)庫與本體模型的語義映射網(wǎng)站W(wǎng)ebsite for semantic mapping betweenRDB and ontology
圖10 語義映射網(wǎng)站
Fig.10 Website for semantic mapping
應(yīng)用層通過數(shù)據(jù)查詢網(wǎng)站和基于語義的聯(lián)合查詢方法,完成了數(shù)據(jù)的一站式查詢。
2.3.1 聯(lián)合查詢的網(wǎng)站建設(shè) 查詢網(wǎng)站為用戶提供了多種查詢方式,包括:樣品類型、樣品采集位置、分析測試指標(biāo)、經(jīng)緯度、數(shù)據(jù)提供者。而樣品采集位置、樣品類型、分析測試指標(biāo)又按照大洋樣品本體中的層次關(guān)系,建立了樹形結(jié)構(gòu)。網(wǎng)頁左下側(cè)的分析測試指標(biāo)是主要的地質(zhì)化學(xué)調(diào)查要素,包括一級指標(biāo)14個,二級分析測試指標(biāo)9個,三級分析測試指標(biāo)70個,一共93個分析測試指標(biāo)(見表2)。
用戶通過簡單友好的查詢界面,即可在樣品類型、采樣位置、分析測試指標(biāo)的樹形結(jié)構(gòu)中選擇查詢關(guān)鍵字(見圖11),選擇后的字段將會顯示在右側(cè)列表框中。
2.3.2 聯(lián)合查詢的工作流程 我們提出的這種基于語義的跨系統(tǒng)聯(lián)合查詢,對用戶屏閉了多個后臺數(shù)據(jù)庫,讓查詢看起來就像是在一個數(shù)據(jù)庫里完成的。如圖12所示,這個方法由以下三步構(gòu)成。
(1) 根據(jù)用戶在網(wǎng)站上選擇的查詢條件生成面向MSO本體模型的SPARQL查詢。
(2) 查詢轉(zhuǎn)換模塊基于RDF推理機(jī)制和語義映射,生成新的SPARQL查詢。
(3) 利用D2RQ將SPARQL查詢語句轉(zhuǎn)換成SQL查詢語句。
表2 部分海洋地球化學(xué)分析測試指標(biāo)
圖11 數(shù)據(jù)查詢網(wǎng)站
為了驗(yàn)證基于本體的數(shù)據(jù)互操作方法的有效性,我們用測試數(shù)據(jù)進(jìn)行了實(shí)驗(yàn),實(shí)驗(yàn)步驟如下。
(1) 創(chuàng)建三個數(shù)據(jù)庫。第一個數(shù)據(jù)庫,參考ODP項(xiàng)目中的ICP-AES數(shù)據(jù)庫模型[21]。第二個數(shù)據(jù)庫,參考拉蒙特-多爾蒂地球觀測中心的PetDB海底巖石學(xué)數(shù)據(jù)庫模型建立[22]。第三個數(shù)據(jù)庫,參照德國馬克斯普朗克研究所(Max-Planck-Institution)的GEOROC數(shù)據(jù)庫模型[23]建立。
圖12 數(shù)據(jù)查詢的工作流
(2) 隨機(jī)選擇了一些元素含量分析測試數(shù)據(jù)集作為測試數(shù)據(jù)集,分別加載到我們創(chuàng)建的3個數(shù)據(jù)庫中。
(3) 用2.3.2中提出的方法,面向以上3個數(shù)據(jù)庫進(jìn)行數(shù)據(jù)查詢。
按照2.2.2中的方法,系統(tǒng)和3個數(shù)據(jù)庫進(jìn)行語義映射后,系統(tǒng)就可以查詢采用位置為“西南印度洋”,樣品類型為“巖石”,測試指標(biāo)為“Fe”的測試結(jié)果。通過在大洋樣品屬性數(shù)據(jù)查詢網(wǎng)站上選擇相應(yīng)的查詢項(xiàng),后臺產(chǎn)生的SPARQL查詢語句如下:
select*where{
?sampleMarineSampleOntology:LocationAt?location.
?locationMarineSampleOntology:SeaArea?area.
filterregex(?area,"SouthWestIndianOcean").
?sampleMarineSampleOntology:SampleType
MarineSampleOntology:Rock.
?majorMarineSampleOntology:MajorElement
ContentOf?sample.
?majorMarineSampleOntology:Fe?Fe.
}
雖然查詢條件僅僅涉及“巖石”和“Fe”,但是由于MSO模型中提供了“巖石”和“Fe”的子類,通過語義推理和查詢轉(zhuǎn)換,最初的查詢條件將轉(zhuǎn)換為針對子類的查詢語句,從而根據(jù)語義映射關(guān)系,一次查詢就可以到相應(yīng)數(shù)據(jù)庫中獲取數(shù)據(jù)。所以,查詢示例返回結(jié)果中的測試指標(biāo)包括“Fe”的子類:“Fe2O3”、“FeO”和“FeT”,樣品類型包括“巖石”的子類:玄武巖(basalt)、花崗巖(Granite)、石灰石(Limestone)。查詢結(jié)果返回結(jié)果如圖13所示。
與現(xiàn)有的其他方法相比,我們所提出的基于本體的數(shù)據(jù)互操作系統(tǒng)有以下優(yōu)勢。
圖13 查詢結(jié)果Fig.13 Query results
(1) 本體與數(shù)據(jù)分別存儲在不同的數(shù)據(jù)源中,在不復(fù)制用戶數(shù)據(jù)的情況下訪問其數(shù)據(jù),可以充分保證數(shù)據(jù)的安全性和時(shí)效性。因此,適用于處理數(shù)據(jù)體量大、更新頻繁、數(shù)據(jù)密集高的信息源。
(2) 本體作為參考語義規(guī)范,可以與多個不同的數(shù)據(jù)集合建立語義映射,在不改變數(shù)據(jù)源內(nèi)容、語義、模式的情況下,實(shí)現(xiàn)了任意兩個數(shù)據(jù)集的互操作。
(3) 本體通過語義映射,對數(shù)據(jù)庫概念模型進(jìn)行了形式化規(guī)范說明,為數(shù)據(jù)庫中的數(shù)據(jù)提供語義,從而實(shí)現(xiàn)了多個數(shù)據(jù)庫之間概念模型的映射,做到了跨系統(tǒng)的基于語義的數(shù)據(jù)檢索。
本文為解決多源異構(gòu)數(shù)據(jù)互操作問題,設(shè)計(jì)了面向E-science的海洋地質(zhì)化學(xué)數(shù)據(jù)互操作系統(tǒng),分別利用3個不同層次的功能,實(shí)現(xiàn)了跨系統(tǒng)異構(gòu)數(shù)據(jù)的采集、整合、檢索、共享。跨系統(tǒng)數(shù)據(jù)檢索實(shí)驗(yàn)結(jié)果顯示:該方法不僅提高了大洋樣品屬性數(shù)據(jù)集成工作的效率,而且在確保數(shù)據(jù)源的獨(dú)立性、安全性、時(shí)效性的前提下,實(shí)現(xiàn)了異構(gòu)海洋調(diào)查實(shí)體數(shù)據(jù)和數(shù)據(jù)模型的復(fù)用。本文并未考慮大規(guī)模數(shù)據(jù)的RDF存儲、查詢和推理,所以未來的工作應(yīng)著眼于基于Hadoop的大規(guī)模語義Web本體數(shù)據(jù)查詢及推理。