江雙五,劉惠蘭,溫華洋,謝 偉
(安徽省氣象信息中心,合肥 230031)
氣象記錄檔案是氣象觀測(cè)和探測(cè)中形成的氣象要素、天氣現(xiàn)象及其變化過(guò)程的真實(shí)記錄,是基礎(chǔ)性的氣象信息資源.目前全國(guó)各類(lèi)氣象檔案館存儲(chǔ)并管理著始于19世紀(jì)中期以來(lái)的各類(lèi)氣象記錄檔案,這些檔案形成的“資源倉(cāng)庫(kù)”是開(kāi)展氣象領(lǐng)域及相關(guān)行業(yè)科學(xué)技術(shù)研究的重要資源,是研究我國(guó)近代氣候變化不可替代的基礎(chǔ)性資料和國(guó)家基礎(chǔ)性戰(zhàn)略資源.
2018 年,中國(guó)氣象局組織安徽、河北、山東和湖北4 省開(kāi)展數(shù)字氣象檔案館試點(diǎn)建設(shè)工作,以館藏檔案社會(huì)化利用為目的,期望各試點(diǎn)省積極利用大數(shù)據(jù)、語(yǔ)義網(wǎng)等信息技術(shù)推動(dòng)氣象檔案管理和利用方法的創(chuàng)新改變,其中一個(gè)重要的試點(diǎn)建設(shè)內(nèi)容是面向全國(guó)氣象檔案館建立一個(gè)語(yǔ)義化、智能化的氣象檔案管理系統(tǒng).而數(shù)字氣象檔案管理系統(tǒng)后臺(tái)的挖掘算法和相關(guān)統(tǒng)計(jì)查詢(xún)的分析效果直接依賴(lài)于背景知識(shí)圖譜的構(gòu)建質(zhì)量.高質(zhì)量的氣象檔案知識(shí)圖譜的建立不僅為我國(guó)氣象檔案的知識(shí)組織提供理論框架,同時(shí)也為推動(dòng)氣象檔案的社會(huì)化利用提供重要的技術(shù)支撐.
1991 年,Neches 等人[1]將本體定義為構(gòu)成相關(guān)領(lǐng)域詞匯的基本術(shù)語(yǔ)和關(guān)系;1993年,Gruber[2]將本體定義為“一種概念化的精確的規(guī)格說(shuō)明”;1998年,Studer等人[3]將本體定義為“共享概念模型的明確形式化規(guī)范說(shuō)明”.隨著專(zhuān)家學(xué)者們對(duì)本體知識(shí)認(rèn)識(shí)的不斷深入,目前科學(xué)研究工作者普遍將本體定義為特定領(lǐng)域內(nèi)的概念、屬性以及之間關(guān)系.
我國(guó)在領(lǐng)域本體構(gòu)建方面已經(jīng)取得了一些初步成果,如醫(yī)療領(lǐng)域本體知識(shí)庫(kù)[4]、多民族語(yǔ)言本體知識(shí)庫(kù)[5]和中文語(yǔ)言本體知識(shí)庫(kù).在氣象領(lǐng)域方面少數(shù)的氣象工作者也開(kāi)展了本領(lǐng)域本體構(gòu)建的探索,如陳梅對(duì)大氣污染和其相關(guān)因素進(jìn)行了本體建模[6];何險(xiǎn)峰開(kāi)展了氣象災(zāi)害本體的設(shè)計(jì)[7];羅煒基于氣象數(shù)據(jù)集開(kāi)展了本體的構(gòu)建[8]等.但查詢(xún)公開(kāi)發(fā)表的文獻(xiàn),氣象檔案領(lǐng)域本體構(gòu)建方面國(guó)內(nèi)還鮮有高質(zhì)量的知識(shí)庫(kù).
知識(shí)圖譜概念是從早期的語(yǔ)義知識(shí)網(wǎng)演變而來(lái)的.目前,知識(shí)圖譜研究方向分為通用知識(shí)圖譜和特定行業(yè)知識(shí)圖譜.通用知識(shí)圖譜主要利用現(xiàn)實(shí)生活中的大量常識(shí)性知識(shí)來(lái)構(gòu)建,為互聯(lián)網(wǎng)查詢(xún)能力的智能化提供支持;特定行業(yè)知識(shí)圖譜主要利用行業(yè)數(shù)據(jù)來(lái)構(gòu)建,為行業(yè)數(shù)據(jù)智能利用提供支持.當(dāng)前,醫(yī)藥、軍事和產(chǎn)業(yè)等不同行業(yè)都在探索構(gòu)建適合本領(lǐng)域的知識(shí)圖譜[9–22].國(guó)內(nèi)外研究顯示檔案領(lǐng)域的知識(shí)圖譜構(gòu)建研究尚處于起步階段,雷杰等利用EAD、DCMI、VIVO、SWRC、Schema.org 等現(xiàn)有較為通用的本體構(gòu)建科研檔案管理知識(shí)圖譜[23],氣象領(lǐng)域知識(shí)圖譜的研究同樣處于起步階段,大多以公開(kāi)發(fā)表的文獻(xiàn)為資源開(kāi)展知識(shí)圖譜構(gòu)建研究,王建勛等人[24]對(duì)1995–2017年中國(guó)知網(wǎng)的數(shù)據(jù)庫(kù)中有關(guān)干旱遙感監(jiān)測(cè)研究的642 篇文獻(xiàn)進(jìn)行可視化分析得到知識(shí)圖譜,王萍等人[25]利用文獻(xiàn)分析工具對(duì)2000–2017年中國(guó)知識(shí)資源總庫(kù)中關(guān)于災(zāi)害風(fēng)險(xiǎn)研究的2890 篇中文文獻(xiàn)進(jìn)行分析,繪制出災(zāi)害風(fēng)險(xiǎn)研究的熱點(diǎn)、關(guān)鍵詞共現(xiàn)矩陣、核心作者群及研究機(jī)構(gòu)的知識(shí)結(jié)構(gòu)圖譜.李莉等人[26]針對(duì)分散的網(wǎng)絡(luò)氣象文本數(shù)據(jù),編寫(xiě)爬蟲(chóng)從網(wǎng)絡(luò)上爬取相關(guān)文本數(shù)據(jù),在此基礎(chǔ)上構(gòu)建了氣象文獻(xiàn)知識(shí)圖譜.本研究以氣象記錄檔案資源智能化利用為目的,研究對(duì)象涵蓋氣象觀測(cè)資料、觀測(cè)規(guī)范和氣象檔案元數(shù)據(jù)等在內(nèi)的主要?dú)庀髾n案資源,通過(guò)挖掘氣象檔案資源之間的語(yǔ)義關(guān)系來(lái)構(gòu)建知識(shí)庫(kù),提升檔案管理系統(tǒng)的查詢(xún)和檢索能力.
知識(shí)圖譜從邏輯結(jié)構(gòu)上一般分為概念層與實(shí)體層.概念層是構(gòu)建目標(biāo)領(lǐng)域的概念模型,以概念、屬性與關(guān)系來(lái)描述目標(biāo)領(lǐng)域,通常通過(guò)建立本體模型來(lái)建立概念層;實(shí)體層則以實(shí)體為構(gòu)建對(duì)象,是以“實(shí)體-關(guān)系-實(shí)體”與“實(shí)體-屬性-屬性值”三元組的形式對(duì)真實(shí)數(shù)據(jù)描述和存儲(chǔ),并基于大量的三元組來(lái)形成關(guān)聯(lián)語(yǔ)義網(wǎng)絡(luò),實(shí)體層是通過(guò)知識(shí)獲取技術(shù)來(lái)實(shí)現(xiàn)的.基于本體的知識(shí)圖譜構(gòu)建方法中,知識(shí)獲取是建立在本體模型的基礎(chǔ)上,本體模型的構(gòu)建質(zhì)量是知識(shí)圖譜構(gòu)建的關(guān)鍵.
以用戶對(duì)氣象檔案的利用需求為導(dǎo)向,以館藏檔案資源為基礎(chǔ),首先在分析氣象檔案特點(diǎn)基礎(chǔ)上構(gòu)建氣象檔案本體庫(kù)模型,再應(yīng)用知識(shí)圖譜構(gòu)建技術(shù)完成氣象記錄檔案知識(shí)圖譜的構(gòu)建.氣象記錄檔案知識(shí)圖譜的構(gòu)建流程主要分為氣象記錄檔案資源的收集整理、知識(shí)圖譜模式層的構(gòu)建以及基于模型層的知識(shí)圖譜的構(gòu)建.基于氣象記錄檔案資源及該領(lǐng)域知識(shí)理解完成該領(lǐng)域概念、屬性、實(shí)體以及之間的關(guān)系構(gòu)建,形成知識(shí)模型,依據(jù)模型從檔案資源中抽取實(shí)體、關(guān)系、屬性值數(shù)據(jù),將抽取的數(shù)據(jù)轉(zhuǎn)化成符合氣象記錄檔案知識(shí)模型圖關(guān)系數(shù)據(jù),再結(jié)合氣象記錄檔案專(zhuān)業(yè)知識(shí)對(duì)數(shù)據(jù)進(jìn)行實(shí)體對(duì)齊、指代消解等知識(shí)融合處理,最后采用知識(shí)推理技術(shù)挖掘氣象檔案數(shù)據(jù)中的隱含關(guān)系及知識(shí),形成氣象記錄檔案的知識(shí)圖譜.從架構(gòu)上(圖1)知識(shí)圖譜的構(gòu)建自下而上包括6 大步驟,分別是氣象記錄檔案數(shù)據(jù)源的收集整理、知識(shí)建模、知識(shí)抽取、知識(shí)融合、知識(shí)存儲(chǔ)和知識(shí)應(yīng)用.
圖1 氣象記錄檔案知識(shí)圖譜構(gòu)建架構(gòu)
氣象檔案資源是知識(shí)圖譜本體庫(kù)和實(shí)體庫(kù)構(gòu)建的基礎(chǔ),主要包括氣象檔案元數(shù)據(jù)、館藏氣象檔案、氣象業(yè)務(wù)技術(shù)規(guī)范檔案和氣象文獻(xiàn)相關(guān)知識(shí)以及基于用戶反饋信息等檔案資源.
3.2.1 氣象檔案元數(shù)據(jù)
基于氣象行業(yè)標(biāo)準(zhǔn)《氣象檔案元數(shù)據(jù)》,主要包括氣象檔案館元數(shù)據(jù)、氣象檔案類(lèi)別元數(shù)據(jù)、氣象檔案案卷元數(shù)據(jù)、氣象檔案卷內(nèi)文件元數(shù)據(jù)、氣象檔案管理元數(shù)據(jù)等5 大類(lèi)105 項(xiàng)元數(shù)據(jù)的收集和整理.主要包含檔案的類(lèi)別、時(shí)間、來(lái)源、案卷數(shù)、存放位置、保存介質(zhì)等內(nèi)容.
3.2.2 館藏氣象檔案
以安徽省氣象檔案館館藏1 萬(wàn)卷檔案為樣例數(shù)據(jù),主要包含全省81 個(gè)臺(tái)站建站以來(lái)的地面、高空、輻射、農(nóng)業(yè)、酸雨、天氣圖、數(shù)據(jù)加工文件和臺(tái)站歷史沿革文件等.
3.2.3 氣象業(yè)務(wù)技術(shù)規(guī)范
收集中國(guó)氣象局公開(kāi)發(fā)布的氣象業(yè)務(wù)規(guī)定和技術(shù)規(guī)范方面的檔案,利用自然語(yǔ)言處理技術(shù),進(jìn)行氣象檔案各類(lèi)詞表的擴(kuò)充并基于數(shù)據(jù)挖掘技術(shù)進(jìn)行知識(shí)圖譜中概念和實(shí)體關(guān)系的發(fā)現(xiàn).
3.2.4 文獻(xiàn)知識(shí)
查詢(xún)公開(kāi)發(fā)表氣象檔案的文獻(xiàn)資料,研究并實(shí)現(xiàn)基于模板的氣象檔案知識(shí)抽取,對(duì)知識(shí)圖譜的知識(shí)進(jìn)行補(bǔ)充,并研究知識(shí)圖譜驅(qū)動(dòng)下的氣象檔案知識(shí)自動(dòng)抽取技術(shù).
3.2.5 用戶反饋
廣泛開(kāi)展用戶咨詢(xún),基于用戶的反饋對(duì)知識(shí)圖譜的知識(shí)進(jìn)行修正和補(bǔ)充.隨著應(yīng)用服務(wù)的不斷加強(qiáng),這一部分將是未來(lái)氣象記錄檔案知識(shí)圖譜迭代更新的重要知識(shí)來(lái)源.
氣象記錄檔案知識(shí)模型的構(gòu)建以本體模型的構(gòu)建為核心,以收集的檔案資源為資料源,在結(jié)合《氣象學(xué)詞典》和《中國(guó)檔案主題詞表》(第2 版)等領(lǐng)域資料的基礎(chǔ)上,選取氣象領(lǐng)域的基本術(shù)語(yǔ)、分類(lèi)信息、主題詞來(lái)建立概念,同時(shí)結(jié)合應(yīng)用需求和分類(lèi)方法建立概念層次.氣象記錄檔案本體模型構(gòu)建的基本流程包括5 個(gè)步驟(圖2):資源梳理、概念及層級(jí)構(gòu)建、屬性定義、概念關(guān)系定義、本體語(yǔ)言表示和本體概念與實(shí)體映射.
圖2 氣象記錄檔案本體模型構(gòu)建流程
3.3.1 氣象記錄檔案本體概念及層次構(gòu)建
從數(shù)據(jù)源中歸納整理出氣象記錄檔案領(lǐng)域核心概念,核心概念的歸納整理注意本體中類(lèi)的設(shè)計(jì)秉承獨(dú)立性、共享性原則[27]以及類(lèi)的數(shù)目最小化原則[28].根據(jù)上述原則,從氣象檔案應(yīng)用場(chǎng)景出發(fā),從檔案的生命周期出發(fā)選擇“氣象記錄檔案”作為最頂層核心概念,次核心概念為“氣象檔案文件”“氣象記錄檔案形成”和“氣象記錄檔案管理“3 大類(lèi),最終從頂向下定義了氣象記錄檔案領(lǐng)域的28 個(gè)核心概念(圖3).
圖3 氣象記錄檔案核心概念及層次
通過(guò)核心概念的建立,逐步建立各層次概念280個(gè),核心子概念“氣象記錄檔案文件”概念層次模型如圖4.
圖4 氣象記錄檔案文件概念層次
3.3.2 氣象記錄檔案本體屬性構(gòu)建
從歸納整理出的氣象記錄檔案概念出發(fā),對(duì)各氣象記錄檔案本體概念定義屬性以及屬性約束,其中屬性應(yīng)結(jié)合用戶查找需求來(lái)定義.以“氣象記錄檔案文件”概念的屬性定義來(lái)說(shuō)明:首先通過(guò)調(diào)研用戶對(duì)氣象記錄檔案的查找需求,查看分析氣象記錄檔案紙質(zhì)文件、電子文件以及氣象記錄檔案元數(shù)據(jù),選取能代表氣象觀測(cè)文件特性和能滿足用戶快速查找定位檔案的詞作為氣象記錄檔案文件屬性(圖5),分別為臺(tái)站編號(hào)、文件名稱(chēng)、文件檔號(hào)、形成單位、地域號(hào)、形成日期、記錄類(lèi)型、保管期限、關(guān)鍵詞和密級(jí)等.
圖5 氣象記錄檔案文件屬性
3.3.3 氣象記錄檔案本體概念關(guān)系定義
在氣象記錄檔案本體中,根據(jù)本體關(guān)系的層級(jí)和結(jié)構(gòu),通過(guò)歸納總結(jié)得到本體關(guān)系模型主要見(jiàn)表1,共分為物理、空間、管理、觀測(cè)、時(shí)間和事件相關(guān)性6 大類(lèi).
表1 氣象記錄檔案本體關(guān)系模型
氣象記錄檔案本體關(guān)系的定義是根據(jù)氣象記錄檔案業(yè)務(wù)分析,圍繞氣象記錄檔案的產(chǎn)生、管理和利用,以氣象記錄檔案自身即“氣象觀測(cè)文件”為核心,定義各概念之間的關(guān)系,在此基礎(chǔ)上建立氣象記錄檔案數(shù)據(jù)之間的關(guān)聯(lián).總的概念關(guān)系圖如圖6所示.
圖6 概念關(guān)系圖
3.3.4 本體語(yǔ)言表示
本體中的概念、屬性以及層級(jí)結(jié)構(gòu)需要采用OWL 語(yǔ)言來(lái)描述,把概念數(shù)據(jù)化,使計(jì)算機(jī)能夠理解與處理.
3.3.5 本體概念與實(shí)體映射
在知識(shí)圖譜中,本體概念是對(duì)實(shí)體的一個(gè)抽象描述,實(shí)體是最基本的元素,它們之間存在對(duì)應(yīng)關(guān)系.只有實(shí)體對(duì)接到概念模型中才能完成知識(shí)圖譜的構(gòu)建,如“氣象觀測(cè)臺(tái)站”是一個(gè)概念,“碭山縣國(guó)家一般氣象站”是一個(gè)實(shí)體,它們分別是知識(shí)圖譜中“圖”的一個(gè)節(jié)點(diǎn),通過(guò)“圖”中節(jié)點(diǎn)之間的連線來(lái)建立概念和實(shí)體間的關(guān)系.知識(shí)圖譜模型實(shí)例見(jiàn)圖7.
圖7 知識(shí)模型圖
依據(jù)已構(gòu)建的氣象記錄檔案知識(shí)模型,抽取安徽省館藏氣象記錄檔案實(shí)體、屬性及關(guān)系.目前安徽省氣象檔案館館藏氣象記錄檔案資源從存儲(chǔ)格式上分為結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化3 種結(jié)構(gòu).要根據(jù)不同的存儲(chǔ)結(jié)構(gòu)定義不同的知識(shí)抽取策略,具體來(lái)說(shuō)結(jié)構(gòu)化的館藏檔案著錄元數(shù)據(jù)采用D2RQ 數(shù)據(jù)處理工具進(jìn)行處理;非結(jié)構(gòu)化的紙質(zhì)氣象記錄檔案數(shù)字化檔案圖像、文本、PDF 等數(shù)據(jù)采用圖像識(shí)別、文本抽取以及自然語(yǔ)言處理等技術(shù)進(jìn)行處理;半結(jié)構(gòu)化的電子類(lèi)氣象觀測(cè)數(shù)據(jù)文件及臺(tái)站歷史沿革數(shù)據(jù)文件則根據(jù)文件的存儲(chǔ)規(guī)則,定制其對(duì)應(yīng)的包裝器來(lái)完成氣象觀測(cè)數(shù)據(jù)的抽取.將抽取的數(shù)據(jù)轉(zhuǎn)化成符合知識(shí)圖譜模型結(jié)構(gòu)的數(shù)據(jù),存入圖數(shù)據(jù)庫(kù)中.
3.5.1 氣象記錄檔案實(shí)體識(shí)別鏈接
實(shí)體識(shí)別鏈接是將氣象檔案實(shí)體實(shí)例數(shù)據(jù)與氣象檔案知識(shí)模型中的概念進(jìn)行對(duì)應(yīng)識(shí)別鏈接的操作.在氣象檔案數(shù)據(jù)中,氣象臺(tái)站的臺(tái)站名稱(chēng)、觀測(cè)位置、觀測(cè)儀器等會(huì)發(fā)生改變,可能導(dǎo)致存在同一個(gè)觀測(cè)位置出現(xiàn)不同的名稱(chēng),同一個(gè)觀測(cè)要素出現(xiàn)不同的要素名稱(chēng),同一個(gè)觀測(cè)儀器出現(xiàn)不同的儀器名稱(chēng).如“合肥國(guó)家基本氣象站”與“合肥國(guó)家基本氣象站;安徽省合肥國(guó)家基本氣象站;合肥站;合肥;合肥氣象站;合肥基本站;合肥國(guó)家站;合肥國(guó)家基本站”等在系統(tǒng)中為同一實(shí)體,類(lèi)似這樣的數(shù)據(jù)在實(shí)體識(shí)別鏈接中需要解決同名實(shí)體含義不同和不同名實(shí)體含義相同的問(wèn)題,構(gòu)建出符合業(yè)務(wù)實(shí)際的氣象記錄檔案知識(shí)圖譜.
3.5.2 氣象記錄檔案知識(shí)合并
氣象檔案觀測(cè)數(shù)據(jù)形式多樣,同一地點(diǎn)、同一時(shí)間氣簿、氣表、自記紙中的觀測(cè)數(shù)據(jù)可能產(chǎn)生重復(fù)記錄的情況,數(shù)據(jù)抽取到圖譜庫(kù)中產(chǎn)生了冗余,這就需要對(duì)氣象檔案實(shí)例及關(guān)系數(shù)據(jù)進(jìn)行知識(shí)合并.
3.5.3 氣象記錄檔案知識(shí)推理
知識(shí)推理是指從已構(gòu)建的氣象記錄檔案關(guān)系數(shù)據(jù)出發(fā),進(jìn)行合理推理,發(fā)現(xiàn)和建立新關(guān)聯(lián),從而豐富和完善氣象記錄檔案知識(shí)圖譜,提升氣象記錄檔案智能化利用能力.
3.5.4 氣象記錄檔案知識(shí)更新
氣象檔案知識(shí)更新可分為概念層更新和實(shí)體層更新.隨著新的觀測(cè)儀器、觀測(cè)方式和觀測(cè)方法的不斷發(fā)展,新的氣象記錄檔案概念將產(chǎn)生,老概念將變化.每年新的檔案資源不斷地被收集到檔案館,檔案實(shí)體必將逐年增加,這些概念和實(shí)體的變化必將推進(jìn)氣象記錄檔案知識(shí)圖譜不斷更新.概念層更新是將新的概念通過(guò)知識(shí)融合加入到概念層中,實(shí)體層更新是將每年新接收的檔案實(shí)體、關(guān)系以及屬性值加到實(shí)體庫(kù)中.
氣象檔案知識(shí)圖譜分為本體庫(kù)存儲(chǔ)和實(shí)體庫(kù)存儲(chǔ).本體庫(kù)存儲(chǔ)一般采用MySQL 來(lái)存儲(chǔ),實(shí)體庫(kù)存儲(chǔ)一般采用Neo4j 來(lái)存儲(chǔ).MySQL 作為通用的一種關(guān)系型數(shù)據(jù)庫(kù),它以表的形式存儲(chǔ)氣象記錄檔案本體概念.Neo4j是一種廣泛應(yīng)用于知識(shí)圖譜領(lǐng)域的圖形數(shù)據(jù)庫(kù)[29],它以節(jié)點(diǎn)和邊的形式來(lái)存儲(chǔ)實(shí)體庫(kù),一個(gè)節(jié)點(diǎn)表示一個(gè)具體的實(shí)體,邊則表示實(shí)體與實(shí)體之間的關(guān)系,這種實(shí)體和實(shí)體之間的關(guān)系以圖的形式展示出來(lái).以下是查詢(xún)節(jié)點(diǎn)關(guān)系的代碼.
@AutoLog(value="根據(jù)節(jié)點(diǎn)ID 查詢(xún)節(jié)點(diǎn)的關(guān)系及目標(biāo)節(jié)點(diǎn)")@ApiOperation(value="根據(jù)節(jié)點(diǎn)ID 查詢(xún)節(jié)點(diǎn)的關(guān)系及目標(biāo)節(jié)點(diǎn)",notes="根據(jù)節(jié)點(diǎn)ID 查詢(xún)節(jié)點(diǎn)的關(guān)系及目標(biāo)節(jié)點(diǎn)")@GetMapping("getById")
public Result getDataById(Integer modelId,Integer conceptId,String conceptCod e,St e d ring nodeId) {Neo4jNodataById=kgDataService.getDataById(modelId,conceptId,conceptCode,nodeId);Neo4jNode neo4jNode=dataById;return Result.ok(neo4jNode);}
3.7.1 檔案本身的智能檢索
基于以檔案為核心的關(guān)聯(lián)關(guān)系網(wǎng),沿著邊呈發(fā)散狀關(guān)聯(lián)大量信息,為用戶提供從檔案的形成、內(nèi)容到管理的相關(guān)信息(圖8),展示出檔案館目前館藏的各種類(lèi)型的檔案及包含的內(nèi)容,方便用戶快速查找檔案.
圖8 檔案檢索實(shí)例圖
3.7.2 觀測(cè)要素的智能檢索
基于觀測(cè)要素與觀測(cè)要素,觀測(cè)要素與檔案、觀測(cè)臺(tái)站之間的關(guān)聯(lián)關(guān)系,以獲得包含同一個(gè)觀測(cè)要素、不同觀測(cè)頻次、不同觀測(cè)時(shí)間的檔案(圖9).滿足用戶以某地某時(shí)某觀測(cè)要素的值為查詢(xún)檔案的條件的逆向查找需求.
圖9 檔案要素檢索實(shí)例圖
目前,各類(lèi)氣象檔案資源之間關(guān)聯(lián)關(guān)系還未被深度挖掘出來(lái).氣象檔案具有專(zhuān)業(yè)性強(qiáng)、結(jié)構(gòu)復(fù)雜且數(shù)據(jù)量大等特點(diǎn),如何面向社會(huì)化利用需求建立氣象檔案知識(shí)模型,從多源異構(gòu)的氣象檔案觀測(cè)數(shù)據(jù)中定義氣象檔案概念、實(shí)體、屬性以及相互之間的關(guān)系是構(gòu)建氣象檔案知識(shí)圖譜的難點(diǎn).
本文基于館藏氣象記錄檔案資源提出了一種氣象記錄檔案知識(shí)圖譜的構(gòu)建方法,并實(shí)例展示了構(gòu)建的氣象記錄檔案知識(shí)圖譜,是氣象領(lǐng)域和檔案領(lǐng)域知識(shí)圖譜構(gòu)建的一次探索,對(duì)構(gòu)建整個(gè)氣象和檔案領(lǐng)域知識(shí)圖譜提供了參考,期望后續(xù)有更多的學(xué)者關(guān)注和開(kāi)展氣象和檔案信息領(lǐng)域的知識(shí)圖譜建設(shè)研究.