劉 航,杜 江,白 瑀
(西安工業(yè)大學(xué)機(jī)電工程學(xué)院,陜西西安710021)
隨著信息量和數(shù)據(jù)量的急劇增長(zhǎng),人們?cè)诤A康臄?shù)據(jù)中尋求知識(shí)越來(lái)越困難。航空工業(yè)生產(chǎn)活動(dòng)綜合了新材料、新工藝、新技術(shù)等高技術(shù)產(chǎn)業(yè)和國(guó)家支柱性產(chǎn)業(yè)。如何有效地對(duì)航空制造業(yè)領(lǐng)域知識(shí)進(jìn)行管理,使用戶快速方便地獲取知識(shí),甚至某技術(shù)問(wèn)題的解決方案,是當(dāng)前航空制造業(yè)領(lǐng)域知識(shí)管理亟需解決的問(wèn)題。
知識(shí)建模是知識(shí)共享與重用的基礎(chǔ),是進(jìn)行知識(shí)管理的關(guān)鍵,對(duì)航空制造業(yè)領(lǐng)域知識(shí)的分類是對(duì)其所包含知識(shí)進(jìn)行管理的基礎(chǔ),可為從事本行業(yè)的人提供理論指導(dǎo),以使紛繁復(fù)雜的知識(shí)得以依類整理,各有歸屬,從而建立起次序化、規(guī)范化、系統(tǒng)化的知識(shí)世界。本文從航空制造業(yè)領(lǐng)域知識(shí)分類入手建立面向知識(shí)層面的多層次、多維度的航空制造業(yè)領(lǐng)域知識(shí)表達(dá)模型[1],為航空制造業(yè)領(lǐng)域知識(shí)管理系統(tǒng)的構(gòu)建奠定基礎(chǔ)。對(duì)航空工業(yè)進(jìn)行快速高效的設(shè)計(jì)制造生產(chǎn)活動(dòng)起著至關(guān)重要的作用。
知識(shí)的分類是知識(shí)管理的基礎(chǔ),對(duì)航空制造業(yè)領(lǐng)域知識(shí)的分析分類是對(duì)其進(jìn)行知識(shí)建模的關(guān)鍵。由于航空制造業(yè)領(lǐng)域知識(shí)本身的復(fù)雜性和多樣性,導(dǎo)致航空制造業(yè)領(lǐng)域知識(shí)中所包含的知識(shí),隨著時(shí)間的推移及工業(yè)技術(shù)水平的發(fā)展,產(chǎn)生大量冗余失效的文件。由于其動(dòng)態(tài)性、多樣性、復(fù)雜性,航空制造業(yè)領(lǐng)域知識(shí)所產(chǎn)生的知識(shí)之間存在著大量相互影響、相互促進(jìn)的因素,使它們之間存在錯(cuò)綜復(fù)雜的關(guān)聯(lián)。航空制造業(yè)領(lǐng)域知識(shí)的這些現(xiàn)狀,迫切需要對(duì)其所包含的知識(shí)進(jìn)行整合分類,以促進(jìn)其知識(shí)的重用、分享及合理利用。
對(duì)于航空制造業(yè)領(lǐng)域知識(shí)的分類,是通過(guò)對(duì)技術(shù)內(nèi)容的概括及某些特征的概念進(jìn)行邏輯分類和系統(tǒng)排列而構(gòu)成,構(gòu)建航空技術(shù)分類模型,為使用者提供設(shè)計(jì)準(zhǔn)則、技術(shù)支持及決策依據(jù),能夠最大化利用航空制造業(yè)領(lǐng)域知識(shí)。對(duì)于航空技術(shù)多領(lǐng)域知識(shí)的分類,從航空技術(shù)的屬性、用途、學(xué)科及主題著手,需要多層次多維度的進(jìn)行分類歸納,構(gòu)建描述預(yù)先定義好的屬性、學(xué)科或概念的分類規(guī)則,按照航空制造業(yè)領(lǐng)域知識(shí)的適用范圍和來(lái)源、原理和功能、描述對(duì)象等多個(gè)方向進(jìn)行劃分,建立如圖1的航空制造業(yè)領(lǐng)域知識(shí)分類模型。
圖1 航空制造業(yè)領(lǐng)域知識(shí)分類模型
本體(Ontology)源自于哲學(xué)范疇,是一個(gè)概念框架,隨著人工智能的發(fā)展,人們賦予它新的含義,Neches[2]認(rèn)為:“本體定義了組成主題領(lǐng)域的詞匯表的基本術(shù)語(yǔ)及其關(guān)系,以及結(jié)合這些術(shù)語(yǔ)和關(guān)系來(lái)定義詞匯表外延的規(guī)則”。Gruber[3]提出“本體是概念化的明確規(guī)范”,他指出我們可以通過(guò)定義一組表示術(shù)語(yǔ)來(lái)描述程序的本體,定義將話語(yǔ)世界中的實(shí)體名稱與描述名稱意義的可讀文本以及約束解釋的公式公理相結(jié)合。Studer[4]認(rèn)為本體概念包括概念化、明確、形式化和共享四個(gè)方面。Swartout[5]認(rèn)為“本體是一個(gè)為描述某個(gè)領(lǐng)域而按繼承關(guān)系組織起來(lái)作為一個(gè)知識(shí)庫(kù)的骨架的一系列術(shù)語(yǔ)”。
知識(shí)表達(dá)是識(shí)別和理解知識(shí)的關(guān)鍵,對(duì)于航空制造業(yè)領(lǐng)域知識(shí)的知識(shí)表達(dá),要實(shí)現(xiàn)對(duì)航空工業(yè)領(lǐng)域生產(chǎn)制造知識(shí)的快速有效的重用、共享。針對(duì)航空工業(yè)知識(shí)結(jié)構(gòu)復(fù)雜、知識(shí)類型多樣、種類繁多,以及航空技術(shù)動(dòng)態(tài)性、多樣性、復(fù)雜性的特點(diǎn),基于多層次本體對(duì)航空制造業(yè)領(lǐng)域知識(shí)進(jìn)行知識(shí)表達(dá),既能表示出不同種類知識(shí)的共性,又能表示出相同種類知識(shí)的個(gè)性,以保證在知識(shí)表達(dá)的準(zhǔn)確定性,實(shí)現(xiàn)知識(shí)的共享和傳遞。利用本體對(duì)知識(shí)進(jìn)行表達(dá)可賦予知識(shí)信息明確的語(yǔ)義環(huán)境,建立概念層次清晰、結(jié)構(gòu)合理、概念間屬性關(guān)系明確的組織網(wǎng)絡(luò)[6]??捎行У貙㈩I(lǐng)域知識(shí)組織起來(lái),使計(jì)算機(jī)可以更好地理解和處理信息,實(shí)現(xiàn)知識(shí)的共享與集成,為知識(shí)的共享與重用奠定基礎(chǔ)。
航空制造業(yè)領(lǐng)域知識(shí)描述本體模型可用四元組表示:{C,A,R,I}。其中:C表示領(lǐng)域內(nèi)知識(shí)的集合;A表示領(lǐng)域內(nèi)知識(shí)屬性的集合;R表示知識(shí)間關(guān)系的集合,是領(lǐng)域中概念之間的關(guān)聯(lián)作用;I表示知識(shí)實(shí)例的集合。
知識(shí)集合C是知識(shí)對(duì)象的集合,表示采用框架定義的類或概念的集合,包括類或概念的名稱,關(guān)系集合等;屬性集合A是知識(shí)表達(dá)的依據(jù),是對(duì)航空制造業(yè)領(lǐng)域知識(shí)分類的描述,是航空制造業(yè)領(lǐng)域知識(shí)表達(dá)的核心要素,包括特征屬性、性能屬性,狀態(tài)屬性、層次屬性等;知識(shí)的關(guān)系集合R代表了知識(shí)間的關(guān)聯(lián)關(guān)系,包括概念關(guān)系、屬性關(guān)系、技術(shù)應(yīng)用關(guān)系等,是構(gòu)建知識(shí)表達(dá)本體的基礎(chǔ),實(shí)例集合I代表知識(shí)的對(duì)象,是知識(shí)集合C和屬性集合A的具體化。
屬性特征代表了航空制造業(yè)領(lǐng)域知識(shí)的性質(zhì),是對(duì)航空制造業(yè)領(lǐng)域知識(shí)最基本的反應(yīng),具有類型和數(shù)據(jù)兩種性質(zhì),類型是將構(gòu)成航空制造業(yè)領(lǐng)域知識(shí)各數(shù)據(jù)系統(tǒng)統(tǒng)一地分配各個(gè)知識(shí)單元的規(guī)則,對(duì)于航空制造業(yè)領(lǐng)域知識(shí)的特征內(nèi)容如表1。
因此,航空制造業(yè)領(lǐng)域知識(shí)屬性特征可表示為:
其中:R表示航空技術(shù)領(lǐng)域知識(shí)集;r表示航空制造業(yè)領(lǐng)域知識(shí)的知識(shí)特征要素;n表示航空制造業(yè)領(lǐng)域知識(shí)的種類;j表示航空制造業(yè)領(lǐng)域知識(shí)的特征數(shù)量。
表1 航空制造業(yè)領(lǐng)域知識(shí)的屬性特征
本體概念一般用類來(lái)表示,類與類間依據(jù)其屬性形成映射來(lái)描述兩類之間的關(guān)系。航空制造業(yè)領(lǐng)域知識(shí)所包含的若干特征可用描述邏輯可表達(dá)為Features ? Aeronautical manufacturing field knowledge,其中最基本的元素是概念(Concept)和關(guān)系(Relation)。概念可以被理解為某領(lǐng)域知識(shí)的某一子集,關(guān)系表示概念間的關(guān)聯(lián)和聯(lián)系。根據(jù)航空制造業(yè)領(lǐng)域知識(shí)的特點(diǎn),依據(jù)其分類、概念和屬性,每個(gè)類里的元素依據(jù)概念進(jìn)行拆分,得到相關(guān)的子元素及其屬性[7]。由于航空制造業(yè)領(lǐng)域知識(shí)的概念數(shù)量龐大,關(guān)系復(fù)雜等特點(diǎn),為解決本體間的異構(gòu)問(wèn)題,建立基于概念及屬性的層次結(jié)構(gòu)關(guān)系時(shí),各子元素間應(yīng)通過(guò)屬性形成映射關(guān)系,建立基于本體的航空制造業(yè)領(lǐng)域知識(shí)知識(shí)表達(dá)模型,其本質(zhì)是概念與概念通過(guò)屬性所形成的關(guān)聯(lián)關(guān)系[8],可記為:
航空制造業(yè)領(lǐng)域知識(shí)不僅包含多領(lǐng)域的文本知識(shí),還包括公式、圖形,表格等多種知識(shí)載體,因此對(duì)于航空制造業(yè)領(lǐng)域知識(shí)表達(dá)模型的建立,需要建立面向多領(lǐng)域的通用模型,既要做到對(duì)知識(shí)的精確表達(dá),還要明確各知識(shí)間的關(guān)聯(lián)關(guān)系,清晰地反映知識(shí)的網(wǎng)絡(luò)體系結(jié)構(gòu),從多方面、多維度描述概念之間的關(guān)系。從語(yǔ)義角度來(lái)看,可將本體中概念的基本關(guān)系分為五種,如表2。
表2 航空制造業(yè)領(lǐng)域知識(shí)本體中概念的基本關(guān)系
航空制造業(yè)領(lǐng)域知識(shí)本身的屬性可以通過(guò)其包含、相關(guān)或互動(dòng)的數(shù)據(jù)所描述。因此蘊(yùn)含不同的信息的知識(shí)元(Ke,構(gòu)成知識(shí)結(jié)構(gòu)的最小元素,最基本的原子概念)形式、結(jié)構(gòu)、屬性各不相同,在聚合為知識(shí)族后,利用相似度對(duì)航空制造業(yè)領(lǐng)域知識(shí)關(guān)聯(lián)進(jìn)行判斷[9]。為了判斷知識(shí)元的相似度,本文應(yīng)用加權(quán)歐幾里德距離衡量知識(shí)元Kei和Kej間的區(qū)別度,即:
用Sim(Kei,Kej)表示知識(shí)元相似度,如下:
Sim(Kei,Kej)=cosθ
其中:相似度在數(shù)值上反映為0≤Sim(Kei,Kej)≤1。
所有Sim(Kei,Kej)|?i,j[1,2,…,n]構(gòu)成一個(gè)模糊等價(jià)關(guān)系,也可表現(xiàn)為一個(gè)對(duì)稱的相似度矩陣:
RKe=[Sim(Kei,Kej)|?(Kei,Kej)∈n×n]
根據(jù)所建立的模糊等價(jià)關(guān)系,定義閾值δ,依據(jù)航空制造業(yè)領(lǐng)域知識(shí)概念的特征集合與某一屬性特征集合在空間內(nèi)的距離,與閾值δ進(jìn)行比較。形成概念間的映射關(guān)聯(lián)關(guān)系[10]。
航空制造業(yè)領(lǐng)域知識(shí)模型可從結(jié)構(gòu)-行為-功能三方面建立立體的多層次本體模型。結(jié)構(gòu)描述了航空制造業(yè)領(lǐng)域知識(shí)的基本內(nèi)容和要素,是航空制造業(yè)領(lǐng)域知識(shí)的基本組成;行為是結(jié)構(gòu)與功能的關(guān)聯(lián)映射,表示航空制造業(yè)領(lǐng)域知識(shí)中某個(gè)參數(shù)隨環(huán)境或?qū)ο蟮母淖兌鴮?dǎo)致另一個(gè)參數(shù)的改變;功能是指航空制造業(yè)領(lǐng)域知識(shí)的應(yīng)用場(chǎng)合、對(duì)象等,也是對(duì)航空制造業(yè)領(lǐng)域知識(shí)的屬性描述。結(jié)構(gòu)是行為建立的基礎(chǔ),功能的描述建立在行為的構(gòu)造上。
對(duì)于航空制造業(yè)領(lǐng)域知識(shí)模型的構(gòu)建,應(yīng)遵循概念化、明確、形式化和共享四個(gè)方面,基于航空制造業(yè)領(lǐng)域知識(shí)的特點(diǎn),對(duì)其本體構(gòu)建流程包括:基于航空制造業(yè)領(lǐng)域知識(shí)的分類獲取數(shù)據(jù)、確定本體的目的和領(lǐng)域、檢驗(yàn)本體可否重用、分析數(shù)據(jù)并提取概念特征及其關(guān)系、建立初始本體、本體的驗(yàn)證分析、建立本體模型[11]。
航空制造業(yè)領(lǐng)域知識(shí)的結(jié)構(gòu)包含其所包含的知識(shí)成分的關(guān)聯(lián)關(guān)系和關(guān)聯(lián)形式,因此需要從領(lǐng)域知識(shí)的分類層次、信息數(shù)據(jù)、知識(shí)元結(jié)構(gòu)等構(gòu)成知識(shí)結(jié)構(gòu)的基礎(chǔ)出發(fā),構(gòu)建系統(tǒng)知識(shí)模型,其過(guò)程如圖2。
對(duì)航空制造業(yè)領(lǐng)域知識(shí)進(jìn)行收集、分析和描述,構(gòu)建航空制造業(yè)領(lǐng)域知識(shí)本體,分析其中概念集間的關(guān)聯(lián)關(guān)系,在此基礎(chǔ)上建立航空制造業(yè)領(lǐng)域知識(shí)知識(shí)層次結(jié)構(gòu),將領(lǐng)域知識(shí)進(jìn)行劃分,生成知識(shí)元,構(gòu)建拓?fù)渲R(shí)結(jié)構(gòu),并與航空技術(shù)領(lǐng)域本體對(duì)應(yīng)關(guān)聯(lián),在微觀知識(shí)元的基礎(chǔ)上建立知識(shí)模型。
圖2 基于多層次本體的航空制造業(yè)領(lǐng)域知識(shí)模型構(gòu)建過(guò)程
按照航空制造業(yè)領(lǐng)域知識(shí)的分析歸納,按照分類規(guī)則,針對(duì)不同種類的知識(shí)類型,在分析各類航空制造業(yè)領(lǐng)域知識(shí)類、概念、屬性等關(guān)系的基礎(chǔ)上,通過(guò)定義類和屬性,依據(jù)屬性提取知識(shí)概念,對(duì)其進(jìn)行關(guān)聯(lián)分析,依據(jù)關(guān)聯(lián)規(guī)則,形成關(guān)聯(lián)網(wǎng)絡(luò)[12]。依據(jù)概念、屬性、關(guān)聯(lián)關(guān)系,對(duì)其進(jìn)行知識(shí)要素分析提取,將知識(shí)以概念的形式進(jìn)行提取,通過(guò)描述框架表示出來(lái),建立概念集,通過(guò)不同的概念集將不同類型的知識(shí)分類,詳細(xì)完整地描述概念,按照概念與屬性,構(gòu)造如圖3所示航空制造業(yè)領(lǐng)域知識(shí)的知識(shí)本體框架。
圖3 基于多層次本體的航空制造業(yè)領(lǐng)域知識(shí)知識(shí)模型
在航空制造業(yè)領(lǐng)域本體中,包含設(shè)計(jì)方法類知識(shí)、材料類知識(shí)、工藝制造類知識(shí)、智能品類知識(shí)等頂層概念。以材料類知識(shí)為例,通過(guò)集成其屬性特征,用本體描述語(yǔ)言O(shè)WL對(duì)其進(jìn)行描述,本體片段如下:
1)類的描述:
<復(fù)合材料rdf:ID=“復(fù)合材料”/>
2)屬性的描述
……
……
3)約束的描述
……
4)實(shí)例的描述
<環(huán)氧樹脂復(fù)合材料rdf:ID=“SC-13G玻璃纖維增強(qiáng)塑料”>
……
<環(huán)氧樹脂復(fù)合材料>
航空制造業(yè)領(lǐng)域知識(shí)作為航空工業(yè)生產(chǎn)活動(dòng)的載體所積累的技術(shù)知識(shí)的總結(jié),通過(guò)對(duì)航空制造業(yè)領(lǐng)域知識(shí)的用途、屬性、學(xué)科及主題的歸納總結(jié),對(duì)其定義分類,進(jìn)而基于本體建立航空制造業(yè)領(lǐng)域知識(shí)知識(shí)模型,建立面向知識(shí)層面的多層次、多維度的航空制造業(yè)領(lǐng)域知識(shí)知識(shí)模型框架,并利用本體描述語(yǔ)言O(shè)WL對(duì)其進(jìn)行描述。這是構(gòu)建航空制造業(yè)領(lǐng)域知識(shí)的知識(shí)管理系統(tǒng)的重要一步,也是實(shí)現(xiàn)航空工業(yè)產(chǎn)品設(shè)計(jì)、制造、生產(chǎn)向智能化、信息化、服務(wù)化發(fā)展的重要途徑。