馬 剛,李 楠,郭葉鵬
(中核控制系統(tǒng)工程有限公司,北京 102401)
產(chǎn)品質(zhì)量是企業(yè)的生命線,全員質(zhì)量是全面質(zhì)量管理理念的核心,如何采用先進技術(shù)和新思維保證產(chǎn)品質(zhì)量是企業(yè)員工都需關(guān)注的問題。企業(yè)在產(chǎn)品實現(xiàn)過程中會產(chǎn)生大量記錄信息,運用先進技術(shù)和新思維對這些數(shù)據(jù)進行組織,既可規(guī)避企業(yè)在產(chǎn)品實現(xiàn)過程中的質(zhì)量風(fēng)險,也可為企業(yè)積累提供寶貴的經(jīng)驗反饋信息。
知識圖譜最初是由谷歌提出,它運用知識圖譜的結(jié)構(gòu)來挖掘、分析、建立、描述和展示不同來源的知識資源之間的關(guān)聯(lián),用簡單直觀的方法來展示復(fù)雜的關(guān)系,以便使計算機和人更好的理解。
知識圖譜是語義網(wǎng)絡(luò)技術(shù)更新所產(chǎn)生的成果,它用結(jié)構(gòu)化的架構(gòu)描述了客觀世界中的概念、實體及關(guān)系,用節(jié)點和連線表示。在知識圖譜中,這些節(jié)點代表現(xiàn)實世界中存在某個具體事物或者其屬性值,用這些線來連接所有有關(guān)系的實體,形成關(guān)系網(wǎng),其中每個節(jié)點和關(guān)系都具有唯一性[1]。知識圖譜將關(guān)系作為知識表示的一種方式,它可通過關(guān)系將相差甚遠的不同種類事物進行關(guān)聯(lián),為使用者提供了一種從“關(guān)系”角度對事物進行分析的新視野。知識圖譜可以根據(jù)使用者的需求回答出精準(zhǔn)的答案以及一些有關(guān)聯(lián)的信息,并利用可視化技術(shù)直觀的展示其關(guān)系,以方便使用者更好的理解知識,同時能夠為行業(yè)內(nèi)的應(yīng)用決策提供精準(zhǔn)化的依據(jù)。
根據(jù)知識圖譜的覆蓋面的不同來看,可以把知識圖譜劃分為通用知識圖譜和行業(yè)知識圖譜兩大類。
通用知識圖譜是面向通用領(lǐng)域,以日常生活中產(chǎn)生的知識為主,注重對知識廣度的描述,而行業(yè)知識圖譜則是面向某一領(lǐng)域,充分利用了本企業(yè)內(nèi)產(chǎn)生的數(shù)據(jù)進行構(gòu)建,更加注重知識的深度和準(zhǔn)確性[2]。本文構(gòu)建的基于企業(yè)質(zhì)量問題知識圖譜是行業(yè)知識圖譜,清晰的展示了概念及關(guān)系模式。
在通用領(lǐng)域知識圖譜構(gòu)建過程中,大量實體和屬性都會帶來許多冗余和錯誤信息,需進一步進行知識融合來消除歧義、剔除冗余和錯誤信息[3]。本文數(shù)據(jù)來源于本企業(yè)記錄的質(zhì)量問題,是經(jīng)人工篩選后去除冗余的數(shù)據(jù)。但仔細(xì)對這些記錄內(nèi)容進行分析,發(fā)現(xiàn)這些數(shù)據(jù)對質(zhì)量問題的語言描述,缺乏規(guī)范性和標(biāo)準(zhǔn)性。先將這些記錄進行統(tǒng)一化、標(biāo)準(zhǔn)化處理,規(guī)范質(zhì)量問題描述內(nèi)容。規(guī)范的描述是知識圖譜的構(gòu)建前提條件。
1.3.1 質(zhì)量問題本體的概念及關(guān)系的確定
質(zhì)量問題知識圖譜是由其實體和實體之間的關(guān)系構(gòu)成,用以描述整個質(zhì)量問題的知識語義網(wǎng)絡(luò)[4]。
在對質(zhì)量問題知識圖譜構(gòu)建前,應(yīng)結(jié)合用戶需求進行組織和規(guī)范,構(gòu)建有效的、可擴展的知識模式。本體指“共享概念模型的形式化規(guī)范說明”[5]。故引入本體可實現(xiàn)對知識圖譜實體與實體間關(guān)系和屬性的統(tǒng)一規(guī)范和管理,有助于提高知識圖譜質(zhì)量。
本文根據(jù)質(zhì)量問題知識圖譜的概念抽取主問題、問題實體描述、從問題層次抽取概念后,又采用訪談法和觀察法,從安全質(zhì)量管理部門對其控制的角度切入的。構(gòu)建的質(zhì)量問題知識圖譜面向的用戶為安全質(zhì)量部門,根據(jù)其調(diào)研結(jié)果,結(jié)合其需求及檢索習(xí)慣確定了本體概念,同時結(jié)合其業(yè)務(wù)流程定義了概念間關(guān)系及實體間關(guān)系,如圖1 所示。
圖1 本企業(yè)質(zhì)量問題本體概念及關(guān)系Fig.1 Quality problem ontology concept and relationship of the enterprise
圖2 本體與知識圖譜映射機制Fig.2 Mapping mechanism of ontology and knowledge map
在概念和關(guān)系確定后,采用“自頂向下”方式,從概念層開始,逐級細(xì)化,進行實體擴充。每個實體包含一個或多個實例,根據(jù)本體特性,實例將繼承其所屬概念的所有屬性和關(guān)系。
1.3.2 本體映射及知識存儲
知識圖譜是將概念層級作為樹,概念節(jié)點作為樹的節(jié)點,實體節(jié)點作為知識圖譜的實體關(guān)系圖節(jié)點,用線連接節(jié)點之間的關(guān)系[6]。
圖3 企業(yè)質(zhì)量問題知識圖譜部分Fig.3 Knowledge map of enterprise quality problems
構(gòu)建的質(zhì)量問題知識圖譜首先要確定本體和知識圖譜間的映射機制,如圖2 所示。本體可看作是將概念層級結(jié)構(gòu),即為“樹的主干”,其中概念和實例等為“樹的枝節(jié)”,用關(guān)聯(lián)關(guān)系連接。
經(jīng)過映射后的知識以三元組形式存在,將知識存儲在圖數(shù)據(jù)庫中,運用數(shù)據(jù)庫存儲知識可快速、直觀、靈活地處理大量復(fù)雜和相互連接的數(shù)據(jù)。
知識圖譜最大的優(yōu)點就是可利用空間形態(tài)直觀地表示出知識間的相互關(guān)系。構(gòu)建的質(zhì)量問題知識圖譜,安全質(zhì)量管理人員可根據(jù)其使用需求和檢索習(xí)慣,多維度的利用知識,同時利用實體間關(guān)系,可為實現(xiàn)質(zhì)量問題精準(zhǔn)定位、根本原因深度挖掘、為制定有效措施奠定基礎(chǔ)。
通過對構(gòu)建完成的質(zhì)量問題知識圖譜進行分析發(fā)現(xiàn),企業(yè)內(nèi)同類質(zhì)量問題時有發(fā)生,根據(jù)此現(xiàn)象,引入語義相似度[7],將這些相似“問題描述”進行聚類,并借助標(biāo)簽組織簇實體,如圖3 所示。如,人工將“生銹”作為兩個質(zhì)量問題的共同標(biāo)簽,通過語義相似度計算,便將描述中有關(guān)“機柜門板生銹”“機柜頂部及內(nèi)部生銹”等質(zhì)量問題,聚為一類。標(biāo)簽的制定為后續(xù)的質(zhì)量問題分析奠定基礎(chǔ)。
構(gòu)建完成的質(zhì)量問題知識圖譜將主要應(yīng)用于以下幾方面:
本文構(gòu)建的知識圖譜以圖結(jié)構(gòu)的形式對產(chǎn)品實現(xiàn)過程中所發(fā)生的質(zhì)量問題的概念、實體、屬性及關(guān)系進行組織和存儲,使知識間的關(guān)聯(lián)更加立體[8]。隨著知識的不斷積累,借助知識圖譜可挖掘質(zhì)量問題產(chǎn)生的根本原因與問題發(fā)生的潛在關(guān)系,便于企業(yè)在產(chǎn)品實現(xiàn)過程中出現(xiàn)質(zhì)量問題時,可實現(xiàn)智能化檢索和問題的邏輯推理,并能進一步快速精準(zhǔn)定位問題原因。
從質(zhì)量問題的實體描述,到解決方案等多步深入分析,便于用戶對該質(zhì)量問題進行全程回顧和追溯,為合理制定改進措施提供物質(zhì)基礎(chǔ)。
本文涉及如何運用新技術(shù)和新思維構(gòu)建企業(yè)質(zhì)量問題知識圖譜,實現(xiàn)企業(yè)質(zhì)量問題高效檢索、問題原因精準(zhǔn)定位、相關(guān)知識的有效積累和共享等,后續(xù)還將繼續(xù)開展對其研究和實踐,將最大限度地發(fā)揮知識圖譜的應(yīng)用價值。