• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于知識(shí)圖譜的核電設(shè)備健康管理知識(shí)建模與分析*

      2021-08-04 01:58:48趙明輝張玲玲
      科技促進(jìn)發(fā)展 2021年4期
      關(guān)鍵詞:核電圖譜關(guān)聯(lián)

      ■ 熊 奧 高 暢 趙明輝 張玲玲

      1.中國(guó)科學(xué)院大學(xué)經(jīng)濟(jì)與管理學(xué)院 北京 100190

      2.中國(guó)科學(xué)院大數(shù)據(jù)挖掘與知識(shí)管理重點(diǎn)實(shí)驗(yàn)室 北京 100190

      3.中國(guó)科學(xué)院大學(xué)中丹學(xué)院 北京 100190

      0 引言

      隨著工業(yè)制造、生物醫(yī)藥、國(guó)防軍事、交通運(yùn)輸?shù)犬a(chǎn)業(yè)的快速發(fā)展,設(shè)備大型化、結(jié)構(gòu)復(fù)雜化、運(yùn)行自動(dòng)化和智能化等特點(diǎn)愈發(fā)突出,機(jī)械設(shè)備的健康管理已逐漸成為企業(yè)運(yùn)營(yíng)乃至跨越發(fā)展的重要載體[1-2]。設(shè)備規(guī)模大、安裝測(cè)點(diǎn)多、采樣頻率高、收集歷時(shí)長(zhǎng)、數(shù)據(jù)量巨大,客觀上推動(dòng)設(shè)備健康管理進(jìn)入數(shù)據(jù)化和智能化管理時(shí)代[3–5]。尤其在核電企業(yè),核心設(shè)備是企業(yè)生存與發(fā)展的依托,保持設(shè)備安全與穩(wěn)定的運(yùn)行是企業(yè)最重要的活動(dòng)之一,同時(shí)也決定了企業(yè)的經(jīng)營(yíng)效益[6]。因此,設(shè)備的維護(hù)與檢修成為核電企業(yè)的主要工作之一,其主要活動(dòng)包括糾正性維護(hù)、適應(yīng)性維護(hù)、完善性維護(hù)和預(yù)防性維護(hù),相應(yīng)工作都由專業(yè)的維修部門負(fù)責(zé)。為確保主要設(shè)備時(shí)刻處于可運(yùn)行狀態(tài),常常需要較大的人力資源實(shí)時(shí)監(jiān)控、實(shí)時(shí)維護(hù)。然而,設(shè)備的維護(hù)與檢修并不容易,工作人員需要了解設(shè)備各維度的信息,如上次檢修時(shí)間,故障可能原因,常用的維護(hù)措施等,相關(guān)信息需要快捷、準(zhǔn)確的傳遞給維修和管理人員。

      為了解決上述問(wèn)題,傳統(tǒng)的方法主要依賴維修人員的個(gè)人素質(zhì)和數(shù)據(jù)庫(kù)的運(yùn)行日志[7],隨著信息技術(shù)發(fā)展,設(shè)備健康數(shù)據(jù)與智能維修技術(shù)的結(jié)合為設(shè)備健康發(fā)展帶來(lái)新的發(fā)展機(jī)遇[8],如核電企業(yè)通常將歷史維修數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)管理系統(tǒng)中(如Oracle,Mysql),但上述方法并沒(méi)有打破“數(shù)據(jù)孤島(Isolated Data Island,IDI)的狀態(tài),不利于從整體數(shù)據(jù)中發(fā)現(xiàn)有價(jià)值的信息,缺乏對(duì)故障案例關(guān)聯(lián)網(wǎng)絡(luò)的挖掘和展現(xiàn),而企業(yè)的設(shè)備故障通常存在隱性關(guān)聯(lián)關(guān)系,挖掘這些關(guān)聯(lián)信息將有利于設(shè)備健康管理實(shí)施。

      新興的知識(shí)圖譜技術(shù),以圖譜數(shù)據(jù)為核心,通過(guò)對(duì)所有數(shù)據(jù)的有效鏈接,擺脫傳統(tǒng)數(shù)據(jù)查詢頁(yè)面的方式,采用圖譜展示方式實(shí)現(xiàn)用戶在信息檢索中的聯(lián)想式檢索,使系統(tǒng)中積累的海量數(shù)據(jù)得到有效的整合和深層的挖掘[9]。近年來(lái),已經(jīng)有相關(guān)研究人員利用知識(shí)圖譜技術(shù)在設(shè)備健康管理領(lǐng)域做出嘗試性的探索,如Tang[10]提出了一種融合多源異構(gòu)電力設(shè)備數(shù)據(jù)構(gòu)建電力設(shè)備知識(shí)圖,并基于所構(gòu)造的知識(shí)圖對(duì)所需信息進(jìn)行詳盡說(shuō)明的方法,同時(shí)以變電站為例,給出了相關(guān)的搜索結(jié)果,證明了知識(shí)圖可以提高電力設(shè)備管理效率。Irlán[11]提出一種基于知識(shí)圖譜集成不同數(shù)據(jù)源的通用方法,并能基于知識(shí)圖譜的數(shù)據(jù)輕松實(shí)現(xiàn)生產(chǎn)線產(chǎn)品零件的追溯;趙倩[12]針對(duì)數(shù)控設(shè)備故障發(fā)生原因復(fù)雜、隱蔽、不易排查的特點(diǎn),提出一種針對(duì)數(shù)控設(shè)備故障領(lǐng)域的知識(shí)圖譜構(gòu)建方法,實(shí)現(xiàn)對(duì)歷史數(shù)控設(shè)備故障知識(shí)的積累、組織和共享;王莉[13]為降低地鐵工程事故的危害性,通過(guò)集成多年的地鐵工程事故數(shù)據(jù),提出基于知識(shí)圖譜的地鐵工程事故知識(shí)建模與事故分析方法,為安全管理提供決策支持;王杰[14]為充分挖掘航空安全領(lǐng)域積累的海量航空安全事件基礎(chǔ)數(shù)據(jù),提出一種航空安全事件知識(shí)圖譜構(gòu)建的方法,為提升民航突發(fā)事件應(yīng)急管理提供良好的數(shù)據(jù)支持;段陽(yáng)[15]充分利用制造企業(yè)的金屬切削數(shù)據(jù)資源,將金屬切削數(shù)據(jù)構(gòu)建成知識(shí)圖譜,實(shí)現(xiàn)對(duì)切削加工數(shù)據(jù)的有機(jī)整合,即提升了數(shù)據(jù)的價(jià)值密度,同時(shí)也為金屬切削智能應(yīng)用開(kāi)發(fā)提供支持。

      與之前的研究相比,本文具有如下的創(chuàng)新和提升:首先,知識(shí)圖譜在地鐵、航空等多類型設(shè)備健康管理中已經(jīng)初步顯現(xiàn)其獨(dú)特且突出的優(yōu)勢(shì),本文將其在核電設(shè)備領(lǐng)域進(jìn)行多視角的擴(kuò)展;其次,詳細(xì)梳理了核電企業(yè)維修部門維修工單數(shù)據(jù)庫(kù)的實(shí)體、屬性及關(guān)系等概念體系,增加特定領(lǐng)域知識(shí)圖譜的多樣性;最后,用構(gòu)建完成的核電領(lǐng)域知識(shí)圖譜在實(shí)際設(shè)備健康管理工作中進(jìn)行廣泛的應(yīng)用探索,并取得良好的實(shí)踐效果。本文綜合知識(shí)圖譜研究基礎(chǔ)以及核電企業(yè)設(shè)備維修的業(yè)務(wù)特點(diǎn),提出基于知識(shí)圖譜的核電設(shè)備健康管理方法,并梳理出基于知識(shí)圖譜的核電設(shè)備維修分析流程,運(yùn)用專業(yè)查詢語(yǔ)言實(shí)現(xiàn)維修知識(shí)獲取和可視化,可以實(shí)現(xiàn)對(duì)核電設(shè)備維修知識(shí)的有效集成和充分利用。

      1 基于知識(shí)圖譜的設(shè)備健康管理

      1.1 知識(shí)圖譜研究現(xiàn)狀

      知識(shí)圖譜(Knowledge Graph, KG)是由實(shí)體和關(guān)系組成的語(yǔ)義網(wǎng)絡(luò),網(wǎng)絡(luò)中的每個(gè)節(jié)點(diǎn)是一個(gè)實(shí)體(Enti‐ty),每條邊代表一種關(guān)系(Relation),每個(gè)三元組(h,r,t)表示每個(gè)頭節(jié)點(diǎn)h和尾節(jié)點(diǎn)t是由關(guān)系r相連接。知識(shí)圖譜以結(jié)構(gòu)化的方式描述客觀世界中概念、實(shí)體及其關(guān)系,將信息表達(dá)成接近人類認(rèn)知世界可以認(rèn)知的形式,為人們提供了一種更好地組織、管理和理解海量信息的范式[16]。知識(shí)圖譜作為一種高效的知識(shí)組織方式,它能夠幫助用戶快捷、準(zhǔn)確地查詢到所需要的信息以及其關(guān)聯(lián)信息,與傳統(tǒng)基于關(guān)鍵字匹配的搜索引擎原理不同,知識(shí)圖譜不但有結(jié)構(gòu)數(shù)據(jù)展示,還提供關(guān)聯(lián)查詢,其利用概念、實(shí)體的匹配度可以返回與搜索相關(guān)的知識(shí)體系[17],知識(shí)圖譜的工作原理如圖1所示,在數(shù)據(jù)層面,首先需要從數(shù)據(jù)源中抽取出實(shí)體,實(shí)體屬性以及實(shí)體之間的關(guān)系,實(shí)體和關(guān)系以三元組的方式表示,然后將三元組存入專業(yè)數(shù)據(jù)庫(kù),這個(gè)過(guò)程集合知識(shí)提取,知識(shí)整合及知識(shí)存儲(chǔ);在應(yīng)用層面,用戶根據(jù)需求輸入檢索內(nèi)容,系統(tǒng)提取搜索內(nèi)容中的實(shí)體和屬性信息,與知識(shí)圖譜中的實(shí)體信息進(jìn)行匹配,并將查詢的到的實(shí)體信息和關(guān)聯(lián)實(shí)體信息一并返回給用戶。

      圖1 知識(shí)圖譜工作原理

      自Google提出知識(shí)圖譜概念以來(lái),國(guó)內(nèi)外針對(duì)知識(shí)圖譜的研究與應(yīng)用發(fā)展十分迅速,并涌現(xiàn)出一大批成果,根據(jù)知識(shí)圖譜的應(yīng)用范圍,學(xué)術(shù)界將知識(shí)圖譜分為通用知識(shí)圖譜和垂直知識(shí)圖譜[18]。在通用領(lǐng)域,知識(shí)圖譜具有數(shù)據(jù)量大、通用性強(qiáng)、知識(shí)范圍廣等特點(diǎn),如國(guó)外的YAGO[19],NELL[20],DBpedia[21],F(xiàn)reebase[22],Knowl‐edge Vault[23],國(guó) 內(nèi) 的Zhishi.me[24],Xlore[25],CN-DBpe‐dia[26]等。在垂直領(lǐng)域,知識(shí)圖譜具有數(shù)據(jù)量小、密度大、知識(shí)集中以及專業(yè)性強(qiáng)等特點(diǎn),被常常用來(lái)輔助各種復(fù)雜的分析或支持決策,截至2020年,相關(guān)技術(shù)已經(jīng)廣泛應(yīng)用于社會(huì)各行各業(yè)。在金融反欺詐領(lǐng)域,知識(shí)圖譜可以組織相關(guān)知識(shí)碎片,深入語(yǔ)義分析與推理,并通過(guò)對(duì)客戶信息內(nèi)容的一致性進(jìn)行充分驗(yàn)證來(lái)識(shí)別或提前發(fā)現(xiàn)欺詐行為[27–29];在企業(yè)商業(yè)風(fēng)險(xiǎn)領(lǐng)域,基于全國(guó)企業(yè)知識(shí)圖譜可以從異常關(guān)聯(lián)挖掘、企業(yè)風(fēng)險(xiǎn)評(píng)估、關(guān)聯(lián)探索等多維度構(gòu)建數(shù)據(jù)模型,進(jìn)行全方位的企業(yè)風(fēng)險(xiǎn)評(píng)估,這種方法能有效規(guī)避潛在的經(jīng)營(yíng)風(fēng)險(xiǎn)與資金風(fēng)險(xiǎn),為行業(yè)客戶提供智能風(fēng)險(xiǎn)管理[30];在創(chuàng)投領(lǐng)域,知識(shí)圖譜可以通過(guò)圖譜可視化對(duì)創(chuàng)投圖譜中的初創(chuàng)公司發(fā)展情況,投資機(jī)構(gòu)投資偏好等進(jìn)行解讀,通過(guò)節(jié)點(diǎn)探索、路徑發(fā)現(xiàn)、關(guān)聯(lián)探尋等可視化分析技術(shù)展示公司的全方位信息,通過(guò)知識(shí)地圖、時(shí)序圖譜等形態(tài)對(duì)地理分布、發(fā)展趨勢(shì)等進(jìn)行解讀,為投融資決策提供支持[31];除此之外,隨著知識(shí)圖譜發(fā)展,知識(shí)圖譜融合一些新的技術(shù)方法還可以實(shí)現(xiàn)政治意識(shí)形態(tài)檢測(cè)[32]、城市人口流動(dòng)分析[33],特別是知識(shí)圖譜賦能工業(yè)制造,在物體檢測(cè)[34],設(shè)備維修[35]等都有巨大的研究?jī)r(jià)值。

      1.2 知識(shí)圖譜集成設(shè)備維修知識(shí)的優(yōu)勢(shì)

      知識(shí)圖譜在設(shè)備維修知識(shí)整合和管理上據(jù)有明顯的優(yōu)勢(shì),具體包括以下4個(gè)方面:

      (1)在設(shè)備健康管理中,其數(shù)據(jù)形式是多源的,既有結(jié)構(gòu)化的維修工單,也有非結(jié)構(gòu)化的文本描述信息以及設(shè)備部件的圖片信息,上述數(shù)據(jù)在設(shè)備健康管理中可能都是在描述同一設(shè)備,知識(shí)圖譜能夠有效地整合和存儲(chǔ)設(shè)備維修相關(guān)知識(shí),為設(shè)備健康管理提供較全面的數(shù)據(jù)支撐;

      (2)與傳統(tǒng)結(jié)構(gòu)化顯示數(shù)據(jù)的方式不同,知識(shí)圖譜采用語(yǔ)義網(wǎng)絡(luò)進(jìn)行知識(shí)表示,打通數(shù)據(jù)之間的阻隔并形成有效關(guān)聯(lián),擺脫原來(lái)“數(shù)據(jù)孤島”的狀態(tài),并通過(guò)屬性值的自動(dòng)補(bǔ)全等功能極大地?cái)U(kuò)展設(shè)備原有的信息,進(jìn)一步強(qiáng)化設(shè)備之間的聯(lián)系,此外也可以從各種數(shù)據(jù)源提取知識(shí)并快速集成到已有知識(shí)圖譜中,靈活性和拓展性較強(qiáng),也更加有利于相關(guān)知識(shí)的持續(xù)積累和用戶管理;

      (3)設(shè)備維修故障描述中存在大量非結(jié)構(gòu)化數(shù)據(jù),如故障描述、維修報(bào)告等,其語(yǔ)言隨意無(wú)章,不利于相關(guān)知識(shí)復(fù)用,通過(guò)對(duì)其按照一定的邏輯規(guī)則進(jìn)行處理后,其關(guān)鍵信息抽取后存入知識(shí)圖譜,可以實(shí)現(xiàn)設(shè)備健康管理所需關(guān)鍵知識(shí)要素的選擇性提取和循環(huán)利用;

      (4)知識(shí)圖譜能夠進(jìn)一步為核電設(shè)備健康管理的知識(shí)挖掘、應(yīng)用開(kāi)發(fā)、可視化分析等提供堅(jiān)實(shí)基礎(chǔ),知識(shí)圖譜是經(jīng)過(guò)清洗和濃縮處理后的知識(shí),基于知識(shí)圖譜的語(yǔ)義搜索能夠?qū)崿F(xiàn)關(guān)聯(lián)知識(shí)獲取,并能夠?qū)崿F(xiàn)可視化展示,基于知識(shí)圖譜的智能知識(shí)推薦能夠?qū)崿F(xiàn)精準(zhǔn)的對(duì)接需求,縮短故障處理的周期。

      2 核電設(shè)備知識(shí)圖譜構(gòu)建及分析

      2.1 知識(shí)圖譜構(gòu)建流程

      在知識(shí)圖譜的構(gòu)建流程方面,李濤等將構(gòu)建過(guò)程總結(jié)為本體和實(shí)體的抽取,圖譜的構(gòu)建、更新、維護(hù),以及面向知識(shí)圖譜的內(nèi)部結(jié)構(gòu)挖掘和外部擴(kuò)展應(yīng)用[17];劉嶠等將構(gòu)建過(guò)程分為知識(shí)抽取、知識(shí)融合、知識(shí)加工和知識(shí)更新4個(gè)步驟[18]。領(lǐng)域知識(shí)圖譜是面向特定領(lǐng)域的知識(shí)庫(kù),其構(gòu)建始終遵循“始于需求,終于應(yīng)用”的原則,根據(jù)該業(yè)務(wù)原則,本文將核電維修知識(shí)圖譜的流程定義為如圖2所示,其中業(yè)務(wù)需求是指搭建圖譜的業(yè)務(wù)目的,知識(shí)建模旨在根據(jù)業(yè)務(wù)需求搭建知識(shí)圖譜模型框架,讓相關(guān)知識(shí)要素以一定邏輯形式展示,知識(shí)提取旨在從各類數(shù)據(jù)源中提取所需要的知識(shí)要素;知識(shí)融合旨在對(duì)冗余、重復(fù)數(shù)據(jù)進(jìn)行清洗,知識(shí)儲(chǔ)存是將獲取的知識(shí)要素儲(chǔ)存在特定的數(shù)據(jù)庫(kù)之中[36]。由于企業(yè)的業(yè)務(wù)需求是一個(gè)復(fù)雜動(dòng)態(tài)的過(guò)程,難以泛化,所以本文更加關(guān)注圖2知識(shí)建模到知識(shí)推理和應(yīng)用部分,其中知識(shí)應(yīng)用部分會(huì)根據(jù)實(shí)際情況變化不斷提出新的需求,進(jìn)而推動(dòng)知識(shí)圖譜的完善和迭代。

      圖2 領(lǐng)域知識(shí)圖譜構(gòu)建流程

      2.2 知識(shí)圖譜知識(shí)建模

      知識(shí)建模需要對(duì)業(yè)務(wù)有較深的理解,也需要對(duì)未來(lái)業(yè)務(wù)可能的變化有一定預(yù)估,從而設(shè)計(jì)出最貼近現(xiàn)狀并且性能高效的系統(tǒng),其中主要面臨的問(wèn)題包括:首先根據(jù)所設(shè)計(jì)的知識(shí)模型確定實(shí)體、關(guān)系和屬性,其次確定可以組成概念的實(shí)體和關(guān)系,最后確定不需要放在知識(shí)圖譜中的信息。在圖譜中,概念是一定領(lǐng)域中某一類實(shí)體的抽象表達(dá),不同的概念擁有不同的實(shí)體,且不同類別的實(shí)體擁有不同的屬性。概念設(shè)計(jì)需要根據(jù)業(yè)務(wù)需求,確定該概念所包含的實(shí)體及其屬性,關(guān)系將不同概念的實(shí)體按照一定的規(guī)則進(jìn)行關(guān)聯(lián),從而讓孤立的數(shù)據(jù)呈現(xiàn)出網(wǎng)狀結(jié)構(gòu)。本文借助傳統(tǒng)數(shù)據(jù)庫(kù)設(shè)計(jì)使用的ER (Entity Relationship Graph)圖即實(shí)體-關(guān)系圖,表示現(xiàn)實(shí)世界中的概念實(shí)體及其之間存在的關(guān)系,通過(guò)分析已有設(shè)備維修數(shù)據(jù),提取出關(guān)鍵知識(shí)要素作為領(lǐng)域的概念、關(guān)系和屬性,具體知識(shí)模型如圖3所示。

      圖3 核電維修知識(shí)圖譜主要概念和關(guān)系模式

      2.3 知識(shí)要素提取和融合

      知識(shí)要素提取主要是指將上述概念和關(guān)系模式設(shè)計(jì)中包含的實(shí)體對(duì)象、屬性信息從數(shù)據(jù)源中提取出來(lái),并根據(jù)關(guān)系模式確定實(shí)體之間的關(guān)系,由于實(shí)體對(duì)象通常以其名稱指代對(duì)應(yīng)的實(shí)體,因此實(shí)體識(shí)別也稱為命名實(shí)體識(shí)別[37]。核電維修知識(shí)圖譜的關(guān)鍵知識(shí)要素提取需要從維修工單的描述中提取出上述概念和關(guān)系模式設(shè)計(jì)的知識(shí)要素,主要包括維修事件、設(shè)備、電廠、機(jī)組、責(zé)任科室、責(zé)任班組、任務(wù)描述,故障位置等。最新的自然語(yǔ)言處理技術(shù)能夠?qū)崿F(xiàn)非結(jié)構(gòu)化數(shù)據(jù)自動(dòng)提取,有利于維修知識(shí)持續(xù)提取和知識(shí)積累,主要方法包括:基于規(guī)則的方法、基于統(tǒng)計(jì)學(xué)習(xí)的方法、基于深度學(xué)習(xí)的方法,以及多種方法的組合使用[38–41]。

      本文以秦山核電企業(yè)4個(gè)機(jī)組的維修工單任務(wù)為源數(shù)據(jù),收集時(shí)間范圍在2019年4月1日到5月30日的維修記錄共524 項(xiàng)工單數(shù)據(jù),每項(xiàng)工單任務(wù)包含83 個(gè)字段,該數(shù)據(jù)在數(shù)據(jù)庫(kù)中主要以表格的形式儲(chǔ)存,樣本數(shù)據(jù)如圖4所示。本文根據(jù)概念和關(guān)系模式抽取任務(wù)名稱、設(shè)備名稱、所屬電廠、所屬機(jī)組、責(zé)任科室、責(zé)任班組等關(guān)鍵知識(shí)要素。提取知識(shí)要素是一個(gè)復(fù)雜的過(guò)程,實(shí)際的維修工單中包含許多無(wú)效字段以及重復(fù)數(shù)據(jù),如果不進(jìn)行融合和實(shí)體消歧會(huì)導(dǎo)致圖譜中形成大量數(shù)據(jù)噪音,知識(shí)圖譜的準(zhǔn)確性和可用性會(huì)因此受影響。因此,本文在數(shù)據(jù)處理的編碼過(guò)程中設(shè)計(jì)出一個(gè)知識(shí)融合單元,對(duì)重復(fù)的信息進(jìn)行清洗和融合,最終提取出各類實(shí)體、關(guān)系數(shù)據(jù)如表1所示。

      圖4 維修工單數(shù)據(jù)樣本

      表1 不同類型的實(shí)體關(guān)系及屬性數(shù)量

      2.4 基于Neo4j的知識(shí)儲(chǔ)存

      根據(jù)知識(shí)模型提取出來(lái)的知識(shí)要素要以特定的物理結(jié)構(gòu)進(jìn)行存儲(chǔ),知識(shí)圖譜主要以“圖”數(shù)據(jù)結(jié)構(gòu)進(jìn)行存儲(chǔ),這種數(shù)據(jù)結(jié)構(gòu)能夠快速處理各類復(fù)雜關(guān)系,是一種理想的領(lǐng)域知識(shí)管理工具。但具體圖數(shù)據(jù)庫(kù)的選擇需要根據(jù)業(yè)務(wù)量以及效率的要求,截至2020年,相關(guān)數(shù)據(jù)庫(kù)的使用情況,無(wú)論是工業(yè)應(yīng)用還是學(xué)術(shù)研究,使用最廣泛的是Neo4j數(shù)據(jù)庫(kù),其儲(chǔ)存方式主要以節(jié)點(diǎn)(node)和關(guān)系(relation)為對(duì)象的網(wǎng)絡(luò)結(jié)構(gòu)形式[42]。Neo4j 一般可以滿足10億節(jié)點(diǎn)以下規(guī)模的數(shù)據(jù)量?jī)?chǔ)存,但如果數(shù)據(jù)量特別龐大,可選擇支持分布式的系統(tǒng)比如OrientDB,Ja‐nusGraph 等,或者通過(guò)效率、冗余原則把信息存放在傳統(tǒng)數(shù)據(jù)庫(kù)中,從而減少知識(shí)圖譜所承載的信息量。

      本文借助Neo4j中的標(biāo)簽實(shí)現(xiàn)核電設(shè)備相關(guān)實(shí)體和關(guān)系類型的標(biāo)識(shí),Neo4j 圖數(shù)據(jù)庫(kù)本身提供Cypher 工具對(duì)三元組數(shù)據(jù)進(jìn)行操作,其本身支持RDF、CSV、JSON等文件格式,可以利用load csv 完成對(duì)csv 文件數(shù)據(jù)的批量導(dǎo)入,本文出于便捷操作的考慮,使用基于Neo4j 的python 開(kāi)發(fā)包py2neo 導(dǎo)入實(shí)體關(guān)系數(shù)據(jù),初步建立核電維修知識(shí)圖譜如圖5所示,其中同類實(shí)體或關(guān)系顯示為同一種顏色,如其中cEvents 的節(jié)點(diǎn)顯示顏色為黃色,當(dāng)然相關(guān)可視化狀態(tài)都是可變的,可以根據(jù)實(shí)際需求對(duì)節(jié)點(diǎn)顏色以及大小進(jìn)行動(dòng)態(tài)調(diào)整。從圖譜中可以發(fā)現(xiàn),本文構(gòu)建的核電設(shè)備維修知識(shí)圖譜由2906 個(gè)節(jié)點(diǎn)標(biāo)簽和5331條邊組成,節(jié)點(diǎn)標(biāo)簽由定義的9類實(shí)體組成,邊標(biāo)簽由定義的11 類關(guān)系組成,同時(shí)還包含大量的屬性鍵值,不同于現(xiàn)存大多的同構(gòu)知識(shí)圖譜(即只有一類邊),本文所構(gòu)建的異構(gòu)知識(shí)圖譜擁有豐富的實(shí)體和關(guān)系種類。

      2.5 基于知識(shí)圖譜的分析和應(yīng)用

      2.5.1 設(shè)備維修分析流程

      在已構(gòu)建的核電設(shè)備維修知識(shí)圖譜基礎(chǔ)上,借助Neo4j提供的CQL工具能夠快速獲取設(shè)備維修的相關(guān)知識(shí),如故障描述、責(zé)任科室、負(fù)責(zé)班組等,實(shí)現(xiàn)多維度、多層次的維修統(tǒng)計(jì)分析、關(guān)聯(lián)分析等。CQL 是代表Cypher的查詢語(yǔ)言,是一種聲明性模式匹配語(yǔ)言,遵循SQL 語(yǔ)法,具有語(yǔ)法簡(jiǎn)單、人性化以及可讀性強(qiáng)等特點(diǎn)。基于知識(shí)圖譜的設(shè)備維修分析流程如圖6所示,首先確定分析的對(duì)象,以限制條件縮小搜索范圍,以MATCH 配合WHERE 語(yǔ)法使用,基本思想同關(guān)系型數(shù)據(jù)庫(kù)類似;其次選取分析對(duì)象,確定分析目標(biāo),在圖數(shù)據(jù)庫(kù)之中可以以實(shí)體節(jié)點(diǎn)為分析對(duì)象,如實(shí)體的統(tǒng)計(jì)特征,也可以以關(guān)系為分析對(duì)象,如關(guān)聯(lián)路徑分析,同時(shí)還可以結(jié)合實(shí)體和關(guān)系進(jìn)行綜合分析;最后返回可視化結(jié)果,Neo4j既支持?jǐn)?shù)據(jù)的圖譜可視化,同時(shí)也支持普通數(shù)據(jù)庫(kù)類似的表格表達(dá)方式,輸出結(jié)果可以用于實(shí)現(xiàn)安全管理、故障分析、決策支持等目標(biāo)。

      圖6 基于知識(shí)圖譜的核電設(shè)備維修分析流程

      2.5.2 維修作業(yè)統(tǒng)計(jì)分析

      Neo4j 的統(tǒng)計(jì)分析常用COUNT,SUM,AVG 等統(tǒng)計(jì)指標(biāo),并可以結(jié)合WHERE,LIMIT 等限制性函數(shù)對(duì)數(shù)據(jù)節(jié)點(diǎn)進(jìn)行篩選,統(tǒng)計(jì)分析主要以表格的形式進(jìn)行展示。如不同電廠產(chǎn)生的工單數(shù)量以及對(duì)應(yīng)的維修日期和相應(yīng)的作業(yè)類型并按照工單數(shù)量排序,可以輸入:“MATCH p=(c:cEvents)-[]->(a:cFacility)RETURN a.name AS 電廠名稱,COUNT(*)AS 工單數(shù)量,c.pWO_TSK_STATUS_DATE AS 檢修日期,c.pWORK_ORDER_TYPEAS 作業(yè)類型ORDER BY 工單數(shù)量DESC”,運(yùn)行結(jié)果如圖7所示,產(chǎn)生工單數(shù)量最多的日期為2019.05.10,所在電廠為QS2,單日維修工單數(shù)量達(dá)到29 件,作業(yè)類型為PM(總的作業(yè)類型包含13 類)。且從總體說(shuō)來(lái),QS2 的工單數(shù)量明顯高于其它電廠,作業(yè)類型都集中在PM 項(xiàng),同時(shí)也有MO 項(xiàng)作業(yè),其它電廠的工單作業(yè)類型也集中在PM 項(xiàng),如要繼續(xù)挖掘深層次的具體原因則要結(jié)合到企業(yè)的運(yùn)營(yíng)安排和其它數(shù)據(jù)的拓展和聚合。

      圖7 統(tǒng)計(jì)分析

      2.5.3 維修作業(yè)關(guān)聯(lián)分析

      以數(shù)據(jù)庫(kù)之中所有與“柴油機(jī)”相關(guān)的歷史維修事件為例,輸入“MATCH(n:cEvents)-[]-(p:cEquipment)WHERE n.name=~'.*柴油機(jī).*'RETURN n.name as 柴油機(jī)故障,p.name as 相關(guān)設(shè)備”,則會(huì)返回“柴油機(jī)”故障和相關(guān)設(shè)備的列表如圖8所示,輸入“MATCH p=(n:cEv‐ents)-->()where n.name=~'.*柴油機(jī).*'RETURN p”則會(huì)返回與柴油機(jī)故障相關(guān)聯(lián)的所有實(shí)體節(jié)點(diǎn)如圖9所示。從圖9中可以發(fā)現(xiàn),共查詢到5 件案例,其中4 件是由運(yùn)行三處負(fù)責(zé),3 件是由M316 班組負(fù)責(zé)維修,有3 件的負(fù)責(zé)人都是200770xx,所有故障維修事件來(lái)源都是QS2 廠房??梢哉J(rèn)為,QS2 廠房的柴油機(jī)故障發(fā)生比較頻繁,與柴油機(jī)相關(guān)的維修事件運(yùn)行三處是對(duì)口科室,而M316 組在類似的維修事件上經(jīng)驗(yàn)豐富,同時(shí)200770xx負(fù)責(zé)人對(duì)柴油機(jī)相關(guān)故障維修最清楚,通過(guò)知識(shí)圖譜的展現(xiàn)形式,可以清楚的看到對(duì)象之間的關(guān)系并進(jìn)行針對(duì)性的維修操作。

      圖8 故障和關(guān)聯(lián)設(shè)備模糊查詢

      圖9 故障和關(guān)聯(lián)實(shí)體可視化

      3 結(jié)論

      本文結(jié)合核電設(shè)備健康管理的現(xiàn)實(shí)需求以及知識(shí)圖譜在相關(guān)領(lǐng)域的特異性優(yōu)勢(shì),提出了一種新的基于知識(shí)圖譜的核電設(shè)備健康管理方法,并設(shè)計(jì)了基于核電企業(yè)實(shí)際維修工單數(shù)據(jù)的實(shí)體關(guān)系模型,構(gòu)建了核電維修知識(shí)圖譜,做了基于知識(shí)圖譜的核電設(shè)備健康管理的統(tǒng)計(jì)與關(guān)聯(lián)分析。研究結(jié)果表明,知識(shí)圖譜能夠?yàn)樵O(shè)備健康管理提供較為全面的數(shù)據(jù)支持,在設(shè)備維修知識(shí)的集成上打破傳統(tǒng)的數(shù)據(jù)孤島問(wèn)題;同時(shí),知識(shí)圖譜實(shí)現(xiàn)設(shè)備故障分析可視化,不僅可以為維修人員和管理人員提供決策和知識(shí)支持,而且有助于用戶理解實(shí)際業(yè)務(wù);此外,知識(shí)圖譜還有極強(qiáng)的可擴(kuò)展性,可以將不同數(shù)據(jù)源集成在同一圖譜中,本文構(gòu)建的知識(shí)圖譜僅針對(duì)維修工單數(shù)據(jù)源,而在核電企業(yè)中與設(shè)備維修有關(guān)聯(lián)的數(shù)據(jù)源還包括BOM 表、設(shè)備主數(shù)據(jù)、供應(yīng)商、PM 項(xiàng)目以及工單物資申請(qǐng)表等,通過(guò)相關(guān)邏輯規(guī)則擴(kuò)展現(xiàn)有的圖譜信息,能最大限度地發(fā)揮知識(shí)圖譜在設(shè)備健康管理中的價(jià)值,為未來(lái)設(shè)備的智慧管理奠定基礎(chǔ),這是本文進(jìn)一步研究的方向。

      值得注意的是,雖然知識(shí)圖譜在工業(yè)應(yīng)用中有諸多優(yōu)勢(shì),但搭建領(lǐng)域類圖譜,特別是工業(yè)知識(shí)圖譜存在許多值得注意的地方,具體說(shuō)來(lái),有以下3個(gè)方面:

      (1)數(shù)據(jù)建模方面,知識(shí)建模決定了圖譜中實(shí)體之間的關(guān)聯(lián)形式,不同于本文中單種類的數(shù)據(jù)建模,實(shí)際的工業(yè)數(shù)據(jù)是多種類的,數(shù)據(jù)建模需要考慮復(fù)雜的實(shí)體以及實(shí)體之間的關(guān)系,特別需要考慮數(shù)據(jù)之間的邏輯關(guān)聯(lián),這需要知識(shí)建模人員和業(yè)務(wù)人員深度交流和溝通。

      (2)數(shù)據(jù)融合方面,工業(yè)數(shù)據(jù)常常面臨著噪音多,數(shù)據(jù)雜的特點(diǎn),在數(shù)據(jù)預(yù)處理過(guò)程中,需要考慮設(shè)計(jì)一個(gè)數(shù)據(jù)融合單元,對(duì)噪音數(shù)據(jù)和重復(fù)數(shù)據(jù)進(jìn)行清洗。

      (3)應(yīng)用開(kāi)發(fā)方面,知識(shí)圖譜是設(shè)備健康管理應(yīng)用開(kāi)發(fā)的一個(gè)基礎(chǔ)和底層,可視化只是應(yīng)用一部分,知識(shí)圖譜對(duì)設(shè)備健康管理最有用的部分是智能問(wèn)答、智能推薦等智能應(yīng)用開(kāi)發(fā),因?yàn)橹R(shí)圖譜是經(jīng)過(guò)清洗和整理過(guò)的知識(shí),其規(guī)則的三元組形式對(duì)接智能問(wèn)答和推薦的應(yīng)用開(kāi)發(fā)十分便利。

      猜你喜歡
      核電圖譜關(guān)聯(lián)
      第四代核電 高溫氣冷堆
      百年初心精神 點(diǎn)亮核電未來(lái)
      繪一張成長(zhǎng)圖譜
      2020年核電活動(dòng)安排
      “一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
      奇趣搭配
      核電鏈接
      補(bǔ)腎強(qiáng)身片UPLC指紋圖譜
      中成藥(2017年3期)2017-05-17 06:09:01
      智趣
      讀者(2017年5期)2017-02-15 18:04:18
      主動(dòng)對(duì)接你思維的知識(shí)圖譜
      腾冲县| 武强县| 西宁市| 彩票| 如东县| 北宁市| 小金县| 台东县| 仁怀市| 巩留县| 临漳县| 莱西市| 营山县| 东乡族自治县| 保亭| 革吉县| 东莞市| 江门市| 姚安县| 琼海市| 深泽县| 扎赉特旗| 奈曼旗| 布尔津县| 旬邑县| 兴业县| 徐水县| 兴安盟| 西贡区| 信宜市| 阳东县| 遵化市| 南陵县| 新营市| 象州县| 留坝县| 宜昌市| 曲阜市| 平潭县| 迁西县| 松江区|