鄧顯波 費(fèi)雯麗
摘 ?要:由于電纜線路運(yùn)行的年限越來越多以及用電負(fù)荷的不斷增長,各種原因?qū)е码娎|頻繁地發(fā)生故障,傳統(tǒng)的故障分析手段無法滿足當(dāng)前的電纜故障診斷任務(wù)。文章對(duì)近10年的電纜故障歷史案例進(jìn)行分析和數(shù)據(jù)結(jié)構(gòu)化處理,抽取相關(guān)故障特性信息,構(gòu)建電纜故障知識(shí)圖譜,利用人工智能技術(shù)建立電纜故障診斷系統(tǒng),該系統(tǒng)初步實(shí)現(xiàn)了電纜線路故障的快速分析和診斷,適用于各電力公司一線檢修人員,降低電纜故障分析的難度,且縮短故障分析周期。
關(guān)鍵詞:電纜線路;數(shù)據(jù)挖掘;知識(shí)圖譜;故障診斷
中圖分類號(hào):TN915.06;TM73 ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2020)21-0148-04
Analysis of Cable Fault Diagnosis Based on Knowledge Map
DENG Xianbo,F(xiàn)EI Wenli
(China Electric Power Research Institute Co.,Ltd.,Wuhan ?430074,China)
Abstract:Due to more and more years of cable line operation and the continuous growth of power load,various reasons lead to frequent cable fault,the traditional fault analysis methods can not meet the current task of cable fault diagnosis. In this paper,the cable fault history cases in recent 10 years are analyzed and the data is structured. The relevant fault characteristic information is extracted,and the cable fault knowledge map is constructed. The cable fault diagnosis system is established by using artificial intelligence technology. The system initially realizes the rapid analysis and diagnosis of cable line faults,which is suitable for front-line maintenance personnel of various power companies,reduces the difficulty of cable fault analysis,and shortens the fault analysis cycle.
Keywords:cable line;data mining;knowledge map;fault diagnosis
0 ?引 ?言
我國城市電網(wǎng)系統(tǒng)電纜化率逐年提升,電纜線路安全運(yùn)行的重要性日益凸顯。近年來,由于用電負(fù)荷不斷上漲等原因致使電纜故障頻繁發(fā)生。目前,國家電網(wǎng)公司系統(tǒng)內(nèi)的高壓電纜線路總長度已超過3萬千米,近幾年的高壓電纜故障次數(shù)年均幾十次,分布在電纜和附件不同位置,且故障原因多樣化,每年組織電纜線路的故障分析也成為一項(xiàng)非常重要的工作[1,2]。電纜線路一般敷設(shè)于地下通道,一旦發(fā)生故障,搶修工作時(shí)間緊、難度大,電纜故障原因分析專業(yè)性強(qiáng),且費(fèi)時(shí)費(fèi)力,甚至很多線路的故障因缺乏專業(yè)人員協(xié)助分析很難找到真正的故障原因,這在全國很多運(yùn)維單位都是普遍存在的問題。一些重要的高壓電纜線路發(fā)生故障時(shí),公司相關(guān)部門會(huì)組織專家對(duì)該故障現(xiàn)象進(jìn)行分析和論證,得出故障原因,并給出解決問題的建議。國內(nèi)近些年形成了很多典型的電纜故障案例,而公司系統(tǒng)對(duì)這些高壓電纜故障案例的管理缺乏有效的信息化手段,現(xiàn)有的很多故障案例資源只能成為個(gè)例,沒有對(duì)其他的故障案例分析發(fā)揮研判借鑒作用。
為了提高系統(tǒng)運(yùn)行的可靠性,在發(fā)生線路故障后,運(yùn)維單位首先應(yīng)盡快有效恢復(fù)線路運(yùn)行,并且要盡快分析和總結(jié)故障案例,提出檢修的意見以及對(duì)應(yīng)的整改措施,避免再次發(fā)生類似的故障。目前,全國范圍內(nèi)電纜數(shù)量大,基層運(yùn)維管理專業(yè)人員相對(duì)緊張,電纜故障人工分析難度大,因此,采用人工智能技術(shù)建立電纜故障快速分析手段的需求日益迫切。
隨著大數(shù)據(jù)處理和人工智能技術(shù)的快速進(jìn)步,當(dāng)今世界已步入互聯(lián)互通的信息化時(shí)代[3-5],作者針對(duì)現(xiàn)階段專業(yè)大數(shù)據(jù)分析能力薄弱、非結(jié)構(gòu)化運(yùn)檢大數(shù)據(jù)無法實(shí)現(xiàn)綜合分析等突出問題,以本公司PMS系統(tǒng)、精益化管控平臺(tái)等運(yùn)維信息交互為切入點(diǎn),利用大數(shù)據(jù)處理技術(shù)和人工智能技術(shù),建立規(guī)范化的電纜故障案例庫,研究故障智能分析算法,建立電纜故障智能研判系統(tǒng),該系統(tǒng)基于大數(shù)據(jù)挖掘技術(shù)和知識(shí)圖譜關(guān)聯(lián)分析技術(shù),實(shí)現(xiàn)故障案例特征條件與歷史數(shù)據(jù)的智能匹配,推薦相似故障案例和故障原因,最終生成專業(yè)的故障分析報(bào)告,協(xié)助運(yùn)維人員對(duì)電纜線路故障的檢修處理,可以大幅提高電纜線路故障分析效率。
1 ?知識(shí)圖譜核心技術(shù)
知識(shí)圖譜的可擴(kuò)展性和表達(dá)能力都非常強(qiáng),在進(jìn)行知識(shí)表達(dá)時(shí),可以從多種粒度進(jìn)行表達(dá),要充分利用圖譜的表達(dá)能力,使得其能夠?yàn)椴煌瑧?yīng)用場景和不同業(yè)務(wù)需求提供服務(wù)。關(guān)于構(gòu)成知識(shí)圖譜的架構(gòu),既包括知識(shí)圖譜自身的邏輯結(jié)構(gòu),也包括在構(gòu)建知識(shí)圖譜時(shí)所采用的技術(shù)架構(gòu),如圖1所示。
為了使圖譜資源的內(nèi)容能夠被計(jì)算機(jī)所理解,需要對(duì)知識(shí)內(nèi)容賦予專門的語義描述框架。語義描述框架(Resource Description Framework,RDF)作為描述資源的機(jī)制,可以實(shí)現(xiàn)任何領(lǐng)域的資源描述,它通過類以及屬性描述個(gè)體之間的關(guān)系,這些類和屬性由模式定義。在RDF中,知識(shí)總是以三元組的形式出現(xiàn);RDF中的主語是一個(gè)個(gè)體,個(gè)體是類的實(shí)例;RDF中的謂語是一個(gè)屬性,屬性可以連接兩個(gè)個(gè)體,或者連接一個(gè)個(gè)體和一個(gè)數(shù)據(jù)類型的實(shí)例。
RDF為知識(shí)圖譜數(shù)據(jù)的存儲(chǔ)與查詢提供了詳細(xì)的規(guī)范描述,具體的研究實(shí)現(xiàn)只需要遵循其中的標(biāo)準(zhǔn)即可。
1.1 ?知識(shí)標(biāo)注
由于對(duì)知識(shí)文檔進(jìn)行標(biāo)注的效果主觀性很大,需要人工干涉與審批來判斷標(biāo)注的結(jié)果是否準(zhǔn)確合理。本文采用的人工干涉是讓人工專家來對(duì)機(jī)器標(biāo)注的結(jié)果進(jìn)行審批,即手工標(biāo)注。專家對(duì)機(jī)器標(biāo)注結(jié)果不理想的標(biāo)簽進(jìn)行修改,提高整體的標(biāo)注效果。
自動(dòng)標(biāo)注將通過TF-IDF、Jaccard和HowNet語義相似度來得到自動(dòng)標(biāo)注的結(jié)果,而手工標(biāo)注將通過Web頁面形式的手工標(biāo)注技術(shù)來對(duì)標(biāo)注結(jié)果進(jìn)行修正。
1.2 ?知識(shí)融合
1.2.1 ?模式匹配
模式匹配主要尋找本體中屬性和概念之間的對(duì)應(yīng)關(guān)系:
(1)通過使用電纜結(jié)構(gòu)以及WordNet之類的詞典等信息進(jìn)行模式匹配,然后加權(quán)平均整合結(jié)果,再通過一些模式去進(jìn)行檢查,刪除導(dǎo)致屬性不一致的對(duì)應(yīng)關(guān)系。通過循環(huán)此過程,直至沒有再找到新的對(duì)應(yīng)關(guān)系。
(2)通過基于術(shù)語的相似度計(jì)算算法,比如編輯距離和N-Gram,對(duì)結(jié)果進(jìn)行加權(quán)求和再合并,概念之間的層次關(guān)系以及相關(guān)的背景知識(shí)也需要考慮,最后進(jìn)行合并。
(3)使用錨的系統(tǒng)來應(yīng)對(duì)大規(guī)模的本體,此系統(tǒng)的起點(diǎn)為一對(duì)來自兩個(gè)本體的相似概念,找出匹配的概念需要通過根據(jù)這些概念的父概念以及子概念等等鄰居信息一點(diǎn)一點(diǎn)地構(gòu)建小片段。新的錨為新找出的匹配概念,然后再構(gòu)建新的片段。不斷重復(fù)該過程,直至找不到新的匹配概念對(duì)。
(4)采用分而治之的思想,來處理規(guī)模龐大的本體,對(duì)本地結(jié)構(gòu)進(jìn)行劃分形成組塊,然后再基于這些組塊進(jìn)行錨的匹配,此錨指預(yù)先就匹配好的實(shí)體對(duì),最好找出相應(yīng)的屬性和概念從所匹配的組塊中?,F(xiàn)存在的匹配方法基本上都是將多個(gè)算法相結(jié)合,然后加權(quán)求和或者通過加權(quán)平均來合并。但是,由于本地的結(jié)構(gòu)擁有不對(duì)稱的特征,此方法存在不足。
(5)動(dòng)態(tài)的合并方法是通過基于貝葉斯決策的風(fēng)險(xiǎn)最小化提出的,通過本體的特征計(jì)算每個(gè)實(shí)體對(duì)的相似度來動(dòng)態(tài)的選擇匹配算法并合并這些算法,由于其靈活性強(qiáng)所以帶來了很好的匹配效果。
1.2.2 ?實(shí)例匹配
實(shí)例匹配通過對(duì)異構(gòu)知識(shí)源之間實(shí)例對(duì)相似對(duì)的評(píng)估,判斷是否有指向給定領(lǐng)域的相同實(shí)體的實(shí)例?;诳焖傧嗨贫扔?jì)算的實(shí)例匹配方法,這類方法的思想是盡量降低每次相似度計(jì)算的時(shí)間復(fù)雜度,即降低O(n2t),因此映射過程只能使用簡單且速度較快的匹配器,考慮的映射線索也必須盡量簡單,從而保證t接近常數(shù)O(1)?;诳焖傧嗨贫扔?jì)算的方法使用的匹配器主要包括文本匹配器,結(jié)構(gòu)匹配器和基于實(shí)例的匹配器等,很多基于文本相似的匹配算法時(shí)間復(fù)雜度都較低,但為達(dá)到快速計(jì)算元素相似度的目的,文本匹配器還應(yīng)避免構(gòu)造復(fù)雜的映射線索。例如映射線索只考慮元素標(biāo)簽和注釋信息,大規(guī)模知識(shí)圖譜匹配中的結(jié)構(gòu)匹配器借助概念層次或元素鄰居文本相似的啟發(fā)式規(guī)則計(jì)算相似度,例如兩個(gè)實(shí)例的父概念相似,則兩個(gè)實(shí)例也相似等。為避免匹配時(shí)間復(fù)雜度過高,這些啟發(fā)式規(guī)則不能考慮太復(fù)雜的結(jié)構(gòu)信息。實(shí)例匹配通常需要通過分類、規(guī)則、聚類等方法實(shí)現(xiàn)大規(guī)模圖譜的分塊,同時(shí),并行處理技術(shù)能在此基礎(chǔ)上進(jìn)一步提高匹配結(jié)果質(zhì)量。
1.3 ?基于知識(shí)圖譜的語義搜索
基于圖譜的語義搜索(Semantic Search)與傳統(tǒng)互聯(lián)網(wǎng)中的文檔檢索不同,語義搜索能夠處理粒度更細(xì)的結(jié)構(gòu)化語義數(shù)據(jù)。
面向文檔的信息檢索主要通過輕量級(jí)的語法模型表示用戶的檢索需求和資源等內(nèi)容,即目前占主導(dǎo)地位的關(guān)鍵詞模式-詞袋模型,這種技術(shù)對(duì)主題搜索的效果很好,即給定一個(gè)主題檢索相關(guān)的文檔,但不能應(yīng)對(duì)更加復(fù)雜的信息檢索需求。相比來說,基于數(shù)據(jù)庫和基于知識(shí)庫的檢索系統(tǒng)能夠通過使用表達(dá)能力更強(qiáng)的模型來表示用戶的需求,并且利用數(shù)據(jù)內(nèi)在的結(jié)構(gòu)和語義關(guān)聯(lián),允許更為復(fù)雜的查詢,進(jìn)而提供更加精確和具體的答案。
基于知識(shí)圖譜的智能搜索總體技術(shù)框架從下到上主要分為四層:
(1)數(shù)據(jù)層。即原始數(shù)據(jù)層,各類用戶數(shù)據(jù)、訪問信息、日志等數(shù)據(jù),數(shù)據(jù)類別主要為非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和結(jié)構(gòu)化數(shù)據(jù)等。
(2)存儲(chǔ)層。包括搜索數(shù)據(jù)存儲(chǔ)和三元組知識(shí)圖譜數(shù)據(jù)存儲(chǔ)。
(3)搜索層。包括搜索配置、搜索核心模型和搜索分析,其中搜索配置主要包括分詞策略配置、同義詞設(shè)置、黑白名單配置等基礎(chǔ)搜索配置項(xiàng);搜索核心模型包括NLP模型、基于知識(shí)圖譜的意圖識(shí)別模型和Learning to Rank等;搜索分析主要提供針對(duì)搜索內(nèi)容、搜索結(jié)果的基礎(chǔ)分析功能。
(4)接口層。即對(duì)外提供的所有搜索相關(guān)的接口,主要包括主搜索接口、智能提示接口和相關(guān)搜索接口等。
1.4 ?基于知識(shí)圖譜的問答
自然語言問題給定之后,就對(duì)問題進(jìn)行語義理解和解析,然后通過知識(shí)庫對(duì)解析結(jié)果進(jìn)行查找、推理得到最終答案,完整的基于知識(shí)圖譜的問答系統(tǒng)需要包括幾個(gè)模塊,分別是基于知識(shí)圖譜的命名實(shí)體識(shí)別、會(huì)話補(bǔ)全、意圖識(shí)別及查詢構(gòu)建。同時(shí),為了提升問答系統(tǒng)的交互體驗(yàn),可以從以下幾個(gè)方面來進(jìn)行部署實(shí)施,包括相關(guān)問題推薦、問題提示等。
2 ?電纜知識(shí)圖譜構(gòu)建與故障診斷
2.1 ?總體構(gòu)建
知識(shí)圖譜中的知識(shí)來源于結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化的信息資源,如圖1所示。通過知識(shí)抽取技術(shù)從不同結(jié)構(gòu)和類型的數(shù)據(jù)中提取出計(jì)算機(jī)可理解和計(jì)算的結(jié)構(gòu)化數(shù)據(jù),以供進(jìn)一步的分析和利用。通過從不同來源、不同結(jié)構(gòu)的數(shù)據(jù)中獲取知識(shí),然后再對(duì)知識(shí)進(jìn)行提取,得到結(jié)構(gòu)化的知識(shí)并存入到知識(shí)圖譜中。
目前知識(shí)獲取通過專家法完成,基于歷史故障案例邏輯關(guān)系以及專家人工審核意見,結(jié)合線路基本信息和故障現(xiàn)象信息聯(lián)合抽取故障特征條件,歸納總結(jié)后形成知識(shí)。
知識(shí)獲取可分為概念、關(guān)系、屬性,其構(gòu)成一張巨大的語義網(wǎng)絡(luò)圖,節(jié)點(diǎn)表示實(shí)體或概念,邊則由屬性或關(guān)系構(gòu)成。
電纜故障知識(shí)圖譜構(gòu)建與應(yīng)用設(shè)計(jì)的應(yīng)用架構(gòu)應(yīng)分為應(yīng)用層、服務(wù)層、支撐層及數(shù)據(jù)層4個(gè)模塊,如圖2所示,其中應(yīng)用層包含故障知識(shí)搜索、故障分析頁面、缺陷問答等;服務(wù)層包含圖像分析模型、查詢服務(wù)、文檔管理、知識(shí)點(diǎn)推薦等;支撐層包括知識(shí)抽取、知識(shí)計(jì)算、知識(shí)建模、實(shí)體融合等功能;數(shù)據(jù)層主要包括知識(shí)存儲(chǔ)等功能。
2.2 ?電纜故障圖譜構(gòu)建
電纜故障圖譜概念包括:電力單位、電纜線路、關(guān)聯(lián)廠家、故障信息、故障大類、故障中類、故障特征描述、故障原因;圖譜關(guān)系包括:電纜線路所屬電力單位,電纜線路關(guān)聯(lián)生產(chǎn)廠家,電纜線路與故障信息通過線路信息進(jìn)行關(guān)聯(lián),故障信息通過故障名稱與故障大類、中類、特征描述、原因進(jìn)行關(guān)聯(lián)。
對(duì)電纜故障結(jié)構(gòu)化數(shù)據(jù)按數(shù)據(jù)模板進(jìn)行導(dǎo)入,通過構(gòu)建的知識(shí)圖譜模型實(shí)現(xiàn)全局構(gòu)建。知識(shí)檢索通過從目標(biāo)節(jié)點(diǎn)開始檢索,到關(guān)聯(lián)方查詢、到探尋節(jié)點(diǎn)間的關(guān)聯(lián)關(guān)系。如圖3所示,電纜故障診斷程序?yàn)椋?/p>
(1)發(fā)生一起電纜線路故障后,工作人員通過查詢線路檔案信息,并在故障現(xiàn)場進(jìn)行觀察,以及輔助一些必要的試驗(yàn),得出該起故障的現(xiàn)象信息,經(jīng)疏理歸納后可作為診斷故障元的特征條件。
(2)在故障診斷界面輸入故障特征條件,通過故障特征檢索關(guān)聯(lián)信息,探尋關(guān)聯(lián)方故障案例的描述語句。
(3)已構(gòu)建的電纜故障案例庫按照故障大類-故障中類-故障特征描述來進(jìn)行分類。因此,在診斷檢索時(shí)也按此順序進(jìn)行。例如:某起電纜本體故障,先檢索故障大類(如施工安裝),在施工安裝大類中再檢索故障中類(如敷設(shè)安裝時(shí)導(dǎo)致電纜機(jī)械損傷),最后通過具體的故障特征描述(如電纜外層出現(xiàn)高溫?zé)g,在外部溫度作用下,絕緣逐漸遭到破壞最終引起電纜擊穿事故;電纜外護(hù)套安裝時(shí)出現(xiàn)損傷,鋼絲鎧裝在角鋼支架上形成接地,鋼絲鎧裝中出現(xiàn)接地環(huán)流使鎧裝和支架接觸部分出現(xiàn)高溫,導(dǎo)致電纜絕緣破壞進(jìn)而出現(xiàn)擊穿)確定匹配度最高的歷史故障案例信息(某公司110 kV交聯(lián)聚乙烯絕緣電纜故障)。
(4)通過上述關(guān)系檢索診斷出的匹配案例的分析,得出故障原因,作為診斷結(jié)果的輸出。診斷界面最后打印診斷報(bào)告,診斷報(bào)告的內(nèi)容包括故障概況、故障現(xiàn)象與分析、結(jié)論與建議。
2.3 ?電纜故障診斷系統(tǒng)
基于上述知識(shí)圖譜故障診斷模型,本文建立了一個(gè)電纜故障診斷系統(tǒng)。該系統(tǒng)的輸入?yún)?shù)包含基本信息和故障特性信息,基本信息包括:線路名稱、所屬單位、電纜廠家或附件廠家、投運(yùn)時(shí)間、電壓等級(jí)、運(yùn)行年限、電纜及附件規(guī)格型號(hào)等。故障特征信息包括:故障類型(本體、接頭、附件),若故障類型為本體,需確定故障類型的大類和中類,若故障類型為接頭或附件,須確定接頭或附件的類型及擊穿通道位置,最后給出故障描述,并附上分析圖片。該平臺(tái)的輸出參數(shù)主要包括故障原因和建議,其中故障原因根據(jù)不同因素分為三級(jí)原因和具體原因,最后給運(yùn)維人員提供相應(yīng)的檢修建議。圖4是電纜故障診斷軟件界面。
3 ?結(jié) ?論
本文對(duì)近10年的電纜故障歷史案例數(shù)據(jù)進(jìn)行結(jié)構(gòu)化處理,建立電纜故障案例庫,通過抽取歷史故障數(shù)據(jù)的特征信息,構(gòu)建電纜故障知識(shí)圖譜,利用人工智能技術(shù),建立故障診斷模型,通過故障特征條件的智能匹配來實(shí)現(xiàn)故障原因的快速分析,并給出故障檢修建議,大大縮減電纜線路故障分析周期。
參考文獻(xiàn):
[1] 楊春宇.電力電纜故障分析與診斷技術(shù)的研究 [D].大連:大連理工大學(xué),2013.
[2] 王沐雪,王紫葉,陳語柔,等.高壓電力電纜故障分析及相關(guān)技術(shù) [J].通信電源技術(shù),2019,36(5):202-203.
[3] 蒲天驕,喬驥,韓笑,等.人工智能技術(shù)在電力設(shè)備運(yùn)維檢修中的研究及應(yīng)用 [J].高電壓技術(shù),2020,46(2):369-383.
[4] 高海翔,苗璐,劉嘉寧,等.知識(shí)圖譜及其在電力系統(tǒng)中的應(yīng)用研究綜述 [J].廣東電力,2020,33(9):66-76.
[5] 李英,錢建國,王曉,等.基于數(shù)據(jù)挖掘的電網(wǎng)系統(tǒng)故障智能診斷系統(tǒng)研究 [J].自動(dòng)化與儀器儀表,2020(7):205-208.
作者簡介:鄧顯波(1984—),男,漢族,湖北仙桃人,高級(jí)工程師,碩士,主要研究方向:電纜老化狀態(tài)評(píng)估、電纜線路運(yùn)行技術(shù)。