黃琳 馬思懿 胡昉 李晶 徐超
【摘要】本文提出一種利用關(guān)鍵字匹配的方法,對電力設(shè)備維修記錄進(jìn)行智能檢索并自動分類的臺帳管理模塊。該模塊可根據(jù)設(shè)備名稱自動檢索湖北省超高壓輸變電公司的臺賬記錄,并對記錄進(jìn)行分類統(tǒng)計,從而生成設(shè)備運(yùn)行履歷。
【關(guān)鍵詞】臺賬;文本;檢索
引言
為實(shí)現(xiàn)“一強(qiáng)三優(yōu)”現(xiàn)代公司的發(fā)展戰(zhàn)略目標(biāo),國家電網(wǎng)公司于2006年啟動了SG-186工程。SG-186工程中的生產(chǎn)管理系統(tǒng)是公司生產(chǎn)管理業(yè)務(wù)的信息平臺,設(shè)備臺帳數(shù)據(jù)是生產(chǎn)管理信息系統(tǒng)的重要數(shù)據(jù)來源,是實(shí)現(xiàn)設(shè)備生產(chǎn)全過程管理的數(shù)據(jù)基礎(chǔ)。設(shè)備臺帳管理要求實(shí)現(xiàn)對設(shè)備臺帳的維護(hù)、查詢和統(tǒng)計功能。設(shè)備臺帳管理模塊的功能有以下需求:各類設(shè)備參數(shù)臺帳的維護(hù);各種形式的查詢手段;設(shè)備從投運(yùn)到報廢的完整履歷管理。搜集既有設(shè)備臺帳數(shù)據(jù)是為下一階段數(shù)據(jù)的轉(zhuǎn)化與導(dǎo)入提供數(shù)據(jù)準(zhǔn)備。正確、有效、合理的數(shù)據(jù)準(zhǔn)備是充分發(fā)揮系統(tǒng)作用的有力保證。本文提出一種利用關(guān)鍵字匹配的方法,對湖北省超高壓輸變電公司設(shè)備維修記錄進(jìn)行智能檢索并自動分類的臺帳管理模塊。該模塊可根據(jù)設(shè)備名稱自動檢索湖北省超高壓輸變電公司的臺賬記錄,并對記錄進(jìn)行分類統(tǒng)計,從而生成設(shè)備運(yùn)行履歷。
1、臺帳檢索分類
制作變電站設(shè)備運(yùn)行臺帳要求將原始檢修記錄文件中所有涉及到某單元的檢修記錄全部檢索出,再根據(jù)具體內(nèi)容加以判斷分類,加入到該單元中對應(yīng)設(shè)備的檢修記錄文件中。以500kV雙河變電站為例,該站設(shè)備臺帳層次結(jié)構(gòu)如圖1所示。
現(xiàn)以制作雙河變電站2010年設(shè)備臺帳數(shù)據(jù)為例,需檢索的原始文件內(nèi)容包括2010年3月至2010年12月雙河變電站所有的設(shè)備檢修記錄,共962條,記錄格式如表1所示。
假設(shè)我們要檢索的是“500kV雙河09開關(guān)單元09高壓斷路器設(shè)備運(yùn)行記錄”,則要求將原始文件中所有關(guān)于09高壓斷路器的檢修記錄全部檢索出來并歸入“500kV線路及開關(guān)單元設(shè)備臺帳”目錄下、“雙09”子目錄下的“高壓斷路器設(shè)備運(yùn)行記錄.doc”文件中。
如果所有臺賬記錄完全按照規(guī)范錄入PMS管理系統(tǒng),則檢索不同設(shè)備的記錄時,僅需搜索“設(shè)備名稱”與“間隔名稱”兩個字段,并將相應(yīng)記錄返回即可。然而由于臺賬是手工錄入,勢必存在記錄不符合輸入規(guī)范的情況,例如“工作記錄”中出現(xiàn)的設(shè)備,并不一定都在“設(shè)備名稱”字段中出現(xiàn)。因此,檢索就不能僅依靠“設(shè)備名稱”字段進(jìn)行,而最好利用“工作內(nèi)容”字段進(jìn)行。然而“工作內(nèi)容”字段的錄入是基于自然語言的,因此設(shè)備名稱會以不同的形式出現(xiàn)。例如“雙09開關(guān)”可能以以下三種形式出現(xiàn):直接以“雙09開關(guān)”形式出現(xiàn);以“雙09X刀閘”(x為0-9的數(shù)字)形式出現(xiàn);與其它設(shè)備并列,設(shè)備間以頓號隔開,比如“雙07、08、09開關(guān)”,或“雙07X、09X刀閘”等。這些不同的出現(xiàn)方式都增加了檢索的難度。
1.1 人工檢索。人工檢索方法為:在原始檢修記錄文件中查找關(guān)鍵字“09”,在所有查找結(jié)果中篩選出與09高壓斷路器有關(guān)的記錄,將記錄中的“工作日期”、“工作內(nèi)容”、“完成情況”三項復(fù)制,粘貼到“雙09”文件夾下的“高壓斷路器設(shè)備運(yùn)行記錄.doc”文件中。
1.2 自動檢索。臺帳檢索是基于關(guān)鍵字的,例如我們要檢索關(guān)于雙河09開關(guān)單元的記錄,則檢索的關(guān)鍵字為:“09”、“開關(guān)”、“斷路器”、“刀閘”、“隔離開關(guān)”、“電流互感器”等。檢索時存在前述三種情況:1、簡單的關(guān)鍵字匹配,即記錄中存在“雙09開關(guān)”這種完整表達(dá)式,可直接與請求的關(guān)鍵字匹配;2、記錄中存在“雙091刀閘”的情況,這時我們只需檢索含有“雙09x刀閘”(其中x為從0到9的數(shù)字)的記錄即可;3、最復(fù)雜的情況是雙09開關(guān)單元設(shè)備與其它單元設(shè)備并列存在,比如“雙07、08、09開關(guān)”,這時我們先檢測“雙”這個關(guān)鍵字,再尋找“開關(guān)”這個關(guān)鍵字,如果“09”關(guān)鍵字在“雙”與“開關(guān)”關(guān)鍵字中間,且中間存在頓號,即算找到匹配記錄。
檢索系統(tǒng)利用C語言在Matlab runtime環(huán)境下實(shí)現(xiàn)。檢索界面如圖2所示。
點(diǎn)擊“檢查檢索要求”按鈕,可顯示如圖3的對話框,用于檢查檢索要求是否符合用戶需要。點(diǎn)擊“開始檢索”按鈕,可根據(jù)檢索要求檢索“待檢索源文件”中的相關(guān)記錄,并將結(jié)果輸出到與源文件相同目錄下的相應(yīng)文件中。如按圖2中的檢索要求將輸出檢索結(jié)果到“E:\雙河\臺賬檢索(綜合IHM)\500kV\雙09開關(guān).xls”文件中。
點(diǎn)擊“一鍵全部檢索”按鈕,可根據(jù)相應(yīng)腳本,檢索某變電站所有設(shè)備的臺賬記錄,并將結(jié)果存在相應(yīng)目錄下。
需要注意的是,針對每一條記錄涉及的所有設(shè)備,其檢修內(nèi)容和完成情況都要?dú)w入到各設(shè)備的檢修記錄中,例如某條檢修記錄涉及雙河07、08、09開關(guān),071、072、081、082、091、092、142刀閘,094地刀,共11個設(shè)備,那么在原始文件中,在這11個不同的設(shè)備名下,此條檢修記錄會重復(fù)11次。因此,必須在檢索后自動去掉冗余記錄,否則在統(tǒng)計操作記錄時會出現(xiàn)較大誤差。本文提出的模塊也實(shí)現(xiàn)了在檢索分類后自動去掉冗余記錄的功能。
2、人工與自動檢索結(jié)果比較
我們?nèi)砸浴半p河500kV 09開關(guān)單元09高壓斷路器設(shè)備運(yùn)行記錄臺帳”為例,人工檢索結(jié)果為10條記錄,利用智能檢索并自動分類的方法,檢索出帶重復(fù)內(nèi)容的記錄共76條,自動去掉重復(fù)記錄后,檢索出19條記錄。
由此例可見,僅雙河09開關(guān)單元09開關(guān)一項設(shè)備2010年的人工檢索記錄就存在9條漏檢記錄,且人工檢索也可能出現(xiàn)更多重復(fù)、錯誤的情況。一個變電站有成百上千項設(shè)備,特別是像500kV雙河變電站這樣投入運(yùn)行接近三十年的老站,不僅設(shè)備多,而且很多設(shè)備老化,對日常維護(hù)檢修工作要求很高,操作記錄很多,制作設(shè)備臺帳時人工檢索工作量巨大,容易導(dǎo)致工作人員疲勞,效率低下,且不可避免的會造成臺帳錯誤。
此外,此例中人工檢索時間至少需要二十分鐘,系統(tǒng)自動檢索時間為9秒左右,效率大大優(yōu)于人工檢索。而隨著工作量的加大,人工檢索效率會越來越低下,系統(tǒng)自動檢索效率不受影響。
參考文獻(xiàn):
[1]沙勝華,李欣,郭大權(quán).基于發(fā)布/訂閱的消息隊列在工作流引擎中的應(yīng)用研究[J].計算機(jī)與現(xiàn)代化,2012,(10).
[2]樊曉光,褚文奎,萬明.基于領(lǐng)域本體的軟構(gòu)件檢索[J].計算機(jī)科學(xué),2009,(06).
[3]馬建剛,黃濤,汪錦嶺,徐罡,葉丹.面向大規(guī)模分布式計算發(fā)布訂閱系統(tǒng)核心技術(shù)[J].軟件學(xué)報,2006,(01).