黃晨貴 羅一 王志文 韋鳳梅
摘要:隨著變電站無(wú)人值守及電網(wǎng)規(guī)模的逐步擴(kuò)大,對(duì)變電站監(jiān)控信息的接入質(zhì)量、規(guī)范性提出更高的要求。為提高存量監(jiān)控信息的規(guī)范性,本文通過(guò)研究基于線性相關(guān)序列的Markov算法,對(duì)長(zhǎng)序詞條進(jìn)行分段預(yù)處理,建立監(jiān)控信息標(biāo)準(zhǔn)庫(kù)、監(jiān)控信息比對(duì)知識(shí)庫(kù),實(shí)現(xiàn)監(jiān)控信息與標(biāo)準(zhǔn)信息的自動(dòng)校核。通過(guò)監(jiān)控信息校核能夠準(zhǔn)確的、快速的對(duì)比出監(jiān)控信息與標(biāo)準(zhǔn)信號(hào)的差異情況。對(duì)在運(yùn)站點(diǎn)表進(jìn)行標(biāo)準(zhǔn)性校核,為監(jiān)控信息表管理提供有效技術(shù)支持。
Abstract: With the unattended substation and the gradual expansion of the scale of the power grid, higher requirements are put forward for the access quality and standardization of substation supervision information. In order to improve the standardization of inventory supervision information, this paper uses the Markov algorithm based on linear correlation sequence to preprocess the long-order entries in segments, establish a supervision information standard library and a supervision information comparison knowledge base, and realize supervision information and standard information automatic verification. Through the supervision information check, the difference between the supervision information and the standard signal can be accurately and quickly compared to perform standard checks on the station tables in operation and provide effective technical support for the management of supervision information.
關(guān)鍵詞:線性相關(guān)序列;Markov算法;文本處理;監(jiān)控信息;校核
Key words: linear correlation sequence;markov algorithm;text processing;supervision information;check
中圖分類號(hào):TP301.6;O211.62? ? ? ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文章編號(hào):1006-4311(2020)31-0215-03
0? 引言
隨著智能電網(wǎng)的逐步推進(jìn)以及調(diào)控一體化的全面實(shí)施,電網(wǎng)監(jiān)控?cái)?shù)據(jù)的及時(shí)性、準(zhǔn)確性的要求日益凸顯,電網(wǎng)監(jiān)控人員所面臨的壓力也逐日增加。變電站監(jiān)控信息表作為調(diào)控一體化運(yùn)行的基礎(chǔ)數(shù)據(jù),對(duì)電網(wǎng)設(shè)備健康運(yùn)行狀態(tài)監(jiān)控具有重要作用[1]。變電站監(jiān)控信息的規(guī)范程度直接影響著監(jiān)控工作的效率甚至是電網(wǎng)的安全穩(wěn)定運(yùn)行。對(duì)于存量變電站監(jiān)控信息的標(biāo)準(zhǔn)化梳理、處置,是減輕監(jiān)控人員工作強(qiáng)度,提高工作效率的重要保障。變電站監(jiān)控信息的標(biāo)準(zhǔn)化這項(xiàng)基礎(chǔ)工作對(duì)于調(diào)度、監(jiān)控人員日常的監(jiān)控信息分析、電網(wǎng)故障判斷起著舉足輕重的作用,有利于對(duì)電網(wǎng)的運(yùn)行狀態(tài)進(jìn)行有效的監(jiān)控和評(píng)估。
1? 監(jiān)控信息預(yù)處理方法
變電站的遙信、遙測(cè)、遙控、遙調(diào)等信息都是以文本弄的方式進(jìn)行存儲(chǔ)的,且傳統(tǒng)的監(jiān)控信息編制都以純手工的方式實(shí)現(xiàn),各站監(jiān)控信息點(diǎn)表差異較大。由此導(dǎo)致了雖然已發(fā)布相關(guān)規(guī)范,但存量監(jiān)控信息不規(guī)范情況仍較為普遍。
基于上述問題,為了避免文本數(shù)據(jù)中因?yàn)椴灰?guī)范的寫法造成的分析錯(cuò)誤,在進(jìn)行信息處理抽取前,需要根據(jù)規(guī)則對(duì)文本內(nèi)容進(jìn)行標(biāo)準(zhǔn)化處理,使得同一類數(shù)據(jù)有相對(duì)統(tǒng)一的寫法。非結(jié)構(gòu)化的監(jiān)控信息在結(jié)構(gòu)化分析過(guò)程中,采用自然語(yǔ)言處理技術(shù)進(jìn)行分析[2]-[3]。具體方法如下:
1.1 設(shè)備類型信息處置
同一個(gè)設(shè)備類型,可能有不同的名稱描述,需要在分析之前對(duì)相關(guān)信息進(jìn)行標(biāo)準(zhǔn)化處置,方便后續(xù)對(duì)設(shè)備的定位與辨識(shí)。表1為主要設(shè)備的類型名稱規(guī)范表。
1.2 序號(hào)類信息處置
對(duì)于變壓器、電容器、電抗器、站用變等,有“1#變壓器、#1變壓器、1號(hào)變壓器、變壓器1”等多種不同的寫法,需要進(jìn)行規(guī)范化處置。在處置的過(guò)程中,注意信息之間的分割。比如針對(duì)1#電容器間隔,對(duì)應(yīng)的開關(guān)編號(hào)為231,有些不規(guī)范的文本描述中,會(huì)把開關(guān)編號(hào)、電容器序號(hào)混寫在一起,寫成“2311#電容器”;在分析的過(guò)程中,需要根據(jù)變電站信息查找包含的電容器列表,根據(jù)拓?fù)渑袛嚯娙萜靼拈_關(guān)編號(hào)信息,根據(jù)電容器、開關(guān)編號(hào)的組合,將文本分割為231、1#電容器這樣的信息組合。
1.3 數(shù)字類信息處置
針對(duì)數(shù)字(比如XX三線中的“三”),可能有漢字、阿拉伯?dāng)?shù)字、羅馬數(shù)字、不規(guī)范的羅馬數(shù)字(比如Ⅲ可能會(huì)用英文字母組合III代替),需要對(duì)多種寫法的數(shù)字進(jìn)行統(tǒng)一。在此過(guò)程中,處理的目標(biāo)信息是單獨(dú)的數(shù)字,注意不要對(duì)設(shè)備編號(hào)、保護(hù)型號(hào)等信息中的數(shù)字信息造成干擾。
另外,還需要對(duì)全角半角等各類信息進(jìn)行規(guī)范化處置。
2? 隱馬爾科夫模型研究
隱馬爾科夫模型(Hidden Markov Model,HMM)[4]:先由隱藏的馬爾科夫鏈隨機(jī)生成的不可觀測(cè)的隨機(jī)狀態(tài)序列,再由產(chǎn)生的狀態(tài)生成一個(gè)可觀測(cè)的隨機(jī)序列的過(guò)程。其中,把由隱馬爾科夫鏈隨機(jī)生成的狀態(tài)序列,稱為狀態(tài)序列(State Sequence);把每個(gè)狀態(tài)生成觀測(cè)組成的隨機(jī)序列稱為觀測(cè)序列(Observation Sequence)。因此,HMM 就是定義了觀測(cè)序列 x 和狀態(tài)序列 y 的聯(lián)合概率 p(x,y)。由于狀態(tài)序列是一個(gè)馬爾科夫鏈,并且狀態(tài)序列不可見,因此稱該過(guò)程為隱馬爾科夫過(guò)程。
3? 基于線性相關(guān)序列的Markov算法實(shí)現(xiàn)監(jiān)控信息知識(shí)庫(kù)的構(gòu)建
變電站監(jiān)控信息表是一種按電網(wǎng)調(diào)度規(guī)則,電網(wǎng)設(shè)備信息等組成的具有規(guī)律性的中文詞條。但由于不同的編制人員的對(duì)監(jiān)控信息規(guī)范理解的差異性,導(dǎo)致監(jiān)控信息的標(biāo)準(zhǔn)化程度因站而議,各站信息差距較大,人工辨識(shí)的難度、工作量都非常大。
通過(guò)研究變電站一、二次設(shè)備的信號(hào)命名規(guī)則,根據(jù)典型監(jiān)控信息的組成原理進(jìn)行深入探究[5],最終將通過(guò)預(yù)處理的監(jiān)控信息分為電壓等級(jí)、間隔、設(shè)備類型、設(shè)備編號(hào)、信號(hào)描述等部分,對(duì)應(yīng)本體監(jiān)控信號(hào)的標(biāo)注為:V(電壓等級(jí))、S(間隔)、D(設(shè)備類型)、N(設(shè)備編號(hào))、I(信號(hào)描述)。
對(duì)于監(jiān)控信息的描述不完備的情況,需基于具體的信號(hào)描述進(jìn)行補(bǔ)充,實(shí)現(xiàn)數(shù)據(jù)的完整性評(píng)估及填充工作。
下面以“2051水車Ⅱ線RCS-923A保護(hù)跳閘”信號(hào)為例展開說(shuō)明:
①電壓等級(jí):無(wú),通過(guò)開關(guān)編號(hào)命名規(guī)范補(bǔ)充電壓等級(jí)為220kV;
②間隔:2051/水車Ⅱ線;
③設(shè)備類型:無(wú),通過(guò)“RCS-923A”補(bǔ)充設(shè)備類型為線路保護(hù);
④設(shè)備編號(hào):RCS-923A;
⑤信息描述:保護(hù)跳閘。
詳細(xì)的拆分及標(biāo)注情況示例如表2所示。
中文長(zhǎng)詞條中缺少對(duì)分詞的明顯分隔符,通常需要依靠人為分?jǐn)鄬?duì)長(zhǎng)詞條進(jìn)行分界點(diǎn)判別。因此如何對(duì)監(jiān)控信息的分詞間斷點(diǎn)判別成為了監(jiān)控信息文本處理的關(guān)鍵。基于線性相關(guān)序列的Markov算法可以有效對(duì)該類長(zhǎng)詞條中文信號(hào)進(jìn)行分詞[6]。
首先通過(guò)對(duì)電網(wǎng)規(guī)程的深入分析與解讀,構(gòu)建一套經(jīng)典電網(wǎng)詞庫(kù),包含電網(wǎng)變電站的電壓等級(jí)、間隔、設(shè)備、常見告警等信息,提取變電站遙信、遙測(cè)、遙控監(jiān)控信號(hào)表中的經(jīng)典詞,與空間向量建立映射關(guān)系,假設(shè)監(jiān)控信息點(diǎn)表中含有x個(gè)經(jīng)典詞庫(kù)收錄短詞,將它們按順序編號(hào)為1, 2, …, x。x維空間向量可采用下面的公式表達(dá):
W=[w1, …, wk, …, wx]
通過(guò)對(duì)監(jiān)控信號(hào)的分詞,實(shí)現(xiàn)監(jiān)控信息文本的向量化,以此構(gòu)建空間向量模型。對(duì)于監(jiān)控信息的文字信息處理,采用語(yǔ)義框架槽填充的方法實(shí)現(xiàn)對(duì)監(jiān)控信息的挖掘;運(yùn)用Space Vector探索了監(jiān)控信息中文文本的挖掘方法。
標(biāo)準(zhǔn)信息的詞條分?jǐn)喾绞酵O(jiān)控信息,不再贅述。
通過(guò)上述方法完成監(jiān)控信息、標(biāo)準(zhǔn)信息的詞條分?jǐn)?,完成監(jiān)控信息標(biāo)準(zhǔn)庫(kù)、監(jiān)控信息校核知識(shí)庫(kù),為標(biāo)準(zhǔn)化校核提供數(shù)據(jù)支撐。
4? 監(jiān)控信息與標(biāo)準(zhǔn)信息的校核
基于監(jiān)控信息及標(biāo)準(zhǔn)信息的長(zhǎng)序詞條分?jǐn)嗉夹g(shù),構(gòu)造監(jiān)控信息知識(shí)庫(kù)。隨著測(cè)試樣本的增加,基于監(jiān)控信息知識(shí)庫(kù)將不斷更新完善,并通過(guò)“最優(yōu)可信度占位”理論的監(jiān)控信息的匹配算法,實(shí)現(xiàn)監(jiān)控信息與標(biāo)準(zhǔn)信息的自動(dòng)校核與匹配,整體方案路線見圖1。相似度在70%以上的信息可實(shí)現(xiàn)自動(dòng)校核,準(zhǔn)確性可達(dá)到92~95%。
5? 結(jié)束語(yǔ)
在電網(wǎng)調(diào)控一體化模式下,集中監(jiān)控變電站數(shù)量及監(jiān)控?cái)?shù)據(jù)數(shù)量龐大,因信息錯(cuò)漏和相關(guān)管理不到位導(dǎo)致的安全風(fēng)險(xiǎn)始終存在。本文通過(guò)基于線性相關(guān)序列的Markov算法實(shí)現(xiàn)監(jiān)控信息的詞條分?jǐn)?,完成監(jiān)控信息知識(shí)庫(kù)的構(gòu)建,進(jìn)而實(shí)現(xiàn)對(duì)監(jiān)控信息標(biāo)準(zhǔn)化的自動(dòng)校核,將存量的監(jiān)控信息與標(biāo)準(zhǔn)信息實(shí)現(xiàn)精準(zhǔn)匹配,發(fā)掘存量信息存在的問題,提高監(jiān)控信息管理的效率和信息表質(zhì)量,為后續(xù)監(jiān)控信息智能化分析奠定堅(jiān)實(shí)的基礎(chǔ),保障監(jiān)控運(yùn)行安全。
參考文獻(xiàn):
[1]吳曉燕.一體化監(jiān)控信號(hào)管理在電力系統(tǒng)監(jiān)控中的應(yīng)用[J]. 科技資訊,2014,32:70.
[2]張春曉,陸建峰,夏士兵,饒莉莉,蔡丹,冉光瑩.基于專家系統(tǒng)的變電站監(jiān)控信號(hào)智能處理系統(tǒng)[J].東南大學(xué)學(xué)報(bào)(自然科學(xué)版),2008(S2):140-144.
[3]張琳.提升無(wú)人值守變電站監(jiān)控質(zhì)量探析[J].科技視界,2015,04:328.
[4]解宇涵.基于深度學(xué)習(xí)的中文分詞模型應(yīng)用研究[D].重慶:重慶大學(xué),2017.
[5]林英,陸穎銓.變電站集中監(jiān)控信號(hào)優(yōu)化方案探究[J].中國(guó)新技術(shù)新產(chǎn)品,2014,16:40-41.
[6]李英,錢建國(guó),方響,等.基于大數(shù)據(jù)背景的集中監(jiān)控輔助決策系統(tǒng)研究[J].浙江電力,2019,38(10):34-39.DOI:10.19585/j.zjdl.201910006.