于楚凡,郭大亮,張秋霞,宋子濤
(1.國(guó)家電投集團(tuán)中央研究院,北京 102209;2.國(guó)家電力投資集團(tuán)有限公司,北京 100029)
電力作為一種可再生的清潔能源,在能源危機(jī)的背景下得到了廣泛的發(fā)展和應(yīng)用。因?yàn)橹苯訌沫h(huán)境中獲取能量,發(fā)電設(shè)備主要安裝在建筑物頂部或沙漠無(wú)人區(qū)[1]。受外部環(huán)境和使用壽命的影響,PV板經(jīng)常出現(xiàn)開裂、老化等故障[2]。電池板故障將影響整個(gè)發(fā)電系統(tǒng)的效率,嚴(yán)重時(shí)會(huì)引起火災(zāi)。當(dāng)前發(fā)電系統(tǒng)故障檢測(cè)技術(shù)主要有紅外圖像法和基于深度Q 網(wǎng)絡(luò)法兩種檢測(cè)方法。使用基于紅外圖像的檢測(cè)方法,利用光學(xué)圖像作為電路板的背景圖像,并與紅外熱圖像進(jìn)行配準(zhǔn),實(shí)現(xiàn)元件定位,在此基礎(chǔ)上,提取待測(cè)板構(gòu)件紅外溫升序列的多個(gè)特征向量,并與標(biāo)準(zhǔn)庫(kù)中的數(shù)據(jù)進(jìn)行對(duì)比,判定構(gòu)件失效。采用該方法成本較高,且受外部環(huán)境影響較大;使用基于深度Q 網(wǎng)絡(luò)法來(lái)判斷部件故障,在基于網(wǎng)絡(luò)的入侵檢測(cè)系統(tǒng)中,入侵預(yù)警與安全響應(yīng)相結(jié)合,但隨著技術(shù)的不斷發(fā)展,攻擊變得越來(lái)越普遍,檢測(cè)也越來(lái)越困難。所以提出了基于大數(shù)據(jù)挖掘的發(fā)電系統(tǒng)異常數(shù)據(jù)識(shí)別系統(tǒng)設(shè)計(jì)。在數(shù)據(jù)處理子系統(tǒng)中,關(guān)聯(lián)規(guī)則是通過(guò)數(shù)據(jù)采集子系統(tǒng)中的監(jiān)測(cè)數(shù)據(jù)建立的,監(jiān)測(cè)數(shù)據(jù)模塊在發(fā)電異常情況下,利用關(guān)聯(lián)規(guī)則生成實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)的實(shí)時(shí)規(guī)則,比較了先驗(yàn)原理和實(shí)時(shí)原理,實(shí)現(xiàn)了發(fā)電設(shè)備運(yùn)行狀態(tài)的自動(dòng)監(jiān)測(cè)和診斷。
為了改善發(fā)電系統(tǒng)裝備老化問(wèn)題而導(dǎo)致的設(shè)備發(fā)電異常情況,提出了基于大數(shù)據(jù)挖掘的發(fā)電系統(tǒng)異常數(shù)據(jù)識(shí)別系統(tǒng),系統(tǒng)硬件結(jié)構(gòu)如圖1 所示。
圖1 系統(tǒng)硬件結(jié)構(gòu)
由圖1 可知,系統(tǒng)硬件結(jié)構(gòu)是由數(shù)據(jù)采集子系統(tǒng)、數(shù)據(jù)處理子系統(tǒng)、數(shù)據(jù)存儲(chǔ)子系統(tǒng)、設(shè)備狀態(tài)顯示子系統(tǒng)組成的[3-4]。通過(guò)設(shè)備狀態(tài)顯示子系統(tǒng),可將其他子系統(tǒng)識(shí)別結(jié)果顯示在界面上,供工作人員查看[5-7]。
該子系統(tǒng)主要實(shí)現(xiàn)對(duì)數(shù)據(jù)的實(shí)時(shí)采集,即自動(dòng)從模擬和數(shù)字裝置(如傳感器等)進(jìn)行數(shù)據(jù)采集的過(guò)程。A/D 轉(zhuǎn)換器是數(shù)據(jù)采集系統(tǒng)中的一個(gè)關(guān)鍵部件,它主要用于把采集到的直流電壓轉(zhuǎn)換成數(shù)字?jǐn)?shù)據(jù),測(cè)量出的電壓可以與特定發(fā)電量、光照強(qiáng)度、溫度、濕度對(duì)應(yīng)[8-9]。A/D 轉(zhuǎn)換器主要有兩種類型:積分和非積分。積分法可以根據(jù)一定的時(shí)間間隔測(cè)量平均輸入值,因此可以抑制多種噪聲源,非積分法是在很短時(shí)間間隔采樣輸入瞬時(shí)值[10]。數(shù)據(jù)采集子系統(tǒng)結(jié)構(gòu)如圖2 所示。
圖2 數(shù)據(jù)采集子系統(tǒng)結(jié)構(gòu)
由圖2 可知,系統(tǒng)硬件結(jié)構(gòu)主要依據(jù)模塊化設(shè)計(jì)思路,包含發(fā)電量、光照強(qiáng)度、溫度、濕度數(shù)據(jù)接口,LCD顯示器及按鍵,RTC實(shí)時(shí)時(shí)鐘[11-12]。采 用LM12H458 高度集成數(shù)據(jù)采集芯片,將采樣結(jié)果與A/D 轉(zhuǎn)換集成結(jié)果存儲(chǔ)在同一芯片內(nèi),大大減少了外圍線路的連接[13]。LM12H458 是一個(gè)多功能數(shù)據(jù)采集系統(tǒng),內(nèi)部含有28 個(gè)16 bit的寄存器,其配置是采集系統(tǒng)的控制中心,可用于控制系統(tǒng)采集的啟動(dòng)和停止[14]。
數(shù)據(jù)處理子系統(tǒng)是利用計(jì)算機(jī)處理信號(hào)的系統(tǒng),采用數(shù)據(jù)處理系統(tǒng)對(duì)數(shù)據(jù)信息進(jìn)行處理、排序,計(jì)算各種分析指標(biāo),便于用戶接收、保存處理后的數(shù)據(jù)信息[15]。數(shù)據(jù)處理子系統(tǒng)的結(jié)構(gòu)如圖3 所示。
圖3 數(shù)據(jù)處理子系統(tǒng)結(jié)構(gòu)
由圖3 可知,該子系統(tǒng)負(fù)責(zé)對(duì)所收集的資料進(jìn)行實(shí)時(shí)處理,它旨在將數(shù)據(jù)采集系統(tǒng)中的“原始數(shù)據(jù)”轉(zhuǎn)化為“成熟數(shù)據(jù)”,即將采集的數(shù)據(jù)轉(zhuǎn)化為滿足上位機(jī)系統(tǒng)需要的、便于使用的數(shù)據(jù)結(jié)構(gòu),并且將數(shù)據(jù)存儲(chǔ)到實(shí)時(shí)數(shù)據(jù)表和歷史數(shù)據(jù)庫(kù)中[16]。在此基礎(chǔ)上,將上位機(jī)發(fā)出的控制指令通過(guò)數(shù)據(jù)處理分系統(tǒng)發(fā)送到相應(yīng)的控制器,完成對(duì)測(cè)控裝置的控制。SCADA 系統(tǒng)的數(shù)據(jù)核心是數(shù)據(jù)處理子系統(tǒng),同時(shí)要求系統(tǒng)具有高可靠性、實(shí)時(shí)性、魯棒性和較強(qiáng)的數(shù)據(jù)處理能力。
存儲(chǔ)器通過(guò)計(jì)算來(lái)處理數(shù)據(jù),其中主要包括CPU (輔助或三級(jí)存儲(chǔ)器)無(wú)法直接存取的存儲(chǔ)設(shè)備和介質(zhì),通常是比RAM 慢但非易失性的硬盤、光驅(qū)等設(shè)備。
使用半導(dǎo)體存儲(chǔ)芯片,如果字節(jié)長(zhǎng)為4 Byte,則使用半導(dǎo)體存儲(chǔ)芯片一次性讀取4 Byte,按字節(jié)尋址,總共1 000 個(gè)單元,每個(gè)單元1 Byte;按字尋址,總共256 個(gè)單元,每個(gè)單元4 Byte;按半字尋址,總共512 個(gè)單元,每個(gè)單元2 Byte;按雙字尋址,總共128個(gè)單元,每個(gè)單元8 Byte。主存塊調(diào)入系統(tǒng),與緩存塊建立對(duì)應(yīng)關(guān)系,使用標(biāo)記記錄與某緩存塊建立了對(duì)應(yīng)關(guān)系的主存塊號(hào),使用先訪問(wèn)Cache 再訪問(wèn)主存方式,無(wú)論命中還是不命中,耗時(shí)均較短。
發(fā)電機(jī)組發(fā)生故障時(shí),LED 看板能自動(dòng)接收和顯示外部控制器發(fā)送的數(shù)據(jù)信息。將參數(shù)讀取到計(jì)算機(jī)作為主站的外部設(shè)備,輸出到顯示設(shè)備。支持VGA 多達(dá)8 屏的分屏輸出,每屏可以單獨(dú)顯示不同數(shù)據(jù),互不影響。能顯示信息,如動(dòng)畫、圖形、圖表、文本值等。LED 看板數(shù)量不限。能獨(dú)立顯示不同字符、數(shù)字等信息,能對(duì)各種信息和數(shù)據(jù)進(jìn)行處理和顯示。
在系統(tǒng)硬件結(jié)構(gòu)支持下,設(shè)計(jì)系統(tǒng)軟件流程,如圖4 所示。在圖4 所示執(zhí)行流程支持下,設(shè)計(jì)異常數(shù)據(jù)詳細(xì)識(shí)別流程。
圖4 系統(tǒng)軟件流程
step1:光強(qiáng)采集模塊和溫度采集模塊分別用于數(shù)據(jù)處理子系統(tǒng)的發(fā)電量W、太陽(yáng)光強(qiáng)G、溫度T和濕度S采集模塊,用于發(fā)電設(shè)備的數(shù)據(jù)輸入;
step2:關(guān)聯(lián)規(guī)則提取模塊從step1 中提取數(shù)據(jù)作為先驗(yàn)數(shù)據(jù),利用先驗(yàn)數(shù)據(jù)構(gòu)造F1、F2、F3規(guī)則,再結(jié)合先驗(yàn)的F1、F2、F3規(guī)則生成先驗(yàn)的規(guī)則集F{F1,F2,F3},將其存儲(chǔ)在先驗(yàn)規(guī)則存儲(chǔ)模塊中。先驗(yàn)規(guī)則集是用apriori 算法構(gòu)建的,具體步驟如下:
1)關(guān)聯(lián)規(guī)則提取模塊提取正常情況下的發(fā)電量W、光強(qiáng)G、溫度T和濕度S,設(shè)置項(xiàng)目集D={D1,D2,…,Dn-1,Dn](n>2)輸入到數(shù)據(jù)處理子系統(tǒng)中,并確定項(xiàng)集集合D最小支持閾值,其中Di={Gi,Ti,Si,Wi} (0
2)依據(jù)1)中得到的最大項(xiàng)集產(chǎn)生的候選項(xiàng)集,需從集合D中確定項(xiàng)集支持度,并與最小支持度進(jìn)行對(duì)比分析,獲取最大項(xiàng)集;
3)循環(huán)處理上述內(nèi)容,直到不會(huì)出現(xiàn)新的項(xiàng)集為止;
4)通過(guò)上述得到最大項(xiàng)集的先驗(yàn)規(guī)則集F{F1,F2,F3}中,F(xiàn)1表示發(fā)電量W與光照強(qiáng)度G之間的關(guān)系、F2表示發(fā)電量W與溫度T之間的關(guān)系、F3表示發(fā)電量W與濕度S之間的關(guān)系。
step3:在發(fā)電系統(tǒng)中,一旦發(fā)現(xiàn)發(fā)電量異常,數(shù)據(jù)采集子系統(tǒng)將采集到的異常數(shù)據(jù)傳送到關(guān)聯(lián)規(guī)則提取庫(kù)中,通過(guò)step2 構(gòu)建新的實(shí)時(shí)規(guī)則集K{K1,K2,K3}。
對(duì)發(fā)電量異常的判別方法如下:設(shè)置發(fā)電量閾值U,提取step1 中構(gòu)造先驗(yàn)規(guī)則中的發(fā)電量W1,將其與發(fā)電系統(tǒng)實(shí)際運(yùn)行狀態(tài)時(shí)相同時(shí)間內(nèi)的發(fā)電量W2進(jìn)行對(duì)比分析。如果W1與W2之間差值小于閾值U,那么說(shuō)明發(fā)電系統(tǒng)正常;反之,則說(shuō)明發(fā)電系統(tǒng)異常運(yùn)行。
在系統(tǒng)Linux 集群環(huán)境下,包含4 臺(tái)虛擬服務(wù)器,各個(gè)服務(wù)器節(jié)點(diǎn)資源配置如表1 所示。
表1 集群虛擬服務(wù)器節(jié)點(diǎn)資源配置
整個(gè)集群包含了一個(gè)主節(jié)點(diǎn)和3 個(gè)子節(jié)點(diǎn),充分考慮節(jié)點(diǎn)分配負(fù)載,給節(jié)點(diǎn)設(shè)置較高的物理內(nèi)存。
該系統(tǒng)適合于光伏發(fā)電監(jiān)測(cè),為測(cè)試系統(tǒng)的功能,采集真實(shí)光伏監(jiān)測(cè)設(shè)備上載的感測(cè)數(shù)據(jù),包括設(shè)備上載的靜態(tài)和動(dòng)態(tài)數(shù)據(jù)、雷達(dá)探測(cè)的plot 數(shù)據(jù)、高清攝像機(jī)拍攝的目標(biāo)照片等。這些數(shù)據(jù)中,雷達(dá)波紋13 萬(wàn)像素、靜態(tài)波紋6 萬(wàn)像素、AIS 動(dòng)態(tài)波紋15 萬(wàn)像素。
對(duì)于多個(gè)預(yù)定義的異常行為,在實(shí)際場(chǎng)景中觀測(cè)到的目標(biāo)不能被全部觸發(fā),即在實(shí)際的數(shù)據(jù)集上不能進(jìn)行異常行為測(cè)試。然后,對(duì)實(shí)際傳感器數(shù)據(jù)進(jìn)行修正,如改變模擬場(chǎng)的異常和篡改行為,消除目標(biāo)軌跡中某些圖形的模擬沉默行為,構(gòu)造實(shí)驗(yàn)數(shù)據(jù)集等。
分析正常情況下發(fā)電系統(tǒng)異常數(shù)據(jù)更新頻率,如表2 所示。
表2 正常情況下發(fā)電系統(tǒng)異常數(shù)據(jù)更新頻率
在上述實(shí)際更新頻率情況下,分別使用基于紅外圖像的故障診斷方法、基于深度Q 網(wǎng)絡(luò)故障診斷方法和基于大數(shù)據(jù)挖掘異常數(shù)據(jù)識(shí)別系統(tǒng)識(shí)別異常數(shù)據(jù),識(shí)別結(jié)果精準(zhǔn)度對(duì)比分析如圖5 所示。
由圖5(a)可知,使用基于紅外圖像的故障診斷方法、基于深度Q 網(wǎng)絡(luò)故障診斷方法異常數(shù)據(jù)識(shí)別結(jié)果與實(shí)際數(shù)據(jù)相差較大,當(dāng)實(shí)驗(yàn)次數(shù)為7 次時(shí),故障狀態(tài)下的識(shí)別結(jié)果依次為120 bit和160 bit。而停止?fàn)顟B(tài)下的識(shí)別結(jié)果與實(shí)際數(shù)據(jù)也不一致。使用基于大數(shù)據(jù)挖掘異常數(shù)據(jù)識(shí)別系統(tǒng)故障狀態(tài)下的識(shí)別結(jié)果、停止?fàn)顟B(tài)下的識(shí)別結(jié)果均與實(shí)際數(shù)據(jù)一致,誤差為0。
由圖5(b)可知,3 種方法非周期內(nèi)異常數(shù)據(jù)識(shí)別結(jié)果一致,周期內(nèi)異常數(shù)據(jù)識(shí)別結(jié)果不一致。使用基于紅外圖像的故障診斷方法、基于深度Q 網(wǎng)絡(luò)故障診斷方法異常數(shù)據(jù)識(shí)別結(jié)果與實(shí)際結(jié)果不一致,而使用基于大數(shù)據(jù)挖掘異常數(shù)據(jù)識(shí)別系統(tǒng)異常數(shù)據(jù)識(shí)別結(jié)果與實(shí)際結(jié)果一致,只有在實(shí)驗(yàn)次數(shù)為1次時(shí),出現(xiàn)10 bit誤差。
圖5 不同方法異常數(shù)據(jù)識(shí)別結(jié)果精準(zhǔn)度對(duì)比分析
基于大數(shù)據(jù)挖掘的發(fā)電系統(tǒng)異常數(shù)據(jù)識(shí)別系統(tǒng)實(shí)現(xiàn)了發(fā)電設(shè)備運(yùn)行狀態(tài)的自動(dòng)監(jiān)測(cè)與診斷,降低了人力、物力成本,具有較高的實(shí)用性。將數(shù)據(jù)挖掘技術(shù)應(yīng)用于故障診斷與檢測(cè)中,能夠快速有效地檢測(cè)出故障源和故障原因,提高了電力系統(tǒng)故障診斷的效率。這種方法不僅可以對(duì)電池板電路故障進(jìn)行診斷,而且可以對(duì)電池板老化狀態(tài)下的低發(fā)電量異常進(jìn)行診斷,具有很強(qiáng)的實(shí)用性。