薛峪峰,田光欣,馬占海
(國網(wǎng)青海省電力公司信息通信公司,青海西寧 810008)
近年來,信息技術(shù)高速發(fā)展,電網(wǎng)建設(shè)越來越完善,電力信息資源越來越豐富,電力信息檢索的難度也隨之增大。電力公共信息是電力信息資源重要的組成部分,公共信息包含了大量電力數(shù)據(jù),公共信息檢索在調(diào)度、調(diào)控和運(yùn)行方面都面臨巨大的壓力,因此必須要研究有效的方法,完成電力信息資源信息化建設(shè)和運(yùn)行。
文獻(xiàn)[1]提出了基于互信息的改進(jìn)決策樹算法作為數(shù)據(jù)挖掘內(nèi)核,并提出適用于電力系統(tǒng)的并行處理架構(gòu),可實(shí)現(xiàn)多源數(shù)據(jù)的快速、有效的信息檢索,但是計算過程過于復(fù)雜,面對海量電力公共信息的可行性較低。文獻(xiàn)[2]設(shè)計了基于搜索引擎的供電信息資源多用戶調(diào)度管理平臺,該平臺能夠充分發(fā)揮數(shù)據(jù)信息的優(yōu)勢,根據(jù)用戶的需求設(shè)立搜索引擎,完成資源調(diào)度。數(shù)據(jù)平臺從門戶功能需求出發(fā),確定信息數(shù)據(jù)展示報表,建立三層架構(gòu),通過中間層完成查詢語言自定義,這種方法的檢索能力很強(qiáng),但是需要有強(qiáng)大的數(shù)據(jù)庫資源。向量空間模型VSM(Vector Space Model)作為一種統(tǒng)計模型,通過分析權(quán)重加以簡化,使計算過程變得更加簡單,且更易實(shí)現(xiàn),從而提高統(tǒng)計效率。該文針對VSM 進(jìn)行改進(jìn),設(shè)計了基于改進(jìn)VSM 的電力公共信息快速檢索系統(tǒng),并通過實(shí)驗(yàn)驗(yàn)證了系統(tǒng)的可行性。
基于改進(jìn)VSM 的電力公共信息快速檢索系統(tǒng)硬件結(jié)構(gòu)如圖1 所示。
圖1 電力公共信息快速檢索系統(tǒng)硬件結(jié)構(gòu)
觀察圖1 可知,該文設(shè)計的電力公共信息快速檢索系統(tǒng)硬件內(nèi)部安裝了主動控制器,內(nèi)部的冗余通信總線與DCS 冗余串口連接到一起,通信模塊與COM741 基座連接,確保通信信息的可靠性[3]。通信模塊連接四個接口,利用硬件跳線組成RS485 通信接口和RS232 通信接口,使不同的電動閥能夠順利連接控制[4-5]。常規(guī)信號與I/O 模塊順利連接,硬接線與通信點(diǎn)數(shù)之比為1∶15。
電力公共信息快速檢索終端如圖2 所示。
圖2 電力公共信息快速檢索終端
根據(jù)圖2 可知,電力檢索終端由CDMA Modem模塊、GPS 模塊、MCU 及電源四部分組成[6]。CDMA Modem 內(nèi)部的核心模塊使用的是Wavcom 公司生產(chǎn)的ME45,確保CDMA 模塊能夠順利通信,CDMA 模塊內(nèi)部的串口不僅能夠完成數(shù)據(jù)的控制和傳輸,同時也能完成信息傳輸。系統(tǒng)內(nèi)部的部分模擬電路能夠保證檢索系統(tǒng)完成通信,利用AT 命令對ME45 完成控制[7]。終端內(nèi)部的GPS 能夠接收外部的GPS 信號,并將計算得到的地理信息傳遞給MCU,通過C8051F020 八位微控制器完善終端,配合C 語言完成信息調(diào)試。
存儲器結(jié)構(gòu)如圖3 所示。
圖3 存儲器結(jié)構(gòu)圖
觀察圖3 可知,存儲器為分層結(jié)構(gòu),同時連接網(wǎng)絡(luò)接口、NAND 接口、RAM 接口、CAM,通過存儲接口和外接接口配合主機(jī)接口,完成各項(xiàng)邏輯的運(yùn)行。主機(jī)接口能夠完成信息平移,并對錯誤的信息進(jìn)行檢測和修正[8-9]。系統(tǒng)內(nèi)部具有壓縮和解壓縮功能,可以完成存儲器信息劃分管理。存儲器分別配備行解碼器和列解碼器,保證存儲器陣列得到順利運(yùn)行。
在識別器內(nèi)部設(shè)計了兩個硬件串口,能夠獨(dú)立產(chǎn)生波特率,識別器內(nèi)部的定時器與串口運(yùn)行不會產(chǎn)生沖突,因此使用過程更加靈活。GPS 和CDMA模塊通過固定的格式完成信息通信,并對數(shù)據(jù)進(jìn)行解析,完成信息封裝,識別器電路圖如圖4 所示。
圖4 識別器電路圖
根據(jù)圖4 可知,識別器電路內(nèi)部有一個CAPI 服務(wù)器,識別器電路內(nèi)部的128 字節(jié)FLASH 能夠存放各種不同的信息參數(shù),完成數(shù)據(jù)識別,并根據(jù)建立IP地址,確保數(shù)據(jù)的傳輸要求;識別器電路內(nèi)部的SRAM 共有4 kB,能夠很好地滿足組幀和數(shù)據(jù)緩沖要求,同時確保大程序量也能夠順利進(jìn)行。FLASH和SRAM 以組合的方式實(shí)現(xiàn)信息的加密和解密,使信息能夠在特定場合下完成使用。I/O 接口通過光電耦合器隔離拓展相應(yīng)的功能,系統(tǒng)內(nèi)部的移動設(shè)備使用低功耗器件,工作過程消耗的電壓僅為3.3 V,滿足了系統(tǒng)的節(jié)能要求[10-11]。識別器電路內(nèi)部的芯片為C8051F020 MCU 芯片,不需要重新擴(kuò)展串口,能夠很好地滿足信息的要求。
VSM 常用在記錄信息方面,具有良好的統(tǒng)計功能,通過向量的方法來表示文檔,表示公式為:
其中,w為系統(tǒng)內(nèi)部文檔,i表示特征項(xiàng)。通過各個不同的特征項(xiàng)占比分析各個方法的權(quán)重。VSM的統(tǒng)計效率高,能夠?qū)⑿畔⒓?,在存儲過程中不會造成信息丟失[12-13]。該文在傳統(tǒng)的VSM 基礎(chǔ)上進(jìn)行了改進(jìn),改進(jìn)原理如圖5 所示。
圖5 改進(jìn)原理
觀察圖5 可知,確定數(shù)據(jù)采集單元出現(xiàn)的電力數(shù)據(jù)信息,將采集到的電力數(shù)據(jù)信息進(jìn)行數(shù)據(jù)存儲和管理,通過數(shù)據(jù)挖掘、決策支持和OLAP 分析表示文檔,組成向量空間模型,完成VSM 改進(jìn)[14]。
在軟件操作過程中,對電力信息進(jìn)行預(yù)處理,提取關(guān)鍵信息,利用改進(jìn)的VSM 對信息進(jìn)行統(tǒng)計,判斷電力信息的初始權(quán)重,抽取公共電力信息,分析初始權(quán)重值,確定關(guān)鍵電力信息,將其組合并提取信息的特征項(xiàng),分析不同特征項(xiàng)的權(quán)重,并對電力信息進(jìn)行修改:
其中,wij表示特征W修改后的信息;fij表示信息出現(xiàn)的頻率;N表示信息的集成次數(shù);n表示信息數(shù)量;k表示組合權(quán)重;j表示修改次數(shù)。根據(jù)式(2)可知,如果電力信息出現(xiàn)的次數(shù)超過閾值,則為公共信息[15]。
將信息融合到一起,建立樣本集,以此為依據(jù)分析樣本數(shù)量,對樣本進(jìn)行決策,判斷所采集的信息與樣本的相似度,計算公式如下所示:
其中,X表示最大樣本閾值;Ci表示待檢測電力信息;Sip表示樣本信息[16];m表示待檢測電力信息總數(shù)。在分類過程中將信息確定為向量,確定得到信息的所屬類型,從而完成分類過程,根據(jù)分類結(jié)果進(jìn)行信息顯示,在顯示屏展示結(jié)果。
為了驗(yàn)證該文提出的基于改進(jìn)VSM 的電力公共信息快速檢索系統(tǒng)的有效性,設(shè)計對比實(shí)驗(yàn),選用的電力信息來自電力企業(yè)服務(wù)器2021 年12 月25 日8:00—12 月30 日16:50 的監(jiān)控記錄。同時配置硬件環(huán)境和軟件環(huán)境,具體配置條件:實(shí)驗(yàn)硬件環(huán)境由服務(wù)器硬件和客戶端硬件組成,服務(wù)器硬件的內(nèi)存為8 T;VPU 為5.0 G;硬盤為2 T??蛻舳擞布膬?nèi)存為4 T;VPU 為2.0 G;硬盤為1 T。軟件測試環(huán)境服務(wù)器語言環(huán)境為C++語言,客戶端通過M5瀏覽器瀏覽。
采集樣本點(diǎn)共有350 個,其中共有150 個公共信息點(diǎn),有45 個公共信息點(diǎn)以分散的方式分布,其他公共信息點(diǎn)以連續(xù)的方式分布。對電力信息的時間序列模型進(jìn)行預(yù)測,計算基線和閾值,確定基線置信度為95%。
考慮到基于搜索引擎的供電信息資源多用戶調(diào)度管理平臺僅側(cè)重于信息調(diào)度,因此在檢索性能方面僅采用該文提出的基于改進(jìn)VSM 的電力公共信息快速檢索系統(tǒng)和基于改進(jìn)決策樹的配電網(wǎng)多源數(shù)據(jù)快速檢索系統(tǒng)進(jìn)行對比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如圖6 所示。
圖6 檢索實(shí)驗(yàn)結(jié)果
根據(jù)圖6 可知,基于改進(jìn)決策樹的配電網(wǎng)多源數(shù)據(jù)快速檢索系統(tǒng)得到的線條與觀測線基本吻合,能夠準(zhǔn)確地檢索出觀測線中存在的電力公共信息,尤其在檢索分散的公共信息時,能夠?qū)崟r響應(yīng),具有很強(qiáng)的響應(yīng)能力。但是在檢索過程中出現(xiàn)了誤報情況,將處于閾值范圍內(nèi)的電力信息誤判為公共信息,對于集中信息點(diǎn),檢測能力較差,同時還出現(xiàn)了多次誤判的情況。雖然基于改進(jìn)VSM 的電力公共信息快速檢索系統(tǒng)與正常的電力信息預(yù)測結(jié)果之間有一定的弱化,但基于改進(jìn)VSM 的電力公共信息快速檢索系統(tǒng)與對比檢索系統(tǒng)相比更加平滑,表明該文設(shè)計系統(tǒng)可以降低CPU 負(fù)荷的波動。且基于改進(jìn)VSM的電力公共信息快速檢索系統(tǒng)與對比檢索系統(tǒng)相比,與正常的電力信息預(yù)測結(jié)果更加接近。綜上可知,該文設(shè)計的檢索系統(tǒng)在檢測率方面能夠及時檢測出多個公共信息點(diǎn),并沒有出現(xiàn)誤判,證明該文設(shè)計的檢索系統(tǒng)具有很強(qiáng)的魯棒性和可靠性,能夠降低檢測失誤概率。
分別選取基于改進(jìn)決策樹的配電網(wǎng)多源數(shù)據(jù)快速檢索系統(tǒng)、基于搜索引擎的供電信息資源多用戶調(diào)度管理平臺以及該文系統(tǒng)進(jìn)行響應(yīng)時間測試,實(shí)驗(yàn)結(jié)果如表1 所示。
表1 響應(yīng)時間實(shí)驗(yàn)結(jié)果
根據(jù)表1 可知,該文系統(tǒng)對于公共信息的響應(yīng)時間僅在第4 次實(shí)驗(yàn)時超過2 s,雖然受到環(huán)境的限制,但是整體響應(yīng)時間滿足了實(shí)際需求。而對比的檢索系統(tǒng)在檢索過程中響應(yīng)時間相對該文系統(tǒng)更長,導(dǎo)致電力系統(tǒng)運(yùn)行過程等待時間過久,但是整體響應(yīng)時間較平均,系統(tǒng)受環(huán)境限制影響較小。
綜上所述,該文提出的基于改進(jìn)VSM 的電力公共信息快速檢索系統(tǒng)應(yīng)用后,有助于各企業(yè)探索政企合作的多種模式,發(fā)揮互聯(lián)網(wǎng)在電力公共信息服務(wù)領(lǐng)域的優(yōu)勢,合理界定政企部門在電力公共信息服務(wù)領(lǐng)域的邊界,推動供電服務(wù)轉(zhuǎn)型。
為了更好地實(shí)現(xiàn)電力公共信息檢索,該文通過改進(jìn)向量空間模型,設(shè)計電力公共信息快速檢索系統(tǒng),在設(shè)計過程中對硬件和軟件進(jìn)行了優(yōu)化,同時更新檢索終端、存儲器和檢索器,利用改進(jìn)的向量空間模型將電力信息轉(zhuǎn)換成分類信息文本,并與閾值對比,確定需要檢索的電力公共信息。實(shí)驗(yàn)結(jié)果表明,該文設(shè)計的系統(tǒng)能夠很好地完成信息檢索。但是在進(jìn)行信息分析時,只能通過相似度比較確定信息是否為公共信息,這樣的檢索方式局限性較強(qiáng),因此未來需要進(jìn)一步深入研究這一問題。