茍吉偉,敖 榜
(深圳供電局有限公司,廣東 深圳 518000)
目前,我國各個生產(chǎn)制造類企業(yè)中都涉及數(shù)據(jù)挖掘技術。數(shù)據(jù)挖掘技術是互聯(lián)網(wǎng)技術下衍生的一種大數(shù)據(jù)技術,能有效對龐大數(shù)據(jù)群體進行管理、分析、分類及匯總,并結合互聯(lián)網(wǎng)管理技術對有用數(shù)據(jù)進行篩選和羅列[1]。電力調度自動化系統(tǒng)中運用大數(shù)據(jù)挖掘技術,將會對電力事業(yè)產(chǎn)生深遠影響。目前,我國正處于經(jīng)濟轉型過渡期,很多傳統(tǒng)企業(yè)急需要改變產(chǎn)業(yè)結構,深化內(nèi)部控制。電力企業(yè)應用數(shù)據(jù)挖掘技術,將進一步推動企業(yè)向現(xiàn)代化生產(chǎn)過渡,提升企業(yè)競爭優(yōu)勢。相關數(shù)據(jù)挖掘技術也將結合企業(yè)發(fā)展特性做出相關調整與改進,以加快我國經(jīng)濟建設。
進入21世紀后,世界進入高速互聯(lián)網(wǎng)時代,信息技術得到空前發(fā)展,而基于互聯(lián)網(wǎng)下的大數(shù)據(jù)技術也成為了當下發(fā)展的焦點。目前,全世界的數(shù)據(jù)庫已達到了一個龐大規(guī)模,各類信息匯聚在互聯(lián)網(wǎng)下,給人們提供了豐富的信息資源。但是這些數(shù)據(jù)龐大且種類繁多,很難進一步找到需要的內(nèi)容,由此出現(xiàn)了大數(shù)據(jù)挖掘技術。大數(shù)據(jù)挖掘技術的出現(xiàn)就是對龐大的數(shù)據(jù)群體進行合理過濾、篩選,然后從中找到有利的信息資源。這種數(shù)據(jù)挖掘技術是指利用有效的手段或者搜集渠道,對現(xiàn)有大數(shù)據(jù)信息進行信息資源與模型的匹配區(qū)分。利用這種匹配區(qū)分將這類具有價值的信息資源搜集,并作為企業(yè)決策的重要依據(jù)[2]。隨著互聯(lián)網(wǎng)技術的不斷發(fā)展,數(shù)據(jù)挖掘技術已形成了一定特點。近年來,出現(xiàn)了很多不同類型的挖掘技術,將龐大的數(shù)據(jù)群體做了進一步細分。
電力系統(tǒng)下的挖掘技術也指數(shù)據(jù)開挖技術。數(shù)據(jù)開挖技術具有如下特點。
(1)實用性。面對現(xiàn)有信息互聯(lián)網(wǎng)下龐大的數(shù)據(jù)信息群體,挖掘技術也在不斷創(chuàng)新和完善?,F(xiàn)在的挖掘技術迎合了時代發(fā)展,對相關數(shù)據(jù)的收集變得越來越快,相關反饋效果也更加及時、有效,給企業(yè)或者團體提供了重要信息參考依據(jù)。
(2)數(shù)據(jù)量龐大?;诨ヂ?lián)網(wǎng)資源下的數(shù)據(jù),正在高速增長,隨著5G等通信網(wǎng)絡的布置,信息數(shù)據(jù)量還會進一步高速增長。
(3)應用性。數(shù)據(jù)挖掘技術的出現(xiàn)主要是源于人們對信息資源龐大的需求,而數(shù)據(jù)挖掘也就成了人們的實際應用需求。該技術將對數(shù)據(jù)進行相關挖掘篩選,再過濾,然后應用于現(xiàn)實生活中,完成實際項目的決策[3]。
(4)動態(tài)性。大數(shù)據(jù)下的信息資源并不是穩(wěn)定不變的,而是隨著時代發(fā)展不斷增加、改變。因此,數(shù)據(jù)挖掘結果具有時間屬性。隨著時間的推移,數(shù)據(jù)挖掘結果涉及的相關數(shù)據(jù)將發(fā)生改變,需及時更新數(shù)據(jù)。
(5)集合性。目前,對于數(shù)據(jù)挖掘的算法以及相關建模的手段有很多,如專家系統(tǒng)、人工智能以及分析統(tǒng)計等。它們在對數(shù)據(jù)做相關收集時,并不是通過單一數(shù)據(jù)進行相關檢索,而是通過多種集合方式實現(xiàn)功能化的應用。
(6)具有價值意義。對大數(shù)據(jù)信息的挖掘是具有價值意義的。為促進企業(yè)發(fā)展,需合理挖掘信息數(shù)據(jù)。
為使電力調度自動化化系統(tǒng)實現(xiàn)數(shù)據(jù)挖掘技術對生產(chǎn)帶來效益,需對挖掘技術進行相關分析。結合數(shù)據(jù)對電力系統(tǒng)的作用,做好相關必要性措施。目前,從挖掘技術實際應用特點來對挖掘技術分析方法進行分析。
龐大的數(shù)據(jù)信息雖然種類繁多、復雜,甚至很多沒有任何參考意義,但是數(shù)據(jù)信息存在于互聯(lián)網(wǎng)下必然會與相關事物存在密不可分的聯(lián)系。當某一些事件一旦發(fā)生,相聯(lián)系的事件也必將出現(xiàn)一定反應。這種反應也就是信息數(shù)據(jù)間存在的關聯(lián)屬性?;诖?,對于數(shù)據(jù)挖掘需求,關聯(lián)分析就是通過對事物與事物間存在的某種依賴或者關聯(lián)信息來找尋事物本身存在的聯(lián)系規(guī)矩,從而又利用這種規(guī)矩來對信息數(shù)據(jù)進行相關挖掘[4]。目前,關聯(lián)分析法在數(shù)據(jù)挖掘中具有重要應用價值,能快速找到相關信息數(shù)據(jù)。
聚類分析法指將物理或抽象對象的集合分組為由類似的對象組成的多個類的分析過程。聚類分析法是利用相似方法來對信息數(shù)據(jù)進行相關收集活動,以找到有價值的數(shù)據(jù)信息。此外,還要進行劃分和提取,以滿足不同類別人群的實際需求。聚類分析常常涉及心理學、醫(yī)學及市場銷售等[5]。
問題預測的兩種表現(xiàn)形式可分為分類與數(shù)值預測兩種。分類就是預測分類,可利用連續(xù)值函數(shù)模型表現(xiàn)現(xiàn)有已知訓練數(shù)據(jù)集合的特征,以實現(xiàn)各類別描述的內(nèi)容,并由此找到用戶需要的信息資源。預測分類法也是監(jiān)督學習的一個過程,它能依據(jù)訓練數(shù)據(jù)來精準表達和劃分有價值的信息數(shù)據(jù)。
人工神經(jīng)網(wǎng)絡法依賴于計算機網(wǎng)絡系統(tǒng)。人工神經(jīng)網(wǎng)絡法普遍應用于計算機以及計算機網(wǎng)絡環(huán)境中,處理的數(shù)據(jù)群體都比較龐大,且處理速度比較快。它可將大批量相關數(shù)據(jù)進行提取過濾,并篩選出有價值的數(shù)據(jù)。由于人工神經(jīng)網(wǎng)絡法的技術層面高,所以具有的價值也更大。人工神經(jīng)網(wǎng)絡法通過建立有效的數(shù)學模型,將對關聯(lián)信息資源或者數(shù)據(jù)引入到數(shù)據(jù)建模中,從而進行相關數(shù)據(jù)分析[6]。目前,常用的人工神經(jīng)網(wǎng)絡有RBF神經(jīng)網(wǎng)絡和BP神經(jīng)網(wǎng)絡。
整個過程都建立了科學性參考,并以此來提升研究價值。整個研究將圍繞周期性關聯(lián)規(guī)則挖掘算法,從而創(chuàng)立基于周期性關聯(lián)規(guī)則的數(shù)據(jù)挖掘分析系統(tǒng)。整個系統(tǒng)的創(chuàng)建過程具體如下。
(1)選擇開發(fā)平臺。開發(fā)平臺的選擇需結合相關電力調度系統(tǒng)功能屬性??蛇x擇微軟旗下的NET平臺作為整個系統(tǒng)的大平臺。這是因為它能很好地適應電力系統(tǒng)的工作環(huán)境,具備強大的數(shù)據(jù)庫訪問能力。此外,它具有豐富的擴展接口,可滿足整個系統(tǒng)的需求。
(2)數(shù)據(jù)橋下的數(shù)據(jù)集成模塊設計。目前,我國電力企業(yè)內(nèi)部環(huán)境比較雜亂,很多相關標準并不統(tǒng)一,所以綜合考慮各方原因決定采用數(shù)據(jù)集成方法。同時,將采用數(shù)據(jù)清洗策略,以完成不完整數(shù)據(jù)、重復數(shù)據(jù)以及錯誤數(shù)據(jù)的清洗工作。數(shù)據(jù)內(nèi)容清洗中,除重復數(shù)據(jù)不需要清洗外,其余相關數(shù)據(jù)都需要利用修補值跟默認值的方式來清洗。例如,如果數(shù)據(jù)出現(xiàn)不完整,就采用補“0”或者“補null”默認值的方法來清洗。此外,無類型文件數(shù)據(jù)集成、數(shù)據(jù)庫相關數(shù)據(jù)集成以及異構數(shù)據(jù)集成也是重要過程。
(3)數(shù)據(jù)管理模塊設計。該設計根據(jù)實際要求出發(fā),可采用SQLSERVER數(shù)據(jù)庫系統(tǒng),并將數(shù)據(jù)庫管理分類為層次建模、數(shù)據(jù)表管理及數(shù)據(jù)表導出。數(shù)據(jù)表管理中含有數(shù)據(jù)管理、結構管理以及刪除等功能,導出過程涉及access文件與excel文件等。
(4)數(shù)據(jù)分析功能模塊設計。整個模塊將由周期數(shù)據(jù)分析、數(shù)據(jù)預警分析關聯(lián)分析以及數(shù)據(jù)周期性分析四個功能構成。主要涉及內(nèi)容為同期數(shù)據(jù)分析模塊設計。此模塊的組成由負荷數(shù)據(jù)、網(wǎng)損失數(shù)據(jù)及有功總數(shù)據(jù)組成。相關分析流程可表示為:輸入所有對比條件、合法、根據(jù)條件生成SQL語錄、顯示查詢結果及打印對比圖像等。
隨著時代的發(fā)展與進步,我國各個領域都在積極創(chuàng)新。很多企業(yè)應用了大數(shù)據(jù)挖掘技術,以提升企業(yè)競爭力。電力調度自動化系統(tǒng)中應用挖掘技術必將推動我國電力企業(yè)不斷發(fā)展。