高宇豆,保 富,黃祖源,田 園,原 野
(云南電網(wǎng)有限責(zé)任公司信息中心,云南昆明 650214)
我國人口數(shù)量以及經(jīng)濟(jì)發(fā)展的壓力較大,能源消耗速度快、消耗量大。我國學(xué)者對節(jié)約電力用戶識別潛力的研究已經(jīng)從工業(yè)領(lǐng)域擴(kuò)展到經(jīng)濟(jì)領(lǐng)域和社會環(huán)境領(lǐng)域[1-2],在需求管理、市場開拓、客戶服務(wù)等方面取得了重大突破。文獻(xiàn)[3]在雙因素理論的基礎(chǔ)上,明確了電力服務(wù)對象。文獻(xiàn)[4]根據(jù)用戶聚類特點,進(jìn)行了節(jié)約電力潛力測試,得出識別效果良好的結(jié)論。
但是上述研究并未涉及電力用戶高斯核密度問題,節(jié)約電力潛力用戶識別穩(wěn)定性較差,對此,該文提出基于數(shù)據(jù)挖掘的節(jié)約電力潛力用戶智能識別方法,數(shù)據(jù)挖掘技術(shù)主要負(fù)責(zé)從大量數(shù)據(jù)中提取、聚類和分析數(shù)據(jù)信息,能夠?qū)⒂脩舴殖刹煌悇e的潛力對象,有助于業(yè)務(wù)人員縮小篩選范圍,有針對性地開展節(jié)約電力工作。
利用數(shù)據(jù)挖掘技術(shù),通過數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘以及數(shù)據(jù)檢驗等步驟,進(jìn)行節(jié)約電力潛力測算[5]。數(shù)據(jù)挖掘流程如圖1 所示。
圖1 中,數(shù)據(jù)挖掘流程包括數(shù)據(jù)清理、數(shù)據(jù)集成以及數(shù)據(jù)分類等具體步驟,以滿足用戶需求為目標(biāo),根據(jù)當(dāng)前的技術(shù)可行性、經(jīng)濟(jì)可行性與環(huán)??尚行裕?guī)則驗證所獲取到的數(shù)據(jù)[6],估算出節(jié)約電力的綜合潛力值。
需要對節(jié)約電力的潛在價值進(jìn)行分析,然后根據(jù)計算結(jié)果對能源消費結(jié)構(gòu)類型進(jìn)行劃分,步驟如下:
依照能源消費結(jié)構(gòu)的組成要素即煤、石油、天然氣數(shù)量,提取替代設(shè)備的轉(zhuǎn)化常數(shù),計算發(fā)電部分的比重,獲取現(xiàn)有設(shè)備的能源平均效率。節(jié)約電力潛力計算公式如下:
其中,R表示理論層面的節(jié)約電力潛力,E表示任意一種非電能的能源消耗量,c表示任意一種非電能的能源熱值,α表示用電設(shè)備與非用電設(shè)備的平均效率比值,D表示電能以千瓦·時為單位的能量轉(zhuǎn)化常數(shù)。根據(jù)消耗燃料的熱值與替代設(shè)備能效數(shù)值,進(jìn)行替代設(shè)備的燃料總消耗量測算,可行潛力計算公式如下:
其中,RT表示電能技術(shù)的可行潛力,A表示任意一種非用電設(shè)備的燃料使用量,B表示該種燃料的能源熱值,α1表示任意非用電設(shè)備的效率均值,α2表示用電設(shè)備的效率均值,D表示電能以千瓦·時為單位的能量轉(zhuǎn)化常數(shù)。默認(rèn)設(shè)備替代前與設(shè)備替代后的燃料使用量相同,則式(2)變成如下形式:
其中,L表示任意一種非電設(shè)備的電能容量,t表示該種非電設(shè)備的運行時長,完成了節(jié)約電力勢值的估算步驟,為智能辨識方法的設(shè)計提供了數(shù)據(jù)支持。
在電網(wǎng)中隨機(jī)選取一個目標(biāo)[7-11],利用鄰域中最近點和最遠(yuǎn)點之間的距離來判斷距離。將任意對象設(shè)為l,則表達(dá)公式如下:
其中,l表示是遠(yuǎn)離簇的任意一個對象,設(shè)定最近的相鄰對象的個數(shù)k=2,dmin與dmax分別表示空間內(nèi)距離樣本中心的最小距離與最大距離,具體如圖2所示。
圖2 中,在同一個空間內(nèi),任意對象l只存在兩個有效距離,即最大距離與最小距離。設(shè)定f為任意整數(shù),則對象l的離群因子表達(dá)公式如下:
其中,Ne表示電力用戶的用電情況樣本,F(xiàn)(l)表示對象l的離群因子,u表示電力用戶的數(shù)量,根據(jù)式(6),得出對象l的高斯核密度公式如下:
其中,Y(l)表示任意對象l的高斯核函數(shù),表示對象b與對象l之間的距離,Ne表示電力用戶的用電情況樣本,j表示Y(l)函數(shù)的縱向?qū)挾?,定義了函數(shù)的有效區(qū)間,當(dāng)上述參數(shù)滿足的條件時,則式(7)變成如下形式:
其中,Y表示對象b與對象l之間的高斯核密度,表示對象b與對象l之間的距離,j表示Y(l)函數(shù)的縱向?qū)挾?。至此,獲取電力用戶用電高斯核密度。
為了突出節(jié)約電力潛在用戶的特征[12-13],提取出所需的用戶信息[14]。根據(jù)用電負(fù)荷曲線,得出電力負(fù)荷的變化規(guī)律,具體如圖3 所示。
圖3 中,電力負(fù)荷變化可以劃分為四個階段,并且從(h1,p1)至(h4,p4)四個階段的增長幅度與增長速度都呈遞增趨勢。將潛力用戶的綜合評價特征進(jìn)行聚類,設(shè)定評價集合為并利用離散因子建立綜合評價的隸屬度矩陣Q,矩陣表達(dá)公式如下:
其中,qns表示對第n個評價因素的模糊權(quán)重,并且滿足s=1,2,…,n的條件,矩陣Q包含的集合Z的所有評價信息,當(dāng)n為任意整數(shù)時,矩陣Q結(jié)合權(quán)重向量,變成如下形式:
其中,代表權(quán)重向量,M表示隸屬度矩陣,定義了節(jié)約電力潛力用戶的綜合評價方式[15-16]。
為了驗證此次設(shè)計的智能識別算法的穩(wěn)定性,利用電力用戶的意向偏離度,獲取節(jié)約電力潛力用戶類型,用戶意向偏離度計算公式如下:
其中,Gp表示用戶意向的偏離度,Cp表示用戶p的用電負(fù)荷,Tpi表示用戶p的節(jié)約電力項目i的接受程度,CTi表示電力用戶中對節(jié)約電力項目i表示感興趣的用戶數(shù)量。根據(jù)式(11)的計算結(jié)果,劃分為10 組隨機(jī)攻擊類型、均值攻擊類型、流行攻擊類型、段推攻擊類型,其多次平均攻擊參數(shù)具體數(shù)值如表1所示。
表1 攻擊參數(shù)均值
將表1 中不同攻擊類型的數(shù)值的均值,代入攻擊概貌識別率的公式中,具體表達(dá)如下:
其中,H表示攻擊概貌的識別率,V表示攻擊概貌的總數(shù)量,P表示真實的攻擊概貌的數(shù)量。
基于上述攻擊類型指標(biāo),以文獻(xiàn)[3]方法和文獻(xiàn)[4]方法為現(xiàn)有識別方法1 和現(xiàn)有識別方法2,在不同的攻擊強(qiáng)度條件下,與該文智能識別方法對比得出實驗結(jié)果如圖4 所示。
圖4中,不同的攻擊強(qiáng)度條件下,兩種現(xiàn)有識別方法與設(shè)計的智能識別算法的測試穩(wěn)定性均值如表2所示。
從表2 可以看出,此次設(shè)計的用戶智能識別方法,比其他兩種現(xiàn)有識別方法的穩(wěn)定性均值高出12.326%~25.651%不等,證明在不同的攻擊強(qiáng)度下,融合了數(shù)據(jù)挖掘技術(shù)的智能識別方法穩(wěn)定性更高,可以合理分配資源,更有利于識別潛在用戶,更適合應(yīng)用在節(jié)約電力潛力用戶識別領(lǐng)域。
表2 識別算法穩(wěn)定性測試結(jié)果均值(%)
文中利用數(shù)據(jù)挖掘技術(shù)提取所需的用戶信息,估計節(jié)約電力的潛在價值,準(zhǔn)確有效地將未知屬性的數(shù)據(jù)樣本劃分為相應(yīng)的類型,構(gòu)造用戶隸屬度矩陣,設(shè)置與匹配智能識別模式,其應(yīng)用穩(wěn)定性均值比其他兩種現(xiàn)有識別方法高出12.326%~25.651%不等,為電力行業(yè)相關(guān)管理部門挖掘節(jié)約電力的潛在用戶,判斷節(jié)約電力市場的變化,制定相應(yīng)的節(jié)約電力決策提供一定的理論支持。