黎煒敏
(南方電網(wǎng)數(shù)字電網(wǎng)研究院有限公司,廣東廣州 510700)
智能電網(wǎng)終端大部分架構在智能通信設備中,用戶可以根據(jù)自身的需求在智能電網(wǎng)終端自主進行查詢與調節(jié),獲取相應的數(shù)據(jù)信息。智能電網(wǎng)終端不但能夠讓用戶查詢個人電網(wǎng)信息,還能提供自助服務,自行完成各項任務,但由于用戶的需求不同,偏好的項目也就不同。為準確分析電網(wǎng)用戶的基本需求,許多學者都研究了活躍用戶數(shù)量預測方法。
文獻[1]研究了基于數(shù)據(jù)挖掘的電網(wǎng)用戶行為分析方法,該方法主要采用主成分分析方法對負荷數(shù)據(jù)進行降維,采用聚類方法對數(shù)據(jù)聚類分析,分析了用戶不同類別的用電行為模式;文獻[2]研究了基于樸素貝葉斯的電網(wǎng)用戶行為分析方法,該方法采用模糊均值聚類方法對用電模式建模,然后提取出主要的用電模式。上述方法完成了用電模式的識別和分析,但是忽略了影響用戶數(shù)量的一些因素,導致預測終端活躍用戶時存在預測效果不佳的問題。
信任度計算是利用協(xié)同相似度算法,其能夠找出用戶之間的關聯(lián)性與親密度,得到用戶的瀏覽記錄,通過單一的用戶喜好來找到與其相似的活躍用戶,從而預測出具有相同喜好用戶的具體數(shù)量。為此,該文在信任度計算的基礎上對智能電網(wǎng)終端活躍用戶的數(shù)量進行預測,以獲取用戶最為關注的項目,為智能電網(wǎng)業(yè)務開展提供數(shù)據(jù)支撐。
在完成基于信任度計算的智能電網(wǎng)終端活躍用戶數(shù)量預測方法設計前,首先分析智能電網(wǎng)終端硬件結構,如圖1 所示。
圖1 智能電網(wǎng)終端硬件結構
智能電網(wǎng)終端的數(shù)據(jù)處理器芯片選用TMX320 C6472CZTZ,該芯片具有較強的采集能力,數(shù)據(jù)處理器外圍不需要擴展外圍電路,以此提高數(shù)據(jù)處理器的集成度和可靠性,簡化數(shù)據(jù)處理器采集數(shù)據(jù)操作次數(shù),數(shù)據(jù)處理器結構如圖2 所示。
圖2 數(shù)據(jù)處理器結構
由圖2 可知,數(shù)據(jù)處理器具有單獨的電源電路,可以采集智能電網(wǎng)終端中的活躍用戶數(shù)據(jù)和業(yè)務數(shù)據(jù),芯片引腳需要接8 Ω的電阻,數(shù)據(jù)處理器內部配置復位按鍵,可對評估系統(tǒng)進行下載調試,定時器與數(shù)據(jù)處理器互聯(lián)的USB連接線為雙層保護線,可以有效保護數(shù)據(jù)處理器與其他配件不受到破壞和干擾。
智能電網(wǎng)終端的微處理芯片采用SD公司最新開發(fā)的SD63C84 微處理芯片,其總線部分由8 Byte 的輸入/輸出接口和8 位的存儲器組成,控制單元由32 位的UART 接口和8 位的通用寄存器組成。同時微控制模塊中還具有單獨的微控制器,其可以控制微處理器對活躍用戶數(shù)據(jù)進行處理,保證活躍用戶數(shù)據(jù)的完整性和準確性。微處理器結構如圖3 所示。
圖3 微處理器結構
由圖3 可知,外圍電路和電源電路可以同時使用,以此提高智能電網(wǎng)終端的數(shù)據(jù)處理便捷性,微處理器芯片具有多個基礎寄存器,可保持微處理器的處理狀態(tài),其他多用途寄存器可存儲基礎變量,控制單元不與處理器總線直接連接,其可向智能電網(wǎng)終端發(fā)送讀、寫請求。
當某些用戶沒有在智能電網(wǎng)終端對話框上回復時,需將智能電網(wǎng)終端的系統(tǒng)設置為保存用戶瀏覽信息[3],首先將所有數(shù)據(jù)進行保密處理,然后向用戶發(fā)出短信調查。由于用戶之間的信任關系保持不變[4],假設發(fā)送短消息的數(shù)量為p,回答的數(shù)量為pu,用戶在系統(tǒng)中的活躍度可用公式表示為:
其中,Q代表用戶活躍度,n代表用戶總數(shù)量,u代表用戶,qu代表用戶有效通話次數(shù),q代表發(fā)送通話數(shù)量,T代表用戶活躍時長。
在信任網(wǎng)絡模型中,假設兩個用戶之間的信任度用C來表示,當信任度為整數(shù)時,證明兩者存在緊密的聯(lián)系,可記為C(u1,u2),而當C為零時,代表用戶不存在信任關系[5]。進行信任度計算之前,首先利用協(xié)同過濾算法對所有用戶進行篩選,統(tǒng)計出使用智能電網(wǎng)終端次數(shù)最多的用戶數(shù)量,在此基礎上歸一化處理[6],得到的信任度為:
式中,u′代表關聯(lián)用戶。為了準確地描述節(jié)點與用戶之間的信任度關系,將其繪制成網(wǎng)格圖,如圖4所示。
圖4 雙層社交網(wǎng)絡示意圖
就智能電網(wǎng)終端而言,只要用戶之間存在信任,那么在終端中就屬于同一個集合,兩者的關聯(lián)程度用權重表示,權重越高,與其相關的用戶數(shù)量越多[7]。若幾個用戶同時參與智能電網(wǎng)終端對話,就會存在相應的信任度。
將互聯(lián)網(wǎng)平臺用戶數(shù)量的預測方法映射到智能電網(wǎng)終端中可知,經(jīng)?;拥幕钴S用戶具有一定的引領性,會獲得部分其他用戶的信任[8],可信度較高。為了過濾出活躍用戶,設定一個嚴格的標準,公式為:
其中,A(u)代表互動頻繁的活躍用戶數(shù)量,E(u)代表相對專業(yè)的用戶數(shù)量,F(xiàn)(u)代表親密度較高的用戶,R(u)代表信任度較高的用戶,g代表過濾參數(shù)。其中,相對專業(yè)的用戶是具有代表性的活躍用戶,并且控制著信任度的評分[9],將每個項目的專業(yè)性評分進行統(tǒng)一處理。
考慮到用戶之間的信任度是單向不可逆的,如果用戶在智能電網(wǎng)終端進行操作,其信任用戶會根據(jù)終端推薦同步操作[10],這樣就可以成為活躍用戶,且互為信任度用戶,系統(tǒng)就會自動生成一個預測數(shù)量[11]。得到預測數(shù)值之后,用戶對終端項目使用最頻繁的概率公式為:
其中,Iu代表用戶喜好最多的項目值。
為了進一步提高智能電網(wǎng)終端活躍用戶數(shù)量的準確性,在信任度可控的情況下[12],建立一個完整的預測模型,獲取用戶之間的信任度后將其輸入模型之中,使兩者相互融合,完成活躍用戶數(shù)量預測。
基于相似度的關聯(lián),可以將所要調查的用戶分為相似與不相似兩類[13],而相似度可表示為:
式中,Str(A,N)代表直接相似度,Q與A代表具有相似度的兩個用戶,S。代表含有相似度的用戶數(shù)量,S1代表不具有相似度的數(shù)量,α代表權重因子,正常情況下,α=0.398 3。在用戶相似度處于穩(wěn)定時,權重的變化控制著信任度以及活躍度的變化[14],因此可預測出活躍用戶數(shù)量的權重。
在權重不變的情況下,形成一個相似度模型,當用戶收到終端發(fā)送的短信息時,系統(tǒng)就會根據(jù)回復速度來判斷是否為活躍用戶,然后進行記錄,保證不錯失每個用戶。當模型中兩個節(jié)點交叉生成的夾角θ不為零時,證明節(jié)點中存在相似度用戶,由此衍生出一個矩陣模型,前提是用戶自主選擇項目,并完成智能電網(wǎng)終端對話。
根據(jù)相似度模型中每個向量的平均分布來預測出用戶的喜好項目與活躍用戶的數(shù)量,然后分別從向量上的主要特征得到具體的數(shù)值,最后完成活躍用戶評分。節(jié)點的活躍程度代表了用戶的喜好程度,并且在矩陣中代表用戶的數(shù)量[15-16]?;谏鲜龅男湃侮P系,將最后的預測公式表示為:
其中,Nt代表待測用戶數(shù)量,xu,i代表用戶活躍度,pre(u,i)代表實際用戶使用率。至此完成智能電網(wǎng)終端活躍用戶數(shù)量的預測。
該實驗主要驗證提出的基于信任度計算的智能電網(wǎng)終端活躍用戶數(shù)量預測方法的有效性,并與文獻[1]基于數(shù)據(jù)挖掘的分析方法、文獻[2]基于樸素貝葉斯的分析方法進行對比,將某地區(qū)居民用戶的基本行為作為實驗數(shù)據(jù),對比三種方法的預測效果。
選取24小時作為用戶活躍度測試的實驗時長,將表1所示的用戶基本情況作為三種方法的輸入,通過三種方法得到不活躍用戶概率分布情況,并將三種方法與實際的不活躍用戶分析結果進行對比,結果如圖5所示。
圖5 不活躍用戶概率分布情況
通過圖5 可知,在2~8 h 之間活躍的用戶較少,該文預測方法獲得的結果與實際數(shù)量基本保持一致,在不活躍度概率分析上,較另兩種分析方法分析準確度更高。
三種預測方法的預測結果如圖6 所示。
圖6 活躍用戶錯誤估計情況
通過圖6 能夠看出,該文預測方法獲得的結果與實際數(shù)量基本保持一致,能夠較為準確地估計出活躍用戶,較另兩種預測方法估計誤差更小。
將三種預測方法與實際的用戶活躍情況進行對比,結果如圖7 所示。
圖7 智能電網(wǎng)終端日活躍用戶時序情況
該文預測方法能夠較為準確地預測出用戶活躍的時序變化情況,其他兩種預測方法與實際的時序有較大差距,分析準確性較差。
該文在信任度計算的基礎上,獲取智能電網(wǎng)終端用戶的喜好項目,預測出大致用戶數(shù)量,不但減少了后臺人員的負擔,還增加了智能電網(wǎng)的實用性。所提出的預測方法不但解決了智能電網(wǎng)終端活躍用戶預測效果較低的問題,還分析了信任用戶之間的數(shù)據(jù)關系,能夠準確、快速地完成活躍用戶數(shù)量的預測。