• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      電網(wǎng)數(shù)據(jù)可信性度量模型研究

      2017-04-21 01:49:23程曉榮李天琦
      關(guān)鍵詞:可信性數(shù)據(jù)源信任

      程曉榮,李天琦

      (1.華北電力大學(xué) 控制與計(jì)算機(jī)工程學(xué)院, 河北 保定 071003)

      電網(wǎng)數(shù)據(jù)可信性度量模型研究

      程曉榮,李天琦

      (1.華北電力大學(xué) 控制與計(jì)算機(jī)工程學(xué)院, 河北 保定 071003)

      針對電力系統(tǒng)中不可信數(shù)據(jù)將導(dǎo)致電力系統(tǒng)狀態(tài)估計(jì)結(jié)果的準(zhǔn)確性降低,分析了電網(wǎng)中數(shù)據(jù)的可信性需求,研究了電力系統(tǒng)不良數(shù)據(jù)的辨識和數(shù)據(jù)可信分析理論,構(gòu)建了層次化、動態(tài)化的電網(wǎng)數(shù)據(jù)可信分析模型。該模型引入時(shí)間因子、懲罰因子等權(quán)重參數(shù),將電力數(shù)據(jù)的可信性分析問題歸結(jié)為數(shù)據(jù)源、數(shù)據(jù)源之間及數(shù)據(jù)傳播網(wǎng)絡(luò)路徑的組合問題,即通過計(jì)算數(shù)據(jù)源之間的可信度、數(shù)據(jù)源的可信度、數(shù)據(jù)的可信度,動態(tài)地構(gòu)建了基于數(shù)據(jù)源依賴關(guān)系的可信虛擬網(wǎng)絡(luò),最后通過所構(gòu)建的可信虛擬網(wǎng)絡(luò)來評估出電力數(shù)據(jù)的可信度。仿真實(shí)驗(yàn)結(jié)果表明,該模型能較好地滿足電網(wǎng)數(shù)據(jù)的可信性評估需求,為可信性評估方法進(jìn)一步研究提供了解決思路。

      電網(wǎng)數(shù)據(jù);大數(shù)據(jù);可信度;動態(tài)性;可信計(jì)算

      0 引 言

      目前,在智能電網(wǎng)系統(tǒng)中,大數(shù)據(jù)貫穿于發(fā)電、輸電、變電、配電、用電、調(diào)度等電力生產(chǎn)及管理的各個(gè)環(huán)節(jié)[1],與此同時(shí),電力系統(tǒng)發(fā)展速度越來越快,網(wǎng)絡(luò)的結(jié)構(gòu)、運(yùn)行模式也變得越來越復(fù)雜。電力大數(shù)據(jù)具有典型的“3V”和“3E”特征,即:體量大(Volume)、速度快(Velocity)、類型多(Variety)和數(shù)據(jù)即能量(Energy)、數(shù)據(jù)即交互(Exchange)、數(shù)據(jù)即共情(Empathy),同時(shí)從特征中不難發(fā)現(xiàn)電力數(shù)據(jù)的典型“HDC”屬性,即數(shù)據(jù)的異構(gòu)性(Heterogeneous)、動態(tài)的數(shù)據(jù)體系(Dynamic)、數(shù)據(jù)的復(fù)雜性(Complexity)。因此,在電力數(shù)據(jù)集合中必然充斥著大量不可信的數(shù)據(jù)[2],這些不可信數(shù)據(jù)的存在會造成電力系統(tǒng)狀態(tài)估計(jì)的失敗,影響調(diào)度員做出錯(cuò)誤的決策,進(jìn)而影響智能電網(wǎng)系統(tǒng)的正常運(yùn)行,甚至可能威脅整個(gè)電力系統(tǒng)的安全[3,4]。如果能及時(shí)對原始數(shù)據(jù)進(jìn)行可信度的評估,那么就會有效降低風(fēng)險(xiǎn),提高電力數(shù)據(jù)的可信性。

      電力系統(tǒng)不良數(shù)據(jù)辨識方法一般以加權(quán)最小二乘狀態(tài)估計(jì)方法為基礎(chǔ),包括非二次準(zhǔn)則法、殘差搜索法、零殘差法、估計(jì)辨識法等,這些方法首先假設(shè)測量誤差服從正態(tài)分布,然后基于假設(shè)檢驗(yàn)的方法依據(jù)殘差來辨識不良量測數(shù)據(jù)。文獻(xiàn)[5,6]提出的這些方法容易出現(xiàn)殘差污染和殘差掩沒現(xiàn)象,從而造成漏檢或誤檢,影響辨識的效果。文獻(xiàn)[7]運(yùn)用基于Spark的并行K-means聚類算法提取出日負(fù)荷特征曲線,分別對輸電網(wǎng)狀態(tài)估計(jì)中的不良數(shù)據(jù)進(jìn)行檢測和辨識。文獻(xiàn)[8]引入基于貝葉斯數(shù)據(jù)處理策略的擴(kuò)展卡爾曼濾波算法進(jìn)行不良數(shù)據(jù)動態(tài)檢測。文獻(xiàn)[9]利用PMU采集的電壓、電流相量,與新息差向量配合使用,提出了使用基爾霍夫電壓定律辨識不良數(shù)據(jù)的方法。基于神經(jīng)網(wǎng)絡(luò)的算法由于閾值選取帶有很大的主觀性和經(jīng)驗(yàn)性,使得實(shí)際應(yīng)用比較困難,基于模糊理論和聚類分析的算法要求人為的確定隸屬度的大小,帶有一定的主觀性,基于GSA的算法由于算法本身比較復(fù)雜,而且要考慮參考分布,當(dāng)量測數(shù)據(jù)量比較大時(shí),計(jì)算量很大,計(jì)算速度會受到影響。若將可信度評估理論應(yīng)用到不良數(shù)據(jù)辨識中,進(jìn)行定量分析,這樣就會使得不良數(shù)據(jù)辨識更加準(zhǔn)確。

      目前,數(shù)據(jù)的可信度分析與評估方法主要分為兩大類,主觀信任分析和客觀信任分析,但均不太適應(yīng)具有“3V”特征的電力數(shù)據(jù)可信性研究。主觀信任分析是基于信念的,一種認(rèn)知現(xiàn)象,是對信任客體的特定特征或行為的特定級別的主觀判斷,這種判斷相對獨(dú)立于主體的特征和行為具有模糊性、不確定性,無法精確地描述、驗(yàn)證和推理,文獻(xiàn)[10-12]提出了基于概率論、模糊集合理論、云理論等不同的主觀信任評估方法。客觀信任分析主要是基于證據(jù)理論的,通過證據(jù)來定義兩者之間的信任關(guān)系,進(jìn)行描述、驗(yàn)證和推理,文獻(xiàn)[13-16]采用D-S證據(jù)理論進(jìn)行可信度計(jì)算。它比主觀信任分析更加合理,但并沒有考慮時(shí)效性及惡意推薦所帶來的影響,缺少靈活性。

      本文在研究電力系統(tǒng)不良數(shù)據(jù)的辨識和傳統(tǒng)數(shù)據(jù)可信分析理論基礎(chǔ)上,為滿足人們對智能電網(wǎng)中的數(shù)據(jù)可信性和系統(tǒng)運(yùn)行可靠性的要求,創(chuàng)新性提出了面向智能電網(wǎng)的數(shù)據(jù)可信性評估模型,給出了一種基于數(shù)據(jù)源依賴關(guān)系的動態(tài)化、層次化可信虛擬網(wǎng)絡(luò)的構(gòu)建方法。

      1 電網(wǎng)數(shù)據(jù)的可信分析模型

      傳統(tǒng)的數(shù)據(jù)可信評估和不良數(shù)據(jù)辨識的方法雖然在處理小規(guī)模數(shù)據(jù)可信問題時(shí)表現(xiàn)出了良好的性能,但是,這些算法均假設(shè)所有數(shù)據(jù)一次性裝入內(nèi)存中,顯然無法處理電力大數(shù)據(jù),這些方法可處理的數(shù)據(jù)規(guī)模和時(shí)效均受到硬件的嚴(yán)重制約。針對電力大數(shù)據(jù)典型特征和“HDC”屬性,本文給出了一種動態(tài)構(gòu)建電網(wǎng)數(shù)據(jù)可信性度量的模型。本方法采用分布式處理方法,運(yùn)行在大數(shù)據(jù)平臺上,能有效利用軟硬件資源、處理海量增長的電力數(shù)據(jù)。該模型主要分三部分:數(shù)據(jù)源之間的可信度量模型、數(shù)據(jù)源可信度量模型、數(shù)據(jù)可信度量模型。數(shù)據(jù)源之間的可信度受數(shù)據(jù)源的可信度制約,數(shù)據(jù)源的可信度受數(shù)據(jù)的可信度和數(shù)據(jù)源之間的可信度雙重制約,數(shù)據(jù)的可信度受數(shù)據(jù)源的可信度和數(shù)據(jù)源之間的可信度雙重制約,它們之間相互關(guān)聯(lián)、相互制約,構(gòu)成一個(gè)整體。其關(guān)聯(lián)關(guān)系如圖1所示。

      圖1 數(shù)據(jù)源間、數(shù)據(jù)、數(shù)據(jù)源的可信度模型關(guān)聯(lián)關(guān)系Fig.1 The correlation of the credibility model of between data sources, data, data source

      1.1 相關(guān)概念

      為便于理解,給出本文所提方法的相關(guān)定義,來闡述電網(wǎng)數(shù)據(jù)可信性分析方面的基本問題。

      數(shù)據(jù)源:是指在電網(wǎng)大數(shù)據(jù)環(huán)境下,數(shù)據(jù)的提供者。

      數(shù)據(jù):是指由多個(gè)屬性特征構(gòu)成。符號記作:data={d1,d2,d3,… ,dn},其中,di是指數(shù)據(jù)的第i個(gè)屬性。

      可信虛擬網(wǎng)絡(luò):是指通過計(jì)算數(shù)據(jù)源之間的可信度而建立的虛擬網(wǎng)絡(luò),網(wǎng)絡(luò)中每個(gè)節(jié)點(diǎn)相當(dāng)于一個(gè)相應(yīng)的設(shè)備(數(shù)據(jù)源),網(wǎng)絡(luò)之間的鏈接是指數(shù)據(jù)源之間的可信度值超過一定的閾值而建立的,與具體互聯(lián)設(shè)備構(gòu)成的網(wǎng)絡(luò)有所區(qū)別。

      根據(jù)前述對電力數(shù)據(jù)可信性分析的相關(guān)描述,在對電力數(shù)據(jù)進(jìn)行可信度計(jì)算時(shí),本文給出一種動態(tài)的可信性分析網(wǎng)絡(luò)模型,該模型由層次化的可信虛擬網(wǎng)絡(luò)結(jié)構(gòu)組成。在初始時(shí)刻,該虛擬網(wǎng)絡(luò)由分散的數(shù)據(jù)源或?qū)<医?jīng)驗(yàn)預(yù)先得到的數(shù)據(jù)源構(gòu)成,且網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)是動態(tài)變化的;然后,在計(jì)算數(shù)據(jù)源之間的關(guān)聯(lián)可信度時(shí),構(gòu)建了該模型的可信性分析網(wǎng)絡(luò);最后,基于該可信性網(wǎng)絡(luò)分析模型,進(jìn)行數(shù)據(jù)的可信性度量,具體過程如下文所述。

      1.2 數(shù)據(jù)源之間的可信性度量模型

      在電網(wǎng)可信度計(jì)算過程中,當(dāng)兩個(gè)數(shù)據(jù)源之間有直接的上下文交互或者它們之間所提供的數(shù)據(jù)或行為的相似度超過一定的閾值時(shí),這時(shí)兩個(gè)數(shù)據(jù)源之間建立有向鏈路,隨著網(wǎng)絡(luò)規(guī)模的擴(kuò)大,可信虛擬網(wǎng)絡(luò)越來越趨于穩(wěn)定。如果發(fā)現(xiàn)某個(gè)數(shù)據(jù)源提供的數(shù)據(jù)不可信,該模型能很快的對其提供者(數(shù)據(jù)源)賦以懲罰系數(shù),使得其提供者在一段時(shí)間內(nèi)的可信度降低;但是隨著時(shí)間的推移,如果數(shù)據(jù)源能繼續(xù)提供可靠的數(shù)據(jù),那么它的可信度也將會緩慢恢復(fù)。在可信性分析網(wǎng)絡(luò)中,如果數(shù)據(jù)源之間在一個(gè)計(jì)算間隔內(nèi)沒有新的上下文直接交互,那么就對其施加一個(gè)時(shí)間懲罰。

      定義1 數(shù)據(jù)源間的可信度:設(shè)TrustA(B,t)表示在t時(shí)刻時(shí),本地?cái)?shù)據(jù)源A對目的數(shù)據(jù)源B的綜合可信度,由數(shù)據(jù)源之間的本地可信度與全局可信度組合而成,其計(jì)算公式為

      (1)

      式中:α1+β1=1。

      定義2 本地可信度:當(dāng)兩個(gè)數(shù)據(jù)源之間有直接的上下文交互或者兩個(gè)數(shù)據(jù)源之間所提供的數(shù)據(jù)或行為的相似度超過一定的閾值時(shí),稱此時(shí)的數(shù)據(jù)源之間具有本地可信度。設(shè)LocalTrustA(B,t)表示在t時(shí)刻時(shí),本地?cái)?shù)據(jù)源A對目的數(shù)據(jù)源B的本地可信度,它是由數(shù)據(jù)源之間直接進(jìn)行上下文交互的可信度與兩個(gè)數(shù)據(jù)源之間的相似度(相似度也可以指相互的認(rèn)可度)組合而成,其計(jì)算公式為

      (2)

      式中:

      (a) 初始值為一個(gè)隨機(jī)數(shù)或0,表示數(shù)據(jù)源A對數(shù)據(jù)源B有一些信任或沒有信任。

      (c) ΔContext(A,B,t)表示在t時(shí)刻時(shí),數(shù)據(jù)源A和數(shù)據(jù)源B之間是否有新增的上下文直接交互。其中,ΔContext(A,B,t)=Context(A,B,t)-Context(A,B,t-1)。

      其中,Context(A,B,t)是指在t時(shí)刻,數(shù)據(jù)源A與數(shù)據(jù)源B之間直接交互數(shù)據(jù)。

      (d)DirTrust(A,B,Context(A,B,t),t)表示在t時(shí)刻時(shí),數(shù)據(jù)源A對數(shù)據(jù)源B在上下文交互條件Context(A,B,t)下的可信值。

      (e)Accept(A,B,t)表示在t時(shí)刻時(shí),數(shù)據(jù)源A對數(shù)據(jù)源B的相似程度的認(rèn)可度。

      Data(A)∩Data(B)是指數(shù)據(jù)源A所提供的數(shù)據(jù)集合與數(shù)據(jù)源B所提供的數(shù)據(jù)集合有相同的主題的數(shù)據(jù)的個(gè)數(shù)。

      (f)λL(t)表示在t時(shí)刻時(shí),本模型對本地可信度的懲罰系數(shù)。

      其中, ΔLocalTrustA(B,t)表示在t時(shí)刻時(shí),數(shù)據(jù)源A對目的數(shù)據(jù)源B本地可信度是否發(fā)生了變化。ΔLocalTrustA(B,t)=LocalTrustA(B,t)-LocalTrustA(B,t-1)。

      (g)α2+β2=1。

      定義3 全局可信度:設(shè)GlobalTrustA(B,t)表示在t時(shí)刻時(shí),本地?cái)?shù)據(jù)源A對目的數(shù)據(jù)源B的全局可信度,它的值是目的數(shù)據(jù)源在整個(gè)可信虛擬網(wǎng)絡(luò)中的可信度,即目的數(shù)據(jù)源的可信度,其計(jì)算公式為

      (3)

      1.3 數(shù)據(jù)源的可信性度量模型

      定義4 數(shù)據(jù)源的可信度:設(shè)Trust(A,t)表示在t時(shí)刻,數(shù)據(jù)源A的可信度,它是指數(shù)據(jù)源提供的所有歷史數(shù)據(jù)的可信度期望值與整個(gè)可信虛擬網(wǎng)絡(luò)中各層對數(shù)據(jù)源的推薦可信度的綜合可信度。其計(jì)算公式為

      (4)

      式中:

      (a) 初始值為一個(gè)隨機(jī)數(shù)或0,表示數(shù)據(jù)源A有一些信任或沒有信任。

      (d)Trust(dataa,t)表示在t時(shí)刻時(shí),對數(shù)據(jù)dataa的信任度。

      (e)Sum(Data(A))表示求數(shù)據(jù)源A提供數(shù)據(jù)的總數(shù)量。

      (f)γn表示在可信虛擬網(wǎng)絡(luò)中,以所求信任值的數(shù)據(jù)源為圓心,每一層對目標(biāo)數(shù)據(jù)源(圓心數(shù)據(jù)源)信任權(quán)重。它是一個(gè)1×n維向量,第一個(gè)元素的值為第一層對圓心數(shù)據(jù)源的信任權(quán)重,以此類推,每個(gè)向量元素為所對應(yīng)層次的信任權(quán)重,且權(quán)重值是個(gè)常數(shù),根據(jù)專家設(shè)定,由內(nèi)向外逐層遞減,取值范圍[0,1]之間。

      (g)α3+β3=1。

      定義5 推薦可信度:設(shè)Recommend(A,B,t)表示在t時(shí)刻時(shí),數(shù)據(jù)源A對數(shù)據(jù)源B以最佳路徑得到推薦可信度,它是指本數(shù)據(jù)源通過最佳路徑到目的數(shù)據(jù)源,對目的數(shù)據(jù)源的可信度。

      設(shè)Recommendn(A,t)表示在t時(shí)刻時(shí),每層數(shù)據(jù)源對目標(biāo)數(shù)據(jù)源(圓心數(shù)據(jù)源)A的推薦可信度,其中它是一個(gè)n×1維向量,第一個(gè)元素的值為第一層所有數(shù)據(jù)源對目標(biāo)數(shù)據(jù)源(圓心數(shù)據(jù)源)A的推薦可信度期望值,以此類推,每個(gè)向量元素為所對應(yīng)層次的推薦可信度期望值。一般層數(shù)是根據(jù)精確度和需求設(shè)置的,層數(shù)越大,計(jì)算量越大,相應(yīng)的得到的數(shù)據(jù)就越準(zhǔn)確。

      設(shè)Recommend(Xi,A,t)為第i層的某個(gè)數(shù)據(jù)源X對目標(biāo)數(shù)據(jù)源(圓心數(shù)據(jù)源)A的推薦可信度,其計(jì)算公式為

      (5)

      其中,Neighbormax(Xi->A)表示朝向A的方向上,第i-1層上與Xi相鄰的可信度最大的數(shù)據(jù)源。

      設(shè)Recommend(A,t)(i)為第i層的所有數(shù)據(jù)源對目標(biāo)數(shù)據(jù)源(圓心數(shù)據(jù)源)A的推薦可信度期望值為

      (6)

      其中,Circlei(A)表示在可信虛擬網(wǎng)絡(luò)中,以A為圓心的第i層上的所有數(shù)據(jù)源,Sum(Circlei(A))表示第i層上的所有數(shù)據(jù)源的數(shù)量。

      1.4 數(shù)據(jù)的可信性度量模型

      定義6 數(shù)據(jù)的可信度:設(shè)Trust(data,t)表示在t時(shí)刻時(shí),數(shù)據(jù)data的可信度,它是指對于這條數(shù)據(jù),所有的直接提供這條數(shù)據(jù)的數(shù)據(jù)源或有直接關(guān)系的數(shù)據(jù)源在歷史記錄中都提供不可靠數(shù)據(jù)的對立事件的概率,其計(jì)算公式為

      (7)

      定義7 數(shù)據(jù)源所提供的某條數(shù)據(jù)的真實(shí)可信度:設(shè)Trust(A,data,t)表示在t時(shí)刻時(shí),數(shù)據(jù)源A對所提供的數(shù)據(jù)data的真實(shí)的可信度,它是指由數(shù)據(jù)源對所有提供數(shù)據(jù)的直接可信度與間接可信度的綜合得到的。其計(jì)算公式為

      (8)

      式中:α4+β4=1。

      定義8 某數(shù)據(jù)源所提供數(shù)據(jù)的直接可信度:設(shè)DirTrust(A,data,t)表示在t時(shí)刻,數(shù)據(jù)源A對所提供的數(shù)據(jù)data的真實(shí)直接可信度,它是指數(shù)據(jù)源在整個(gè)可信虛擬網(wǎng)絡(luò)中的可信度,其計(jì)算公式為

      (9)

      定義9 某數(shù)據(jù)源所提供數(shù)據(jù)的間接可信度:設(shè)InDirTrust(A,data,t)表示在t時(shí)刻,與數(shù)據(jù)源A鄰接的數(shù)據(jù)源對這條數(shù)據(jù)的真實(shí)推薦可信度,一般選出有限的n個(gè)鄰接可信度高的數(shù)據(jù)源組合成這條數(shù)據(jù)真實(shí)的推薦可信度,其計(jì)算公式為

      (10)

      式中:Neighborn(A)與A相鄰的可信度高的n個(gè)數(shù)據(jù)源。

      由上面的定義可得數(shù)據(jù)源間、數(shù)據(jù)源及數(shù)據(jù)的可信度定義之間關(guān)聯(lián)關(guān)系,如圖2所示。

      圖2 數(shù)據(jù)源間、數(shù)據(jù)源及數(shù)據(jù)的可信度關(guān)聯(lián)關(guān)系Fig.2 The correlation of the credibility definition of between data sources, data, data source

      2 案例分析及驗(yàn)證

      本文采用Hadoop平臺搭建了一個(gè)由16臺筆記本電腦組成的集群實(shí)驗(yàn)環(huán)境。為了驗(yàn)證論文所提的方法具有很好的實(shí)用性,仿真實(shí)驗(yàn)選取的對象是某電力公司調(diào)度通信中心實(shí)時(shí)運(yùn)行的數(shù)據(jù),其中包括3個(gè)發(fā)電廠、4個(gè)變電站的局部電網(wǎng)的運(yùn)行數(shù)據(jù)。本實(shí)驗(yàn)對采集設(shè)備進(jìn)行時(shí)鐘同步,每一時(shí)刻采集到的數(shù)據(jù)都帶有時(shí)標(biāo),這樣就避免了時(shí)間延遲會造成對數(shù)據(jù)的懲罰,便于分析。

      實(shí)驗(yàn)中靜態(tài)信息仍然存儲在關(guān)系數(shù)據(jù)庫里。為模擬實(shí)際場景里的數(shù)據(jù)產(chǎn)生網(wǎng)絡(luò),實(shí)驗(yàn)中將一臺PC機(jī)當(dāng)作信息生成發(fā)送端。每條信息包括數(shù)據(jù)源編號,主題類型,時(shí)間,數(shù)據(jù)源可信度值,數(shù)據(jù)可信度值,風(fēng)速平均,有功功率平均,無功功率平均,風(fēng)向角平均,發(fā)電機(jī)轉(zhuǎn)速平均值,葉輪轉(zhuǎn)速平均值,葉尖壓力平均值,系統(tǒng)壓力平均值,偏航角度平均值,齒輪油溫度平均值,齒輪箱軸承溫度平均值,環(huán)境溫度平均值,發(fā)電機(jī)前軸溫度平均值,機(jī)艙溫度平均值,發(fā)電機(jī)后軸溫度平均值,大發(fā)電機(jī)溫度平均值,A、B相電流平均值,A、B相電壓平均值,頻率平均值,功率因數(shù)平均值,有功功率最大值,有功功率最小值,無功功率最大值,無功功率最小值等信息,各個(gè)信息之間用逗號隔開;信息存儲到以數(shù)據(jù)源編號和時(shí)間組成的文件里,如表1所示。

      表1 信息及文件名格式

      2.1 仿真實(shí)驗(yàn)設(shè)計(jì)

      在智能電網(wǎng)環(huán)境下,數(shù)據(jù)源是指可信虛擬網(wǎng)絡(luò)中提供數(shù)據(jù)的實(shí)體,即電力系統(tǒng)中提供數(shù)據(jù)的設(shè)備,記作entity;數(shù)據(jù)是指實(shí)體(數(shù)據(jù)源)關(guān)于某個(gè)主題提供的數(shù)據(jù);主題是指數(shù)據(jù)的附屬主體,記作theme。一個(gè)數(shù)據(jù)源的行為可以被認(rèn)為是在一定的時(shí)間內(nèi),針對一個(gè)主題提供的數(shù)據(jù),則存在這條數(shù)據(jù)屬于數(shù)據(jù)源,記作data∈entity,這條數(shù)據(jù)附屬于對應(yīng)的主題,記作data∈theme,這個(gè)主題屬于數(shù)據(jù)源,記作D(entity)={data|data∈entity}。一個(gè)數(shù)據(jù)源提供的所有的數(shù)據(jù)集合記作theme∈entity,一個(gè)數(shù)據(jù)源與所有有聯(lián)系的主題集合記作T(entity)={theme|theme∈entity},一個(gè)主題所包含的數(shù)據(jù)集合記作D(theme)={data|data∈theme}。

      本模型所涉及的參數(shù)個(gè)數(shù)比較多,其中,涉及數(shù)據(jù)源之間可信度的參數(shù)包括數(shù)據(jù)源的數(shù)量N、本地信任度權(quán)重系數(shù)α1、全局信任度權(quán)重系數(shù)β1、本地信任度直接可信度權(quán)重系數(shù)α2、本地信任度相似程度的認(rèn)可度權(quán)重系數(shù)β2、本地可信度的時(shí)間衰減系數(shù)μL(t)、本地可信度的懲罰系數(shù)λL(t)、數(shù)據(jù)或行為的相似度閾值η、兩次計(jì)算時(shí)間的差值Δt,涉及數(shù)據(jù)源可信度的參數(shù)包括歷史數(shù)據(jù)的可信度期望值權(quán)重系數(shù)α3、推薦可信度權(quán)重系數(shù)β3、數(shù)據(jù)源可信度的時(shí)間衰減系數(shù)μS(t)、數(shù)據(jù)源可信度的懲罰系數(shù)λS(t)、以數(shù)據(jù)源為圓心的層次n、多維層次的信任權(quán)重向量γn,涉及數(shù)據(jù)可信度的參數(shù)包括直接可信度權(quán)重系數(shù)α4、間接可信度權(quán)重系數(shù)β4。

      本實(shí)驗(yàn)把所采集的數(shù)據(jù)分成兩部分,其中一部分是作為前期的電力可信虛擬網(wǎng)絡(luò)的建立,對網(wǎng)絡(luò)進(jìn)行反復(fù)訓(xùn)練,同時(shí)調(diào)整更新參數(shù)的值以適應(yīng)環(huán)境的變化,另一部分?jǐn)?shù)據(jù)則是驗(yàn)證本模型的穩(wěn)定性、準(zhǔn)確性。實(shí)驗(yàn)參數(shù)值是基于主觀性和經(jīng)驗(yàn)性的選取的,但在后期的實(shí)驗(yàn)過程中是在不斷的修改參數(shù)值,以便選擇更合理的參數(shù)值,各參數(shù)的設(shè)置情況如下表。

      2.2 算法分析過程

      在Hadoop中運(yùn)行過程,首先收集數(shù)據(jù),將收集到數(shù)據(jù)進(jìn)行預(yù)處理,在map過程,輸入的key-value對是由采集到的數(shù)據(jù)源的標(biāo)示作為key值,對于value值則是對應(yīng)格式化的一行字符串,每位都有不同的含義,具體要看收集的數(shù)據(jù)源的特點(diǎn),在map過程中,通過對每一行字符串的解析,主要是對value的關(guān)鍵位(對描述數(shù)據(jù)關(guān)鍵信息的位)的取舍和對key值的修改,將數(shù)據(jù)源提供數(shù)據(jù)按主題類型歸屬的進(jìn)行分類,作為新的key值,這樣就得到所需要的key-value對作為輸出;在reduce過程,將map過程中的輸出,按照相同的key值中將value放到同一個(gè)列表中作為reduce的輸入,這時(shí)就需要使用本文模型提出的算法進(jìn)行數(shù)據(jù)源間可信度、數(shù)據(jù)源可信度、數(shù)據(jù)可信度的并行計(jì)算及可信虛擬網(wǎng)絡(luò)的構(gòu)建。同時(shí)啟動其他的輔助進(jìn)程用來修改已經(jīng)組建的可信虛擬網(wǎng)絡(luò),同時(shí)將程序進(jìn)入下一輪的迭代計(jì)算。

      表2 仿真實(shí)驗(yàn)中默認(rèn)值參數(shù)列表

      結(jié)合1.2、1.3、1.4小節(jié)內(nèi)容,首先從式(1)計(jì)算數(shù)據(jù)源間的可信度開始,計(jì)算任意一個(gè)entity對其他entities的可信度,其中,需要根據(jù)式(2)和式(3)計(jì)算兩方面的內(nèi)容,一方面,需要對其它的entities計(jì)算本地可信度,如果數(shù)據(jù)源之間有上下文交互(條件1)或出現(xiàn)新的行為(條件2),那么需要更新本地可信度,如果沒有新的行為,那么就按時(shí)間懲罰因子對其進(jìn)行時(shí)間懲罰。其中,如果滿足上述條件1任意兩個(gè)數(shù)據(jù)源之間有聯(lián)系,或者滿足上述條件2在對數(shù)據(jù)源間本地可信度計(jì)算中,如果任意兩個(gè)數(shù)據(jù)源對于同一主題提供的數(shù)據(jù)相似度超過系統(tǒng)設(shè)定的閾值η,那么他們之間就建立了一條有向鏈路,其中鏈路上的權(quán)值就是數(shù)據(jù)源間可信度的值。另一方面,需要對這個(gè)entity計(jì)算全局可信度。

      再次,利用式(4)計(jì)算entity可信度,其中,如果entity提供的所有歷史數(shù)據(jù)的可信度期望值或在整個(gè)可信虛擬網(wǎng)絡(luò)中各層對entity的推薦可信度發(fā)生變化,那么就更新entity可信度,如果可信度沒有發(fā)生變化,同樣也要對其進(jìn)行時(shí)間懲罰。

      最后,根據(jù)式(7)利用對立事件概率來計(jì)算某個(gè)entity對一個(gè)theme提供data的可信度,其中,式(8)給出了entity對提供的data的真實(shí)的可信度,式(9)和式(10)分別給出entity對data的直接可信度和相鄰entities對data的間接可信度。在實(shí)驗(yàn)驗(yàn)證中,如果某個(gè)entity提供了某種惡意的、不真實(shí)的data時(shí),本模型會對其進(jìn)行嚴(yán)厲懲罰,使其在可信虛擬網(wǎng)絡(luò)中可信值瞬間變的很低,但如果在后期行為正常情況下,可信度也會隨著自己信用的提升而緩慢提升,可信評估計(jì)算過程本身就是不斷迭代更新的過程。整個(gè)算法的程序流程圖如圖3所示。

      圖3 電網(wǎng)大數(shù)據(jù)可信性度量方法的程序流程Fig.3 Program flow diagram of credibility evaluation method for Smart Grid Big Data

      2.3 實(shí)驗(yàn)結(jié)果及分析

      結(jié)合上述算法過程,將上面采集到的數(shù)據(jù)導(dǎo)入模型中進(jìn)行驗(yàn)證。在實(shí)驗(yàn)過程中,人為擬造一個(gè)電力設(shè)備來提供的數(shù)據(jù),主要是驗(yàn)證本模型對于錯(cuò)誤數(shù)據(jù)的檢測、處理能力。由于數(shù)據(jù)源之間可信度、數(shù)據(jù)源可信度、數(shù)據(jù)可信度是相互關(guān)聯(lián)的,是反復(fù)嵌套迭代計(jì)算得到的,利用式(1)、式(4)、式(7)迭代的計(jì)算模擬設(shè)備的可信值,觀察該擬造設(shè)備的可信度值隨時(shí)間變化情況,如圖4所示。

      圖4 人為擬造電力設(shè)備的可信值隨時(shí)間變化趨勢Fig.4 Artificial power equipment’s credibility value changing with time trend

      從圖4中可以看這一電力設(shè)備在T0-T30,電力設(shè)備的可信度呈現(xiàn)一種上升趨勢,其中在T12-T18時(shí)間段內(nèi),電力設(shè)備的可信度呈緩慢下降趨勢,這主要是由于沒有新的行為,其可信度要施加時(shí)間懲罰;在T31時(shí),通過人為修改采集的真實(shí)數(shù)據(jù),使得這一時(shí)刻提供的數(shù)據(jù)與真實(shí)數(shù)據(jù)差距很大,由于電力設(shè)備做出了一種不可信的行為或者數(shù)據(jù)錯(cuò)誤,本系統(tǒng)對其施加了懲罰,導(dǎo)致其可信度下降到0.1以下;在T32以后,由于電力設(shè)備的行為正常,隨著時(shí)間恢復(fù)原先上升的趨勢,但趨勢比較緩慢。

      在某一時(shí)刻,分層數(shù)據(jù)源組成的可信虛擬網(wǎng)絡(luò)部分拓?fù)涫疽鈭D以及多層數(shù)據(jù)源對某條數(shù)據(jù)的可信傳遞模擬示意圖如圖5所示。

      圖5 某時(shí)刻可信虛擬網(wǎng)絡(luò)部分拓?fù)銯ig.5 The partial topological diagram of credibility network at a certain time

      某個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)設(shè)備僅僅是整個(gè)可信虛擬網(wǎng)絡(luò)的一部分,不能單獨(dú)考慮,其單個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)的可信度的作用是為計(jì)算數(shù)據(jù)源之間可信度提供數(shù)據(jù)。網(wǎng)絡(luò)節(jié)點(diǎn)設(shè)備的可信度是受其提供的數(shù)據(jù)可信度制約,圖2描述了數(shù)據(jù)源之間的可信度、數(shù)據(jù)源的可信度、數(shù)據(jù)的可信度三者之間的依賴關(guān)系,通過反復(fù)迭代地計(jì)算三者的可信度,動態(tài)地構(gòu)建大數(shù)據(jù)的可信性分析網(wǎng)絡(luò),然后通過所構(gòu)建的穩(wěn)定的可信性分析網(wǎng)絡(luò)來計(jì)算出數(shù)據(jù)的可信度。其中,由定義2可知,利用式(2)計(jì)算智能電網(wǎng)中數(shù)據(jù)源間的本地可信度時(shí),可構(gòu)建數(shù)據(jù)源間可信虛擬網(wǎng)絡(luò),如圖5(a)所示給出部分分層數(shù)據(jù)源網(wǎng)絡(luò)拓?fù)鋱D,箭頭方向是指某數(shù)據(jù)源對指向數(shù)據(jù)源的聯(lián)系,權(quán)重為數(shù)據(jù)源之間的可信度值,如圖5(b)所示則是給出針對某條數(shù)據(jù)的可信虛擬網(wǎng)絡(luò)示意圖,從中我們可以得出,任何一條數(shù)據(jù)不僅與其提供者有直接聯(lián)系,而且也有很多與之有直接或間接聯(lián)系的數(shù)據(jù)源包圍,形成了一個(gè)小型可信虛擬網(wǎng)絡(luò),這樣就能大大提高對一條數(shù)據(jù)可信性評價(jià)的準(zhǔn)確性。

      在仿真實(shí)驗(yàn)過程中,設(shè)置數(shù)據(jù)規(guī)模為30 GB,不斷的增加節(jié)點(diǎn)數(shù)量,本文分別設(shè)置了2、4、8、16節(jié)點(diǎn)數(shù),圖6反映的是對于處理同一數(shù)據(jù)量的數(shù)據(jù),使得可信虛擬網(wǎng)絡(luò)達(dá)到穩(wěn)定時(shí),計(jì)算的時(shí)間花費(fèi)隨節(jié)點(diǎn)個(gè)數(shù)的增加變化趨勢,從實(shí)驗(yàn)結(jié)果可以得出其變化大致呈現(xiàn)一種線性趨勢。

      圖6 模型計(jì)算時(shí)間隨選取的節(jié)點(diǎn)個(gè)數(shù)變化趨勢Fig.6 Model calculation time changing with the number of selected nodes

      在實(shí)驗(yàn)過程中,對于數(shù)據(jù)源間的可信度度量公式考慮到本地和全局可信度;對于數(shù)據(jù)源的可信度度量公式考慮到其提供歷史數(shù)據(jù)的可信度與可信虛擬網(wǎng)絡(luò)中各層對其的推薦可信度;對于數(shù)據(jù)的可信度度量公式則考慮到其對立事件的概率。上述模型的可信度計(jì)算函數(shù),本文都考慮到時(shí)間是影響可信度計(jì)算的重要因素之一,除此之外,數(shù)據(jù)源的行為特征也是本文考慮的重要因素,同時(shí)添加了行為特征懲罰因素。

      3 結(jié) 論

      本文通過分析電網(wǎng)數(shù)據(jù)的典型特征和屬性,結(jié)合電力系統(tǒng)不良數(shù)據(jù)辨識模型和數(shù)據(jù)可信分析模型,給出了電網(wǎng)數(shù)據(jù)的可信度量的分析模型,提出了可信虛擬網(wǎng)絡(luò)構(gòu)建方法。選取電網(wǎng)數(shù)據(jù)實(shí)例,驗(yàn)證了模型可行性。實(shí)驗(yàn)結(jié)果表明該模型在數(shù)據(jù)源提供數(shù)據(jù)量越多的情況下,越能對所提供電網(wǎng)數(shù)據(jù)的可信度進(jìn)行準(zhǔn)確分析,很好地滿足了電網(wǎng)數(shù)據(jù)的可信需求。但本文的模型有些方面需要進(jìn)一步的研究,一方面,本文模型的參數(shù)值是基于主觀性和經(jīng)驗(yàn)性選取的,需要進(jìn)行多次調(diào)整以適應(yīng)不同的場景,另一方面,對于構(gòu)建電網(wǎng)可信性分析網(wǎng)絡(luò)的方法仍需要完善,這些都是今后的進(jìn)一步研究工作的重點(diǎn)。

      [1] 張東霞, 苗新, 劉麗平, 等. 智能電網(wǎng)大數(shù)據(jù)技術(shù)發(fā)展研究[J]. 中國電機(jī)工程學(xué)報(bào), 2015, 35(1): 2-12.

      [2] HAO Jinping, PIECHOCKI R J, KALESHI D, et al. Sparse malicious false data injection attacks and defense mechanisms in smart grids[J]. IEEE Transactions on Industrial Informatics, 2015, 11(5): 1198-1209.

      [3] 高昆侖, 辛耀中, 李釗, 等. 智能電網(wǎng)調(diào)度控制系統(tǒng)安全防護(hù)技術(shù)及發(fā)展[J]. 電力系統(tǒng)自動化, 2015, 39(1): 48-52.

      [4] 李文武, 游文霞, 王先培. 電力系統(tǒng)信息安全研究綜述[J]. 電力系統(tǒng)保護(hù)與控制, 2011,39(10):140-147.

      [5] DURAN-PAZ J L, PEREZ-HIDALGO F, DURAN-MARTINE M J. Bad data detection of unequal magnitudes in state estimation of power systems[J]. IEEEPower Engineering Review, 2002, 121(5): 57-60.

      [6] HUANG SHYH-JIER, LIN JEU-MIN. Enhancement of anomalous data mining in power system predicting-aided state estimation[J]. IEEE Transactions on Power System, 2004, 19(1): 610-619.

      [7] 孟建良, 劉德超. 一種基于Spark和聚類分析的辨識電力系統(tǒng)不良數(shù)據(jù)新方法[J]. 電力系統(tǒng)保護(hù)與控制, 2016, 44(3): 85-91.

      [8] 王興志, 嚴(yán)正, 沈沉, 等. 基于在線核學(xué)習(xí)的電網(wǎng)不良數(shù)據(jù)檢測與辨識方法[J]. 電力系統(tǒng)保護(hù)與控制, 2012,40(1): 50-55.

      [9] 張艷軍, 葛延峰, 高凱, 等. 基于廣域測量系統(tǒng)的新息圖辨識不良數(shù)據(jù)方法[J]. 電力系統(tǒng)自動化, 2010, 34(23): 25-29.

      [10] 王守信, 張莉, 李鶴松. 一種基于云模型的主觀信任評價(jià)方法[J]. 軟件學(xué)報(bào), 2010, 21(6): 1341-1352.

      [11] 唐文, 陳鐘. 基于模糊集合理論的主觀信任管理模型研究[J]. 軟件學(xué)報(bào), 2003, 14(8): 1401-1408.

      [12] 李玲玲, 朱芬芬, 姚致清, 等. 基于可信度的可靠性度量云模型[J]. 電力系統(tǒng)保護(hù)與控制, 2012, 40(8): 90-94.

      [13] 張仕斌, 許春香. 基于云模型的信任評估方法研究[J]. 計(jì)算機(jī)學(xué)報(bào), 2013, 36(2):422-431.

      [14] 張琳, 劉婧文, 王汝傳, 等. 基于改進(jìn)D-S證據(jù)理論的信任評估模型[J]. 通信學(xué)報(bào), 2013, 34(7): 167-173.

      [15] 趙秋月, 左萬利, 田中生, 等. 一種基于改進(jìn)D-S證據(jù)理論的信任關(guān)系強(qiáng)度評估方法研究[J]. 計(jì)算機(jī)學(xué)報(bào), 2014, 37(4): 873-883.

      [16] 張巍, 朱艷春, 孫寶文, 等. 基于模糊認(rèn)知圖和證據(jù)理論的FCM-DS信任模型[J]. 小型微型計(jì)算機(jī)系統(tǒng), 2016, 37(6): 1259-1262.

      Research on Credibility Measurement Model of Power Grid Data

      CHENG Xiaorong, LI Tianqi

      (1. School of Control and Computer Engineering, North China Electric Power University, Baoding 071003, China)

      The untrusted data in power system reduces the accuracy of the state estimation results. The credibility requirement of data in the power grid is analyzed and identification of bad data in the grid and the theories of credible data are studied. On the basis of these studies, a hierarchical and dynamic credibility analysis model for grid data was established which takes into account weight factors such as time factor and penalty factor. Credibility analysis of power data can be summarized as combinatorial problems including data source, relations between different data sources and network path of data dissemination. The virtual network of the credibility which was on the base of dependent relationship of data source was dynamically established by calculating the credibility between data sources, the credibility of data and the credibility of data source. And the overall credibility of data is normally evaluated by the virtual network. The simulation results show that the model can satisfy the requirement of the credibility estimation of grid data, and also provide ideas to solve the problem of the credibility measurement for further research.

      power grid data; big data; credibility; dynamism; trusted computing

      10.3969/j.ISSN.1007-2691.2017.02.12

      2016-07-19.

      TM711

      A

      1007-2691(2017)02-0083-08

      程曉榮(1963-),女,教授,主要研究方向?yàn)橛?jì)算機(jī)網(wǎng)絡(luò)應(yīng)用、網(wǎng)絡(luò)信息安全;李天琦(1989-),男,碩士研究生,主要研究方向?yàn)橛?jì)算機(jī)網(wǎng)絡(luò)應(yīng)用、網(wǎng)絡(luò)信息安全。

      猜你喜歡
      可信性數(shù)據(jù)源信任
      可變情報(bào)板發(fā)布內(nèi)容可信性檢測系統(tǒng)探究
      基于可信性的鍋爐安全質(zhì)量綜合評價(jià)研究
      在區(qū)間上取值的模糊變量的可信性分布
      表示信任
      Five golden rules for meeting management
      Web 大數(shù)據(jù)系統(tǒng)數(shù)據(jù)源選擇*
      基于不同網(wǎng)絡(luò)數(shù)據(jù)源的期刊評價(jià)研究
      嚶嚶嚶,人與人的信任在哪里……
      桃之夭夭B(2017年2期)2017-02-24 17:32:43
      從生到死有多遠(yuǎn)
      基于真值發(fā)現(xiàn)的沖突數(shù)據(jù)源質(zhì)量評價(jià)算法
      虞城县| 沂源县| 哈巴河县| 昆山市| 金沙县| 塔河县| 恩平市| 东丽区| 阿勒泰市| 邯郸市| 子长县| 台山市| 二连浩特市| 崇礼县| 沙田区| 高邮市| 邯郸县| 吴江市| 凤庆县| 修水县| 五大连池市| 贵州省| SHOW| 葫芦岛市| 增城市| 柯坪县| 日照市| 白城市| 同心县| 迁安市| 潍坊市| 霍城县| 晋州市| 龙胜| 平谷区| 泰安市| 西吉县| 吴旗县| 资兴市| 武义县| 江孜县|