• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于多源局部放電信號數(shù)據(jù)流聚類分離方法

      2022-08-25 08:57:06陳昌川劉仁光馮曉棕覃延佳代少升張?zhí)祢U
      上海交通大學(xué)學(xué)報 2022年8期
      關(guān)鍵詞:數(shù)據(jù)流鄰域半徑

      —放電幅值

      —一個集群中的樣本數(shù)量

      —區(qū)域密度值

      —數(shù)據(jù)的屬性數(shù)

      核心半徑的值根據(jù)集合中每個特征的標(biāo)準(zhǔn)差來計算,然后對其求平均.核心半徑的計算式為

      —純度

      —F-Measure的統(tǒng)計量

      4.我產(chǎn)奶,我有犄角,但我不是奶牛。我是誰?(答案:a milk truck 奶車。horn 既有“犄角”的意思,又有“喇叭”的意思。)

      —陡峭度

      —微簇最小閾值

      —不同寬度的高斯核線性組合成加權(quán)多寬度高斯核的個數(shù)

      —微簇?fù)碛袛?shù)據(jù)量

      —鄰居的個數(shù)

      —數(shù)據(jù)集中的對象個數(shù)

      —準(zhǔn)確度

      男人看似文質(zhì)彬彬,喝茶的樣子卻正好于之相反,半杯茶要一飲而盡。女人拿一雙好看的眼睛盯著他喝光杯里的茶,再捧起壺給他斟上,依舊是半杯,男人再一次端起杯子一飲而盡。然后拿手抹去額頭上的汗珠,方朝女人笑一笑。

      —精確率

      —樣本輸入的速度

      —放電量

      —召回率

      —微簇群的個數(shù)

      —權(quán)重系數(shù)

      —殼半徑

      —核心半徑

      對其每個數(shù)據(jù)點找到其-近鄰、逆-近鄰,以及每個數(shù)據(jù)點近鄰的數(shù)量.

      —常量因子

      1)進(jìn)一步優(yōu)化和完善系統(tǒng)設(shè)計。根據(jù)系統(tǒng)試用發(fā)現(xiàn)的數(shù)據(jù)收集格式、數(shù)據(jù)兼容性等問題,聯(lián)合系統(tǒng)研發(fā)公司一起制訂優(yōu)化方案。例如:對于原始數(shù)據(jù)庫中的項目不能進(jìn)行在線中期檢查和結(jié)題申請的問題,將對數(shù)據(jù)進(jìn)行處理,達(dá)到兼容的目標(biāo);對于數(shù)據(jù)采集中存在的非格式化數(shù)據(jù),重新進(jìn)行賦值定義,做好備注,引導(dǎo)項目申報者完成數(shù)據(jù)錄入各項工作。

      —第個相位的概率密度

      —偏斜度

      —處理時間

      經(jīng)略海洋、維護(hù)海權(quán),建設(shè)海洋強國,是實現(xiàn)強國強軍夢的必然要求。當(dāng)前,我國與海域相鄰國家間存在著許多權(quán)益爭議,特別是美國打著海上自由航行的名義,不斷挑戰(zhàn)我守海衛(wèi)疆的底線,使得海洋問題錯綜復(fù)雜,我維護(hù)海洋權(quán)益、護(hù)海守邊的形勢嚴(yán)峻多變,極有可能引發(fā)海上戰(zhàn)事或軍事沖突。海上民兵是我軍海上作戰(zhàn)時參戰(zhàn)支前的重要力量,將圍繞擔(dān)負(fù)的海上游擊作戰(zhàn)、配合支援海上作戰(zhàn)、組織海上“三戰(zhàn)”等使命任務(wù)采取相應(yīng)行動。

      —加權(quán)多寬度高斯核函數(shù)

      Optimization Research on Reverse Osmosis Treatment Technology for Flexible DC Valve Cooling Spay Water LU Xiang,XU Zhongya,WANG Jianwu,ZENG Qinghe(111)

      —第個相位值

      對生的眷戀是小說歡愉的地方,集中體現(xiàn)為對少女的崇拜。川端康成在這部作品中繼承了以往的少女崇拜情結(jié),在《自夸十講》中曾經(jīng)提過:“如果能夠?qū)懸晃挥朗啦粫郎绲纳倥脑?那么我也不白活這一世。”在川端康成的作品中少女永遠(yuǎn)是最佳的女性形象,《睡美人》中作者就著重筆墨寫了六位代表生命活力的少女。

      Δ—相位的寬度

      使微簇中的數(shù)據(jù)點之間距離的線性平移放大,在其特征區(qū)間內(nèi)擴(kuò)大樣本的差異,可以更好實現(xiàn)對差別微弱的微簇之間進(jìn)行聚類,從而微簇的半徑和密度可通過NaN算法進(jìn)行自適應(yīng)變化.對微簇進(jìn)行調(diào)整,該算法采用了一種簡單的線性老化確定方法,從而縮短了微簇的壽命.該微簇作為未使用的微簇可看作完全消失,不僅可以替代老化的技術(shù),而且還可以通過添加更多的數(shù)據(jù)點來將該微簇激活,從而更新微簇的圖譜.當(dāng)沒有接收可用的數(shù)據(jù)時,微簇會逐漸消失.這種現(xiàn)象廣泛存在時,微簇的壽命將逐漸達(dá)到0,從而被消除.

      —自然特征值

      —第個相位的均值

      —方差

      —工頻相位

      在人口稠密的城市中,對變電站的緊湊設(shè)計和小尺寸的要求,使得氣體絕緣變電站(Gas Insulated Substation,GIS)的安裝成為必要條件.由于緊湊設(shè)計、低維護(hù)要求及可靠的運行,近年來GIS在電力公用事業(yè)中得到了廣泛的應(yīng)用.像其他高壓設(shè)備一樣,在強電場的作用下,GIS設(shè)備絕緣體內(nèi)部區(qū)域可能出現(xiàn)各種引起危害的潛伏性絕緣缺陷,產(chǎn)生不同類型局部放電(Partial Discharge, PD).不同類型PD反映的絕緣劣化機理不同,對GIS設(shè)備損害程度也不同.識別PD類型可以為變壓器的診斷、檢修提供依據(jù),從而確保電力系統(tǒng)安全穩(wěn)定地運行.

      模式識別是氣體絕緣變電站故障診斷的主要內(nèi)容之一,用數(shù)學(xué)技術(shù)方法對有故障信息的數(shù)據(jù)進(jìn)行自動處理和識別,提取有效的信息,從而對故障的數(shù)據(jù)點進(jìn)行聚類和分離.通過PD信號監(jiān)測系統(tǒng)采集到PD信號,通過模式識別方法對數(shù)據(jù)之中能反映氣體絕緣變電站PD的特征信息進(jìn)行辨識,從而可以判斷PD的放電類型.如果氣體絕緣變電站發(fā)生故障,產(chǎn)生了PD的現(xiàn)象,則可以對PD類型進(jìn)行判斷,為維修提供一定的技術(shù)指導(dǎo).PD類型大概分為尖端放電、空穴放電、懸浮電極放電及自由金屬顆粒放電.這些缺陷主要是由諸如斷路器之類的運動部件的機械振動所產(chǎn)生.相位分辨局部放電(Phase Resolved Partial Discharge, PRPD)模式是PD測量分析中最常用的方法,本文采用的特征提取方法是統(tǒng)計特征法.利用特高頻法對PD信號進(jìn)行監(jiān)測,對其放電特性進(jìn)行分析.提取可以反映GIS設(shè)備缺陷的特征參數(shù),這些特征參數(shù)包括偏斜度、陡峭度、上升時間、下降時間及脈沖寬度等.這些特征參數(shù)都應(yīng)該具有很高的辨識度,將GIS的運行狀態(tài)與各個特征參數(shù)相關(guān)聯(lián),來分析并以其結(jié)果預(yù)警GIS設(shè)備潛在故障,利用聚類分離算法將不用的特征參數(shù)的信號分離出來.針對不確定的數(shù)據(jù)流特征,Cao等提出DenStream聚類算法,該算法引入核心微簇來概括任意形狀的簇,同時提出潛在的核心微簇和異常微簇結(jié)構(gòu)來維護(hù)和區(qū)分潛在簇和異常值,擴(kuò)展了傳統(tǒng)基于密度的聚類算法,重點處理任意形狀的數(shù)據(jù)流聚類問題.DenStream算法存在不足,沒有限制核心微簇的數(shù)量,同時也沒有刪減或減少核心微簇的方法,會導(dǎo)致大量的內(nèi)存開銷.Chairukwattana 等提出SE-Stream聚類算法,通過減少執(zhí)行時間和提高微簇的質(zhì)量來提高算法的性能,確定每個活動微簇的適當(dāng)維度子集來表達(dá)數(shù)據(jù)流中的微簇的特定特征,支持微簇結(jié)構(gòu)隨時間的變化,包括微簇的出現(xiàn)、消失、自我進(jìn)化、合并及分裂.SE-Stream算法存在著缺陷,需要初始化定義較多的參數(shù),后期的聚類效果受初始化參數(shù)的影響.該算法目的是為了在每個微簇中提取最佳的選定維度集,不能保證這些維度是否冗余.

      任務(wù)實施是學(xué)生或小組按照計劃逐步完成任務(wù)的環(huán)節(jié)。在這個環(huán)節(jié)中引入MOOC的知識點講解,將學(xué)生任務(wù)中需要掌握的知識點,以線上MOOC的資源方式引導(dǎo)學(xué)生自主完成學(xué)習(xí)。再充分應(yīng)用自己已經(jīng)掌握的知識,并就解決問題、完成任務(wù)的實施步驟形成詳細(xì)的計劃。學(xué)生在這個環(huán)節(jié)要完成的工作主要是進(jìn)一步收集信息,完成任務(wù)或解決問題,匯報PPT、圖紙或其他形式的學(xué)習(xí)成果。

      第三,就歷史與現(xiàn)實的關(guān)系而論,文化多元性下的共識性對話不僅是與世界相關(guān)聯(lián)的中國問題,而且是與歷史相關(guān)聯(lián)、與傳統(tǒng)相關(guān)聯(lián)的現(xiàn)代問題。從本質(zhì)上來看,它理應(yīng)是歷史的對話,其開展的必要條件是以中西馬各自的哲學(xué)史作為根基,以充分調(diào)動三種歷史資源為前提,以“向上的兼容性”去總結(jié)成就、發(fā)現(xiàn)困難、揭露矛盾,在繼承傳統(tǒng)的基礎(chǔ)上將古今中外的智慧結(jié)合實踐經(jīng)驗進(jìn)行融會、貫通甚至超越,以積極尋求不同理論、不同思想之間的對話,為構(gòu)建具有中國特色的當(dāng)代中國形而上學(xué)提供新的思維方式和理論格局。

      針對多種實時PD信號數(shù)據(jù)且不斷變化的問題,系統(tǒng)需要能夠?qū)崟r對多種PD信號進(jìn)行分離,本文提出了一種高效自適應(yīng)在線數(shù)據(jù)流(Efficient Adaptive Online Data Stream Clustering Algorithm, EAOStream)聚類算法,該算法在傳統(tǒng)數(shù)據(jù)流聚類算法上,利用自然鄰域(Natural Neighbor,NaN)的方法,創(chuàng)建KD樹(-dimension Tree)來提高查詢近鄰的效率,該方法通過流數(shù)據(jù)的特征值計算出適應(yīng)的鄰域半徑和區(qū)域密度進(jìn)行局部搜索,從而來支持最佳的聚類效果.在形成團(tuán)簇后,半徑可以跟著時間增加或減小,根據(jù)數(shù)據(jù)流結(jié)構(gòu)動態(tài)變化,一些微簇會隨著時間拆分或合并.實驗測試效果表明,該算法為任意形狀微簇聚類提供了一種有效的解決方案并具有更高的分類精度.

      1 多源PD信號數(shù)據(jù)流聚類分離

      為了測試多源PD信號數(shù)據(jù)流聚類算法的性能,本文在實驗室設(shè)計4種典型的變壓器PD缺陷模型.使用廣州友智電氣技術(shù)有限公司的PD監(jiān)測設(shè)備對每種類型缺陷進(jìn)行在線檢測取樣,設(shè)計特高頻缺陷PD監(jiān)測系統(tǒng)對PD信號的數(shù)據(jù)進(jìn)行概率分析,使信號特征和聚類分離更加穩(wěn)定.

      黃厚江的“本色語文”教學(xué)理念認(rèn)為其基本內(nèi)涵為三點:一是“語文本原”,就是必須立足于語文教育的基本任務(wù);二是“語文本真”,就是探索語文教學(xué)基本規(guī)律,在語文教學(xué)中體現(xiàn)語文的特點;三是“語文本位”,語文課要體現(xiàn)語文學(xué)科基本特點,實現(xiàn)語文課程基本價值。本文主要是在黃厚江老師《背影》課堂實錄的基礎(chǔ)上結(jié)合“本色語文”教學(xué)理念對黃厚江的教學(xué)語言風(fēng)格——以小見大做一個解析。

      1.1 PD信號特征提取

      實現(xiàn)不同PD故障信號的分離,首先必須提取的特征量能夠反映PD信號的時域特征.從而通過特高頻提取到的特征值來表示PD信號.由于放電機理、放電缺陷位置、放電信號傳播路徑的不同,所以多種PD信號會在特征值中表現(xiàn)不同的差異,根據(jù)不同PD信號時域分布特征的不同,就可以將多種PD進(jìn)行分離.用于類型識別的 PD 特征量選擇方法主要集中在PD相位分析模式,統(tǒng)計特征參數(shù)用PRPD的特征描述.本文提取了信號特征中的、、和等特征量.

      (1) 偏斜度用來描述PRPD圖譜的差異,反映了圖譜形狀相對于正態(tài)分布的左右偏斜情況.具體計算公式為

      (1)

      (2) 陡峭度用來描述PRPD圖譜形狀分布的突起程度,表示概率密度分布曲線在平均值處峰值高低的特征數(shù).具體計算公式為

      (2)

      1.2 PD信號分離方法

      根據(jù)PRPD圖譜中統(tǒng)計參數(shù)中的、、和組成一系列二維或三維圖譜及其統(tǒng)計特征來實現(xiàn)對多種PD信號的分類.傳統(tǒng)的聚類分離算法存在一定的問題:通過特高頻傳感器接收不斷變化的實時PD信號,需要保證完整的工頻周期.而離線的聚類算法(例如DBSCAN)不能滿足要求,從而提出了一種高效EAOStream聚類算法.

      ..基本概念

      (1) 微簇形成:在一定半徑的范圍內(nèi),當(dāng)數(shù)據(jù)點與其他的簇足夠遠(yuǎn)的時候,那么這些點會組成一個新簇.

      本研究通過譜效關(guān)系分析證實,紫荊葉提取物質(zhì)量濃度為100 mg/mL(以生藥計)時,P5、P8、P10、P12、P15、P16號共有峰與其對酪氨酸酶活性的抑制作用呈正相關(guān),P2、P4號共有峰與其對酪氨酸酶活性的抑制作用呈負(fù)相關(guān)。但上述共有峰面積(代表化合物的含量)與酪氨酸酶活性抑制作用的正/負(fù)相關(guān)性只能表示其作用趨勢,并不表示這些化合物直接對酪氨酸酶活性起抑制或激活作用;且譜效關(guān)系分析是以各個峰作為獨立樣本為假設(shè)前提,而忽略了不同化合物之間的相互作用。因此,這些特征色譜峰所代表的化合物的結(jié)構(gòu)仍需進(jìn)一步鑒定,化合物之間的相互作用仍需進(jìn)一步深入探索。

      (2) 微簇合并:如果一個微簇的外殼半徑與另一個微簇的核心半徑之和大于其中心距離,這兩個微簇進(jìn)行合并.

      (3) 微簇分裂:如果微簇由一定數(shù)量的數(shù)據(jù)形成的候選微簇不與其他微簇的殼半徑相交,則將這兩個微簇分開.

      (4) 殼半徑:確定了微簇的邊界,用于微簇的合并和分割的操作.離聚類中心最遠(yuǎn)的數(shù)據(jù)距離指定為聚類的殼半徑.

      (5) 核心半徑:作為微簇集中區(qū)域,用于判斷兩個微簇是否能夠合并為一個微簇.

      ()—數(shù)據(jù)點的近鄰距離

      (3)

      微簇的中心有關(guān)的重心計算式為

      在傳統(tǒng)高中語文作文教學(xué)中,教師作為教學(xué)主體,學(xué)生只能被動接受。學(xué)生寫好作文后,由教師一一審閱,教師雖是教學(xué)的引導(dǎo)者,但是教師作為一個個體,思想也有局限性,因此站在教師的角度和立場去評判所有學(xué)生的作文,未免太過片面,而不同的學(xué)生有不同的思想,不同思想的碰撞,會發(fā)出耀眼的光芒,所以應(yīng)該開展學(xué)生之間的互相評審和自評,讓學(xué)生在自評和互評的過程中認(rèn)識自己的不足。通過學(xué)生的探討,學(xué)習(xí)別人的長處,認(rèn)識自己的短處,做到優(yōu)勢互補,共同進(jìn)步。最后,教師和學(xué)生進(jìn)行共同總結(jié),為了以后更好地寫作。

      (4)

      數(shù)據(jù)點到來的時候,確定該數(shù)據(jù)最近的微簇,如果數(shù)據(jù)點到聚類中心的距離小于聚類的,則將數(shù)據(jù)分配給相關(guān)微簇,并更新聚類重心.如果數(shù)據(jù)到聚類中心的距離大于聚類的,小于最大半徑,并且小于聚類的和半徑增量閾值之和,則將此數(shù)據(jù)分配到該聚類.微簇的可以增加到最大半徑,但這個增加的過程是逐步實現(xiàn)的,該增加量可到一個閾值,超過一定閾值,數(shù)據(jù)將不會增加到該集合中,這樣結(jié)構(gòu)能夠保證微簇更加穩(wěn)定,增加微簇抗干擾能力.

      (?)(?)(∈)∧()→

      (5)

      如果數(shù)據(jù)對象分布是規(guī)則的或數(shù)據(jù)集的大小很小,則的值很小.如果數(shù)據(jù)對象分布不規(guī)則或數(shù)據(jù)集的大小很大,則的值很大.但是,無論的值有多大,它仍然遠(yuǎn)遠(yuǎn)小于數(shù)據(jù)集大小的值.為了找到每個數(shù)據(jù)點的NaN,需要不斷擴(kuò)大鄰域的搜索范圍,當(dāng)達(dá)到自然穩(wěn)定狀態(tài),NaN搜索算法就停止.最大的鄰域就是數(shù)據(jù).NaN算法如算法1所示.

      NaN算法

      輸入:數(shù)據(jù)集

      輸出:,NaN,NaN數(shù)據(jù)

      初始化NaN.

      將數(shù)據(jù)放入到KD樹上進(jìn)行最鄰近搜索.

      -—個不同寬度高斯核上的權(quán)重系數(shù)

      判斷是否達(dá)到穩(wěn)定終止平衡條件.

      該算法無需任何參數(shù)即可自動完成NaN的整個過程,如果將最近鄰居的形成視為主動鄰居搜索的過程,則NaN的形成是不可行的,數(shù)據(jù)中的每個對象的最鄰近(-Nearest Neighbor, KNN)和逆最鄰近(Reverse Natural Neighbor, RNN)的搜索成本非常高.因此將KD樹引入到NaN搜索算法中.因為將KD樹引入到NaN的搜索中,所以NaN搜索的算法時間復(fù)雜度為(log).

      這幅肖像生長在現(xiàn)實的原野里,通靈通透,與城市現(xiàn)代人的畫像差異迥然、對照鮮明,其中折射出的文化意味自不待言。《蘇北女人》充滿艱辛而又富有自然詩意的田園,既是作為被現(xiàn)代傷害的一面被仿寫,又作為現(xiàn)代的“根”和“自己的開端”被想象,并被賦予拯救的力量。

      ..EAOStream介紹 EAOStream包括兩個階段.第一階段中,引入NaN算法,EAOStream通過NaN算法對前個數(shù)據(jù)點組成的數(shù)據(jù)集進(jìn)行處理得到值和微簇最小閾值,然后計算每個數(shù)據(jù)點與的距離之后,求其平均值設(shè)算法鄰域半徑為,通過引入NaN算法,得到EAOStream所需要的和,從而無需初始化參數(shù)值,通過數(shù)據(jù)點不斷進(jìn)入,自適應(yīng)更新和

      EAOStream框架如圖1所示,的計算式為

      其次,由于我國產(chǎn)業(yè)結(jié)構(gòu)中高碳產(chǎn)業(yè)占據(jù)了很大的比例,為有效應(yīng)對碳關(guān)稅,應(yīng)加快產(chǎn)業(yè)結(jié)構(gòu)優(yōu)化升級的進(jìn)程,實現(xiàn)國家產(chǎn)業(yè)整體向兩低兩高(低能耗、低排放、高附加值、高技術(shù)含量)的方向轉(zhuǎn)化,大力促進(jìn)新興產(chǎn)業(yè)的發(fā)展,例如太陽能產(chǎn)業(yè)、生物產(chǎn)業(yè)、風(fēng)能等。因此,我國既要全面配合產(chǎn)業(yè)政策調(diào)整,又要同經(jīng)濟(jì)增長方式轉(zhuǎn)變相一致,實現(xiàn)貿(mào)易與資源環(huán)境的協(xié)調(diào)發(fā)展,推動貿(mào)易政策優(yōu)先向競爭力導(dǎo)向轉(zhuǎn)變,提高出口產(chǎn)品的低碳競爭力。

      (6)

      為了針對數(shù)據(jù)集分布的自然規(guī)律,對數(shù)據(jù)點分布稀少或分布密集的區(qū)域,搜索的半徑可以采用加權(quán)多寬度高斯核函數(shù) (Weighted Gaussian Kernel with Multiple Widths, WGKMW) 進(jìn)行加權(quán),動態(tài)設(shè)置微簇的鄰域半徑.區(qū)域密度值越大時,鄰域半徑越大,反之則鄰域半徑越小.加權(quán)公式為

      (7)

      —鄰域半徑

      第二階段是相交的微簇,將微簇分為殼區(qū)域和核心區(qū)域,通過考慮與微簇外殼相交的核心區(qū)域來對微簇進(jìn)行分組,可以自動確定邊緣的微簇群.不具有最小閾值的微簇會存在異常值,每個微簇都含有一個圖形,圖2演示了微簇的相交.通過應(yīng)用圖結(jié)構(gòu)能夠最大程度減少微簇的破裂或最終死亡時分離微簇所需要的計算.EAOStream采用實時更新圖結(jié)構(gòu)的方式得到聚類結(jié)果,當(dāng)數(shù)據(jù)點到來后,計算修改后的微簇周圍的幾個相連的微簇的可達(dá)性,其余的點不需要修改,能夠確保微簇劃分的有效性.聚類形成過程和結(jié)果如圖2所示,數(shù)據(jù)和數(shù)據(jù)分別為數(shù)據(jù)集中數(shù)據(jù)點的橫坐標(biāo)及縱坐標(biāo),不同顏色的微簇代表不同的類別.

      算法處理流程總結(jié)如下.

      參數(shù)選擇.對前個數(shù)據(jù),利用NaN算法得到,計算每個數(shù)據(jù)點近鄰距離的和,并求平均值,所得到的值設(shè)為算法的鄰域半徑,從而能夠自適應(yīng)得到鄰域半徑和區(qū)域密度.

      初始化微簇.初始化參數(shù)主要是鄰域半徑、區(qū)域密度和衰減值,算法將第一個數(shù)據(jù)點用來初始化微簇,并將微簇的屬性設(shè)定初始值.

      分配核心微簇.在到達(dá)新數(shù)據(jù)點時,判斷數(shù)據(jù)樣本是否屬于當(dāng)前任何微簇.如果不是,則創(chuàng)建一個新的微簇.如果數(shù)據(jù)在當(dāng)前微簇中,進(jìn)一步檢查數(shù)據(jù)在微簇團(tuán)的核心半徑或殼半徑內(nèi).如果判斷數(shù)據(jù)點落在殼半徑區(qū)域內(nèi),則更新微簇的中心位置.

      刪除衰減到最小閾值的微簇.所有的微簇壽命減少到衰減量時,將微簇移除,并刪除與它相連的邊.

      更新集群.存在3種情況會使聚類圖進(jìn)行更新:在已存在的微簇中心點位置已發(fā)生改變;微簇發(fā)生移動或產(chǎn)生新的微簇;微簇的壽命衰減到設(shè)定的閾值.

      在上述情況下可以更改算法的邊緣列表,需要更新微簇群的數(shù)量,首先可通過NaN算法計算出合適的鄰域半徑和區(qū)域密度.當(dāng)微簇達(dá)到閾值或微簇中心位置發(fā)生移動時,微簇的圖形邊緣將發(fā)生修改,則產(chǎn)生的微簇的個數(shù)也發(fā)生改變.

      ..EAOStream復(fù)雜度分析 EAOStream采用了NaN算法初始化參數(shù),時間的復(fù)雜度是(log);新進(jìn)入后的算法僅和存在的有限個微簇中心的距離進(jìn)行比較,時間的復(fù)雜度為();檢查是否有新的微簇生成、衰老到指定閾值、更新圖譜結(jié)構(gòu)時間復(fù)雜度為().

      依據(jù)保存的微簇個數(shù)對數(shù)據(jù)流聚類算法的空間復(fù)雜度進(jìn)行衡量.EAOStream僅保存當(dāng)前微簇,以前的微簇不會保留,可以大量減少內(nèi)存消耗.

      2 實驗與結(jié)果分析

      為了在不同的環(huán)境中測試EAOStream的性能,采用了數(shù)據(jù)挖掘與知識發(fā)現(xiàn)網(wǎng)絡(luò)入侵檢測數(shù)據(jù)集(Data Mining and Knowledge Discovery Network Intrusion Detection Data Set,KDD CUP’99)、森林覆蓋類型Forest Covertype及多源局部放電信號(Multi-source Partial Discharge Signal,MS-PD)數(shù)據(jù)集進(jìn)行驗證.本文算法在軟件仿真實現(xiàn)后移植到硬件中,實驗的硬件環(huán)境為:Intel i7-8750 CPU,16 GB的內(nèi)存,Windows 10操作系統(tǒng),核心板為MZ7X 7035.KDD CUP’99數(shù)據(jù)集作為數(shù)據(jù)流輸入到算法中,多源PD信號數(shù)據(jù)集來自于校企合作項目,現(xiàn)場通過PD監(jiān)測系統(tǒng)對多種PD源放電信號進(jìn)行采集得到數(shù)據(jù)集,并同時將聚類效果與DenStream和SE-Stream算法進(jìn)行對比分析.為了評估聚類效果,通常采用的評估指標(biāo)包括純度、準(zhǔn)確度及F-Measure.

      (1) 純度是一種對聚類效果的測量方法,代表著簇本身的純度,其定義為

      (8)

      (2) 準(zhǔn)確度通過將模型產(chǎn)生的聚類效果與真實聚類進(jìn)行比較,來衡量模型是否成功,其定義為

      (9)

      (3) F-Measure的統(tǒng)計量為精確率和召回率的加權(quán)調(diào)和平均,主要用于評價分類模型的性能,其定義為

      (10)

      2.1 聚類實驗結(jié)果分析

      為了驗證EAOStream的性能,通過性能指標(biāo)純度、準(zhǔn)確度及來衡量聚類的質(zhì)量,同時將DenStream、SE-Stream與EAOStream進(jìn)行比較.在實驗室中,采用3種真實的數(shù)據(jù)集,第1個數(shù)據(jù)集是KDD CUP’99,使用其中數(shù)據(jù)集中的子集,包含 494 020 條記錄,每條記錄對應(yīng)一個正常的連接或4種類型的網(wǎng)絡(luò)攻擊之一,具有34個屬性和22個類.第2個數(shù)據(jù)集是Forest Covertype,來自于加州大學(xué)歐文分校(University of CaliforniaIrvine,UCI)機器學(xué)習(xí)植被型數(shù)據(jù)集,其中包含 581 012 條記錄,具有10個屬性和7個類.第3個數(shù)據(jù)集是MS-PD數(shù)據(jù)集.與校企合作項目中的PD監(jiān)測系統(tǒng),在實地高壓場景下模擬MS-PD信號,通過特高頻傳感器采集產(chǎn)生的多種混合的PD信號進(jìn)行實驗,采集到真實的MS-PD信號數(shù)據(jù)集.其中數(shù)據(jù)集包含 548 573 條記錄,具有2個屬性和5個類.在這3種數(shù)據(jù)集中創(chuàng)建500個間隔為 1 000 個樣本的時間間隔并將它們分成25組,在這25組中求取平均的純度、準(zhǔn)確度及.KDD CUP’99數(shù)據(jù)集是流行的數(shù)據(jù)集,用來測試不斷變化的聚類算法,將EAOStream、DenStream及SE-Stream進(jìn)行比較.為了使聚類效果更好,將數(shù)據(jù)歸一化到相對于區(qū)域半徑合適的范圍.通過取性能指標(biāo)的平均值來進(jìn)一步降低該度量的相關(guān)性,性能指標(biāo)分析結(jié)果如圖3所示,EAOStream平均純度為97%,超過SE-Stream和DenStream,平均純度最快達(dá)到100%.可以看出,EAOStream能夠快速適應(yīng)這種變化.在考慮準(zhǔn)確度和時,注意到EAOStream平均準(zhǔn)確度和保持接近95%以上,其余兩者算法平均準(zhǔn)確度都有降低到80%以下.EAOStream比其他兩種算法聚類精度更穩(wěn)定,在不斷時間積累下,精度會逐步提高.這是因為其采用的NaN算法具有不斷從自適應(yīng)鄰域半徑和區(qū)域密度進(jìn)入數(shù)據(jù)點的特征,從而達(dá)到更好的聚類效果.圖4所示為MS-PD數(shù)據(jù)集3種聚類算法性能對比, 圖中為樣本輸入的速度,設(shè)置數(shù)據(jù)流到達(dá)的速率單位為pt/s,pt為像素單位,每隔25 s顯示一次聚類結(jié)果.采用了MS-PD數(shù)據(jù)集,研究其平均純度和準(zhǔn)確度.EAOStream針對多個樣本速度和時間段來測量MS-PD數(shù)據(jù)集的平均純度和準(zhǔn)確度,驗證EAOStream基于不同樣本速度自適應(yīng)參數(shù)的能力,算法的平均純度和準(zhǔn)確度在所有采樣速度下都維持在85%以上,比其他兩者聚類算法更好.

      表1所示為不同算法在真實數(shù)據(jù)集的性能對比.可見,在MS-PD數(shù)據(jù)集中,EAOStream純度為98.75%,準(zhǔn)確度為97.23%,為98.14%,這表明EAOStream能夠快速適應(yīng)變化,因MS-PD數(shù)據(jù)集中PD信號存在從一種到多種PD漸變的過程,所以EAOStream可以克服人為主觀選擇參數(shù)的問題,通過NaN算法自適應(yīng)鄰域半徑,創(chuàng)建KD樹來提高查詢近鄰的效率,根據(jù)氣體絕緣變電站PD信號產(chǎn)生的特性,從一種PD源到多種PD源漸變,其中包括干擾脈沖的存在.EAOStream是一種支持進(jìn)化變化的算法,可以成功實現(xiàn)微簇群結(jié)構(gòu)隨時間的變化,這可以提高聚類的成功率.在大多數(shù)測試數(shù)據(jù)集中,EAOStream都優(yōu)于其他的算法.EAOStream在KDD CUP’99數(shù)據(jù)集上,評價指標(biāo)平均純度比SE-Stream稍差,EAOStream在高維的數(shù)據(jù)集聚類效果不是特別穩(wěn)定,而SE-Stream專為高維數(shù)據(jù)流設(shè)計.EAOStream設(shè)計對任意形狀的微簇結(jié)構(gòu)圖都有很好的分類效果且能夠自適應(yīng)半徑特征,當(dāng)數(shù)據(jù)特征發(fā)生很大變化時也能夠達(dá)到好的聚類效果.

      2.2 多種PD源信號聚類分離現(xiàn)場實測

      為了驗證EAOStream在PD信號時域特征聚類分離的可行性和有效性,與校企合作項目建立PD監(jiān)測系統(tǒng),在實驗室中對多種不同類型混合的PD類型進(jìn)行系統(tǒng)測試,特高頻缺陷PD模擬信號發(fā)生器實物如圖5所示,將采集的信號輸入到硬件系統(tǒng)板中,如圖6所示,其中包括信號采集單元和信號處理單元,將EAOStream聚類算法移植硬件系統(tǒng)板中,實時在線處理完后的數(shù)據(jù)上傳到上位機顯示.本文選取PRPD圖譜中統(tǒng)計參數(shù)中的和組成的二維圖譜來實現(xiàn)對多種PD信號的分離.在實驗室采集多種PD信號形成數(shù)據(jù)集,在3種聚類算法的效果對比圖7所示,通過顏色來判斷類別,相同顏色的團(tuán)簇代表一類.由圖7可知,有5類信號,Denstream和SE-Stream對圖中第1類和第2類的分離的效果無影響,第1類信號和第2類信號微簇之間較近,容易將其判斷為一類信號;圖7(b)、7(c)所示第1類信號和第2類信號顏色被算法判斷成一種顏色,EAOStream能夠準(zhǔn)確將兩種信號分離出來.

      在實際測試中,通過特高頻傳感器將多源PD信號輸入到采集單元中,然后進(jìn)入到處理單元提取脈沖的特征值,通過EAOStream將不同特征值的多源PD信號實時分離,將數(shù)據(jù)上傳到上位機中,數(shù)據(jù)包括相位、放電幅度及標(biāo)記3個參數(shù).在整個過程中各個單元同步進(jìn)行,數(shù)據(jù)源源不斷進(jìn)入到處理單元中.

      在實際項目中,將算法固化到硬件系統(tǒng),很難通過人工在現(xiàn)場調(diào)試參數(shù),需要算法本身根據(jù)流數(shù)據(jù)特征來自適應(yīng)修改鄰域半徑和區(qū)域密度,從而達(dá)到最佳的聚類分離效果.在PRPD圖譜顯示結(jié)果如圖8所示,放電次數(shù)映射到顏色空間上,每個分布位置可以疊加,從而可以做到顏色標(biāo)識,根據(jù)累積的次數(shù)分為6個顏色級別,對應(yīng)規(guī)則如表2所示.實驗中采用兩種信號混合輸入,分別是懸浮電極放電信號和尖端放電信號.由于實驗室懸浮電極放電信號的產(chǎn)生沒有固定相位,所以隨著時間的推移,相位會發(fā)生偏移,最后形成一條綠色的線條.尖端放電信號由實驗室中高壓試驗變壓器和特高頻缺陷PD模擬信號發(fā)生器產(chǎn)生,因相位固定,隨著時間累計,中間部分顏色會一直變深,最后趨于穩(wěn)定.實驗證明,EAOStream對多種混合PD信號分離效果不錯.

      3 結(jié)語

      本文分析了當(dāng)前氣體絕緣變電站故障診斷的現(xiàn)狀,針對傳統(tǒng)的DBSCAN聚類算法不能處理實時且不斷變化的多種PD信號特征,提出了聚類算法EAOStream,該算法可以完全在線處理數(shù)據(jù),具有自適應(yīng)半徑的特征,對任意形狀的簇的分類都有一定的效果.提出的算法中使用了NaN算法,主要用于自適應(yīng)鄰域半徑和區(qū)域密度.基于使用純度、準(zhǔn)確度及的質(zhì)量指標(biāo)對真實數(shù)據(jù)集進(jìn)行了廣泛評估.與其他算法相比,實驗研究表明該算法在合理的時間內(nèi)具有較高聚類成功率.在未來的工作中,將著重于提高算法的穩(wěn)健性,擴(kuò)展處理高維數(shù)據(jù)流,集中處理在高維數(shù)據(jù)集情況下降低算法的計算復(fù)雜性以及消除復(fù)雜數(shù)據(jù)流中噪聲對聚類的負(fù)面影響,從而進(jìn)一步提高該算法的性能.

      猜你喜歡
      數(shù)據(jù)流鄰域半徑
      汽車維修數(shù)據(jù)流基礎(chǔ)(下)
      稀疏圖平方圖的染色數(shù)上界
      連續(xù)展成磨削小半徑齒頂圓角的多刀逼近法
      基于鄰域競賽的多目標(biāo)優(yōu)化算法
      一種提高TCP與UDP數(shù)據(jù)流公平性的擁塞控制機制
      一些圖的無符號拉普拉斯譜半徑
      關(guān)于-型鄰域空間
      基于數(shù)據(jù)流聚類的多目標(biāo)跟蹤算法
      熱采水平井加熱半徑計算新模型
      北醫(yī)三院 數(shù)據(jù)流疏通就診量
      苍南县| 太谷县| 大同市| 江都市| 平乐县| 日土县| 马关县| 仁化县| 宁晋县| 泰和县| 广南县| 岳西县| 黑水县| 克山县| 太原市| 饶阳县| 游戏| 彰化市| 新疆| 无极县| 定兴县| 田阳县| 镇巴县| 彰化市| 西充县| 长海县| 丰顺县| 辰溪县| 五峰| 福贡县| 双峰县| 石家庄市| 阳江市| 东莞市| 黄大仙区| 莆田市| 左云县| 博乐市| 苍南县| 白玉县| 虎林市|