楊曉燕,謝滿承,郭小璇,趙巖,陳翀旻,陳子民,廖卓穎
(1.廣西電網(wǎng)有限責任公司南寧供電局,南寧 530001; 2.廣西電網(wǎng)有限責任公司電力科學研究院,南寧 530023;3.中國科學院廣州能源研究所,廣州 501640)
隨著我國“雙碳”目標的提出及碳減排工作的不斷深入,以新能源為主體的新型電力系統(tǒng)快速發(fā)展,光伏發(fā)電因可用性高、安裝速度快、維護成本低、能源獨立性強,成為常用的可再生清潔能源之一[1-2]。國家能源局公布的數(shù)據(jù)顯示,截至2022 年年底,全國累計光伏并網(wǎng)容量約為3.920 4 億kW,同比增長了28.12%,其中集中式光伏電站累計并網(wǎng)容量為2.344 2 億kW,分布式光伏電站累計并網(wǎng)容量為1.576 2 億kW[3]。光伏電站系統(tǒng)由組件、逆變器、匯流箱、支架等多個部件組成,它們通常在惡劣的室外環(huán)境中運行,強風、大雨、冰雹、污染、紫外線、熱循環(huán)和不當?shù)倪\輸、安裝、維護等都會導致光伏系統(tǒng)出現(xiàn)各種故障[4]。光伏系統(tǒng)部件眾多,任何一個環(huán)節(jié)出現(xiàn)問題,都會影響電站的正常運行[5],輕則損失發(fā)電量(據(jù)Firth 等的統(tǒng)計,光伏陣列故障可導致輸出電能減少18.9%[6]),重則引起火災(zāi)等。光伏系統(tǒng)故障大多發(fā)生在直流側(cè),即模塊或陣列本身,也可能發(fā)生在交流側(cè),涉及逆變器或與電網(wǎng)的連接異常[7]。據(jù)統(tǒng)計,組件、逆變器、匯流箱等直流側(cè)設(shè)備故障占比高達90.18%;電纜、箱式變電站、土建、升壓站等交流側(cè)設(shè)備故障占比達9.82%[8]。為了確保光伏陣列可靠運行,近年來許多國內(nèi)外學者對故障檢測和診斷方法進行了廣泛研究。
通過時序電流-電壓(I-V)測量進行光伏陣列故障診斷是目前較普遍的診斷方法[9],光伏電站數(shù)據(jù)采集與監(jiān)視控制(SCADA)系統(tǒng)通過傳感器測量并采集各部件的相關(guān)運行參數(shù),這些電壓、電流、頻率等參數(shù)能反映組件的運行狀態(tài)信息[10]。對比電壓、電流、頻率等數(shù)據(jù)正常運行值和實際值間的差值,經(jīng)過算法分析得到故障診斷的結(jié)果[9]。在分析計算過程中,常采用群智能算法對核極限學習機[11-12]、神 經(jīng) 網(wǎng) 絡(luò)[13]、隨 機 森 林(Random Forest,RF)[14]等分類診斷算法進行優(yōu)化。文獻[11]提出了一種基于螢火蟲擾動的改進麻雀搜索算法優(yōu)化傳統(tǒng)極限學習機的光伏系統(tǒng)故障診斷方法,能夠有效解決傳統(tǒng)故障診斷方法收斂速度慢的問題。文獻[12]利用Levy 飛行策略和自適應(yīng)t分布策略對麻雀搜索算法進行改進,再利用改進后的麻雀搜索算法對核極限學習機的核參數(shù)和正則化系數(shù)進行優(yōu)化,提高了核極限學習機分類的準確率。文獻[13]提出了利用自適應(yīng)權(quán)重粒子群對反向傳播(Back Propagationg,BP)神經(jīng)網(wǎng)絡(luò)優(yōu)化的光伏陣列故障診斷方法,提高了故障診斷的實時性。文獻[14]提出了一種基于級聯(lián)RF 的光伏組件在線故障診斷模型,其準確率和收斂時間都優(yōu)于單一的RF 模型與BP神經(jīng)網(wǎng)絡(luò)模型。
神經(jīng)網(wǎng)絡(luò)故障診斷方法對樣本數(shù)量要求高,對相關(guān)參數(shù)的依賴性強;核極限學習機方法對數(shù)據(jù)集中存在的離群點過于敏感;而RF 算法對泛化誤差采用無偏估計,具有較強的泛化能力及強抗干擾和抗過擬合特性。因此,本文選擇RF 分類器作為光伏系統(tǒng)故障診斷的基礎(chǔ)算法,同時在原子軌道搜索(Atomic Orbital Search,AOS)算法的基礎(chǔ)上提出改進的IAOS 算法,共同構(gòu)建光伏陣列故障診斷模型。首先,對光伏系統(tǒng)故障進行分類;然后,用IAOS算法優(yōu)化RF 分類器,形成更加高效的IAOS-RF 模型;最后,對光伏系統(tǒng)故障進行仿真試驗分析。
本文使用實驗室可實現(xiàn)的典型并網(wǎng)光伏系統(tǒng)來驗證所提算法在最大功率點跟蹤(Maximum Power Point Tracking,MPPT)模式下的故障診斷性能。該光伏系統(tǒng)由N×M個光伏組件陣列、反饋傳感器、MPPT 控制器、逆變器和升壓變壓器組成,系統(tǒng)結(jié)構(gòu)如圖1所示。
圖1 光伏系統(tǒng)結(jié)構(gòu)Fig.1 Structure of a PV system
常見的光伏系統(tǒng)故障只考慮了光伏組件老化、遮陰問題和陣列之間的短路、開路問題[15-17],很少涉及系統(tǒng)中傳感器、控制器、逆變器等元件的故障。本文除了常見的光伏陣列故障,更偏重對不同元件的故障類型進行分類,所述光伏系統(tǒng)不同工作狀態(tài)包括正常狀態(tài)、逆變器故障、反饋傳感器故障、電網(wǎng)異常故障、局部陰影故障、單支路開路故障、MPPT控制器故障和升壓轉(zhuǎn)換器控制器故障,并對此進行編號。表1為以上運行狀態(tài)及故障成因。
AOS 算法是在原子搜索算法基礎(chǔ)上提出的新型元啟發(fā)式算法,原子間的相互作用力是該算法數(shù)學模型的關(guān)鍵,而電子密度配置和原子吸收或發(fā)射能量的基本原理則是AOS算法的主要思想[18]。AOS算法模擬了電子在高低兩種能態(tài)之間的轉(zhuǎn)移過程,在該算法中,每個電子代表一個可行解X,搜索空間為圍繞原子核的電子云,其物理模型可分成不同半徑的薄球殼層,也稱為電子軌道。每個電子由搜索空間中的可行解Xi表示,決策變量xji用于定義候選解在搜索空間中的位置,該目標的數(shù)學方程為
式中:m為搜索空間內(nèi)電子的數(shù)量;d為可行解的維數(shù)。
電子云中電子的初始位置根據(jù)以下數(shù)學方程隨機確定。
式中:E為目標函數(shù)值的向量;Ei為第i個電子的能級。
在基于量子的原子模型中,電子在原子核周圍的位置由電子的概率密度函數(shù)(Probability Density Function,PDF)決定。原子核周圍的電子云分為多個虛擬層,PDF用于確定可行解在這些層中的位置??尚薪饣谧钚』蜃畲蠡瘍?yōu)化問題按升序或降序進行排序,較好目標函數(shù)值的可行解代表較低能級的電子。因此,具有較高PDF 值的可行解位于內(nèi)部虛擬電子層,而具有較低PDF 值的可行解位于外部虛擬電子層,如圖2所示。
圖2 通過PDF確定可行解位置Fig.2 Determining the positions of solution candidates by PDF
圖2 所示的原子軌道模型中,隨機整數(shù)n用于表示虛擬層L的數(shù)量。這些層將整個搜索空間劃分為多個部分,以便在數(shù)學上表示原子核周圍電子的波動行為。這些層的半徑表示這些層在核周圍的分布方式,其中較小半徑的層為核層(L0),較大半徑的層為核周圍n個(L1—Ln)球形層。
虛擬層中可行解位置Xk和目標函數(shù)值Ek的矢量方程如下
在光子的發(fā)射、吸收部分的更新策略中引入自適應(yīng)權(quán)重和反向?qū)W習機制更新電子位置,可以提高搜索空間的全面勘探和開發(fā)能力,更加快速準確地找到最佳值。
利用IAOS算法對RF的決策樹數(shù)目和決策樹深度進行優(yōu)化求解,形成更加高效的組合訓練模型。選取該模型的期望輸出值和實際輸出值的均方差為目標函數(shù)即適應(yīng)度值,利用原子軌道中的電子聚集來確定決策樹數(shù)目和決策樹深度,當均方差值最小時,就確定了RF的一組理論最優(yōu)參數(shù)。IAOS-RF模型的具體實現(xiàn)步驟如下。
(1)數(shù)據(jù)預(yù)處理。對采集的原始特征參數(shù)進行數(shù)據(jù)預(yù)處理,包括數(shù)據(jù)歸一化和數(shù)據(jù)打亂等。
(2)算法初始化。初始化AOS 算法參數(shù)和RF的最大迭代次數(shù),其中AOS 算法參數(shù)及其常見的取值范圍為:軌道數(shù)n∈[2,10],原子數(shù)i∈[2,50],光子速率vp∈(0,1)。
(3)計算個體適應(yīng)度值。每個電子都有一個能量狀態(tài),對應(yīng)各個個體的適應(yīng)度值。
(4)確定各個層級的結(jié)合能和結(jié)合態(tài)。將各層中的電子位置平均值記為結(jié)合態(tài),結(jié)合能為各個個體適應(yīng)度值的平均值。
(5)更新電子位置。引入自適應(yīng)權(quán)重和反向?qū)W習機制對光子的發(fā)射、吸收部分的更新策略進行改進,更新電子狀態(tài)。
(6)更新電子最優(yōu)位置與適應(yīng)度值。在尋優(yōu)迭代過程中,對電子的位置向量和適應(yīng)度進行更新。
(7)確定RF 分類器最優(yōu)參數(shù)。重復步驟(3)—(6),當達到算法最大迭代次數(shù)或滿足算法設(shè)定精度時,則認為算法趨于收斂,停止迭代,輸出理論最優(yōu)決策樹數(shù)目和決策樹深度給RF分類器。
(8)抽取子數(shù)據(jù)集。采取有放回的抽樣方式在原始數(shù)據(jù)集中進行子數(shù)據(jù)集的隨機抽取。
(9)構(gòu)建決策樹。假設(shè)一個子數(shù)據(jù)集有X個屬性,決策樹的節(jié)點需要分裂時,從這些屬性中隨機抽選出Y個屬性(Y?X);再通過信息增益方式從Y個屬性中選擇一個作為該節(jié)點的分裂屬性;不斷重復這個步驟,直到達到?jīng)Q策深度值為止。
(10)構(gòu)建RF。按照步驟(8)—(9)來構(gòu)建大量若干的決策樹直到達到?jīng)Q策樹數(shù)目值為止,這些子決策樹就會構(gòu)成RF。
(11)進行故障診斷。將數(shù)據(jù)集輸入不同的子決策樹,得到不同的判斷結(jié)果,判斷結(jié)果最多的就是RF的最佳故障診斷分類結(jié)果。
本文數(shù)據(jù)來自Azzeddine Bakdi提供的實驗室并網(wǎng)光伏系統(tǒng)故障數(shù)據(jù)[19]。在并網(wǎng)光伏系統(tǒng)的8種工作狀態(tài)下分別采集200 組數(shù)據(jù),共1 600 組,隨機抽取1 200 組數(shù)據(jù)作為故障診斷的訓練樣本,其余400組數(shù)據(jù)作為該模型的測試樣本。采用的光伏發(fā)電陣列工作于最大功率點,關(guān)注的電氣參數(shù)包括光伏陣列電流Ipv、光伏陣列電壓Vpv、直流電壓Vdc、A 相電流ia、B相電流ib、C相電流ic、A相電壓va、B相電壓vb、C相電壓vc,典型樣本數(shù)據(jù)見表2。
將IAOS-RF 算法的最大迭代次數(shù)設(shè)為100,用于電子位置測定的光子率設(shè)為0.1,電子數(shù)量設(shè)為30,虛擬層數(shù)設(shè)為5。以上參數(shù)對算法性能的影響是相互關(guān)聯(lián)的:較小的最大迭代次數(shù)和較高的光子率可加快算法的收斂速度,但也可能降低搜索的精度;較多的電子數(shù)量和較大的虛擬層數(shù)可以增加全局搜索的能力,但也增加了計算和存儲的壓力。因此,選擇適當?shù)膮?shù)組合以平衡算法的速度和品質(zhì)至關(guān)重要。本文參數(shù)設(shè)定原因如下。
表2 光伏陣列典型樣本數(shù)據(jù)Table 2 Typical sample data for PV arrays
(1)本算法用于故障診斷場景時,目標函數(shù)趨于穩(wěn)定所需的迭代次數(shù)基本都少于100,因此將最大迭代次數(shù)設(shè)為100。較小的迭代次數(shù)可以在相對較短的時間內(nèi)得到結(jié)果,適用于簡單問題或需要較快得到結(jié)果的場景,避免算法過度迭代。
(2)較高的光子率意味著光子更有可能進入較遠的位置,擴大搜索空間,以便更好地發(fā)現(xiàn)潛在的解,但會降低搜索精度。綜合考慮精度和收斂速度要求,選擇光子率為0.1。
(3)較多的電子數(shù)量可以提高算法的全局搜索能力,但也增加了計算和存儲的成本,選擇適當?shù)碾娮訑?shù)量可在考慮效率的同時保持算法的搜索品質(zhì)。為了平衡搜索的速度和精度,將電子數(shù)量設(shè)為30。
(4)通過引入虛擬層,算法可以探索更多不同的解并避免陷入局部最優(yōu)解,較大的虛擬層數(shù)將增加計算和存儲要求,但可以提高算法的搜索效果。為了增加搜索的靈活性和多樣性,將虛擬層數(shù)設(shè)為5。
利用3.1 節(jié)采集的數(shù)據(jù)集,在IAOS-RF 算法模型中進行迭代訓練,將訓練結(jié)果與AOS-RF 模型和傳統(tǒng)RF 模型的訓練結(jié)果進行對比,其中各電氣特征參數(shù)在診斷過程中的重要性如圖3 所示。其中,Ipv,Vpv,Vdc這3 個特征參數(shù)占較高比重。由此可見,不同運行狀態(tài)下,這3個參數(shù)差異較大,其閾值差能有效幫助識別故障類型。
圖3 電氣特征參數(shù)的重要性Fig.3 Importance of electrical characteristic parameters
經(jīng)過仿真試驗得到IAOS-RF 和AOS-RF 算法模型的迭代次數(shù)值和適應(yīng)度值,結(jié)果見表3。由表3可以看出:IAOS-RF 算法模型迭代55次左右時目標函數(shù)的結(jié)果就趨于穩(wěn)定,而AOS-RF 需要迭代70 次左右才能趨于穩(wěn)定,說明改進后的算法可以更好地跳出局部極值點,能以更快的速度收斂到全局最優(yōu);同時,IAOS-RF 算法模型適應(yīng)度為0.032,而AOS-RF算法模型的適應(yīng)度為0.035,說明改進后的算法尋優(yōu)精度更好。這是因為引入了自適應(yīng)權(quán)重和反向?qū)W習機制對光子發(fā)射和吸收部分的更新策略進行改進,用于更新電子狀態(tài)。自適應(yīng)權(quán)重機制的作用是根據(jù)當前搜索狀態(tài)和解的情況,動態(tài)調(diào)整光子發(fā)射和吸收的權(quán)重,使得算法能夠更好地平衡探索和利用的能力,更有效地搜索解空間;通過引入反向?qū)W習機制,電子的位置將根據(jù)光子發(fā)射和吸收的結(jié)果進行更新,這種更新機制使得電子能夠更快地朝著更優(yōu)解的方向移動,從而加速算法的收斂。
表3 2種算法模型的迭代次數(shù)和適應(yīng)度Table 3 Iteration times and fitness of the two models
對故障特征參數(shù)的樣本數(shù)據(jù)進行訓練后,將其余400 組測試集數(shù)據(jù)輸入3 種模型,得到的測試集的故障診斷分類結(jié)果見表4。
表4 3種算法模型診斷結(jié)果Table 4 Diagnostic accuracy of the three models
(1)在相同樣本數(shù)據(jù)集下,IAOS-RF 算法模型的診斷精度達到了98.00%,略高于AOS-RF 的95.00%,二者均遠高于RF 算法模型的77.25%。這是由于AOS 優(yōu)化了RF 分類器的決策樹數(shù)目和決策樹深度,使得分類器中的決策樹可以更好地將光伏陣列的故障數(shù)據(jù)分解為不同維度的細節(jié)信息,理論上可以不斷逼近實際故障類型的輸入輸出非線性映射關(guān)系。
(2)在測試的400組數(shù)據(jù)中,IAOS-RF 算法模型僅誤診斷8 組數(shù)據(jù),IAOS-RF 算法模型的測試集預(yù)測結(jié)果如圖4所示。AOS-RF 算法模型誤診斷20組數(shù)據(jù),傳統(tǒng)RF 模型則誤診斷60 組數(shù)據(jù)。表明改進的IAOS 優(yōu)化RF 分類器后,有效增強了故障模型的分類診斷能力,在區(qū)域搜索過程中收斂速度和適應(yīng)度均得到了一定提升,因此可以更準確地對光伏系統(tǒng)故障進行診斷。另外,對于第4種故障,即電網(wǎng)異常故障,IAOS-RF 算法和AOS-RF 算法的誤診率均為最高。究其原因,可能是樣本不平衡以及算法對特定故障類型的魯棒性不足等。
針對這些問題,提出以下能增強算法對各種故障類型適應(yīng)能力的方法。
圖4 IAOS-RF算法模型測試集預(yù)測結(jié)果Fig.4 Predicted results of the testing set by IAOS-RF algorithm
(1)數(shù)據(jù)清洗和預(yù)處理。引入更多的數(shù)據(jù)清洗和預(yù)處理步驟,減少噪聲,處理缺失數(shù)據(jù)等,以提高算法對數(shù)據(jù)質(zhì)量的魯棒性并降低誤診斷的風險。
(2)特征選取和特征工程。使用領(lǐng)域?qū)<业戎R,結(jié)合模型進行自動篩選和特征提取,進一步改善特征表示能力,優(yōu)化特征選擇的過程。
針對光伏系統(tǒng)故障難以被準確高效地診斷和分類問題,利用IAOS-RF 算法模型對光伏系統(tǒng)進行故障診斷,得到如下結(jié)論。
(1)IAOS具有更強的尋優(yōu)能力和更快的收斂速度,可有效對光伏系統(tǒng)故障進行診斷,不受模型其他參數(shù)影響。
(2)相較于傳統(tǒng)RF 和AOS-RF 算法模型,IAOS-RF 算法模型可以更加迅速準確地識別出光伏陣列的各類故障,在故障診斷效率和精度上都有明顯的優(yōu)勢。
(3)利用IAOS-RF 算法建立基于數(shù)據(jù)驅(qū)動的診斷模型,在樣本有限的情況下具有良好的泛化能力,能夠有效提高光伏發(fā)電陣列故障分類的準確性,仿真證明該方法的故障診斷準確率可達98%。
IAOS-RF 算法在光伏系統(tǒng)故障診斷方面取得了顯著的成果,但仍存在一些局限性和改進空間,需要進一步研究和探討。
(1)在現(xiàn)實應(yīng)用中,光伏系統(tǒng)故障數(shù)據(jù)可能受到多種因素的影響,如噪聲、缺失數(shù)據(jù)等。因此,如何處理和優(yōu)化這些數(shù)據(jù)質(zhì)量問題以及如何更準確地選擇和提取故障特征,仍然是一個值得研究的方向。
(2)盡管IAOS-RF 算法能夠有效地處理光伏系統(tǒng)的故障診斷問題,但結(jié)合其他機器學習方法可能進一步提升其性能。例如,可以考慮結(jié)合深度學習方法,如卷積神經(jīng)網(wǎng)絡(luò)或循環(huán)神經(jīng)網(wǎng)絡(luò),以便更好地解決特征提取和模式識別問題。
(3)隨著光伏系統(tǒng)的不斷發(fā)展,其結(jié)構(gòu)和運行情況可能變得更加復雜。如何進一步提升IAOSRF算法的泛化能力,以適應(yīng)各種系統(tǒng)結(jié)構(gòu)和工況變化,是未來研究的一個關(guān)鍵方向。