王騰達(dá) 孫昊 李前
關(guān)鍵詞:機(jī)器學(xué)習(xí);光伏組件;熱斑故障;故障危害識(shí)別
1光伏組件熱斑故障介紹及產(chǎn)生原因
1.1介紹
光伏組件熱斑故障是指光伏電池組件表面出現(xiàn)局部溫度升高或局部損壞的現(xiàn)象。光伏組件熱斑故障通常是由電池組件中的某些問(wèn)題引起的,如電池片質(zhì)量不均勻、電池片間接觸不良、接觸電阻過(guò)大、電池片內(nèi)部和蓋板中存在缺陷等。熱斑故障會(huì)對(duì)光伏組件的性能和壽命產(chǎn)生不利影響。局部溫度升高可能會(huì)導(dǎo)致光伏組件的整體效率下降,因?yàn)闊岚邥?huì)消耗一部分光能,使其不能轉(zhuǎn)化為電能。熱斑故障可能會(huì)導(dǎo)致局部電池片損壞,使得整個(gè)組件的性能下降,并最終影響電池組件的壽命。
1.2產(chǎn)生原因
光伏組件熱斑故障的產(chǎn)生受到多種因素影響,因此需要綜合考慮并采取相應(yīng)的措施來(lái)預(yù)防和解決。具體影響因素如下:①電池片質(zhì)量不均勻。在光伏組件制造過(guò)程中,可能會(huì)存在電池片質(zhì)量不均勻的情況,導(dǎo)致部分區(qū)域的電池片性能較差,易發(fā)生局部升溫,形成熱斑。②電池片間接觸不良。光伏組件中的電池片通過(guò)電池片間的導(dǎo)線連接,如果連接方式有問(wèn)題或存在松動(dòng)現(xiàn)象,可能導(dǎo)致局部電池片間接觸不良,產(chǎn)生局部高電阻,使得該區(qū)域溫度升高,引發(fā)熱斑。③電池片內(nèi)部缺陷。電池片內(nèi)部可能存在生產(chǎn)過(guò)程中出現(xiàn)的缺陷,如晶體缺陷、金屬污染等,這些缺陷會(huì)導(dǎo)致局部電池性能下降,產(chǎn)生熱斑。④蓋板缺陷。如果光伏組件的蓋板存在缺陷,如局部失效、損壞,可能導(dǎo)致太陽(yáng)能光線過(guò)度聚焦在局部區(qū)域,引起局部溫度升高,產(chǎn)生熱斑。⑤接觸電阻過(guò)大。如果光伏組件中的連接件存在接觸電阻過(guò)大的情況,會(huì)使得局部電路過(guò)熱,形成熱斑。⑥溫度梯度效應(yīng)。當(dāng)光伏組件表面存在溫度梯度時(shí)(不同區(qū)域間的溫度差異),可能會(huì)導(dǎo)致局部熱斑,尤其是在不均勻的發(fā)電場(chǎng)景下,易產(chǎn)生此效應(yīng)。⑦遮擋物影響。光照條件良好,任何遮擋物都可能導(dǎo)致局部區(qū)域過(guò)度受熱,從而在光伏組件表面形成熱斑。⑧污染和覆蓋。光伏組件表面的污染或長(zhǎng)期的陰影覆蓋可能導(dǎo)致局部區(qū)域的溫度升高,引發(fā)熱斑。
2相關(guān)算法介紹
2.1決策樹(shù)
決策樹(shù)是一種機(jī)器學(xué)習(xí)模型,模擬了一個(gè)樹(shù)形結(jié)構(gòu),結(jié)構(gòu)中的每個(gè)節(jié)點(diǎn)代表一個(gè)特征或?qū)傩裕織l邊代表該特征可能的取值,主要用于分類和預(yù)測(cè)任務(wù)。其通過(guò)一系列的決策規(guī)則來(lái)對(duì)數(shù)據(jù)進(jìn)行分類或預(yù)測(cè),每個(gè)決策規(guī)則都基于特征的屬性。決策樹(shù)的構(gòu)建過(guò)程是通過(guò)對(duì)數(shù)據(jù)集進(jìn)行分割,直到達(dá)到終止條件則停止。新數(shù)據(jù)會(huì)按照相同規(guī)則被決策樹(shù)分類到最終的葉節(jié)點(diǎn),從而得到相應(yīng)的預(yù)測(cè)結(jié)果。決策樹(shù)模型能夠?yàn)閱?wèn)題提供清晰而直觀的解釋,進(jìn)而推斷結(jié)果,因此得到了廣泛應(yīng)用。決策樹(shù)具體算法根據(jù)不同的特征選擇策略被劃分,這些算法在決策樹(shù)構(gòu)建和分裂的過(guò)程中采用不同的策略和指標(biāo)。迭代二分器3代(iterative dichotomiser 3,ID3)算法使用信息增益來(lái)選擇最佳的特征進(jìn)行分裂;分類回歸樹(shù)4.5代(classification and regression trees 4.5,C4.5)算法是ID3算法的改進(jìn)版本,使用信息增益比來(lái)選擇特征,并且C4.5還可以處理連續(xù)型特征;分類回歸樹(shù)(classification and regression trees,CART)算法是一種既可用于分類,又可用于回歸的機(jī)器學(xué)習(xí)算法。在決定如何對(duì)數(shù)據(jù)進(jìn)行分裂時(shí),CART算法使用基尼指數(shù)來(lái)評(píng)估特征的重要性,從而選擇最佳特征進(jìn)行分裂。
2.2梯度提升決策樹(shù)
梯度提升決策樹(shù)(gradient boosting decisiontree,GBDT)是一種集成學(xué)習(xí)方法,通過(guò)將弱分類器(通常是決策樹(shù))組合成一個(gè)強(qiáng)分類器來(lái)提高預(yù)測(cè)性能。GBDT使用的梯度提升算法是一種迭代的優(yōu)化算法,通過(guò)逐步優(yōu)化損失函數(shù)來(lái)構(gòu)建一個(gè)強(qiáng)大的集成模型。在每次迭代中,GBDT都會(huì)嘗試調(diào)整損失函數(shù)的梯度方向,不斷擬合殘差,從而逐步提升模型的性能。GBDT的基學(xué)習(xí)器通常采用決策樹(shù),每棵決策樹(shù)都可對(duì)已構(gòu)建決策樹(shù)的預(yù)測(cè)誤差進(jìn)行優(yōu)化,逐步減小殘差,最終構(gòu)成一個(gè)強(qiáng)大的集成模型。為了避免過(guò)擬合,引入正則化項(xiàng),將決策樹(shù)的深度限制在一定范圍內(nèi),以避免模型過(guò)于復(fù)雜。同時(shí),設(shè)置葉子節(jié)點(diǎn)的最小樣本數(shù),保證每個(gè)葉子節(jié)點(diǎn)中包含足夠的樣本數(shù)據(jù),提高模型的準(zhǔn)確性和魯棒性。在訓(xùn)練完成后,通過(guò)將多個(gè)弱分類器的預(yù)測(cè)結(jié)果進(jìn)行加權(quán)求和,集成學(xué)習(xí)可以有效地減少學(xué)習(xí)器的偏差和方差,并提高整體模型的魯棒性和泛化臺(tái)旨力。
3基于機(jī)器學(xué)習(xí)的光伏組件故障危害識(shí)別
3.1故障特征提取
在深度學(xué)習(xí)中,數(shù)據(jù)集的數(shù)量和質(zhì)量對(duì)模型練習(xí)和預(yù)測(cè)結(jié)論都具有重要影響。模型擁有更多數(shù)據(jù),這有助于獲取新的信息,使模型可以更好地學(xué)習(xí)數(shù)據(jù)里的模型和關(guān)聯(lián)性。但是,數(shù)據(jù)的品質(zhì)也非常重要,既需要準(zhǔn)確和完備的數(shù)據(jù),同時(shí)還需要防止噪聲和極端值的影響。特征工程的任務(wù)是將繁雜的原始數(shù)據(jù)轉(zhuǎn)換成適合機(jī)器學(xué)習(xí)算法模型的高效特征,包括獲取有關(guān)特征和篩選具有較強(qiáng)預(yù)測(cè)能力的特征。通過(guò)選擇適合模型的特征,模型可以更好地捕獲數(shù)據(jù)間的模型和關(guān)聯(lián)性,提升模型的預(yù)測(cè)精密度;可以幫助提升模型的輸入數(shù)據(jù)質(zhì)量,增強(qiáng)模型的預(yù)測(cè)能力。因此,特征工程在機(jī)器學(xué)習(xí)算法中至關(guān)重要。
3.1.1熱斑數(shù)據(jù)特征提取
為了獲取熱斑溫度的有關(guān)特點(diǎn),應(yīng)該考慮熱斑與周圍環(huán)境溫度的差異。通過(guò)對(duì)比熱點(diǎn)區(qū)域溫度和光伏發(fā)電板正常區(qū)域溫度,可以計(jì)算差異值,而不是直接應(yīng)用熱點(diǎn)的溫度值。為了盡可能獲取更多特征,文中所選的溫度有關(guān)特征包括:熱點(diǎn)區(qū)域最高溫度和正常區(qū)域平均溫度的差異、熱點(diǎn)區(qū)域平均溫度和正常區(qū)域平均溫度的差異、熱點(diǎn)區(qū)域最低溫度和正常區(qū)域平均溫度的差異、熱點(diǎn)區(qū)域溫度標(biāo)準(zhǔn)偏差、熱點(diǎn)區(qū)域溫度標(biāo)準(zhǔn)差、正常區(qū)域溫度標(biāo)準(zhǔn)偏差、正常區(qū)域溫度標(biāo)準(zhǔn)差和熱斑區(qū)域最大溫差。通過(guò)選取熱點(diǎn)區(qū)域長(zhǎng)度、寬度和總面積,描述熱點(diǎn)特征。在特征處理環(huán)節(jié),對(duì)提取特征開(kāi)展綜合處理,清除失效特征,保證最后參加提取的特征合理。
3.1.2光伏組件數(shù)據(jù)特征提取
為了能獲取故障光伏組件的信息特性,本文結(jié)合故障光伏組件的特性和目前數(shù)據(jù)處理流程,利用光伏組件損害的特性進(jìn)行故障診斷。因?yàn)楣夥M件的傷害程度與熱斑的特性、數(shù)量相關(guān),所以要從這兩個(gè)方面開(kāi)展特征獲取。熱點(diǎn)的級(jí)別和面積與光伏組件的傷害程度相關(guān),挑選光伏組件中熱斑故障的最高級(jí)別、單個(gè)熱斑區(qū)域內(nèi)的最大面積、全部熱點(diǎn)區(qū)域內(nèi)的占地面積和熱點(diǎn)的最高溫度作為熱點(diǎn)特征的有關(guān)特征。挑選獲取熱斑數(shù)、高風(fēng)險(xiǎn)級(jí)別熱斑數(shù)、中危熱斑數(shù)和低危熱斑數(shù)作為熱斑數(shù)的有關(guān)特征。特征獲取結(jié)束后,對(duì)標(biāo)值特征開(kāi)展歸一化處理,對(duì)熱點(diǎn)故障傷害級(jí)別開(kāi)展量化處理。同時(shí),清除失效特征,對(duì)特征進(jìn)行相應(yīng)降維處理,保證最后特征集具有代表性和可執(zhí)行性。
3.2故障分類流程
本文采用兩個(gè)分類模型對(duì)光伏組件的故障危害進(jìn)行分類。第一個(gè)分類模型是熱斑故障危害等級(jí)分類模型,負(fù)責(zé)對(duì)光伏組件上的熱斑進(jìn)行分類并劃分出不同的故障危害等級(jí)。第二個(gè)分類模型是光伏組件故障危害等級(jí)分類模型,根據(jù)第一個(gè)模型的分類結(jié)果,對(duì)有熱斑的光伏組件進(jìn)一步劃分,以確定其故障危害等級(jí)。本文通過(guò)聯(lián)立兩個(gè)分類模型,構(gòu)建了光伏組件故障危害分類模型,實(shí)現(xiàn)了對(duì)光伏組件故障危害等級(jí)的準(zhǔn)確劃分。光伏組件故障危害等級(jí)分類流程如圖1所示。
本文使用人工標(biāo)注的方法對(duì)7030張光伏組件的圖像進(jìn)行熱斑識(shí)別危害等級(jí)的劃分。通過(guò)這種方式,建立了熱斑數(shù)據(jù)集,并從中提取相關(guān)特征。其中,訓(xùn)練集占比為80%,驗(yàn)證集占比為20%。采用交叉驗(yàn)證的方法來(lái)評(píng)估模型的性能。
4實(shí)驗(yàn)結(jié)果與分析
本文提出一種以決策樹(shù)為基礎(chǔ)分類器的梯度提升決策樹(shù)算法,對(duì)光伏組件故障進(jìn)行識(shí)別,并提取熱斑故障的相關(guān)特征,對(duì)熱斑危害等級(jí)進(jìn)行分類。通過(guò)選取K近鄰(k-nearest neighbors,KNN)算法和支持向量機(jī)(support vector machines,SVM)算法作為比對(duì)算法,進(jìn)行不同機(jī)器學(xué)習(xí)算法下的光伏組件故障分類方法研究。
4.1熱斑故障分類
先對(duì)熱斑故障進(jìn)行分類,熱斑故障分類算法指標(biāo)評(píng)價(jià)結(jié)果如表1所示。由表1可知,相較于KNN、SVM算法,GBDT算法在熱斑故障分類算法中各個(gè)指標(biāo)上都能取得較優(yōu)的效果。
4.2光伏組件故障分類
在對(duì)熱斑故障進(jìn)行分類后,再對(duì)光伏組件故障進(jìn)行分類,光伏組件故障分類算法指標(biāo)評(píng)價(jià)結(jié)果如表2所示。GBDT算法同樣在不同的指標(biāo)上取得最優(yōu)效果,特別是錯(cuò)誤率大大降低。在實(shí)際應(yīng)用中,可以提前發(fā)現(xiàn)和診斷光伏組件故障,并采取相應(yīng)的維護(hù)和修復(fù)措施,以確保光伏系統(tǒng)的正常運(yùn)行和發(fā)電效率具有重要意義。
5結(jié)論
本文針對(duì)光伏組件的安裝位置和數(shù)量較多、監(jiān)測(cè)成本高昂、檢修困難等管理問(wèn)題,提出了光伏組件故障危害識(shí)別算法。利用紅外圖像的溫度信息來(lái)判別熱斑故障,并采用機(jī)器學(xué)習(xí)模型進(jìn)行熱斑故障的分類識(shí)別。通過(guò)對(duì)紅外圖像的數(shù)據(jù)進(jìn)行處理和分析,得到熱斑故障的相關(guān)特征,然后利用機(jī)器學(xué)習(xí)算法建立相應(yīng)的分類模型對(duì)熱斑故障進(jìn)行精準(zhǔn)檢測(cè)和分類。本文使用KNN、SVM和GBDT 3種算法進(jìn)行光伏組件故障危害分類,并對(duì)其性能進(jìn)行測(cè)試。結(jié)果表明,GBDT算法相較于KNN、SVM算法在不同的評(píng)價(jià)指標(biāo)上能取得較優(yōu)的效果,可為光伏組件故障的準(zhǔn)確診斷和危害等級(jí)劃分提供有效的解決方案,提高光伏電站的運(yùn)行維護(hù)管理水平和運(yùn)行可靠性。未來(lái),可將機(jī)器學(xué)習(xí)技術(shù)與其他領(lǐng)域的先進(jìn)技術(shù)結(jié)合,如物聯(lián)網(wǎng)、大數(shù)據(jù)分析,進(jìn)一步提升光伏組件故障識(shí)別的能力。