康英偉, 段松濤, 劉向偉, 朱 峰, 楊 平, 梁正玉
(1.上海電力大學(xué), 上海 200090; 2.潤電能源科學(xué)技術(shù)有限公司, 河南 鄭州 450000)
目前,我國大多數(shù)火電廠都已安裝了廠級監(jiān)控信息系統(tǒng)(Supervisory Information System,SIS)。其歷史數(shù)據(jù)庫儲存了火電機(jī)組運行的海量歷史數(shù)據(jù),其中包含機(jī)組特性的寶貴信息。如何有效地利用機(jī)組的歷史數(shù)據(jù)實現(xiàn)控制和運行的優(yōu)化便很自然地成為一個重要的研究課題[1-4]。相應(yīng)地,關(guān)于數(shù)據(jù)建模方法及其在火電生產(chǎn)領(lǐng)域的應(yīng)用近年來也受到越來越多的重視。
一元和二元函數(shù)分別指只有1個和2個自變量的靜態(tài)函數(shù)模型。盡管這兩類模型都較為簡單,卻具有相當(dāng)廣泛的代表性,在火電生產(chǎn)領(lǐng)域亦是如此,其重要性不容輕視。例如:鍋爐的煙氣含氧量是反映燃料燃燒充分程度的重要指標(biāo),若建立以煙氣最優(yōu)含氧量為因變量、以機(jī)組負(fù)荷為自變量的一元函數(shù)模型,并將其嵌入鍋爐燃燒自動控制系統(tǒng)的控制策略中,就可以提升鍋爐運行的熱效率[5-8];汽輪機(jī)的閥門流量特性是調(diào)節(jié)汽門開度與通過汽門的蒸汽流量間的映射關(guān)系,若建立汽輪機(jī)閥門流量特性的一元函數(shù)模型(以蒸汽流量為因變量,調(diào)節(jié)汽門開度為自變量),就可以優(yōu)化數(shù)字式電液(Digital Electro Hydraulic,DEH)調(diào)節(jié)系統(tǒng)的配汽曲線,有效避免機(jī)組一次調(diào)頻性能下降、功率低頻振蕩等問題的發(fā)生[9-12];機(jī)組負(fù)荷受到調(diào)節(jié)汽門開度和主蒸汽壓力2個因素的影響,若建立以機(jī)組負(fù)荷為因變量、以調(diào)節(jié)汽門開度和主蒸汽壓力為自變量的二元函數(shù)模型,便可從根本上掌握機(jī)組的負(fù)荷特性,進(jìn)而優(yōu)化機(jī)組的運行方式。因此,基于火電機(jī)組的歷史數(shù)據(jù),研究并發(fā)展簡單有效的一元和二元函數(shù)建模方法,對掌握機(jī)組特性、提升機(jī)組的安全性和經(jīng)濟(jì)性具有十分重要的作用。
SIS中火電機(jī)組的歷史數(shù)據(jù)是時間序列數(shù)據(jù)。由于機(jī)組變負(fù)荷和其他擾動因素的存在,歷史數(shù)據(jù)中包含有大量的非穩(wěn)態(tài)過程數(shù)據(jù),因此基于歷史數(shù)據(jù)建立一元和二元函數(shù)模型需主要解決兩個方面的問題:一是歷史數(shù)據(jù)中穩(wěn)態(tài)數(shù)據(jù)的檢測與提取問題;二是一元和二元函數(shù)的數(shù)據(jù)建模問題,即如何根據(jù)提取出的穩(wěn)態(tài)數(shù)據(jù)建立所需形式的一元和二元函數(shù)模型。對于問題一,根據(jù)檢測原理的不同,目前已經(jīng)提出了基于機(jī)理分析、統(tǒng)計分析和趨勢提取等原理的多種穩(wěn)態(tài)檢測方法[13-17],部分方法已被應(yīng)用于實際生產(chǎn)中。對于問題二,在統(tǒng)計學(xué)、數(shù)值分析和機(jī)器學(xué)習(xí)等領(lǐng)域已有十分豐富的建模方法,每種方法各有其特點及適用范圍。由于實際應(yīng)用場景的多樣性,建模目的和建模要求各不相同,從而形成形式多樣的數(shù)據(jù)建模問題,因此需要針對性地發(fā)展建模方法。
本文專注于問題二的解決,將給出2種一元函數(shù)數(shù)據(jù)建模方法和1種二元函數(shù)數(shù)據(jù)建模方法。以下分別介紹這些數(shù)據(jù)建模方法,并給出這些方法在某600 MW超臨界火電機(jī)組負(fù)荷特性建模中的應(yīng)用實例。
一元函數(shù)數(shù)據(jù)建模是數(shù)據(jù)建模中最基本的問題,解決此類問題的常用方法是曲線擬合[18-19]。根據(jù)選用的擬合基函數(shù)的不同,曲線擬合方法有多項式擬合、高斯擬合、傅里葉擬合等。這些曲線擬合方法均采用較為復(fù)雜的非線性函數(shù)形式,而一些應(yīng)用場景卻要求采用更為簡單的分段直線模型形式。例如,目前火電機(jī)組控制系統(tǒng)的軟件平臺就普遍支持用分段直線模型逼近各種一元非線性函數(shù)關(guān)系。
在已有的分段直線擬合方法中,文獻(xiàn)[20-23]的方法都是根據(jù)局部數(shù)據(jù)點的變化情況,自動進(jìn)行分段,不僅直線分段數(shù)無法控制,而且無法保證分段直線擬合的整體最優(yōu);文獻(xiàn)[24]的方法本質(zhì)上是通過窮舉搜索實現(xiàn)分段直線擬合的整體最優(yōu),但當(dāng)擬合數(shù)據(jù)點較多時,計算復(fù)雜度會非常高。已有的這些分段直線擬合方法均適用于數(shù)據(jù)信噪比高、分布較均勻且變化較緩慢的情況,而從工業(yè)現(xiàn)場獲得的數(shù)據(jù)往往含有噪聲、疏密分布不均且變化較快。
因此,本節(jié)給出解決該問題的2種方法:基于給定間隔點橫坐標(biāo)和基于曲線擬合的分段直線擬合方法。這里對一元函數(shù)數(shù)據(jù)建模問題的提法為:給定穩(wěn)態(tài)數(shù)據(jù)集S={xj,yj},j=1,2,3,…,n,其中xj彼此不同且按由小到大順序排列,要求將一元函數(shù)關(guān)系y=f(x)以足夠的精度建模為指定分段數(shù)的分段直線模型。
該方法的基本思想為:首先,根據(jù)分段數(shù)的要求,通過觀察數(shù)據(jù)點的分布情況和走向趨勢,給定各段直線間隔點(也包括首段直線的起點和末段直線的終點)橫坐標(biāo);然后,利用最小二乘方法,以總擬合誤差平方和最小為優(yōu)化目標(biāo),求得間隔點縱坐標(biāo),從而得到各分段直線方程。
該方法的具體步驟如下。
步驟2 根據(jù)間隔點坐標(biāo)(Xi,Yi)(其中縱坐標(biāo)Yi為待求量),可以得到各段直線方程的表達(dá)式。其中,第i段直線方程的表達(dá)式為
(1)
步驟3 利用步驟2得到的直線方程,推導(dǎo)出各段直線擬合的誤差平方和ei以及總誤差平方和e的表達(dá)式。ei和e分別定義如下
(2)
(3)
式中:下標(biāo)i,k代表第i段數(shù)據(jù)中的第k個數(shù)據(jù)點;上標(biāo)^代表預(yù)測值。
步驟4 為使分段直線預(yù)測的總誤差平方和e最小,須滿足e對Yi的偏導(dǎo)數(shù)為零的條件,即
(4)
根據(jù)分段直線擬合的總誤差平方和的表達(dá)式,可以得到e對Yi的偏導(dǎo)數(shù)的表達(dá)式如下。
當(dāng)i=0時,
(5)
當(dāng)i=1,2,3,…,(m-1)時,
(6)
當(dāng)i=m時,
(7)
將式(5)~式(7)代入式(4)中,整理后得到以間隔點縱坐標(biāo)Yi為未知數(shù)的線性方程組,其中包含(m+1)個方程、(m+1)個未知數(shù),具體表達(dá)式為
AY=B
(8)
式中Y=[Y0,…,Yi,…,Ym]T,進(jìn)而解得Yi。
步驟5 將步驟4得到的間隔點坐標(biāo)(Xi,Yi)代入式(1)中,即可得到m段連續(xù)的分段擬合的直線方程。
該方法的基本思想為:通過“曲線擬合+分段直線逼近”的方式建立分段直線模型,即先利用成熟的曲線擬合方法對離散數(shù)據(jù)點進(jìn)行擬合,再對擬合曲線進(jìn)行分段直線逼近。
該方法的具體步驟如下。
步驟1 選擇合適的曲線擬合方法對離散數(shù)據(jù)點進(jìn)行曲線擬合,以達(dá)到要求的擬合效果。常用的曲線擬合方法有多項式擬合、高斯擬合、傅里葉擬合等,但不局限于此。曲線擬合方法的選擇以取得好的擬合效果為依據(jù)。該步驟的目的在于通過曲線擬合捕捉數(shù)據(jù)點變化的主要特征。
步驟2 采用多段直線去逼近步驟1中得到的擬合曲線,最終得到分段直線模型。分段直線逼近策略具體為:以擬合曲線的起點和終點作為兩個初始節(jié)點確定1條直線,并找到該直線與擬合曲線的最大誤差點作為新添加節(jié)點,得到2段直線,再找到該2段直線與擬合曲線的最大誤差點作為新添加節(jié)點,得到3段直線,以此類推,不斷添加下去,直到直線分段數(shù)達(dá)到指定的分段數(shù)m為止。
步驟3 將步驟2得到的各節(jié)點坐標(biāo)(Xi,Yi)代入式(1)中,即可得到m段連續(xù)的分段擬合的直線方程。
解決二元函數(shù)數(shù)據(jù)建模問題的常用方法是曲面擬合[18-19]。曲面擬合方法能較好地克服數(shù)據(jù)中噪聲的影響,反映數(shù)據(jù)變化的整體趨勢,但是面對不同的非線性映射關(guān)系,如何確定二元擬合函數(shù)的形式尚缺乏有效的方法,則大大降低了該方法的通用性?;谏鲜鲆辉瘮?shù)數(shù)據(jù)建模方法,本文給出一種簡單實用的二元函數(shù)數(shù)據(jù)建模方法,即分段直線擬合-插值混合型方法。
該方法的基本思想為:將擬合和插值方法融合起來,通過“分段直線擬合+插值”的方式實現(xiàn)二元函數(shù)的數(shù)據(jù)建模,即利用分段直線擬合方法表示因變量隨其中一個自變量的變化情況,再利用插值方法表示因變量隨另一個自變量的變化情況,從而完成對二元函數(shù)的建模。
這里對二元函數(shù)數(shù)據(jù)建模問題的提法為:給定原始穩(wěn)態(tài)數(shù)據(jù)集T={xf,yf,zf},f=1,2,3,…,N,其中,x和z為自變量,y為因變量,要求以足夠的精度建立二元函數(shù)模型y=f(x,z)。
該方法的具體步驟如下。
步驟1 對原始穩(wěn)態(tài)數(shù)據(jù)集T做簡單的統(tǒng)計處理及排序處理,得到q個穩(wěn)態(tài)數(shù)據(jù)集Th={xg,h,yg,h,zh},g=1,2,3,…,Nh,h=1,2,3,…,q。其中,Nh為zh所對應(yīng)的數(shù)據(jù)點數(shù),q為T中相異z的數(shù)目,xg,h彼此不同且已按由小到大順序排列,下標(biāo)g,h代表穩(wěn)態(tài)數(shù)據(jù)集Th中的第g個數(shù)據(jù)點。
步驟2 從q個zh中選擇并確定p個z的插值節(jié)點zH,H=1,2,3,…,p。z的插值節(jié)點主要根據(jù)zh所對應(yīng)的數(shù)據(jù)點數(shù)、點分布情況以及xg,h覆蓋的數(shù)值范圍選定。為獲得更好的建模效果,插值節(jié)點zH的具體選定原則為:zH應(yīng)盡量均勻覆蓋變量z的整個取值范圍;zH所對應(yīng)的數(shù)據(jù)點(xg,H,yg,H)應(yīng)盡量多且沿x方向有良好的分布特性;zH所對應(yīng)數(shù)據(jù)點的xg,H覆蓋的數(shù)值范圍應(yīng)盡可能寬。
步驟3 分別利用穩(wěn)態(tài)數(shù)據(jù)集TH,H=1,2,3,…,p,對一元函數(shù)y=f(x,zH)進(jìn)行分段直線擬合。
步驟4 在自變量z方向上,通過插值方法計算二元函數(shù)y=f(x,z)的值。
火電機(jī)組的負(fù)荷特性可以表示為二元函數(shù)關(guān)系
y=f(x,z)
(9)
x——調(diào)節(jié)汽門開度,%;
z——主蒸汽壓力,MPa。
當(dāng)主蒸汽壓力保持恒定時,負(fù)荷特性簡化為一元函數(shù)關(guān)系
y=f(x)
(10)
建模數(shù)據(jù)均取自某600 MW超臨界火電機(jī)組現(xiàn)場數(shù)據(jù)。由于原始數(shù)據(jù)是時間序列數(shù)據(jù),為了獲得穩(wěn)態(tài)數(shù)據(jù)集,采用一種基于分段曲線擬合的穩(wěn)態(tài)檢測方法進(jìn)行穩(wěn)態(tài)數(shù)據(jù)的檢測。該穩(wěn)態(tài)檢測方法的原理是對原始時間序列數(shù)據(jù)進(jìn)行分段曲線擬合,利用重疊數(shù)據(jù)加權(quán)來保證各段邊界的連續(xù)性和光滑性,根據(jù)擬合曲線各點的一階導(dǎo)數(shù)和二階導(dǎo)數(shù)信息來判斷各時刻點是否處于穩(wěn)定狀態(tài)。關(guān)于該方法的細(xì)節(jié)可以參閱文獻(xiàn)[16]。
原始數(shù)據(jù)為機(jī)組主蒸汽壓力24.25 MPa條件下的時間序列數(shù)據(jù)。對原始數(shù)據(jù)進(jìn)行穩(wěn)態(tài)檢測和提取,并進(jìn)行排序和統(tǒng)計處理后,得到穩(wěn)態(tài)數(shù)據(jù)集S={xj,yj},j=1,2,3,…,86,其中xj彼此不同且已按由小到大順序排列。分別采用基于給定間隔點橫坐標(biāo)和基于曲線擬合的分段直線擬合方法對一元函數(shù)關(guān)系y=f(x)建模。
應(yīng)用基于給定間隔點橫坐標(biāo)的分段直線擬合方法的建模過程如下。
(1) 觀察該數(shù)據(jù)集中數(shù)據(jù)點的分布情況和走向趨勢,將數(shù)據(jù)分為5段,并給定直線間隔點的橫坐標(biāo)X=[X0,X1,X2,X3,X4,X5]T=[82.50,85.00,87.00,89.00,90.00,92.00]T。
(2) 根據(jù)分段間隔點坐標(biāo)(Xi,Yi),i=0,1,2,…,5,得到各段直線方程的表達(dá)式,并推導(dǎo)出分段直線擬合的總誤差平方和e的表達(dá)式。
(3) 將e對Yi求偏導(dǎo),并令偏導(dǎo)數(shù)為零,得到以間隔點縱坐標(biāo)Yi為未知數(shù)的線性方程組AY=B,其中:
排課相關(guān)方法包括醫(yī)生工作強(qiáng)度計算以及醫(yī)生工作強(qiáng)度調(diào)整方法。醫(yī)生工作強(qiáng)度計算方法主要用于計算醫(yī)生醫(yī)療和教學(xué)的綜合工作強(qiáng)度,醫(yī)生工作強(qiáng)度調(diào)整方法用于調(diào)整醫(yī)生醫(yī)療和教學(xué)的工作安排,均衡醫(yī)生醫(yī)療和教學(xué)的綜合工作強(qiáng)度。
求解以上線性方程組,得到間隔點縱坐標(biāo)Y=[Y0,Y1,Y2,Y3,Y4,Y5]T=[511.37,543.49,564.55,588.42,603.92,618.17]T。從而得到直線分5段時各節(jié)點的坐標(biāo):(82.50,511.37),(85.00,543.49),(87.00,564.55),(89.00,588.42),(90.00,603.92),(92.00,618.17)。
(4) 將各節(jié)點坐標(biāo)代入式(1)即可得到各段直線方程。分段直線擬合效果(分5段)如圖1所示。
圖1 基于給定間隔點橫坐標(biāo)方法的擬合效果
應(yīng)用基于曲線擬合的分段直線擬合方法的建模過程如下。
(1) 選擇合適的曲線擬合方法對離散數(shù)據(jù)點進(jìn)行曲線擬合。經(jīng)嘗試發(fā)現(xiàn),采用如下的6階高斯函數(shù)擬合這些離散的數(shù)據(jù)點,可獲得令人滿意的擬合效果。
(11)
式中:al,bl,cl——高斯函數(shù)的3個參數(shù),具體取值見表1。
表1 6階高斯擬合的參數(shù)取值
(2) 對所得的6階高斯曲線進(jìn)行分段直線逼近。以擬合曲線的起點和終點作為分段直線的兩個初始節(jié)點,并將分段直線與擬合曲線的最大誤差點作為新添加節(jié)點,不斷添加下去,直到達(dá)到指定的分段數(shù)5為止。從而得到直線分5段時各節(jié)點的坐標(biāo):(82.90,513.16),(85.60,545.63),(86.24,560.50),(88.02,572.15),(89.48,597.05),(92.00,615.36)。
(3) 將各節(jié)點坐標(biāo)代入式(1)即可得到各段直線方程。分段直線擬合效果(分5段)如圖2所示。
圖2 基于曲線擬合方法的擬合效果
以上應(yīng)用實例說明了這兩種一元函數(shù)數(shù)據(jù)建模方法的有效性。通過以上應(yīng)用實例,可以看出兩種方法的特點。這兩種方法均具有直線分段數(shù)可控、數(shù)據(jù)適用性廣等優(yōu)點,對于不均勻分布、變化較快的數(shù)據(jù)都可以有效建模。第1種方法的算法在分段數(shù)比較多時會變得很復(fù)雜,且對數(shù)據(jù)點的人工分段影響了此方法的準(zhǔn)確性、簡單性和實用性。相比第1種方法,第2種方法的優(yōu)勢是完全自動地確定分段節(jié)點且算法十分簡單,實現(xiàn)方便,實用性強(qiáng)。但這是以放棄擬合總誤差平方和最小為代價的??紤]到絕大多數(shù)應(yīng)用場景并不嚴(yán)格要求總誤差平方和最小,因此這一點完全可以接受。此外,值得指出的是,第2種方法在分段直線逼近之前,先要對數(shù)據(jù)進(jìn)行曲線擬合,相當(dāng)于對數(shù)據(jù)進(jìn)行了平滑處理,因此該方法可以在一定程度上克服數(shù)據(jù)噪聲的影響。
原始數(shù)據(jù)為某600 MW超臨界火電機(jī)組各種主蒸汽壓力條件下的時間序列數(shù)據(jù)。對原始數(shù)據(jù)進(jìn)行穩(wěn)態(tài)檢測和提取,得到原始穩(wěn)態(tài)數(shù)據(jù)集T={xf,yf,zf},f=1,2,3,…,801 408。采用分段直線擬合-插值混合型的二元函數(shù)數(shù)據(jù)建模方法,建立二元函數(shù)模型y=f(x,z)。建模過程如下。
(1) 統(tǒng)計出T中相異z的數(shù)目為148,按z對T進(jìn)行劃分并作簡單的統(tǒng)計處理及排序處理后,得到148個穩(wěn)態(tài)數(shù)據(jù)集Th={xg,h,yg,h,zh},g=1,2,3,…,Nh,h=1,2,3,…,148,其中,xg,h已經(jīng)按由小到大順序排列。
(2) 根據(jù)每個zh所對應(yīng)的數(shù)據(jù)點數(shù)、點分布情況以及xg,h覆蓋的數(shù)值范圍,從148個zh中選擇并確定了8個z的插值節(jié)點,寫成向量形式為[14.80,16.50,17.90,18.60,20.20,21.80,23.70,24.40]T。這8個z的插值節(jié)點基本均勻地覆蓋了變量z的整個取值范圍,所對應(yīng)的數(shù)據(jù)點數(shù)分別為51,90,89,83,75,64,128,126,并且數(shù)據(jù)點沿x方向的分布特性良好。
(3) 分別利用z插值節(jié)點所對應(yīng)的穩(wěn)態(tài)數(shù)據(jù)集TH,H=1,2,3,…,8,對一元函數(shù)y=f(x,zH)進(jìn)行分段直線擬合。這里采用基于曲線擬合的分段直線擬合方法,得到各分段節(jié)點的坐標(biāo)。當(dāng)zH=14.80 MPa時,對一元函數(shù)y=f(x,zH)擬合的直線分段數(shù)為1;當(dāng)zH取其他值時,直線分段數(shù)均為12。圖3給出了z節(jié)點選取及分段直線擬合效果圖。
圖3 z節(jié)點選取及分段直線擬合效果
(4) 在自變量z方向上,采用線性插值方法計算二元函數(shù)y=f(x,z)的值。圖4給出了當(dāng)23.70 MPa≤z<24.40 MPa時,在z方向上線性插值的示意圖(取x=85%截面)。
圖4 z方向上線性插值示意
表3 二元函數(shù)模型預(yù)測結(jié)果
由表3可以看出,所建立的二元函數(shù)模型無論是在x方向上還是在z方向上都能較好地反映數(shù)據(jù)的變化趨勢,并取得較好的預(yù)測效果。需要指出的是,建模精度可通過改變擬合和插值節(jié)點的數(shù)量加以調(diào)整。
以上應(yīng)用實例說明了該二元函數(shù)數(shù)據(jù)建模方法的有效性。
本文給出了2種一元函數(shù)數(shù)據(jù)建模方法和1種二元函數(shù)數(shù)據(jù)建模方法,并通過某600 MW超臨界火電機(jī)組負(fù)荷特性的建模實例驗證了這些方法的有效性。
2種一元函數(shù)數(shù)據(jù)建模方法(基于給定間隔點橫坐標(biāo)和基于曲線擬合的分段直線擬合方法)均具有直線分段數(shù)可控、數(shù)據(jù)適用性廣等優(yōu)點。相比基于給定間隔點橫坐標(biāo)的分段直線擬合方法,基于曲線擬合的分段直線擬合方法具有算法簡單、可自動確定分段節(jié)點等優(yōu)點,實用性較強(qiáng),而這是以放棄擬合總誤差平方和最小為代價的。
相比已有的二元函數(shù)數(shù)據(jù)建模方法,分段直線擬合-插值混合型的二元函數(shù)數(shù)據(jù)建模方法具有靈活性高、通用性強(qiáng)、模型形式簡單等優(yōu)點。
將本文所給出的數(shù)據(jù)建模方法開發(fā)成軟件,可以通過交互的方式十分方便地完成從歷史數(shù)據(jù)到一元或二元函數(shù)模型的建模全過程。