陳濤
(中國傳媒大學(xué)數(shù)據(jù)科學(xué)與智能媒體學(xué)院,北京 100024)
系統(tǒng)分析和預(yù)測的主要目標(biāo)是通過分析觀測到的系統(tǒng)行為數(shù)據(jù),建立數(shù)學(xué)模型。一旦確定了數(shù)學(xué)模型,則可以運(yùn)用相應(yīng)的數(shù)學(xué)理論分析工具和數(shù)值計(jì)算方法探究模型的性質(zhì),從而描述系統(tǒng)的變化規(guī)律,預(yù)測系統(tǒng)發(fā)展趨勢。在一些發(fā)展成熟的學(xué)科,比如物理學(xué),描述系統(tǒng)變化規(guī)律的數(shù)學(xué)模型是基于已經(jīng)被透徹理解的物理機(jī)制而建立的,模型中的參數(shù)可以通過第一性原理求解或者直接測量得到[1]。然而,在當(dāng)前很多學(xué)科中的系統(tǒng)問題中,比如社會系統(tǒng),經(jīng)濟(jì)系統(tǒng)和傳播系統(tǒng)等,系統(tǒng)運(yùn)行的機(jī)制和傳播規(guī)律并沒有被人們所充分理解,此時建立的數(shù)學(xué)模型中含有的未知參數(shù)并不能通過第一性原理或測量得到。因此,需要從觀測數(shù)據(jù)中估計(jì)出數(shù)學(xué)模型中的未知參數(shù)。
微分方程是一類廣泛用于描述系統(tǒng)變量隨時間變化的數(shù)學(xué)模型,被廣泛應(yīng)用于很多學(xué)科??紤]采用微分方程描述系統(tǒng)的變化規(guī)律:
其中x是系統(tǒng)變量,一般觀察系統(tǒng)變量隨時間的變化,因此自變量是時間變量t。符號α代表一個參數(shù)集,表示模型中的待定參數(shù)?;疑到y(tǒng)理論[1]創(chuàng)始人鄧聚龍教授(1982)指出,社會系統(tǒng),經(jīng)濟(jì)系統(tǒng)等均可視為廣義的能量系統(tǒng),而能量的積累和釋放一般遵循指數(shù)規(guī)律[9]。指數(shù)函數(shù)在微分算子的作用下是關(guān)于自身的線性函數(shù),即設(shè)f=ax+b,則可以得到最基本的灰色預(yù)測GM(1,1)模型[4]:
該模型的參數(shù)集α={a,b} 含有兩個待定參數(shù)。希望通過系統(tǒng)的觀測數(shù)據(jù),來估計(jì)模型的未知參數(shù)a和b。使用傳統(tǒng)的統(tǒng)計(jì)方法比如極大似然估計(jì)[5],貝葉斯方法[6],或者現(xiàn)代的神經(jīng)網(wǎng)絡(luò)[7],機(jī)器學(xué)習(xí)方法[8]做模型的參數(shù)估計(jì)時,都需要大量的樣本數(shù)據(jù)。和這些方法不同,灰色系統(tǒng)理論主要是分析和求解由于信息不完全和不準(zhǔn)確而導(dǎo)致的不確定性問題,其最顯著的特征是小樣本數(shù)據(jù)建模[9]?;疑到y(tǒng)理論的一個基本準(zhǔn)則是充分開發(fā)和利用現(xiàn)有的數(shù)據(jù),從而發(fā)現(xiàn)更多隱藏在數(shù)據(jù)背后的系統(tǒng)規(guī)律[10]。
當(dāng)今的移動互聯(lián)網(wǎng)上每天產(chǎn)生海量的數(shù)據(jù)。我們可以獲得數(shù)目巨大的樣本,但是用于建模的觀測變量卻很少,因?yàn)橄到y(tǒng)通常只記錄了樣本在什么時間,什么位置,做了什么事。并且這些數(shù)據(jù)也只是記錄了用戶的行為,而至于用戶為什么這么做?動機(jī)在哪?這些變量很難測量[11]。由于缺乏這方面的建模數(shù)據(jù),導(dǎo)致部分信息明確,而部分信息不明確,屬于灰色系統(tǒng)[9]。此外,獲得的觀測數(shù)據(jù)存在誤差[11],尤其是生成式智能機(jī)器人的出現(xiàn),導(dǎo)致互聯(lián)網(wǎng)上大量的非人為信息出現(xiàn),并非真實(shí)體現(xiàn)人類樣本的行為。這些問題給建模帶來了很大的困難。
鄧聚龍教授(1984)提出了累加生成算子(AGO)[3][4],它是一種作用在數(shù)據(jù)序列的算子,有兩個目的:首先,它為建模提供中間數(shù)據(jù);其次,它將原有隨機(jī)序列的隨機(jī)性加以弱化。對于非負(fù)數(shù)據(jù)序列,通過適當(dāng)?shù)睦奂由珊?,得到的累加序列已由隨機(jī)變?yōu)榉请S機(jī),服從指數(shù)法則,可以通過微分方程模型進(jìn)行擬合。累加生成算子已經(jīng)成為很多灰色模型的建模的必要過程[12]。
累加生成算子可以連續(xù)多次作用于數(shù)據(jù)序列,自然產(chǎn)生高階累加生成算子的概念,比如累加生成算子連續(xù)作用m次相當(dāng)于m階累加生成算子,即m-AGO,m∈?自然數(shù)集。在很多灰色模型中,累加生成算子的階數(shù)是一個很重要的參數(shù)。關(guān)于累加生成算子的階數(shù)已有大量的研究。吳利豐等(2015)提出了分?jǐn)?shù)階累加生成算子,其中p,q∈?+正整數(shù)集[13][14]。本質(zhì)上分?jǐn)?shù)屬于有理數(shù)。曾波和孟偉等(2016)將累加生成算子的階數(shù)推廣到任意實(shí)數(shù)階,即r-AGO,r∈?實(shí)數(shù)集[15][16]。吳正鵬等(2016)將累加生成算子的階數(shù)推廣到頻率域,即z-AGO,z∈?復(fù)數(shù)集,這是累加生成算子階數(shù)最一般的結(jié)果,因?yàn)閺?fù)數(shù)域是目前已知的最廣的數(shù)域[17][18][19]。以上提到的工作都有一個共同特點(diǎn),它們都是通過代數(shù)求和的方式構(gòu)造累加生成算子。最近有一些工作是從新的途徑研究累加算子,肖新平和毛樹華(2016)發(fā)展了以矩陣形式表示累加生成算子[20]。韋保磊和謝乃明等(2020)引入積分匹配法解釋累加生成算子的機(jī)制[21]。林長海等(2021)引入信號處理領(lǐng)域的頻譜分析方法研究累加生成算子在頻率域中的形式[22]。本文的主要工作是,采用數(shù)據(jù)序列的卷積運(yùn)算構(gòu)造累加生成算子相應(yīng)的卷積序列,從而通過數(shù)據(jù)序列的卷積運(yùn)算實(shí)現(xiàn)累加生成。
本文結(jié)構(gòu):第2 部分主要介紹數(shù)據(jù)序列卷積運(yùn)算的定義并通過卷積定義累加生成,引入單邊Z 變換將累加生成卷積序列變換到頻率域上。第3 部分,基于卷積定義逆累加生成算子。第4部分,從三種視角,算子的角度、卷積序列的角度和頻率域的角度,討論累加生成算子和逆累加生成算子的互逆關(guān)系。第5部分通過實(shí)際案例驗(yàn)證理論的正確性和方法的有效性。
本節(jié)引進(jìn)數(shù)據(jù)序列的卷積運(yùn)算來定義累加生成算子。采用小寫字母“ago”表示累加生成算子和累加生成卷積序列。傳統(tǒng)的累加生成算子的定義如下:
下面,引入數(shù)據(jù)序列的卷積運(yùn)算,然后通過卷積重新定義累加生成算子。
引理2.1 表明單位脈沖序列對于任何序列具有卷積不變性,從而它在卷積運(yùn)算中,扮演著單位元素的角色,即可以認(rèn)為δ[n]=I[n]。如果序列和其它數(shù)據(jù)序列做卷積不會改變數(shù)據(jù)序列的結(jié)果,那么稱為卷積單位元素,即x[n]?I[n]=I[n]?x[n]=x[n]。
通過以上定義,給出關(guān)于累加生成算子在卷積運(yùn)算中的具體形式,即找到一個序列,任何其他序列和它做卷積,相當(dāng)于做了累加的結(jié)果。
證明:由定義2.2,可得:
對比(7)式,則得結(jié)論(8)。
定義1.4 同一序列多次重復(fù)卷積稱為卷積冪:
由定義2.4,式可重新寫為卷積冪級數(shù)的形式:
接下來,引進(jìn)單邊Z 變換(SSZT)將累加生成卷積序列變換到頻率域,分析它在頻率域的性質(zhì)。首先可以把有限長的數(shù)據(jù)序列延拓到無限長的序列。通常有兩種延拓方式,一種是周期延拓,另一種是零延拓。本文考慮零延拓,即直接在原數(shù)據(jù)序列的基礎(chǔ)上直接補(bǔ)零。
其中,z=rejθ為復(fù)變量,r=|z|為模,θ=Arg(z)為輻角。
引理2.2 單位脈沖序列的單邊Z變換為:
證明:由單邊Z變換的定義,可得:
證明:由單邊Z變換的定義,可得:
由引理2.2和引理2.3,可得:
證明:由單邊Z變換的定義,可得:
評注:公式(18)是無窮的幾何級數(shù),其收斂域是|z-1| <1,即|z| >1,其收斂的結(jié)果為:
這個結(jié)論和單位階躍序列u[n]的單邊Z 變換結(jié)果一致:
本節(jié)將基于序列卷積運(yùn)算給出逆累加生成算子的定義。首先從逆累加生成算子出發(fā)。
以下定理通過序列卷積運(yùn)算給出了逆累加生成算子的定義。
證明:由序列卷積運(yùn)算的定義,可得:
對比(24)式和(22)式,可得結(jié)論(23)式。
從定理3.1,可以推導(dǎo)出逆累加生成卷積序列的具體形式如下:
評注:逆累加生成卷積序列具體形式如下:
證明:由單邊Z變換的定義,可得:
從定義2.1 和定義3.1,可知累加生成算子和逆累加生成算子相互之間是互為逆算子的關(guān)系:
從這個角度來看,可得:
那么,重新使用卷積定義的累加生成算子是否繼續(xù)保持這種互逆的關(guān)系,或者更進(jìn)一步,這種互逆關(guān)系在卷積運(yùn)算下會變成什么樣的形式,下面給出相關(guān)定理。
從引理2.1,單位脈沖序列δ[n]對任何序列保持了卷積不變性,相當(dāng)于卷積運(yùn)算中的單位元素,即δ[n]=I[n]。因此,可以定義類似于公式(30)的互逆的卷積序列。
根據(jù)卷積滿足交換律:
從而公式(34)成立。
證明:從定理2.2,可得:
從定理2.2,可得:
然后,將公式(36)和(37)相乘可得結(jié)論。
評注:現(xiàn)在至少有三個觀點(diǎn)看待累加生成算子的互逆關(guān)系:
第一,從序列的算子的觀點(diǎn)看,由定義2.1 和定義3.1,可得累加生成算子ago()和逆累加生成算子iago()之間的互逆關(guān)系,即:
這里“?”應(yīng)該理解為算子的復(fù)合操作,而算子中的單位元素應(yīng)該理解為單位算子I。
第二,從算子對應(yīng)的卷積序列來看,由定義2.2 和定義3.2,可得累加生成卷積序列和逆累加生成卷積序列之間的互逆關(guān)系,即:
其中“?”是卷積運(yùn)算,而卷積序列中的單位元素變成了單位脈沖序列。
第三,從單邊Z變換的觀點(diǎn)看,由定理4.2,可得累加生成卷積序列的單邊Z 變換AGO[z]和逆累加生成卷積序列的單邊Z 變換IAGO[z]之間的互逆關(guān)系,即:
此處“?”為普通的復(fù)數(shù)乘法,而復(fù)數(shù)中的單位元素退化為數(shù)1。
根據(jù)公式(4),可得:
計(jì)算兩個序列的卷積結(jié)果并和傳統(tǒng)的逆累加生成算子的結(jié)果進(jìn)行比較。
根據(jù)公式,可得:
根據(jù)公式(4),設(shè):
因此,累加生成卷積序列和逆累加生成卷積序列之間的互逆關(guān)系得到了驗(yàn)證。
例4.設(shè)原始數(shù)據(jù){x[n]}為1985-2021 年世界發(fā)總電量(單位:Terawatt-hours),數(shù)據(jù)見表1和圖1。數(shù)據(jù)來自2022年七月發(fā)布的BP世界能源統(tǒng)計(jì)年報(bào)[25]。
圖1 1985-2021年世界總發(fā)電量(單位:Terawatt-hours)
表1 1985-2021年世界總發(fā)電量(Unit:Terawatt-hours)
(1)將所有年份減去首年份1985,把首年份平移到0。設(shè)和累加生成卷積序列,然后計(jì)算兩者的卷積,,從而生成累加序列:
卷積得到的累加序列見圖2。
圖2 卷積x[n]*ago[n]和GM(1,1)擬合值的比較(單位:Terawatt-hours)
和時間響應(yīng)函數(shù):
和相應(yīng)的時間響應(yīng)序列:
擬合結(jié)果見圖3。擬合值和原始數(shù)據(jù)之間的誤差列在表格2,其中每個時間數(shù)據(jù)相應(yīng)的殘差定義如下:
每個時間數(shù)據(jù)相應(yīng)的相對誤差定義如下:
綜合所有時間數(shù)據(jù),定義平均絕對百分比誤差(MAPE)計(jì)算公式如下:
本文構(gòu)造了累加生成算子相應(yīng)的累加生成卷積序列實(shí)現(xiàn)了累加生成的運(yùn)算,按照信號處理的觀點(diǎn),相當(dāng)于找到了累加生成系統(tǒng)的脈沖響應(yīng)函數(shù)在時域的離散序列。而借助Z 變換得到了累加生成卷積序列在頻率域的表達(dá)形式,相當(dāng)于累加生成系統(tǒng)的傳遞函數(shù)。通過卷積和Z 變換,可以從新的角度去理解累加生成算子和逆累加生成算子之間的互逆關(guān)系。在實(shí)際的案例中,數(shù)據(jù)序列和累加生成卷積序列做卷積生成了累加數(shù)據(jù),數(shù)據(jù)序列和逆累加生成卷積序列做卷積生成了累減數(shù)據(jù)。累加生成卷積序列和逆累加生成卷積序列互為逆卷積序列。經(jīng)過累加生成卷積序列做卷積生成的數(shù)據(jù)和灰色系統(tǒng)模型GM(1,1)的擬合度很高,驗(yàn)證了理論的正確性和方法的有效性。
本文后續(xù)可能開展的工作包括:
(1)累加階數(shù)在灰色預(yù)測模型中具有重要作用,對應(yīng)到累加生成卷積序列是什么?如果是整數(shù)m階累加生成算子,是否對應(yīng)累加生成卷積序列的m次重復(fù)卷積?
(2)接問題(1),分?jǐn)?shù)階累加生成算子相應(yīng)的卷積形式如何實(shí)現(xiàn)?累加生成卷積序列會有分?jǐn)?shù)階卷積嗎?
(3)通過構(gòu)造累加生成卷積序列,對累加生成的機(jī)制是否有更深的理解,累加生成能夠弱化原數(shù)據(jù)的隨機(jī)性的機(jī)制是什么?為什么灰色建模必須經(jīng)過累加生成?