梁素梅
摘要:氣象觀測(cè)站優(yōu)化問(wèn)題已成為實(shí)際生活中的熱點(diǎn)問(wèn)題,文章根據(jù)已有的降水量數(shù)據(jù)對(duì)該市氣象觀測(cè)站之間的相互關(guān)系和擬合程度進(jìn)行了分析;借助EXCEL,EVIEWS3.1,MATLAB等軟件進(jìn)行數(shù)據(jù)的預(yù)處理,對(duì)氣象觀測(cè)站問(wèn)題進(jìn)行更加深入討論和相關(guān)的分析研究,使得站點(diǎn)的選擇問(wèn)題得到了很好解決。
Abstract: The optimization of meteorological observation stations has become a hot issue in real life. Based on the existing precipitation data, this paper analyzes the relationship and fitting degree between the meteorological observation stations in the city; With the help of EXCEL, EVIEWS3.1, MATLAB and other software for data preprocessing, it conducts more in-depth discussion and related analysis and research on the problems of meteorological observation stations, so that the problem of site selection is well resolved.
關(guān)鍵詞:氣象觀測(cè)站;多重共線性;多元統(tǒng)計(jì);回歸分析;降水量
Key words: meteorological observation station;multicollinearity;multivariate statistics;regression analysis;precipitation
中圖分類(lèi)號(hào):O212.1? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文章編號(hào):1006-4311(2020)32-0157-04
0? 引言
某市有10個(gè)縣,每個(gè)縣有一個(gè)氣象觀測(cè)站,每個(gè)氣象觀測(cè)站測(cè)得的年降水量即為該縣的年降水量。30年來(lái)各觀測(cè)站測(cè)得的年降水量[1]中的B題。為了節(jié)省開(kāi)支,想要適當(dāng)減少氣象觀測(cè)站,那么減少哪些觀測(cè)站既可以節(jié)省開(kāi)支,又可以使得該市年降水量的信息量損失較小即信息量足夠大?我們究竟應(yīng)按什么標(biāo)準(zhǔn)來(lái)減少觀測(cè)站呢?這個(gè)標(biāo)準(zhǔn)是主觀還是客觀的呢?如果是客觀的,那么減少觀測(cè)站時(shí)應(yīng)考慮哪些影響因素呢?有沒(méi)有可能根據(jù)這些影響因素來(lái)構(gòu)建一個(gè)氣象觀測(cè)站標(biāo)準(zhǔn)的量化模型或定性模型呢?如果可能具體操作又如何呢?如①有人認(rèn)為第7個(gè)觀測(cè)站和第8個(gè)觀測(cè)站觀測(cè)到的數(shù)據(jù)之間有相關(guān)關(guān)系,第7個(gè)觀測(cè)站可以減少,第7個(gè)觀測(cè)站的年降水量信息可以從第8個(gè)觀測(cè)站觀測(cè)到的數(shù)據(jù)中獲取。②還有哪些觀測(cè)站可以減少,減少的觀測(cè)站的年降水量信息如何獲取。③如果以10個(gè)縣年降水量的平均值為該市年平均降水量。在減少觀測(cè)站以前,每個(gè)縣年降水量都是觀測(cè)數(shù)據(jù)。在減少觀測(cè)站以后,被減少的觀測(cè)站的年降水量只能從其它觀測(cè)站觀測(cè)到的數(shù)據(jù)中獲取。減少觀測(cè)站以前和減少觀測(cè)站以后是用兩種不同測(cè)量計(jì)算方法得到該市年平均降水量。兩種不同測(cè)量計(jì)算方法得到的該結(jié)果會(huì)有誤差,試預(yù)測(cè)誤差的絕對(duì)值小于10mm的概率是多少?誤差的絕對(duì)值大于20mm的概率是多少?
1? 模型假設(shè)
①該市的地理特性具有一定的均勻性,即地理因素對(duì)氣象的影響可忽略不計(jì);
②不考慮該區(qū)以外的其它因素對(duì)本地區(qū)的氣象的影響;
③各縣建氣象觀測(cè)站的花費(fèi)是相同的,不隨地理的不同而改變;
④信息量足夠大是指可預(yù)測(cè)性在95%以上;
⑤假設(shè)預(yù)測(cè)誤差的絕對(duì)值服從正態(tài)分布,當(dāng)m值比較大時(shí)服從中心極限定理。
2? 符號(hào)說(shuō)明
3? 減少氣象觀測(cè)站的模型
通過(guò)軟件EViews3.1分析降水量數(shù)據(jù)得到各觀測(cè)站之間的相關(guān)系數(shù)如表1所示。
從表1中我們可以看出x7和x8的相關(guān)系數(shù)為0.952268,具有高度相關(guān)性,其中x2和x3,x6和x7,x6和x8之間都存在較強(qiáng)的相關(guān)性。這反映出它們之間可能存在多重共線性[2-3]。
下面通過(guò)軟件EViews3.1用VIFi法來(lái)診斷多重共線性問(wèn)題。通過(guò)軟件EViews3.1算出各變量xi的VIFi值如表2。
從表2中可以看出,VIF8=19.7776,這個(gè)數(shù)值是很大的,當(dāng)變量間出現(xiàn)共線性時(shí),可以設(shè)法將其消除,用其他變量來(lái)表示它,通常選擇VIFi值最大的變量進(jìn)行剔除,所以我們首先可以將x8即第8個(gè)觀測(cè)站減去。它們之間的相關(guān)系數(shù)為0.952268,具有高度相關(guān)性,認(rèn)為第8個(gè)觀測(cè)站的年降水量信息可以從第7個(gè)觀測(cè)站觀測(cè)到的數(shù)據(jù)中獲取。但是x2,x3,x6,x7的VIFi值同樣也比較大,尤其是x7的VIF7值僅次于VIF8,所以x2,x3,x6,x7中還有可能減少。
當(dāng)?shù)趇個(gè)特征值λ≈0時(shí),表示與其對(duì)應(yīng)的主分量對(duì)總體的貢獻(xiàn)很小,若λi所對(duì)應(yīng)的特征向量vi中第k個(gè)分量所占的權(quán)重最大,則說(shuō)明在貢獻(xiàn)很小的主成份中起主要作用的是第k個(gè)觀測(cè)站,因此可把第k個(gè)觀測(cè)站剔除掉,剔除它所損失的信息量就是這個(gè)主成份的貢獻(xiàn)率。對(duì)剩下的p-1個(gè)觀測(cè)站的n年觀測(cè)數(shù)據(jù)再按上述方法進(jìn)行計(jì)算,看是否需要再剔除另一個(gè)觀測(cè)站;依此進(jìn)行有限次計(jì)算,直到?jīng)]有特征值近似為0時(shí)為止。
在上述過(guò)程中剔除了3個(gè)測(cè)站即x3,x6,x8。因?yàn)槠涫O碌?個(gè)觀測(cè)站就基本上保留了原來(lái)氣象測(cè)站的信息,這樣就達(dá)到了節(jié)省開(kāi)支,優(yōu)化測(cè)站的目的。
由表2可見(jiàn)λ1=0.0321,λ2=0.0571,λ3=0.0933都是約等于0,第一次計(jì)算結(jié)果與它們相對(duì)應(yīng)的特征向量v1,v2,v3中,只有v1中的第8個(gè)分量的絕對(duì)值最大,這時(shí)在不損失信息量的情況下刪除站x8。由于各測(cè)站之間存在相關(guān)關(guān)系,所以每次只可刪除一個(gè)測(cè)站,再將余下的9個(gè)測(cè)站30年來(lái)的數(shù)據(jù)按上述方法計(jì)算剔除測(cè)站x3。第三次將余下的8個(gè)測(cè)站到按上述方法計(jì)算剔除測(cè)站x6此計(jì)算結(jié)束。
綜上所述第7個(gè)觀測(cè)站可以減少,第7個(gè)觀測(cè)站的年降水量信息可以從第8個(gè)觀測(cè)站觀測(cè)到的數(shù)據(jù)中獲取。
4? 優(yōu)化氣象觀測(cè)站模型與回歸模型
4.1 模型的分析
要減少觀察站,肯定會(huì)對(duì)降水量信息量有一定的影響,但要求降水信息量損失較小。因此,此處不妨將預(yù)測(cè)的可靠性設(shè)置為95%。首先對(duì)表中數(shù)據(jù)進(jìn)行分析,可以得出各數(shù)據(jù)之間的線性相關(guān)性[4],根據(jù)95%的可信度,查“檢驗(yàn)相關(guān)系數(shù)ρ=0的臨界(rα)表”,可得:
用EVIEWS3.1[7]求的各個(gè)相關(guān)系數(shù)β0,β1,并建立相關(guān)的一元線性函數(shù)和二元線性函數(shù),再通過(guò)F檢驗(yàn)線性系數(shù)的正確性。過(guò)后對(duì)模型的建立求解,最后檢驗(yàn)?zāi)P?。并通過(guò)誤差分析判斷出所測(cè)數(shù)據(jù)的置信區(qū)間。
4.2 模型的建立
4.2.1 將表中的數(shù)據(jù)進(jìn)行折線圖的繪圖,如圖1。
根據(jù)圖1可知,各觀測(cè)站之間存在著一定的線性關(guān)系,再通過(guò)求各觀測(cè)站之間的線性相關(guān)系數(shù),判斷是否可以進(jìn)行各個(gè)觀測(cè)站的線性擬合;又由表2可知:根據(jù)95%的可信度,查“檢驗(yàn)相關(guān)系數(shù)ρ=0的臨界(rα)表”,可得r0.05(30-2)≈0.36,從表1可查得,rij>0.36的觀測(cè)站組合:
說(shuō)明了這四個(gè)組合的線性相關(guān)性是顯著的。
4.2.2 建立一元線性回歸模型
對(duì)于觀測(cè)站2和3的線性回歸模型為
4.2.3 建立了多元線性回歸模型
因?yàn)樵谝辉€性回歸中,只考慮兩者間的相關(guān)性,而沒(méi)有考慮用多個(gè)觀測(cè)站來(lái)預(yù)測(cè)一個(gè)站點(diǎn)的情況,因而我們須再進(jìn)行多元線性回歸分析。
從表2的數(shù)據(jù)可知,一些rij較接近于0.36,如:r25=-0.271127,r35=-0.345852,這時(shí)可通過(guò)多元分析,來(lái)確定是否可再減少一些站點(diǎn)。
在二元線性回歸中,對(duì)于6,7和8的線性回歸模型:
③通過(guò)優(yōu)化模型可以解決第三個(gè)問(wèn)題。
方案1)當(dāng)建立7個(gè)站時(shí)候,由于我們選擇了x1,x2,x4,x5,x8,x9,x10則預(yù)測(cè)誤差絕對(duì)值的均值可用模型2得到誤差絕對(duì)均值=19.9,方差=227.6,又預(yù)測(cè)誤差的絕對(duì)值滿足正態(tài)分布當(dāng)θ=10時(shí)候根據(jù)公式可得:p=2.5,即預(yù)測(cè)誤差的絕對(duì)值小于10mm的概率為0.25。
當(dāng)誤差的絕對(duì)值大于20mm的概率同理可得p=0.5。
由于m值為30較大,故可以用中心極限定理來(lái)求:可知預(yù)測(cè)誤差的絕對(duì)值小于10mm的概率p=0.3667。誤差的絕對(duì)值大于20mm的概率p=0.5。
方案2)當(dāng)建立8個(gè)站時(shí)候,由于我們選擇了x1,x2,x4,x5,x7,x8,x9,x10則預(yù)測(cè)誤差絕對(duì)值的均值可用模型2得到誤差絕對(duì)均值=10.8,方差=58.1,又預(yù)測(cè)誤差的絕對(duì)值滿足正態(tài)分布當(dāng)θ=10時(shí)候根據(jù)公式可得p=0.4602,即預(yù)測(cè)誤差的絕對(duì)值小于10mm的概率為0.4602。當(dāng)誤差的絕對(duì)值大于20mm的概率同理可得p=0.1736。
由于m值為30較大,故可以用中心極限定理來(lái)求:可知預(yù)測(cè)誤差的絕對(duì)值小于10mm的概率p=0.53。
誤差的絕對(duì)值大于20mm的概率p=0.1。
④對(duì)②中的兩種方案進(jìn)行討論
對(duì)②中1)雖然建立觀測(cè)站的開(kāi)支減少了,但是使得該市的年降水量損失比較大,而對(duì)于4中的2)雖然觀測(cè)站的開(kāi)支相對(duì)1)多了點(diǎn),但是使得該市的年降水量的信息損失減小了。從上述的討論,可以看出在開(kāi)支和信息損失兩個(gè)角度,如果開(kāi)支大,得到的信息準(zhǔn)確,那么寧愿要選擇信息準(zhǔn)確的方案。因此,對(duì)上述的討論,采取方案2)是最優(yōu)的,即在即在市內(nèi)x1,x2,x4,x5,x7,x8,x9,x10建立氣象觀測(cè)站。
5? 結(jié)論
依據(jù)以上的兩種模型,可以對(duì)某市的氣象站進(jìn)行一個(gè)比較好的規(guī)劃。氣象站的建立固然重要,但是有些不應(yīng)該建立的站點(diǎn),應(yīng)該從費(fèi)用和實(shí)用性雙方面來(lái)考慮。信息的準(zhǔn)確性對(duì)于一個(gè)市的經(jīng)濟(jì)有重要的影響,同時(shí)建立的站點(diǎn)并不是越多就越好,對(duì)于有些沒(méi)有必要的站點(diǎn),可以通過(guò)采用就近的方案近似的估計(jì)它當(dāng)年的降水量。通過(guò)合理規(guī)劃既可以節(jié)省開(kāi)支又比較準(zhǔn)確地獲得了降水量的信息。
參考文獻(xiàn):
[1]http://www.doc88.com/p-304514289238.html.
[2]周品,趙新芬.數(shù)理統(tǒng)計(jì)分析[M].北京:國(guó)防工業(yè)出版社,1989.
[3]于秀,任秀松.多元統(tǒng)計(jì)分析[M].北京:中國(guó)統(tǒng)計(jì)出版社,1999.
[4]袁衛(wèi),等.統(tǒng)計(jì)學(xué)[M].北京:高等教育出版社,2000.
[5]劉來(lái)福,曾文藝.數(shù)學(xué)模型與數(shù)學(xué)建模[M].北京:北京師范大學(xué)出版社,2002.
[6]求是科技,MATLAB7.0從入門(mén)到精通[M].北京:人民郵電出版社,2001.
[7]易丹輝.數(shù)據(jù)分析與EVIEWS應(yīng)用[M].北京:中國(guó)人民出版社,2008.
[8]袁曾任.人工神經(jīng)元網(wǎng)絡(luò)及其應(yīng)用[M].北京:清華大學(xué)出版社,1999.