郭小芹, 李光明, 孫占峰, 王興濤
(1.中國氣象局云霧物理環(huán)境重點開放實驗室,北京 100081;2.武威市氣象局,甘肅 武威 733000)
祁連山地處青藏、蒙新、黃土高原交匯地帶,位居我國干旱半干旱區(qū)內(nèi)陸腹地,橫跨青海省東北部與甘肅省西部地區(qū)。整個祁連山區(qū)屬褶皺斷塊,自西北向東南依次為大雪山、托來山、托來南山、野馬南山、疏勒南山、黨河南山、土爾根達坂山、柴達木山和宗務隆山,平均海拔4000 m 以上,山脈東西長1000 km,南北寬300 km,范圍廣大,地形復雜,降水區(qū)域性分布特征尤為明顯。作為西北干旱區(qū)的一條濕舌,祁連山不僅是諸多河流與水系的發(fā)源地,也是周邊區(qū)域生存與發(fā)展的屏障。祁連山北側是石羊河、黑河、疏勒河三大內(nèi)陸河徑流區(qū),是河西綠洲存活的基礎;祁連山南側是大通河、湟水河流經(jīng)地,是河湟流域生存的命脈。祁連山的存在影響著周邊大范圍地區(qū),形成一個相互影響且不可分割的整體。近年來祁連山雪線上升、冰川面積銳減、水資源嚴重短缺等問題日益凸顯,成為社會經(jīng)濟與生態(tài)環(huán)境可持續(xù)發(fā)展的制約因素,也成為學術界探究的熱門話題[1-4]。隨著氣候變暖,極端天氣影響頻繁出現(xiàn),探討祁連山及周邊降水分布與變化規(guī)律有著重要的現(xiàn)實意義。
人工增雨是開發(fā)祁連山空中云水資源以及緩解水資源短缺的有效手段之一,其有效性與科學性已經(jīng)被越來越多的研究者所重視[5-7]。作為人工增雨試驗研究的技術難點,作業(yè)效果評價是一項極其復雜而重要的工作。由于自然降水變率極大,評價對象本身存在一定的不確定性,各種復合因子相互影響,要準確客觀地厘清界限是比較難的。比如,如何將地面降水量中人工增加部分從自然降水量中識別出來,如何剔除“假效果”而實現(xiàn)精準評價以及如何建立概念模型等問題[8-9]。區(qū)域歷史回歸統(tǒng)計檢驗是增雨效果評價的基本方法,但往往受分區(qū)分型方法與影響區(qū)、對比區(qū)設計的左右,很顯然,不同對比區(qū)將會生成不同的評價效果。無論是統(tǒng)計檢驗、物理檢驗和數(shù)值模擬檢驗,在對比區(qū)選擇上,準確性是很難把握的。要科學評價增雨效果,精準分區(qū)尤為重要。聚類檢驗為對比區(qū)選取提供了一種量化方法,為增雨效果評價的定量、客觀提供了科學的解讀依據(jù)。
多年來氣候區(qū)劃邊界問題因受制于人為因素左右,其地理分類方法備受質疑,而主成分分析(Principal component analysis,PCA)在一定程度上規(guī)避了這種缺陷,但在荷載值上依然存在臨界值勘定問題,因而在一定意義上尚不能實現(xiàn)科學準確的數(shù)值分類。聚類分析又稱群分析,是分類學中依據(jù)事件的某些相似性特征進行歸類的一種多元方法,在分析中多選用距離系數(shù)、相似系數(shù)、相關系數(shù)、相關距離系數(shù)等指標以實現(xiàn)相似性度量[10-11]。盡管如此,很多學者依然認為該方法缺乏統(tǒng)計學基礎。幺枕生[12]提出的聚類統(tǒng)計檢驗方法(Cluster analysis with statistical test,CAST)則有效彌補了分區(qū)分類過程中顯著性檢驗的重大缺陷,尤其在中心聚類評價上具有廣泛的適用價值[13-14]。
根據(jù)聚類統(tǒng)計檢驗分析的基本思路,本文對祁連山及周邊降水空間分區(qū)分型的合理性進行了深入探討,研究結果將有利于剖析復雜地形下不同降水區(qū)域的空間變化特征,為準確把握祁連山降水變化特征與分布規(guī)律提供科學依據(jù)。
本文數(shù)據(jù)來源于中國氣象局國家氣象信息中心提供的祁連山以及周邊區(qū)域31 個國家基本站1961—2020年5—9月降水量資料,研究所用序列經(jīng)過嚴格質量控制。如遇個別時段缺測,則按照維爾達(WILD)綜合訂正法取鄰近站點展開序列訂正,在通過適當性判據(jù)之后,實現(xiàn)該站點缺失值的插補[15]。祁連山及周邊海拔高度變化與氣象站點分布見圖1。祁連山西高東低,最大海拔高度差2084 m,為了消除地理因素引起的平均值以及變率的影響,在分析前對上述資料進行了標準化處理,形成祁連山降水空間場數(shù)據(jù)集。分析過程采用多種統(tǒng)計方法并借助SPSS、Matlab編程以及ArcGIS等軟件實現(xiàn)了降水特征的分區(qū)分型研究。
圖1 祁連山及周邊海拔高度變化與氣象站點分布Fig.1 Changes of altitude and spatial distribution of meteorological stations in Qilian Mountains and its surrounding areas
1.2.1 主成分分析特征值是衡量主成分影響度的重要指標,代表了引入該主成分以后能夠解釋源數(shù)據(jù)信息量的多少,一般以特征值≥1作為考量主成分重要性的標準。方差貢獻率(或累積貢獻率)用于判斷主成分的份量,其數(shù)值越大,表明該主成分(或上述主成分)包含的源數(shù)據(jù)信息量就越大。荷載值反映了主成分與各個變量間的密切程度,在標準化變量下,任意一個主成分的荷載值實質上就是主成分與原變量的相關性指標[16-17],也就是說,在一定意義上荷載值就類似于相關系數(shù),其值越大,表明該因子對當前變量的影響程度越大。
主成分分析[18-20]可以歸納為以下幾個步驟:(1)對降水量數(shù)據(jù)進行標準化處理,以消除地域因素帶來的系統(tǒng)性誤差;(2)計算標準化樣本的相關系數(shù)矩陣;(3)按照特征值和方差貢獻率的大小提取因子數(shù)量,取得閾值范圍內(nèi)的主分量;(4)對各個主分量進行分析,考察可解釋性,如有必要可對因子進行旋轉,通過荷載值以尋求更好的解釋方式。
1.2.2 聚類檢驗聚類分析可將樣本劃分為不同類群,通過評價分析,其結果具有綜合性、客觀性和科學性,近年來在各個領域得到廣泛應用[21-23]。氣候分型區(qū)劃理論研究已經(jīng)證明了統(tǒng)計聚類檢驗與主成分分析的關聯(lián)性,并認為在一定程度上聚類檢驗是主成分應用于分區(qū)分型的理論基礎,并通過多種方法證實了這種關聯(lián)的有效性[16-17]。聚類分析常用距離來度量數(shù)據(jù)間的親疏關系,諸如明可夫斯基距離、曼哈頓距離、歐幾里得距離、契比雪夫距離等。將變量間這種距離用Cij表示,Cij與相關系數(shù)具有一致性,同時又具備正態(tài)分布性,通過χ2分布函數(shù)的構造,可以實現(xiàn)聚類過程的顯著性檢驗。
假設某氣象要素具有時間序列長度為n、測站數(shù)量為p所構成的變量場X,已經(jīng)證明,測站Xi和Xj之間的距離可以用相關系數(shù)(rij)表示。根據(jù)幺枕生[12]理論,定義自由度η-1的分布統(tǒng)計量:
1.2.3 區(qū)域歷史回歸檢驗區(qū)域歷史回歸檢驗方法是基于地面降水量的效果評價方法,該方法立足對比區(qū)、影響區(qū)地面降水量相關分析,采用最小二乘法建立一元線性回歸方程,預測出影響區(qū)的自然降水量,通過自然降水量估計值與實測降水量的分析比較,得出絕對增雨量和相對增雨率。該方法在人工增雨作業(yè)效果檢驗技術指南中已有介紹,詳見文獻[24],這里不再贅述。
祁連山及周邊地區(qū)降水量分布與祁連山脈走向基本一致。以5—9 月為例,東段降水在350 mm以上,西段降水只有100 mm 左右,表現(xiàn)出極不均勻性。降水量年度分布不均,以1961—2020 年為例,全域多年平均降水量343.7 mm,降水量最大值441.8 mm(1967 年),降水量最小值240.2 mm(1991年),降水變率±30%,高值區(qū)多在祁連山區(qū)。降水季節(jié)性特征明顯,夏季集中,冬季稀少,5—9月降水量占全年85%以上。降水地域分布極不均勻,以2016年為例,張掖降水量還不足剛察的1/45,出現(xiàn)了50 a不遇的氣象干旱。研究發(fā)現(xiàn),祁連山及周邊地區(qū)降水量與地理位置相關聯(lián),降水量與緯度呈顯著負相關,與海拔呈顯著正相關,也就是說緯度越高,降水量越少,海拔越高,降水量越多,這種規(guī)律使得祁連山及周邊地區(qū)降水呈現(xiàn)出東多西少、南多北少的特征,最大降水帶分布在2500~3500 m區(qū)域,也說明西南暖濕氣流與夏季風對該區(qū)域降水形成有著極其重要的影響。
建立1961—2020 年祁連山及周邊31 個測站5—9月地面降水量原始矩陣,對標準化后的相關矩陣做主成分分析,然后以各個主成分對應的高荷載值作為聚類中心,依據(jù)式(1)~(4)給出一定信度下的分區(qū)檢驗判據(jù),對分區(qū)結果進行分析評價。
首先對降水量相關矩陣進行主成分分析(表1),依據(jù)特征值以及方差貢獻率篩選之分量。從表1可以看出,旋轉前后7個主分量其累積方差貢獻率均為78.135%,經(jīng)過旋轉之后主分量C3~C7的方差貢獻率普遍得以提高,說明旋轉后對主分量的解釋更為明確,這7 個主分量可以很好的表征原始場大部分信息和主要趨勢。相比主分量C1,其余主分量的方差貢獻率都比較小,這說明祁連山及周邊的地形影響特征很明顯。
表1 祁連山及周邊降水量的主成分分析結果Tab.1 Results of principal component analysis of precipitation in Qilian Mountains and its surrounding areas
以主成分分析得到的高荷載值作為中心點,對荷載值≥0.6各個測站進行聚類評判,當評判結果通過95%顯著性水平檢驗時,可認為分類結果合理,評判標準與結果見表2。通過聚類檢驗,研究區(qū)域構成以樂都、海晏、野牛溝、武威、高臺、臨澤、剛察為中心點的7個區(qū)域(Z1~Z7),一個區(qū)域對應一種類型,從而得到祁連山及周邊多個相對獨立的分區(qū)分型區(qū)域。
表2 祁連山及周邊降水量聚類中心以及分區(qū)分型結果Tab.2 Cluster center site and regional classification of precipitation in Qilian Mountains and its surrounding areas
依據(jù)聚類檢驗分析結果,對各個降水區(qū)域分布特征進行研究(圖2)。結果顯示:第一區(qū)域Z1位于研究區(qū)域東南部,包括烏鞘嶺、天祝、永登、樂都、平安、民和、化隆、循化8個站點,占研究區(qū)域測站比例為25.8%,最大荷載中心在樂都(0.892),平均荷載值0.376,年平均降水量296.3 mm,海拔1800~3000 m,屬于研究區(qū)域季風氣候響應區(qū),是祁連山及周邊自然生態(tài)門戶以及農(nóng)牧業(yè)重點發(fā)展地區(qū)。第二區(qū)域Z2 位于祁連山中南部,包括門源、海晏、湟源、大通、互助、西寧、湟中7 個站點,測站占比為22.6%,最大荷載值0.751,年平均降水量398.5 mm,海拔2500~3000 m,是研究區(qū)域草原與牧場基地,也是祁連山區(qū)重要的水源涵養(yǎng)地。第三區(qū)域Z3 分布在沿祁連山中段,包括山丹、民樂、肅南、托勒、野牛溝、祁連6 個站點,測站占比為19.3%,最大荷載值0.786,年平均降水量285.0 mm,海拔1700~3400 m,是祁連山重要生態(tài)保護與植被恢復地區(qū)。第四區(qū)域Z4分布在祁連山北麓東端即石羊河流域,測站占比為12.9%,最大荷載值0.903,年平均降水量170.3 mm,海拔1300~2000 m,是發(fā)端于冷龍嶺北側大雪山的重要綠洲流域,屬于典型的灌溉農(nóng)業(yè)。第五區(qū)域Z5為最北端疏勒河流域,測站占比6.5%,最大荷載值0.824,年平均降水量僅有81.2 mm,海拔1400 m,是源于祁連山西段托來南山與疏勒南山之間的綠洲地帶,屬于灌溉農(nóng)業(yè)。第六區(qū)域Z6地處黑河流域,發(fā)端于祁連山北麓中段冰川地帶,測站占比為6.5%,最大荷載值0.952,年平均降水量100.4 mm,海拔1470 m,屬于灌溉農(nóng)業(yè)。第七區(qū)域Z7為祁連山海拔最高區(qū)域,包括天峻、剛察,測站占比6.5%,最大荷載值0.814,年平均降水量341.3 mm,海拔3400 m,位居大通山地段,是祁連山多條河流的發(fā)源地。綜上可以看出,分區(qū)分型結果與降水量、地理地形、海拔高度顯著相關,各個分區(qū)相互獨立,差異性明顯,同一區(qū)域特征相近,具有共性,從而構成祁連山獨特的降水空間布局特征。
圖2 祁連山及周邊各個區(qū)域荷載值的空間分布Fig.2 Spatial distributions of the loading values of each divided areas in Qilian Mountains and its surrounding areas
依據(jù)聚類檢驗方法,可將祁連山及周邊劃分為7個區(qū)域,其結論與研究成果[25-26]相吻合:受西風帶、副熱帶、青藏高原環(huán)流的共同影響,特別是山地地形的熱力和動力作用,祁連山及周邊容易構成氣旋式環(huán)流,副熱帶高壓明顯增強,西南暖濕氣流強化,夏季風顯著北延,冷暖空氣一旦相遇,極易在祁連山一帶形成強降水區(qū),西北氣流型、低槽東移型、東高西低型均是構成祁連山強降水的有利天氣形勢。也就是說,局地環(huán)流、邊界層結構均能有效促使祁連山地形正反饋,導致降水量顯著增加,且從東南到西北逐漸減少,從而構成獨特的降水空間變化特征。
2.4.1 增雨效果評價背景統(tǒng)計檢驗的評估對象是地面降水量,基本方法通過同一時期對比區(qū)自然降水量與影響區(qū)實測降水量的比較,得出定量化結果,這個結果就是增雨效果。但在作業(yè)影響區(qū)確定以后,不同對比區(qū)就會有不同的增雨效果。聚類檢驗分區(qū)分型結果,可以作為對比區(qū)選擇的基本依據(jù),換一句話說,當影響區(qū)和對比區(qū)位于同一區(qū)域時,統(tǒng)計檢驗才有了可信度。
選取Z4,即石羊河流域作為實證區(qū)域。該流域人口密集、水資源匱乏、生態(tài)環(huán)境極其脆弱,人工增雨已成為緩解旱情與生態(tài)治理的重要措施?,F(xiàn)已建成人工影響作業(yè)點71個,其中火箭增雨作業(yè)點45個、高炮增雨防雹作業(yè)點14 個、固定煙爐作業(yè)點8個、焰彈作業(yè)點4個,覆蓋面積6000 km2以上。該流域人工影響作業(yè)始于1992 年,截至目前,累積作業(yè)6000 余次,發(fā)射高炮25000 余發(fā)、火箭16000 余枚、焰彈20000余枚,具備對比區(qū)與影響區(qū)遴選條件。
首先,Z4 所在區(qū)域500~700 hPa 常年盛行西北風向,只要對比區(qū)位于影響區(qū)上風方或者側風方,就可以使對比區(qū)不受催化作業(yè)影響而保持相對的獨立性;其次,Z4 所在區(qū)域地處大陸腹地,氣候干旱、降水少、蒸發(fā)量大,地形地貌、氣候背景、植被特征、區(qū)域面積、天氣系統(tǒng)高度一致,地面降水量顯著相關。石羊河流域地理地形以及增雨作業(yè)點布局見圖3。
圖3 石羊河流域地理分布以及對比區(qū)與影響區(qū)布局Fig.3 Geographical distribution of Shiyang River Basin and the layout of contrast area and affected area
2.4.2 增雨效果評價和檢驗石羊河流域地面作業(yè)集中在5—9月,選取民勤為對比區(qū),涼州為影響區(qū),即對比區(qū)位于影響區(qū)側風方。將1961—1991 年作為歷史降水量序列時段,1992—2020年作為作業(yè)影響序列時段,2 個時段樣本量基本相當。在應用區(qū)域歷史回歸統(tǒng)計檢驗方法之前,需要確定統(tǒng)計變量是否滿足正態(tài)分布,為了使回歸模型具有可比性,要求對比區(qū)和影響區(qū)在2 個時段同時具備正態(tài)性,即通過Kolmogorov-Smimov(KS)檢驗[27]。檢驗與分析結果見表3。
以對比區(qū)降水量為自變量,影響區(qū)降水量為因變量,運用地面降水量區(qū)域歷史回歸統(tǒng)計檢驗方法對該時段降水量進行分析。對應時段回歸方程均通過95%的顯著性水平檢驗,表明擬合方程可以代表該時段降水量的基本特征(表3)。將對比區(qū)降水量代入回歸方程,得到影響區(qū)降水量的預估值,在此基礎上對不同時段作業(yè)效果展開分析。
表3 石羊河流域不同時段地面作業(yè)效果檢驗的特征值Tab.3 Eigenvalues of ground operation effect test at different periods in Shiyang River Basin
1992—2020 年5—9 月絕對增雨量為8.91 mm,相對增雨率為6.51%,說明5—9 月作業(yè)效果明顯,具有很好的增雨潛力。但在不同月份作業(yè)效果卻表現(xiàn)出明顯的差異性(表3)。5—6月為負效果,7—9 月為正效果,其中7 月最高(6.30 mm,21.86%),8月次之(5.44 mm,16.11%),這一結果與石羊河流域氣候背景以及天氣系統(tǒng)演變規(guī)律密切關聯(lián)。5—6月正值春末夏初,是典型的“卡脖子”時段,從多年降水量分布上看,該時段降水量不足全年的20%,水汽條件差、增雨效率不高、作業(yè)效果弱,實際業(yè)務中應該慎重選擇作業(yè)時機,盡可能降低負效果的出現(xiàn)幾率。而7—9月正是高原降水云系活躍階段,尤其是7—8 月,陣性降水多、水汽條件好、增雨效率高、作業(yè)效果明顯,可以通過增加作業(yè)點次以及作業(yè)量,顯著增加降水量,有效提升作業(yè)效果。
作業(yè)效果評價一直是制約人工影響天氣發(fā)展的技術性難題。祁連山地形復雜、范圍廣大,我們前期已經(jīng)對降水分布的區(qū)域性特征進行了一些研究,在利用統(tǒng)計檢驗評價增雨效果時,發(fā)現(xiàn)在對比區(qū)的選擇上存在諸多問題,導致檢驗效果出現(xiàn)很多不確定性結果。眾所周知,對比區(qū)與影響區(qū)降水量比對是統(tǒng)計檢驗的基本思路,大量事實證明,在作業(yè)影響區(qū)確定以后,不同對比區(qū)就會有不同的增雨效果。遺憾的是,一直以來,關于對比區(qū)選擇并未形成客觀準確的方法,也沒有可以依靠的理論依據(jù),地面作業(yè)效果評價與人工增雨服務陷入困境。
聚類檢驗分區(qū)分型結果,可以作為對比區(qū)選擇的基本依據(jù)。只有當影響區(qū)和對比區(qū)位于同一區(qū)域時,統(tǒng)計檢驗才具有可靠的前提條件。本文采用主成分分析方法對研究區(qū)域降水場進行分區(qū)分型,再通過聚類檢驗進行結果驗證,很大程度上保證了分區(qū)的準確性。將分區(qū)分型結果應用于對比區(qū)與影響區(qū)的選擇,解決了在增雨效果評價上區(qū)域選擇的盲目性問題,這也是制約地面增雨效果評價的關鍵環(huán)節(jié)。這種方法通常用于氣候分型區(qū)劃,但很少用于區(qū)域降水研究,在人工增雨效果檢驗對比區(qū)選擇上則更為少見。祁連山以及周邊區(qū)域地形復雜,降水分布極為不均,建立科學準確的分區(qū)方法,對把握該區(qū)域降水特征具有極為重要的意義。
基于主成分分析與聚類分析的一致性,本文對分區(qū)分型方法進行了深入研究,并驗證了這種結果的合理性。通過分析,將祁連山及周邊降水分布劃分為7個區(qū)域,在對上述區(qū)域逐一評價的基礎上,選擇石羊河流域作為實例。設計對比區(qū)、影響區(qū),采用區(qū)域歷史回歸統(tǒng)計方法對不同時段降水量展開增雨效果評價。結果顯示:1992—2020年5—9月絕對增雨量8.91 mm,相對增雨率6.51%,其中7 月最高(6.30 mm,21.86%),8月次之(5.44 mm,16.11%),說明人工增雨效果在不同時段具有差異性,適時作業(yè)、科學作業(yè),才能提高綜合效果,最大程度提升抗旱蓄水、生態(tài)治理與修復的能力和水平。