胡 江,王春紅,馬福恒
(1.南京水利科學(xué)研究院 水文水資源與水利工程科學(xué)國家重點(diǎn)實(shí)驗(yàn)室,南京 210029;2.南京瑞迪水利信息科技有限公司,南京 210029)
我國已建、在建一批特高拱壩。這些特高拱壩技術(shù)指標(biāo)多超出現(xiàn)行規(guī)范,且修建在高山峽谷,地質(zhì)地形條件復(fù)雜[1]。工程實(shí)踐表明,特高拱壩對溫度邊界和基礎(chǔ)受力邊界條件敏感,其變形特征與200 m以下的拱壩有著較大的差異,蓄水期和運(yùn)行初期尤其明顯[2-3]。
如當(dāng)水庫蓄水并長時(shí)間處于540~560 m高程時(shí),溪洛渡上部谷幅收縮、拱壩整體向上游變形[4]。同時(shí),壩體上游主要溫度邊界——壩前庫水溫垂直分層還未形成,水泥持續(xù)水化使得壩體內(nèi)部溫度回升,影響壩體變形[5-7]。據(jù)統(tǒng)計(jì),在蓄水后5 a內(nèi)發(fā)生失事的大壩占總失事大壩數(shù)一半以上[8]。變形是特高拱壩工作性態(tài)最直觀的反映,開展其運(yùn)行初期預(yù)測模型研究對保障工程安全有重要的意義[1-2]。
傳統(tǒng)多元回歸模型HST(Hydrostatic Season Time)是應(yīng)用最廣泛的大壩安全性態(tài)預(yù)測模型,但HST模型是針對運(yùn)行期提出的,采用周期項(xiàng)溫度因子表征壩體的穩(wěn)定溫度場,不適合復(fù)雜環(huán)境條件和非穩(wěn)定溫度場情形下的模型構(gòu)建。對此,提出了一些解決方法,如基于實(shí)測溫度因子的多元回歸模型HTT(Hydrostatic Temperature Time)[9],又如基于實(shí)測溫度因子主成分分析(Principal Component Analysis,PCA)的多元回歸模型HTPCAT(Hydrostatic-PCA based Temperature-Time)[10]。此外,過去20多年里非線性數(shù)學(xué)模型方法也得以大量應(yīng)用,主要有神經(jīng)網(wǎng)絡(luò)模型、支持向量機(jī)(Support Vector Machine,SVM)等,兩者均具有較高的擬合和預(yù)測精度[11]。
庫水溫對特高拱壩的應(yīng)力應(yīng)變和變形影響顯著[6],現(xiàn)行規(guī)范的庫水溫預(yù)測主要依賴適用于100 m級水庫的經(jīng)驗(yàn)公式,且未考慮蓄水和運(yùn)行初期庫水溫變化的過程。狹長河道型水庫壩前庫水溫垂向?qū)α骰旖?,分布?fù)雜。運(yùn)行初期變形預(yù)測模型須考慮庫水溫的時(shí)空變化[6-8]。同時(shí),封拱后的壩體溫度回升也將影響變形??紤]實(shí)測溫度變量為特高拱壩運(yùn)行初期變形監(jiān)測和預(yù)報(bào)模型提供了思路[7-8]。因此,對眾多監(jiān)測儀器采集得到的海量數(shù)據(jù)中進(jìn)行分析[12],提取其中的關(guān)鍵信息是構(gòu)建基于實(shí)測溫度的預(yù)測模型需要解決的關(guān)鍵問題。
多變量時(shí)間序列是高維Euclidean空間,主成分分析(PCA)法將其近似轉(zhuǎn)換為低維子空間,并保留了主要形態(tài)。另一種多變量壓縮轉(zhuǎn)換方法是分層聚類(Hierarchical Clustering,HC)[13]。當(dāng)變量間距離均采用Euclidean距離,可將PCA作為HC的前處理步驟,降低干擾變量影響;還可采用PCA的映射圖、因子圖等直觀地表示HC結(jié)果;可見,融合PCA和HC可更穩(wěn)健地描述變量空間、更直觀地表示聚類結(jié)果。
為此,本文融合PCA和HC法,提出基于主成分分層聚類法(Hierarchical Clustering on Principal Component,HCPC)的特高拱壩運(yùn)行初期環(huán)境和壩體溫度因子的選取方法,同時(shí),考慮谷幅收縮和周期性的加載卸荷恢復(fù)變形,引入指數(shù)和周期項(xiàng)組合時(shí)效因子,在此基礎(chǔ)上,構(gòu)建HTT、SVM等2類模型,并將結(jié)果與HST模型進(jìn)行對比,驗(yàn)證方法的科學(xué)性和合理性。
PCA法的核心思想是使用S個(gè)不相關(guān)變量即主成分描述數(shù)據(jù)集XK×I(K個(gè)變量、I次觀測,S<K)。這些主成分反映了原始數(shù)據(jù)集中蘊(yùn)含信息的本質(zhì),其余的主成分則可認(rèn)為為噪音[14-15]。因此,PCA也是一種去噪方法,可作為聚類分析的預(yù)處理步驟。
XK×I的元素為xkij,g是X的每列平均值的向量。與某一變量相關(guān)的特征值等于該變量的平方因子值的總和。一個(gè)變量對于某一主成分的重要性可通過該變量的平方因子值與這一主成分的特征值的比值即變量對該主成分的貢獻(xiàn)率求得,變量k對主成分l的貢獻(xiàn)率ck,l表示為[14-15]
式中:fk,l是變量k對主成分l的因子值;λl是第l個(gè)主成分的特征值。
變量貢獻(xiàn)率介于0和1之間。對給定的某主成分,所有變量貢獻(xiàn)率總和為1。貢獻(xiàn)率越大,變量對主成分的貢獻(xiàn)越大。一個(gè)重要的啟發(fā)式的方法是,當(dāng)某一變量貢獻(xiàn)率大于所有變量的均值時(shí),該變量可用來解釋這一主成分。同時(shí),具有高貢獻(xiàn)率但符號不同的變量代表該主成分的2個(gè)維度方向,可用來解釋該主成分[14-15]。
平方余弦表示一個(gè)主成分對某一變量的重要性,它表示了主成分對變量到原點(diǎn)平方距離的貢獻(xiàn),即
式中:xk,i為第k個(gè)變量、第i次觀測值;gi為質(zhì)心的第i個(gè)元素,即x的第i列平均值。
當(dāng)數(shù)據(jù)居中時(shí),式(3)簡化為
在PCA映射圖上,正相關(guān)變量聚集在一起,負(fù)相關(guān)變量則分布在某一主成分相反的2個(gè)方向;變量和原點(diǎn)間的距離表示了變量的重要性,遠(yuǎn)離原點(diǎn)的變量能很好地表示主成分。平方余弦值用于估計(jì)主成分表示變量的質(zhì)量,高值表示質(zhì)量好,這種情況下變量位于相關(guān)圓的圓周附近,對于解釋主成分就越重要;反之,變量未完全由主成分表示,變量接近圓心、不具代表性。
PCA的降噪和去冗余使得HCPC可獲得比在原始變量上直接聚類更穩(wěn)健的結(jié)果。HC法需要確定距離度量和分簇?cái)?shù)量的標(biāo)準(zhǔn)。有許多距離度量(Manhattan、Euclidean等)和分簇?cái)?shù)量確定(Ward、Single和Centroid等)方法[16-17]。這里,使用應(yīng)用較廣的基于Huygens定理的Ward法。
根據(jù)Huygens定理,總方差可以分解為組間方差和組內(nèi)方差之和[16],即
式中:xiqk為第q組的變量i在觀測點(diǎn)k的值為各變量在觀測點(diǎn)k的平均值為第q組內(nèi)各變量在觀測點(diǎn)k的平均值;Iq為第q組內(nèi)的觀測數(shù);K為變量個(gè)數(shù);Q為分組個(gè)數(shù)。
組內(nèi)方差表征了組內(nèi)變量的同質(zhì)性,Ward準(zhǔn)則在聚類時(shí)使每個(gè)步驟中組內(nèi)方差增長最小,即組間方差減少最小。確定分組數(shù)是聚類分析的核心問題。分層聚類本質(zhì)是一種嵌套分區(qū),最底層上每個(gè)變量均是一個(gè)小組的,最頂層上所有變量都?xì)w屬同一個(gè)大組??筛鶕?jù)組內(nèi)方差的增長情況判斷最優(yōu)的聚類分組結(jié)果。當(dāng)分組數(shù)從(Q-1)到Q時(shí)的組間方差的增加值ΔQ遠(yuǎn)大于從Q到(Q+1)時(shí)的增加值Δ(Q+1)時(shí),最優(yōu)分組數(shù)為Q組。
HCPC結(jié)果可表示在樹形圖或主成分映射圖上。2種結(jié)果可視化方法相互補(bǔ)充、交叉驗(yàn)證。
針對特高拱壩布置了眾多庫水溫、壩體混凝土溫度測點(diǎn)的情況,基于PCA、HCPC結(jié)果,對運(yùn)行初期溫度因子測點(diǎn)進(jìn)行聚類,并結(jié)合PCA映射圖,確定各分區(qū)的高平方余弦值的變量為同一簇即同一分區(qū)的典型溫度測點(diǎn),將其作為變形預(yù)測模型的溫度因子。
除溫度因子外,運(yùn)行初期的時(shí)效因子影響顯著。變形時(shí)效包括混凝土徐變、剛固地基上壩體徐變、完整巖體外荷下徐變及巖體裂隙節(jié)理水壓下時(shí)效位移等。其特點(diǎn)是運(yùn)行初期變化急劇,而后隨運(yùn)行時(shí)間的增長逐步穩(wěn)定。同時(shí),混凝土及巖石在卸荷后徐變位移有一定的恢復(fù)[18]。
用一階衰減微分方程表示運(yùn)行初期隨時(shí)間單調(diào)急劇增加的時(shí)效變形為
式中:c、r均是待定常數(shù);t為時(shí)間。
當(dāng)庫水位呈年周期變化時(shí),運(yùn)行初期加載卸荷周期引起的徐變恢復(fù)δe也呈近似年周期變化[18],其表達(dá)式為
式中:m=1~2,這里取1;An、Bn均是待定常數(shù)。
當(dāng)庫水位呈年周期變化時(shí),對比式(7)和傳統(tǒng)模型中的周期溫度因子,兩者型式一致。
2)由于社會領(lǐng)域是造成城鄉(xiāng)規(guī)劃非理性化的主要原因,因此,大數(shù)據(jù)時(shí)代可通過對海量數(shù)據(jù)的高效利用,逐步實(shí)現(xiàn)城鄉(xiāng)規(guī)劃社會領(lǐng)域的計(jì)量化,為城鄉(xiāng)規(guī)劃中遇到的社會問題的計(jì)量處理提供參考信息。
通過平均絕對誤差EMAE分析模型的擬合效果,其表達(dá)式為
式中:N是訓(xùn)練或者預(yù)測樣本集的大?。粂i是實(shí)測的監(jiān)測效應(yīng)量值;F(xi)是預(yù)測值。
水壓則采用庫水位的4次項(xiàng)表示;應(yīng)用HCPC方法選取典型的庫水溫、壩體溫度測點(diǎn),作為變形預(yù)測模型的溫度因子;同時(shí),以式(6)、式(7)組合作為時(shí)效因子。將上述水壓、溫度、時(shí)效因子作為變量,構(gòu)建HTT、SVM模型,以式(8)衡量模型的擬合和預(yù)測精度。
某混凝土雙曲拱壩壩頂高程610.00 m,建基面高程324.50 m,共31個(gè)壩段。河床壩基地質(zhì)條件相對復(fù)雜,采用了“基礎(chǔ)+大壩”的擴(kuò)大基礎(chǔ)整體結(jié)構(gòu)的方法(圖1)。水庫的正常蓄水位、死水位和汛限水位分別為600.00、540.00、560.00 m。水庫具有年調(diào)節(jié)能力。
大壩內(nèi)埋設(shè)了7 200支監(jiān)測儀器以全方位地監(jiān)測壩體的環(huán)境和效應(yīng)量。在5#、10#、15#、22#、27#壩段各布置1組垂線系統(tǒng)。垂線系統(tǒng)在高程610.00、563.25、527.25、470.25、395.25、347.25 m各布置正垂線測點(diǎn),正垂線對應(yīng)的壩基布置倒垂線。在典型高程上、下游壩面各布置1支溫度計(jì)觀測環(huán)境溫度;壩體內(nèi)部溫度則采用位于壩體上游側(cè)、中部和下游側(cè)應(yīng)變計(jì)測點(diǎn)的測溫傳感器獲取。15#壩段的垂線測點(diǎn)的布置和16#壩段的溫度測點(diǎn)布置如圖1所示。
圖1 15#壩段垂線測點(diǎn)和16#壩段溫度測點(diǎn)示意圖Fig.1 Layout of installed pendulums in Monolith 15 and temperature-measuring points in Monolith 16
2013年5月4 日,大壩導(dǎo)流底孔下閘,庫水位從高程441.25 m開始逐步抬升。2014年3月6日,大壩完成最后一倉澆筑。2014年9月28日,水位第1次蓄至正常蓄水位600.00 m,蓄水和運(yùn)行初期庫水位過程如圖2所示。壩頂垂線測點(diǎn)于2014年7月4日開始觀測,15#壩段垂線測值過程線如圖2所示。以典型高程測點(diǎn)為例,16#壩段的環(huán)境溫度和混凝土內(nèi)部溫度的時(shí)空變化過程如圖3所示,其中溫度計(jì)測的是環(huán)境溫度,應(yīng)變計(jì)如S3-1測的是混凝土溫度。以16#壩段的庫水溫作為壩前庫水溫,2015年、2016年和2017年的典型時(shí)間的壩前庫水溫垂直分層如圖4所示。
圖2 庫水位和15#壩段的垂線徑向位移實(shí)測過程線Fig.2 Variations of reservoir water level and radial displacements of Monolith 15
圖4 16#壩段庫水溫垂直分層情況示意圖Fig.4 Vertical stratifications of reservoir water before Monolith 16
由于壩頂測點(diǎn)初始觀測日期為2014年7月4日,本次分析的垂線時(shí)間序列為2014年7月—2018年6月。在此時(shí)段內(nèi),壩體經(jīng)歷了4次完整的加載和卸荷周期。其中,庫水位、溫度為日均值,各1 460個(gè)測值;垂線測點(diǎn)的監(jiān)測頻次為2~3 d/次,各621個(gè)測值。
采用HCPC法,得到庫水溫各測點(diǎn)在第一、第二主成分維度上的貢獻(xiàn)率及分簇,如圖5所示,樹狀圖和映射圖的分區(qū)結(jié)果如圖6所示,Ta表示氣溫。
圖5 庫水溫測點(diǎn)的貢獻(xiàn)圖和分簇圖Fig.5 Contributions and grouping results of reservoir water temperature points
HCPC法將庫水溫分為3類,且在映射圖上與氣溫存在較大的差異。結(jié)合圖3至圖6可看出,480 m高程以下區(qū)域的庫水溫測點(diǎn)(T1—T17),庫水溫明顯異于氣溫,但仍存在年變化,該區(qū)域水溫年變幅小,且與氣溫存在較大的相位差;每年1—7月份溫度持續(xù)處于較低的溫度,在15℃左右。500.00~560.00 m高程區(qū)域的庫水溫測點(diǎn)(T21—T27),庫水溫變化基本類似,存在明顯的年變化;蓄水后,該區(qū)域水溫年變幅小于氣溫,且與氣溫存在相位差。
由于深孔底高程在490.00 m左右,并且每年均有泄洪,從而加強(qiáng)了上下層水流的熱交換,使得該區(qū)域溫度變化大于底部高程,T19測點(diǎn)既類似于低高程測點(diǎn),又表現(xiàn)出明顯的差異。560.00 m高程以上區(qū)域的庫水溫測點(diǎn)(T29、T31)受上游來水溫度和氣溫雙重影響,水溫變化較為復(fù)雜。由圖4可知,汛期垂向混合,溫躍層高程降低,導(dǎo)致深水層水溫上升;同時(shí),來流密度大于表水層和深水層,進(jìn)入庫區(qū)后下潛,貼河床流動,直到遇到水溫更低的深層水體,不再下潛,轉(zhuǎn)為中間流,導(dǎo)致汛期垂向水溫分布不規(guī)則[7]??傊?014年以后,壩前垂向庫水溫的表溫層、溫躍層、滯溫層層化結(jié)構(gòu)明顯,但汛期較為復(fù)雜。
圖6 庫水溫測點(diǎn)的樹狀和映射圖Fig.6 Hierarchical clustering and projection based on grouping results
同樣地,采用HCPC法,得到PL15-5垂線段及其以下各溫度測點(diǎn)在第一、第二主成分維度上的貢獻(xiàn)率及分簇圖,如圖7所示,樹狀圖和映射圖的分區(qū)結(jié)果如圖8所示。
限于篇幅,僅以PL15-5垂線段為例說明。結(jié)合圖3、圖4與圖7、圖8可知,395.25 m高程以下壩體溫度整體趨于穩(wěn)定,但各個(gè)部位有略有差異,HCPC法將該區(qū)域的環(huán)境和壩體溫度測點(diǎn)分為6類。具體地,水化熱引起的溫度回升現(xiàn)象主要表現(xiàn)在壩體中部,測點(diǎn)主要為S6-4—S6-7、S3-2;壩體中部的S6-6測點(diǎn)又略有差異,仍呈較小幅度的溫升現(xiàn)象;S6-9、S6-10則更為顯著;壩體上游部分受庫水溫影響,已基本穩(wěn)定,測點(diǎn)主要為T1、T3和S3-1;壩體下游部分呈較小幅度的溫升,但受年周期的氣溫影響明顯,測點(diǎn)主要為T2、T4和T6。從圖1(b)可看出,擴(kuò)大基礎(chǔ)采用大壩混凝土,使得S6-4類似于壩體內(nèi)部溫度。
圖7 PL15-5區(qū)間及其以下高程溫度測點(diǎn)的貢獻(xiàn)圖和分簇圖Fig.7 Contributions and grouping results of temperature-measuring points for PL15-5
圖8 PL15-5垂線及其以下高程溫度測點(diǎn)的樹狀和映射圖Fig.8 Hierarchical clustering and projection based on grouping results of temperature measuring points for PL15-5
通過HCPC對其余垂線段溫度測點(diǎn)分析可發(fā)現(xiàn),PL15-4垂線段以上壩體仍受水化熱影響,普遍呈溫升趨勢;壩體中部以單調(diào)溫升為主;壩體上下游還受庫水溫、氣溫的影響,既表現(xiàn)出年周期變化,也呈溫升趨勢,但受環(huán)境溫度影響的程度隨高程的增加逐漸降低,如570 m高程左右,距上下游面4.2 m處的測點(diǎn)溫度同壩體中部相同,近似呈單調(diào)溫升狀態(tài);418 m高程以上都處于該階段。
以16#壩段的環(huán)境和壩體溫度溫度測點(diǎn)作為相鄰15#壩段的溫度因子,采用HCPC法選取每一垂線段的典型溫度計(jì)測點(diǎn),結(jié)果列于表1。
表1 模型構(gòu)建考慮的實(shí)測溫度因子Table 1 Measured temperature points considered in model construction
最終考慮的所有環(huán)境、荷載和邊界變量列于表2。一般地,選取樣本總數(shù)的10%~20%作為預(yù)測集[19],考慮到運(yùn)行初期的環(huán)境、荷載條件的復(fù)雜性,這里選取15%作為預(yù)測集。
表2 模型構(gòu)建考慮的因子Table 2 Variables considered in model construction
采用HST、HTT、SVM這3類模型構(gòu)建運(yùn)行初期15#壩段垂線徑向位移的預(yù)測模型。HTT與SVM模型采用的變量相同,為表2中列舉的所有因子;HST模型的時(shí)效為式(6)型式,其溫度周期項(xiàng)同式(7),可見其與HTT模型的區(qū)別在于是否包含了實(shí)測的環(huán)境和溫度變量。SVM采用了優(yōu)化算法選擇最佳的懲罰因子C、不敏感系數(shù)gamma分別為1 000和0.000 1。HST和HTT模型采用最小二乘法擬合。得到各模型的效果列于表3,將各變量標(biāo)準(zhǔn)化,HTT模型各變量擬合系數(shù)如表4。
表3 各模型效果對比Table 3 Comparison of performance parameters among constructed models
表4 HTT模型各變量的擬合系數(shù)Table 4 Fitted coefficients of variables of HTT models
以PL15-1測點(diǎn)為例,其擬合和預(yù)測效果如圖9。分別統(tǒng)計(jì)庫水位、庫水溫和氣溫等環(huán)境溫度、壩體內(nèi)部溫度、時(shí)效等各影響因素對監(jiān)測效應(yīng)量的相對影響大小,結(jié)果如圖10所示。
圖9 PL15-1的3類模型的訓(xùn)練和預(yù)測效果Fig.9 Training and prediction performances of three constructed models for PL15-1
從表3和圖9可看出,HTT、SVM模型均具有較高的擬合和預(yù)測精度。HST模型精度較差,具有較大的殘差和EMAE值,以PL15-1為例,測點(diǎn)的最大年變幅為2017年的34.18 mm,訓(xùn)練集和預(yù)測集的MAE值分別為5.96、6.62 mm,遠(yuǎn)超了規(guī)范要求的拱壩徑向位移觀測的中誤差±2.0 mm的要求。SVM模型的預(yù)測精度較HTT模型要高,但HTT模型可解釋各個(gè)變量的影響大小。利用kappa函數(shù)計(jì)算自變量矩陣的條件數(shù),以PL15-1測點(diǎn)為例,計(jì)算得到的條件數(shù)為206.8,表明變量間存在中等相似共線性。
圖10 各變量對PL15-1測點(diǎn)徑向位移的相對影響Fig.10 Relative importance of variables to radial displacements of PL15-1
圖10可知,在假設(shè)各變量相互獨(dú)立的條件下,壩體溫度(如S6-4、S6-9和S5-5測點(diǎn))對15#壩段的壩頂徑向位移影響最顯著,壩體溫度的緩慢回升使得壩體產(chǎn)生了向上游變形[3],為31.77%,這也是HST模型精度不足的重要原因;庫水位波動引起的水壓變化、時(shí)效及環(huán)境溫度分別占24.63%、23.25%和20.35%。由此可見,特高拱壩運(yùn)行初期變形受到加載卸荷、庫水溫垂直分層、壩體內(nèi)部水化熱溫升、時(shí)效等多因素影響,造成了變形的非線性特征。
本文提出了基于HCPC法的特高拱壩運(yùn)行初期實(shí)測溫度因子分區(qū)及典型測點(diǎn)的選取方法;同時(shí),引入了可反映周期性庫水位變化下運(yùn)行初期時(shí)效變形特征的指數(shù)和周期項(xiàng)的組合時(shí)效因子,得到了運(yùn)行初期變形預(yù)報(bào)模型的潛在變量集。
實(shí)例分析表明,依據(jù)HCPC結(jié)果,可直觀地分析壩體的非穩(wěn)定溫度場的特征,有助于辨析壩體的變形機(jī)理。在此基礎(chǔ)上構(gòu)建的HTT和SVM模型,均具有較高的擬合和預(yù)測精度,而HST模型精度較差,具有較大的平均絕對誤差。壩體溫度因子對特高拱壩運(yùn)行初期變形影響顯著,監(jiān)測和預(yù)報(bào)模型須考慮實(shí)測溫度因子。