王 成 何 啟
(1.中交第四航務(wù)工程局 第七工程有限公司,廣州 510230;2.河海大學(xué) 水利水電學(xué)院,南京 210098)
混凝土壩可視為一個(gè)不斷變化的復(fù)雜系統(tǒng),特殊的結(jié)構(gòu)形式和復(fù)雜的工作環(huán)境,導(dǎo)致大壩的服役性態(tài)呈現(xiàn)出復(fù)雜、多樣、不確定等特點(diǎn).在諸多反映混凝土壩性態(tài)變化的效應(yīng)量中,壩工界普遍認(rèn)為,大壩的變形能最直觀地反映出大壩的運(yùn)行性態(tài)[1].在混凝土壩長(zhǎng)期服役的過(guò)程中,積累了大量的變形監(jiān)測(cè)數(shù)據(jù),這些數(shù)據(jù)包含了大量的混凝土壩變形性態(tài)信息,為分析混凝土壩變形性態(tài)提供了有效的資料,也為變形性態(tài)的預(yù)測(cè)提供了基礎(chǔ)信息.
在對(duì)混凝土壩的變形情況進(jìn)行監(jiān)測(cè)時(shí),自動(dòng)化系統(tǒng)中儀器的數(shù)據(jù)采集一般都是基于一定時(shí)間間隔的,如每六小時(shí)一測(cè)或每天一測(cè)等,且通常保持不變;而人工監(jiān)測(cè)系統(tǒng)由于人為原因、儀器損壞和數(shù)據(jù)丟失等因素的影響,監(jiān)測(cè)信息之間的時(shí)間間隔往往并不能保持完全一致,表現(xiàn)為不等間隔的時(shí)間序列,這將給建模工作帶來(lái)困難.需要特別說(shuō)明的是,在自動(dòng)化系統(tǒng)和人工系統(tǒng)中,有時(shí)由于儀器長(zhǎng)時(shí)間損壞,導(dǎo)致監(jiān)測(cè)信息會(huì)出現(xiàn)長(zhǎng)時(shí)間的缺失問(wèn)題,比如某測(cè)點(diǎn)兩年的數(shù)據(jù)序列中某一個(gè)月或某兩個(gè)月的連續(xù)缺失,這種類(lèi)型的數(shù)據(jù)缺失問(wèn)題將直接導(dǎo)致無(wú)法獲得該時(shí)間段內(nèi)該測(cè)點(diǎn)的變形情況,當(dāng)該測(cè)點(diǎn)位于大壩關(guān)鍵監(jiān)測(cè)位置時(shí),很可能錯(cuò)過(guò)大壩異常變形情況的監(jiān)測(cè)而給大壩的安全分析工作帶來(lái)困難.另外,數(shù)據(jù)的長(zhǎng)時(shí)間缺失導(dǎo)致信息的中斷不利于變形情況的整體分析,變形預(yù)測(cè)工作也不方便展開(kāi).因此,需要研究相關(guān)方法實(shí)現(xiàn)缺失數(shù)據(jù)的彌補(bǔ).呂開(kāi)云[2]指出觀測(cè)數(shù)據(jù)插補(bǔ)的方法主要包括內(nèi)在物理聯(lián)系插補(bǔ)法和數(shù)學(xué)插補(bǔ)法兩種,并介紹了線(xiàn)性插補(bǔ)法的原理和過(guò)程;李雙平等[3]對(duì)比了常用的數(shù)學(xué)插值方法,選擇了充分利用已有數(shù)據(jù)信息、插值曲線(xiàn)光滑的三次Hermite分段插值,實(shí)現(xiàn)了數(shù)據(jù)序列的均勻化處理;屠立峰等[4]針對(duì)傳統(tǒng)插值函數(shù)在兩端插值區(qū)間易出現(xiàn)“龍格現(xiàn)象”的弊端,充分發(fā)揮了分形插值法能通過(guò)物體的部分信息推求整體性態(tài)的優(yōu)勢(shì),將其運(yùn)用到缺失時(shí)間序列的插值計(jì)算中;胡添翼[5]運(yùn)用空間鄰近點(diǎn)的變形信息來(lái)回歸目標(biāo)測(cè)點(diǎn)的變形值,提出了空間鄰近點(diǎn)回歸插值法和空間反距離加權(quán)插值法.
本文將混凝土壩變形監(jiān)測(cè)信息視為時(shí)間序列,將信息的不完整問(wèn)題分為兩類(lèi)來(lái)處理,一類(lèi)是時(shí)間序列的單值缺失問(wèn)題(不均勻問(wèn)題),即存在小部分時(shí)間間隔與整體不一致的數(shù)據(jù)序列時(shí),對(duì)其進(jìn)行均勻化處理;另一類(lèi)是連續(xù)多個(gè)數(shù)據(jù)缺失問(wèn)題,對(duì)其進(jìn)行估計(jì)補(bǔ)充.
傳統(tǒng)的混凝土壩單值缺失處理方法常用插值法進(jìn)行估計(jì),主要包括分段線(xiàn)性插值、多項(xiàng)式Lagrange插值、Newton 插值、三次樣條插值和三次Hermite插值等,這些插值方法對(duì)單值缺失數(shù)據(jù)進(jìn)行估計(jì)時(shí),并不會(huì)影響到變形時(shí)間序列的整體變化趨勢(shì)和規(guī)律,因此當(dāng)缺失信息較少時(shí),可采用此類(lèi)插值方法進(jìn)行補(bǔ)齊,構(gòu)成等間隔的變形時(shí)間序列.但這些傳統(tǒng)插值方法只是基于已知的數(shù)據(jù)本身,并沒(méi)有過(guò)多考慮實(shí)際問(wèn)題的物理意義,而變形時(shí)間序列單值缺失問(wèn)題的處理是混凝土壩未知時(shí)間點(diǎn)變形信息的補(bǔ)充,需要考慮到混凝土壩的實(shí)際變形規(guī)律.
為此,本文引入非局部平均(Non-local Means,NLM)思想[6-7],提出了混凝土壩單值缺失處理改進(jìn)的非局部平均插值法,方法思路為:利用變形信息的非局部知識(shí)信息,以及變形序列中不同時(shí)刻信息規(guī)律的自相似性來(lái)對(duì)缺失時(shí)刻的變形值進(jìn)行估計(jì),在此基礎(chǔ)上,引入完整的與目標(biāo)測(cè)點(diǎn)變形趨勢(shì)相關(guān)性最強(qiáng)的變形序列作為計(jì)算依據(jù).該方法旨在通過(guò)綜合考慮變形序列不同時(shí)刻變形值之間的自相關(guān)性,以及與目標(biāo)測(cè)點(diǎn)位置相當(dāng)?shù)臏y(cè)點(diǎn)之間的相關(guān)性來(lái)刻畫(huà)出缺失信息的特征.
假設(shè)壩體某變形測(cè)點(diǎn)A 的測(cè)值存在不均勻現(xiàn)象,為了估計(jì)出單個(gè)缺失數(shù)據(jù),進(jìn)行以下步驟.
首先,從測(cè)點(diǎn)的整個(gè)變形時(shí)間序列來(lái)看,找出與測(cè)點(diǎn)A 的變形趨勢(shì)相關(guān)性最強(qiáng)且序列完整的測(cè)點(diǎn)B,可從同一個(gè)監(jiān)測(cè)垂線(xiàn)上的諸多測(cè)點(diǎn)來(lái)尋找.本文采用Pearson相關(guān)性檢驗(yàn)方法來(lái)計(jì)算測(cè)點(diǎn)變形數(shù)據(jù)之間的相關(guān)性,Pearson相關(guān)系數(shù)是一種用來(lái)定量衡量變量之間相關(guān)關(guān)系的統(tǒng)計(jì)學(xué)參數(shù),其計(jì)算公式為:
式中:δAi、δBi分別表示A、B測(cè)點(diǎn)同一時(shí)刻的變形值;N表示序列的總個(gè)數(shù).
從式(1)可以看出,Pearson相關(guān)系數(shù)的值在-1到1之間變化,且相關(guān)系數(shù)的絕對(duì)值越大,代表兩變量之間的相關(guān)性越強(qiáng).當(dāng)相關(guān)系數(shù)越接近于1或-1時(shí),相關(guān)性越強(qiáng);當(dāng)相關(guān)系數(shù)越接近于0時(shí),相關(guān)性越弱.另外,當(dāng)相關(guān)系數(shù)大于0時(shí),兩變量為正相關(guān);反之為負(fù)相關(guān).
其次,將測(cè)點(diǎn)B 的變形時(shí)間序列中與測(cè)點(diǎn)A 序列中待求插值點(diǎn)同一時(shí)間的變形值稱(chēng)作假設(shè)插值點(diǎn),計(jì)算測(cè)點(diǎn)B的序列中其它點(diǎn)對(duì)此假設(shè)插值點(diǎn)變形值的權(quán)重.本文采用歐幾里德距離(又稱(chēng)歐式距離)的平方(Square of Euclidean Distance,SED)來(lái)度量不同時(shí)間點(diǎn)對(duì)應(yīng)變形值的相似性.歐式距離的平方計(jì)算公式為:
式中:δBi、δBj分別表示B 測(cè)點(diǎn)i、j時(shí)刻對(duì)應(yīng)的變形值大小.
通常情況下,不同時(shí)刻的變形值和之間的差值越小,說(shuō)明兩個(gè)時(shí)刻的變形越相似,計(jì)算時(shí)賦予的權(quán)重值也越大,權(quán)重采用如下公式計(jì)算:
式中:h為控制指數(shù)函數(shù)增減速度的參數(shù),決定著權(quán)重的大小.
最后,將基于測(cè)點(diǎn)B完整變形序列求出的各個(gè)參考點(diǎn)相對(duì)于假設(shè)插值點(diǎn)的權(quán)值賦予測(cè)點(diǎn)A 對(duì)應(yīng)時(shí)刻的變形值,再對(duì)其進(jìn)行加權(quán)平均即可求出插值點(diǎn)的數(shù)值,公式如下:
式中:I表示選取的整個(gè)時(shí)間序列的時(shí)刻集.
假設(shè)測(cè)點(diǎn)A 和測(cè)點(diǎn)B的變形時(shí)間序列如圖1所示,其中測(cè)點(diǎn)B的序列完整,測(cè)點(diǎn)A 的序列中有缺失情況.圖中圓點(diǎn)表示不同時(shí)刻對(duì)應(yīng)的變形值大小,方點(diǎn)表示測(cè)點(diǎn)A 序列中的缺失值,也即待求的插值點(diǎn).
圖1 單值缺失情況示意圖
當(dāng)變形時(shí)間序列中缺失的信息較多時(shí),傳統(tǒng)的插值方法難以進(jìn)行有效的插值計(jì)算,而NLM 插值算法雖然可以求出每個(gè)缺失點(diǎn)的數(shù)值,但需要逐個(gè)計(jì)算參考序列中其它點(diǎn)對(duì)假設(shè)插值點(diǎn)的權(quán)重值,再計(jì)算目標(biāo)序列中各點(diǎn)對(duì)插值點(diǎn)的權(quán)重.該方法雖然可行,但計(jì)算工作量大.針對(duì)上述情況,本文研究混凝土壩變形信息的多值缺失處理方法.
目前常用的多值缺失處理方法主要有非線(xiàn)性回歸分析插值法和空間鄰近點(diǎn)回歸插值法,但兩種方法都有其局限性.當(dāng)回歸模型對(duì)變形序列的擬合精度較低或缺失段的環(huán)境量未知時(shí),非線(xiàn)性回歸分析插值法精度較低;空間鄰近點(diǎn)回歸插值法借鑒了統(tǒng)計(jì)模型的建模思想,僅對(duì)變量的有限個(gè)整數(shù)項(xiàng)冪級(jí)數(shù)展開(kāi)進(jìn)行回歸,難以全面刻畫(huà)測(cè)點(diǎn)變形之間未知的作用關(guān)系.
考慮到空間測(cè)點(diǎn)變形之間復(fù)雜未知的作用關(guān)系難以用具體的數(shù)學(xué)表達(dá)式進(jìn)行表征,而B(niǎo)P神經(jīng)網(wǎng)絡(luò)具有強(qiáng)大的非線(xiàn)性映射能力,經(jīng)過(guò)對(duì)樣本的學(xué)習(xí)訓(xùn)練可以勾畫(huà)出數(shù)據(jù)背后復(fù)雜的信息關(guān)系;與此同時(shí),BP神經(jīng)網(wǎng)絡(luò)還具備強(qiáng)大的泛化能力,訓(xùn)練好的網(wǎng)絡(luò)可以實(shí)現(xiàn)對(duì)新輸入樣本的有效處理,給出合適的輸出結(jié)果.因此,為了提高缺失值估計(jì)的精度,盡可能找出最接近缺失時(shí)刻變形真實(shí)值,本文引入BP神經(jīng)網(wǎng)絡(luò)來(lái)處理空間測(cè)點(diǎn)變形之間的未知關(guān)系,由此提出相應(yīng)缺失值的估計(jì)方法.
假設(shè)某混凝土壩壩體有n個(gè)在空間上鄰近且結(jié)構(gòu)上相關(guān)的監(jiān)測(cè)點(diǎn),如混凝土重力壩同一條垂線(xiàn)上的測(cè)點(diǎn)或混凝土拱壩同一變形分區(qū)內(nèi)的測(cè)點(diǎn)(分區(qū)方法本文不展開(kāi)說(shuō)明),當(dāng)?shù)趇個(gè)測(cè)點(diǎn)的變形信息由于某些原因出現(xiàn)缺失,即可利用其它m=(n-1)個(gè)測(cè)點(diǎn)的已知信息來(lái)估計(jì)i點(diǎn)的信息.基于BP神經(jīng)網(wǎng)絡(luò)映射的多值缺失估計(jì)方法建立步驟如下:
設(shè)樣本集中含有輸入向量和輸出向量之間的Z個(gè)模式對(duì),隨機(jī)取一個(gè)模式對(duì)k,輸入模式向量為A k,期望輸出向量為;中間層單元輸入向量為S=(s1,s2,…,s p)(p為隱含層節(jié)點(diǎn)的數(shù)目,下同),輸出向量為B k=(b1,b2,…,b p);輸出層單元輸入向量為L(zhǎng) k=(l1,l2,…,l p),輸出向量為C=(c);輸入層與隱含層之間的連接權(quán)為w(w=w ij,i=1,2,…,m;j=1,2,…,p);隱含層與輸出層之間的連接權(quán)為v(v=v j,j=1,2,…,p);隱含層各單元輸出閾值為θ(θ=θj,j=1,2,…,p);輸出層單元的輸出閾值為γ=(γ).
1)網(wǎng)絡(luò)參數(shù)初始化,通過(guò)隨機(jī)賦值函數(shù)給w、v、θ和γ隨機(jī)賦一個(gè)(-1,1)之間的較小值;
2)用輸入向量A k、連接權(quán)w和閾值θ計(jì)算隱含層的輸入S;用S通過(guò)Sigmoid函數(shù)計(jì)算隱含層的輸出B k,即:
3)用隱含層的輸出B k、連接權(quán)v和閾值γ計(jì)算輸出層單元的輸入L k,再用L k計(jì)算輸出層單元的輸出向量C,即:
4)用期望輸出向量Y k、網(wǎng)絡(luò)實(shí)際輸出C計(jì)算輸出層單元的一般化誤差d k,即:
5)用連接權(quán)v、輸出層的一般化誤差d k和隱含層的輸出Bk計(jì)算隱含層各單元的一般化誤差e k,即:
6)用輸出層單元的一般化誤差d k、中間層各單元的輸出B k修正連接權(quán)v和閾值γ,即:
式中:η代表學(xué)習(xí)效率,取η=0.01~0.8;α為動(dòng)量因子,取α=0.9.
近二三十年來(lái),國(guó)內(nèi)學(xué)者通過(guò)引進(jìn)和學(xué)習(xí)西方的數(shù)學(xué)教育理論和方法,增強(qiáng)國(guó)際間的交流與合作,這是現(xiàn)在與世界進(jìn)行對(duì)話(huà)的基礎(chǔ).但是,與數(shù)學(xué)不同的是,數(shù)學(xué)教育有很強(qiáng)的民族性、地域性,如何基于中國(guó)的民族性和地域性建立中國(guó)數(shù)學(xué)教育理論體系與研究規(guī)范,并以此為基礎(chǔ)建立自己的話(huà)語(yǔ)權(quán),進(jìn)而與世界對(duì)話(huà),融入世界學(xué)術(shù)圈?
8)隨機(jī)選取訓(xùn)練樣本集中另一個(gè)學(xué)習(xí)模式對(duì),重復(fù)步驟3)~6),直至所有的模式對(duì)訓(xùn)練完畢;
9)計(jì)算網(wǎng)絡(luò)全局誤差函數(shù)E,其計(jì)算式為:
若E小于預(yù)先設(shè)定的一個(gè)誤差值,則網(wǎng)絡(luò)停止學(xué)習(xí);否則重復(fù)步驟3)~8),進(jìn)行樣本集的下一輪學(xué)習(xí)訓(xùn)練;
10)將訓(xùn)練好的網(wǎng)絡(luò)保存,輸入新樣本,得出缺失信息估計(jì)輸出結(jié)果.
以n=5為例,輸入層即為4個(gè)相關(guān)測(cè)點(diǎn)的變形序列,輸出層即為目標(biāo)測(cè)點(diǎn)的變形序列,網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示.
圖2 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖
我國(guó)某混凝土重力壩壩頂高程384 m,最大壩高162 m;為監(jiān)測(cè)大壩的水平變形,在各重要壩段均布置了垂線(xiàn).本文以泄1壩段正垂線(xiàn)上的各測(cè)點(diǎn)監(jiān)測(cè)數(shù)據(jù)為例進(jìn)行分析,驗(yàn)證本文所提出的不完整信息處理方法的有效性,6 個(gè)測(cè)點(diǎn)的水平變形過(guò)程線(xiàn)如圖3 所示.可以發(fā)現(xiàn),這些測(cè)點(diǎn)的水平變形過(guò)程線(xiàn)具有較強(qiáng)的相關(guān)性.
以圖3中的測(cè)點(diǎn)PL5-3為例,首先尋找與該測(cè)點(diǎn)變形序列相關(guān)性最強(qiáng)的參考序列,目標(biāo)測(cè)點(diǎn)序列與其它各測(cè)點(diǎn)序列的相關(guān)性計(jì)算結(jié)果見(jiàn)表1.
圖3 泄1壩段正垂線(xiàn)測(cè)點(diǎn)水平變形過(guò)程線(xiàn)
表1 目標(biāo)測(cè)點(diǎn)與各鄰近測(cè)點(diǎn)變形序列的相關(guān)性結(jié)果
從上表的計(jì)算結(jié)果可以看出,測(cè)點(diǎn)PL5-4的變形序列與目標(biāo)序列的相關(guān)性最強(qiáng),變形規(guī)律最相似,因此,參考測(cè)點(diǎn)即為測(cè)點(diǎn)PL5-4.
對(duì)于2014年8月31日到2014年9月18日的變形序列,共有19個(gè)變形數(shù)據(jù),見(jiàn)表2.
表2 目標(biāo)測(cè)點(diǎn)與參考測(cè)點(diǎn)的變形數(shù)據(jù)匯總表
假設(shè)2014年9月10日的變形數(shù)據(jù)是缺失的,用本文提出的基于非局部平均的插值方法和傳統(tǒng)方法分別對(duì)缺失值進(jìn)行估計(jì),結(jié)果見(jiàn)表3.
表3 各插值方法的估計(jì)結(jié)果對(duì)比 (單位:mm)
從各插值方法的計(jì)算結(jié)果可以看出,本文提出的基于非局部平均的單值缺失估計(jì)方法的估計(jì)結(jié)果接近原監(jiān)測(cè)值.同時(shí)可以發(fā)現(xiàn),當(dāng)缺失值不在前后兩個(gè)數(shù)值區(qū)間范圍內(nèi)時(shí),傳統(tǒng)的插值方法難以有效估計(jì)出此類(lèi)變形值;而NLM 插值方法克服了此局限性,該方法利用變形序列自相似性的同時(shí)引入?yún)⒖夹蛄?提高了缺失值估計(jì)的精度.
同樣以PL5-3測(cè)點(diǎn)的變形序列為例,構(gòu)造長(zhǎng)達(dá)一個(gè)月的缺失段(2014 年9 月1 日 至2014 年10 月2日).利用BP 神經(jīng)網(wǎng)絡(luò)建立同一垂線(xiàn)上的其它測(cè)點(diǎn)與目標(biāo)測(cè)點(diǎn)變形序列之間的映射關(guān)系.首先將各測(cè)點(diǎn)均已知的變形數(shù)據(jù)組成訓(xùn)練樣本導(dǎo)入BP 神經(jīng)網(wǎng)絡(luò)中進(jìn)行學(xué)習(xí),其次將其它測(cè)點(diǎn)缺失時(shí)間的變形值組成新樣本導(dǎo)入訓(xùn)練好的網(wǎng)絡(luò)中計(jì)算出目標(biāo)測(cè)點(diǎn)的缺失數(shù)據(jù).各方法的計(jì)算結(jié)果如圖4所示,其估計(jì)精度見(jiàn)表4,其中可決系數(shù)
圖4 缺失值估計(jì)結(jié)果對(duì)比圖
表4 缺失值估計(jì)精度對(duì)比
由圖4和表4的結(jié)果可以看出,本文提出的基于空間鄰近點(diǎn)BP 映射的多值缺失估計(jì)方法的估計(jì)精度均高于其它3種方法,可決系數(shù)和均方根誤差均達(dá)到比較理想的效果;空間鄰近點(diǎn)插值方法的估計(jì)效果也較好,但該方法僅利用了上下兩個(gè)測(cè)點(diǎn)的變形信息進(jìn)行回歸分析,沒(méi)有充分挖掘出目標(biāo)測(cè)點(diǎn)變形的相關(guān)信息;非線(xiàn)性回歸利用了統(tǒng)計(jì)模型的思想,在環(huán)境量變化不大的情況下可以采用該方法進(jìn)行估計(jì);線(xiàn)性插值的效果較差,難以適用于多值缺失的估計(jì).
為解決混凝土壩變形信息的缺失問(wèn)題,本文提出了基于非局部平均思想的單值缺失估計(jì)方法和基于空間鄰近點(diǎn)BP映射的多值缺失估計(jì)方法;工程應(yīng)用驗(yàn)證表明,本文提出的兩種方法計(jì)算簡(jiǎn)單,易于操作,且均具有較高的精確度,可以較好地估計(jì)出變形時(shí)間序列中的缺失信息.但是,這兩種方法仍有待改進(jìn)的地方:1)基于非局部平均思想的單值缺失估計(jì)方法,需要確定時(shí)間序列中所有已知時(shí)刻變形對(duì)缺失時(shí)刻變形的權(quán)重,整個(gè)時(shí)間序列長(zhǎng)度的選擇標(biāo)準(zhǔn)值需進(jìn)一步的研究;2)基于空間鄰近點(diǎn)BP映射的多值缺失估計(jì)方法,通過(guò)BP神經(jīng)網(wǎng)絡(luò)來(lái)刻畫(huà)目標(biāo)測(cè)點(diǎn)變形和鄰近點(diǎn)變形的映射關(guān)系,但難以用數(shù)學(xué)顯式刻畫(huà)測(cè)點(diǎn)變形之間的關(guān)系,需要進(jìn)一步研究能充分反映混凝土壩各部分變形間相互關(guān)系的直觀表達(dá)式.