靳 萍,李紅志,王 磊
(國(guó)家海洋技術(shù)中心,天津 300112)
感應(yīng)傳輸CTD,是一種主要用于淺海區(qū)固定水層對(duì)溫鹽進(jìn)行長(zhǎng)期、定點(diǎn)觀測(cè)的剖面儀,主要搭載于潛標(biāo)、浮標(biāo)和錨泊式觀測(cè)平臺(tái)等。通過(guò)在溫鹽鏈不同位置部署多個(gè)CTD測(cè)量?jī)x,以感應(yīng)傳輸?shù)姆绞?,將水下CTD傳感器測(cè)得的水文信息上傳到水上終端,以實(shí)現(xiàn)溫鹽剖面的實(shí)時(shí)觀測(cè)。由多個(gè)感應(yīng)傳輸CTD構(gòu)成的系泊系統(tǒng)既可用來(lái)研究上層海洋復(fù)雜的運(yùn)動(dòng)過(guò)程,也能有效捕獲上層海洋對(duì)氣候的影響過(guò)程[1]。然而,由于海水變化是一個(gè)隨機(jī)過(guò)程,再加上淺海區(qū)易受周?chē)h(huán)境干擾的特殊性、及測(cè)量?jī)x的長(zhǎng)期工作等,在對(duì)海水測(cè)量的過(guò)程中會(huì)不可避免地受到各種噪聲源的干擾,使CTD測(cè)量?jī)x測(cè)得的原始水文數(shù)據(jù)必然存在測(cè)量誤差[2-3],這就極大地限制了數(shù)據(jù)的實(shí)用性。
自20世紀(jì)80年代以來(lái),海洋科學(xué)工作者十分重視CTD數(shù)據(jù)資料校正技術(shù)的研究,并提出了CTD數(shù)據(jù)處理的主要方法和步驟[4-6],當(dāng)前美國(guó)Seabird Electronics SBE Data Processing軟件中提供的CTD數(shù)據(jù)處理模塊是較為常用的數(shù)據(jù)校正方式,包括:數(shù)據(jù)濾波、逆壓訂正、對(duì)齊訂正、熱滯訂正、壓力/時(shí)間平均等,主要針對(duì)CTD在下放過(guò)程中出現(xiàn)的傳感器響應(yīng)時(shí)間不匹配、船體上下?lián)u晃及儀器裝配和電導(dǎo)池?zé)釡?yīng)等問(wèn)題進(jìn)行處理。此外,梁廣建等[7]和劉首華等[8]在統(tǒng)計(jì)檢驗(yàn)基礎(chǔ)上,分別采用濾波/擬合、局部檢驗(yàn)方法對(duì)異常值進(jìn)行質(zhì)控;Uchida等[9]采用低通濾波方法降低高頻噪聲干擾;鄭一等[10]提出一種小波分析方法降低測(cè)量誤差。然而這些校正方式主要針對(duì)CTD垂直剖面測(cè)量過(guò)程中產(chǎn)生的誤差問(wèn)題進(jìn)行,對(duì)定點(diǎn)式測(cè)量誤差校正研究甚少,且降噪方法是基于某個(gè)時(shí)域或頻域單獨(dú)進(jìn)行,有一定局限性。而通常情況下,海水變化非平穩(wěn),定點(diǎn)式測(cè)量過(guò)程中也會(huì)存在各種噪聲干擾,單獨(dú)時(shí)域或頻域處理很難保證方法的有效性,如時(shí)域降噪方法雖有很好直觀性,卻容易混淆視覺(jué),造成誤判;頻域處理方法雖能將時(shí)域內(nèi)隱含的特征很好地表征,但需滿足時(shí)間序列平穩(wěn)性的前提條件,小波變換可處理非平穩(wěn)信號(hào),但對(duì)小波基和系數(shù)有著較高要求,這就限制了其適用性。因此,鑒于時(shí)域和頻域各自的優(yōu)缺點(diǎn)、CTD各參數(shù)測(cè)量值非線性非平穩(wěn)性變化,提出一種時(shí)頻分析方法,用于對(duì)感應(yīng)傳輸CTD海試數(shù)據(jù)進(jìn)行降噪,其總體設(shè)計(jì)框圖如圖1所示。該方法不僅能夠有效識(shí)別與去除高頻噪聲成分,還能在提升信噪比基礎(chǔ)上保留原有信號(hào)的細(xì)微變化。
圖1 感應(yīng)傳輸CTD數(shù)據(jù)降噪的總體設(shè)計(jì)框圖
感應(yīng)傳輸CTD獲取的溫鹽深水文數(shù)據(jù)是一種非線性非平穩(wěn)的時(shí)間序列,其中,壓力在測(cè)量剖面的水平方向上以布放深度為基線平衡點(diǎn),在海流、引潮力、降雨、風(fēng)等作用下圍繞基線上下波動(dòng)、漂移,存在著明顯的潛周期性,其降噪處理過(guò)程如圖2所示;溫度和電導(dǎo)率的變化相對(duì)緩慢,兩者變化趨勢(shì)基本一致,主要受到CTD布放的水層位置、太陽(yáng)輻射及氣溫的日、月、季節(jié)性變化等因素影響,溫度和電導(dǎo)率的降噪處理過(guò)程一致,如圖3所示。
圖2 壓力降噪處理過(guò)程
圖3 溫度/電導(dǎo)率降噪處理過(guò)程
其中,CEEMD分解的自適應(yīng)性能有效識(shí)別CTD信號(hào)中的高頻諧波成分,且第一經(jīng)驗(yàn)態(tài)本征函數(shù)IMF0變化頻率最快,鑒于異常值幅值及頻率突變的特點(diǎn),可有效定位異常突變點(diǎn);隨機(jī)森林中決策樹(shù)選擇的隨機(jī)性和有放回的隨機(jī)抽樣技術(shù),使回歸具有較強(qiáng)的魯棒性,非常適用于處理非線性數(shù)據(jù);FFT變換用于CTD各參數(shù)諧波振蕩的頻譜特點(diǎn)分析,對(duì)其所含的高頻低幅值噪聲識(shí)別。
CEEMD方法將復(fù)雜的時(shí)間序列根據(jù)其變化特征自適應(yīng)地分解為一系列從高頻到低頻具有固定模態(tài)的基函數(shù)IMF,每個(gè)IMF代表一個(gè)的基本諧波振蕩,是 EMD(empirical mode decomposition)和EEMD(ensemble empirical mode decomposition)的改進(jìn)算法,可有效解決EMD的模態(tài)混疊現(xiàn)象和EEMD噪聲殘留問(wèn)題,CEEMD分解步驟如下[11]:
3)求多組分量的瞬時(shí)平均值
隨機(jī)森林是將多棵決策樹(shù)集成的一種機(jī)器學(xué)習(xí)算法,每個(gè)決策樹(shù)是一個(gè)單獨(dú)的基評(píng)估器,通過(guò)求平均或多數(shù)表決的原則進(jìn)行回歸,可有效改善決策樹(shù)在回歸時(shí)易過(guò)擬合的缺陷,提升回歸準(zhǔn)確率。隨機(jī)森林的構(gòu)建過(guò)程如圖4所示[13]。
圖4 隨機(jī)森林模型構(gòu)建過(guò)程
隨機(jī)森林算法進(jìn)行魯棒性回歸時(shí),需重點(diǎn)解決兩個(gè)核心問(wèn)題:1)找到最佳節(jié)點(diǎn)和分枝;2)讓決策樹(shù)停止生長(zhǎng),防止過(guò)擬合。這兩個(gè)問(wèn)題關(guān)鍵在于分枝質(zhì)量衡量指標(biāo)的選取和參數(shù)調(diào)優(yōu),鑒于均方誤差存在異常點(diǎn)敏感、魯棒性不強(qiáng)的問(wèn)題[14],本文選擇平均絕對(duì)誤差(mean absolute error,MAE)作為分枝衡量指標(biāo),同時(shí)采用學(xué)習(xí)曲線與網(wǎng)格搜索法相結(jié)合的方法優(yōu)化隨機(jī)森林參數(shù),擬尋找最小化泛化誤差。
式中:yi——第個(gè)樣本點(diǎn)的實(shí)測(cè)值;
fi——第i個(gè)樣本點(diǎn)模型回歸的值;
N——觀測(cè)的樣本點(diǎn)數(shù)。
鑒于海水運(yùn)動(dòng)復(fù)雜性,為了更好地模擬海水壓力、溫度和電導(dǎo)率時(shí)間序列的變化,本文將CTD水文信號(hào)的仿真分為3種信號(hào)的疊加。第一類(lèi)是真實(shí)水文信號(hào),是由海流、波浪、潮汐,以及太陽(yáng)輻射、風(fēng)等自然現(xiàn)象引起的水文變化[15],以實(shí)測(cè)數(shù)據(jù)求滑動(dòng)平均的方法進(jìn)行模擬;第二類(lèi)是隨機(jī)誤差信號(hào),諸如儀器固有的電子和布朗熱運(yùn)動(dòng)等問(wèn)題引起的白噪聲[10],通過(guò)一個(gè)平穩(wěn)的偽隨機(jī)高斯白噪聲進(jìn)行仿真;第三類(lèi)是異常信號(hào),如微生物附著、海面油污、人為破壞或儀器不穩(wěn)定等問(wèn)題造成的暫態(tài)信號(hào),通過(guò)添加幅值、頻率突變樣點(diǎn)進(jìn)行模擬。限于篇幅,本文只對(duì)溫度和壓力信號(hào)進(jìn)行仿真和降噪驗(yàn)證。
1)壓力信號(hào)仿真
壓力信號(hào)仿真如圖5所示,其中1 bar=0.1 MPa。
圖5 壓力信號(hào)仿真
2)壓力信號(hào)降噪
① 異常值定位
壓力IMF0如圖6所示,可以看到圖中存在3個(gè)明顯的幅值突變點(diǎn),與壓力信號(hào)添加異常點(diǎn)的位置剛好吻合。
圖6 壓力IMF0
② CEEMD分解及FFT譜分析
壓力時(shí)間序列經(jīng)CEEMD分解為IMF0至IMF5的固態(tài)特征分量,對(duì)其進(jìn)行相應(yīng)的FFT譜分析,結(jié)果如圖7所示。
從時(shí)頻分析圖7中可以看到,IMF0時(shí)域上的幅值變化表現(xiàn)隨機(jī)性,頻域上的主頻譜主要集中在高頻域,含大量的噪聲成分;從IMF1到IMF5,變化頻率依次降低,主頻譜向低頻集中靠攏,有用信號(hào)的頻率主要集中在0~20 Hz之間;IMF1含有部分高頻噪聲,IMF5反映了壓力信號(hào)的基線變化趨勢(shì)。
圖7 壓力CEEMD分解的時(shí)頻圖
3)降噪結(jié)果分析
通過(guò)時(shí)頻域分析可知,噪聲部分主要集中于固態(tài)特征分量IMF0、IMF1,濾波后的得到圖8所示的降噪對(duì)比結(jié)果。
從降噪結(jié)果對(duì)比圖8中可以看到,壓力降噪后的變化趨勢(shì)與真實(shí)信號(hào)高度一致,毛刺現(xiàn)象減少,有效降低噪聲干擾;表1中,相關(guān)性99%以上,信噪比提升了約9 dB。
圖8 壓力降噪結(jié)果對(duì)比
表1 壓力降噪結(jié)果統(tǒng)計(jì)
1)溫度信號(hào)仿真
溫度信號(hào)仿真,如圖9所示。
圖9 溫度信號(hào)仿真
2)溫度信號(hào)降噪
①異常值定位
溫度IMF0如圖10所示,可以看到圖中存在4個(gè)明顯的幅值突變點(diǎn),與溫度信號(hào)添加異常點(diǎn)的位置剛好吻合。
圖10 溫度IMF0
②隨機(jī)森林回歸
a.構(gòu)造特征項(xiàng)
從表2可以看到,將時(shí)間和壓力作為特征項(xiàng)時(shí),可有效提高模型回歸的準(zhǔn)確性。
表2 特征項(xiàng)選擇
b.參數(shù)調(diào)優(yōu)
通過(guò)學(xué)習(xí)曲線和網(wǎng)格搜索法,以平均絕對(duì)誤差作為模型回歸的評(píng)價(jià)指標(biāo),確定最終參數(shù):樹(shù)深為10,樹(shù)數(shù)26,分枝節(jié)點(diǎn)最小樣本數(shù)2,葉節(jié)點(diǎn)最小樣本數(shù)30,調(diào)參后準(zhǔn)確度提升了0.003 ℃,見(jiàn)表3。
表3 參數(shù)調(diào)優(yōu)
③殘差CEEMD分解及FFT譜分析
溫度序列經(jīng)隨機(jī)森林魯棒性回歸后,對(duì)擬合殘差性進(jìn)行CEEMD分解,分解為IMF0至IMF6的固態(tài)特征分量,對(duì)其進(jìn)行相應(yīng)的FFT譜分析,結(jié)果如圖11所示。
從圖11中可以看到,IMF0時(shí)域上的幅值變化隨機(jī),變化頻率明顯高于其他特征分量,主頻譜主要集中在高頻域,含大量的噪聲成分;從IMF1到IMF6,變化頻率依次降低,主頻譜向低頻集中靠攏,有用信號(hào)的頻率主要集中在0~20 Hz之間,其中IMF1含有較多的高頻噪聲。
圖11 溫度回歸殘差CEEMD分解的時(shí)頻圖
3)降噪結(jié)果分析
通過(guò)時(shí)頻域分析可知,噪聲主要集中于固態(tài)特征分量IMF0、IMF1,濾波后的得到圖12所示的降噪對(duì)比結(jié)果。
從降噪結(jié)果對(duì)比圖12中可以看到,降噪后的變化趨勢(shì)與真實(shí)信號(hào)高度一致,既保留了細(xì)節(jié)信息,又減少了毛刺噪聲干擾;從表4中,相關(guān)性和信噪比分別提升了約2%和9 dB。
表4 溫度降噪結(jié)果統(tǒng)計(jì)
圖12 溫度降噪結(jié)果對(duì)比
感應(yīng)耦合傳輸CTD在威海褚島海域錨泊平臺(tái)進(jìn)行海試,水深約70 m,該次試驗(yàn)投放開(kāi)始于2019年10月24日,2020年5月20日回收,歷時(shí)長(zhǎng)達(dá)約7個(gè)月,采樣間隔為10 min。為了驗(yàn)證基于時(shí)頻分析的降噪方法的有效性,基于壓力背景場(chǎng)的周期性波動(dòng),選取2019.11.21-2019.11.22海試數(shù)據(jù)為例說(shuō)明,將布放深度最為相近(相差約1.5 m)的國(guó)產(chǎn)ICTD57和進(jìn)口SBE37_57設(shè)置為比測(cè)對(duì)照組。
鑒于海水運(yùn)動(dòng)復(fù)雜多變,聯(lián)合國(guó)教科文組織關(guān)于海洋科學(xué)第54號(hào)文件的第5章中提及采用均方根誤差(root mean squared error,RMSE)作為準(zhǔn)確度評(píng)價(jià)指標(biāo),故本文將其作為CTD準(zhǔn)確度的評(píng)價(jià)指標(biāo)。
式中:xi、yi——比測(cè)對(duì)照組在第i個(gè)樣本點(diǎn)值;
N——觀測(cè)的樣本點(diǎn)數(shù)。
應(yīng)用本文所提的壓力時(shí)頻分析方法對(duì)ICTD57和SBE37_57的壓力實(shí)測(cè)值分別進(jìn)行降噪處理,降噪處理對(duì)比結(jié)果如圖13、圖14和表5所示。
從圖13可以看到,壓力時(shí)頻分析的降噪方法能夠有效識(shí)別異常突變點(diǎn),降噪后的變化趨勢(shì)與原始數(shù)據(jù)基本一致,即保留了細(xì)微信息,又降低了毛刺噪聲干擾;從圖14和表5可以看到,經(jīng)過(guò)降噪處理后,測(cè)量偏差在小提琴圖上下端的尖峰分布明顯減少,RMSE減小,相關(guān)提升。
圖13 ICTD57和SBE37_57壓力降噪結(jié)果對(duì)比
圖14 ICTD57與SBE37_57壓力測(cè)量偏差分布
表5 ICTD57與SBE37_57壓力降噪前后的統(tǒng)計(jì)對(duì)比
首先,對(duì)溫度序列利用隨機(jī)森林進(jìn)行魯棒性回歸,構(gòu)造特征項(xiàng)和參數(shù)調(diào)優(yōu)是提升模型回歸準(zhǔn)確性的關(guān)鍵。本文通過(guò)構(gòu)造不同的特征項(xiàng),選擇平均絕對(duì)誤差作為分枝質(zhì)量的評(píng)價(jià)指標(biāo),并基于學(xué)習(xí)曲線和網(wǎng)格搜索法相結(jié)合的方法對(duì)參數(shù)調(diào)優(yōu),以ICTD57為例,ICTD57溫度回歸最優(yōu)參數(shù)為:最大樹(shù)深為9,數(shù)樹(shù)數(shù)43,分枝節(jié)點(diǎn)最小樣本數(shù)2,葉節(jié)點(diǎn)最小樣本數(shù)1,最終擬合效果如表6所示。
從表6可以看到,將時(shí)間和壓力綜合作為特征項(xiàng)時(shí),平均絕對(duì)誤差有效減小,壓力經(jīng)降噪處理及調(diào)參后模型準(zhǔn)確性提升,也從側(cè)面說(shuō)明了壓力降噪方法的有效性。
表6 ICTD57溫度回歸特征項(xiàng)選擇
應(yīng)用溫度時(shí)頻分析方法對(duì)ICTD57和SBE37_57的溫度實(shí)測(cè)值進(jìn)行降噪處理,如圖15、圖16和表7所示。
圖15 ICTD57和SBE37_57溫度降噪結(jié)果對(duì)比
圖16 ICTD57與SBE37_57溫度測(cè)量偏差分布
表7 ICTD57與SBE37_57溫度降噪前后的統(tǒng)計(jì)對(duì)比
從定性分析結(jié)果圖15和16看,溫度時(shí)頻分析降噪方法在保留溫度原有變化趨勢(shì)的基礎(chǔ)上,可減少隨機(jī)噪聲干擾,測(cè)量偏差在小提琴兩端的尖端分布現(xiàn)象明顯減少;從定量分析結(jié)果表7中,溫度的RMSE達(dá)到了GB/T 12763.2—2007《海洋調(diào)查規(guī)范第2部分:海洋水文觀測(cè)》的一級(jí)準(zhǔn)確度要求:±0.02 ℃,經(jīng)降噪處理后,可達(dá)到±0.01 ℃的準(zhǔn)確度要求,相關(guān)性提高了約4%。
1)有效性分析
鑒于海水中同一觀測(cè)量無(wú)法復(fù)測(cè)的特殊性及溫鹽參數(shù)對(duì)海洋動(dòng)力學(xué)研究的重要性,通過(guò)檢定比測(cè)對(duì)照組溫鹽的測(cè)量準(zhǔn)確性(見(jiàn)表8),以檢驗(yàn)該降噪方法的有效性。
表8 溫鹽測(cè)量準(zhǔn)確性
由表8可知,經(jīng)過(guò)降噪處理后,溫度和鹽度測(cè)量準(zhǔn)確性分別提升約1.4、1.3倍,均達(dá)到了GB/T 12763.2—2007的一級(jí)準(zhǔn)確度要求;溫度的準(zhǔn)確度可以達(dá)到±0.01 ℃,表明該降噪方法有效。
由于海水鹽度并非由傳感器直接測(cè)量而是由壓力、溫度和電導(dǎo)率參數(shù)衍生得到,由誤差傳遞原理,可通過(guò)鹽度檢驗(yàn)的方法對(duì)降噪結(jié)果的有效性進(jìn)行綜合分析。根據(jù)PSS-78鹽標(biāo)定義,由降噪后的壓力、溫度和電導(dǎo)率值計(jì)算出新的鹽度值,降噪對(duì)比結(jié)果如圖17、圖18、圖19和表9所示。
表9 ICTD57與SBE37_57鹽度降噪前后的統(tǒng)計(jì)對(duì)比
圖17 ICTD57與SBE37_57鹽度降噪前后對(duì)比
圖18 ICTD57與SBE37_57鹽度降噪方法對(duì)比
圖19 ICTD57與SBE37_57鹽度測(cè)量偏差分布
從圖17中紅色標(biāo)示可以看到,該降噪方法既可識(shí)別鹽度變化中的異常突變點(diǎn),又去除了毛刺噪聲干擾;圖18中,與常規(guī)低通濾波相比,能有效保留了海水的細(xì)微變化信息。
從圖19可以看到,經(jīng)降噪處理后,仍保留了鹽度測(cè)量偏差的原有分布規(guī)律,但在小提琴兩端的尖峰分布問(wèn)題明顯減少;表9中,降噪后的相關(guān)性提高了約2%,準(zhǔn)確性提升1.3倍,測(cè)量準(zhǔn)確度達(dá)到了GB/T 12763.2—2007的一級(jí)準(zhǔn)確度要求,進(jìn)一步說(shuō)明了該降噪方法的有效性。
2)白噪聲檢驗(yàn)
鑒于海水中對(duì)同一觀測(cè)量無(wú)法復(fù)測(cè)的特殊性,且對(duì)海水的實(shí)際值未知,為了保證沒(méi)有濾除海水變化的有用信息,需對(duì)降噪后的殘差進(jìn)行白噪聲檢驗(yàn),本文采用直方分布、相關(guān)性檢驗(yàn)和LB顯著性檢驗(yàn)相結(jié)合的方法分別對(duì)降噪后殘差的幅值分布、平穩(wěn)性和隨機(jī)性進(jìn)行檢驗(yàn),檢驗(yàn)結(jié)果見(jiàn)圖20~圖22。
從圖20可知,降噪后的殘差服從高斯分布;圖21中,只有滯后0時(shí),相關(guān)性最強(qiáng),在95%的置信區(qū)間內(nèi)相關(guān)系數(shù)基本上接近于0,表明降噪后的殘差滿足白噪聲標(biāo)準(zhǔn)差為常數(shù)、二階矩在時(shí)間滯后大于0時(shí)不相關(guān)的平穩(wěn)性特點(diǎn);圖22中,LB統(tǒng)計(jì)量和BP統(tǒng)計(jì)量的 P 值均大于0.05(圖中綠色橫線),故不拒絕原假設(shè),即降噪后殘差項(xiàng)分布呈隨機(jī)性,是白噪聲,說(shuō)明了該降噪方法的可靠性。
圖20 鹽度降噪殘差幅值分布
圖21 鹽度降噪殘差相關(guān)性
圖22 鹽度降噪殘差白噪聲檢驗(yàn)
感應(yīng)傳輸CTD在海上試驗(yàn)時(shí),會(huì)受到各種噪聲干擾引起的測(cè)量誤差?;跍佧}深各參數(shù)的變化特點(diǎn),提出一種基于時(shí)頻分析的降噪方法,首先,基于隨機(jī)森林回歸的魯棒性和CEEMD分解自適應(yīng)性提取高頻諧波振蕩;其次,由FFT譜特點(diǎn)可對(duì)高頻成分信噪分離,提取出所含的高頻噪聲成分。為了驗(yàn)證該降噪方法的有效性和可靠性,本文設(shè)置比測(cè)對(duì)照組,以鹽度檢驗(yàn)的方法對(duì)降噪效果分析,并通過(guò)仿真試驗(yàn)和實(shí)例分析驗(yàn)證,結(jié)果表明:
1)從仿真試驗(yàn)結(jié)果來(lái)看,溫鹽深各參數(shù)降噪后的變化趨勢(shì)與真實(shí)信號(hào)高度一致,毛刺現(xiàn)象明顯減少,表明時(shí)頻分析的降噪方法對(duì)噪聲干擾和異常突變點(diǎn)具有較高的識(shí)別性,降噪后各參數(shù)的信噪比提升。
2)在實(shí)例分析中,由比測(cè)對(duì)照組可以看到,經(jīng)降噪處理后的兩型CTD的溫鹽測(cè)量準(zhǔn)確性均達(dá)到了GB/T 12763.2—2007《海洋調(diào)查規(guī)范第2部分:海洋水文觀測(cè)》的一級(jí)準(zhǔn)確度要求,且與常規(guī)低通濾波相比,時(shí)頻分析降噪方法可保留海水的細(xì)微變化信息,說(shuō)明了該降噪方法的有效性。
3)以鹽度檢驗(yàn)的方法對(duì)降噪效果分析,降噪后的殘差通過(guò)了平穩(wěn)性和LB顯著性檢驗(yàn),滿足高斯白噪聲的特性要求,即時(shí)頻分析的降噪方法并沒(méi)有將有用信息去除,表明了該降噪方法的可靠性。