(1. 山東科技大學(xué) 測繪科學(xué)與工程學(xué)院,山東 青島 266590;2. 齊魯工業(yè)大學(xué)(山東省科學(xué)院) 海洋儀器儀表研究所,山東 青島 266061;3. 自然資源部 第一海洋研究所,山東 青島 266061)
海水溶解氧是維持海洋生物生存的重要物質(zhì),是評價水體受污染情況的重要指標(biāo)??焖贉?zhǔn)確、長期連續(xù)地監(jiān)測水體溶解氧濃度對于海洋環(huán)境保護、水質(zhì)生態(tài)危機預(yù)報預(yù)警、海岸帶綜合修復(fù)狀況評價以及科學(xué)指導(dǎo)水產(chǎn)養(yǎng)殖都具有重要意義[1]?,F(xiàn)有的基于熒光猝滅原理的光學(xué)溶解氧傳感器,尤其是國產(chǎn)傳感器存在連續(xù)工作穩(wěn)定性可靠性差、易污染、易生物附著、測量數(shù)據(jù)易漂移等問題[1]。究其原因,在于不論何種測控應(yīng)用場景,依賴各類傳感器測量獲得的結(jié)果均存在一定程度的數(shù)據(jù)不確定性。這種不確定性來源于操作誤差、儀器設(shè)備精確度、傳輸干擾或數(shù)據(jù)處理誤差等因素,因此必須對測控系統(tǒng)的傳感器輸出采取必要處理,確保數(shù)據(jù)有效性。
現(xiàn)階段,各類測控場景應(yīng)用最多的方法是信息融合,也稱數(shù)據(jù)融合。其主要思想是以多種渠道或多組測量獲取的數(shù)據(jù)全體為依據(jù),采用一定的算法邏輯,開展數(shù)據(jù)篩選、提前和整合,獲得的融合后數(shù)據(jù)比原始數(shù)據(jù)更加真實、可信。針對這類問題,文獻[2-5]進行了多傳感器測量數(shù)據(jù)融合的相關(guān)探索和研究。然而在各類工控領(lǐng)域,獨立傳感器測量或多傳感器獨立分布、組網(wǎng)測量的方式仍在被廣泛使用,而且對這類獨立使用的傳感器測量數(shù)據(jù)的不確定性剔除和融合處理方面的研究仍較少[6-8]。最常用的算術(shù)平均法,計算量少、速度快,但是對所有樣本采用同樣權(quán)值進行運算,融合結(jié)果易受到各種不確定性因素的影響。文獻[6]設(shè)計了一種基于統(tǒng)計加權(quán)的融合算法,依據(jù)測量結(jié)果偏離融合結(jié)果的程度賦予不同權(quán)值,能在一定程度上削弱主觀因素對融合值的影響,但存在迭代計算量大、收斂速度慢的缺陷。文獻[7]介紹了一種基于最大熵的測量結(jié)果估計方法,單選用樣本概率作為數(shù)據(jù)融合權(quán)系數(shù),難以削弱融合結(jié)果對不確定性因素的敏感程度。文獻[8]提出一種改進的分批估計融合算法,但算法的應(yīng)用必須以傳感器測量值樣本符合正態(tài)分布特性為前提,存在明顯局限性。因此,研究單傳感器測量系統(tǒng)數(shù)據(jù)融合方法來提高測量數(shù)據(jù)準(zhǔn)確性和可靠性,仍具有十分重要的意義。
本研究在自主研制的HJY1-1型光學(xué)溶解氧傳感器的基礎(chǔ)上[9],從Shannon提出的信息熵概念[10-13]出發(fā),針對該型溶解氧傳感器標(biāo)定數(shù)據(jù)融合問題,提出一種基于信息熵的單傳感器數(shù)據(jù)融合處理方法,力圖解決上述算法在單傳感器測控系統(tǒng)適用性與測量數(shù)據(jù)分布局限性方面的不足。在此基礎(chǔ)上,結(jié)合光學(xué)溶解氧傳感器標(biāo)定實驗測量數(shù)據(jù),對方法有效性作出評估。
本方法主要思想是:首先利用最大熵方法(maximum entropy method,MEM)估計獲得離散傳感器數(shù)據(jù)的概率分布[13],然后根據(jù)求得的標(biāo)定實驗測量的不確定度確定置信區(qū)間,依托該置信區(qū)間,進行粗差辨別和剔除[14-17]。最后,針對有效標(biāo)定數(shù)據(jù),計算樣本自信息量與信息比率,根據(jù)定義的融合權(quán)系數(shù)完成數(shù)據(jù)融合處理,得到最終的融合結(jié)果。該方法步驟如流程圖1所示。
最大熵方法是指在僅能獲知局部信息的條件下對開展系統(tǒng)狀態(tài)估計時, 所選擇的合理狀態(tài)應(yīng)為信息熵值最大且符合約束條件的那組, 是現(xiàn)有條件下能做出的唯一公正的選擇, 所有選擇的其他狀態(tài)都代表改變了原有假設(shè)或添加了其他約束,無法做到不偏不倚[14]。因此,對于單傳感器測量控制系統(tǒng)而言,如果條件只允許獲得傳感器測量值樣本數(shù)據(jù),而不能夠根據(jù)已有條件獲得該獨立傳感器輸出測量值的概率分布的,就能夠利用該最大熵方法,獲得該獨立傳感器測量輸出值最公平的概率分布情況。
對于光學(xué)溶解氧傳感器標(biāo)定實驗,假設(shè)每組濃度梯度處,水體溶解氧含量穩(wěn)定后,待標(biāo)定傳感器對溶解氧濃度參數(shù)進行k次獨立重復(fù)測量,獲得的樣本數(shù)據(jù)表示為m1,m2,…,mk。由于實際標(biāo)定實驗中,對每組溶解氧濃度梯度處的測量為有限次,因此,獲得的測量列是一列離散值。由Shannon信息熵定義,計算測量列最大離散熵來估計樣本數(shù)據(jù)的概率分布形式。
離散隨機變量M的最大離散熵為:
(1)
其中,P(mi)為每組溶解氧濃度梯度處的測量數(shù)據(jù)樣本的概率,其滿足約束條件為:
(2)
其中,〈fn(mi)〉為若干函數(shù)fn(mi)的期望值,N為期望函數(shù)的個數(shù)。
運用拉格朗日乘數(shù)法可計算該概率分布及對應(yīng)的最大熵,計算公式如式(3)、(4)所示。
(3)
(4)
其中,λ0和λn為引入的相應(yīng)拉格朗日乘數(shù),Hmax為所求的最大離散熵。
對于光學(xué)溶解氧傳感器標(biāo)定實驗這類獨立傳感器重復(fù)測量的情形,在獲取溶解氧傳感器測量示值作為樣本點的基礎(chǔ)上,依據(jù)離散標(biāo)定數(shù)據(jù)列的方差與數(shù)學(xué)期望,構(gòu)造該標(biāo)定實驗數(shù)據(jù)的期望函數(shù),進行后續(xù)運算處理。
當(dāng)單傳感器獨立使用時,整個測控系統(tǒng)采集的有效監(jiān)測數(shù)據(jù)不足或采樣頻率不高、次數(shù)較少的情況下,獲得的有效樣本空間的大小將不足以滿足統(tǒng)計規(guī)律,難以獲得測量值的概率分布。傳統(tǒng)的、建立在數(shù)理統(tǒng)計基礎(chǔ)上的粗差判別準(zhǔn)則將很難適用[16]。
在獲得最大離散熵概率分布的基礎(chǔ)上,估計出測量列的概率密度函數(shù)為P(mi),故離散測量列的不確定度為:
(5)
進一步地,以此置信區(qū)間為依據(jù),判定不在該區(qū)間范圍內(nèi)的數(shù)據(jù)為粗差,剔除這些粗差后獲得新的純凈數(shù)據(jù)序列,開展后續(xù)融合處理。
由Shannon信息熵定義可知,信息熵是信息量的度量,是衡量不確定性程度的指標(biāo)[11,13]。根據(jù)測量樣本數(shù)據(jù)的不確定性大小來分配不同的權(quán)系數(shù),進行數(shù)據(jù)融合,能夠有效削弱融合結(jié)果對不確定性因素的敏感程度[16-17]。因此,基于信息熵的數(shù)據(jù)融合理論,可以用來進行單傳感器測量數(shù)據(jù)的修正處理。
對于光學(xué)溶解氧傳感器標(biāo)定實驗這類單傳感器獨立重復(fù)觀測,需要借助自信息量I(mi)來表征不同濃度梯度下的每組傳感器測量樣本mi所攜帶的信息。同時,可以借助信息熵來表征樣本總體的測量不確定程度。在此基礎(chǔ)上,通過定義每個樣本自身的信息比率來表征其在樣本總體中的不確定性。顯然,在工程實際應(yīng)用中,對于每個單傳感器輸出測量值,距離真值越遠,則表示該測量值產(chǎn)生的概率越低,對應(yīng)的自信息量越豐富;相反地,測差值距離真值越近,該測量值產(chǎn)生的概率越高,對應(yīng)的自信息量越微弱。由此可知,傳感器測量數(shù)據(jù)自信息量與融合時相應(yīng)的權(quán)系數(shù)呈反比關(guān)系。
根據(jù)以上分析,設(shè)計的適用于光學(xué)溶解氧傳感器標(biāo)定數(shù)據(jù)處理的融合算法步驟如下:
1) 根據(jù)獲得的離散測量樣本,估計數(shù)據(jù)的最大熵分布;
2) 求出標(biāo)定實驗中,每種情況下傳感器測量輸出值的自信息量I(mi);
3) 計算信息比率ηi,即單個測量數(shù)據(jù)在總體測量數(shù)據(jù)中的不確定性程度,即:
(6)
其中,I(mi)=-logP(mi)。
4) 規(guī)定數(shù)據(jù)融合權(quán)系數(shù),進行歸一化處理,有:
(7)
5) 針對剔除粗差后的有效數(shù)據(jù),進行數(shù)據(jù)融合,即:
(8)
圖2 光學(xué)溶解氧傳感器新型標(biāo)定裝置與HJY1-1型光學(xué)溶解氧傳感器
采用如圖2所示的光學(xué)溶解氧傳感器新型標(biāo)定裝置,對HJY1-1型光學(xué)溶解氧傳感器進行標(biāo)定實驗。利用獲取的標(biāo)定實驗數(shù)據(jù),對本方法的有效性進行評估。
針對任意設(shè)定溫度下的每一處溶解氧濃度點,均可以獲得如表1所示的一組測量樣本數(shù)據(jù)。表1中數(shù)據(jù)表示用同一款光學(xué)溶解氧傳感器在同一溫度和同一溶解氧濃度條件下,連續(xù)進行多次采樣,獲得的8個溶解氧濃度測量樣本數(shù)據(jù)。此處設(shè)定的環(huán)境水溫為5 ℃,水體溶解氧含量保持恒定,采用國標(biāo)碘量法(GB 7489—87)測得的結(jié)果為8.37 mg·L-1。
表1 光學(xué)溶解氧傳感器在設(shè)定溫度及濃度情況下8個樣本數(shù)據(jù)
選取測量樣本數(shù)據(jù)的絕對誤差和均方誤差作為衡量數(shù)據(jù)融合效果的精度指標(biāo)。表1中,8組測量數(shù)據(jù)的期望和方差分別為:
離散測量數(shù)據(jù)樣本概率分布滿足的約束條件有:
運用MATLAB軟件,根據(jù)最大熵方法,按照拉格朗日乘數(shù)法計算得到拉格朗日系數(shù),分別為:-4.69、0.69、5.97,進而可得該組離散測量數(shù)據(jù)概率分布為:
P(mi)=exp[4.69-0.69mi-5.97(mi-9.39)2]。
最大離散熵為:
Hmax=1.819 9。
測量數(shù)據(jù)自信息量為:
I(mi)=-[4.69-0.69mi-5.97(mi-8.39)2]。
表1中8組測量數(shù)據(jù)對應(yīng)的概率和自信息量如表2所列。
表2 本情況下8組溶解氧傳感器測量輸出值的概率以及對應(yīng)自信息量
圖3 測量數(shù)據(jù)的自信息量和概率分布曲線
結(jié)合表2中數(shù)據(jù),可得該組溶解氧濃度條件下全部測量數(shù)據(jù)的自信息量以及最大熵分布曲線圖,詳見圖3。不難得出下面結(jié)論,若傳感器測量輸出結(jié)果距離溶解氧含量真值(即國標(biāo)碘量法測定溶解氧濃度)越遠,其自信息量越大、概率越??;距離溶解氧含量真值越近,自信息量越小、概率越大。
由測量數(shù)據(jù)的最大離散熵概率分布,可得測量的不確定度為:
故可以推定,該組測量數(shù)據(jù)的有效置信區(qū)間為:
依據(jù)該有效置信區(qū)間,進行粗大誤差判別。經(jīng)過判斷,該組測量數(shù)據(jù)8個樣本中,第3、5、7個樣本包括粗大誤差,必須被剔除出有效測量序列。在獲得自信息量的基礎(chǔ)上,根據(jù)算法公式(7)融合權(quán)系數(shù)的定義,計算剩余5個離散測量樣本融合權(quán)系數(shù),進行測量數(shù)據(jù)融合運算。需要特別說明的是,當(dāng)離散的傳感器測量數(shù)據(jù)列已經(jīng)完成粗差剔除工作后,不同的數(shù)據(jù)組合,不影響后續(xù)的融合權(quán)確定和最終融合結(jié)果的運算。綜上所述,該組測量樣本的數(shù)據(jù)融合結(jié)果為8.36 mg·L-1,具體運算數(shù)據(jù)如表3所列。
表3 本組實驗條件下5個純凈測量結(jié)果融合權(quán)系數(shù)情況
針對該組測量數(shù)據(jù),選取除本算法外的其他多種算法進行數(shù)據(jù)融合計算。統(tǒng)一將國標(biāo)碘量法的測點結(jié)果8.37 mg·L-1作為真值,選取絕對誤差和均方誤差作為判定融合效果的精度指標(biāo),與文獻[6-8]中各種方法及傳統(tǒng)算術(shù)平均法融合結(jié)果對比如表4所列。
表4 5種算法數(shù)據(jù)融合結(jié)果對比
從表4可看出,以水體溶解氧濃度測量的國標(biāo)碘量法測量結(jié)果(8.37 mg·L-1)為標(biāo)準(zhǔn),基于信息熵的數(shù)據(jù)融合算法擁有最小的絕對誤差,并且均方誤差也顯著降低。因此,基于信息熵理論針對光學(xué)溶解氧傳感器標(biāo)定數(shù)據(jù)融合提出的算法,能夠明顯提高傳感器整體的工作可靠性和測量數(shù)據(jù)穩(wěn)定性,有效提升標(biāo)定實驗的效果。
針對光學(xué)溶解氧傳感器標(biāo)定過程的各濃度梯度處標(biāo)定測量樣本有效融合的問題,提出一種基于標(biāo)定實驗離散測量數(shù)據(jù)信息熵的數(shù)據(jù)融合算法,解決了國產(chǎn)光學(xué)溶解氧傳感器標(biāo)定過程中的單傳感器測量數(shù)據(jù)處理的難題。該算法從獨立傳感器測量數(shù)據(jù)最大離散熵入手,獲得樣本數(shù)據(jù)的概率分布,進而計算離散測量數(shù)據(jù)的不確定度,并據(jù)此進行粗差剔除。在此基礎(chǔ)上,對置信區(qū)間內(nèi)的有效測量數(shù)據(jù),通過自信息量與權(quán)系數(shù)的計算,進行合理數(shù)據(jù)融合。結(jié)合HJY1-1光學(xué)溶解氧傳感器標(biāo)定應(yīng)用實例,驗證了該算法能夠有效避免單傳感器測量使用情況下的各種不確定、非線性因素對測量結(jié)果的影響。對比其他4種算法,本文算法在多種精度指標(biāo)上均表現(xiàn)出明顯優(yōu)勢,能夠有效提升測量數(shù)據(jù)的準(zhǔn)確性和可靠性。與此同時,針對光學(xué)溶解氧傳感器標(biāo)定實驗進行的相關(guān)研究,對于其他各類海洋傳感器的實驗室標(biāo)定校準(zhǔn)工作,均能提供一定的參考和借鑒。不足之處在于,本次實驗覆蓋的溫度區(qū)間有限,獲得的有效算例不夠豐富,在后續(xù)研究工作中,將進一步完善充實。