曹金鳳,郭繼鴻,李建偉,蘇天赟
(1.青島理工大學(xué) a.機械與汽車工程學(xué)院;b.土木工程學(xué)院,山東 青島 266520;2.中海油能源發(fā)展股份有限公司安全環(huán)保分公司,天津 300450;3.自然資源部第一海洋研究所,山東 青島 266061)
海洋溢油事故是導(dǎo)致海洋環(huán)境污染的重要因素之一,也會對海洋生態(tài)系統(tǒng)造成嚴(yán)重且不可逆的影響。溢油從井口噴射進(jìn)入海水后將以射流的形式運動,油滴粒徑的分布特征決定了油滴的總體運動狀態(tài),從而影響溢油是否會上浮到海水表面或是在水體中分散[1]。海底條件復(fù)雜多樣,亟須考察多種工況下(諸如不同溫度、噴射口直徑等)油滴粒徑分布。
許多學(xué)者通過室內(nèi)水槽實驗,實現(xiàn)對油滴流速、溫度、噴射口直徑等多種狀態(tài)的準(zhǔn)確控制,從而模擬多工況下的油滴運動[2-6]。在水槽實驗中,需要人工標(biāo)定和篩選實驗圖片中的油滴區(qū)域,較為繁瑣和不便,適用于試驗規(guī)模較小且試驗條件有限的情況,對大量試驗圖片進(jìn)行快速準(zhǔn)確的識別和篩選,難度較大且效率較低。
機器學(xué)習(xí)由于能夠從大量數(shù)據(jù)中學(xué)習(xí),從而獲得數(shù)據(jù)的關(guān)鍵特征,因此,被廣泛應(yīng)用于圖像識別領(lǐng)域。有學(xué)者開展了相關(guān)研究[7-11]。
為了實現(xiàn)對大量油滴圖片快速準(zhǔn)確識別,本文提出了一種基于支持向量機(SVM)的油滴識別和粒徑分布特征提取算法。為了驗證該算法處理實際圖片的可行性,選用圖片均來自通過工業(yè)相機拍攝的室內(nèi)水槽溢油噴射實驗圖片,并將識別結(jié)果與經(jīng)典粒徑分布模型Rosin-Rammler模型對比。實驗結(jié)果表明,該算法能夠快速識別油滴圖片,并統(tǒng)計油滴的粒徑分布,為海底溢油應(yīng)急搶險提供了理論基礎(chǔ)。
研究選取的水下溢油模擬實驗水槽裝置見圖1、2,由水槽槽體、注油系統(tǒng)和控制柜構(gòu)成;注油系統(tǒng)管路見圖3。水槽高2 m、底面尺度1 m×1 m,工作水深1.8 m。整個實驗過程采用工業(yè)計算機控制,輸油齒輪泵由變頻器控制,可人工調(diào)節(jié)管路中油樣的流量。
圖1 實驗室水下溢油模擬實驗水槽
圖2 實驗水槽
研究過程中使用的原油油樣和天然海水的物理性質(zhì)分別見表1、2。
表1 原油油樣物理性質(zhì)
注:ρ-密度,kg/m3;μ-運動黏度,mm2/s;t-溫度,℃。
表2 天然海水的性質(zhì)
用2臺工業(yè)相機分別拍攝含較大油滴和較小油滴的溢油圖片。測定較大油滴粒徑的相機幀速率50幀/s,分辨率為200萬像素(2 048像素×1 088像素),感光芯片名稱CMV2000,鏡頭分辨率200 μm。該相機掛于水槽外,相機鏡頭中心離噴嘴豎直距離為1.5 m。實驗前,應(yīng)用有機玻璃直尺(最小刻度1 mm)對測試區(qū)進(jìn)行了尺度標(biāo)定。測定較小油滴粒徑的相機幀速率17幀/s,分辨率500萬像素(2 456像素×2 058像素),感光芯片名稱ICX625,鏡頭分辨率5.8 μm。該相機掛于水槽內(nèi),相機鏡頭中心離噴嘴豎直距離為1.5 m。實驗前,應(yīng)用顯微鏡C4測微尺(最小刻度50 μm)對測試區(qū)進(jìn)行了尺度標(biāo)定。
對實驗圖片處理包括濾波和分割2個部分,處理流程見圖4。
圖4 對油滴圖片進(jìn)行處理和分割的工作流程
獲取的原始圖片背景中含有大量噪聲,背景噪聲的存在將直接影響最終的分割效果,因此,需要對圖片進(jìn)行濾波處理,減少噪聲對于分割圖片的干擾。
濾波圖像的灰度均值和標(biāo)準(zhǔn)差越接近原始圖像,圖像平滑指數(shù)越大,則濾波圖片對于原始圖片保留的信息越多,去噪聲效果越好[12]。表3給出了對于同一幅灰度圖片,選取35×35窗口,分別采用均值濾波、高斯濾波和中值濾波時,濾波圖片各指標(biāo)對比原始圖片的結(jié)果。
表3 濾波圖片各指標(biāo)對比原始圖片結(jié)果
除此之外,濾波器窗口的大小也會影響到濾波圖片效果。濾波窗口越大,圖片原始信息丟失越多,噪聲抑制效果越好。圖5分別給出了同一幅圖片分別選取5×5,7×7,35×35濾波窗口時的高斯濾波效果。
圖5 不同濾波窗口效果比較
比較表3和圖5可見,高斯濾波在充分抑制背景噪聲的同時,對于原始圖片的信息保留最多。因此,選用窗口尺寸為35×35的高斯濾波器對原始圖片進(jìn)行濾波處理。
圖像閾值分割方法主要包括:固定閾值分割、自適應(yīng)均值閾值分割和最大類間方差法(Otsu)。圖6b),c),d)分別給出了固定閾值、Otsu算法以及自適應(yīng)均值閾值分割的分割效果。
圖6 不同閾值算法的分割效果比較
比較圖6b)、c)、d)3種閾值算法,可以看出,自適應(yīng)均值閾值算法和Ostu算法都可以很好地將油滴區(qū)域和背景區(qū)分開來,但前者還可以將油滴區(qū)域的邊界顯示出來,并排除掉重疊的油滴區(qū)域,因此,本文選取均值自適應(yīng)均值閾值分割法對油滴區(qū)域進(jìn)行圖像分割。
在諸多機器學(xué)習(xí)算法中,SVM算法由于對數(shù)據(jù)樣本的需求量少,且可以處理復(fù)雜的非線性方程,被廣泛應(yīng)用于圖像識別和故障診斷。
支持向量機理論來自于數(shù)據(jù)分類問題的處理,試圖尋找一個滿足分類要求的最優(yōu)分類超平面,使得該超平面在保證分類精度的同時,能夠使超平面兩側(cè)的空白區(qū)域最大化。理論上,支持向量機能夠?qū)崿F(xiàn)對線性可分?jǐn)?shù)據(jù)的最優(yōu)分類。隨后,文獻(xiàn)[13]通過引入核映射方法將非線性問題轉(zhuǎn)化為高維空間的線性可分問題來解決。
圖7給出了支持向量機的分類原理:空心點和實心點分別表示特征空間中2種不同類別的數(shù)據(jù);H為能夠?qū)深悢?shù)據(jù)正確區(qū)分的線;H1和H2為能夠?qū)?種數(shù)據(jù)分開且平行于分類線的最外側(cè)直線,二者之間的距離即為2類數(shù)據(jù)的分類間隔(margin)。支持向量機的訓(xùn)練目標(biāo)就是使分類間隔達(dá)到最大,此時H1和H2上的點即為支持向量,H1和H2之間的距離即為兩類數(shù)據(jù)的最大分類間隔,H則為最優(yōu)分類線。將其推廣到高維特征空間中,最優(yōu)分類線則成為最優(yōu)分類超平面。
圖7 最優(yōu)分類面
上述討論僅適用于數(shù)據(jù)線性可分的情況,在許多問題中,樣本集通常是線性不可分的,此時可以通過適當(dāng)引入核函數(shù)K(x(i),x(j))來實現(xiàn)非線性變換后的線性分類,并不再增加計算的復(fù)雜度,核函數(shù)的可選種類較多,本文在研究過程中選用學(xué)習(xí)能力較強,適用范圍廣的Gauss函數(shù)。
為了避免數(shù)據(jù)中某一特征值的權(quán)重過大,在進(jìn)行訓(xùn)練之前還應(yīng)該對數(shù)據(jù)的特征值進(jìn)行歸一化處理:對于數(shù)據(jù)點的每一個特征值,依次經(jīng)過式(1)所示的變換,使其特征值落在[0,1]之間。
在油滴識別問題中,每張樣本圖片都可以被標(biāo)記為背景或油滴,因此,該問題是一個二元分類問題,僅需訓(xùn)練一個分類模型就可滿足要求。使用支持向量機進(jìn)行油滴識別,學(xué)習(xí)算法的實施過程如下。
1)對于每一張樣本圖片,提取圖片中每個像元的灰度值作為其特征值,建立樣本的特征向量xi。
2)對每個樣本的特征值進(jìn)行歸一化處理。
3)標(biāo)記每個樣本圖片的所屬類別,建立標(biāo)簽向量yi。
4)輸人特征向量和對應(yīng)的標(biāo)簽向量對SVM進(jìn)行訓(xùn)練建模。
從拍攝得到的原始圖片中選取70張畫面純凈的圖片,經(jīng)圖像分割后得到343張油滴圖片和514張背景圖片,從857張圖片中隨機抽取770張建立樣本數(shù)據(jù)集,實驗樣本的組成見表4。
表4 實驗樣本組成
本文SVM算法各項訓(xùn)練參數(shù)設(shè)置如下:選取核函數(shù)為徑向基函數(shù);設(shè)置訓(xùn)練最優(yōu)參數(shù)值為0.041 4;正則化參數(shù)值為8。訓(xùn)練過程中,共獲取支持向量24個。訓(xùn)練模型識別測試樣本情況見表5,測試樣本識別正確率為100%,因為:①選用圖像灰度值作為特征值時,油滴與背景的明暗對比度大,油滴與背景灰度值的差值較大,且油滴形狀簡單,易于區(qū)分;②SVM算法引入了正則化參數(shù),保證預(yù)測誤差盡可能小、回歸函數(shù)盡可能平滑,從而提高識別模型的泛化能力。
表5 識別結(jié)果
使用該模型對其余204張完整實驗圖片進(jìn)行識別檢測,累計識別192處油滴,識別正確率超過95%,預(yù)測結(jié)果可靠。
使用Ostu算法對相同的204張圖片進(jìn)行識別,表6給出了Ostu算法與SVM算法的用時比較。圖8給出了2種算法在識別過程中的累計用時。
表6 傳統(tǒng)分割算法與SVM時間復(fù)雜度比較
圖8 累計用時對比
由表6和圖8可見,SVM算法識別204張圖片的平均用時為0.03 s,比Ostu算法的0.13 s快了76.9%;SVM算法識別204張圖片的總共用時為6.67 s,比Ostu算法的26.14 s快了74.5%;SVM算法的識別效率明顯優(yōu)于Ostu算法,在識別海量圖片時,本文提出的基于SVM算法建立的識別模型,效率更高。
實驗的圓形噴嘴孔徑為2 mm,實驗過程中通過調(diào)節(jié)齒輪油泵變頻器的頻率以控制油樣流量。油樣流量由注油系統(tǒng)中的精密流量計實時記錄,根據(jù)噴嘴口徑換算出油樣初始流速為4.2 m/s。
對識別的油滴粒徑進(jìn)行統(tǒng)計,得到其粒徑分布在[113.62 μm,7 692.08 μm]范圍內(nèi),繪制油滴粒徑出現(xiàn)概率的分布圖(見圖9)。粒徑概率分布屬于左偏態(tài)分布,粒徑低于300 μm的油滴占總油滴的73.08%;粒徑低于500 μm的油滴占總油滴的86.81%;粒徑大于2 000 μm的油滴占總油滴的2.20%,該范圍的油滴占比較少,可以忽略。
圖9 油滴粒徑出現(xiàn)概率的分布
為了進(jìn)一步描述識別油滴的粒徑分布情況,引入Rosin-Rammler粒徑分布式(2)。
式中:R(d)為篩下累積率,%;d為識別油滴粒徑,μm;de為臨界粒徑,μm,當(dāng)R(d)=63.2%時所對應(yīng)的粒徑;m為均勻性指數(shù),表示油滴粒徑分布范圍的寬窄程度,m值越大,油滴粒徑的分布范圍越窄。
對式(2)取對數(shù)得到式(3)。
ln{-ln[1-R(d)]}=mlnd-mlnde
(3)
由式(3)可以看出:當(dāng)lnd與ln{-ln[1-R(d)]}的回歸線為直線時,油滴的粒徑分布符合Rosin-Rammler,回歸線的斜率為該分布的均勻性指數(shù)m,回歸線在橫軸上的截距為臨界粒徑的自然對數(shù)lnde。
由式(2)和式(3),可以計算油滴的中值粒徑d50。
式中:d50為中值粒徑,μm;de為臨界粒徑,μm;m為均勻性指數(shù)。
將油滴粒徑d與篩下累積率R(d)代入式(2)和(3),得到均勻性指數(shù)m與臨界粒徑de值分別為1.252 0、251.36μm。
由式(4)得到中值粒徑d50=158.85μm。油滴粒徑d在自然對數(shù)坐標(biāo)系下的分布見圖10,其中的圓點表示識別油滴粒徑的自然對數(shù)分布,當(dāng)lnd>7.7時,在此粒徑范圍中的油滴在整體中占2%,可以忽略。由圖10可見:lnd與ln{-ln[1-R(d)]}大致呈線性回歸關(guān)系,協(xié)方差R2=0.842 7,表明識別油滴粒徑分布模型符合Rosin-Rammler分布。
圖10 識別的油滴粒徑分布與Rosin-Rammler模型的比較
1)將SVM算法應(yīng)用于油滴識別,用圖片灰度值作為特征值來識別油滴和背景,所訓(xùn)練模型在測試集樣本識別中正確率達(dá)到100%,在油滴圖片識別中正確率在95%以上,識別快速、結(jié)果可靠,可應(yīng)用于海底溢油快速識別、及時采取應(yīng)急措施。
2)處理204張油滴圖片,SVM算法的平均識別用時比Ostu算法快76.9%,累計識別用時比Ostu算法快74.5%。
3)識別出來的油滴粒徑在自然對數(shù)坐標(biāo)系下呈線性分布,線性回歸的協(xié)方差R2=0.842 7,與經(jīng)典的Rosin-Rammler粒徑分布吻合。
4)SVM算法對油滴進(jìn)行識別及粒徑分布預(yù)測可行,為海底溢油快速識別及應(yīng)急搶險提供了一種新的思路,具有較好的工程應(yīng)用價值。