王蔚 關(guān)放
摘 要耙吸挖泥船的自動(dòng)化程度與日俱增,需要分析處理的采集數(shù)據(jù)也較為繁多,如果數(shù)據(jù)在傳輸過(guò)程中出現(xiàn)丟失和延遲的問(wèn)題,會(huì)對(duì)后續(xù)的分析和預(yù)測(cè)建模產(chǎn)生較大的影響。本文針對(duì)這一問(wèn)題,討論各種可行的解決方法。
關(guān)鍵詞數(shù)據(jù)丟失;數(shù)據(jù)延遲;延遲校準(zhǔn)
0 引言
耙吸挖泥船在施工作業(yè)時(shí)會(huì)產(chǎn)生大量的數(shù)據(jù),在集中傳輸這些數(shù)據(jù)時(shí),會(huì)由于部分?jǐn)?shù)據(jù)丟失或者傳輸延遲,導(dǎo)致數(shù)據(jù)不可用的問(wèn)題,造成數(shù)據(jù)分析困難,預(yù)測(cè)建模不準(zhǔn)確。對(duì)于數(shù)據(jù)丟失問(wèn)題,本文將闡述利用“去除”和“補(bǔ)充”兩大方法的優(yōu)劣及應(yīng)用場(chǎng)景;而對(duì)于數(shù)據(jù)延遲,本文將著重分析如何對(duì)數(shù)據(jù)延遲進(jìn)行校準(zhǔn)并同步。
1 數(shù)據(jù)丟失的處理方法
1.1 去除法
去除法是最原始的方法,也是較為有效的方法之一。此方法是將丟失的數(shù)據(jù)整個(gè)去除,該方法操作簡(jiǎn)便,處理便捷,效果明顯。耙吸挖泥船在施工作業(yè)時(shí),采集并記錄的數(shù)據(jù)非常龐大,小到吃水傳感器的數(shù)據(jù),大到主機(jī)、推進(jìn)器的數(shù)據(jù),實(shí)際在某時(shí)刻丟失的數(shù)據(jù)占整個(gè)數(shù)據(jù)的量非常之小,采用去除法對(duì)數(shù)據(jù)庫(kù)的整體性影響較小,對(duì)后續(xù)數(shù)據(jù)分析和預(yù)測(cè)建模幾乎不會(huì)產(chǎn)生很大的干擾。但是,這種方法也存在其局限性,如果在耙吸挖泥船施工作業(yè)中,某一傳感器由于損壞或者傳輸線路不暢,導(dǎo)致丟失數(shù)據(jù)過(guò)多,在整個(gè)數(shù)據(jù)庫(kù)占比較大時(shí),采用去除法就會(huì)存在很大的缺陷,這會(huì)導(dǎo)致數(shù)據(jù)的整體性遭到破壞,分析的價(jià)值大大降低,并導(dǎo)致數(shù)據(jù)分析的結(jié)果不能反映真實(shí)的情況,數(shù)據(jù)對(duì)后續(xù)的預(yù)測(cè)建模沒(méi)有了參考價(jià)值。
1.2 補(bǔ)充法
補(bǔ)充法是利用給定的值去補(bǔ)充丟失的數(shù)據(jù),使得數(shù)據(jù)庫(kù)逐步完善,達(dá)到可以分析利用的程度。通常情況下,該方法通過(guò)統(tǒng)計(jì)學(xué)相關(guān)知識(shí),根據(jù)前后數(shù)據(jù)或者歷史數(shù)據(jù),為當(dāng)前的丟失的數(shù)據(jù)補(bǔ)充一個(gè)合理的數(shù)值。具體分為以下幾種方法:
1.2.1 手動(dòng)輸入法
耙吸挖泥船在施工作業(yè)時(shí),有經(jīng)驗(yàn)的操作人員,在分析多個(gè)疏浚作業(yè)過(guò)程的數(shù)據(jù)后,對(duì)丟失的個(gè)別數(shù)據(jù),可以通過(guò)經(jīng)驗(yàn)判斷出比較準(zhǔn)確的數(shù)值。這樣由人工輸入的數(shù)據(jù)一般比較合理,產(chǎn)生的數(shù)據(jù)曲線也比較平滑。然而,正常情況下,該方法會(huì)占用大量的處理時(shí)間,當(dāng)數(shù)據(jù)丟失較多,或者人工經(jīng)驗(yàn)相對(duì)欠缺時(shí),該方法就不是那么適用了。
1.2.2 均值估計(jì)法
耙吸挖泥船在施工作業(yè)時(shí)的傳輸數(shù)據(jù)大多數(shù)都屬于數(shù)值型的數(shù)據(jù),非數(shù)值型的數(shù)據(jù)均值估計(jì)法是不能適用的。均值估計(jì)法一般有兩種方法,一種是將采集到的所有數(shù)據(jù)進(jìn)行平均,這種方法比較簡(jiǎn)單直接,處理方便且速度快。第二種方法是條件平均,參與平均計(jì)算的數(shù)據(jù)不是從整個(gè)數(shù)據(jù)庫(kù)選取,而是按照相似數(shù)據(jù)進(jìn)行平均操作,這種方法在實(shí)際操作中也是簡(jiǎn)單而且行之有效的。這兩種方法本質(zhì)上是一樣的,都是通過(guò)對(duì)數(shù)值取平均值,從而推斷實(shí)際的數(shù)值,盡管兩者所采集的數(shù)據(jù)有所不同。
1.2.3 回歸分析法
采集過(guò)往耙吸挖泥船施工作業(yè)時(shí)的數(shù)據(jù),然后根據(jù)這些數(shù)據(jù),建立回歸模型,當(dāng)某個(gè)傳感器的數(shù)據(jù)缺失時(shí),將其他數(shù)據(jù)放入回歸模型,從而計(jì)算出該丟失數(shù)據(jù)的值。采用這種方法,預(yù)測(cè)數(shù)據(jù)的精確性很大程度上依賴所選取得回歸模型的準(zhǔn)確性,所預(yù)測(cè)的數(shù)據(jù)會(huì)產(chǎn)生不必要的誤差,而且這種誤差往往很難避免。
1.2.4 統(tǒng)計(jì)模型法
基于統(tǒng)計(jì)學(xué)知識(shí),可以將丟失的數(shù)據(jù)看作是具有隨機(jī)性的數(shù)據(jù),通過(guò)采集到的大量數(shù)據(jù),可以確定出數(shù)據(jù)參數(shù)分布的統(tǒng)計(jì)模型,并且假設(shè)模型的準(zhǔn)確性,通過(guò)該統(tǒng)計(jì)模型去確認(rèn)丟失數(shù)據(jù)的數(shù)值。采用該方法需要最大化所采集數(shù)據(jù)的量,只有在大樣本的條件下才能保證推斷出的數(shù)據(jù)準(zhǔn)確性。但這種方法很容易使得估計(jì)得數(shù)值能夠達(dá)到局部最優(yōu),但沒(méi)有達(dá)到全局最優(yōu),且收斂速度比較慢,計(jì)算會(huì)相對(duì)比較復(fù)雜。
2 數(shù)據(jù)延遲的校準(zhǔn)方法
由于耙吸挖泥船的密度計(jì)安裝在泥泵的出口位置,與耙頭處吸入泥漿的實(shí)時(shí)密度必然產(chǎn)生一定延遲,而控制耙頭處的實(shí)時(shí)泥漿密度對(duì)于提高施工作業(yè)效率更有參考意義。下文針對(duì)耙吸挖泥船吸入泥漿密度延遲的問(wèn)題,展開(kāi)討論,并作完整分析。
2.1 測(cè)量延遲
3 結(jié)語(yǔ)
本文介紹了耙吸挖泥船在傳輸數(shù)據(jù)時(shí)出現(xiàn)丟失時(shí)的解決方法,并給出了數(shù)據(jù)延遲的校準(zhǔn)推導(dǎo)。經(jīng)過(guò)上述方法處理后的數(shù)據(jù)可以較好地應(yīng)用于后續(xù)的數(shù)據(jù)分析及建立預(yù)測(cè)模型。如今越來(lái)越倡導(dǎo)耙吸船的智能化,而智能化離不開(kāi)大量的數(shù)據(jù)支撐,只有做好前期的數(shù)據(jù)積累,未來(lái)耙吸挖泥船的智能化步伐才能越走越快。
參考文獻(xiàn)
[1]張燕.國(guó)內(nèi)外大型耙吸挖泥船的關(guān)鍵技術(shù)發(fā)展研究分析[D].哈爾濱工程大學(xué),2010.
[2]王柳艷,田雨,俞孟蕻.耙吸挖泥船耙頭密度估計(jì)器研究與分析[J].中國(guó)港灣建設(shè),2014(11):69-72.
[3]錢廣亭.基于模型預(yù)測(cè)控制的耙吸挖泥船疏浚機(jī)理優(yōu)化的研究[D].江蘇科技大學(xué),2012.
[4]張朔.數(shù)據(jù)驅(qū)動(dòng)的耙吸式挖泥船疏浚作業(yè)模型及優(yōu)化[D].上海交通大學(xué),2011.