史方敏,郝永志,2
(1.浙江國際海運職業(yè)技術(shù)學院航海工程學院,浙江舟山 316021;2.上海海事大學商船學院,上海 201306)
全球貨物貿(mào)易絕大部分都需要通過船舶運輸來完成,經(jīng)濟一體化的發(fā)展趨勢帶來了航運業(yè)的變化,使航運業(yè)出現(xiàn)了貿(mào)易貨物標準化管理、裝卸、運輸?shù)内厔?,推進了船舶技術(shù)的不斷變革[1]。但在船舶技術(shù)變革的過程中,存在船舶航行效率較低、無法克服復雜的海上環(huán)境等多種問題[2]。針對這種情況,人們將注意力集中在怎樣減少人力、物力損失以及實現(xiàn)智能化船舶控制等問題上,而對于航線規(guī)劃等問題則缺乏關(guān)注。事實上,航線規(guī)劃問題與船舶操縱智能化水平息息相關(guān),對于實現(xiàn)船舶快速、經(jīng)濟、安全航行可以說是至關(guān)重要。為了實現(xiàn)船舶的智能航線規(guī)劃,需要對船舶航行水域航線調(diào)度信息進行采集。國內(nèi)外都十分重視對船舶航行水域航線調(diào)度信息的采集問題。在國外研究中,致力于將數(shù)據(jù)挖掘、機器學習、人工智能等技術(shù)與理論應(yīng)用到航運數(shù)據(jù)智能應(yīng)用與分析上,以進行船舶航行水域航線調(diào)度信息采集,金輝等[3]提出1 種基于高斯混合模型的船舶航行水域航線調(diào)度信息采集方法,主要通過高斯混合模型構(gòu)建船舶航行水域航線調(diào)度信息采集模型進行船舶航行水域航線調(diào)度信息的采集。在國內(nèi),對于船舶航行水域航線調(diào)度信息采集的研究則相對起步較晚,最早開始通過借鑒國外的研究成果進行相關(guān)研究,接著主要集中于對船舶航行水域航線調(diào)度信息的捕捉與預測等方向進行研究,冉明華[4]提出一種基于DSP(digital signal processing)技術(shù)的船舶航行水域航線調(diào)度信息采集方法,主要通過DSP 技術(shù)實現(xiàn)船舶航行水域航線調(diào)度信息的采集。但是,在利用以上方法進行船舶航行水域航線調(diào)度信息的采集時,受軌跡數(shù)據(jù)中存在缺失值與異常數(shù)據(jù)的影響而無法進行數(shù)據(jù)壓縮,導致船舶在航行過程中的航線轉(zhuǎn)向點存在識別率較低的問題。因此,本文提出一種基于ECDIS 平臺的船舶航行水域航線調(diào)度信息采集方法?;贖adoop 大數(shù)據(jù)處理框架提取船舶軌跡數(shù)據(jù),對軌跡數(shù)據(jù)進行預處理,并利用D-P 壓縮方法對軌跡數(shù)據(jù)進行壓縮,利用ECDIS 系統(tǒng)平臺進行船舶航行水域航線的軌跡調(diào)度信息采集。
首先獲取AIS(automatic identification system)報文里的UTC 時間、船寬、船長、對水速度、對地速度、航向、船舶位置、MMSI(maritime mobile service identify)碼等船舶軌跡數(shù)據(jù)[5]。利用AIS 系統(tǒng)(船舶自動識別系統(tǒng))對船舶進行解碼識別,并將其導入SHIPDB 數(shù)據(jù)庫中。并對需要的船舶軌跡數(shù)據(jù)基于Hadoop 大數(shù)據(jù)處理框架進行提取[6]。根據(jù)船舶實際航行狀態(tài)提取船舶軌跡數(shù)據(jù),將原始的船舶軌跡數(shù)據(jù)序列設(shè)為T={p1,p2,p3,……pn},則具體提取步驟如下:第一步:對原始的船舶軌跡數(shù)據(jù)序列集合進行初始化處理;第二步:對原始的船舶軌跡數(shù)據(jù)序列進行遍歷,一直到找到pj這一數(shù)據(jù)點,該數(shù)據(jù)點的對應(yīng)航行狀態(tài)是錨泊;第三步:從pj這一數(shù)據(jù)點開始向下進行遍歷,一直到找到pk這一數(shù)據(jù)點,該數(shù)據(jù)點的對應(yīng)航行狀態(tài)是在航[7]。第四步:重新構(gòu)建1 個軌跡序列s={pj,pj+1,pj+2,……pk-1},將重新構(gòu)建的軌跡序列添加到原始的船舶軌跡數(shù)據(jù)序列集合中,將k 作為新的起點對第二步進行重復,一直到完成所有數(shù)據(jù)點的偏離[7]。
提取到所需的船舶軌跡數(shù)據(jù)信息如表1 所示。
表1 提取到所需的船舶軌跡數(shù)據(jù)信息Tab.1 The required ship track data information is extracted
首先運用均值插補法對提取的船舶軌跡數(shù)據(jù)實施缺失值處理。將提取的船舶軌跡數(shù)據(jù)整體視為線性軌跡[8],利用缺失數(shù)據(jù)的2 個相鄰的已知數(shù)據(jù)D-P 壓縮缺失數(shù)據(jù)[9]。將缺失數(shù)據(jù)設(shè)為(ti,pti),其中pti代表缺失值;ti代表缺失數(shù)據(jù)所對應(yīng)的時間。缺失數(shù)據(jù)的2 個相鄰的已知數(shù)據(jù)分別為(tk,ptk)與(tm,ptm),利用這2 個數(shù)據(jù)點對pti進行擬合,以對缺失值進行填補。插補公式見式(1)。
接著對提取的船舶軌跡數(shù)據(jù)中的異常數(shù)據(jù)進行處理,包括軌跡點漂移情況、軌跡稀疏情況以及航線過短情況[10]。對于軌跡稀疏情況與航線過短情況需要直接放棄[11]。
對于軌跡點漂移情況,需要對其進行D-P 壓縮處理,以軌跡變化情況為依據(jù)對軌跡點漂移情況進行識別[12]。將當前軌跡點設(shè)為Ti,當Ti與其前后的軌跡點距離較大時,則認為其為軌跡漂移點,通過Ti前后的軌跡點對直線進行擬合。軌跡點漂移情況及擬合后的軌跡點情況示意圖如圖1 所示。
圖1 軌跡點漂移情況及擬合后的軌跡點情況示意圖Fig.1 The drift of track points and the sketch diagram of track points after fitting
接著利用D-P 壓縮方法對船舶軌跡數(shù)據(jù)實施壓縮處理,具體處理流程如下:
(1)對軌跡序列中各軌跡點進行逐個掃描,獲取相鄰子段間的平均速率和角度變化值[13]。
(2)對航向變化率或航向變化進行判斷,當其超越閾值時直接存入軌跡特征點航向數(shù)據(jù)庫內(nèi)[14]。
(3)當航速和航向都比閾值小,對下一個軌跡點進行掃描,對其是否為最后一個船舶軌跡點進行判斷[15],當確定其是最后一個船舶軌跡點,將其直接存入軌跡特征點航向數(shù)據(jù)庫內(nèi),結(jié)束壓縮流程;否則繼續(xù)對下一個軌跡點進行掃描。
在上述所得船舶軌跡數(shù)據(jù)的基礎(chǔ)上,利用ECDIS 系統(tǒng)平臺進行船舶航行水域航線的軌跡調(diào)度信息采集,從而利用采集的軌跡調(diào)度信息自動生成水域航線[16]。首先利用ECDIS 基礎(chǔ)顯示平臺構(gòu)建ENC(environmental noise cancellation) 數(shù)據(jù)模型,ENC 是指由海道測量機構(gòu)或其他相關(guān)政府機構(gòu)制定的矢量電子海圖,如圖2 所示。
圖2 ENC 數(shù)據(jù)模型Fig.2 ENC data model
通過ENC 數(shù)據(jù)模型[17]對壓縮后的船舶軌跡數(shù)據(jù)進行記錄分析,采集壓縮后的船舶軌跡數(shù)據(jù)中的5 種船舶航行水域航線調(diào)度記錄[18],在其中提取船舶航行水域航線軌跡調(diào)度信息,具體如表2 所示。
表2 提取的船舶航行水域航線軌跡調(diào)度信息Tab.2 The route track scheduling information extracted from the navigation area of the ship
為證明設(shè)計的基于ECDIS 平臺的船舶航行水域航線調(diào)度信息采集方法的性能,對其進行實驗驗證。實驗中船舶航行水域為某海峽水域,收集該海峽水域的50 248 條船舶軌跡數(shù)據(jù)作為實驗數(shù)據(jù)。船舶速度、航跡向和船舶轉(zhuǎn)向點是航線規(guī)劃信息采集中的重要因素,統(tǒng)計不同船舶速度和航向數(shù)據(jù)并進行壓縮篩選,匹配ENC 數(shù)據(jù)模型,從而獲取水域航線軌跡調(diào)度信息。該海峽水域的最大速度、平均速度及交通流速度等相關(guān)速度數(shù)據(jù)如圖3~5 所示。最大速度是指船舶在該海峽水域的最大行駛速度;平均速度是指船舶在該海峽水域的平均行駛速度;交通流速度是指船舶在該海峽水域上連續(xù)行駛形成的船舶流量速度。
圖3 該海峽水域的最大速度分布Fig.3 Maximum velocity distribution in the channel
圖4 該海峽水域的平均速度分布Fig.4 Mean velocity distribution in the channel
圖5 該海峽水域的交通流速度分布Fig.5 Velocity distribution of traffic flow in the channel
該海峽水域內(nèi)的實際速度分布具體如圖6 所示。實際速度是指船舶在該海峽水域受到水流壓力等因素的影響而實際航行的速度。獲取該海峽水域的實際航向分布特征,具體如表3 所示。
表3 該海峽水域的實際航向分布特征Tab.3 The actual course distribution characteristics of the channel waters
圖6 該海峽水域內(nèi)的實際速度分布Fig.6 The actual velocity distribution in the waters of the channel
對該海峽水域的航跡向?qū)嵤┙y(tǒng)計分析,具體結(jié)果如圖7 所示。
圖7 航跡向統(tǒng)計分析結(jié)果Fig.7 Statistical analysis results of track direction
利用設(shè)計的基于ECDIS 平臺的船舶航行水域航線調(diào)度信息采集方法針對該海峽水域進行船舶航行水域航線軌跡調(diào)度信息采集實驗。為避免本次實驗結(jié)果過于單一,將原有的2 種方法作為實驗中的對比方法,分別為基于DSP 技術(shù)、基于高斯混合模型的船舶航行水域航線調(diào)度信息采集方法。DSP 技術(shù)是基于數(shù)字信號處理的船舶信息采集系統(tǒng),這種方法進行航線調(diào)度信息的采集時,受軌跡數(shù)據(jù)中存在缺失值與異常數(shù)據(jù)的影響,航線轉(zhuǎn)向點存在識別率較低。高斯混合模型是一個常用的描述混合密度分布的模型,通過刻畫參數(shù)空間中數(shù)據(jù)的分布及其特性,用高斯概率密度函數(shù)量化事物,它是一個將事物分解為K 個基于高斯概率密度函數(shù)的線性組合而形成的模型。
運用這3 種方法進行實驗,船舶在航行中轉(zhuǎn)舵改變航向時的地點叫轉(zhuǎn)向點,轉(zhuǎn)向點識別率越高,船舶水域航線調(diào)度能力越高,對航線調(diào)度信息采集具有重要意義,選用該海峽水域內(nèi)具有20~30 個船舶航線的轉(zhuǎn)向點識別率數(shù)據(jù)作為對比實驗數(shù)據(jù)。
當船舶轉(zhuǎn)向點為20~25 個時,基于ECDIS 平臺的船舶航行水域航線調(diào)度信息采集方法與基于DSP 技術(shù)、基于高斯混合模型的船舶航行水域航線調(diào)度信息采集方法的航線轉(zhuǎn)向點識別率對比實驗數(shù)據(jù)具體如表4 所示。
表4 航線轉(zhuǎn)向點識別率對比實驗數(shù)據(jù)Tab.4 Comparison experimental data of recognition rate of course turning point
根據(jù)表4 的航線轉(zhuǎn)向點識別率對比實驗數(shù)據(jù)可知,基于ECDIS 平臺的船舶航行水域航線調(diào)度信息采集方法的航線轉(zhuǎn)向點識別率普遍高于92%,相比基于DSP 技術(shù)、基于高斯混合模型的船舶航行水域航線調(diào)度信息采集方法,基于ECDIS 平臺的船舶航行水域航線調(diào)度信息采集方法的航線轉(zhuǎn)向點識別率較高。
當船舶轉(zhuǎn)向點為26~30 個時,基于ECDIS 平臺的船舶航行水域航線調(diào)度信息采集方法與基于DSP 技術(shù)、基于高斯混合模型的船舶航行水域航線調(diào)度信息采集方法的航線轉(zhuǎn)向點識別率對比實驗數(shù)據(jù)具體如表5 所示。
表5 航線轉(zhuǎn)向點識別率對比實驗數(shù)據(jù)Tab.5 Comparison experimental data of recognition rate of course turning point
由表5 的航線轉(zhuǎn)向點識別率對比實驗數(shù)據(jù)可知,基于ECDIS 平臺的船舶航行水域航線調(diào)度信息采集方法的航線轉(zhuǎn)向點識別率高于基于DSP 技術(shù)、基于高斯混合模型的船舶航行水域航線調(diào)度信息采集方法。這是因為本文方法利用ECDIS 系統(tǒng)平臺采集船舶航行水域航線軌跡調(diào)度信息,提高航向轉(zhuǎn)向點識別率。
本研究提出1 種基于ECDIS 平臺的船舶航行水域航線調(diào)度信息采集的新方法。運用AIS 系統(tǒng)獲取船舶實際航行軌跡數(shù)據(jù)信息,提取所需要的船舶軌跡數(shù)據(jù)進行分析,并對該數(shù)據(jù)進行預處理和壓縮處理,利用ECDIS 系統(tǒng)平臺采集船舶航行水域航線軌跡調(diào)度信息,從而實現(xiàn)了航線軌跡調(diào)度信息采集。最后進行實驗研究,得到結(jié)果顯示基于ECDIS 平臺的船舶航行水域航線調(diào)度信息采集方法實現(xiàn)了航線轉(zhuǎn)向點識別率的提升,對于船舶水域航線調(diào)度信息采集有很大意義。