萬輝+張建雄+高嵩+蔡浩
摘 要:為了解決內(nèi)河船舶信息孤島、屏障問題,實(shí)現(xiàn)船舶海量數(shù)據(jù)的快速整合應(yīng)用,本文對(duì)內(nèi)河船舶數(shù)據(jù)互聯(lián)互通、共享交換的實(shí)際情況進(jìn)行了綜合分析,對(duì)內(nèi)河船舶大數(shù)據(jù)關(guān)鍵技術(shù)展開研究。厘清內(nèi)河各類船舶數(shù)據(jù)間的關(guān)系,確定船舶大數(shù)據(jù)建設(shè)內(nèi)容,探索船舶大數(shù)據(jù)處理技術(shù)方法、船舶大數(shù)據(jù)存儲(chǔ)、船舶大數(shù)據(jù)共享與服務(wù),為船舶大數(shù)據(jù)平臺(tái)建設(shè)打下理論技術(shù)基礎(chǔ)。
關(guān)鍵詞:船舶;大數(shù)據(jù);數(shù)據(jù)倉庫;數(shù)據(jù)挖掘;ETL;數(shù)據(jù)抓取
中圖分類號(hào):U662.3 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1006—7973(2017)11-0047-04
大數(shù)據(jù)是一種新處理模式下具備更強(qiáng)決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。大數(shù)據(jù)比較有代表性的定義是4V定義,即規(guī)模性(Volume)、多樣性(Variety)、高速性(Velocity)和價(jià)值性(Value)。大數(shù)據(jù)的特點(diǎn)決定了在大數(shù)據(jù)時(shí)代,傳統(tǒng)的數(shù)據(jù)處理技術(shù)必需有革命性的提升。
長江是我國的“黃金水道”,長江流域創(chuàng)造超過40%的國內(nèi)生產(chǎn)總值和約35%的外貿(mào)進(jìn)出口額,是沿江地區(qū)交通物流和經(jīng)濟(jì)社會(huì)可持續(xù)發(fā)展的重要命脈。船舶作為長江航運(yùn)體系的載體,它承載著長江航運(yùn)機(jī)構(gòu)的各類業(yè)務(wù)。各航運(yùn)機(jī)構(gòu)間種類繁多的船舶業(yè)務(wù)系統(tǒng)運(yùn)行時(shí)產(chǎn)生的數(shù)據(jù)龐大、增長快速、類型豐富,符合大數(shù)據(jù)的特征。伴隨著長江航運(yùn)信息化的加速發(fā)展,各類船舶業(yè)務(wù)數(shù)據(jù)會(huì)持續(xù)爆炸式的增長,由于各自機(jī)構(gòu)系統(tǒng)之間相互獨(dú)立運(yùn)行,難以實(shí)現(xiàn)信息共享交換,各機(jī)構(gòu)間各司其責(zé),行政管理上的缺失,造成了人為的行政壁壘,阻礙了信息數(shù)據(jù)的整合應(yīng)用,形成內(nèi)河數(shù)據(jù)孤島, 傳統(tǒng)的數(shù)據(jù)處理技術(shù)遇到瓶頸,不能滿足航運(yùn)機(jī)構(gòu)從海量數(shù)據(jù)中快速獲取船舶信息的需求,內(nèi)河船舶大數(shù)據(jù)技術(shù)的研究是長江航運(yùn)信息化、智能化發(fā)展的必然要求;也是充分整合利用現(xiàn)有內(nèi)河船舶數(shù)據(jù)資源,徹底解決內(nèi)河船舶數(shù)據(jù)孤島、屏障問題,實(shí)現(xiàn)內(nèi)河船舶數(shù)據(jù)的互聯(lián)互通、共享應(yīng)用的手段。鑒于此,本文開展內(nèi)河船舶大數(shù)據(jù)關(guān)鍵技術(shù)研究,厘清內(nèi)河各類船舶數(shù)據(jù)間的關(guān)系,探索船舶大數(shù)據(jù)整合技術(shù)、方法。
1 船舶大數(shù)據(jù)建設(shè)分析
1.1 內(nèi)河船舶數(shù)據(jù)現(xiàn)狀
目前,長江航運(yùn)機(jī)構(gòu)開發(fā)的各類業(yè)務(wù)應(yīng)用系統(tǒng)均建立了各自的后臺(tái)數(shù)據(jù)庫,基本涵蓋了所有航運(yùn)業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)庫存儲(chǔ)。但由于各業(yè)務(wù)應(yīng)用系統(tǒng)相對(duì)獨(dú)立,條塊分割的建設(shè)模式使得這些應(yīng)用系統(tǒng)的后臺(tái)數(shù)據(jù)庫成為了一個(gè)個(gè)信息孤島。系統(tǒng)間所需信息需要人工轉(zhuǎn)錄,或通過數(shù)據(jù)接口進(jìn)行異步共享。不同系統(tǒng)間數(shù)據(jù)結(jié)構(gòu)交叉嚴(yán)重,數(shù)據(jù)在不同系統(tǒng)間重復(fù)錄入,數(shù)據(jù)接口過多過雜,數(shù)據(jù)同步不及時(shí),導(dǎo)致數(shù)據(jù)的時(shí)效性、一致性、準(zhǔn)確性差。
1.2 船舶數(shù)據(jù)關(guān)系分析
長江航運(yùn)船舶業(yè)務(wù)主要包括:船舶AIS動(dòng)態(tài)監(jiān)管、船舶VTS交管、LRIT、船舶登記、船舶安檢、在港作業(yè)、船舶簽證、危險(xiǎn)品管理、綜合統(tǒng)計(jì)等業(yè)務(wù)處理,主要業(yè)務(wù)涉及的數(shù)據(jù)項(xiàng)如下:
船舶AIS動(dòng)態(tài)監(jiān)管:MMSI、船名、航艏向、航速、經(jīng)度、緯度、更新時(shí)間等。
船舶VTS交管:編號(hào)、船名、船舶位置、航速、更新時(shí)間等。
船舶登記:船舶編號(hào)、船舶登記號(hào)、中文船名、英文船名、船舶呼號(hào)、IMO編號(hào)、船舶曾用名、船籍港等。
安全檢查:船舶編號(hào)、檢查日期、檢查地點(diǎn)、是否有缺陷、滯留時(shí)間、滯留原因、船級(jí)社、安全檢查缺陷、安全檢查項(xiàng)目等。
在港作業(yè):船舶編號(hào)、作業(yè)代碼、單位名稱、單位地址、申請(qǐng)時(shí)間、聯(lián)系人、聯(lián)系電話等。
船舶簽證:船舶編號(hào)、進(jìn)出港代碼、預(yù)到日期、船舶類型、開往港口、旅客總數(shù)、本港卸貨數(shù)、本港裝貨數(shù)、載貨種類、聯(lián)系人、聯(lián)系電話等。
通過分析,船舶信息間的關(guān)系都是通過船舶動(dòng)態(tài)系統(tǒng)中船舶編號(hào)來唯一關(guān)聯(lián)。船員、船公司等船舶輔助信息,要建立與船舶基本信息的關(guān)聯(lián),同樣是通過船舶編號(hào)進(jìn)行關(guān)聯(lián)。
船舶AIS、VTS系統(tǒng)中并未包含船舶編號(hào)數(shù)據(jù),要想實(shí)現(xiàn)與船舶基本信息的關(guān)聯(lián),需要從船舶名稱入手,采用數(shù)據(jù)庫(Oracle/Sqlserver)中間件實(shí)現(xiàn)中英文船名自動(dòng)匹配關(guān)聯(lián)及人工預(yù)處理關(guān)聯(lián),最終得到完整的船舶綜合數(shù)據(jù)。
船舶AIS、VTS系統(tǒng)都包含了船舶位置信息,要實(shí)現(xiàn)數(shù)據(jù)關(guān)聯(lián)的同時(shí),還要解決數(shù)據(jù)融合問題,利用AIS、VTS的位置數(shù)據(jù),通過Kalman濾波器進(jìn)行信號(hào)的預(yù)處理,得到相對(duì)準(zhǔn)確的船舶定位信息。將定位信息進(jìn)行匯總?cè)诤希〝?shù)據(jù)的時(shí)空對(duì)準(zhǔn)、坐標(biāo)轉(zhuǎn)換,結(jié)合上面描述的關(guān)聯(lián)數(shù)據(jù),通過融合算法進(jìn)行船舶動(dòng)態(tài)數(shù)據(jù)的整體融合,得到準(zhǔn)確的船舶動(dòng)態(tài)融合數(shù)據(jù)。
1.3 船舶大數(shù)據(jù)建設(shè)內(nèi)容分析
船舶大數(shù)據(jù)建設(shè)要遵循組織合理、結(jié)構(gòu)清晰、冗余度低、便于操作、易于維護(hù)、安全可靠、擴(kuò)充性好的原則,并建立大數(shù)據(jù)實(shí)時(shí)更新機(jī)制,以及各區(qū)域和各部門單位船舶協(xié)同管理的數(shù)據(jù)共享機(jī)制。
船舶大數(shù)據(jù)的建設(shè)將以船舶基礎(chǔ)信息為核心,重構(gòu)并形成支撐船舶管理的基礎(chǔ)數(shù)據(jù)庫(船舶基礎(chǔ)庫、船員基礎(chǔ)庫、船公司基礎(chǔ)庫)、船舶動(dòng)態(tài)庫、數(shù)據(jù)應(yīng)用庫,數(shù)據(jù)庫的框架結(jié)構(gòu)應(yīng)以便于后期完善、擴(kuò)展和改造等為標(biāo)準(zhǔn)進(jìn)行搭建。
基礎(chǔ)數(shù)據(jù)庫:數(shù)據(jù)共享程度最高,是多個(gè)業(yè)務(wù)應(yīng)用系統(tǒng)的基礎(chǔ),具有基礎(chǔ)性、全局性特征。包括船舶基礎(chǔ)數(shù)據(jù)、船員基礎(chǔ)數(shù)據(jù)、船公司基礎(chǔ)數(shù)據(jù),以及相關(guān)證書基礎(chǔ)數(shù)據(jù)。
動(dòng)態(tài)數(shù)據(jù)庫:數(shù)據(jù)主要用于支撐時(shí)間敏感性業(yè)務(wù)應(yīng)用的開展,由動(dòng)態(tài)業(yè)務(wù)過程產(chǎn)生。包括船舶AIS、VTS、進(jìn)出口岸查驗(yàn)、船舶申報(bào)、船舶簽證、船舶安全檢查、事故處理、船舶違章、危險(xiǎn)品申報(bào)數(shù)據(jù)等。
數(shù)據(jù)應(yīng)用數(shù)據(jù)庫:此類數(shù)據(jù)主要為了滿足第三方開發(fā)系統(tǒng)業(yè)務(wù)應(yīng)用的需求,進(jìn)行深度挖掘、抽取、整合形成。
2 船舶大數(shù)據(jù)關(guān)鍵技術(shù)
建立船舶大數(shù)據(jù),是要在網(wǎng)絡(luò)互聯(lián)互通及各業(yè)務(wù)系統(tǒng)共同提供數(shù)據(jù)信息的前提下,讓各類離散業(yè)務(wù)數(shù)據(jù)資源能夠?qū)崿F(xiàn)多角度、全方位的共享應(yīng)用。endprint
通過船舶大數(shù)據(jù),可以把各類船舶相關(guān)數(shù)據(jù)進(jìn)行異構(gòu)重組,形成統(tǒng)一、虛擬、完整的業(yè)務(wù)信息整合平臺(tái),同時(shí)能夠提供一種資源協(xié)同、高性能計(jì)算、管理及應(yīng)用服務(wù)的能力。船舶大數(shù)據(jù)的數(shù)據(jù)處理包括采集與加工、存儲(chǔ)與處理、共享與服務(wù)三大層次。
2.1 數(shù)據(jù)的采集與加工技術(shù)
船舶大數(shù)據(jù)建設(shè)的核心既是對(duì)各類船舶數(shù)據(jù)的采集與加工,從圖1可以分析得到,信息采集層由四部分組成,一是由外部的信息采集來組成;二是來源于分布在各地、各單位的異源數(shù)據(jù)庫;三是來至網(wǎng)絡(luò)的信息抓取;最后是人工錄入數(shù)據(jù)。所有這些數(shù)據(jù)源的特點(diǎn)都是異構(gòu)、分布、具備相關(guān)性、大小規(guī)模不等。
2.1.1 數(shù)據(jù)采集技術(shù)
由于各種數(shù)據(jù)不是在統(tǒng)一的時(shí)間生成,數(shù)據(jù)在進(jìn)入數(shù)據(jù)倉庫之前需要經(jīng)過大量的運(yùn)算,為了不影響原有系統(tǒng)的正常運(yùn)行和保證導(dǎo)入數(shù)據(jù)倉庫數(shù)據(jù)的正確性與有效性,可設(shè)置中間(臨時(shí))數(shù)據(jù)庫。中間(臨時(shí))數(shù)據(jù)庫起所有數(shù)據(jù)從傳統(tǒng)數(shù)據(jù)庫導(dǎo)入到數(shù)據(jù)倉庫的過渡作用。
2.1.1.1 數(shù)據(jù)標(biāo)準(zhǔn)化歸一
不同來源所得到的相同字段數(shù)據(jù)定義可能不一樣,因此首先需要將數(shù)據(jù)字段的定義標(biāo)準(zhǔn)化,把它們的定義和取值區(qū)間統(tǒng)一起來,從而消除變量之間不同類型數(shù)值之間的懸殊差異。進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化需要定義各類數(shù)據(jù)標(biāo)準(zhǔn)化整合規(guī)則。包括:定義數(shù)據(jù)屬性、字典、數(shù)據(jù)解析規(guī)則、整合對(duì)照表、對(duì)應(yīng)的數(shù)據(jù)整合處理方式及數(shù)據(jù)檢測(cè)條件等六項(xiàng)內(nèi)容。
消除數(shù)據(jù)的主體差異。對(duì)各類船舶主題數(shù)據(jù)進(jìn)行人工梳理及分析,然后將分布的、異構(gòu)數(shù)據(jù)源中的數(shù)據(jù)抽取到臨時(shí)中間層后進(jìn)行清洗、轉(zhuǎn)換、集成,最后加載到數(shù)據(jù)倉庫。
2.1.1.2 異源數(shù)據(jù)庫及文件數(shù)據(jù)采集技術(shù)
對(duì)于只需一次性導(dǎo)入的數(shù)據(jù)可以遵循“數(shù)據(jù)元提取-數(shù)據(jù)清理-數(shù)據(jù)入庫”的基本步驟完成數(shù)據(jù)采集。而對(duì)于需要定期或?qū)崟r(shí)進(jìn)行數(shù)據(jù)同步與交換的數(shù)據(jù)源,應(yīng)通過數(shù)據(jù)交換平臺(tái)同步交換抽取源數(shù)據(jù),再進(jìn)行上述處理。
數(shù)據(jù)同步交換規(guī)則及內(nèi)容:①利用中間件直接訪問各數(shù)據(jù)系統(tǒng)(數(shù)據(jù)庫或者文件系統(tǒng)),同時(shí)建立靈活的數(shù)據(jù)導(dǎo)入方式;②向中間(臨時(shí))數(shù)據(jù)庫導(dǎo)入數(shù)據(jù),創(chuàng)建統(tǒng)一規(guī)則的數(shù)據(jù)導(dǎo)入環(huán)境;③設(shè)定用戶權(quán)限,來區(qū)分不同用戶應(yīng)導(dǎo)入的相應(yīng)的數(shù)據(jù)內(nèi)容,確保不同用戶間導(dǎo)入數(shù)據(jù)時(shí)不出現(xiàn)混亂操作。
基本上能轉(zhuǎn)換當(dāng)下流行的數(shù)據(jù)庫數(shù)據(jù)(例如SqlServer、Oracle、Sybase、Db2、文件型Excel數(shù)據(jù)表及其它的文本存儲(chǔ)的數(shù)據(jù)格式。各類的數(shù)據(jù)的同步交換處理都有相應(yīng)的接口模塊,都會(huì)有統(tǒng)一數(shù)據(jù)接口對(duì)接規(guī)則,這樣能夠?qū)崿F(xiàn)對(duì)新的數(shù)據(jù)格式的快速增加、識(shí)別、轉(zhuǎn)換。
實(shí)際操作時(shí)可以根據(jù)具體情況,靈活選擇數(shù)據(jù)抽取方案。如對(duì)于船舶基礎(chǔ)數(shù)據(jù)進(jìn)行采集時(shí),可以采用ETL工具直接連接各應(yīng)用系統(tǒng)數(shù)據(jù)庫將數(shù)據(jù)抽取到集中數(shù)據(jù)庫中進(jìn)行處理。而對(duì)于動(dòng)態(tài)過程中產(chǎn)生的數(shù)據(jù)(如船舶簽證、AIS、VTS等),由于涉及到實(shí)時(shí)數(shù)據(jù)抽取,可根據(jù)情況選擇如下方案:①將實(shí)時(shí)和歷史數(shù)據(jù)分開處理。周期性的將各單位的歷史數(shù)據(jù)抽取到集中數(shù)據(jù)庫中。通過跨數(shù)據(jù)源訪問功能直接使用穿透鉆取技術(shù)從應(yīng)用服務(wù)中鉆取到實(shí)時(shí)的數(shù)據(jù)。②使用數(shù)據(jù)同步工具對(duì)數(shù)據(jù)庫進(jìn)行實(shí)時(shí)同步。③對(duì)于手工填報(bào)數(shù)據(jù)和文件數(shù)據(jù),建議采用指定格式(如Excel、Word)上傳填報(bào)或者基于系統(tǒng)交互頁面的填報(bào),通過ETL工具導(dǎo)入數(shù)據(jù)庫中。
2.1.1.3 數(shù)據(jù)抓取技術(shù)
船舶大數(shù)據(jù)還有一類數(shù)據(jù)來源依靠網(wǎng)絡(luò)爬蟲形式的數(shù)據(jù)抓取,數(shù)據(jù)抓取方案由目標(biāo)設(shè)定、規(guī)則配置、任務(wù)執(zhí)行、解析處理、人工判定五部分組成。
(1)利用工具來配置數(shù)據(jù)抓取目標(biāo)。
(2)配置規(guī)則來實(shí)現(xiàn)數(shù)據(jù)的完整抓取。
(3)根據(jù)配置文件執(zhí)行抓取任務(wù)。
(4)抓取程序訪問數(shù)據(jù)列表地址來解析每一個(gè)數(shù)據(jù)項(xiàng),利用正則匹配實(shí)現(xiàn)對(duì)html內(nèi)容解析抓取。
(5)人工判斷。抓取只是簡單的實(shí)現(xiàn)了網(wǎng)絡(luò)數(shù)據(jù)的采集,信息內(nèi)容的準(zhǔn)確性需要人工判定校準(zhǔn)。
2.1.2 數(shù)據(jù)清洗加工技術(shù)
2.1.2.1 數(shù)據(jù)的清洗
過濾或者修改那些不符合要求的數(shù)據(jù)是作為數(shù)據(jù)清洗的主要任務(wù)。數(shù)據(jù)清洗不是簡單的更新數(shù)據(jù)記錄,而是對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,清洗過后的數(shù)據(jù)應(yīng)能滿足沒有數(shù)據(jù)異常、沒有近似重復(fù)記錄的要求,并可以支持船舶數(shù)據(jù)的集成。技術(shù)手段:
數(shù)據(jù)人工調(diào)整:通過匹配檢查,發(fā)現(xiàn)并標(biāo)識(shí)出違反規(guī)則的一類數(shù)據(jù),然后經(jīng)過人工操作對(duì)這類數(shù)據(jù)進(jìn)行相應(yīng)的結(jié)構(gòu)調(diào)整。
計(jì)算機(jī)自動(dòng)調(diào)整:通過分析樣本預(yù)先制定出數(shù)據(jù)清洗規(guī)則的集合,再利用專門的ETL工具或自行編制的批處理工具完成數(shù)據(jù)的清洗。
2.1.2.2 缺失值的處理
對(duì)于數(shù)據(jù)集中的數(shù)據(jù),存在有這樣兩種情況:
(1)數(shù)據(jù)中有大量缺失值的屬性,如確定是無效數(shù)據(jù),通常采取的措施可以有:①從整合后的數(shù)據(jù)集中直接刪除;②作刪除標(biāo)記。
(2)對(duì)于比較重要的屬性,也會(huì)存在少量缺失值,需要將數(shù)據(jù)補(bǔ)充完整后進(jìn)行一系列的數(shù)據(jù)挖掘。可以采取以下方式進(jìn)行數(shù)據(jù)填補(bǔ):①需要用一個(gè)相同的并且不會(huì)引起使用歧義的常數(shù)對(duì)象來替換缺失的屬性值,例如字符串就直接填入空格;數(shù)值類直接填入0或者允許的缺省數(shù)據(jù)值;②利用該屬性的最可能的值填充缺失值。
(3)清洗相似的重復(fù)數(shù)據(jù)。相似重復(fù)記錄清洗內(nèi)容包括如下兩項(xiàng),一是針對(duì)兩個(gè)數(shù)據(jù)集的清洗,另外一個(gè)是針對(duì)合并后的數(shù)據(jù)集進(jìn)行清洗。首先是記錄匹配過程,即識(shí)別相似重復(fù)記錄并標(biāo)識(shí)與這個(gè)重復(fù)記錄相同現(xiàn)實(shí)實(shí)體對(duì)象。然后,將找出的相似重復(fù)記錄采用特定規(guī)則來合并成一個(gè)包含更多屬性的新的實(shí)體對(duì)象,確保信息記錄無冗余,最終在數(shù)據(jù)集中刪除多余的記錄。
(4)數(shù)據(jù)規(guī)模的消減。對(duì)數(shù)據(jù)進(jìn)行了缺失值清理后,考慮進(jìn)行人選或機(jī)選,刪除冗余屬性或者與船舶數(shù)據(jù)無關(guān)的屬性。
2.2 采集數(shù)據(jù)的存儲(chǔ)及處理技術(shù)endprint
船舶數(shù)據(jù)的存儲(chǔ)與處理,它的任務(wù)是對(duì)采集到的各種信息進(jìn)行分析、存儲(chǔ)、處理、發(fā)布。服務(wù)的動(dòng)態(tài)創(chuàng)建及服務(wù)的即時(shí)發(fā)現(xiàn)是船舶大數(shù)據(jù)進(jìn)行信息服務(wù)時(shí)要具備的重點(diǎn)功能。要實(shí)現(xiàn)異構(gòu)數(shù)據(jù)的共享,可以將采集到的信息作為服務(wù),來動(dòng)態(tài)的創(chuàng)建、發(fā)現(xiàn)來自于不同分布范圍的服務(wù)信息,做到對(duì)數(shù)據(jù)的集中、分類并深度處理分析。內(nèi)容如下:
創(chuàng)建數(shù)據(jù)管理中心,通過交互操作實(shí)現(xiàn)對(duì)信息的請(qǐng)求、識(shí)別、接收、融合、編輯、更新、管理等。
大數(shù)據(jù)庫創(chuàng)建,制定數(shù)據(jù)建設(shè)標(biāo)準(zhǔn),將采集到的船舶信息存儲(chǔ)在數(shù)據(jù)庫或者其他存儲(chǔ)介質(zhì)。
數(shù)據(jù)倉庫挖掘,分析原數(shù)據(jù)庫、擬建數(shù)據(jù)庫、Excel等數(shù)據(jù)文件的基本結(jié)構(gòu)及內(nèi)容,設(shè)計(jì)挖掘規(guī)則與概念模型,進(jìn)行ETL深度分析處理。
2.3 數(shù)據(jù)的共享與服務(wù)技術(shù)
船舶數(shù)據(jù)的共享與服務(wù)可以針對(duì)不同用戶的需求,直接AOC將核心層處理分析后的數(shù)據(jù)發(fā)送到各用戶終端,用戶即可得到所需業(yè)務(wù)數(shù)據(jù)服務(wù)。
建設(shè)數(shù)據(jù)交換平臺(tái),數(shù)據(jù)交換平臺(tái)可基于數(shù)據(jù)中間件產(chǎn)品實(shí)現(xiàn),組成一套完整的數(shù)據(jù)交換節(jié)點(diǎn),在每個(gè)前置及數(shù)據(jù)采集點(diǎn)部署該交換節(jié)點(diǎn),實(shí)現(xiàn)對(duì)內(nèi)對(duì)外的數(shù)據(jù)交換。
實(shí)現(xiàn)數(shù)據(jù)應(yīng)用共享服務(wù),將核心數(shù)據(jù)層分析處理過的數(shù)據(jù)推送到不同的用戶終端,并將這些信息利用中間件的方式進(jìn)行匯總、整理,實(shí)現(xiàn)業(yè)務(wù)應(yīng)用層面的數(shù)據(jù)共享,并能提供共享的數(shù)據(jù)接口服務(wù)。
采用Webservice+SSL+XML+Json接口技術(shù),按船舶、船員、業(yè)務(wù)分類設(shè)計(jì)開發(fā)一套標(biāo)準(zhǔn)統(tǒng)一的船舶大數(shù)據(jù)接口服務(wù),用來對(duì)內(nèi)對(duì)外提供數(shù)據(jù)存儲(chǔ)、更新、查詢服務(wù),保障船舶大數(shù)據(jù)運(yùn)行的安全性、穩(wěn)定性、可靠性及高可用性。
3 結(jié)語
通過內(nèi)河船舶大數(shù)據(jù)關(guān)鍵技術(shù)研究,能夠理清內(nèi)河各類船舶數(shù)據(jù)間的關(guān)系,解決內(nèi)河船舶信息孤島問題,實(shí)現(xiàn)船舶數(shù)據(jù)的共享應(yīng)用;能夠?yàn)榇按髷?shù)據(jù)平臺(tái)建設(shè)打下技術(shù)理論基礎(chǔ);能夠獲得一些大型船舶綜合應(yīng)用平臺(tái)開發(fā)的思路、方法;能夠獲得更多關(guān)于船舶大數(shù)據(jù)行業(yè)應(yīng)用的啟發(fā)。
參考文獻(xiàn):
[1] Gartner. Top ten strategic technology trend for 2012[EB/OL].(2011-11-05)[2014-08-17]. http://www.gartner.com.
[2] 孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計(jì)算機(jī)研究與發(fā)展, 2013,50(1):146-169.
[3] 張笛, 萬程鵬, 嚴(yán)新平. 基于事故特征分析的長江礙航風(fēng)險(xiǎn)研究[J]. 中國航海, 2013, 36(2):94-99.
[4] 徐武雄, 初秀民, 劉興龍. 海事業(yè)務(wù)數(shù)據(jù)挖掘和共享關(guān)鍵技術(shù)研究[C]// 中國智能交通年會(huì). 2015.
[5] 文哲, 何正偉, 辛旭日,等. 基于云計(jì)算的海事信息處理模式[J]. 中國航海, 2016, 39(2):50-54.
[6] 整合海事系統(tǒng)業(yè)務(wù)信息資源促進(jìn)海事協(xié)同管理 盧艷民 - 《天津航?!? 2011-03-25.
[7] 孫星, 嚴(yán)新平, 初秀民,等. 基于船標(biāo)岸一體化技術(shù)的內(nèi)河信息服務(wù)關(guān)鍵技術(shù)研究[J]. 交通信息與安全, 2012, 30(4):126-130.
[8] 申慧超, 胡勤友, 楊春. 基于AIS數(shù)據(jù)的預(yù)抵船舶聯(lián)系信息查詢系統(tǒng)[J]. 上海海事大學(xué)學(xué)報(bào), 2010, 31(4):13-16.
[9] 于俊逸, 陳偉, 劉建,等. 內(nèi)河航運(yùn)VTS與AIS信息融合關(guān)鍵技術(shù)研究[J]. 交通信息與安全, 2013, 31(6).
[10] 彭玢, 代潔. 基于中間庫與WebService平臺(tái)信息交互接口設(shè)計(jì)[J]. 計(jì)算機(jī)與數(shù)字工程, 2013, 41(11):1801-1803.endprint