郭 策 金 楓 馬朝陽
(1.北京北礦智能科技有限公司,北京 102628;2.金屬礦山智能開采技術北京市重點實驗室,北京 102628;3.礦冶科技集團有限公司,北京 100160)
為了更好地研究和探討不規(guī)范航行的識別方法,本論文主要從以下三個方面對不規(guī)范航行通告的識別與識別方法展開論述。本文的目的是通過基于NLP的方法建立模型,通過預處理和識別不規(guī)范航行通告,提取不規(guī)范航行載具的運動軌跡、速度等信息,進行航行的安全性數(shù)據(jù)分析和優(yōu)化,使駕駛者的安全意識得以提升,減少交通事故的發(fā)生幾率。
信息是一種客觀的現(xiàn)象和事物的屬性及其變化的規(guī)律性的總和信息的概念,是指人們在社會生活中所接觸到的一切信息,包括文字、圖形、聲音等,也可以說信息就是人的思想和感情的反應過程。不規(guī)范的航行通告識別系統(tǒng)主要研究的是不規(guī)范航行信息的識別與分析,它是一個對不規(guī)范的運輸路線進行實時的監(jiān)控與追蹤,并通過對異常情況的預警來實現(xiàn)對運輸車輛的有效管理。
不規(guī)范的航行通告是指沒有經(jīng)過國家相關部門的批準而在港口、碼頭等地方行駛的通告;影響交通安全不規(guī)范的航行通告會對運輸設備造成一定的干擾作用,使其不能正常地運行和使用。例如,如果在港的時候需要進出,那么就必須要通過正規(guī)的程序來檢查,然后再由船公司的工作人員來負責。對于交通運輸來說,它是一個非常重要的方面,它也可以為人們的出行提供便利,但同時也給城市的發(fā)展帶來了巨大的壓力和挑戰(zhàn)。因為一旦有了不準確的航行通告,不僅僅會給我們的生活以及工作環(huán)境帶去威脅,而且還會破壞到整個地區(qū)的穩(wěn)定與和諧。因此,為了保證航行的安全性和效率,對其研究十分有必要[1]。
根據(jù)不規(guī)范航行通告的識別方法,可將其分為兩大類:一類是基于圖論的分類方法,另一類是基于神經(jīng)網(wǎng)絡的分類方法。(1)圖論的分類。不規(guī)范運輸調(diào)度系統(tǒng)的主要功能就是對不規(guī)范的車輛進行合理的規(guī)劃和管理,從而提高了交通的運行效率。因此在研究中,有必要對其數(shù)學模型建立和分析,以方便對交通運輸過程的優(yōu)化設計。(2)基于神經(jīng)網(wǎng)絡的分類方法。將不規(guī)范航行通告文本序列視為一組token,基于詞嵌入技術,進而將句子表示成token序列?;趖oken的標識進行詞性或詞義分類,應用循環(huán)神經(jīng)網(wǎng)絡(RNN)和卷積神經(jīng)網(wǎng)絡(CNN)等常用深度學習技術實現(xiàn)文本序列建模。
在不規(guī)范運行信息中,以前通常使用的是傳統(tǒng)的識別方法,這種方法是將不規(guī)范航行通告的發(fā)生原因和影響因素作為研究對象,然后對其進行分類,最后再利用神經(jīng)網(wǎng)絡的原理對其特征、類型、分布等方面的內(nèi)容進行分析,并根據(jù)這些特點來識別出不規(guī)范的航行通告[2]。目前,有很多的學者都致力于研究人工神經(jīng)網(wǎng)絡的模型來解決不精確的安全駕駛問題。其中有一種就是用模糊的數(shù)學語言來描述它的過程:在系統(tǒng)的輸入層,將一個復雜的非線性函數(shù)映射到輸出層上,接著通過輸出層的神經(jīng)元與外部環(huán)境的連接關系,從而得到了整個系統(tǒng)的狀態(tài)反饋。本文主要介紹的是基于NLP的智能識別的方法。該方法的優(yōu)點是簡單,可以很容易地從計算機的角度去處理,并且具有很強的魯棒性[3]。但是也存在著一定的缺點,比如只能適用于一些特定的條件下,而不能完全適用于某些特殊的情況。
首先,對不規(guī)范航行通告進行預判,然后對不規(guī)范運行的原因分析,最后根據(jù)識別結果確定是否需要采取預判措施。在本實驗中,先通過實驗對比,判斷不規(guī)范航行的目的是什么,再從系統(tǒng)的角度出發(fā),選擇合適的識別方法,并結合實際的應用情況,最終得出結論。在本實驗中,主要采用了3種識別方法,分別為:(1)特征值法。該方法是一種比較常用的數(shù)據(jù)處理的算法;(2)神經(jīng)網(wǎng)絡法。它是將復雜的信息從大量的樣本空間映射到了有意義的集合上,并將其作為一個整體來研究。它具有簡單容易實現(xiàn)的特點;(3)支持向量機(SVM)。它可以用于分類和建模,并且能夠很好地解決一些問題。3種方法都是以訓練集為基礎的模型來建立的;各個模塊的組合都是用來輔助的對象和輸入的參數(shù)之間的關系以及輸出的概率分布。
計算機網(wǎng)絡技術在軍事領域的應用越來越廣泛,在航行運輸中,通過對不規(guī)范航行通告的研究和分析,可以對不規(guī)范航行做出預警,從而減少損失。本文的主要內(nèi)容是利用MATLAB軟件進行仿真,并結合Matlab中的運動學和數(shù)學模型,建立起一個精確的、高效的、通用的航行通告識別系統(tǒng)。本論文的重點在于,如何識別出不規(guī)范的航行通告,并將其應用于實際的駕駛過程,該系統(tǒng)的設計思路如下:(1)根據(jù)目標車的行駛速度,以及環(huán)境的變化來判斷是否存在異常,然后再確定該車型的具體位置,最后再將其傳回數(shù)據(jù)庫。(2)首先,需要對該車型的所有數(shù)據(jù)的采集及處理,包括車速和加速度等。其次,是要計算出該車型的相關參數(shù),比如發(fā)動機的轉速等。再次,就是要考慮到駕駛員的反應時間,當出現(xiàn)了緊急情況,應該及時地采取相應的應對措施[3]。
該模塊主要是對不規(guī)范航行通告的識別和判斷包括對不規(guī)范運行的分析、判定和預測。主要模塊有對不規(guī)范航行的識別,以及對于不規(guī)范運行的預警機制的研究。在本系統(tǒng)中,將根據(jù)不同的規(guī)則分別建立起針對性的安全警告信息庫,并通過該庫的數(shù)據(jù)進行預判,從而確定是否存在異常。然后再結合具體的事件來制定出相應的應對策略。
本次實驗主要是為了驗證不規(guī)范化航行通告識別的應用效果,因此需要在實驗前對實驗數(shù)據(jù)進行預處理,并將預處理結果與實際運行情況對比,從而確定是否使用不規(guī)范化航行通告識別。首先,在MATLAB的環(huán)境中,設置好時間間隔,并將采集到的信息通過SPSS17.0軟件的GUI顯示模塊的形式發(fā)送給主控中心,主控中心可以根據(jù)接收到的信息對所收集的信息做出相應的反應和判斷。其次,在K-3的窗口中,將本系統(tǒng)的關鍵詞放在Excel表中,然后利用SPSS22.0來生成表格,方便用戶查看。最后,當所有的樣本都測試完畢,則會把本文本框發(fā)給終端,由其來發(fā)送控制指令,同時也會發(fā)出提示,以提醒注意觀察。如果沒有達到要求,則會自動執(zhí)行相關操作[4]。
經(jīng)過對不規(guī)范航行船舶的仿真實驗,可以得出以下結論:(1)對不規(guī)范航行的影響:由于沒有建立起完善的數(shù)學模型,所以在運行過程中,可能會出現(xiàn)一系列的錯誤操作。(2)對不規(guī)范航行的預測:在進行了大量的實驗后,發(fā)現(xiàn)數(shù)據(jù)與實際的相差較大,這就表明有很多的誤差存在,這些誤差的產(chǎn)生是由許多因素造成的,例如時間和天氣等。
傳統(tǒng)的不規(guī)范航行通告識別方式主要有以下幾種:(1)人工識別:這種方法是通過現(xiàn)場的觀察和記錄,對不規(guī)范航行做出正確的判斷;(2)機器識別:在進行了大量的資料收集之后,再對這些信息進行進一步的分析和處理,然后再將它們輸入到計算機中,從而實現(xiàn)對運輸過程的控制;(3)專家系統(tǒng):該方法是一種比較先進的檢測技術,它能夠快速地發(fā)現(xiàn)不規(guī)范航行的行為并及時的作出反應,同時還能為決策者提供可靠的參考數(shù)據(jù)。但是由于其自身的局限性,它只能適用于一些特定的情況下,并不能完全解決具體的問題;另外,該方法也存在著一定的缺點,比如無法實時的監(jiān)控到交通狀況,導致預測的不準確性。但隨著科技的發(fā)展與進步,人工智能化的研究也逐漸的開始應用,這就使得智能化的辨識方式越來越多地出現(xiàn)在人們的日常生活中。
在進行航路上的不規(guī)范航行通告的識別時,可以用圖來表示。比如航路上的不規(guī)范航行通告,圖上的符號是“向”,它代表的是不規(guī)范的航行通告。在進行航路上的違規(guī)船舶的識別時,圖上的“向”的特點就是由圖右下角的箭頭來表示。因為駕駛員的意圖是為了駕駛人員的安全而設計的;所以,在進行判斷的時候就會有很大的可能性。因此對于不規(guī)范的航行通告,需要對其做出準確的識別和分析。在對違章行為的識別的過程中,圖上的符號也要根據(jù)實際情況做出相應的變化。
預處理是指對不規(guī)范航行通告進行識別、過濾、篩選和分析,并將其分類從而確定是否為違規(guī)的航行通告。首先,需要對文本中的標點符號進行預處理,通常利用正則表達式進行判定;其次,應用基于隱馬爾可夫的jieba分詞庫,對文本中的中文詞語進行有效分割;再次,將文本中分割后的詞頻進行統(tǒng)計,消除小樣本噪聲;最后,將預處理后的每一個分詞進行唯一識別號關聯(lián),用于后續(xù)的模型訓練[5]。
在不規(guī)范航行通告的分割中加入一個NLP的概念來識別,NLP是指通過對不規(guī)范航行通告的分析和處理,將其與普通的航行通告進行對比,從而判斷出是否存在違規(guī)行為[6]。這種新的方法也有很多的優(yōu)點:(1)對于不規(guī)范的運輸車輛,由于其自身的特點使得它的識別難度增加,所以需要對其的識別過程加以嚴格地把控[7]。(2)雖然該算法的原理很簡單,但是也有一些不足之處,比如說,當駕駛員的反應時間較長時,就會導致錯誤的發(fā)生概率加大,而且當出現(xiàn)突發(fā)事件時,因為該算法的準確度不高,因此無法保證準確性[8]。
對于不規(guī)范航行,我們可以通過區(qū)域的劃分來進行識別。
(1)根據(jù)地形、地貌等因素,對不規(guī)范航行的區(qū)域進行分析,將其分為不同的區(qū)域。在地勢較為復雜的地區(qū),如山區(qū)和丘陵等,這些地方的安全系數(shù)較低,因此不規(guī)范運行的概率較大;而在地勢相對平坦的地區(qū),如鐵路和公路等,這些地方的安全系數(shù)較高,因此一般不會發(fā)生大的交通事故[9]。(2)按照河流的流量大小,將整個河網(wǎng)劃為一個個的小流域,這樣做的好處是能夠有效地減少河網(wǎng)的擁擠程度,提高運輸效率,但是這種做法的缺點是無法對河的流量做出準確的判斷和預測,并且不能很好地控制進出口的車輛數(shù)量,一旦出現(xiàn)擁堵情況,就會造成很大的損失[10]。
本文對不規(guī)范航行通告的神經(jīng)網(wǎng)絡方法進行了研究,分析比較了各種模型和算法在不同條件下所表現(xiàn)出來的優(yōu)劣。通過實驗對比發(fā)現(xiàn):(1)在不一樣條件時,每種建模方式都有其適用范圍。(2)從仿真結果看得到最優(yōu)參數(shù)是最小化期望誤差與最大通信容量之間線性度;而當傳輸速率高、速度快或者數(shù)據(jù)量大時,可以選擇使用最短路徑法來進行模擬計算分析,得出最佳節(jié)點位置和優(yōu)化模型,在不一樣的條件下,傳輸速率越快、通信容量越大時選擇最多路徑法。(3)從模型結果看得到最優(yōu)參數(shù)是最小化期望誤差與最大通信質(zhì)量之間的線性度,而最短路徑方法可以有效地減少信息量。