• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于時(shí)間窗口選擇和SVR的船舶交通事故率預(yù)測(cè)

      2019-05-10 06:50:36孫墨林鄭中義
      中國(guó)航海 2019年1期
      關(guān)鍵詞:置信區(qū)間年份不確定性

      孫墨林, 鄭中義

      (大連海事大學(xué) 航海學(xué)院, 遼寧 大連 116026)

      船舶交通事故率的預(yù)測(cè)是在對(duì)與預(yù)測(cè)有關(guān)的資料的分析、處理、提煉和概括的基礎(chǔ)上,利用模型的形式刻畫出船舶交通事故率的基本演變規(guī)律,并根據(jù)對(duì)未來(lái)?xiàng)l件的了解和分析,推測(cè)或計(jì)算出船舶交通事故率在未來(lái)期間所可能表現(xiàn)的狀況。[1]目前船舶交通事故率的預(yù)測(cè)方法有時(shí)間序列預(yù)測(cè)法、統(tǒng)計(jì)回歸預(yù)測(cè)法、灰色GM(1,1)模型、神經(jīng)網(wǎng)絡(luò)模型、混沌預(yù)測(cè)模型和支持向量回歸(Support Vector Regression, SVR)模型等。其中,統(tǒng)計(jì)回歸預(yù)測(cè)法、神經(jīng)網(wǎng)絡(luò)模型和混沌預(yù)測(cè)模型都需要大量的數(shù)據(jù)作為預(yù)測(cè)的基礎(chǔ)。[2-3]時(shí)間序列預(yù)測(cè)法、灰色GM(1,1)模型和SVR模型都可用于小樣本數(shù)據(jù),但灰色GM(1,1)模型更適用于具有較強(qiáng)指數(shù)規(guī)律的序列。[4]常用的時(shí)間序列預(yù)測(cè)法為指數(shù)平滑法和自回歸移動(dòng)平均模型(Autoregressive Integrated Moving Average Model, ARIMA)。SVR模型拓?fù)浣Y(jié)構(gòu)簡(jiǎn)單、推廣性能好,能從未知分布的小樣本中抽取最大的有用信息,解決樣本空間中的非線性回歸等問(wèn)題,回歸預(yù)測(cè)精度高。[5]

      由于船舶交通事故的發(fā)生具有隨機(jī)不確定性[6],當(dāng)事故率按時(shí)間排列時(shí),則構(gòu)成不確定時(shí)間序列??紤]到海事規(guī)則的生效等可能會(huì)導(dǎo)致船舶交通事故率發(fā)生顯著的變化,船舶交通事故率的預(yù)測(cè)問(wèn)題可歸結(jié)為不確定時(shí)間序列的分段問(wèn)題和小樣本數(shù)據(jù)的預(yù)測(cè)問(wèn)題。本文利用泊松模型中置信區(qū)間的計(jì)算方法構(gòu)造船舶交通事故率不確定時(shí)間序列,并基于時(shí)間序列發(fā)展的有序性,采用滑動(dòng)窗口技術(shù)對(duì)置信區(qū)間比較集中的不確定時(shí)間序列點(diǎn)進(jìn)行聚類,實(shí)現(xiàn)不確定時(shí)間序列的分段,將其中最接近當(dāng)前時(shí)間的區(qū)段選為統(tǒng)計(jì)時(shí)間窗口,由于該時(shí)間窗口內(nèi)的樣本數(shù)據(jù)一般較少,選擇SVR模型對(duì)船舶交通事故率進(jìn)行預(yù)測(cè)。以英國(guó)籍船舶交通事故數(shù)據(jù)作為算例,并與指數(shù)平滑法和ARIMA模型的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比,驗(yàn)證預(yù)測(cè)模型的有效性。

      1 模型的基本原理

      1.1 隨機(jī)不確定性量化算法

      船舶交通事故統(tǒng)計(jì)一般可將不確定性歸納為兩種類型。第一類是隨機(jī)不確定性,用以表達(dá)事物行為的隨機(jī)性;第二類是認(rèn)識(shí)不確定性,用以表達(dá)知識(shí)的不完善性。船舶交通事故的發(fā)生具有隨機(jī)不確定性,當(dāng)用概率模型來(lái)描述這類隨機(jī)行為時(shí),可體現(xiàn)人們對(duì)客觀現(xiàn)象的主觀認(rèn)識(shí),具有認(rèn)識(shí)不確定性。

      概率理論是處理隨機(jī)不確定性最主要的數(shù)學(xué)工具。[7]在選用概率模型方面,假設(shè)船舶交通事故的發(fā)生服從泊松分布[8],并選擇泊松模型[9]來(lái)量化船舶交通事故率的置信區(qū)間。雖然泊松模型的選擇具有認(rèn)識(shí)不確定性,但由于船舶交通事故率較低,隨機(jī)不確定性較為顯著,不對(duì)選用概率模型帶來(lái)的認(rèn)識(shí)不確定性進(jìn)行量化。利用泊松模型計(jì)算船舶交通事故率置信區(qū)間的公式[9]為

      1.2 SVR模型原理

      給定訓(xùn)練數(shù)據(jù)(x1,y1),…,(xi,yi),…,(xl,yl),其中:xi∈Rn為輸入向量;yi∈R為xi對(duì)應(yīng)的輸出值;l為樣本個(gè)數(shù)。SVR的基本思想是通過(guò)一個(gè)非線性映射φ將輸入向量映射到高維特征空間中,并在這個(gè)空間進(jìn)行線性回歸[10],回歸函數(shù)為

      f(x)=wTφ(x)+b

      (3)

      式(2)中:w為權(quán)值向量;b為偏置。

      SVR問(wèn)題就轉(zhuǎn)換為求解一個(gè)二次規(guī)劃的問(wèn)題

      (4)

      通過(guò)引入核函數(shù),并應(yīng)用Lagrange乘子法求解上述二次規(guī)劃問(wèn)題的對(duì)偶問(wèn)題,得到?jīng)Q策函數(shù)為

      (5)

      2 船舶交通事故率預(yù)測(cè)模型

      2.1 時(shí)間窗口的選擇模塊

      船舶交通事故率一般轉(zhuǎn)化到時(shí)間序列上進(jìn)行分析。由于船舶交通事故的發(fā)生具有隨機(jī)不確定性,船舶交通事故率時(shí)間序列每個(gè)時(shí)間點(diǎn)上,對(duì)應(yīng)的不再是一個(gè)確定值,而是一個(gè)可能取值的區(qū)間,該時(shí)間序列稱為不確定時(shí)間序列,可能取值的區(qū)間可通過(guò)式(1)和式(2)進(jìn)行量化。

      隨著海事規(guī)則的生效、老舊船舶的逐步淘汰和新技術(shù)在航運(yùn)業(yè)的應(yīng)用等都會(huì)在一定程度上對(duì)船舶交通事故率產(chǎn)生影響,船舶交通事故率的大小是影響其變化的各種不同因素在同一時(shí)間窗口內(nèi)發(fā)生作用的綜合結(jié)果,其時(shí)間序列為呈現(xiàn)某種變化趨勢(shì)的非平穩(wěn)序列。為更精確地對(duì)船舶交通事故率進(jìn)行預(yù)測(cè),需要對(duì)船舶交通事故率的狀態(tài)進(jìn)行劃分。

      在構(gòu)造船舶交通事故率不確定時(shí)間序列的基礎(chǔ)上,采用滑動(dòng)窗口技術(shù)對(duì)置信區(qū)間比較集中的不確定時(shí)間序列點(diǎn)進(jìn)行聚類,從而實(shí)現(xiàn)不確定時(shí)間序列的分段,即船舶交通事故率狀態(tài)的劃分。滑動(dòng)窗口技術(shù)以第一個(gè)年份作為第一個(gè)分段,并持續(xù)向后增長(zhǎng)直到某一年份真實(shí)的船舶交通事故率超出上一分段的置信區(qū)間,結(jié)束該分段,并以該年份作為新分段的開(kāi)始,不斷重復(fù)上述過(guò)程直到不確定時(shí)間序列末端。判斷分段的條件是下一年份真實(shí)的船舶交通事故率是否在上一分段的置信區(qū)間中。根據(jù)時(shí)間序列發(fā)展的有序性和連續(xù)性,如果下一年份真實(shí)的船舶交通事故率不在上一分段的置信區(qū)間中,則說(shuō)明該年份真實(shí)的船舶交通事故率和上一分段相比發(fā)生顯著性變化,即在隨機(jī)不確定性導(dǎo)致的數(shù)據(jù)波動(dòng)以外,船舶交通事故率仍然發(fā)生變化,在一定的置信水平下取該年份為分段點(diǎn)是合理的。

      初步分段結(jié)束后,需要判斷是否存在某個(gè)分段中僅包括一個(gè)年份的情況。如果存在該情況,并且其相鄰的兩個(gè)分段之間沒(méi)有發(fā)生顯著性變化,說(shuō)明該年份對(duì)應(yīng)的時(shí)間序列點(diǎn)隨機(jī)波動(dòng)較大,導(dǎo)致不確定時(shí)間序列的分段,其相鄰的兩個(gè)分段之間沒(méi)呈現(xiàn)出顯著的變化趨勢(shì)。為增加樣本數(shù)量,減小統(tǒng)計(jì)結(jié)果的不確定性,避免過(guò)度分段需合并上述分段。顯著性變化的判斷條件與不確定時(shí)間序列的分段條件一致,即下一年份真實(shí)的船舶交通事故率是否在上一分段的置信區(qū)間中。如果該年份相鄰的兩個(gè)分段發(fā)生顯著性變化,說(shuō)明不確定時(shí)間序列存在顯著性變化趨勢(shì),則維持分段結(jié)果。當(dāng)該年份為不確定時(shí)間序列的末端點(diǎn)時(shí),為避免統(tǒng)計(jì)結(jié)果具有較大的不確定性,可直接將其劃入相鄰分段。分段完成后,選擇最接近當(dāng)前時(shí)間的區(qū)段作為統(tǒng)計(jì)時(shí)間窗口。船舶交通事故率不確定時(shí)間序列分段流程見(jiàn)圖1。

      圖1 不確定時(shí)間序列分段流程圖

      2.2 SVR模型的預(yù)測(cè)模塊

      參數(shù)的取值同樣對(duì)SVR模型有重要的影響,選擇合適的參數(shù)能夠使SVR模型既有好的學(xué)習(xí)能力,又有好的泛化能力。SVR模型中主要的參數(shù)是損失函數(shù)參數(shù)P、懲罰參數(shù)C和徑向基函數(shù)(Radial Basis Function, RBF)參數(shù)R。損失函數(shù)參數(shù)P用于控制支持向量的個(gè)數(shù),其值越大,支持向量越少,精度越低。懲罰參數(shù)C用于控制模型的復(fù)雜度和逼近誤差,懲罰參數(shù)C越大,對(duì)數(shù)據(jù)的擬合能力越強(qiáng),但過(guò)高的懲罰參數(shù)C會(huì)導(dǎo)致過(guò)學(xué)習(xí)狀態(tài)。RBF核函數(shù)參數(shù)R定義了高維特征空間的結(jié)構(gòu),其值過(guò)大或過(guò)小都會(huì)導(dǎo)致系統(tǒng)的泛化能力變差。為獲取最佳預(yù)測(cè)性能的SVR模型,采用網(wǎng)格尋參方法來(lái)進(jìn)行參數(shù)尋優(yōu),其基本思想是讓參數(shù)在一定范圍內(nèi)變動(dòng),運(yùn)用交叉檢驗(yàn)方法找到預(yù)測(cè)精度最高的參數(shù)取值。

      3 實(shí)例驗(yàn)證

      3.1 數(shù)據(jù)來(lái)源

      船舶交通事故與通常人們所說(shuō)的海事概念不同,海事中與船舶交通有關(guān)的那部分海事即碰撞、擱淺、觸礁和觸碰、浪損等稱為船舶交通事故。[1]根據(jù)英國(guó)海事調(diào)查局(MAIB)發(fā)布的年度報(bào)告[11],對(duì)所建立的預(yù)測(cè)模型進(jìn)行實(shí)例研究。2000—2016年英國(guó)籍船舶交通事故數(shù)據(jù)見(jiàn)表1。英國(guó)籍船舶指的是100總噸及以上的英國(guó)籍商船。

      3.2 時(shí)間窗口的選擇

      將表1中各年份的船舶艘數(shù)和船舶交通事故數(shù)代入式(1)中的s和n,顯著性水平a取0.1[8],計(jì)算出各年份船舶交通事故率的置信區(qū)間,將其按時(shí)間排列后得到不確定時(shí)間序列(見(jiàn)圖2)。在圖2中,置信區(qū)間通過(guò)線段進(jìn)行表示,線段的上下端點(diǎn)表示置信區(qū)間的上下邊界,線段中間的圓點(diǎn)表示該年份真實(shí)的船舶交通事故率。為更形象地描述船舶交通事故率的變化情況,將各置信區(qū)間的上邊界和下邊界分別用虛線連接起來(lái)。

      表1 英國(guó)籍船舶交通事故數(shù)據(jù)

      圖2 船舶交通事故率不確定時(shí)間序列

      利用滑動(dòng)窗口技術(shù),對(duì)圖2中的不確定時(shí)間序列進(jìn)行分段。首先將2000年作為第一個(gè)分段,由圖2可知:2000年真實(shí)的船舶交通事故率為0.132起/(船·年),置信區(qū)間為[0.111, 0.156]。2001年真實(shí)的船舶交通事故率為0.133起/(船·年),在上一個(gè)分段的置信區(qū)間中,故將2001年劃入上一分段。基于式(1)計(jì)算2000—2001分段的置信區(qū)間,得到[0.117, 0.149]。2002年真實(shí)的船舶交通事故率為0.107起/(船·年),由于其不在上一個(gè)分段的置信區(qū)間中,故以2002年作為新的分段開(kāi)始,計(jì)算該分段的置信區(qū)間,并對(duì)下一年份真實(shí)的船舶交通事故率是否在上一分段的置信區(qū)間中進(jìn)行判斷。以此類推,直至不確定時(shí)間序列的末端。初步分段完成后,共得到4個(gè)分段,分別為2000—2001、2002—2004、2005、2006—2016。發(fā)現(xiàn)2005年為一個(gè)分段僅包括一個(gè)年份的情況,需要判斷其相鄰分段是否發(fā)生顯著性變化。將表1中2002—2004分段的船舶艘數(shù)和船舶交通事故數(shù)代入式(1)中的s和n,顯著性水平a同樣取0.1,計(jì)算得到2002—2004分段的置信區(qū)間為[0.096, 0.116],而2006年真實(shí)的交通事故率為0.088起/(船·年),其不在2002—2004分段的置信區(qū)間中,說(shuō)明不確定時(shí)間序列存在顯著性變化趨勢(shì),維持分段結(jié)果。因此,最后是2000—2001、2002—2004、2005、2006—2016等4個(gè)分段。選擇最接近當(dāng)前時(shí)間的區(qū)段2006—2016作為船舶交通事故率預(yù)測(cè)的統(tǒng)計(jì)時(shí)間窗口。

      3.3 船舶交通事故率的預(yù)測(cè)

      將2006—2016分段的船舶交通事故率不確定時(shí)間序列轉(zhuǎn)化為真實(shí)值時(shí)間序列,真實(shí)值置信區(qū)間上邊界時(shí)間序列和真實(shí)值置信區(qū)間下邊界時(shí)間序列等3條確定的時(shí)間序列?;赟VR模型對(duì)上述3條時(shí)間序列進(jìn)行預(yù)測(cè)的過(guò)程相同,本文僅以真實(shí)值時(shí)間序列作為例子闡述預(yù)測(cè)過(guò)程。對(duì)于2006—2016分段的船舶交通事故率真實(shí)值時(shí)間序列,將其分成兩個(gè)部分:2006—2014年數(shù)據(jù)作為訓(xùn)練樣本,2015—2016年數(shù)據(jù)作為測(cè)試樣本。使用MATLAB LibSVM工具箱來(lái)訓(xùn)練SVR模型并對(duì)相關(guān)參數(shù)進(jìn)行網(wǎng)格尋優(yōu),得到最佳損失函數(shù)參數(shù)P、懲罰參數(shù)C以及RBF核函數(shù)參數(shù)R分別為0.2、7.7和17.9?;谟?xùn)練得到的SVR模型對(duì)測(cè)試集進(jìn)行預(yù)測(cè),來(lái)驗(yàn)證SVR模型的有效性。SVR模型對(duì)訓(xùn)練集的擬合情況和對(duì)測(cè)試集的預(yù)測(cè)結(jié)果見(jiàn)圖3。同理可得到真實(shí)值置信區(qū)間上邊界時(shí)間序列和真實(shí)值置信區(qū)間下邊界時(shí)間序列對(duì)測(cè)試集的預(yù)測(cè)結(jié)果分別為(0.101,0.098)和(0.072,0.067),組成2015年和2016年的真實(shí)值預(yù)測(cè)區(qū)間[0.072, 0.101]和[0.067, 0.098]。

      圖3 基于SVR模型的預(yù)測(cè)

      3.4 模型評(píng)價(jià)

      為對(duì)本文建立的預(yù)測(cè)模型進(jìn)行評(píng)價(jià),選擇不帶時(shí)間窗口選擇的SVR模型,時(shí)間序列預(yù)測(cè)中常用的指數(shù)平滑法和ARIMA模型作為參比模型。上述3種參比模型均利用全部的歷史數(shù)據(jù)。指數(shù)平滑法通過(guò)給最新的時(shí)間序列值以最大的權(quán)重,給其它的時(shí)間序列值以遞減的權(quán)重方法,進(jìn)行時(shí)間序列的預(yù)測(cè)。ARIMA模型在將非平穩(wěn)時(shí)間序列轉(zhuǎn)化為平穩(wěn)時(shí)間序列的基礎(chǔ)上建立回歸模型,進(jìn)而對(duì)時(shí)間序列進(jìn)行預(yù)測(cè)。各模型預(yù)測(cè)值及誤差的對(duì)比見(jiàn)表2。誤差指的是模型預(yù)測(cè)值與2015年船舶交通事故率真實(shí)值0.085起/船·年或2016年船舶交通事故率真實(shí)值0.078起/船·年之間的差值。

      表2 預(yù)測(cè)值及誤差

      從表2可知:帶時(shí)間窗口選擇的SVR模型的預(yù)測(cè)精度優(yōu)于不帶時(shí)間窗口選擇的SVR模型、指數(shù)平滑法以及ARIMA模型,驗(yàn)證該模型的有效性。本文建立的預(yù)測(cè)模型不僅能夠給出預(yù)測(cè)值,同時(shí)能夠給出該預(yù)測(cè)值可能的變化區(qū)間。2015年和2016年船舶交通事故率真實(shí)值0.085起/(船·年)和0.078起/(船·年)均落在帶時(shí)間窗口選擇的SVR模型的預(yù)測(cè)區(qū)間[0.072, 0.101]和[0.067, 0.098]中,說(shuō)明所建立的預(yù)測(cè)模型不僅預(yù)測(cè)精度高,還能為決策者提供更多的信息,更好地為船舶交通安全管理者的決策提供指導(dǎo)。

      4 結(jié)束語(yǔ)

      有效的預(yù)測(cè)船舶交通事故率對(duì)船舶交通事故的預(yù)防、控制以及船舶交通安全的評(píng)價(jià)有著重大意義??紤]到船舶交通事故的發(fā)生具有隨機(jī)不確定性以及海事規(guī)則生效等導(dǎo)致的事故率的變動(dòng)趨勢(shì),本文建立船舶交通事故率預(yù)測(cè)模型,該模型包括時(shí)間窗口的選擇和SVR模型兩個(gè)模塊,基于英國(guó)籍船舶交通事故數(shù)據(jù),與指數(shù)平滑法和ARIMA模型的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比,驗(yàn)證本文預(yù)測(cè)模型的有效性。該研究還存在一定的不足,例如預(yù)測(cè)模型無(wú)法應(yīng)用于未發(fā)生過(guò)船舶交通事故或時(shí)間序列分段內(nèi)數(shù)據(jù)過(guò)少的情況,利用多因素分析方法來(lái)進(jìn)行時(shí)間窗口的選擇并預(yù)測(cè)船舶交通事故率有待進(jìn)一步研究。

      猜你喜歡
      置信區(qū)間年份不確定性
      法律的兩種不確定性
      法律方法(2022年2期)2022-10-20 06:41:56
      定數(shù)截尾場(chǎng)合三參數(shù)pareto分布參數(shù)的最優(yōu)置信區(qū)間
      特殊的一年
      p-范分布中參數(shù)的置信區(qū)間
      多個(gè)偏正態(tài)總體共同位置參數(shù)的Bootstrap置信區(qū)間
      英鎊或繼續(xù)面臨不確定性風(fēng)險(xiǎn)
      列車定位中置信區(qū)間的確定方法
      具有不可測(cè)動(dòng)態(tài)不確定性非線性系統(tǒng)的控制
      什么是閏年?
      一樣的年份
      金沙县| 句容市| 靖江市| 孟津县| 西青区| 永年县| 东辽县| 桐庐县| 泸溪县| 邻水| 图们市| 仲巴县| 潢川县| 炉霍县| 南开区| 崇州市| 宝应县| 香河县| 蓬安县| 全州县| 邓州市| 金沙县| 大邑县| 宁陕县| 前郭尔| 屏边| 红安县| 册亨县| 兴仁县| 文昌市| 南漳县| 金沙县| 皋兰县| 永顺县| 玉溪市| 芦山县| 张家口市| 平舆县| 和龙市| 巫溪县| 长阳|