羅肖霞 劉 奕 劉敬賢
(武漢理工大學(xué)航運學(xué)院1) 武漢 430063) (內(nèi)河航運技術(shù)湖北省重點實驗室2) 武漢 430063)
船舶間時距分布又稱船舶到達規(guī)律,屬于宏觀交通流特征的一種,是對大量船舶到達數(shù)據(jù)進行統(tǒng)計分析后挖掘出的一種船舶交通特征.研究船舶間時距分布規(guī)律對于船舶交通流特征度量、通過能力研究和岸線規(guī)劃研究均有一定意義.
國內(nèi)外均已展開了具有一定深度和廣度的船舶間時距分布研究,文獻[1-2]利用統(tǒng)計學(xué)原理對分析船舶在港區(qū)和橋區(qū)的到達規(guī)律,得出船舶的到達規(guī)律服從泊松分布;劉敬賢等[3]對天津港主航道2003—2005年的船舶交通流的概率分布進行統(tǒng)計分析得出船舶到達規(guī)律服從正態(tài)分布.Kozan[4]在研究了澳大利亞布里斯班集裝箱碼頭到港數(shù)據(jù)后,總結(jié)出船舶到港規(guī)律符合指數(shù)分布模型.Noritake等[5]發(fā)現(xiàn)埃爾朗分布能有效擬合隨機到達的雜貨船的到港規(guī)律.張魯寧等[6-8]對集裝箱港區(qū)船舶到港時間間隔統(tǒng)計分析后得出,集裝箱港區(qū)概率服從符合埃爾朗分布.黃顯鑫等[9]分析廈門港主航道船舶到達數(shù)據(jù)后得出γ分布能有效擬合船舶的到達規(guī)律.總結(jié)研究現(xiàn)狀可知,已有船舶到達規(guī)律研究仍停留在運用傳統(tǒng)分布模型的層面,如指數(shù)分布、埃爾朗分布.而這兩種模型都有其局限性,無法涵蓋船舶間時距分布的某些特征點.
對數(shù)正態(tài)分布由于本身的性質(zhì),可用于描述某些呈右偏態(tài)分布的樣本,在金融市場和生物學(xué)領(lǐng)域有著廣泛應(yīng)用[10].交通領(lǐng)域最早由Greenberg[11]引入用以研究車輛間時距問題,研究認(rèn)為對數(shù)正態(tài)模型適用于交通負(fù)荷較大的區(qū)域.對數(shù)正態(tài)分布在公路的間時距分布問題上有較好的表現(xiàn),其偏態(tài)分布的特性能較好擬合間時距較小,概率密度大的特征[12-13].而在水路交通領(lǐng)域,僅有初秀明等[14]在探索長江中下游航道通過能力時,使用了該模型對武漢段、蕪湖段船舶間時距進行擬合,但并未對模型的擬合優(yōu)度進行分析.
本文旨在進一步研究對數(shù)正態(tài)分布在船舶間時距問題上的適應(yīng)性和優(yōu)越性.引入對數(shù)正態(tài)分布模型對港口泊位船舶間時距分布情況進行擬合,并與埃爾朗分布和γ分布橫向比較,通過卡方擬合優(yōu)度檢驗確立三種函數(shù)中擬合最優(yōu)分布模型.使用天津港2012—2014年的船舶到達數(shù)據(jù)作為實例演算,同時,為保證對數(shù)正態(tài)分布模型的普適性,考慮三種不同船型在進港排隊、船舶引航、貨物裝卸等方面的差異性,分別研究散貨、原油和集裝箱泊位的船舶到達間時距概率分布.
1)γ分布γ分布的概率密度函數(shù)為
t>0,α>0,β>0
(1)
(2)
式中:α為形狀參數(shù);β為率參數(shù);α,β均為實數(shù);t為船舶間時距;Γ(α)為γ函數(shù).
γ分布的累積分布函數(shù)為
(3)
式中:γ(α,βt)為不完全γ函數(shù).
2) 埃爾朗分布 埃爾朗分布屬于γ分布的一種,當(dāng)γ分布的形狀參數(shù)(埃爾朗分布中多用k表示)為正整數(shù)時,函數(shù)即為埃爾朗分布.
埃爾朗分布的概率密度函數(shù)為
(4)
式中:k為形狀參數(shù);λ為率參數(shù).
當(dāng)式(4)中λ為常數(shù)時,則變量t服從k階埃爾朗分布,k為正整數(shù).
k階埃爾朗分布的累積分布函數(shù)為
(5)
3) 指數(shù)分布 指數(shù)分布又稱負(fù)指數(shù)分布.當(dāng)式(4)中的形狀參數(shù)k為1時,函數(shù)為指數(shù)分布,其概率密度函數(shù)見式(6).一般來說,如果船舶的到達服從泊松分布,則船舶間時距分布服從指數(shù)分布[15].
指數(shù)分布因其簡潔性而廣為所用,但指數(shù)分布并不適用于所有交通狀況下的間時距研究,特別是在交通較為擁堵、追越情況較少發(fā)生時;相對地,它更適用于船舶航行在寬闊水域或輕交通負(fù)荷的狀況下.
f(t;λ)=λe-λt,t>0,λ>0
(6)
4) 傳統(tǒng)分布模型的局限性 經(jīng)廣泛查閱文獻、分析函數(shù)本身特性后發(fā)現(xiàn),指數(shù)分布首先不適用于對港口某泊位船舶到達規(guī)律進行擬合,埃爾朗分布和γ分布也均存在一定的局限性:
指數(shù)分布中,當(dāng)間時距趨近于零,函數(shù)對應(yīng)最大的概率分布,此時表明船舶可以經(jīng)常同時到泊位,這顯然與實際情況不符.港口內(nèi)碼頭和泊位的數(shù)量是一定的,不可能無限接收船舶,船舶到港頻繁時勢必會需要等待.考慮到指數(shù)分布適用于開闊水域,而本文的算例研究選用了較繁忙的天津港水域,因此本文不對指數(shù)分布進行比對.
埃爾朗分布和γ分布則較為靈活,雖不存在這一問題,但一方面由于埃爾朗分布的形狀參數(shù)必須為整數(shù),經(jīng)擬合后求得的形狀參數(shù)一般需要經(jīng)過四舍五入,因此,存在一定的誤差;另一方面,雖然γ分布不限定形狀參數(shù)必須為整數(shù),但其分布形狀的左尾部較厚,這也并不符合港口泊位船舶到達的實際情況.
對數(shù)正態(tài)分布是正態(tài)分布經(jīng)對數(shù)變換推演而來的.對數(shù)正態(tài)分布的概率密度函數(shù)和累積分布函數(shù)見式(7)~(8).對數(shù)正態(tài)分布函數(shù)的均值和方差見式(9)~(10).式(11)為對數(shù)正態(tài)分布的變異系數(shù),式(12)為對數(shù)正態(tài)分布的偏度(又稱偏態(tài),Skewness).
t>0,σ>0,μ∈
(7)
(8)
(9)
Var(t;μ,σ)=e2μ+σ2·(eσ2-1)
(10)
(11)
(12)
式(7)~(12)中:μ為位置參數(shù),又稱對數(shù)均值參數(shù),是變量t的自然對數(shù)的均值;σ稱為尺度參數(shù),又稱對數(shù)標(biāo)準(zhǔn)差,是變量t自然對數(shù)的標(biāo)準(zhǔn)差.
選定函數(shù)后需對函數(shù)進行參數(shù)估計,即確定參數(shù)μ和參數(shù)σ的值.
本文選擇極大似然估計方法進行參數(shù)估計.極大似然估計可通過求取對數(shù)似然函數(shù)最大值,尋求擬合結(jié)果的最優(yōu)值.對數(shù)似然函數(shù)的表達式見式(13).
(13)
式中:Θ為參數(shù)的極大似然估計值;n為樣本總數(shù);ti為第i個間時距值;f(ti)為所研究函數(shù)的概率模型.
將對數(shù)似然函數(shù)對各參數(shù)求偏導(dǎo)數(shù),可得對數(shù)似然方程組.從方程組中求解即完成參數(shù)估計.為求解參數(shù)μ和參數(shù)σ,對式(13)做如下推導(dǎo),并求得μ和σ的極大似然估計值[16-17],見式(15)~(16).
lntn)=C+lnN(μ,σ|lnt1,lnt2,…,lntn)
(14)
式中:C為常數(shù).
(15)
(16)
擬合優(yōu)度檢驗可用于檢驗分布模型與實際船舶間時距分布的擬合程度與偏差值.擬合優(yōu)度檢驗的常用表征值為顯著性概率,或稱p值.常用的擬合優(yōu)度檢驗方法有卡方擬合優(yōu)度檢驗、K-S檢驗等.因卡方擬合優(yōu)度檢驗過程簡便,易于操作,本文選用卡方擬合優(yōu)度檢驗分別對埃爾朗分布、伽馬分布、對數(shù)正態(tài)分布進行擬合優(yōu)度檢驗.
卡方擬合優(yōu)度檢驗中需將所有的數(shù)據(jù)合理劃分為不同區(qū)間,且每個區(qū)間樣本值不少于5.在確定假設(shè)函數(shù)后,引進如下檢驗統(tǒng)計量:
(17)
式中:Oi為區(qū)間i內(nèi)的實測頻數(shù);Ei為區(qū)間i內(nèi)的理論頻數(shù);n為區(qū)間總數(shù).
在卡方分布中,臨界值只與自由度R有關(guān):
R=n-s-1
(18)
式中:s為被檢驗分布的參數(shù)個數(shù).
本文使用天津港2012—2014年船舶到達數(shù)據(jù)進行案例演算.原始數(shù)據(jù)來源于天津海事局,主要有如下幾個特點:①數(shù)據(jù)涵蓋所有2012—2014年通過主航道進出天津港的船舶;②數(shù)據(jù)包括船舶基本信息,如吃水、船長、船名等;③數(shù)據(jù)包括船舶抵達泊位和離開泊位的具體時間.
為保證結(jié)論具有一定的普適性,不受船舶類型、船舶進出港優(yōu)先順序等因素干擾,綜合考慮數(shù)據(jù)樣本豐富程度后,選取了三種船型篩選數(shù)據(jù),即油船、集裝箱船、散貨船,每種船型選擇三個碼頭研究其到達規(guī)律.
根據(jù)對船舶進出港口數(shù)據(jù)的統(tǒng)計分析,作出統(tǒng)計樣本頻率直方圖,再分別將對數(shù)正態(tài)分布、埃爾朗分布、γ分布的概率密度函數(shù)與直方圖擬合,最終確定描述船舶間時距分布的函數(shù).
篩選后的9組樣本船舶到泊位間時距的基本統(tǒng)計量見表1.
表1 船舶間時距樣本的基本統(tǒng)計量
統(tǒng)計發(fā)現(xiàn),樣本中船舶到達泊位總數(shù)(樣本數(shù))與船舶到泊間時距的均值和標(biāo)準(zhǔn)差存在明顯函數(shù)關(guān)系,利用指數(shù)函數(shù)擬合的結(jié)果見圖1.隨著船舶總到泊數(shù)的增加,船舶到泊間時距的均值和標(biāo)準(zhǔn)差減少,說明間時距分布更集中于一個相對較小值.
圖1 船舶到達基本統(tǒng)計量的關(guān)系
由于本文中各樣本的數(shù)據(jù)覆蓋時間段相同,所以各樣本船舶總到泊數(shù)間的差異也是各泊位船舶交通繁忙程度的差異.因此,船舶到泊間時距的分布特征與船舶交通繁忙程度緊密相關(guān).
對上述9個泊位的間時距分布情況進行統(tǒng)計后,在MATLAB中使用對數(shù)正態(tài)分布、埃爾朗分布、γ分布模型擬合并進行擬合優(yōu)度檢驗,擬合示意圖僅選擇G2散貨泊位、N3集裝箱泊位、N4原油泊位作為代表展示,見圖2.圖2中黑色實線為對數(shù)正態(tài)分布擬合結(jié)果,深灰色虛線為埃爾朗分布擬合結(jié)果,灰色實線為γ分布擬合結(jié)果.
圖2 船舶到達間時距分布擬合結(jié)果
完整的卡方擬合優(yōu)度檢驗結(jié)果見表2,取顯著性水平為1%,當(dāng)p值大于1%時假設(shè)不被拒絕,即船舶到達規(guī)律服從所檢驗分布.由檢驗結(jié)果可知,3種分布函數(shù)均沒有全部通過擬合優(yōu)度檢驗.相較之下,廣為接受的埃爾朗分布在3種分布中表現(xiàn)結(jié)果最差,9個泊位中7個未通過檢驗;γ分布表現(xiàn)稍優(yōu),6個泊位未通過檢驗;而對數(shù)正態(tài)分布的擬合結(jié)果在3者中最優(yōu),9個泊位中僅3個未通過檢驗,且其卡方值在同樣自由度下均小于相應(yīng)的埃爾朗分布(平均減少37.38%)和γ分布的卡方值(平均減少24.26%).
表2 擬合優(yōu)度檢驗結(jié)果
1) 使用埃爾朗分布對9組數(shù)據(jù)進行擬合,只有2組通過檢驗;使用γ分布只有3組通過檢驗;而使用對數(shù)正態(tài)分布有6組數(shù)據(jù)通過檢驗;
2) 在全部9組樣本中,使用對數(shù)正態(tài)分布進行擬合所得到的卡方值均最小,結(jié)果較埃爾朗分布平均提高37.38%,較γ分布平均提高24.26%;
3) 三種分布的擬合結(jié)果均未實現(xiàn)全部通過,分析認(rèn)為船舶到泊間時距的分布特征與船舶交通繁忙程度緊密相關(guān),而三種分布針對船舶交通較繁忙泊位的船舶到達間時距分布擬合結(jié)果均不理想.
因此綜合認(rèn)為,對數(shù)正態(tài)分布在擬合港口泊位船舶到達間時距分布規(guī)律上,相對傳統(tǒng)的埃爾朗分布和γ分布具有一定的優(yōu)越性;在研究不同類型的泊位時,對數(shù)正態(tài)分布均有更好的擬合結(jié)果,模型具有普適性.但在分析了檢驗通過組的樣本數(shù)后發(fā)現(xiàn),當(dāng)樣本數(shù)過大時,雖然對數(shù)正態(tài)分布模型的擬合結(jié)果最優(yōu),但也無法通過檢驗,顯示了簡單的分布模型在面對交通負(fù)荷較大情況時的局限性.
探尋擬合結(jié)果更優(yōu)的港口泊位船舶到達間時距分布模型,綜合分析傳統(tǒng)模型的局限性后引入了對數(shù)正態(tài)分布模型,并以天津港過往3年數(shù)據(jù)為作為實例.同時,為確保結(jié)論的普適性,避免因船型差異造成影響,分別篩選了多個散貨、集裝箱和油船泊位進行驗證.實例驗證結(jié)果表明,對數(shù)正態(tài)分布在擬合港口泊位船舶到達規(guī)律上,相對傳統(tǒng)的埃爾朗分布和γ分布具有一定的優(yōu)越性;在研究不同類型的泊位時,對數(shù)正態(tài)分布均有更好的擬合結(jié)果.但在交通負(fù)荷較大情況時,對數(shù)正態(tài)分布擬合結(jié)果也不理想.后續(xù)研究可重點針對這一局限性展開.
[1] 候海強,余玉歡,嚴(yán)新平,等.橋區(qū)航道船舶通過能力仿真[J].大連海事大學(xué)學(xué)報,2015,41(1):27-21.
[2] 劉亮,劉敬賢,譚志榮.荊州長江大橋船舶到達規(guī)律分析及檢驗[J].大連海事大學(xué)學(xué)報,2010,36(4):8-10.
[3] 劉敬賢,李云斌.天津港主航道船舶到達規(guī)律的統(tǒng)計分析[J].武漢理工大學(xué)學(xué)報(交通科學(xué)與工程版),2008,32(2):351-353.
[4] KOZAN T. Comparison of analytical and simulation planning models of seaport container terminals [J]. Transportation Planning and Technology,1997,20:235-248.
[5] NORITAKE A, KIMURA S. Optimum number and capacity of seaport berth [J]. Journal of Waterway Port Coastal and Ocean Engineering,1983,109(3):323-329.
[6] 張魯寧,王諾,陳爽.集裝箱班輪到港規(guī)律實證研究[J].大連海事大學(xué)學(xué)報,2012,38(1):47-49.
[7] 王諾,徐靈杰,宋南奇,等.集裝箱班輪到港規(guī)律的分布函數(shù)及實證研究[J].大連海事大學(xué)學(xué)報,2013,39(4):107-110.
[8] WU K H. A case study of inter-arrival time distributions of container ships [J]. Journal of Marine Science and Technology,2006,14(3):155-164.
[9] 黃顯鑫,邵哲平,紀(jì)賢標(biāo),等.廈門港主航道船舶間時距概率分布特性[J].中國航海,2014,37(4):74-78.
[10] 于洋.對數(shù)正態(tài)分布的幾個性質(zhì)及其參數(shù)估計[J].廊坊師范學(xué)院學(xué)報(自然科學(xué)版),2011,11(5):8-11.
[11] GREENBERG A. The log normal distribution of headways[J]. Australian Road Research,1966,2(7):14-18.
[12] KUMAR R. Headway and speed studies on two-lane highways[J]. Indian Highways,1998(5):23-36.
[13] GHAMDI A. Analysis of time headways on urban roads: case study from Riyadh[J]. Journal of Transportation Engneering,2001,127(4):289-294.
[14] 初秀民,李祎承,余玉歡.長江中下游航道通過能力計算方法[J].交通運輸系統(tǒng)工程與信息,2014,14(2):213-219.
[15] 吳兆麟,朱軍.海上交通工程[M].大連:大連海事大學(xué)出版社,2004.
[16] 陳嬌.城市快速路車頭時距特征分析[D].長春:吉林大學(xué),2012.
[17] 陳盼盼.對數(shù)正態(tài)分布參數(shù)的線性貝葉斯估計及其優(yōu)良性[D].北京:北京交通大學(xué),2015.