羅小強(qiáng)
(長(zhǎng)安大學(xué)建筑學(xué)院,西安710064)
出行分布觀測(cè)數(shù)據(jù)中的稀疏矩陣問題研究
羅小強(qiáng)*
(長(zhǎng)安大學(xué)建筑學(xué)院,西安710064)
對(duì)出行分布觀測(cè)數(shù)據(jù)中的稀疏矩陣問題進(jìn)行分析,提出了部分矩陣估計(jì)、補(bǔ)零矩陣估計(jì)和增量矩陣估計(jì)3種不同方法來標(biāo)定雙約束重力模型的參數(shù).通過定義估計(jì)的精確性和有效性兩個(gè)不同的估計(jì)效果測(cè)度,將雙約束重力模型等價(jià)為帶有約束的數(shù)學(xué)規(guī)劃,并采用解析方法比較3種不同標(biāo)定方法的估計(jì)精度差異.在此基礎(chǔ)上,通過數(shù)值方法模擬計(jì)算,并比較3種標(biāo)定方法的估計(jì)有效性.通過研究可以發(fā)現(xiàn),補(bǔ)零矩陣估計(jì)的參數(shù)精確性最好,而增量矩陣估計(jì)的有效性最好.研究成果能夠作為實(shí)際城市交通規(guī)劃中觀測(cè)稀疏矩陣參數(shù)標(biāo)定工作的理論依據(jù).
城市交通;稀疏矩陣;參數(shù)標(biāo)定;重力模型;誤差估計(jì)
在城市交通規(guī)劃實(shí)踐中,通過實(shí)際調(diào)查所得到的出行矩陣往往含有很多零元.假如某城市共劃分了100個(gè)交通小區(qū),每個(gè)交通小區(qū)平均2萬人左右.若為分析需要而劃分了9種出行目的、5個(gè)出行時(shí)段及7種交通方式,那么在分目的分時(shí)段分方式的出行矩陣分析中要使每個(gè)點(diǎn)對(duì)之間至少有一次出行被觀測(cè)到,觀測(cè)出行量至少為315萬人次.但總的出行量即使按照2.5人次/人·日計(jì)算,一天也不過500萬人次,加之出行分布在空間上的不均勻性,故觀測(cè)矩陣毫無疑問地會(huì)存在很多零元.
由于從出行生成到出行分布的預(yù)測(cè)分析過程主要是一種乘積運(yùn)算,這就意味著觀測(cè)矩陣中的零元將被保持到對(duì)未來的估計(jì)中去.這明顯有悖于常識(shí).為了避免這樣的情形出現(xiàn),實(shí)踐中有三種可行的方法用以解決這一問題:
(1)部分矩陣法[1]:將含有大量零元的觀測(cè)矩陣視為部分矩陣來估計(jì)參數(shù),而后用模型估計(jì)整個(gè)矩陣,并將其視為觀測(cè)矩陣的“真實(shí)態(tài)”.這種辦法顯然損失了零元部分的阻抗信息.
(2)補(bǔ)零矩陣法[1]:采用一個(gè)較小的數(shù)來替換零元.但這樣的方法對(duì)實(shí)際觀測(cè)矩陣而言,無疑是一種結(jié)構(gòu)上的變形.
(3)增量矩陣法:采用一個(gè)全部單元格都為相同較小數(shù)的滿陣與原觀測(cè)矩陣相加.顯然這種辦法能夠最大程度地保留原有分布結(jié)構(gòu).
那么,當(dāng)面對(duì)稀疏矩陣時(shí)應(yīng)該如何選擇合理的標(biāo)定方法就成了交通需求預(yù)測(cè)理論與實(shí)踐過程中亟待解決的問題.
重力模型的參數(shù)標(biāo)定并不是一個(gè)新問題,早在上世紀(jì)70年代Williams I[2]就提出了受Hyman M[3]啟發(fā)的采用平均阻抗為收斂性判據(jù)的參數(shù)標(biāo)定算法,在實(shí)際中得到相當(dāng)廣泛的應(yīng)用.近些年來,隨著交通規(guī)劃建模技術(shù)的廣泛應(yīng)用,對(duì)一些非常規(guī)狀態(tài)下的重力模型參數(shù)標(biāo)定問題有很多新的研究成果.Lam W等對(duì)部分觀測(cè)矩陣和交通量的組合估計(jì)提出了一種隨機(jī)校準(zhǔn)方法[4].Celik M證明了重力模型的標(biāo)定中小樣本觀測(cè)數(shù)據(jù)與大樣本觀測(cè)數(shù)據(jù)同樣有效[5].Foulds H.等針對(duì)出行矩陣觀測(cè)數(shù)據(jù)中的不完備和不精確問題提出了模糊逐次線性逼近的標(biāo)定算法[6].Guo A等提出了對(duì)數(shù)線性回歸方法用以估計(jì)矩陣缺失數(shù)據(jù)[].這些研究成果都涉及到了實(shí)踐中出行矩陣的標(biāo)定問題,但對(duì)于城市交通規(guī)劃中經(jīng)常遇到的稀疏矩陣問題還缺少與實(shí)踐相對(duì)應(yīng)的分析成果.實(shí)際上在交通規(guī)劃理論的發(fā)展過程中,稀疏矩陣的問題被提出了很長(zhǎng)時(shí)間[1,8],但由于實(shí)踐中重力模型不需要完整的觀測(cè)數(shù)據(jù)也能進(jìn)行標(biāo)定,所以這一問題在實(shí)踐中往往被忽視.
本文從重力模型參數(shù)估計(jì)的有效性和精確性兩個(gè)不同的效果出發(fā),對(duì)出行分布觀測(cè)數(shù)據(jù)中的稀疏矩陣問題進(jìn)行了分析,并通過對(duì)重力模型作等價(jià)數(shù)學(xué)規(guī)劃變換,用拉格朗日乘數(shù)法分析了對(duì)觀測(cè)稀疏矩陣的三種不同處理方法的參數(shù)估計(jì)精確性,最后通過數(shù)值計(jì)算比較了三種不同處理方法的參數(shù)估計(jì)有效性.研究結(jié)論表明,參數(shù)估計(jì)的精確性和有效性并不一致,增量矩陣的估計(jì)精度最高,但補(bǔ)零矩陣的有效性最好.本文研究結(jié)論可以作為實(shí)踐中觀測(cè)稀疏矩陣參數(shù)標(biāo)定的理論依據(jù).
為了分析問題,定義真實(shí)的出行分布所定義的矩陣結(jié)構(gòu)為“原象”,記為A;通過居民出行調(diào)查所得到的觀測(cè)結(jié)果為“觀測(cè)矩陣”,記為A0;對(duì)觀測(cè)矩陣中原來為零的單元加上小量a后得到的矩陣稱為“補(bǔ)零矩陣”,記為A1;對(duì)全部單元都加上小量a后得到的矩陣稱為“增量矩陣”,記為A2.
那么現(xiàn)在需要比較通過A1和A2標(biāo)定所得到的重力模型參數(shù)與原象矩陣參數(shù)的相對(duì)關(guān)系.但前提條件是雙約束重力模型相對(duì)于待標(biāo)定參數(shù)而言是單調(diào)增的.為了便于問題表述,假定雙約束重力模型的阻抗函數(shù)為
式中f(xij)為交通小區(qū)i到j(luò)的交通阻抗,由費(fèi)用、時(shí)間和距離等表達(dá);θ為待定系數(shù).
2.1 重力模型的單調(diào)性
按照交通規(guī)劃理論,一般雙約束重力模型可以寫為
式中qij為交通小區(qū)i到j(luò)的估計(jì)出行量;Oi為交通小區(qū)i的出行發(fā)生量;Dj為交通小區(qū)j的出行吸引量.
將qij視為關(guān)于θ的函數(shù),對(duì)式(2)兩端求關(guān)于θ的導(dǎo)數(shù),得到
考慮到模型的實(shí)際意義,顯然有Oi>0,Dj>0,cij>0成立.故?qij?θ<0成立.即qij是關(guān)于參數(shù)θ的單調(diào)減函數(shù).
2.2 阻抗函數(shù)的一般形式
假設(shè)矩陣的所有單元可以劃分為兩個(gè)集合,分別記為S和U.其中S代表觀測(cè)矩陣中不為0的單元所組成的集合,U代表觀測(cè)矩陣中為0的單元所組成的集合.則平均費(fèi)用函數(shù)為
式中a和b分別為對(duì)非0單元和0單元的調(diào)整量,顯然有a≥0 a≥0且b≥0b≥0成立.
不妨稱式(6)為費(fèi)用函數(shù)的一般形式,容易看出:當(dāng)a=b=0時(shí)為觀測(cè)矩陣的平均費(fèi)用函數(shù)0,當(dāng)a=0,b>0時(shí)為補(bǔ)零矩陣的平均費(fèi)用函數(shù)1,當(dāng)a>0,b>0時(shí)為增量矩陣的費(fèi)用函數(shù)2.
其中,出行量的估計(jì)值通過式(9)~式(11)計(jì)算得到.
這樣就建立了出行觀測(cè)量與參數(shù)之間的關(guān)系.
2.3 參數(shù)估計(jì)有效性和精確性
盡管重力模型的參數(shù)標(biāo)定是依靠迭代求得估計(jì)值所對(duì)應(yīng)的估計(jì)平均費(fèi)用與觀測(cè)平均費(fèi)用盡量靠近時(shí)所對(duì)應(yīng)的參數(shù).然而,通過迭代所得出的參數(shù)估計(jì)值盡管可能具有較高的精確性,但不一定有對(duì)預(yù)測(cè)工作來說具有有效性.在預(yù)測(cè)理論中,估計(jì)參數(shù)的精確性和有效性是兩個(gè)不同的概念[9].陳華友最早提出了預(yù)測(cè)有效度概念[10].受此啟發(fā),給出估計(jì)的精確性和有效性的定義.
定義1參數(shù)估計(jì)的精確性:將根據(jù)對(duì)現(xiàn)象的觀察所標(biāo)定的參數(shù)值與客觀上存在的參數(shù)值之間的接近程度定義為參數(shù)估計(jì)的精確性[11].一般情況下,采用參數(shù)的估計(jì)值與真值之間的相對(duì)距離來表示,即
式中δk為稀疏矩陣的不同處理方法所導(dǎo)致的參數(shù)估計(jì)誤差,下標(biāo)k為0代表觀測(cè)矩陣、為1代表補(bǔ)零矩陣、為2代表增量矩陣;為原象矩陣所對(duì)應(yīng)的參數(shù)估計(jì)值,可以視為參數(shù)估計(jì)的真值;k為稀疏矩陣的第k種處理方法所得到的參數(shù)估計(jì)值.
定義2參數(shù)估計(jì)的有效性:應(yīng)用參數(shù)估計(jì)出行矩陣時(shí)估計(jì)出行量與實(shí)際出行量之間的差距[12,13].定義估計(jì)的有效性為[14]
式中Δk為稀疏矩陣的不同處理方法所導(dǎo)致的出行量估計(jì)誤差,下標(biāo)k為0代表觀測(cè)矩陣、為1代表補(bǔ)零矩陣、為2代表增量矩陣;tij為原象矩陣第i行、j列的出行量,可以視為矩陣估計(jì)的真值;ij,k為稀疏矩陣的第k種處理方法所得到的第i行、j列的出行量的估計(jì)值;n為出行矩陣的維數(shù).
按照交通規(guī)劃理論,式(2)~式(4)所表達(dá)的雙約束重力模型與式(14)~式(18)是等價(jià)的[15].
式中Q為出行總量,那么采用拉格朗日乘數(shù)法將式(14)~式(18)轉(zhuǎn)化為無約束極值問題,即
式中λi,μj為拉格朗日系數(shù).
同理,對(duì)于觀測(cè)矩陣而言,其無約束極值問題為
同理,對(duì)于補(bǔ)零矩陣而言,其無約束極值
同理,對(duì)于增量矩陣而言,其無約束極值問題為
由于雙約束重力模型的結(jié)構(gòu)形式較為復(fù)雜,要從解析角度進(jìn)行參數(shù)的有效性估計(jì)是十分困難的.但通過數(shù)值運(yùn)算模擬的辦法則相對(duì)較為可行.借助一個(gè)簡(jiǎn)單的算例來分析稀疏矩陣估計(jì)中不同處理方法的有效性差異.
假設(shè)有如圖1所示的交通小區(qū)劃分,各小區(qū)之間的出行阻抗如表1所示,(觀測(cè))部分矩陣為表2,其所對(duì)應(yīng)的出行矩陣原象如表3所示.表4和表5分別為補(bǔ)零矩陣和增量矩陣.
圖1 交通小區(qū)劃分Fig.1 Traffic zone division
表1 阻抗矩陣Table 1Impedance matrix
表2 (觀測(cè))部分矩陣Table 2Segment matrix(observation)
表3 原象矩陣Table 3The original matrix
表4 補(bǔ)零矩陣Table 4Zero padding matrix
表5 增量矩陣Table 5Incremental matrix
需要說明的是,對(duì)于圖1所示的交通小區(qū)劃分而言,其阻抗是固定不變的,而其原象矩陣可以視為在實(shí)際中真實(shí)發(fā)生的出行分布情況.要了解出行分布狀況,就需要對(duì)出行的分布進(jìn)行觀測(cè).但需要注意的是,這樣的觀測(cè)往往是不完備的.
按照三種不同的處理方式得到的參數(shù)估計(jì)結(jié)果與原象矩陣的估計(jì)結(jié)果比較如表6所示.
表6 參數(shù)標(biāo)定結(jié)果的精確性比較分析Table 6The accuracy comparative analysis of the calibration results of parameters
在表6中,分別列出了根據(jù)原象矩陣、部分矩陣、補(bǔ)零矩陣和增量矩陣分別進(jìn)行雙約束重力模型的標(biāo)定運(yùn)算之后的結(jié)果,為了比較參數(shù)標(biāo)定的結(jié)果,表6中同時(shí)也列出了相應(yīng)于模型參數(shù)估計(jì)值的平均費(fèi)用情況.
各個(gè)單元格的編號(hào)規(guī)則如表7所示.為了分析不同參數(shù)估計(jì)值在矩陣估計(jì)中的有效性,將上述依據(jù)原象矩陣、部分矩陣、補(bǔ)零矩陣和增量矩陣所估計(jì)得到的參數(shù)值代入模型當(dāng)中,并輸入阻抗矩陣計(jì)算得到各個(gè)單元格的估計(jì)出行量如表8所示.
表7 各個(gè)單元格的編號(hào)規(guī)則Table 7The numbering rule of each cell
從計(jì)算結(jié)果上來看,不同參數(shù)值的雙約束重力模型估計(jì)結(jié)果表明:采用原象矩陣、部分矩陣、補(bǔ)零矩陣和增量矩陣估計(jì)得到的不同參數(shù)應(yīng)用于模型之后所得到的出行矩陣估計(jì)效果是不同的.這種差距最主要地表現(xiàn)在估計(jì)出行量與實(shí)際中真實(shí)發(fā)生的原象之間的差距上.
從結(jié)果上來看,就估計(jì)的有效性而言,補(bǔ)零矩陣>部分矩陣>增量矩陣.
該結(jié)果揭示了重力模型參數(shù)標(biāo)定并不唯一地依賴于對(duì)出行現(xiàn)象的觀測(cè)結(jié)果的準(zhǔn)確性.除了數(shù)據(jù)之外,還有一些模型本身的標(biāo)定算法及計(jì)算機(jī)存儲(chǔ)的舍入等因素對(duì)參數(shù)標(biāo)定的結(jié)果起著不可忽略的作用[16,17].
表8 不同參數(shù)值的出行矩陣估計(jì)結(jié)果的有效性分析Table 8The efficiency analysis of the trip matrix estimation results about different parameter values
本文通過對(duì)出行分布觀測(cè)中常見的稀疏矩陣問題的三種不同處理方式(部分矩陣法、補(bǔ)零矩陣法、增量矩陣法)的比較分析和數(shù)值計(jì)算,得到以下幾點(diǎn)研究結(jié)論:
(1)從精確性的角度來看,增量矩陣法相對(duì)于補(bǔ)零矩陣法、部分矩陣法具有優(yōu)勢(shì),盡管在數(shù)值計(jì)算的過程中展現(xiàn)出的優(yōu)勢(shì)相對(duì)比較微弱.但也有可能隨著所研究矩陣的維數(shù)增加而表現(xiàn)地更為顯著.
(2)從有效性的角度來看,補(bǔ)零矩陣法比增量矩陣法和部分矩陣法更有優(yōu)勢(shì).
(3)雖然本文對(duì)稀疏矩陣的處理方法問題作了一定辨析,但依然存在很多尚未解決的問題.例如:不同維數(shù)矩陣、不同標(biāo)定算法結(jié)構(gòu)、不同計(jì)算精度要求等情況下三種處理方法的差別等等.這些問題還需要更進(jìn)一步的分析和研究.
[1]毛保華,曾會(huì)欣,袁振洲.交通規(guī)劃模型及其應(yīng)用[M].北京:中國(guó)鐵道出版社,1999.[MAO B H,ZENG H X, YUANZZ.Trafficplanningmodelandits application[M].Beijing:China Railway Press,1999.]
[2]Williams I.A comparison of some calibration techniques for doubly constrained models with an exponential cost function[J].Transportation Research,1976,10(2):91-104.
[3]Hyman M.The calibration of trip distribution models[J]. Environment and Planning,1969,1(3):105-112.
[4]Lam W,Huang H J.Calibration of the combined trip distribution and assignment model for multiple user classes[J].TransportationResearchPartB: Methodological,1992,26(4):289-305.
[5]Celik H M.Sample size needed for calibrating trip distribution and behavior of the gravity model[J].Journal of Transport Geography,2010,18(1):183-190.
[6]Foulds H,Nascimento D,Calixto I,et al.A fuzzy setbased approach to origin-destination matrix estimation inurbantrafficnetworkswithimprecisedata[J]. European Journal of Operational Research,2013,231 (1):190-201.
[7]Guo A,Shen Q,Gizem S.Origin-destination missing data estimation for freight transportation planning:a gravity model-based regression approach[J].General Information,2014,37(6):505-524.
[8]HensherD,ButtonK.Handbookoftransport modelling[M].Oxford,U.K.:Elsevier Science Ltd.,2000.
[9]郎茂祥,傅選義,朱廣宇.預(yù)測(cè)理論與方法[M].北京:清華大學(xué)出版社,北京交通大學(xué)出版社,2011. [LANG M X,FU X Y,ZHU G Y.Forecasting theory and method[M].Beijing:TsingHua University Press,Beijing Jiaotong University Press,2011.]
[10]陳華友.基于預(yù)測(cè)有效度的非負(fù)變權(quán)組合預(yù)測(cè)模型研究[J].運(yùn)籌與管理,2001,10(1):48-52.[CHEN H Y. Research on combination forecasting model with nonnegative and time-variant weights based on effective measure of forecasting methods[J].Operations Research and Management Science,2001,10(1):48-52.]
[11]王麗霞.概率論與數(shù)理統(tǒng)計(jì):理論、歷史及應(yīng)用[M].大連:大連理工大學(xué)出版社,2010.[WANG L X. Probability theory and mathematical statistics:Theory, history and application[M].Dalian:Dalian University of Technology Press,2010.]
[12]陳華友,侯定丕.基于預(yù)測(cè)有效度的優(yōu)性組合預(yù)測(cè)模型研究[J].中國(guó)科學(xué)技術(shù)大學(xué)學(xué)報(bào),2002,32(2):172-180.[CHEN H Y,HOU D P.Research on superior combination forecasting model based on forecasting effective measure[J].Journal of University of Science and Technology of China,2002,32(2):172-180.]
[13]陳華友,侯定丕.基于標(biāo)準(zhǔn)差的預(yù)測(cè)有效度的組合預(yù)測(cè)模型[J].系統(tǒng)工程學(xué)報(bào),2003,18(3):203-210+223. [CHEN H Y,HOU D P.Combination forecasting model based on forecasting effective measure with standard deviate[J].Journal of Systems Engineering,2003,18(3): 203-210+223.]
[14]張令剛,牛德寧,孟兆民.基于預(yù)測(cè)有效度的組合模型在交通量預(yù)測(cè)中的應(yīng)用[J].道路交通與安全,2010,10 (1):24-27.[ZHANG L G,NIU D Y,MENG Z M. Application of combination forecasting model based on effective measure in traffic volume forecasting[J].Road Traffic and Security,2010,10(1):24-27.]
[15]劉燦齊.現(xiàn)代交通規(guī)劃學(xué)[M].北京:人民交通出版社, 2001.[LIU C Q.Modern transportation planning[M]. Beijing:China Communications Press,2001.]
[16]陳國(guó)強(qiáng).精密運(yùn)動(dòng)控制、設(shè)計(jì)與實(shí)現(xiàn)(原書第2版)[M].北京:機(jī)械工業(yè)出版社,2011.[CHEN G Q.Precision motion control,the design and implementation(Version 2)[M].Beijing:China Machine Press,2011.]
[17]劉勝.最優(yōu)估計(jì)理論[M].北京:科學(xué)出版社,2011. [LIU S.The optimal estimation theory[M].Beijing: Science Press,2011.]
The Sparse Matrix Problem in Trip Distribution Observational Data
LUO Xiao-qiang
(School ofArchitecture,Chang'an University,Xi'an 710061,China)
The problem of sparse matrix in the trip distribution observational data are analyzed,and three different methods are put forward to calibrate the parameters of the double restraint gravitational model,as Parted Matrix Estimation,Zero Replaced Matrix Estimation and Incremental Matrix Estimation.By defining the Estimate Accuracy Index and the Estimate Effectiveness Index to measure the effects of estimation,this paper through the double restraint gravitational model equivalent mathematical programming with constraints,and compares three different analytical method of the estimation precision of the calibration method.On the basis of analysis,it used the methods of numerical simulation calculation,and contrasted the three estimation methods in accuracy and effectiveness.The conclusion finds that the calibration parameters by the method of the Zero Replaced Matrix Estimation have the best results in accuracy,and the calibration parameters by the method of the Incremental Matrix Estimation have the best results in effectiveness.The research results can be used as a theoretical basis of parameters calibration of observation sparse matrix in urban traffic planning in practical.
urban traffic;sparse matrix;parameter calibration;gravity model;error estimation
1009-6744(2015)05-0216-07
U491.1
A
2015-05-21
2015-07-25錄用日期:2015-08-11
中央高校基金(2013G1411077);陜西省社科基金(2014D39).
羅小強(qiáng)(1979-),男,陜西南鄭人,講師,博士. *
luoxq37@yeah.net