摘" 要:隨著城市交通出行規(guī)劃的日益發(fā)展,需要精細(xì)的居民交通出行數(shù)據(jù)作為數(shù)據(jù)支撐以實(shí)現(xiàn)更準(zhǔn)確的居民交通出行需求預(yù)測(cè)。文章基于多源數(shù)據(jù),包括地塊數(shù)據(jù)、居民交通出行樣本數(shù)據(jù)以及總?cè)丝诩彝ヌ卣鲾?shù)據(jù),采用迭代比例更新算法(Iterative Proportional Updating,IPU),結(jié)合蒙特卡洛模擬,實(shí)現(xiàn)了獲取小尺度的精細(xì)居民交通出行數(shù)據(jù)的目標(biāo),為精細(xì)交通出行數(shù)據(jù)的獲取提供了有益的參考和借鑒。
" 關(guān)鍵詞:交通數(shù)據(jù)獲取;IPU算法;精細(xì)位置匹配;出行數(shù)據(jù)擴(kuò)樣
" 中圖分類號(hào):F502" " 文獻(xiàn)標(biāo)志碼:A
DOI:10.13714/j.cnki.1002-3100.2024.21.019
Abstract: In order to obtain micro data containing precise location information, marginal constraints were obtained based on multi-source data such as plot data, household sample data, and total population household characteristic data. The Iterative Proportional Updating(IPU)algorithm, which is a micro data acquisition method, was used in conjunction with Monte Carlo simulation to expand the family sample data and obtain micro data with unmatched positions, construct a multiple Logit model based on capacity constraints, and perform position matching on micro data of unmatched positions to obtain small-scale fine micro data. The results show that the above methods can effectively obtain small-scale fine micro data, with relative errors of around 1.5% and 6% at the household and individual levels, respectively, meeting the accuracy requirements of data expansion and reflecting population distribution characteristics at a small scale.
Key words: traffic data acquisition; IPU algorithm; fine position matching; travel data expansion
0" 引" 言
交通需求預(yù)測(cè)在城市交通規(guī)劃中起著重要作用,它為未來(lái)出行需求提供了數(shù)據(jù)基礎(chǔ),提供投資決策、資源優(yōu)化管理建議,幫助緩解交通擁堵問(wèn)題,促進(jìn)交通運(yùn)輸業(yè)可持續(xù)發(fā)展,指導(dǎo)交通基礎(chǔ)設(shè)施建設(shè)。通過(guò)對(duì)交通需求的預(yù)測(cè)和分析,規(guī)劃者可以做出合理的決策,優(yōu)化交通系統(tǒng)的布局和運(yùn)行,實(shí)現(xiàn)城市交通的可持續(xù)發(fā)展。
基于活動(dòng)的微觀模擬可以精確預(yù)測(cè)交通出行需求,該方法是對(duì)個(gè)體行為進(jìn)行研究的分析方法,主要是從人們?nèi)粘I钪械幕顒?dòng)出發(fā),通過(guò)對(duì)活動(dòng)需求分析來(lái)推測(cè)人們的出行需求,從而提高交通規(guī)劃的科學(xué)性和針對(duì)性。但基于活動(dòng)的交通出行模擬通常受到交通出行數(shù)據(jù)的限制。交通出行數(shù)據(jù)包含存在于特定空間區(qū)域中人口的基本信息,包括性別、年齡、職業(yè)和居住、出行活動(dòng)、婚育和家庭結(jié)構(gòu)等,是城市交通規(guī)劃、土地利用等研究中的重要內(nèi)容。在國(guó)內(nèi)外,通常由于個(gè)人和家庭微觀數(shù)據(jù)的隱私性而無(wú)法獲得交通出行數(shù)據(jù)。
在國(guó)外,許多學(xué)者通過(guò)不同方法進(jìn)行數(shù)據(jù)獲取。Rich et al.[1]設(shè)計(jì)了一個(gè)人口合成框架,包括目標(biāo)協(xié)調(diào)、矩陣擬合、家庭和個(gè)體的模擬以及最終人口的重新加權(quán)等合成階段,預(yù)測(cè)了整個(gè)丹麥的人口。Moreno et al.[2]采用改進(jìn)的迭代比例更新和蒙特卡羅抽樣算法,合成了慕尼黑市的詳細(xì)人口屬性數(shù)據(jù),具有高效性和可擴(kuò)展性。Huang et al.[3]通過(guò)迭代比例擬合(IPF)算法,基于從德國(guó)住宅能源消費(fèi)調(diào)查和德國(guó)人口普查數(shù)據(jù),生成合成人口。Borysov et al.[4]提出一種基于變分自動(dòng)編碼器的深度生成建模方法,相比傳統(tǒng)方法具有更好的可擴(kuò)展性和零樣本采樣能力,支持更豐富的人口合成。H?rl et al.[5]利用開(kāi)放數(shù)據(jù)和開(kāi)放軟件生成巴黎及其周邊區(qū)域的人工數(shù)據(jù),包括個(gè)人家庭、人員和每日活動(dòng)鏈。Fabrice et al.[6]介紹了目前主流的合成人口方法,包括合成重構(gòu)、組合優(yōu)化和統(tǒng)計(jì)學(xué)習(xí),通過(guò)對(duì)其方法的描述和比較,提供了選擇合適方法的建議。Chapuis et al.[7]設(shè)計(jì)了Gen*模型,可以在基于代理的建模和仿真平臺(tái)中直接生成、定位和構(gòu)建具有社交網(wǎng)絡(luò)的合成人口,解決了社會(huì)模擬領(lǐng)域中初始人口的問(wèn)題。Boyam et al.[8]使用四種合成重構(gòu)方法合成人口數(shù)據(jù),結(jié)果表明最佳方法是迭代比例擬合和相對(duì)熵最小化算法。Milos et al.[9]基于加利福尼亞地區(qū)數(shù)據(jù)使用人口合成工具Popgen得到了適用于基于代理的交通模型的人口數(shù)據(jù)。
在國(guó)內(nèi),龍瀛等[10]提出了一種利用開(kāi)放數(shù)據(jù)、自動(dòng)空間化和合成人口屬性的方法,來(lái)合成北京市的人口微觀全樣本。杭軒等[11]利用國(guó)內(nèi)統(tǒng)計(jì)年鑒數(shù)據(jù)獲取各類屬性的邊際約束,結(jié)合居民出行調(diào)查數(shù)據(jù)通過(guò)IPU算法并使用蒙特卡洛法,最終獲取綿陽(yáng)市的居民個(gè)體屬性數(shù)據(jù)。洪曉龍[12]以居民出行調(diào)查為基礎(chǔ),針對(duì)居民出行數(shù)據(jù)的多目標(biāo)優(yōu)化問(wèn)題提出綜合校核擴(kuò)樣流程算法,并以烏魯木齊2014年調(diào)查數(shù)據(jù)為例驗(yàn)證了算法和流程的應(yīng)用效果。葉佩軍[13]基于DISC性格理論并采用馬爾科夫鏈將代理的微觀決策參數(shù)和宏觀分布特征相結(jié)合,構(gòu)建人工人口計(jì)算模擬系統(tǒng),研究基本人口屬性的演化趨勢(shì)并驗(yàn)證人口合成與參數(shù)標(biāo)定方法的正確性。雷煥宇等[14]在傳統(tǒng)IPU算法的基礎(chǔ)上,介紹了一種ExtendedIPU算法,可以從不同地理層級(jí)進(jìn)行人口合成,更加精準(zhǔn)、科學(xué)合理地反映城市的人口和家庭情況。郭莉等[15]考慮不同片區(qū)的人均手機(jī)擁卡數(shù)以及運(yùn)營(yíng)商占有率情況,采用分區(qū)擴(kuò)樣的方式進(jìn)行擴(kuò)樣,對(duì)于不同的出發(fā)地和目的地采用不同約束擴(kuò)樣。朱海明等[16]結(jié)合牛頓迭代法、多源數(shù)據(jù)融合、家庭戶及人口特征雙重約束,以天津?yàn)I海新區(qū)調(diào)查數(shù)據(jù)為例驗(yàn)證了該方法的高效、高精度和易推廣性。李丁杰等[17]通過(guò)深圳市居民出行入戶調(diào)查數(shù)據(jù)實(shí)證分析比較IPU算法和GRE算法擴(kuò)樣結(jié)果,證明IPU算法更優(yōu)越、更有普適性。陳小鴻等[18]利用手機(jī)信令數(shù)據(jù)設(shè)計(jì)了相應(yīng)的擴(kuò)樣模型結(jié)構(gòu)進(jìn)行居民出行調(diào)查擴(kuò)樣和挖掘沉默出行需求,結(jié)果表明新模型在揭示沉默出行需求方面效果顯著。吳煥等[19]提出了一種綜合擴(kuò)樣方法,從戶擴(kuò)樣、戶擁車調(diào)整、人擴(kuò)樣、人口調(diào)整和出行擴(kuò)樣等多個(gè)方面進(jìn)行組合,解決了居民出行調(diào)查中隨機(jī)抽樣困難和沉默需求增加的問(wèn)題。王媛[20]基于居民出行調(diào)查和學(xué)生家庭調(diào)查數(shù)據(jù),按照家庭屬性和個(gè)人屬性進(jìn)行分層加權(quán)擴(kuò)樣,為研究提供更準(zhǔn)確的數(shù)據(jù)。但這些方法獲取到的個(gè)人和家庭數(shù)據(jù)的地理屬性只能精確到街道、行政區(qū)和居委會(huì),無(wú)法匹配更精確的位置,不能在小尺度上反映人口分布特征,不能得到更加精細(xì)的交通出行數(shù)據(jù)。在城市道路網(wǎng)越發(fā)復(fù)雜的今天,地理屬性更加精細(xì)的交通出行數(shù)據(jù)能夠給基于活動(dòng)的微觀模擬帶來(lái)更加精確的交通出行需求預(yù)測(cè)結(jié)果,從而給城市交通規(guī)劃提供更精確、更有力的數(shù)據(jù)支撐。
為克服更加精細(xì)的交通出行數(shù)據(jù)難以獲取這一局限性,可先通過(guò)IPU算法獲取交通出行數(shù)據(jù),再基于研究區(qū)域的房?jī)r(jià)數(shù)據(jù)、人口數(shù)據(jù)等,通過(guò)有容量限制的多項(xiàng)Logit模型給交通出行數(shù)據(jù)進(jìn)行精細(xì)位置匹配獲取更加精細(xì)的交通出行數(shù)據(jù)。
1" 數(shù)據(jù)準(zhǔn)備
1.1" 多源數(shù)據(jù)獲取及預(yù)處理
以武漢市經(jīng)開(kāi)區(qū)部分區(qū)域作為研究區(qū)域,結(jié)合武漢市規(guī)劃圖將研究區(qū)域劃分為若干地塊,地塊的地理層級(jí)小于街道。
本文所需數(shù)據(jù)主要包括地塊及建筑物數(shù)據(jù)、樣本家庭數(shù)據(jù)、WorldPop數(shù)據(jù)、平均房?jī)r(jià)數(shù)據(jù)和總?cè)丝诩彝ヌ卣鲾?shù)據(jù)。
(1)建筑物數(shù)據(jù)
" 建筑物數(shù)據(jù)包括研究區(qū)域建筑物類型、建筑物層數(shù)、建筑物修建年、地塊和建筑物邊界信息,通過(guò)線上調(diào)查、線下調(diào)查和在線數(shù)字地圖、房屋管理局網(wǎng)頁(yè)得到。該數(shù)據(jù)主要用于計(jì)算每個(gè)地塊的居住人口數(shù)據(jù)。
" (2)樣本家庭數(shù)據(jù)
" 樣本家庭數(shù)據(jù)是研究區(qū)域家庭及個(gè)人的樣本數(shù)據(jù)信息,通過(guò)線上、線下問(wèn)卷調(diào)查和居民信息收集得到,樣本總量為研究區(qū)域家庭數(shù)據(jù)總量3%左右,對(duì)樣本家庭數(shù)據(jù)進(jìn)行處理,篩除無(wú)效數(shù)據(jù)、重復(fù)數(shù)據(jù),通過(guò)信度分析檢驗(yàn)可信度,當(dāng)數(shù)據(jù)信度滿足此要求后方可使用。該數(shù)據(jù)作為反演人口的初始數(shù)據(jù)。
" (3)WorldPop數(shù)據(jù)
" WorldPop數(shù)據(jù)是南安普頓大學(xué)發(fā)起的全球人口數(shù)據(jù)評(píng)估,其中國(guó)內(nèi)人口分布數(shù)據(jù)是基于第六次人口普查數(shù)據(jù)對(duì)2020年中國(guó)人口分布的預(yù)測(cè)數(shù)據(jù),通過(guò)WorldPop官網(wǎng)獲得。該數(shù)據(jù)用于結(jié)合第七次人口普查數(shù)據(jù)進(jìn)行數(shù)據(jù)修正。
" (4)平均房?jī)r(jià)數(shù)據(jù)
" 平均房?jī)r(jià)數(shù)據(jù)是每個(gè)地塊對(duì)應(yīng)的房屋平均每平方售價(jià),通過(guò)爬取房?jī)r(jià)網(wǎng)站獲取每個(gè)地塊的房?jī)r(jià)信息,再對(duì)每個(gè)地塊的房?jī)r(jià)信息取平均獲得,該數(shù)據(jù)用于作為容量限制的多項(xiàng)Logit模型中的標(biāo)定數(shù)據(jù)。
" (5)總?cè)丝诩彝ヌ卣鲾?shù)據(jù)
" 總?cè)丝诩彝ヌ卣鲾?shù)據(jù)包括人口年齡構(gòu)成、人口性別構(gòu)成、家庭平均人口數(shù)、經(jīng)開(kāi)區(qū)總?cè)丝跀?shù)、家庭戶規(guī)模構(gòu)成和不同收入人群構(gòu)成等,通過(guò)統(tǒng)計(jì)年鑒與人口普查數(shù)據(jù)獲取。該數(shù)據(jù)用于獲取研究區(qū)域的邊際約束。
" 各類數(shù)據(jù)說(shuō)明如表1所示。
1.2" 基于多源數(shù)據(jù)獲取邊際約束
" 由于研究區(qū)域是行政區(qū)域的一部分,不能直接獲取研究區(qū)域的人口總數(shù),也不能直接獲取每個(gè)地塊的人口數(shù),因此需要通過(guò)一定方法獲取?;舅悸啡缦拢?/p>
基于建筑物數(shù)據(jù)計(jì)算獲得每個(gè)地塊的人口分布數(shù)據(jù),即各地塊人口數(shù)和研究區(qū)域總?cè)丝跀?shù),但該數(shù)據(jù)可能存在偏差,需要通過(guò)別的數(shù)據(jù)進(jìn)行驗(yàn)證。WorldPop數(shù)據(jù)是基于第六次人口普查數(shù)據(jù)獲得的中國(guó)人口分布預(yù)測(cè)數(shù)據(jù),可通過(guò)第七次人口普查數(shù)據(jù)對(duì)其進(jìn)行修正得到較為準(zhǔn)確的人口分布數(shù)據(jù),該數(shù)據(jù)可作為驗(yàn)證數(shù)據(jù)。將修正后的WorldPop數(shù)據(jù)用于校正人口分布數(shù)據(jù),得到最終人口分布數(shù)據(jù),通過(guò)最終人口分布數(shù)據(jù)和總?cè)丝诩彝ヌ卣鲾?shù)據(jù)得到邊際約束。具體技術(shù)路線如圖1所示。
(1)基于建筑物數(shù)據(jù)計(jì)算得到人口分布數(shù)據(jù)
" 將研究區(qū)域劃分成若干地塊,統(tǒng)計(jì)每個(gè)地塊上的居住建筑物,根據(jù)建筑物的修建年設(shè)置建筑物的入住率,建筑物的居住人口數(shù)計(jì)算公式如下:
P=POP·r·u·α" " " nbsp; " " " " " " " " (1)
式中:POP為家庭平均人口數(shù),r為層數(shù),u為每層居住單元數(shù),α為入住率。
" (2)WorldPop數(shù)據(jù)修正
獲取的WorldPop數(shù)據(jù)是基于第六次人口普查數(shù)據(jù)對(duì)2020年中國(guó)人口分布的預(yù)測(cè)數(shù)據(jù),為了得到與最新人口總量匹配的WorldPop數(shù)據(jù),則需用人口普查數(shù)據(jù)進(jìn)行修正。修正后的WorldPop柵格數(shù)據(jù)為原始柵格人口值乘以修正系數(shù)。修正系數(shù)計(jì)算公式如下:
γ=POP/POP" " " " " " " " " " " " " " " " " " " " " " "(2)
式中:γ為修正系數(shù),POP為研究區(qū)域的行政區(qū)域的人口普查總量,POP為基于WorldPop統(tǒng)計(jì)得到的行政區(qū)人口總量。
(3)校正人口分布數(shù)據(jù)及邊際約束計(jì)算
對(duì)修正后的WorldPop數(shù)據(jù)按照研究區(qū)域邊界進(jìn)行裁剪處理,可統(tǒng)計(jì)得到研究區(qū)域的人口總量。最后,通過(guò)修正系數(shù)來(lái)校正基于建筑物數(shù)據(jù)計(jì)算得到的初始人口分布。
" 對(duì)比修正后的WorldPop數(shù)據(jù)和基于建筑物得到初始人口分布,若兩者之間的研究區(qū)域人口總量的相對(duì)誤差大于5%,則需要對(duì)初始人口分布進(jìn)行校正。相對(duì)誤差計(jì)算和校正公式如下:
相對(duì)誤差計(jì)算公式如下:
θ=
P
-P/P×100%" " " " " " " " " " " " " " " " " " " " " (3)
式中:θ表示初始人口分布和修正過(guò)的WorldPop數(shù)據(jù)的相對(duì)誤差,反映初始人口分布的精度,P表示初始人口分布的總?cè)丝跀?shù),P表示修正過(guò)的WorldPop數(shù)據(jù)的總?cè)丝跀?shù)。
" 根據(jù)校正系數(shù),對(duì)初始人口分布中各地塊的總?cè)丝跀?shù)進(jìn)行校正,校正公式如下:
P=P×P/P" " " " " " " " " " " " " " " " " " " " " " " (4)
式中:P表示修正后的人口分布中第i個(gè)地塊的總?cè)丝跀?shù),P表示初始人口分布的總?cè)丝跀?shù),P表示修正過(guò)的WorldPop數(shù)據(jù)的總?cè)丝跀?shù),P表示初始人口分布中第i個(gè)地塊的總?cè)丝跀?shù)。
" 通過(guò)最終人口分布數(shù)據(jù)得到研究區(qū)域人口總量,并基于人口家庭特征數(shù)據(jù)得到邊際約束。
2" 基于IPU算法的人口數(shù)據(jù)反演
2.1" IPU算法
" 使用IPU算法作為交通出行數(shù)據(jù)獲取方法,IPU算法是一種滿足邊際分布的條件,還能更好地?cái)M合人口和家庭兩個(gè)維度方面的屬性分布的啟發(fā)式算法。杭軒等[11]使用IPU算法基于居民出行調(diào)查數(shù)據(jù)獲取了四川省綿陽(yáng)市49萬(wàn)居民的個(gè)體屬性數(shù)據(jù),本文同樣使用了IPU算法進(jìn)行交通出行數(shù)據(jù)獲取。
" IPU算法對(duì)樣本家庭表(不包含地塊編號(hào)屬性列)的屬性列進(jìn)行循環(huán)迭代, 當(dāng)?shù)螖?shù)達(dá)到最大值或擬合度優(yōu)化值Δ達(dá)到閾值時(shí),取此時(shí)的樣本家庭權(quán)重作為最終樣本家庭權(quán)重,基于最終樣本家庭權(quán)重通過(guò)蒙特卡洛模擬方法抽取樣本家庭表中的家庭獲得交通出行數(shù)據(jù)。具體步驟如下:
(1)設(shè)置i表示家庭的編號(hào),d表示第i個(gè)家庭的第j個(gè)屬性的數(shù)值,j為家庭及個(gè)人屬性的編號(hào),m為家庭及個(gè)人屬性的總數(shù),j=1,2,3,…,m,設(shè)置C為第j個(gè)屬性的邊際約束。
" (2)設(shè)置每個(gè)家庭及個(gè)人層面屬性初始權(quán)重為1,即w=1。
" (3)擬合度變量δ是完成一次迭代后計(jì)算得到的整體擬合度。迭代比例更新算法通過(guò)擬合度變量δ的計(jì)算作為對(duì)算法是否收斂的判斷,擬合度δ越小說(shuō)明結(jié)果越好。定義擬合度δ計(jì)算公式:
δ=" " " " " " " " " " " " " " " " " " " " (5)
" (4)設(shè)置r為迭代次數(shù),初始值為1。
(5)設(shè)置S為第j列所有不為0的行號(hào)的集合。
(6)設(shè)置k為第k個(gè)邊際約束,初始值為1。
" (7)設(shè)置s表示第k列的所有不為0的元素,q表示第k列的所有不為0的元素的索引。
" (8)對(duì)家庭及個(gè)人屬性列進(jìn)行迭代,通過(guò)權(quán)值調(diào)整修正系數(shù)計(jì)算公式和權(quán)值更新公式,基于個(gè)人屬性邊際約束對(duì)每列個(gè)人屬性不為0的行進(jìn)行權(quán)值調(diào)整。權(quán)值調(diào)整修正系數(shù)ρ計(jì)算公式為:
ρ=" " " " " " " " " " " " " " " " " " " " " " "(6)
" (9)權(quán)值更新公式為:
Ws =Ws×ρ" " " " " " " " " " " " " " " " " " " " " " " (7)
式中:Ws表示第k列更新前的權(quán)值,ρ表示權(quán)重修正系數(shù)。
" (10)k=k+1。
(11)若k≤m,則返回步驟(7),若kgt;m,則進(jìn)行步驟(12)。
" (12)設(shè)置δ表示本次權(quán)重更新記數(shù)后的擬合度,δ為上次權(quán)重更新記數(shù)后的擬合度。計(jì)算擬合度優(yōu)化值Δ,擬合度優(yōu)化值Δ計(jì)算公式為:
Δ=δ-δ" " " " " " " " " " " " " " " " " " " " " " " (8)
(13)r=r+1。
" (14)設(shè)置ε為收斂閾值,閾值一般設(shè)置為0.000 1。若Δgt;ε,則返回步驟(6),否則說(shuō)明算法已經(jīng)收斂。
在數(shù)據(jù)反演過(guò)程中,如果權(quán)重與個(gè)人總量完全匹配卻沒(méi)有和家庭總量完全匹配,會(huì)出現(xiàn)權(quán)重之和與設(shè)定的家庭總數(shù)不吻合的情況,這時(shí)需要優(yōu)先強(qiáng)調(diào)家庭層面的總量約束,再進(jìn)行一次家庭層面屬性列的權(quán)值更新,得到最終權(quán)重。樣本家庭權(quán)重表示例如表2所示。
2.2" 蒙特卡洛模擬
" 得到了每個(gè)樣本家庭的最終權(quán)重后,需要通過(guò)蒙特卡洛模擬根據(jù)研究區(qū)域家庭總數(shù)進(jìn)行數(shù)據(jù)擴(kuò)樣,獲取沒(méi)有精細(xì)位置的家庭交通出行數(shù)據(jù)。每個(gè)樣本家庭被選擇概率公式為:
P=w/∑w" " " " " " " " " " " " " " " (9)
" 式中:i表示第i個(gè)家庭,P表示第i個(gè)家庭被選擇的概率,w表示第i個(gè)家庭的權(quán)重,s表示家庭的總數(shù)。
" 最終,通過(guò)蒙特卡洛模擬基于樣本家庭數(shù)據(jù)和樣本家庭的最終權(quán)重得到研究區(qū)域家庭總數(shù)個(gè)家庭的不含地理屬性的交通出行數(shù)據(jù)。交通出行數(shù)據(jù)示例如表3所示。
3" 基于容量限制多項(xiàng)Logit模型的交通出行數(shù)據(jù)精細(xì)位置匹配
由于研究區(qū)域是行政區(qū)域的一部分,進(jìn)行地塊劃分后每個(gè)地塊的邊際約束同樣難以獲取,因此不能直接反映出每個(gè)家庭匹配位置信息,針對(duì)這個(gè)問(wèn)題,本文選擇構(gòu)建容量限制的多項(xiàng)Logit模型給獲得的交通出行數(shù)據(jù)匹配位置信息。
3.1" 多項(xiàng)Logit模型
多項(xiàng)Logit模型(Multinational Logit Model)基于隨機(jī)效用理論。為決策者的家庭(或個(gè)人、或組織)在一個(gè)可以選擇的、選擇項(xiàng)相互獨(dú)立的集合中,會(huì)選擇對(duì)自己來(lái)說(shuō)效用最大的選擇項(xiàng)。其中,隨機(jī)項(xiàng)的分布函數(shù)服從極值分布。效用函數(shù)可以表示為:
U=V+ε=∑Xβ+ε" " " " " " " " " " " " " " " " " " " "(10)
式中:q表示每一個(gè)家庭;i表示每一個(gè)地塊;V表示效用函數(shù)的可觀測(cè)項(xiàng),包括地塊上的人口總數(shù)和平均房?jī)r(jià)數(shù)據(jù);X表示所觀測(cè)的變量值,包括主體的特性(家庭特性,即家庭月收入)和選擇客體的屬性(區(qū)位特性,即地塊的平均房?jī)r(jià));β表示要求解模型的參數(shù)值,反映效用值對(duì)相應(yīng)的X變化的敏感性;ε表示效用函數(shù)的隨機(jī)項(xiàng)。
" 根據(jù)選擇者的特性和備選方案的屬性,推導(dǎo)出在一組可用備選方案中進(jìn)行選擇的概率。多項(xiàng)Logit模型的概率表達(dá)式為:
P=e/∑e" " " " " " " " " " " " " " " " " " " " " " (11)
式中:P為決策者q選擇備選方案i的概率。
3.2" 構(gòu)建容量限制Logit模型匹配位置信息
每個(gè)地塊的人口總數(shù)是有限制的,因此在進(jìn)行位置匹配時(shí)需要考慮地塊上的人口容量限制。針對(duì)地塊上有容量限制的情況,本文采用了多次迭代的方法,將獲取到的交通出行數(shù)據(jù)中的家庭匹配到各個(gè)地塊?;舅悸肥欠峙芜M(jìn)行家庭地塊選擇,每次迭代后,在備選集中刪除容量超限的地塊,并計(jì)算地塊上剩余容量;在選擇集中刪除已經(jīng)匹配了地塊的家庭,接著將未分配的家庭重新進(jìn)行地塊選擇。
構(gòu)建容量限制Logit模型步驟如下:
(1)構(gòu)建標(biāo)定長(zhǎng)表
根據(jù)家庭樣本數(shù)據(jù)和地塊數(shù)據(jù)構(gòu)建標(biāo)定長(zhǎng)表,即構(gòu)建一個(gè)不同家庭選擇不同地塊的長(zhǎng)表。但在模型中家庭選擇地塊時(shí),若將所有居住地塊都作為選擇集,會(huì)面臨選擇集過(guò)大和求解耗時(shí)較長(zhǎng)的問(wèn)題,可通過(guò)隨機(jī)抽樣選擇合適大小的地塊選擇集的方式選擇地塊子集。標(biāo)定長(zhǎng)表示例如表4所示。
" (2)標(biāo)" 定
基于效用函數(shù)變量(地塊上的人口數(shù)和平均房?jī)r(jià)數(shù)據(jù))和標(biāo)定長(zhǎng)表進(jìn)行標(biāo)定,獲得效用函數(shù)變量系數(shù)。根據(jù)最終標(biāo)定結(jié)果中的Pseudo R-squ和Pseudo R-bar-squ參數(shù)驗(yàn)證結(jié)果是否符合要求。
(3)生成家庭地塊映射概率表
" 標(biāo)定完成后,根據(jù)分段標(biāo)定結(jié)果生成家庭地塊映射概率表,該表為不同類型家庭選擇不同地塊的概率。
(4)匹配地理信息
標(biāo)定結(jié)果符合要求后,基于家庭地塊映射概率表給交通出行數(shù)據(jù)中每個(gè)家庭匹配地塊,并將每個(gè)家庭隨機(jī)分配到其對(duì)應(yīng)地塊的建筑物中。
4" 實(shí)例分析
獲取地塊及建筑物數(shù)據(jù)、樣本家庭數(shù)據(jù)、WorldPop數(shù)據(jù)、平均房?jī)r(jià)數(shù)據(jù)和總?cè)丝诩彝ヌ卣鲾?shù)據(jù)多源數(shù)據(jù),通過(guò)調(diào)查設(shè)置入住率α為:修建年為2005年以前為0.5,修建年為2005年至2015年為0.7,修建年為2015年以后為0.5。計(jì)算邊際約束,家庭層面邊際約束表和個(gè)人層面邊際約束表部分如表5、表6所示。
基于邊際約束和樣本家庭數(shù)據(jù)通過(guò)IPU算法計(jì)算每個(gè)樣本家庭的權(quán)重,隨后基于樣本家庭權(quán)重表通過(guò)蒙特卡洛模擬獲得交通出行數(shù)據(jù),交通出行數(shù)據(jù)和研究區(qū)域?qū)嶋H值對(duì)比如圖2所示。
由圖2可知在家庭層面,人口規(guī)模屬性中家庭人口為1的分布誤差為0.14%,其余屬性誤差均小于0.1%,擴(kuò)樣結(jié)果與研究區(qū)域?qū)嶋H比較吻合,家庭平均月收入屬性中家庭平均月收入4 501~6 000元的分布誤差為0.32%,其余均小于0.15%,擴(kuò)樣結(jié)果與研究區(qū)域?qū)嶋H同樣比較吻合。說(shuō)明在家庭層面,IPU算法擴(kuò)樣得到的交通出行數(shù)據(jù)能夠較好地滿足擴(kuò)樣的精度要求。
" 由圖2可知在個(gè)人層面,年齡屬性35~59歲的分布誤差為6.01%,其余屬性誤差均小于6%,個(gè)人層面各類屬性的誤差均比家庭層面屬性的誤差大,這是因?yàn)镮PU算法一般優(yōu)先考慮家庭層面約束,這就導(dǎo)致了家庭層面數(shù)據(jù)精度會(huì)優(yōu)于個(gè)人層面數(shù)據(jù)精度。
" 隨后通過(guò)基于容量限制的多項(xiàng)Logit模型對(duì)交通出行數(shù)據(jù)中每個(gè)家庭匹配地理信息?;诩彝颖緮?shù)據(jù)和地塊數(shù)據(jù)構(gòu)建標(biāo)定長(zhǎng)表,效用函數(shù)的變量選擇地塊平均房?jī)r(jià)數(shù)據(jù)、地塊人口總數(shù)。通過(guò)標(biāo)定獲得每個(gè)變量對(duì)應(yīng)的系數(shù),并根據(jù)標(biāo)定結(jié)果計(jì)算家庭選擇地塊的概率表,其中標(biāo)定結(jié)果顯著性強(qiáng),符合要求。根據(jù)家庭選擇地塊的概率表對(duì)所有家庭進(jìn)行有容量的選擇,得到最終人口分布和匹配位置的交通出行數(shù)據(jù)分布對(duì)比如圖3所示,匹配位置信息的交通出行數(shù)據(jù)部分表如表7所示。
5" 結(jié)" 論
交通出行數(shù)據(jù)獲取一直是基于活動(dòng)主體的城市系統(tǒng)交通出行模擬的關(guān)鍵和難點(diǎn),而精細(xì)交通出行數(shù)據(jù)獲取則更為困難。本文在IPU算法的基礎(chǔ)上,巧妙地利用了基于容量限制的多項(xiàng)Logit模型,提出了一套符合國(guó)情的精細(xì)交通出行數(shù)據(jù)獲取方法和流程。通過(guò)在武漢市經(jīng)開(kāi)區(qū)部分區(qū)域的數(shù)據(jù)驗(yàn)證,表明該算法和流程的可行性,效果良好,為未來(lái)精細(xì)交通出行數(shù)據(jù)的獲取提供了有益的參考和借鑒。
參考文獻(xiàn):
[1]" RICH J. Large-scale spatial population synthesis for denmark[J]. European Transport Research Review, 2018,10(2):1-18.
[2]" MORENO A T, MOECKEL R. Population synthesis handling three geographical resolutions[Z]. 2018.
[3]" HUANG C, ELSLAND R. A survey-based approach to estimate residential electricity consumption at municipal level in Germany[R]. Working Paper Sustainability and Innovation, 2019.
[4]" BORYSOV S S, RICH J, PEREIRA F C. How to generate micro-agents? A deep generative modeling approach to population synthesis[J]. Transportation Research Part C: Emerging Technologies, 2019,106:73-97.
[5]" H?RL S, BALAC M. Open data travel demand synthesis for agent-based transport simulation: A case study of Paris and ?le-de-France[J]. Arbeitsberichte Verkehrs-und Raumplanung, 2020,15:1499.
[6]" CHAPUIS K, TAILLANDIER P, GAUDOU B, et al. An integrated tool for realistic agent population synthesis[C] // Advances in Social Simulation-Proceedings of the 15th Social Simulation Conference, 2019.
[7]" FABRICE YAMéOGO B, GASTINEAU P, HANKACH P, et al. Comparing methods for generating a two-layered synthetic population[J]. Transportation Research Record, 2021,2675(1):136-147.
[8]" BOYAM FABRICE YAMEOGO, PIERRE OLIVIER VANDANJON, PASCAL GASTINEAU, et al. Generating a two-layered synthetic population for French municipalities: Results and evaluation of four synthetic reconstruction methods[J]. JASSS-Journal of Artificial Societies and Social Simulation, 2021,24:1-27.
[9]" MILOS BALAC, SEBASTIAN H?RL. Synthetic population for the state of California based on open-data: Examples of san francisco bay area and san diego county[C] // 100th Annual Meeting of the Transportation Research Board (TRB), 2021.
[10] 龍瀛. 北京城鄉(xiāng)空間發(fā)展模型:BUDEM2[J]. 現(xiàn)代城市研究,2016(11):2-9,27.
[11] 杭軒,楊超. 城市居民個(gè)體屬性數(shù)據(jù)獲取方法[J]. 交通信息與安全,2016,34(2):31-38.
[12] 洪曉龍. 烏魯木齊市居民出行調(diào)查數(shù)據(jù)綜合校核擴(kuò)樣方法研究[J]. 科學(xué)技術(shù)創(chuàng)新,2017(27):129-130.
[13] 葉佩軍. 基于混合代理建模的人工人口生成與標(biāo)定方法研究[D]. 北京:中國(guó)科學(xué)院自動(dòng)化研究所,2019.
[14] 雷煥宇,胡封疆. 基于Extended IPU的人口合成模型及應(yīng)用[C] // 中國(guó)智能交通協(xié)會(huì). 第十五屆中國(guó)智能交通年會(huì)科技論文集(1),2020:353-367.
[15] 郭莉,周軍,梁宇豪. 手機(jī)信令數(shù)據(jù)與傳統(tǒng)居民出行調(diào)查的對(duì)比及擴(kuò)樣方法研究——以深圳為例[C] // 中國(guó)城市規(guī)劃學(xué)會(huì)城市交通規(guī)劃學(xué)術(shù)委員會(huì). 交通治理與空間重塑——2020年中國(guó)城市交通規(guī)劃年會(huì)論文集,2020:1890-1897.
[16] 朱海明,鄭海星,芮曉麗,等. 基于數(shù)據(jù)融合與雙重特征的居民出行調(diào)查擴(kuò)樣[J]. 城市交通,2021,19(3):94-102.
[17] 李丁杰,樂(lè)陽(yáng),郭莉. 基于人口合成技術(shù)的居民出行調(diào)查數(shù)據(jù)擴(kuò)樣[J]. 交通科技與經(jīng)濟(jì),2021,23(6):24-31.
[18] 陳小鴻,陳先龍,李彩霞,等. 基于手機(jī)信令數(shù)據(jù)的居民出行調(diào)查擴(kuò)樣模型[J]. 同濟(jì)大學(xué)學(xué)報(bào)(自然科學(xué)版),2021,49(1):86-96.
[19] 吳煥,陳梓星,莊義彬,等. 居民出行調(diào)查數(shù)據(jù)擴(kuò)樣及校核方法應(yīng)用研究[J]. 交通工程,2021,21(4):67-73.
[20] 王媛. 多源數(shù)據(jù)融合在上海市綜合交通模型中的應(yīng)用[J]. 城市交通,2023,21(1):86-96,127.
收稿日期:2023-10-19
基金項(xiàng)目:國(guó)家社會(huì)科學(xué)基金項(xiàng)目“智慧出行的方案定制及服務(wù)提升策略研究”(20CGL018)
作者簡(jiǎn)介:鄒昌杰(2001—),男,湖北孝感人,武漢科技大學(xué)汽車與交通工程學(xué)院碩士研究生,研究方向:交通運(yùn)輸規(guī)劃與管理;陳玲娟(1985—),女,湖北武漢人,武漢科技大學(xué)汽車與交通工程學(xué)院,教授,博士,研究方向:智能交通系統(tǒng)。
引文格式:鄒昌杰,陳玲娟,湯文,等. 基于多源數(shù)據(jù)的交通出行數(shù)據(jù)擴(kuò)樣及位置匹配研究[J]. 物流科技,2024,47(21):79-85.