王曉全,邵春福,管 嶺,尹超英
(北京交通大學(xué)綜合交通運(yùn)輸大數(shù)據(jù)應(yīng)用技術(shù)交通運(yùn)輸行業(yè)重點(diǎn)實(shí)驗(yàn)室,北京100044)
隨著城市化進(jìn)程加快和社會(huì)經(jīng)濟(jì)水平提高,城市居民對(duì)小汽車依賴程度逐漸提高,小汽車依賴性增強(qiáng)帶來(lái)的交通擁堵和尾氣排放問(wèn)題給城市交通及環(huán)境系統(tǒng)帶來(lái)了嚴(yán)峻挑戰(zhàn).探究土地利用和小汽車依賴之間的關(guān)系被認(rèn)為是解決小汽車增長(zhǎng)帶來(lái)交通及環(huán)境問(wèn)題的重要手段.
既有研究對(duì)建成環(huán)境與小汽車擁有之間的關(guān)系進(jìn)行了探討.尹超英等[1]構(gòu)建路徑分析—離散選擇一體化模型分析建成環(huán)境對(duì)小汽車擁有和使用行為的影響,結(jié)果表明,居住地建成環(huán)境對(duì)小汽車擁有行為具有顯著影響.王曉全等[2]考慮交通小區(qū)之間的相關(guān)性,基于Bayesian層次模型分析了居住地建成環(huán)境對(duì)小汽車擁有行為的影響,結(jié)果表明,控制交通小區(qū)間的相關(guān)性和個(gè)體社會(huì)經(jīng)濟(jì)屬性后,居住地建成環(huán)境仍對(duì)家庭小汽車擁有行為具有顯著影響.丁川[3]構(gòu)建考慮空間異質(zhì)性的多層次序Probit模型,研究居住地建成環(huán)境對(duì)小汽車擁有的影響,結(jié)果表明,居住地建成環(huán)境對(duì)小汽車擁有具有顯著影響.Yin等[4]同時(shí)分析城市層和社區(qū)層建成環(huán)境對(duì)小汽車擁有行為的影響,揭示不同尺度建成環(huán)境對(duì)家庭小汽車擁有行為的影響.Guo[5]以紐約市城區(qū)調(diào)查數(shù)據(jù)為例,分析居住地建成環(huán)境和停車可用性對(duì)家庭小汽車擁有行為的影響,發(fā)現(xiàn)在控制社會(huì)經(jīng)濟(jì)屬性后,居住地的建成環(huán)境屬性和停車供給均會(huì)影響家庭小汽車擁有行為.既有研究多關(guān)注居住地建成環(huán)境對(duì)小汽車擁有的影響,較少關(guān)注工作地建成環(huán)境對(duì)小汽車擁有行為的影響[6].此外,現(xiàn)有研究多是基于傳統(tǒng)的統(tǒng)計(jì)模型分析建成環(huán)境對(duì)小汽車擁有行為的影響,模型結(jié)果僅給出建成環(huán)境變量和小汽車擁有行為之間的統(tǒng)計(jì)顯著性,無(wú)法量化各個(gè)屬性對(duì)小汽車擁有行為的影響程度,然而各個(gè)屬性的作用程度對(duì)城市規(guī)劃及交通政策的制定具有重要意義[7].因此,有必要構(gòu)建機(jī)器學(xué)習(xí)模型量化捕捉居住地和工作地建成環(huán)境屬性對(duì)小汽車擁有行為的影響程度.
在既有研究的基礎(chǔ)上,本文將居住地和工作地建成環(huán)境同時(shí)納入模型,通過(guò)構(gòu)建梯度提升迭代決策樹(Gradient Boosting Decision Tree,GBDT)模型量化捕捉建成環(huán)境各要素對(duì)家庭小汽車擁有的影響程度.研究結(jié)果可為通過(guò)優(yōu)化城市土地利用緩解小汽車依賴提供理論支撐.
以2012年長(zhǎng)春市居民出行調(diào)查數(shù)據(jù)為基礎(chǔ),研究職住地建成環(huán)境屬性對(duì)小汽車擁有行為的影響.長(zhǎng)春市居民出行調(diào)查數(shù)據(jù)覆蓋長(zhǎng)春市5個(gè)行政區(qū),237個(gè)交通小區(qū).剔除缺失數(shù)據(jù),共得到5 201條數(shù)據(jù)用于實(shí)證分析,樣本數(shù)據(jù)中居民職住地位置分布如圖1所示.家庭社會(huì)經(jīng)濟(jì)屬性直接從出行調(diào)查數(shù)據(jù)中提取,包括性別、年齡、教育、家庭規(guī)模和家庭收入.
職住地建成環(huán)境屬性均包括:到中央商務(wù)區(qū)(Central Business District,CBD)距離、土地利用混合度、公共交通站點(diǎn)密度及交叉口密度4個(gè)變量,分別用于度量建成環(huán)境的“目的地可達(dá)性”“多樣性”“公共交通可達(dá)性”“設(shè)計(jì)”4個(gè)維度.建成環(huán)境各變量均基于ArcGIS平臺(tái)計(jì)算得到.首先,根據(jù)出行調(diào)查數(shù)據(jù)中記錄的居民居住地和工作地的地理位置信息對(duì)居民的職住地進(jìn)行定位;其次,根據(jù)定位計(jì)算職住地到CBD的歐幾里得距離;同時(shí),根據(jù)長(zhǎng)春市交通地圖計(jì)算得到各交通小區(qū)的交叉口密度;最后,基于高德地圖API 提取興趣點(diǎn)(Point of Interest,POI)數(shù)據(jù),計(jì)算交通小區(qū)公共交通站點(diǎn)密度及土地利用混合度.土地利用混合度基于熵指數(shù)法計(jì)算得到,計(jì)算所利用的11種興趣點(diǎn)數(shù)據(jù)包括:住宅、賓館、餐飲、超市、公園、廣場(chǎng)、購(gòu)物中心、學(xué)校、醫(yī)院、銀行及政府[8],計(jì)算過(guò)程為
式中:pij為交通小區(qū)j內(nèi)第i種興趣點(diǎn)所占的比例;Nj為交通小區(qū)j內(nèi)包含的POI種類數(shù).
居民社會(huì)經(jīng)濟(jì)屬性和職住地建成環(huán)境屬性的描述性統(tǒng)計(jì)結(jié)果如表1所示.
表1 變量描述性統(tǒng)計(jì)結(jié)果Table1 Descriptive statistics of explanatory variables
因各影響因素度量方式(包括單位和數(shù)量級(jí)等)不同,傳統(tǒng)的統(tǒng)計(jì)學(xué)模型難以估計(jì)各屬性對(duì)因變量的作用程度.本文構(gòu)建GBDT模型分析社會(huì)經(jīng)濟(jì)屬性及職住地建成環(huán)境屬性對(duì)小汽車擁有行為的影響程度.GBDT模型是一種基于迭代的決策樹算法,被廣泛應(yīng)用于捕捉各自變量對(duì)因變量的作用程度[7-8].
近似函數(shù)定義為弱分類器的迭代形式,即
式中:γj、c為待估計(jì)參數(shù);hj(x)為弱分類器j的估計(jì)結(jié)果;J為弱分類器數(shù)量.
通過(guò)梯度提升方法估計(jì)GBDT模型參數(shù)的計(jì)算過(guò)程如下:
Step 1算法初始化,設(shè)置F0(x)為常數(shù)值,γ為待估參數(shù),,設(shè)置最大迭代次數(shù)M.
Step 2計(jì)算第m次迭代的殘差,rim=
Step 3利用弱分類器hm(x)擬合Step 2中得到的殘差rim.
Step 4估計(jì)乘子,
Step 5更新,F(xiàn)m(x)=Fm-1(x)+γmhm(x).
Step 6判斷是否達(dá)到迭代次數(shù)和精度要求.滿足,則得到最終估計(jì)結(jié)果;否則,返回Step 2.
GBDT模型通過(guò)計(jì)算所有加法樹的均值,量化捕捉外生變量對(duì)內(nèi)生變量的影響程度,即
式中:為對(duì)小汽車擁有行為的影響程度;Tj為加法樹j;為加法樹j中自變量xi對(duì)小汽車擁有行為的影響程度;t為樹的終端節(jié)點(diǎn);H為終端節(jié)點(diǎn)數(shù)量;為調(diào)整因子;v(t)為用于判斷i是否屬于該分割區(qū)域的函數(shù);當(dāng)i屬于該分割區(qū)域時(shí),I(·)值為1,否則,I(·)值為0.
為量化社會(huì)經(jīng)濟(jì)屬性和職住地建成環(huán)境屬性對(duì)小汽車擁有行為的影響,利用五折交叉驗(yàn)證方法確定模型參數(shù).數(shù)據(jù)被隨機(jī)平均分為5份,在執(zhí)行過(guò)程中1份數(shù)據(jù)作為驗(yàn)證集合,4份作為訓(xùn)練集合,程序執(zhí)行5次能夠穩(wěn)定估計(jì)結(jié)果;將學(xué)習(xí)速率設(shè)置為0.001,樹的復(fù)雜度設(shè)置為10.
各外生變量對(duì)小汽車影響程度的估計(jì)結(jié)果如表2所示.由表2可知,社會(huì)經(jīng)濟(jì)屬性對(duì)小汽車擁有行為的影響程度最大,為58.95%,表明與職住地建成環(huán)境屬性相比,社會(huì)經(jīng)濟(jì)屬性仍是影響小汽車擁有行為的最主要因素.對(duì)于建成環(huán)境屬性而言,職住地建成環(huán)境對(duì)小汽車擁有行為的影響程度為41.05%,其中,居住地建成環(huán)境屬性的影響程度為23.77%,工作地建成環(huán)境的影響程度為17.28%.盡管居住地建成環(huán)境屬性對(duì)小汽車擁有行為的影響高于工作地,在推進(jìn)城市土地利用政策時(shí),對(duì)商業(yè)中心等就業(yè)崗位集中地區(qū)的土地利用規(guī)劃亦是緩解小汽車增長(zhǎng)的重要手段.
表2 各外生變量對(duì)小汽車擁有的影響程度Table2 Relative contribution of influential factors to explaining automobile ownership
社會(huì)經(jīng)濟(jì)屬性中,家庭收入、教育水平和年齡是對(duì)小汽車擁有行為影響程度較大的3個(gè)因素.其中,家庭收入是對(duì)小汽車擁有行為影響最大的變量,這一結(jié)論與已有研究結(jié)果類似,如Yin等[4]針對(duì)中國(guó)48個(gè)城市的居民小汽車擁有行為進(jìn)行建模發(fā)現(xiàn),在中國(guó)社會(huì)環(huán)境下家庭收入是影響家庭小汽車擁有的重要因素.作為排名第2的變量,教育水平對(duì)小汽車擁有行為的作用程度為13.98%,也被諸多研究所證實(shí)[10].年齡對(duì)小汽車擁有行為影響程度排名第3,即10.67%.此外,家庭規(guī)模和性別對(duì)小汽車擁有行為的作用程度分別為6.05%和3.23%.
居住地建成環(huán)境屬性中,除交叉口密度外,其他建成環(huán)境因素對(duì)小汽車擁有行為的作用程度均高于對(duì)應(yīng)的工作地建成環(huán)境屬性.其中,土地利用混合度是所有居住地建成環(huán)境中對(duì)小汽車擁有行為影響最大的因素,此結(jié)論為已有研究結(jié)論“土地利用混合開發(fā)可減少小汽車依賴行為”提供了理論支持[1].到CBD距離對(duì)小汽車擁有行為的影響程度僅次于土地利用混合度,為7.20%,表明居住地的空間位置是影響小汽車擁有行為的重要因素之一.公共交通站點(diǎn)密度對(duì)小汽車擁有行為的影響程度為5.83%.交叉口密度對(duì)小汽車擁有行為的作用較弱為1.02%.
工作地建成環(huán)境屬性中,土地利用混合度仍是小汽車擁有行為最重要的影響因素.工作地交叉口密度對(duì)小汽車擁有行為的作用程度為5.94%,這也是工作地建成環(huán)境變量中唯一影響程度高于居住地建成環(huán)境的變量.此外,工作地到CBD距離及公共交通站點(diǎn)密度對(duì)小汽車擁有行為的作用程度分別為4.04%和0.87%.
由此可見,居民在小汽車擁有行為決策過(guò)程中,社會(huì)經(jīng)濟(jì)屬性、居住地及工作地建成環(huán)境均發(fā)揮重要作用.
針對(duì)既有研究多忽略工作地建成環(huán)境對(duì)小汽車擁有的影響,本文基于GBDT模型對(duì)家庭小汽車擁有行為的影響因素進(jìn)行建模,分析了職住地建成環(huán)境對(duì)小汽車擁有的作用程度.基于居民出行調(diào)查數(shù)據(jù)的實(shí)證研究表明,職住地建成環(huán)境均在小汽車擁有行為決策中發(fā)揮重要作用.本文可為通過(guò)城市規(guī)劃手段減緩小汽車擁有提供理論基礎(chǔ).本文只考慮了各因素的作用程度,未能對(duì)各因素的影響方向進(jìn)行分析,研究成果具有一定的局限性,未來(lái)在作用程度建模的基礎(chǔ)上,分析各因素與小汽車擁有的非線性關(guān)系.