• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于人群出行行為軌跡的城市功能區(qū)識別

      2022-07-14 13:10:48凌鵬諸彤宇周軼吳愛枝張鵬
      計算機工程 2022年7期
      關(guān)鍵詞:功能區(qū)人群分類

      凌鵬,諸彤宇,周軼,吳愛枝,張鵬

      (1.北京航空航天大學 軟件開發(fā)環(huán)境國家重點實驗室,北京 100191;2.北京市安全生產(chǎn)科學技術(shù)研究院,北京 101101)

      0 概述

      目前,全球一半以上的人口居住在城市中,而且城市人口規(guī)模仍在不斷擴大,到2030 年,全球城市人口數(shù)量估計會增長到50億[1]。因此,對如此龐大的城市人口和有限的城市地區(qū)進行管理非常重要。

      城市功能區(qū)識別是進行合理城市規(guī)劃和管理的關(guān)鍵一環(huán)。功能區(qū)是一個文化概念,描述了某個地區(qū)的人類活動,能夠反映城市的復雜空間分布和社會經(jīng)濟功能[2]。每個功能區(qū)在空間上都由不同的地理對象聚合,并從土地用途上進行語義抽象[3]。功能區(qū)是城市規(guī)劃的基本單位[4-5],對城市交通、資源管理、工廠選址等都有重要影響[6-7]。傳統(tǒng)的城市功能區(qū)識別研究主要采用調(diào)研統(tǒng)計的方法,通過對人們出行日志的記錄和問卷調(diào)查等方式進行。這種方法具有很大的局限性,不僅需要大量的人力、物力、財力,效率低下,而且調(diào)查者容易將主觀意見和看法帶入研究結(jié)果[8]。

      遙感影像數(shù)據(jù)可以很好地捕獲陸地表面的自然外觀,因此,大量研究者用遙感影像數(shù)據(jù)來進行功能區(qū)識別[9-11]。但僅使用遙感圖像進行區(qū)域功能識別存在不足:一方面,遙感數(shù)據(jù)只能反映地表的自然屬性,而城市功能區(qū)具有社會經(jīng)濟屬性,并由相關(guān)的人類活動決定;另一方面,遙感數(shù)據(jù)的獲取需要巨大的耗費,且高密度城市中眾多高層建筑存在陰影,這對遙感圖像處理帶來了巨大挑戰(zhàn)。

      公共交通工具(公共汽車、地鐵、出租車等)能夠產(chǎn)生大量與人移動強相關(guān)的位置數(shù)據(jù)用于功能區(qū)識別[12-13]。QIAN等[14]提出了一個集成模型,先基于出租車軌跡中的上下車點,使用K-Means 和k 最近鄰算法提取區(qū)域社交屬性,再基于決策樹算法融合遙感數(shù)據(jù)得到功能區(qū)分類。但公交數(shù)據(jù)會忽視行人對于城市功能區(qū)的影響,也會忽略路網(wǎng)未覆蓋的區(qū)域。

      興趣點(Points of Interest,POI)數(shù)據(jù)作為城市設(shè)施的代表,被廣泛應用于城市功能區(qū)提取。YUAN等[15]使用基于主題的推斷模型來推斷每個區(qū)域的功能,該模型將區(qū)域視為文檔,將功能視為主題,將POI 的類別視為元數(shù)據(jù),將人類流動模式作為詞語。POI 數(shù)據(jù)以建筑物的功能屬性出發(fā),能夠覆蓋所有區(qū)域,但并未考慮人的社會活動屬性,同時數(shù)據(jù)更新成本較大。

      手機呼叫詳細記錄(Call Detail Records,CDR)數(shù)據(jù)間接記錄了人的活動時間、空間信息,同時隱含了人的社會活動屬性[16-17],數(shù)據(jù)獲取成本較低,且支持實時更新。江貴林等[18]使用高斯混合模型,基于CDR 數(shù)據(jù)的簡單統(tǒng)計量設(shè)計多特征加權(quán)判決的功能區(qū)識別算法。TU等[19]先基于手機信令數(shù)據(jù)推斷人的職住位置,再基于隱馬爾可夫模型由社交媒體簽到數(shù)據(jù)獲取人的活動的知識,從而推斷城市功能。JIA等[20]自定義融合規(guī)則,同時使用遙感影像數(shù)據(jù)與CDR 數(shù)據(jù)。但目前基于手機數(shù)據(jù)的大部分研究都只用到了簡單的統(tǒng)計量,如區(qū)域內(nèi)不同時間段的通話量等。

      現(xiàn)有基于出行信息的功能區(qū)識別研究大部分停留在簡單的統(tǒng)計,且多數(shù)將區(qū)域內(nèi)不同出行行為的人群混雜在一起,并沒有考慮不同群體對區(qū)域產(chǎn)生的不同影響。筆者通過研究相關(guān)數(shù)據(jù)發(fā)現(xiàn):不同功能區(qū)的人群出行活動具有各自的特征,而通過學習這些特征可以識別出相應的功能區(qū)。本文基于人群出行行為軌跡構(gòu)建城市功能區(qū)識別模型UFAI。利用粗粒度的匿名個體移動位置數(shù)據(jù)提取隱含的個體出行特征,并通過將這些出行特征與所在局部區(qū)域相關(guān)聯(lián),對該區(qū)域的群體出行特征進行分類。在此基礎(chǔ)上,通過訓練功能區(qū)的多分類深度學習模型,完成對功能區(qū)的識別。

      1 UFAI 模型

      1.1 模型框架與符號定義

      UFAI 模型框架如圖1 所示,主要分為3 個模塊:

      圖1 UFAI 模型框架Fig.1 UFAI model framework

      1)個體出行特征提取模塊。對原始數(shù)據(jù)進行數(shù)據(jù)預處理后,使用ST-DBSCAN 算法[21]識別用戶停留點,然后構(gòu)建出行鏈,提取出用戶的職住位置以及隱含的個體出行特征。

      2)區(qū)域內(nèi)人群出行行為刻畫模塊。以區(qū)域為研究對象,基于個體出行特征劃分區(qū)域內(nèi)的不同群體,提取出各類人群的停留特征和居民的活動特征。

      3)功能區(qū)分類模塊。首先人工標注高置信度樣本,然后以時間周期為單位切分數(shù)據(jù),從而擴充樣本,構(gòu)建并訓練深度學習模型。

      本文所使用符號定義如表1 所示。

      表1 相關(guān)符號定義Table 1 Definition of related symbols

      1.2 個體出行特征提取

      一個用戶uid對應的全部原始軌跡記錄集為Rid,如式(1)所示:

      1.2.1 停留點識別

      通過對聚類算法的研究可知,密度聚類算法DBSCAN 比較適用于停留點提取,但傳統(tǒng)的DBSCAN 算法只考慮了空間這一單一維度,并不適用于處理具有多個維度的數(shù)據(jù),因此,本文引入面向高維數(shù)據(jù)的ST-DBSCAN 算法。ST-DBSCAN 算法相對DBSCAN 主要有兩點改進:時間閾值的加入與選擇樣本鄰域方法的改變。時間閾值限制了簇集中樣本點的最短時間跨度值,而選擇樣本鄰域的方法由隨機擴展方式改為按時序擴展方式,能夠保證一個簇集中的樣本點在時間上是連續(xù)的。

      從手機CDR 數(shù)據(jù)中獲取用戶的停留點集合,如式(2)和式(3)所示:

      其中:Pid是一個用戶對應的所有停留點的集合,集合的第i個停留點為是三元組;stdbscan代表ST-DBSCAN聚類算法;εS、εT分別是ST-DBCAN聚類算法中的空間閾值和時間閾值。

      1.2.2 職住位置提取

      基于停留點集合Pid可以提取uid在各個位置對應的所有停留時段。計算各個位置在居家時間段的累計停留時長,并取累計停留時長最長的停留點作為居住地hid。同時,計算各個位置在工作時間段的累計停留時長,并取累計停留時長最長的停留點作為工作地wid。上述計算過程如式(4)和式(5)所示:

      其中:dH和dW分別為居家時間段和工作時間段;fT是一個函數(shù),用于計算任意兩個時間段交集的時間長度。

      1.3 區(qū)域內(nèi)人群出行行為刻畫

      1.3.1 區(qū)域內(nèi)的人群分類

      以往針對區(qū)域內(nèi)人群出行行為的研究,都是以區(qū)域內(nèi)的所有人群為研究對象,但單個區(qū)域內(nèi)的人員成分復雜,不同人群的出行行為也互不相同。因此,本文先將單個區(qū)域c內(nèi)的人群分為8 個研究類別,如表2 所示。

      表2 區(qū)域內(nèi)人群研究類別定義Table 2 Categories definition of population research in the region

      對于用戶uid,職住位置為hid和wid,則其在區(qū)域c內(nèi)的停留時長計算如式(6)所示:

      用戶在整個研究范圍內(nèi)的停留天數(shù)如式(7)所示:

      其中:date 代表所取停留時段對應的日期。由此可得各類人群職住位置的計算公式如式(8)~式(15)所示:

      1.3.2 區(qū)域內(nèi)各類人群的停留特征

      區(qū)域內(nèi)不同人群的出行行為在相同時間范圍內(nèi)具有不同的人數(shù)變化趨勢,因此,先以τ為采樣粒度,將一天劃分為間隔相等的時間片序列,可以計算得到區(qū)域一天各時間片的各類人群的人數(shù),最后將連續(xù)多天的結(jié)果進行拼接,用以刻畫區(qū)域內(nèi)各類人群的出行行為。

      對于區(qū)域c,在第k個時間周期的第d天,時間片t對應g類人群的數(shù)量如式(16)所示:

      由此,可得到各個區(qū)域的人群出行行為特征矩陣N。

      1.3.3 區(qū)域內(nèi)居民的活動特征刻畫

      其中:dis 為計算兩點間的直線距離的函數(shù);fD為分段離散函數(shù)。

      fD將輸入的任意原始連續(xù)值x映射為t段離散值中的一個離散類別r:

      其中:κr,1和κr,2分別代表離散類別r的范圍上界和下界,離散后的類別數(shù)與一天時間片個數(shù)相同。

      對于區(qū)域c,在時間周期k的第d天,半徑離散類別r對應的值如式(20)和式(21)所示:

      由此,可得到各個區(qū)域的居民出行行為特征矩陣A和W。

      1.4 功能區(qū)分類模型

      區(qū)域人群出行行為刻畫模型基于粗粒度軌跡數(shù)據(jù),從出行行為角度出發(fā)計算得到區(qū)域的人群出行行為特征和居民出行行為特征。

      功能區(qū)分類模型先拼接兩類特征矩陣,得到模型的輸入特征矩陣X。由經(jīng)驗可知,一周為一個人類活動的周期,因此,本文選取一周七天為區(qū)域的一個時間周期,構(gòu)建區(qū)域c第k個時間周期輸入特征的方式如式(22)所示:

      1.4.1 樣本集擴充

      結(jié)合實際經(jīng)驗和數(shù)據(jù)分析,先人工標記部分功能區(qū),作為訓練和測試數(shù)據(jù)。但由于功能區(qū)數(shù)量本身有限,導致有標簽的功能區(qū)數(shù)量有限,因此需要擴充樣本。

      由于數(shù)據(jù)在同一個區(qū)域的不同時間周期上遵循同一個概率分布,而且時間周期是可以不斷擴展的,因此本文將一個區(qū)域?qū)亩鄠€時間周期數(shù)據(jù)切分為多個訓練樣本,從而擴充樣本集。

      1.4.2 模型訓練與分類結(jié)果

      對于任意區(qū)域c,時間周期k對應的特征矩陣是一個三維張量,經(jīng)分析發(fā)現(xiàn)其時空分布均勻,類似圖像數(shù)據(jù),因此,本文采用類似卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)構(gòu)建多分類模型。

      其中:l代表層數(shù);k為卷積核;Mj表示選擇的輸入特征圖的集合。每個輸出特征圖會給一個額外的偏置b,然后進行最大池化:

      其中:u(n,n)為輸入窗口函數(shù)。在此基礎(chǔ)上,進行第2次卷積和池化:

      其中:W為全連接層的權(quán)重矩陣。

      對于同一個區(qū)域,當輸入多個時間周期時,得到的分類結(jié)果可能會有所不同。出現(xiàn)這種情況的原因可能是該區(qū)域的功能分類復雜,也可能是數(shù)據(jù)采集的問題。因此,本文選取所有時間周期對應的分類結(jié)果中出現(xiàn)次數(shù)最多的結(jié)果,作為區(qū)域的功能區(qū)分類的最終結(jié)果。在第k個時間周期,區(qū)域c的輸入特征矩陣為Xc,k,模型的分類結(jié)果為yc,k,獲取區(qū)域的最終結(jié)果oc的過程如式(28)所示:

      其中:fM用于返回一個序列的眾數(shù)。

      2 實驗與結(jié)果分析

      2.1 實驗數(shù)據(jù)集

      本文實驗所用的數(shù)據(jù)集為某移動運營商提供的北京市2019 年1 月—2019 年10 月的手機信令數(shù)據(jù),覆蓋北京市范圍內(nèi)2 000 萬匿名手機用戶,數(shù)據(jù)采樣頻率為半小時,主要字段說明如表3 所示。

      表3 數(shù)據(jù)字段說明Table 3 Data field description

      經(jīng)過數(shù)據(jù)去噪后,本文選取數(shù)據(jù)質(zhì)量好、無重大節(jié)日影響且具有典型日常生活特征的數(shù)據(jù)作為UFAI 模型的輸入。

      2.2 實驗設(shè)置

      本文以北京市作為研究區(qū)域,以250 m×250 m為精度將其劃分為18 106 個網(wǎng)格區(qū)域。通過參考《北京市土地利用總體規(guī)劃(2006—2020 年)》《北京市主體功能區(qū)規(guī)劃》以及網(wǎng)絡(luò)地圖,選取250 個區(qū)域作為訓練集,100 個區(qū)域作為測試集,經(jīng)過樣本擴充,訓練集個數(shù)最終為1 250 個,功能區(qū)類別有居住區(qū)、工作區(qū)、其他。同時,本文的多分類模型采用交叉熵損失函數(shù),如式(29)所示:

      2.3 實驗結(jié)果分析

      采用本文模型進行訓練,實驗結(jié)果如表4 所示。

      表4 各功能區(qū)分類結(jié)果Table 4 Classification results of each functional area

      圖2 為某局部區(qū)域?qū)墓δ軈^(qū)分類結(jié)果,從中隨機選取多個網(wǎng)格進行數(shù)據(jù)分析,如圖3 所示,其中橫坐標為一天48 個時間片,縱坐標為各時間片對應人數(shù),不同線條代表一周七天??梢钥闯觯壕W(wǎng)格①平時人數(shù)多于周末人數(shù),且每天人數(shù)趨勢符合“凸”形;網(wǎng)格②平時人數(shù)少于周末,且每天人數(shù)區(qū)域符合“凹”形。以上數(shù)據(jù)表現(xiàn)符合日常生活經(jīng)驗。

      圖2 某局部區(qū)域功能區(qū)分類結(jié)果Fig.2 Classification result of functional area in a local area

      圖3 一周七天網(wǎng)格內(nèi)總?cè)藬?shù)隨時間變化曲線Fig.3 Curve of the total number of people over time in the daily grid in a week

      實驗使用以下對比模型:

      1)決策樹分類模型(Decision Tree)[22]。

      2)隨機森林模型(Random Forest)[23]。

      3)核函數(shù)選擇線性函數(shù)(SVM)[24]。

      4)多項式樸素貝葉斯算法(Multinomial NB)[25]。

      5)K 最近鄰分類算法(KNN)[26]。

      6)邏輯回歸算法(Logistic Regression)[27]。

      7)集成學習梯度提升決策樹分類模型(Gradient Boosting Classifier)[28]。

      對比結(jié)果如表5 所示,與其他模型相比,本文UFAI 模型具有最好的性能,F(xiàn)1 值達到0.95。

      表5 對比實驗結(jié)果Table 5 Comparison experimental results

      3 結(jié)束語

      本文基于粗粒度匿名個體移動位置數(shù)據(jù)構(gòu)建城市功能區(qū)識別模型UFAI。挖掘個體出行特征并與局部區(qū)域結(jié)合,將人群劃分為不同類別。在此基礎(chǔ)上,通過刻畫各個區(qū)域內(nèi)不同人群的出行活動,構(gòu)建功能區(qū)多分類深度學習模型,同時將多個時間周期數(shù)據(jù)劃分為多個訓練樣本,從而擴充樣本集。實驗結(jié)果表明,UFAI 模型識別準確率達到0.93,相比于決策樹、隨機森林等分類模型準確率更高。下一步將結(jié)合更多識別功能區(qū)的人群出行活動特征,擴大本文模型的識別范圍。

      猜你喜歡
      功能區(qū)人群分類
      在逃犯
      分類算一算
      糖尿病早預防、早控制
      燒結(jié)混合機各功能區(qū)的研究與優(yōu)化
      山東冶金(2019年3期)2019-07-10 00:53:54
      分類討論求坐標
      數(shù)據(jù)分析中的分類討論
      我走進人群
      百花洲(2018年1期)2018-02-07 16:34:52
      衡水市不同功能區(qū)土壤營養(yǎng)元素的比較
      財富焦慮人群
      教你一招:數(shù)的分類
      科技| 濮阳县| 武乡县| 广丰县| 鹤山市| 三明市| 杭锦后旗| 新巴尔虎左旗| 正安县| 英山县| 南和县| 巴林右旗| 灵川县| 交口县| 连平县| 高尔夫| 湘阴县| 织金县| 巴里| 宁都县| 松江区| 静乐县| 巴林左旗| 凯里市| 云浮市| 厦门市| 霍州市| 龙游县| 高密市| 梓潼县| 昌平区| 宽城| 镶黄旗| 新宁县| 威信县| 昌吉市| 柳林县| 东乡族自治县| 平顶山市| 察哈| 西华县|