禹文豪,魏 鋮,陳佳鑫
1.中國地質(zhì)大學(xué)(武漢)地理與信息工程學(xué)院,湖北 武漢 430074;2.中國地質(zhì)大學(xué)(武漢)國家地理信息系統(tǒng)工程技術(shù)研究中心,湖北 武漢 430074
興趣點(diǎn)(POI)數(shù)據(jù)是電子地圖、導(dǎo)航平臺、專題地圖等的重要組成部分,反映餐飲、文娛、住宿等多種城市活動場所信息。受益于基于位置服務(wù)(LBS)的普及,POI數(shù)據(jù)表現(xiàn)出數(shù)據(jù)量大、獲取迅速、來源多樣、商業(yè)價值高等特點(diǎn),其數(shù)據(jù)產(chǎn)品在城市規(guī)劃、社會服務(wù)、應(yīng)急管理及智慧城市等領(lǐng)域具有廣泛應(yīng)用[1-6]。
作為POI數(shù)據(jù)的重要來源,眾源地理信息數(shù)據(jù)受非專業(yè)收集模式影響,相關(guān)專題數(shù)據(jù)質(zhì)量參差不齊,影響POI數(shù)據(jù)產(chǎn)品的可靠性與準(zhǔn)確性。例如,OSM平臺的POI數(shù)據(jù),其類別或標(biāo)簽特征往往存在標(biāo)注錯誤或信息丟失的問題,如何利用空間智能模型自動糾正錯誤標(biāo)簽或補(bǔ)全缺失信息,是該領(lǐng)域的一個重要研究方向。
不同于信息科學(xué)領(lǐng)域的一般標(biāo)簽預(yù)測任務(wù),POI特征依賴于空間關(guān)系的定義和語義信息挖掘。例如,文獻(xiàn)[7]提出利用POI名稱文本數(shù)據(jù),結(jié)合分詞技術(shù)和向量空間模型構(gòu)建POI目標(biāo)特征,以此輸入樸素貝葉斯模型預(yù)測樣本類別的條件概率。雖然POI名稱對于部分類別預(yù)測具有一定適應(yīng)性,但POI標(biāo)簽類別與其命名并無本質(zhì)聯(lián)系,建立的相關(guān)模型對不同場景的泛化能力也較弱。文獻(xiàn)[8—9]利用用戶訪問POI的時間、用戶人口統(tǒng)計(jì)信息及附近商家信息構(gòu)建Placer分類器,由決策樹模型輸出POI標(biāo)簽預(yù)測概率。文獻(xiàn)[10—11]提出了一個潛在的概率生成模型,融合了用戶簽到行為的多源數(shù)據(jù),包括空間位置信息、時間信息以及用戶自身的配置文件等。同樣是基于用戶的簽到行為特征。文獻(xiàn)[12]綜合利用了更多的簽到統(tǒng)計(jì)數(shù)據(jù),首先提取POI的顯式特征,然后基于用戶簽到行為間的相關(guān)關(guān)系構(gòu)建相似POI網(wǎng)絡(luò),以此提取POI間的隱式特征,支持顯式特征和隱式特征耦合下的POI標(biāo)簽預(yù)測。然而,傳統(tǒng)方法大多需要利用位置、語義、文本、行為等多源數(shù)據(jù);考慮到不同場景下數(shù)據(jù)獲取的有限性,本文嘗試?yán)肞OI最基本的位置和類別信息推測目標(biāo)缺失的標(biāo)簽,提高方法在實(shí)際環(huán)境下的適應(yīng)性。
針對標(biāo)簽預(yù)測問題,常規(guī)前饋神經(jīng)網(wǎng)絡(luò)[13]須假設(shè)各類別的對象數(shù)量具有均衡性,而對于數(shù)量相對較少的類別,傳統(tǒng)模型容易將其錯分至數(shù)量較多的類別,難以顧及不平衡類別間的預(yù)測精度。事實(shí)上,POI數(shù)據(jù)具有典型的不平衡類別分布,不同POI類型承擔(dān)不同的城市功能服務(wù),部分類別在城市系統(tǒng)中占主要地位,如餐廳等。如何有效顧及POI數(shù)據(jù)的類別不均衡性與空間依賴等特征,是設(shè)計(jì)有效神經(jīng)網(wǎng)絡(luò)標(biāo)簽預(yù)測模型的關(guān)鍵。為了解決不平衡數(shù)據(jù)集分類問題,許多專家學(xué)者從數(shù)據(jù)和算法兩個層面開展了相關(guān)研究。在數(shù)據(jù)層面上,欠采樣或過采樣的方法占據(jù)主流。文獻(xiàn)[14]提出Tmoek-links欠采樣方法,尋找互為最鄰近的兩類樣本來去除多數(shù)類樣本中的噪音;文獻(xiàn)[15]提出的SMOTE方法以線性插值的方式在樣本間生成少數(shù)類樣本從而對數(shù)據(jù)過采樣。在算法層面,代價敏感學(xué)習(xí)和集成學(xué)習(xí)影響力較為廣泛。文獻(xiàn)[16]將較高的分類代價分給少數(shù)類,通過各類間不同的錯分代價分配提高分類器對少數(shù)類的關(guān)注度。文獻(xiàn)[17—19]分別提出了集成學(xué)習(xí)中著名的Bagging算法[17]、Boosting算法[18]及其變體隨機(jī)森林[19]。它們都是基于一系列的子分類器,通過某種規(guī)則將各個子分類器的結(jié)果整合起來作為最終分類結(jié)果。但對POI數(shù)據(jù)集而言,現(xiàn)有的不平衡數(shù)據(jù)集處理方法在分類精度的提高上始終有限。
本文提出一種基于多層次類別組織的神經(jīng)網(wǎng)絡(luò)模型,不同于神經(jīng)網(wǎng)絡(luò)內(nèi)部多層次的概念,該多層次神經(jīng)網(wǎng)絡(luò)模型是在POI多層次類別構(gòu)建的基礎(chǔ)上,以單個前饋神經(jīng)網(wǎng)絡(luò)作為模型的分類結(jié)點(diǎn),在每一個神經(jīng)網(wǎng)絡(luò)分類結(jié)點(diǎn)進(jìn)行兩個POI類別集合的分流,從而形成一個“金字塔”式的多層次網(wǎng)絡(luò)模型。相較于傳統(tǒng)模型直接在單一層面上將對象劃分至某一類別,本文模型考慮了不同類別的不平衡性,將少數(shù)類合并為一個大類,以此平衡與其他現(xiàn)有大類的數(shù)量差異,解決神經(jīng)網(wǎng)絡(luò)對少數(shù)類的泛化能力不足的問題,提高POI標(biāo)簽預(yù)測精度與眾源地理信息數(shù)據(jù)質(zhì)量的水平。
參考地理學(xué)第一定理,POI目標(biāo)與其周圍不同地理范圍內(nèi)各類別POI的數(shù)量分布具有潛在的相關(guān)關(guān)系。因此,推斷某一POI標(biāo)簽可由其鄰近空間的POI分布特征分析實(shí)現(xiàn)。但如何定義鄰近空間以及提取多類型POI分布信息是該步驟的關(guān)鍵。傳統(tǒng)方法往往基于單距離鄰域,而對于不同的地理上下文環(huán)境,單一硬性邊界容易丟失空間依賴關(guān)系的多尺度信息,生成不完備的特征矢量空間,進(jìn)而影響POI分類器的標(biāo)簽預(yù)測精度。因此,本文提出一種基于多距離鄰域的POI特征矢量化方法。
具體上:對于有M個類別共N條POI記錄的POI數(shù)據(jù)集,假設(shè)Xn對應(yīng)第n條POI記錄,Xmi對應(yīng)第m個類的第i條POI記錄(i在第m個類內(nèi)遍歷),兩者空間距離為dnmi。構(gòu)建目標(biāo)Xn的K級多鄰域緩沖區(qū)集合D,存儲k個順序排列的緩沖區(qū)距離邊界二元組,并統(tǒng)計(jì)落入各級別緩沖區(qū)范圍的不同類別POI點(diǎn)的數(shù)量,以此生成Xn的特征矢量。假設(shè)第m個POI類的數(shù)據(jù)量為mJ,則該類落入Xn的第Dk個緩沖區(qū)的目標(biāo)計(jì)數(shù)函數(shù)Count表示為
(1)
式中,計(jì)數(shù)判定函數(shù)I的定義為
(2)
基于以上定義,首先將Countnm&k(k=1,2,…,K)作為目標(biāo)Xn特征空間的第((m-1)·K+k)個維度,然后依次構(gòu)建Xn在M個類上的完備特征空間,最后生成所有POI點(diǎn)的特征矢量。具體的鄰近空間構(gòu)建策略如圖1所示。對于POI目標(biāo)的鄰近范圍d,首先按照緩沖區(qū)的遞增變量a,構(gòu)建目標(biāo)POI的[d/a]個圓形(或環(huán)形)緩沖區(qū),其緩沖距離區(qū)間的集合為{(0,a),(a,2a),(2a,3a),…,([d/a]×a,d)};然后,為顧及不同距離鄰域內(nèi)以及跨越緩沖區(qū)邊界的空間關(guān)系,以2a為緩沖區(qū)遞增變量,繼續(xù)生成POI的[d/a]-1個圓形(或環(huán)形)緩沖區(qū),其緩沖距離區(qū)間的集合為{(0,2a),(a,3a),(2a,4a),…,([d/a]×a-a,d)};迭代以上步驟,可分析多種距離鄰域、跨越不同范圍的空間關(guān)系;最后,引入距離區(qū)間{(0,d)}的圓形緩沖區(qū)和{(d,2d)}的環(huán)形緩沖區(qū),分別用以消除鄰近范圍d的內(nèi)硬邊界與外硬邊界的影響。
圖1 興趣點(diǎn)的多尺度緩沖區(qū)構(gòu)建(Xn為當(dāng)前POI點(diǎn))
由以上建模方式可見,鄰域范圍d是提取POI空間依賴特征的重要考慮因素。在城市分析領(lǐng)域,有研究者指出400~600 m的空間距離足以模擬城市街區(qū)和街道等尺度上的空間交互作用[20-21]。但POI通常與多個街區(qū)的空間背景有相互作用,因此選擇1000 m作為POI對象間的基本交互范圍。文獻(xiàn)[22]也證實(shí)了1000 m對于POI位置評價的有效性。圖2以包含10個類別的POI數(shù)據(jù)集為例,設(shè)置鄰近范圍d為1000 m,緩沖區(qū)遞增變量a為20 m,構(gòu)建6個遞增尺度(即20、40、60、80、100、1000 m)的緩沖區(qū)集合,則該中心POI點(diǎn)將生成2420維(即(50+49+48+47+46+2)×10維)特征屬性。此外,為訓(xùn)練本文模型,采用One-Hot技術(shù)[23](即采用N位狀態(tài)寄存器對N種類別進(jìn)行獨(dú)立編碼,且任意時刻只有一個有效狀態(tài)位)編碼POI數(shù)據(jù)的類別信息。由此生成的特征矢量不僅包含有多距離鄰域空間的POI分布信息,而且可表示POI的語義類別特征。
注:針對鄰近空間中的某一類POI,將生成242維特征;因此,如果數(shù)據(jù)包含10類POI,將總共生成2420維的特征向量。
不同類型POI的數(shù)據(jù)量具有較高的異質(zhì)特征,部分POI類型的數(shù)量差異可達(dá)數(shù)百倍(如餐廳與影劇院),這種不平衡分布是限制神經(jīng)網(wǎng)絡(luò)分類效果的關(guān)鍵因素。針對以上問題,部分學(xué)者采用集成學(xué)習(xí)、數(shù)據(jù)欠采樣及數(shù)據(jù)過采樣等策略[14-19],但對于提高POI標(biāo)簽預(yù)測精度的作用有限。相關(guān)研究指出[16],神經(jīng)網(wǎng)絡(luò)在處理分類問題上要優(yōu)于傳統(tǒng)算法,尤其是在二分類問題上的表現(xiàn)比多分類問題更為精確。本文立足于神經(jīng)網(wǎng)絡(luò)的二分類能力,耦合多個二分類前饋神經(jīng)網(wǎng)絡(luò)(binary classification feedforward neural network,BCFNN)搭建多層次POI標(biāo)簽預(yù)測模型,將POI多分類問題分解為層次二分類任務(wù),以此提高模型泛化能力。具體多層次網(wǎng)絡(luò)模型如圖3所示。
圖3 針對興趣點(diǎn)標(biāo)簽預(yù)測的多層次模型框架
圖4 興趣點(diǎn)類系劃分流程
具體過程為:
(1)將輸入類系中的各個類按數(shù)據(jù)量大小重新排序,得到類別集合{i、i+1、…、j}。設(shè)類別k為類系二分的界限類,類別k及其前面各類組成新類系1,類別k后面各類組成新類系2。
(2)按順序?qū)㈩悇eID賦值給變量k,判斷以類別k為界限類而形成的新類系1與新類系2的數(shù)據(jù)量是否在同一數(shù)量級。若是,則將類別k作為輸入類系的二分界限類進(jìn)行輸出,若不是,則取下一個類賦值給k并重復(fù)步驟(2)的判斷。
(3)需要注意的是,如果k被賦值到最后一個類別j,則直接選取倒數(shù)第2個類別j-1作為界限類,以此降低數(shù)據(jù)不平衡的影響;另外,輸入的類系中只有兩個類別時,則直接以排序后的第一個類作為界限類。
因此,本文提出的多層次模型是按數(shù)據(jù)集中各個類別數(shù)量的大小關(guān)系逐級分層構(gòu)建的,模型每一層的BCFNN網(wǎng)絡(luò)為下一層的BCFNN網(wǎng)絡(luò)提供類系再次細(xì)分的數(shù)據(jù)與對應(yīng)的標(biāo)簽,直至每一個BCFNN網(wǎng)絡(luò)劃分的類系只包含一個類別,則完成POI分類的工作。模型構(gòu)建的思想借鑒于傳統(tǒng)機(jī)器學(xué)習(xí)的決策樹模型,區(qū)別在于該模型中每一層的每一個結(jié)點(diǎn)是基于BCFNN網(wǎng)絡(luò)而非具體的類別判定條件,避免人工制定規(guī)則的限制。
該模型的BCFNN網(wǎng)絡(luò)使用sigmoid函數(shù)為激活函數(shù),L1范數(shù)函數(shù)為損失函數(shù),并采用Adam優(yōu)化算法對損失函數(shù)Loss求最小化極值,通過反向傳播實(shí)現(xiàn)對BCFNN相關(guān)參數(shù)的優(yōu)化。
試驗(yàn)數(shù)據(jù)來源于廣州市中心城區(qū)的POI數(shù)據(jù),包括10種常用的POI類型,依據(jù)高德地圖的標(biāo)簽分類體系,其具體信息如圖5和表1所示。從中可知,廣州市的POI類型分布具有較顯著的不平衡特征,餐廳、超市、生活服務(wù)3類POI數(shù)量占比超過65%,對模型預(yù)測效果構(gòu)成較大挑戰(zhàn)。
表1 廣州市城市設(shè)施興趣點(diǎn)類型信息
圖5 廣州市城市設(shè)施興趣點(diǎn)數(shù)據(jù)分布
(1)數(shù)據(jù)預(yù)處理。首先對廣州POI數(shù)據(jù)進(jìn)行特征矢量初始化,生成可直接用于多層次模型的輸入向量;然后,對每個類按1∶6的測訓(xùn)比(測試樣本量與訓(xùn)練樣本量的比例)隨機(jī)抽取數(shù)據(jù),完成測試樣本與訓(xùn)練樣本的劃分,具體如表2所示。
表2 訓(xùn)練樣本與測試樣本的對比信息
(2)模型搭建。采用python語言與Pytorch深度學(xué)習(xí)框架構(gòu)建多層次二分類神經(jīng)網(wǎng)絡(luò)模型。如圖6所示,首先將10個類別按照數(shù)據(jù)量遞增排序,其ID排序結(jié)果為{5,4,6,3,8,7,9,2,1,0};然后按照第2節(jié)的POI類系劃分方法,將各類型分層聚合,使得在同一個BCFNN網(wǎng)絡(luò)下(即同一層)的兩個類系具有相同級別的數(shù)據(jù)量,避免分布不均衡對模型精度的影響。
圖6 廣州市興趣點(diǎn)類型的多層次組織
(3)模型訓(xùn)練。依照上述搭建的基本模型結(jié)構(gòu),對各層的BCFNN網(wǎng)絡(luò)采用多線程同步訓(xùn)練,記錄下訓(xùn)練過程中的損失函數(shù)值并繪制損失曲線。如圖7所示,隨著訓(xùn)練次數(shù)的增加各個BCFNN子模型的損失已趨于收斂。
圖7 各層次BCFNN子模型損失曲線
從總體數(shù)據(jù)中抽取1/7的測試樣本作為標(biāo)簽預(yù)測目標(biāo),利用上述訓(xùn)練好的模型對每一個樣本進(jìn)行測試,將預(yù)測標(biāo)簽與真實(shí)標(biāo)簽進(jìn)行對比,模型各個層次的預(yù)測目標(biāo)數(shù)量見表3。
表3 多層次模型中各層的預(yù)測數(shù)量結(jié)果
為了驗(yàn)證POI多尺度特征對本任務(wù)的影響,本文在多層次預(yù)測模型的基礎(chǔ)上分別設(shè)置了6個POI單一尺度特征驅(qū)動的預(yù)測對比試驗(yàn),如圖8所示。結(jié)果表明,基于POI單一尺度特征的多層次模型的標(biāo)簽推斷能力不如多尺度融合特征生成的模型,由此可見,本文提出的POI多尺度依賴特征的構(gòu)建方法對提升多層次模型的預(yù)測能力具有顯著的促進(jìn)作用。
圖8 POI單一尺度和多尺度推斷精度對比
為了驗(yàn)證多層次神經(jīng)網(wǎng)絡(luò)模型對本任務(wù)的優(yōu)勢,本文選擇當(dāng)下流行的數(shù)據(jù)挖掘算法模型(即基于單層次神經(jīng)網(wǎng)絡(luò)模型[13]、基于關(guān)聯(lián)規(guī)則模型[22]、基于集成學(xué)習(xí)模型[24])和傳統(tǒng)的機(jī)器學(xué)習(xí)模型(基于隨機(jī)森林模型[19]、基于決策樹模型[25]、基于支持向量機(jī)模型[26])作為對比試驗(yàn),在同等條件下(輸入均為多尺度POI特征)對7種方法的模型預(yù)測能力進(jìn)行比較。如圖9所示,通過對比各個模型之間的混淆矩陣不難發(fā)現(xiàn),多層次神經(jīng)網(wǎng)絡(luò)模型在混淆矩陣的對角線上取得了較高的灰度值,這說明本文提出的多層次POI預(yù)測模型在先聚合小樣本數(shù)據(jù)集再逐層劃分POI類別的策略下,能夠很好地對各個類別進(jìn)行精準(zhǔn)預(yù)測。相比之下,傳統(tǒng)的數(shù)據(jù)挖掘模型和傳統(tǒng)的機(jī)器學(xué)習(xí)算法在POI標(biāo)簽預(yù)測任務(wù)中稍顯遜色:在POI分布存在嚴(yán)重分布不均衡的現(xiàn)實(shí)環(huán)境中,傳統(tǒng)模型算法會通過提高對大樣本數(shù)據(jù)集的擬合能力來降低模型損失從而提高整體的預(yù)測精度,而本文提出的多層次預(yù)測模型能較好地解決小樣本類別預(yù)測精度低的問題。
圖9 POI類別預(yù)測模型的混淆矩陣對比
如圖10所示,為了進(jìn)一步量化對比本文的多層次POI預(yù)測模型和其他6個模型的POI標(biāo)簽預(yù)測能力,采用準(zhǔn)確率(Accuracy)、精確率(Precision)、召回率(Recall)、F1分值(F1score)作為各個模型的評價指標(biāo),計(jì)算公式為
圖10 POI類別預(yù)測模型的評價指標(biāo)對比
(3)
(4)
(5)
(6)
式中,TP表示模型認(rèn)為POI為正類且其標(biāo)簽為正類標(biāo)簽;FN表示模型認(rèn)為POI為負(fù)類且其標(biāo)簽為正類標(biāo)簽;FP表示模型認(rèn)為POI為正類且其標(biāo)簽為負(fù)類標(biāo)簽;TN表示模型認(rèn)為POI為負(fù)類且其標(biāo)簽為負(fù)類標(biāo)簽;下標(biāo)K代表POI類別ID,K=0,1,2,…,9。若規(guī)定對類別m而言,類別m為正類,除類別m外的其他類為負(fù)類。試驗(yàn)結(jié)果表明,多層次神經(jīng)網(wǎng)絡(luò)模型在僅基于POI位置信息與類別信息的前提下,POI類別的總體預(yù)測準(zhǔn)確度達(dá)到66.6%,作為對比,傳統(tǒng)的機(jī)器學(xué)習(xí)算法總體準(zhǔn)確率不足50%,基于關(guān)聯(lián)規(guī)則和集成學(xué)習(xí)算法的模型總體準(zhǔn)確度甚至低于20%。這說明了本文多層次POI標(biāo)簽預(yù)測模型在POI標(biāo)簽預(yù)測任務(wù)上具有較高的可靠性。值得注意的是,在各個模型關(guān)于POI各類別的精確率對比上,總體準(zhǔn)確率最低的關(guān)聯(lián)規(guī)則模型在各POI類別上的精確率均高于本文模型。但結(jié)合兩者的混淆矩陣不難發(fā)現(xiàn),關(guān)聯(lián)規(guī)則模型善于對特征較明顯的POI進(jìn)行分類,而對于在測試集中特征較模糊的POI,關(guān)聯(lián)規(guī)則模型會趨向于將分類到某一個POI數(shù)量較多的類別上,以此來規(guī)避不必要的損失,但其帶來的結(jié)果是總體準(zhǔn)確率的大幅下滑。基于隨機(jī)森林和基于支持向量機(jī)的模型具有相似的特點(diǎn),它們在個別POI類別上有比本文模型有更高的精確率,但它們更傾向于將特征不夠明顯的POI統(tǒng)一劃分到POI數(shù)量最多的類別上從而最小化模型損失,因此它們相較于關(guān)聯(lián)規(guī)則模型有更高的準(zhǔn)確率。相比于模型精確率的評價指標(biāo),F(xiàn)1分值是模型精確率和召回率的調(diào)和平均數(shù),對模型的質(zhì)量評價更具有可信度。本文模型在總體準(zhǔn)確率占優(yōu)的情況下,在POI測試集各個類別上的F1分值也遠(yuǎn)大于其他對比模型,這說明多層次預(yù)測方法較大程度改進(jìn)了傳統(tǒng)方法的效果以及對復(fù)雜現(xiàn)實(shí)場景的適應(yīng)性。
POI是地理信息服務(wù)的重要數(shù)據(jù)源,其收集途徑的多樣性與便利性是POI數(shù)據(jù)產(chǎn)品的優(yōu)勢,但同時也帶來了諸多的數(shù)據(jù)質(zhì)量問題,例如標(biāo)簽缺失、錯誤等。如何增強(qiáng)眾源POI數(shù)據(jù)特征是地理信息領(lǐng)域的熱點(diǎn)問題。不同于一般的標(biāo)簽預(yù)測任務(wù),POI類型分布具有顯著的不平衡特征,綜合考慮空間數(shù)據(jù)特有的依賴關(guān)系、多尺度等特征,發(fā)展高精度的神經(jīng)網(wǎng)絡(luò)預(yù)測模型具有重要價值。
本文旨在解決POI標(biāo)簽預(yù)測的兩個關(guān)鍵問題,即多尺度特征矢量初始化、不平衡類型分布的標(biāo)簽預(yù)測。首先,依據(jù)空間依賴等地理學(xué)知識,提取目標(biāo)周圍POI類型分布信息,作為當(dāng)前POI的特征空間;考慮到鄰近空間的多尺度特性,提出了基于多緩沖區(qū)的特征矢量初始化方法,可有效考慮不同尺度空間關(guān)聯(lián)對POI標(biāo)簽預(yù)測的影響。其次,針對不同POI類型的數(shù)據(jù)量差異,提出了一種新的多層次神經(jīng)網(wǎng)絡(luò)模型,將復(fù)雜的多分類問題分解為簡單二分類任務(wù),提高模型對不同類型數(shù)據(jù)的泛化能力和預(yù)測精度。由于本方法只需利用POI的位置數(shù)據(jù)和類別信息,其比較傳統(tǒng)方法具有更廣泛的應(yīng)用場景。通過對比試驗(yàn)發(fā)現(xiàn),多層次模型比傳統(tǒng)關(guān)聯(lián)規(guī)則模型與集成學(xué)習(xí)方法的精度更高。后續(xù)研究將基于多層次組織策略,融合POI多源屬性數(shù)據(jù)(如簽到行為數(shù)據(jù)等)[27-28],并基于不同地區(qū)POI分布特征設(shè)計(jì)空間鄰域范圍的自適應(yīng)確定算法,進(jìn)一步優(yōu)化該模型,提高方法的預(yù)測精度。此外,多層次神經(jīng)網(wǎng)絡(luò)為空間目標(biāo)的標(biāo)簽預(yù)測提供了一種新思路,不僅可用于POI數(shù)據(jù),也可用于路網(wǎng)弧段、建筑物等其他類型目標(biāo)。