張銘龍,何貞銘*
(1.長江大學(xué)地球科學(xué)學(xué)院,湖北 武漢 430100)
商業(yè)中心是城市商圈形成的前提條件,是一個(gè)地區(qū)城市化進(jìn)程的關(guān)鍵部分。商業(yè)中心布局隨城市結(jié)構(gòu)的發(fā)展而改變。城市商業(yè)中心的變化往往暗示了城市空間結(jié)構(gòu)的變化[1]。因此,商業(yè)中心的信息挖掘在城市規(guī)劃以及改善城市結(jié)構(gòu)中扮演了十分重要的角色。近年來,POI數(shù)據(jù)作為當(dāng)今地理數(shù)據(jù)中的研究熱門,其擁有數(shù)據(jù)量大、用戶參與廣、更新快和位置精度高的特點(diǎn)。曹芳潔等[2]利用POI數(shù)據(jù)進(jìn)行核密度運(yùn)算和度量指標(biāo)運(yùn)算,最終確定了北京市商業(yè)中心集聚區(qū)和商業(yè)空間格局。
因子分析法是一種包含降維的思想,是把復(fù)雜的變量轉(zhuǎn)化為簡單因子的算法[3]。本文依據(jù)商業(yè)POI數(shù)據(jù), 利用DBSCAN聚類分析法和密度因子分析法, 保證數(shù)據(jù)的精確度,驗(yàn)證算法的可依托程度,對武漢市商業(yè)中心的抽取進(jìn)行探究,并分析提取后的商業(yè)中心分布情況和發(fā)展程度。
武漢市位于長江中游中部地區(qū)、湖北省東部,是國家區(qū)域中心城市(華中)、湖北省省會、長江中游重要的中心城市、輻射帶動?xùn)|西部地區(qū)發(fā)展的國家重要門戶城市[4]。
商業(yè)POI數(shù)據(jù)來自城市數(shù)據(jù)派網(wǎng)站,包括2017年 武漢市商業(yè)性質(zhì)POI數(shù)據(jù),其數(shù)量為3 402個(gè),商業(yè)數(shù)據(jù)分類內(nèi)容商場、超市、便民商店/便利店、專賣店、個(gè)人用品/化妝品店、家居建材市場、文化用品店、中介機(jī)構(gòu)、樓宇、綜合市場。其余數(shù)據(jù)出自 2017年武漢統(tǒng)計(jì)年鑒的部分內(nèi)容。
本文所用的POI數(shù)據(jù)與城市、社會、生活和服務(wù)密切相關(guān),可以系統(tǒng)地反映城市空間特征和屬性關(guān)系?;赑OI數(shù)據(jù)挖掘城市中隱含的信息,具有重要的理論價(jià)值和現(xiàn)實(shí)意義[5-6]。
DBSCAN 算法是密度聚類的典型代表,由Ester 等[7]提出。DBSCAN算法最大的優(yōu)點(diǎn)是聚類速度快,可以有效地處理噪聲點(diǎn),找到任意形狀的空間聚類[8];另外,DBSCAN算法可以有效地解決數(shù)據(jù)量大且興趣點(diǎn)重疊并相互覆蓋的問題。從宏觀角度來看分布規(guī)律,數(shù)據(jù)的位置精確度保持在細(xì)節(jié)層面上[9]。 本文利用spyder軟件對python語言中的DBSCAN算法進(jìn)行編程,對武漢商業(yè)POI數(shù)據(jù)進(jìn)行聚類分析。DBSCAN算法流程如圖1所示。
圖1 DBSCAN算法流程圖
本文將設(shè)Eps為0.02,minpoints為35,計(jì)算得出其噪聲比為30.60%。最后將武漢市原始商業(yè)POI用地與聚類分析后的商業(yè)POI用地進(jìn)行對比,排除了 1 041個(gè)噪聲點(diǎn),得出DBSCAN算法有較好的數(shù)據(jù)篩選效果(圖2)。
圖2 武漢市原始商業(yè)POI用地與聚類分析后的 商業(yè)POI用地對比情況圖
本文擬采用定量的方式挖掘每個(gè)POI點(diǎn)的發(fā)展程度,空間分析單元以城市商業(yè)POI數(shù)據(jù)作為微觀層面的指標(biāo)。通過ArcGIS Pro和SPSS軟件采取不同的分析方法來分別獲取評判商業(yè)中心的指標(biāo)數(shù)據(jù),其包括人口密度、服務(wù)業(yè)產(chǎn)業(yè)指數(shù)、最近道路距離、道路密度、商業(yè)聚集程度和所在行政區(qū)面積,密度因子分析算法的過程如圖3所示。
圖3 密度因子分析算法流程
首先,人口密度popDen(si)、服務(wù)業(yè)產(chǎn)業(yè)指數(shù)tertiary(si)數(shù)據(jù)均來自武漢統(tǒng)計(jì)年鑒,最近道路距離neardist(si)和所在行政區(qū)面積shpArea(si)通過ArcGIS中的鄰近分析中的距離和面積計(jì)算功能得到。
其次,構(gòu)造點(diǎn)實(shí)體建立Delaunay三角剖分的方法用于構(gòu)造點(diǎn)實(shí)體的類Voronoi空間剖分圖(Thiessen多邊形)[10],挖掘其興趣點(diǎn)密度聚集程度,定義商業(yè)POI聚集程度為:
式中,si代表商業(yè)POI點(diǎn);Den(si)是點(diǎn)的密度聚集程度;AVi是在商業(yè)POI范圍內(nèi)的類Voronoi圖面積。密度聚集程度的范圍取0~1之間,值越大,表明si的周圍的類Voronoi圖面積越小,商業(yè)POI呈聚集分布特征, 點(diǎn)si處在商業(yè)中心的可能性越大;值越小,點(diǎn)si與其被包含的多邊形之間的區(qū)域差異越大,其比例或相鄰空間在商業(yè)功能上的聚合能力越小。
最后通過點(diǎn)緩沖區(qū)分析計(jì)算道路網(wǎng)絡(luò)密度,定義道路網(wǎng)絡(luò)密度計(jì)算公式:
式中,si表示商業(yè)POI點(diǎn);RoadDen(si)是商業(yè)POI的道路網(wǎng)絡(luò)密度;AVi是si的緩沖區(qū)面積(緩沖區(qū)半徑取500m);LPi是si緩沖區(qū)范圍內(nèi)所有道路長度 之和。
首先標(biāo)準(zhǔn)化原始數(shù)據(jù),消除不同變量的量綱影響;經(jīng)過計(jì)算城市商業(yè)中心的KMO值為0.699>0.6,Bartlett球度檢驗(yàn)顯著性P(Sig.)=0.00<0.05,說明因子分析可以取得更好的結(jié)果,因此原始數(shù)據(jù)適用于因子分析;因子分析法有多種抽取方法和旋轉(zhuǎn)方法,為了最大程度反映原始變量的信息量和更好地解釋公因子的含義[11],本文通過SPSS軟件采用主成分抽取和最大方差旋轉(zhuǎn)方法獲取兩個(gè)主成分,主成分一(F1)用于反映綜合兩類特征的變化情況,主成分二(F2)偏向于反映綜合幾何特征;基于因子得分系數(shù)和原始變量的標(biāo)準(zhǔn)化值統(tǒng)計(jì)出各個(gè)POI的商業(yè)中心密度指數(shù)(F),并將計(jì)算結(jié)果F歸一化到[0,10]區(qū)間,其主成分參數(shù)參見表1,計(jì)算公式如式3、4和5 所示。
表1 主成分參數(shù)表
經(jīng)過因子分析法評價(jià)后的點(diǎn)數(shù)據(jù)集,通過基于密度屬性的聚類[12]進(jìn)行下一步的數(shù)據(jù)清洗與分類,其過程為:
1)選擇最大密度作為初始聚類中心。
2)根據(jù)廣度優(yōu)先遍歷方法搜索該對象的直接鄰居,聚類滿足閾值的對象,并進(jìn)行標(biāo)記。
3)循環(huán)步驟1)和步驟2),依次搜索對象的間接鄰居,向外擴(kuò)散,將符合閾值的對象添加到集群,不合適的對象標(biāo)記為噪聲,并將其刪除。
經(jīng)過分析后,在武漢市三環(huán)以內(nèi)的區(qū)域提取出 13個(gè)不同的商業(yè)POI點(diǎn)數(shù)據(jù)集,可以作為武漢市商業(yè)布局的空間分布,通過ArcGIS中的中心性特征分析抽取出13個(gè)商業(yè)中心(圖4)。
圖4 提取的商業(yè)布局空間分布與抽取出的武漢市商業(yè)中心
隨著經(jīng)濟(jì)的發(fā)展,城市基礎(chǔ)建設(shè)的完善,城市商業(yè)中心開始由單中心模式向多中心模式轉(zhuǎn)變,使得商業(yè)中心的服務(wù)范圍覆蓋整個(gè)城市[13]。本文從城市商業(yè)中心的抽取、POI數(shù)據(jù)使用與分析這兩個(gè)方面進(jìn)行了相關(guān)研究和算法開發(fā),通過python進(jìn)行DBSCAN算法的設(shè)計(jì)與改進(jìn),利于ArcGIS進(jìn)行緩沖區(qū)分析、Delaunay三角網(wǎng)和Voronoi圖的構(gòu)建,然后進(jìn)行相關(guān)因子得分和各屬性值的加權(quán)統(tǒng)計(jì),得到相關(guān)密度評價(jià)數(shù)據(jù),最后對商業(yè)中心進(jìn)行抽取。實(shí)驗(yàn)結(jié)果表明,聚類分析DBSCAN與密度因子分析算法在商業(yè)POI數(shù)據(jù)的支撐下,能有效地抽取出大部分的商業(yè)中心。該算法還存在著一些不足和一定的誤差,后期應(yīng)該加入點(diǎn)評POI數(shù)據(jù),提高數(shù)據(jù)的完整度,并且將盡可能多的影響指標(biāo)因素考慮在因子分析算法中。