牛 強(qiáng)
中國(guó)城市規(guī)劃的大數(shù)據(jù)時(shí)代已經(jīng)來(lái)臨。從學(xué)術(shù)交流來(lái)看,2013年開始,中國(guó)城市規(guī)劃年會(huì)已經(jīng)連續(xù)兩年舉辦了關(guān)于大數(shù)據(jù)的自由論壇——“大數(shù)據(jù)時(shí)代的城鄉(xiāng)規(guī)劃與智慧城市”和“大數(shù)據(jù)和城鄉(xiāng)治理”,反響非常強(qiáng)烈。從研究機(jī)構(gòu)來(lái)看,北京城市實(shí)驗(yàn)室BCL、北京西城-清華同衡城市數(shù)據(jù)實(shí)驗(yàn)室UDL、南京大學(xué)城市規(guī)劃設(shè)計(jì)研究院規(guī)劃技術(shù)協(xié)同創(chuàng)新中心等開始先后研究城市大數(shù)據(jù),一些自媒體網(wǎng)站如城市數(shù)據(jù)派UDParty、城市界面CITYIF等先后成立并介紹關(guān)于城市大數(shù)據(jù)的研究成果。從開放數(shù)據(jù)來(lái)源來(lái)看,近年來(lái)國(guó)際上許多知名的開放數(shù)據(jù)組織開始支持國(guó)內(nèi)數(shù)據(jù)訪問(wèn),如開放街道地圖OSM、知識(shí)共享CC、開放知識(shí)基金會(huì)OKFN等;中國(guó)政府也在有序推進(jìn)政府信息公開工作,如天地圖、北京市政務(wù)數(shù)據(jù)資源網(wǎng)、上海政府?dāng)?shù)據(jù)服務(wù)網(wǎng)等;大批互聯(lián)網(wǎng)公司開始在一定程度上開放自己的數(shù)據(jù),或者提供開放的API,如新浪微博、大眾點(diǎn)評(píng)網(wǎng)、百度等。
學(xué)者們利用這些城市大數(shù)據(jù)進(jìn)行了卓有成效的研究,取得了傳統(tǒng)數(shù)據(jù)環(huán)境下無(wú)法企及的成果,而大數(shù)據(jù)的空間化是開展這些研究的有效途徑。
數(shù)據(jù)收集一直以來(lái)在城市規(guī)劃編研中占據(jù)著十分重要的位置,但傳統(tǒng)數(shù)據(jù)收集方式(如實(shí)地調(diào)研、問(wèn)卷、統(tǒng)計(jì)資料等)存在樣本數(shù)量小、主觀性強(qiáng)、成本高、周期長(zhǎng)等缺陷。大數(shù)據(jù)時(shí)代的到來(lái)極大地拓展了城市規(guī)劃數(shù)據(jù)獲取的渠道,為城市規(guī)劃提供了大量高價(jià)值的數(shù)據(jù),概括起來(lái)可以分為以下7類。
(1)業(yè)務(wù)運(yùn)營(yíng)數(shù)據(jù),例如公交IC刷卡數(shù)據(jù)、水電煤氣數(shù)據(jù)、業(yè)務(wù)審批數(shù)據(jù)、出租車GPS軌跡數(shù)據(jù)、移動(dòng)通訊數(shù)據(jù)、金融數(shù)據(jù)、物流數(shù)據(jù)、超市購(gòu)物數(shù)據(jù)、就醫(yī)數(shù)據(jù)等。
(2)普查數(shù)據(jù),例如人口普查、經(jīng)濟(jì)普查等。
(3)監(jiān)控?cái)?shù)據(jù),例如視頻監(jiān)控、交通監(jiān)控、環(huán)境監(jiān)控等。
(4)社會(huì)網(wǎng)絡(luò)數(shù)據(jù),例如微博、論壇等。
(5)主動(dòng)感知數(shù)據(jù),例如關(guān)于溫度、濕度、PM2.5等環(huán)境的感知數(shù)據(jù)、手機(jī)定位數(shù)據(jù)等。
(6)遙感數(shù)據(jù),例如航空遙感和航天遙感數(shù)據(jù)等。
(7)GIS數(shù)據(jù),例如關(guān)于道路、建筑、行政區(qū)劃的地形數(shù)據(jù)等。
上述這些大數(shù)據(jù)都具有典型的5V特征,即Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價(jià)值)、Veracity(真實(shí)性)。對(duì)城市大數(shù)據(jù)全樣本的分析,對(duì)于推動(dòng)城市規(guī)劃朝著精細(xì)化、準(zhǔn)確化、科學(xué)化方向發(fā)展具有革新性的意義。但是這些數(shù)據(jù)數(shù)量龐大、結(jié)構(gòu)多樣,利用起來(lái)技術(shù)難度較大,而空間化技術(shù)可以在一定程度上方便它們的利用。
較之其他大數(shù)據(jù),城市大數(shù)據(jù)的一個(gè)突出特點(diǎn)是它們大多和空間位置有一定的關(guān)系,要么是關(guān)于某地的信息,例如某街區(qū)的人口、經(jīng)濟(jì)、環(huán)境等;要么是發(fā)生在某地的信息,例如發(fā)生在某地的犯罪、通訊、交通等。
城市大數(shù)據(jù)的空間化就是要把這些信息以空間的方式組織起來(lái),并通過(guò)二維、三維地圖展現(xiàn)出來(lái),從而方便查看和空間分析。下面介紹幾類典型城市大數(shù)據(jù)空間化的效果。
(1)公交刷卡數(shù)據(jù)的空間化
公交刷卡數(shù)據(jù)是典型的大數(shù)據(jù),它反映了市民的公交通勤軌跡,基于它可以分析城市的職住分布、居住與就業(yè)特征、居民的通勤等。龍瀛等(2012)對(duì)北京的公交IC刷卡數(shù)據(jù)進(jìn)行了空間化(圖1),用于通勤分析、職住分析、人的行為分析、人的識(shí)別、重大事件影響分析、規(guī)劃項(xiàng)目實(shí)施評(píng)估分析等。
圖1 基于公交IC刷卡的北京市中心區(qū)通勤
圖2 武漢某時(shí)段的實(shí)時(shí)交通量
圖3 六普數(shù)據(jù)空間化得到的2010年人口密度圖
圖4 2000 年全國(guó)縣級(jí)農(nóng)業(yè)統(tǒng)計(jì)數(shù)據(jù)的空間化
(2)交通量數(shù)據(jù)的空間化
交通量監(jiān)測(cè)數(shù)據(jù)的數(shù)據(jù)量十分巨大,空間化是查閱分析它的有力手段。圖2顯示了百度地圖對(duì)城市實(shí)時(shí)交通量數(shù)據(jù)的空間化效果。它根據(jù)各條道路上的交通量,用不同顏色繪制道路,從而反映出某時(shí)段整個(gè)城市的交通量分布情況。
(3)人口數(shù)據(jù)的空間化
全國(guó)人口普查數(shù)據(jù)是典型的大數(shù)據(jù),該數(shù)據(jù)具有普查區(qū)信息,標(biāo)識(shí)了其空間位置。毛其智、龍瀛、吳康(2014)對(duì)“五普”和“六普”的人口數(shù)據(jù)按照普查區(qū)進(jìn)行了空間化,得到了全國(guó)鄉(xiāng)鎮(zhèn)和街道尺度的細(xì)粒度人口密度圖(圖3)。它將一條條難以查看的普查數(shù)據(jù)關(guān)聯(lián)到地圖上的普查小區(qū),變成了一幅高精度的人口密度圖,圖中顏色的深淺變化代表了人口密度的高低。較之傳統(tǒng)的粗粒度、大尺度的人口分布圖,該方式極大地提升了人口大數(shù)據(jù)的科研價(jià)值和使用效果。
(4)經(jīng)濟(jì)普查數(shù)據(jù)的空間化
經(jīng)濟(jì)普查產(chǎn)生了大量高價(jià)值的經(jīng)濟(jì)數(shù)據(jù),除了用于傳統(tǒng)數(shù)理分析,目前不少學(xué)者將其空間化(圖4),從而可以開展經(jīng)濟(jì)空間分析,包括產(chǎn)業(yè)、就業(yè)、經(jīng)濟(jì)密度等空間分布、產(chǎn)業(yè)空間聚類等。
(5)移動(dòng)終端位置信息的空間化
人類行為數(shù)據(jù)的采集是研究人類空間行為的關(guān)鍵,但傳統(tǒng)問(wèn)卷和普查的方式工作量極大、效率低、精度不高。當(dāng)前大數(shù)據(jù)為這些研究提供了詳實(shí)的一手資料,其信息主要來(lái)源于手機(jī)中的LBS(基于地理位置的服務(wù)),它通過(guò)移動(dòng)終端和移動(dòng)網(wǎng)絡(luò)的配合,確定移動(dòng)用戶的實(shí)際地理位置,百度和谷歌根據(jù)這類服務(wù)主動(dòng)收集了大量用戶的位置信息。這些位置信息可以反映人類活動(dòng)的時(shí)空軌跡。
例如,“百度遷徙”對(duì)其擁有的LBS大數(shù)據(jù)進(jìn)行空間化,全程、動(dòng)態(tài)、即時(shí)、直觀地展現(xiàn)2014年中國(guó)春節(jié)前后人口大遷徙的軌跡與特征(圖5)。
(6)社交數(shù)據(jù)的空間化
社交數(shù)據(jù)是反映人類活動(dòng)和聯(lián)系交往的重要信息。當(dāng)前網(wǎng)絡(luò)環(huán)境下的微博、博客提供了新型的社交平臺(tái),并產(chǎn)生了數(shù)量巨大的社交大數(shù)據(jù),這極大地彌補(bǔ)了社交數(shù)據(jù)難以采集的問(wèn)題。對(duì)社交數(shù)據(jù)的空間化可以反映社交的空間分布以及兩地之間的聯(lián)系強(qiáng)度。因此,目前許多學(xué)者利用了微博數(shù)據(jù)中的位置信息來(lái)開展研究,例如王江浩抓取了帶有位置信息的微博數(shù)據(jù),并以此得到了全國(guó)各省市的人類活動(dòng)強(qiáng)度和區(qū)域聯(lián)系度(圖6)。
(7)犯罪數(shù)據(jù)的空間化
毛媛媛等(2014)對(duì)上海市浦東新區(qū)某時(shí)間段的兩起刑事案件根據(jù)其發(fā)生位置進(jìn)行了空間化,直觀反映出犯罪的空間分布(圖7),用于分析其與城市空間環(huán)境的關(guān)系。
圖5 2014年春節(jié)期間人口遷徙圖
圖6 基于帶地理位置微博數(shù)據(jù)得到的江蘇省人類活動(dòng)強(qiáng)度圖
圖7 犯罪數(shù)據(jù)的空間化
城市大數(shù)據(jù)空間化后,信息變得直觀,并拓展了分析和利用途徑,可以更加有效地支持信息發(fā)掘和知識(shí)發(fā)現(xiàn)。
(1)用于信息內(nèi)容的空間可視化
“一張圖勝過(guò)一千句話”,這是對(duì)圖紙信息表現(xiàn)力的客觀評(píng)價(jià)。城市大數(shù)據(jù)由于數(shù)據(jù)量極其龐大,要直觀反映其中的內(nèi)容是非常困難的。而空間化后,用二、三維地圖反映其空間分布,用顏色、線型反映信息的內(nèi)容(如GDP、人口數(shù)量、交通量等),繁雜的信息就能變得有序、易懂。如此就可以將大數(shù)據(jù)中的數(shù)字轉(zhuǎn)化為對(duì)城市的理解。前述各典型大數(shù)據(jù)空間化后得到的圖紙都是其信息表現(xiàn)力的有力證明。
(2)用于空間分析,挖掘空間知識(shí)
城市大數(shù)據(jù)空間化后,大量的空間分析方法都可以被使用,從而極大地拓寬了分析手段。這些空間分析類型眾多,基于分析目的可以分為以下5類:空間特征分析、模式和格局分析、空間關(guān)系和成因分析、趨勢(shì)分析和預(yù)測(cè)、評(píng)價(jià)。
1)空間特征分析:通過(guò)空間統(tǒng)計(jì)、密度分析等方法得到研究對(duì)象時(shí)空分布和演變的特征。例如對(duì)人口普查數(shù)據(jù)空間化后可以分析其空間分布特征,在對(duì)出租車軌跡數(shù)據(jù)分析的基礎(chǔ)上得到出行方式、通勤時(shí)間、出行人群識(shí)別和比例等。
2)模式和格局分析:通過(guò)空間自相關(guān)分析、熱點(diǎn)分析、空間聚類等方法找到研究對(duì)象空間分布的格局和模式。例如對(duì)社交網(wǎng)絡(luò)數(shù)據(jù)空間化后可以識(shí)別城市網(wǎng)絡(luò)體系、城市間的聯(lián)系和等級(jí)結(jié)構(gòu),識(shí)別不同類型人群及其聚積方式、范圍。
3)空間關(guān)系和成因分析:通過(guò)空間回歸分析等揭示變量之間的統(tǒng)計(jì)因果關(guān)系。例如分析人口空間分布和水電煤氣消耗、道路交通量的關(guān)系,城市環(huán)境質(zhì)量和經(jīng)濟(jì)、人口分布、交通網(wǎng)絡(luò)之間的關(guān)系等。
4)趨勢(shì)分析和預(yù)測(cè):預(yù)測(cè)是大數(shù)據(jù)的核心,大數(shù)據(jù)空間化后可以預(yù)測(cè)交通擁堵點(diǎn)發(fā)生的時(shí)間地點(diǎn)、預(yù)測(cè)環(huán)境即將惡化的區(qū)域、預(yù)測(cè)人行為的路徑、預(yù)測(cè)犯罪可能會(huì)發(fā)生的區(qū)域等。
5)評(píng)價(jià):按照評(píng)價(jià)模型,分區(qū)域?qū)ι鐣?huì)、經(jīng)濟(jì)、城市管理、交通、環(huán)境、滿意度、規(guī)劃實(shí)施等進(jìn)行評(píng)價(jià)。
此外,大數(shù)據(jù)的最大魅力在于隱藏于其中的各類知識(shí),數(shù)據(jù)挖掘是發(fā)現(xiàn)這些知識(shí)的重要途徑。大數(shù)據(jù)空間化后,利用空間數(shù)據(jù)挖掘則可以發(fā)掘出空間知識(shí),這正是城市研究的目標(biāo)之一。空間數(shù)據(jù)挖掘是指從空間數(shù)據(jù)庫(kù)中抽取沒有清楚表現(xiàn)出來(lái)的隱含的知識(shí)和空間關(guān)系,并發(fā)現(xiàn)其中有用的特征和模式的理論、方法和技術(shù),可以找到空間關(guān)聯(lián)規(guī)則,對(duì)數(shù)據(jù)進(jìn)行分類和聚類,歸納出一般規(guī)則和模式,發(fā)現(xiàn)空間特征、探測(cè)趨勢(shì)等。
(3)用于城市大數(shù)據(jù)之間的信息集成和綜合分析
基于相同空間位置可以在多個(gè)大數(shù)據(jù)之間建立聯(lián)系,把不同來(lái)源的大數(shù)據(jù)集成起來(lái),為之后的高效數(shù)據(jù)挖掘和分析做好準(zhǔn)備。例如針對(duì)同一街道的人口普查數(shù)據(jù)和經(jīng)濟(jì)普查數(shù)據(jù),由于具有相同的空間位置,兩者可以對(duì)應(yīng)起來(lái),整合成人口和經(jīng)濟(jì)大數(shù)據(jù)。多個(gè)大數(shù)據(jù)聯(lián)合起來(lái)后往往會(huì)比單個(gè)大數(shù)據(jù)更具價(jià)值,例如把人口和交通大數(shù)據(jù)聯(lián)合起來(lái)就更容易發(fā)現(xiàn)交通和人口之間的關(guān)系,找到交通擁堵的原因和防治措施。
(4)用于城市大數(shù)據(jù)的空間檢索查詢
面對(duì)無(wú)比龐大的大數(shù)據(jù),傳統(tǒng)基于關(guān)鍵詞、主題詞的檢索往往達(dá)不到預(yù)期效果,因?yàn)獒槍?duì)大數(shù)據(jù)的檢索結(jié)果往往也會(huì)條目眾多,而要從中找到目標(biāo)信息仍猶如大海撈針。對(duì)大數(shù)據(jù)空間化后,可以基于空間位置來(lái)檢索,其檢索精度和效率都相對(duì)高得多。用戶可以在地圖上指定查詢的空間位置,例如某條道路、某棟建筑、某個(gè)街區(qū)等,然后檢索得到這個(gè)位置上的相關(guān)數(shù)據(jù),而把不在該位置的其余數(shù)據(jù)過(guò)濾掉,檢準(zhǔn)率和檢全率都比較高,操作相對(duì)簡(jiǎn)單,并且檢索結(jié)果也能用地圖來(lái)表達(dá)其內(nèi)容。
根據(jù)當(dāng)前的技術(shù)條件,可以采用以下兩種方法對(duì)城鄉(xiāng)規(guī)劃大數(shù)據(jù)進(jìn)行空間化,它們都需要借助GIS平臺(tái)來(lái)實(shí)現(xiàn)。
(1)基于大數(shù)據(jù)中自帶或關(guān)聯(lián)的地理坐標(biāo)信息
部分大數(shù)據(jù)直接帶有或可以關(guān)聯(lián)上地理坐標(biāo)信息。例如微博簽到數(shù)據(jù)、出租車GPS軌跡數(shù)據(jù)、LBS(基于地理位置的服務(wù))數(shù)據(jù)等直接帶有地理坐標(biāo)信息。通用GIS(地理信息系統(tǒng))平臺(tái)一般都可以將這些地理坐標(biāo)轉(zhuǎn)換成地圖上的點(diǎn),并把其他信息附加到點(diǎn)上。例如ArcGIS提供了“創(chuàng)建XY事件圖層”工具,根據(jù)數(shù)據(jù)表中每行記錄的 X 和 Y 坐標(biāo)字段創(chuàng)建新的點(diǎn)圖,并附上所有其他字段信息。
人口普查、經(jīng)濟(jì)普查、公交刷卡等帶有標(biāo)識(shí)其空間位置的代碼,可以根據(jù)空間位置代碼關(guān)聯(lián)上普查小區(qū)、站點(diǎn)等地理要素,進(jìn)而獲得地理位置信息。以公交刷卡數(shù)據(jù)為例,如果刷卡記錄中有起訖站點(diǎn)的編號(hào)(公交車刷卡可能只有上車站點(diǎn)編號(hào)),同時(shí)手邊還有關(guān)于站點(diǎn)位置的GIS數(shù)據(jù),那么就可以根據(jù)共同的站點(diǎn)編號(hào)將刷卡記錄鏈接到站點(diǎn)位置GIS數(shù)據(jù)上,從而實(shí)現(xiàn)刷卡數(shù)據(jù)的空間化。
(2)基于大數(shù)據(jù)中的地址、地名信息
城市業(yè)務(wù)部門產(chǎn)生的大數(shù)據(jù)一般都會(huì)帶有地址信息,例如水電煤氣數(shù)據(jù)、物流數(shù)據(jù)等都會(huì)帶有用戶的地址?;诘刂窋?shù)據(jù)庫(kù)和GIS提供的地址匹配功能,可以自動(dòng)實(shí)現(xiàn)其空間化。地理匹配的過(guò)程是先對(duì)含有地址屬性的每個(gè)記錄和帶有地址屬性的GIS空間參照要素進(jìn)行比較,如果找到匹配,GIS空間參照要素上的地理坐標(biāo)就被分配給相應(yīng)的記錄,從而可以在GIS中作為地圖顯示并用作進(jìn)一步的分析。ArcGIS的Geocoding提供了上述功能。
當(dāng)前我國(guó)城市規(guī)劃領(lǐng)域?qū)Υ髷?shù)據(jù)的關(guān)注程度日益高漲,對(duì)大數(shù)據(jù)能帶給規(guī)劃界的成果充滿期待,但關(guān)于城市大數(shù)據(jù)的研究才剛剛起步,手段也不夠豐富。空間化為城市大數(shù)據(jù)的研究提供了一條有效途徑,是城市大數(shù)據(jù)可視化的有力方式,是開展大數(shù)據(jù)空間分析的前提,是實(shí)現(xiàn)多源大數(shù)據(jù)融合的紐帶。
當(dāng)前的GIS平臺(tái)正在積極支持這一途徑,例如ESRI公司提供的GIS Tools for Hadoop能夠?qū)崿F(xiàn)對(duì)存放在Hadoop中的大數(shù)據(jù)進(jìn)行讀取、空間可視化和空間分析。而ESRI的城市瞭望臺(tái)(Urban Observatory)項(xiàng)目,則正在基于空間將全球55個(gè)大城市的大數(shù)據(jù)整合到一個(gè)平臺(tái)下,通過(guò)互動(dòng)地圖將城市大數(shù)據(jù)轉(zhuǎn)化成對(duì)城市的理解。筆者深信,隨著越來(lái)越強(qiáng)大的空間分析工具的出現(xiàn),隨著智慧城市的推進(jìn)和越來(lái)越多的開放大數(shù)據(jù)的供給,大數(shù)據(jù)將會(huì)離普通規(guī)劃師越來(lái)越近,終將成為開展城市規(guī)劃必不可少的技術(shù)支撐。
References
[1]龍瀛,崔承印,張宇,等. 利用公交一卡通刷卡數(shù)據(jù)評(píng)價(jià)北京職住分離的空間差異[C]//多元與包容——2012中國(guó)城市規(guī)劃年會(huì)論文集,2012.LONG Ying,CUI Chengyin,ZHANG Yu,et al. Using Public Transport Smart Card Data to Evaluate Spatial Difference of Jobs-housing Separation in Beijing[C]//2012 Annual National Planning Conference,2012.
[2]毛其智,龍瀛,吳康. 中國(guó)人口密度的時(shí)空演變與城鎮(zhèn)化空間格局初探:2000—2010[R]. 北京城市實(shí)驗(yàn)室工作論文,2014.MAO Qizhi,LONG Ying,WU Kang.Spatiotemporal Changes of Population Density and Urbanization Pattern in China:2000—2010[R].Beijing City Lab,Working Paper,2014.
[3]齊麗麗,柏延臣. 社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)熱點(diǎn)探測(cè)的MAUP效應(yīng)[J]. 地理學(xué)報(bào),2012(10):1317-1326.QI Lili,BO Yanchen. MAUP Effects on the Detection of Spatial Hot Spots in Socio-economic Statistical Data[J]. Acta Geographica Sinica,2012(10):1317-1326.
[4]茅明睿. 大數(shù)據(jù)時(shí)代的城市規(guī)劃[EB/OL].城市數(shù)據(jù)派論壇, http://www.udparty.com/news.php?act=view&id=443,2014.MAO Mingrui. Urban Planning in the Age of Big Data[EB/OL]. Urban Data Party,http://www.udparty.com/news.php?act=view&id=443,2014.
[5]毛媛媛,丁家駿. 搶劫與搶奪犯罪行為時(shí)空分布特征研究——以上海市浦東新區(qū)為例[J]. 人文地理,2014(1):49-54.MAO Yuanyuan,DING Jiajun. Study on Spatialtemporal Patterns of Robbery and Snatch:A Case Study of Pudong New Area,Shanghai[J]. Human Geography,2014(1):49-54.
[6]秦蕭,甄峰. 基于大數(shù)據(jù)應(yīng)用的城市空間研究進(jìn)展與展望[C]//城市時(shí)代,協(xié)同規(guī)劃——2013中國(guó)城市規(guī)劃年會(huì)論文集,2013.QIN Xiao,ZHEN Feng. Research Progress and Prospect of Urban Spatial Studies Based on Big Data Application[C]//2013 Annual National Planning Conference,2013.
[7]維克托?邁爾-舍恩伯格,肯尼思?庫(kù)克耶. 大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革[M]. 盛楊燕,周濤,譯. 杭州:浙江人民出版社,2013.Viktor Mayer-Schonberger,Kenneth Cukier. Big Data:A Revolution that will Transform How We Live,Work,and Think[M]. SHENG Yangyan,ZHOU Tao,translate. Hangzhou:Zhejiang People’s Publishing House,2013.
[8]牛強(qiáng),宋小冬. 城建檔案管理中的地理空間序化方法研究[J]. 城建檔案,2010(11):53-57.Niu Qiang, Song Xiaodong. The Research on Geographical Spatial Ordering Method in Urban Construction Archive management[J]. The Urban Construction Archives Magazine,2010(11):53-57.