張珊珊,何正國
1. 廣州市城市規(guī)劃勘測設計研究院,廣東 廣州 510640;
2. 廣州市城市規(guī)劃自動化中心,廣東 廣州 510030
城市實有數(shù)據(jù)自1997年公安部蘇州會議[1]提出后,已有上海、湖南、廣州等城市實施落地?!八膶崱睌?shù)據(jù)是實有數(shù)據(jù)的一種,包括實有人口、實有房屋、實有單位與實有設施,是一種表達城市人口、建筑及設施等要素的新型數(shù)據(jù)類型。實有數(shù)據(jù)與傳統(tǒng)的城市人口及建筑以行政區(qū)劃做總量統(tǒng)計,以及測繪體系下類型化要素表達不同,“四實”數(shù)據(jù)針對人口、建筑、就業(yè)單位及服務設施的采集尺度與對象聚焦到獨立地理實體目標上,是一種以最小空間粒度劃分、全息采集的新型地理空間數(shù)據(jù)采集方式,具有以地理實體為典型數(shù)據(jù)特征的新型基礎測繪數(shù)據(jù)的特點。
當前,有關“四實”數(shù)據(jù)的研究較為有限,姜玉[2]、李菁[3]等針對北京和上海實有人口數(shù)據(jù)的類型及規(guī)范性等質(zhì)量問題進行了研究,何華貴等[4]研究了智慧廣州時空云平臺實現(xiàn)“四實”數(shù)據(jù)的地址化標準化方法。在地理實體的新型基礎測繪研究方面,李景文[5]、龔健雅[6]等學者研究了地理實體基本理論,閭國年[7]、彭清山[8]等學者研究了地理實體的類型化,從空間形態(tài)、應用方向等角度進行分類。阮于洲[9]、顧婷[10]研究了地理實體的采集與質(zhì)量控制。這些研究著重于數(shù)據(jù)采集質(zhì)量及標準化,對“四實”數(shù)據(jù)屬性及空間粒度精細至個體人、房屋地理實體特征,以及表單化數(shù)據(jù)如何實現(xiàn)空間化缺乏系統(tǒng)性的范式研究。
本文依據(jù)新型基礎測繪體系下地理實體相互關聯(lián)理論,針對“四實”數(shù)據(jù)的特點提出地理關聯(lián)實體概念,研究“四實”表單數(shù)據(jù)在關系鏈映射下的數(shù)據(jù)規(guī)則化與空間化的技術(shù)與方法,并以廣州市人民南社區(qū)為例進行了驗證。
“四實”數(shù)據(jù)在不同城市數(shù)據(jù)類型及數(shù)據(jù)內(nèi)容上有差別。廣州市“四實”數(shù)據(jù)中,實有設施數(shù)據(jù)已采集了空間坐標,因此需要空間化的地理實體對象為人、房(棟、套)、建筑與單位數(shù)據(jù),以人口信息表、流動人口信息表、境外人口信息表、房屋棟信息表、房屋套信息表、單位信息表、從業(yè)人員信息表、人房關系表、單位房屋關系表9張表單形式存儲(表1)。
表1 “四實”數(shù)據(jù)表單內(nèi)容Tab.1 Contents of the “Four Reals” data sheet
“四實”數(shù)據(jù)表單為需要處理的原始數(shù)據(jù),數(shù)據(jù)空間化處理流程總體包括數(shù)據(jù)質(zhì)量標準建立、數(shù)據(jù)清洗規(guī)則設計、數(shù)據(jù)清洗、關系鏈映射、地理關聯(lián)實體構(gòu)建與空間化等步驟。其中,基于關系鏈映射的地理關聯(lián)實體構(gòu)建與空間化,是實現(xiàn)建筑單體與人口個體數(shù)據(jù)關聯(lián)及空間落地的關鍵環(huán)節(jié)。
新型基礎測繪是測繪空間地理信息在數(shù)據(jù)采集方法與應用需求發(fā)生巨大變化之后的發(fā)展方向[11],而地理實體是這一發(fā)展方向中在數(shù)據(jù)要素方面最核心的類型和表達[12-13]。地理實體能夠?qū)崿F(xiàn)空間表達粒度和信息的精細化與全息化[14]。對于地理實體的類型化劃分,彭清山等提出以空間形態(tài)劃分的地理單實體、地理組合實體、地理聚合實體3類地理實體[8]。其中地理組合實體要求類型一致,而地理聚合實體則由若干具有空間關聯(lián)性的實體聚合而成,指向了一定封閉空間單元中具有邏輯關系的獨立地理實體組合。
“四實”數(shù)據(jù)表達的人、房(棟、套)、建筑與單位等實體要素關系,并不符合上述組合與聚合類型的地理實體特征,而是在城市尺度這一廣域范圍內(nèi)以特定要素相互關聯(lián)的地理實體集合,本文稱之為地理關聯(lián)實體。具體而言,地理關聯(lián)實體指向以下兩個方面。
1)在人、房(棟、套)與單位的關系中,人與房(棟、套)、人與單位、單位與房(棟、套)分別存在著居住、就業(yè)、進駐的關系,且這些關系同時與作為空間單元的建筑實體存在關聯(lián)關系,這一多重關系是“四實”地理關聯(lián)實體的邏輯關聯(lián)。
2)以建筑實體的地址信息作為人、房(棟、套)、單位等多重邏輯關聯(lián)實體的紐帶,可以實現(xiàn)“四實”地理關聯(lián)實體的空間關聯(lián)?!八膶崱钡乩黻P聯(lián)實體的關系如圖1所示。
圖1 地理關聯(lián)實體構(gòu)建過程Fig.1 The process of constructing geographically associated entity
為實現(xiàn)“四實”數(shù)據(jù)空間化,需要梳理多表單數(shù)據(jù)的內(nèi)在關系規(guī)則,通過對9個數(shù)據(jù)表單的分析,首先明確空間落點表單對象分別為個體人口信息、房屋建筑、單位信息,其次確定從業(yè)人員信息表CY、人房關系表GX1、單位房屋關系表GX2是具備關聯(lián)功能的關系型表單。3個關系型表單及各落點對象信息表單關鍵屬性字段的匹配關系表明,人口、房(棟、套)、單位信息之間存在一對一、一對多、多對多的關系規(guī)則,人口信息、單位信息、房(棟、套)信息之間存在承載關系。將承載關系劃分為職住兩條,個體居住在具體房(棟、套)內(nèi),房(棟、套)位于具體單體建筑內(nèi);個體在具體單位就業(yè),單位進駐在房(棟、套)內(nèi),房(棟、套)同樣位于具體單體建筑內(nèi)。
關系鏈是對多級關聯(lián)傳遞的一種相對直觀的可視化模式,基于指定的關系規(guī)則,實現(xiàn)屬性信息傳遞至相應載體上[15]。本文以“四實”數(shù)據(jù)表達的人、房(棟、套)、單位之間存在的一對一、一對多、多對多的關系,建立“四實”數(shù)據(jù)關系鏈映射(圖2)。
圖2 “四實”數(shù)據(jù)關系鏈映射Fig.2 “Four Reals” data relationship chain mapping
實現(xiàn)“四實”數(shù)據(jù)關系鏈映射主要有兩個過程,一個過程基于人口信息完成居住角度與就業(yè)角度兩組地理關聯(lián)實體的構(gòu)建,另外一個過程基于地址信息的屬性項關聯(lián)匹配,實現(xiàn)對居住和就業(yè)兩條關系鏈的拓展與地理關聯(lián)實體的空間化。
結(jié)合圖 2,上述 4式中RK1、RK2、RK3、FWT、FWD、DW為各屬性信息集合表;GX1、GX2、CY為上述6個屬性信息集合表的關聯(lián)關系;rkid、Tid、Did、DWid為存在于關聯(lián)關系表中的屬性集合關聯(lián)匹配項,分別關聯(lián)匹配人口信息、房屋套信息、房屋棟(單體建筑信息)、單位信息。
通過人房關系表,式(1)將3類人口信息表關聯(lián)至房屋上,式(2)將三維立體角度的房屋套信息關聯(lián)至二維平面角度的單體建筑上;通過從業(yè)人員信息表,式(3)將3類人口信息關系關聯(lián)至具體工作單位上;通過單位房(棟、套)關系表,式(4)將單位關聯(lián)至房(棟、套)上。依據(jù)關系傳遞的特性,將3種類型的人口信息進行聚合,分別構(gòu)建個體職、住關系鏈。下面的式(5)表示的關系鏈分別從個人居住角度和工作角度出發(fā),將人口信息傳遞關聯(lián)至個人居住的具體建筑、房(棟、套)、工作單位上。
通過建立以上關系鏈,完成居住角度與就業(yè)角度兩組地理關聯(lián)實體的構(gòu)建,為后續(xù)利用空間相關屬性將非空間屬性進行關系鏈映射提供基礎。在此基礎上,選取地址信息作為指向空間位置的基本屬性。門牌地址空間數(shù)據(jù)的地址信息屬性項能與房(棟、套)信息表的地址信息屬性項關聯(lián)匹配,實現(xiàn)對職住兩條關系鏈的拓展。以下面的式(6)居住關系鏈為例,在單體建筑地理關聯(lián)實體上,利用地址信息屬性項,可將關系鏈與門牌地址空間數(shù)據(jù)相關聯(lián),實現(xiàn)“四實”數(shù)據(jù)關系鏈到外部數(shù)據(jù)的拓展延伸,使其具備空間屬性(x,y),實現(xiàn)人口數(shù)據(jù)及房(棟、套)數(shù)據(jù)的空間坐標關聯(lián),完成關系鏈的空間化過程。
本文選取廣州市越秀區(qū)人民南社區(qū)進行“四實”數(shù)據(jù)關系鏈映射、關聯(lián)實體構(gòu)建以及空間化研究。人民南社區(qū)位于廣州市越秀老城區(qū)的中心商業(yè)樞紐地帶,總面積為86 hm2。實驗以“四實”數(shù)據(jù)中實有人口為數(shù)據(jù)樣本,實有房(棟、套)為人口數(shù)據(jù)載體,通過單體建筑地理關聯(lián)實體實現(xiàn)數(shù)據(jù)關聯(lián)與落點,形成空間數(shù)據(jù)成果。由于原始數(shù)據(jù)采集的完整性,以及研究場地范圍較小等原因,本文地理關聯(lián)實體構(gòu)建與空間化中未處理從業(yè)人員-單位這一關聯(lián)實體數(shù)據(jù)。
以截至2020年的“四實”數(shù)據(jù),統(tǒng)計人民南社區(qū)人口結(jié)構(gòu)(表2)。結(jié)果顯示,人民南社區(qū)實有人口總數(shù)約5.72萬,從性別結(jié)構(gòu)看:男性人口29065人,女性人口28219人,總?cè)丝谛詣e比為103.00(以女性為100);從年齡構(gòu)成看:60周歲及以上的老年人口為15686人,約占社區(qū)總?cè)丝诘?7.38%。
表2 人民南社區(qū)現(xiàn)狀人口信息統(tǒng)計Tab.2 Current demographic information of Renminnan Community
基于關系鏈映射和地理關聯(lián)實體空間化方法生成人民南社區(qū)人口分布圖(圖3)與社區(qū)建筑人口分布圖(圖4),獲得以實有人口和實有房屋組成的關聯(lián)實體數(shù)據(jù)。顯然,以關系鏈映射建立各地理實體之間的關聯(lián)關系,建立地理關聯(lián)實體并實現(xiàn)空間化,能夠?qū)崿F(xiàn)有別于傳統(tǒng)測繪的新型基礎測繪的數(shù)據(jù)表達。特別之處在于,“四實”當中的實有人口數(shù)據(jù),能夠超越傳統(tǒng)上基于統(tǒng)計年鑒的行政區(qū)劃空間粒度的人口分析,將數(shù)據(jù)分析落實于任何空間單元、任何年齡結(jié)構(gòu),實現(xiàn)多空間尺度與多空間粒度的人口分析。
圖3 人民南社區(qū)人口分布圖Fig.3 Distribution of the population in Renminnan Community
圖4 人民南社區(qū)建筑中人口分布Fig.4 Distribution of the population in Renminnan Community building
本文以廣州市“四實”數(shù)據(jù)處理、分析與研究為例,創(chuàng)新性地提出面向“四實”數(shù)據(jù)關聯(lián)特征的地理關聯(lián)實體概念,利用基于關系鏈映射的數(shù)據(jù)處理策略,實現(xiàn)了“四實”數(shù)據(jù)空間化,在最小粒度、無尺度全息采集及對社會經(jīng)濟屬性關注的數(shù)據(jù)特征上,新增了空間化數(shù)據(jù)特征,實現(xiàn)了“四實”數(shù)據(jù)從記錄型數(shù)據(jù)向地理實體數(shù)據(jù)的轉(zhuǎn)換。后續(xù)工作中要深入研究數(shù)據(jù)更新與數(shù)據(jù)應用模式,進一步推動“四實”數(shù)據(jù)應用的深度與廣度。