寇靜行 王漢英 王玉琴 尤靜靜
(地理信息工程國(guó)家重點(diǎn)實(shí)驗(yàn)室 北京 100088)
作為地理空間大數(shù)據(jù)的重要代表,POI(Point of Interest)數(shù)據(jù)隨著互聯(lián)網(wǎng)電子地圖服務(wù)與基于位置服務(wù)(Location Based Services,LBS)應(yīng)用的普及,無論從概念內(nèi)涵與信息縱深,還是應(yīng)用的廣度與深度,都有著長(zhǎng)足發(fā)展,已經(jīng)成為信息空間的參天大樹。基于POI數(shù)據(jù)的各種研究與應(yīng)用,不僅便利了人們?nèi)粘I钜率匙⌒?,也為城市?guī)劃、鄉(xiāng)村振興、經(jīng)濟(jì)分析、能源消耗等諸多領(lǐng)域提供分析輔助決策,發(fā)揮著巨大經(jīng)濟(jì)和社會(huì)效益。國(guó)內(nèi)學(xué)者對(duì)POI 數(shù)據(jù)的研究熱度持續(xù)高漲,從中國(guó)知網(wǎng)相關(guān)論文數(shù)量上看,一直呈上升趨勢(shì)。面對(duì)迅猛的發(fā)展態(tài)勢(shì),有必要對(duì)近年來POI 領(lǐng)域研究進(jìn)行階段性總結(jié),摸清其研究熱點(diǎn),挖掘其應(yīng)用潛力與發(fā)展趨勢(shì)。基于此,該文應(yīng)用Citespace工具,對(duì)中國(guó)知網(wǎng)上2020 年以來POI 領(lǐng)域研究的文獻(xiàn)進(jìn)行知識(shí)圖譜分析,梳理當(dāng)前研究熱點(diǎn),分析該領(lǐng)域研究不足與洼地,探究發(fā)展趨勢(shì),為進(jìn)一步研究奠定基礎(chǔ)。
POI 數(shù)據(jù)在測(cè)繪行業(yè)特指導(dǎo)航圖中的興趣點(diǎn)數(shù)據(jù),是Point of Interest 的縮寫,在其他應(yīng)用領(lǐng)域也有解釋為信息點(diǎn),是Point of Information的縮寫,所以POI數(shù)據(jù)可根據(jù)所在的應(yīng)用場(chǎng)景不同,可以翻譯為興趣點(diǎn)或信息點(diǎn),泛指互聯(lián)網(wǎng)電子地圖中點(diǎn)類地理實(shí)體數(shù)據(jù),如學(xué)校、醫(yī)院、商場(chǎng)、加油站、公園以及政府機(jī)構(gòu)等。一般由名稱、類別、地址、坐標(biāo)這4個(gè)基本屬性組成,來表達(dá)地理實(shí)體的空間位置和屬性信息。
從GIS應(yīng)用層面看,POI數(shù)據(jù)可以分為基礎(chǔ)框架類POI 和業(yè)務(wù)應(yīng)用類POI?;A(chǔ)框架類POI 用于表達(dá)真實(shí)世界的基本組成要素,如城市部件、地名數(shù)據(jù)等,主要來源于國(guó)家基礎(chǔ)測(cè)繪成果DLG 產(chǎn)品中點(diǎn)類地圖要素矢量數(shù)據(jù)集;業(yè)務(wù)應(yīng)用類POI 是根據(jù)應(yīng)用場(chǎng)景的需要,將一些事、物進(jìn)行統(tǒng)一建模,抽象帶有屬性的地理位置點(diǎn)進(jìn)行管理、分析和計(jì)算,如網(wǎng)約車平臺(tái)系統(tǒng)中的上車推薦點(diǎn)、O2O行業(yè)中的各類門店點(diǎn)、導(dǎo)航服務(wù)中的門牌地名點(diǎn)數(shù)據(jù)等,該類POI數(shù)據(jù)根據(jù)GIS應(yīng)用系統(tǒng)特點(diǎn)進(jìn)行設(shè)計(jì)、采集、更新維護(hù),大多時(shí)間應(yīng)用的POI 數(shù)據(jù)大多是兩者的融合。
POI 數(shù)據(jù)的獲取途徑有兩種,最可靠的獲取途徑是利用信息采集設(shè)備到實(shí)地進(jìn)行空間位置采集和屬性信息的調(diào)查核對(duì),獲取時(shí)效性最好、可靠性最高的POI數(shù)據(jù);間接方法是從百度地圖、高德地圖、谷歌地圖、Open Street Map 等開放平臺(tái)中,通過API(Application Programming Interface)接口獲取數(shù)據(jù)源?;贏PI 接口,一些平臺(tái)、專業(yè)測(cè)繪公司及個(gè)人已經(jīng)開發(fā)出獲取POI 數(shù)據(jù)的軟件,如位和智能、BigMap、Geosharp 等[1],因其便利性成為POI數(shù)據(jù)獲取的有效途徑。值得注意的是,不同來源POI 數(shù)據(jù)所包含的信息由于表達(dá)和應(yīng)用側(cè)重點(diǎn)不同,數(shù)據(jù)存在一定差異性,需要通過清洗、去重、融合等技術(shù)處理,形成符合要求的POI數(shù)據(jù)。
該文用于構(gòu)建POI 圖譜的數(shù)據(jù)來源于中國(guó)知網(wǎng)(CNKI)中文學(xué)術(shù)期刊,文獻(xiàn)采集時(shí)間范圍為2020 年1月1日至2022年5月28日。為確保檢索結(jié)果的高度相關(guān)性,選用“篇關(guān)摘”的檢索方式,檢索詞設(shè)為“POI or興趣點(diǎn)”,來源類別為“SCI 來源期刊”“EI 來源期刊”“北大核心”“CSSCI”“CSCD”。在檢索到的文章中,剔除明顯相關(guān)性不強(qiáng)的通信技術(shù)及圖像識(shí)別等方面文獻(xiàn),最后篩選得到563 篇相關(guān)論文,以Refworks 格式導(dǎo)出,導(dǎo)出內(nèi)容包括標(biāo)題、摘要、關(guān)鍵詞、正文、發(fā)表年份和來源等。
該文以文獻(xiàn)計(jì)量學(xué)為理論依據(jù),采用知識(shí)圖譜生成技術(shù),使用CiteSpace軟件,對(duì)檢索得到的563篇文獻(xiàn)數(shù)據(jù),進(jìn)行關(guān)鍵詞知識(shí)圖譜構(gòu)建,以可視化方式分析近年來POI數(shù)據(jù)的研究熱點(diǎn)和發(fā)展趨勢(shì)。
文獻(xiàn)計(jì)量學(xué)作為該文研究的理論依據(jù),它是以文獻(xiàn)體系和文獻(xiàn)計(jì)量特征為研究對(duì)象,采用數(shù)學(xué)、統(tǒng)計(jì)學(xué)等計(jì)量研究方法,研究文獻(xiàn)情報(bào)的分布結(jié)構(gòu)、數(shù)量關(guān)系、變化規(guī)律和定量管理,進(jìn)而探討科學(xué)技術(shù)的某些結(jié)構(gòu)、特征和規(guī)律[2]。
知識(shí)圖譜是以科學(xué)知識(shí)、新興學(xué)科發(fā)展過程和發(fā)展現(xiàn)狀、科學(xué)知識(shí)內(nèi)外部結(jié)構(gòu)建立的一種圖形,以可視化方式將科學(xué)知識(shí)更為直觀、系統(tǒng)地展現(xiàn)給研究人員,容易直觀理解,易于發(fā)現(xiàn)未來發(fā)展方向。在關(guān)鍵詞共現(xiàn)圖譜中,需用到社會(huì)網(wǎng)絡(luò)分析方法(Social network Analysis)又稱結(jié)構(gòu)分析法(Structural Analysis)。該方法是一種考慮個(gè)體之間互相依賴性的定量分析方法。社會(huì)網(wǎng)絡(luò)由節(jié)點(diǎn)和線組成,它可以直觀地展示網(wǎng)絡(luò)的整體結(jié)構(gòu)、個(gè)人在網(wǎng)絡(luò)中的位置以及與其他個(gè)人的關(guān)系。社會(huì)網(wǎng)絡(luò)分析法在關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)分析中已得到了很好的應(yīng)用,其中介中心性BCD(Betweenness Centrality Degree)可以衡量節(jié)點(diǎn)在網(wǎng)絡(luò)中的重要性。
CiteSpace軟件則是目前最具特色和影響力的知識(shí)圖譜繪制工具之一,在國(guó)內(nèi)又被翻譯為引文空間,是一款著眼于分析科學(xué)文獻(xiàn)中蘊(yùn)含的潛在知識(shí),并在科學(xué)計(jì)量學(xué)、數(shù)據(jù)和信息可視化背景下逐漸發(fā)展起來的一款多元、分時(shí)、動(dòng)態(tài)的引文可視化分析軟件[3]。
關(guān)鍵詞是對(duì)研究?jī)?nèi)容和觀點(diǎn)的高度概括,可凝練一篇論文的主題[4]。利用關(guān)鍵詞進(jìn)行論文研究主題分析,可以掌握文章的研究目標(biāo)。對(duì)大量文獻(xiàn)進(jìn)行關(guān)鍵詞分析,得到某領(lǐng)域在特定時(shí)間區(qū)間內(nèi)關(guān)鍵詞出現(xiàn)的頻率,可直觀地得到該領(lǐng)域內(nèi)的研究熱點(diǎn)與發(fā)展趨勢(shì)。
利用CiteSpace 軟件,對(duì)關(guān)鍵詞進(jìn)行共現(xiàn)分析,排除檢索關(guān)鍵詞“POI”“興趣點(diǎn)”“大數(shù)據(jù)”“數(shù)據(jù)挖掘”“北京市”等不影響分析的無義關(guān)鍵詞,經(jīng)整理生成關(guān)鍵詞知識(shí)圖譜,具體內(nèi)容如圖1所示。圖1中節(jié)點(diǎn)代表關(guān)鍵詞,連接兩節(jié)點(diǎn)的路徑代表了這兩個(gè)關(guān)鍵詞同時(shí)出現(xiàn)在一篇文獻(xiàn)中,標(biāo)簽字體大小代表關(guān)鍵詞出現(xiàn)的頻次高低,節(jié)點(diǎn)大小代表關(guān)鍵詞中介中心性的強(qiáng)弱[5]。
圖1 關(guān)鍵詞知識(shí)圖譜
如圖1 所示,出現(xiàn)頻次最高且中心性最強(qiáng)的關(guān)鍵詞為“多源數(shù)據(jù)”,體現(xiàn)出POI數(shù)據(jù)的融合屬性。POI數(shù)據(jù)作為多源異構(gòu)數(shù)據(jù)中的基礎(chǔ)數(shù)據(jù),往往需與其他數(shù)據(jù)進(jìn)行融合,才能實(shí)現(xiàn)時(shí)空數(shù)據(jù)的深度挖掘與分析應(yīng)用:如與遙感影像數(shù)據(jù)、數(shù)據(jù)高程模型、城市感知數(shù)據(jù)、土地利用數(shù)據(jù)等融合,實(shí)現(xiàn)城市功能區(qū)劃分、宜居性評(píng)價(jià)、土地利用分類以及鄉(xiāng)村發(fā)展類型識(shí)別等;與街景數(shù)據(jù)、圖像數(shù)據(jù)、人口熱力數(shù)據(jù)、手機(jī)信令數(shù)據(jù)、車輛軌跡實(shí)時(shí)數(shù)據(jù)等融合,分析街道活力,精細(xì)化研究城市功能區(qū),為城市規(guī)劃和運(yùn)行管理提供科學(xué)評(píng)估與決策;與夜間燈光數(shù)據(jù)、人口格網(wǎng)數(shù)據(jù)融合,分析夜間經(jīng)濟(jì)時(shí)空分布,實(shí)現(xiàn)城市活力評(píng)價(jià)和空間關(guān)聯(lián)性分析。
關(guān)鍵詞“影響因素”體現(xiàn)出POI數(shù)據(jù)分析的價(jià)值屬性。基于POI 數(shù)據(jù)分析,找到制約或促進(jìn)目標(biāo)問題的關(guān)鍵影響因素。比如:以POI 數(shù)據(jù)結(jié)合實(shí)地調(diào)研等方法,分析出地鐵站外部空間特征、街道可達(dá)性和區(qū)域功能混合程度是地鐵出入口客流分布的影像因素[6];綜合遙感、調(diào)查、統(tǒng)計(jì)及POI 數(shù)據(jù),分析出經(jīng)濟(jì)發(fā)展條件和地形起伏是生活空間宜居性的主導(dǎo)因素;以POI 數(shù)據(jù)為基礎(chǔ),運(yùn)用最近鄰層次聚類分析等空間分析方法,得出距市中心距離、游客密度、街道活力、居民密度、資源稟賦、道路密度等是影響成都市休閑旅游資源空間分布的重要因素。
“空間分布”“空間格局”“空間布局”為同義詞,與“建成環(huán)境”“土地利用”“風(fēng)景園林”“城市交通”等關(guān)鍵詞,代表POI 數(shù)據(jù)熱點(diǎn)應(yīng)用領(lǐng)域。近年來,基于POI數(shù)據(jù)的應(yīng)用研究多圍繞城市主題,從城市整體空間格局分布到精細(xì)化街區(qū)功能與活力研究,甚至細(xì)微至地鐵出入口流量分析等,無不滲透著POI 數(shù)據(jù)基礎(chǔ)支撐的作用。
“深度學(xué)習(xí)”“隨機(jī)森林”“機(jī)器學(xué)習(xí)”等關(guān)鍵詞,則代表POI 數(shù)據(jù)熱門研究方法。以深度學(xué)習(xí)、機(jī)器學(xué)習(xí)等為代表的人工智能技術(shù),應(yīng)用到POI 數(shù)據(jù)的處理清洗、計(jì)算分析、智能推薦等具體工作流程中。比如:以遙感影像、人口數(shù)據(jù)、POI數(shù)據(jù)為基礎(chǔ),結(jié)合深度學(xué)習(xí)技術(shù),構(gòu)建基于多源數(shù)據(jù)和深度學(xué)習(xí)的城市邊緣區(qū)判定方法[7];從不同角度對(duì)深度學(xué)習(xí)技術(shù)在用戶興趣點(diǎn)推薦中的研究進(jìn)行綜述,在POI 推薦中使用深度學(xué)習(xí)方法解決了POI 推薦中所面臨的時(shí)空序列特征提取、內(nèi)容社交特征提取、多特征整合、數(shù)據(jù)稀疏性問題處理這4 個(gè)方面問題時(shí)存在的優(yōu)勢(shì)以及不足,并提出了未來通過深度學(xué)習(xí)提高POI 推薦效果的研究方向;分析深度學(xué)習(xí)方式的POI數(shù)據(jù)推薦與傳統(tǒng)推薦方法的區(qū)別與影響因素,總結(jié)了4 個(gè)類型的深度學(xué)習(xí)推薦POI 方式(POI 的向量化學(xué)習(xí)、深度協(xié)同過濾、從輔助內(nèi)容中提取特征、利用循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行序列推薦),闡述了深度學(xué)習(xí)技術(shù)在這些方式中的應(yīng)用效果與優(yōu)勢(shì)[8]。
綜上所述,對(duì)這些熱點(diǎn)關(guān)鍵詞的分析,可進(jìn)一步總結(jié)歸納得出,近年來國(guó)內(nèi)POI 數(shù)據(jù)領(lǐng)域研究主要集中在POI數(shù)據(jù)的應(yīng)用技術(shù)方法和應(yīng)用領(lǐng)域這兩大方面。
從上述分析可知,近年來關(guān)于POI 數(shù)據(jù)的研究主要集中在應(yīng)用領(lǐng)域,而對(duì)POI 數(shù)據(jù)結(jié)構(gòu)本身研究的不多。目前,POI 數(shù)據(jù)生產(chǎn)主要來源于百度、高德、谷歌這些大型互聯(lián)網(wǎng)圖商,由各互聯(lián)網(wǎng)平臺(tái)自行規(guī)劃設(shè)計(jì)、采集、更新維護(hù)。不同圖商來源的POI數(shù)據(jù),雖然都包含名稱、類別、地址、坐標(biāo)這4個(gè)基本屬性,但其內(nèi)部數(shù)據(jù)模型、數(shù)據(jù)格式及標(biāo)準(zhǔn)各不相同,給數(shù)據(jù)的共享利用帶來諸多不便。在對(duì)同名異源POI數(shù)據(jù)之間相互融合應(yīng)用時(shí),需要逐項(xiàng)對(duì)照進(jìn)行去重,清洗冗余,才能融合有用信息,造成大量的人力、物力、財(cái)力的消耗。顯然,多源POI 數(shù)據(jù)是一種國(guó)家戰(zhàn)略資源,研究建立統(tǒng)一模型和標(biāo)準(zhǔn)規(guī)范的POI 數(shù)據(jù)結(jié)構(gòu),使各圖商按照統(tǒng)一標(biāo)準(zhǔn)分區(qū)生產(chǎn),融合公用,能大大節(jié)約人力、物力資源,對(duì)低碳發(fā)展具有重要的意義。而如何建立有效的統(tǒng)一POI 數(shù)據(jù)模型,關(guān)鍵在于解決兼容不同平臺(tái)個(gè)性化需求以及自主拓展性。從近年來文獻(xiàn)數(shù)據(jù)上,尚未看到相關(guān)研究。
POI 數(shù)據(jù)質(zhì)量大體可從現(xiàn)勢(shì)性、準(zhǔn)確性、完備性、豐富性等幾個(gè)維度進(jìn)行綜合評(píng)價(jià)。定位準(zhǔn)確,信息完備且豐富、現(xiàn)勢(shì)性好的POI數(shù)據(jù)對(duì)提高用戶體驗(yàn),準(zhǔn)確支撐分析具有十分重要意義。比如:POI 數(shù)據(jù)的現(xiàn)勢(shì)性體現(xiàn)出提供的地理空間信息反映當(dāng)前最新情況的程度,若POI數(shù)據(jù)的現(xiàn)勢(shì)性不高,新鮮度不好,過期的POI數(shù)據(jù)會(huì)有損用戶體驗(yàn),甚至造成決策失誤等引起嚴(yán)重后果。研究如何增強(qiáng)POI 數(shù)據(jù)的現(xiàn)勢(shì)性,盡可能快速發(fā)現(xiàn)并處理已停業(yè)、搬遷、更名、拆遷的過期冗余數(shù)據(jù),對(duì)提高POI 數(shù)據(jù)質(zhì)量至關(guān)重要。從近年來文獻(xiàn)數(shù)據(jù)中,也較少能看到POI 數(shù)據(jù)質(zhì)量保證這方面的研究論文。
從該文檢索到的關(guān)于POI數(shù)據(jù)研究方面的論文篇數(shù)、期刊種類和學(xué)術(shù)層次上看,近年來國(guó)內(nèi)關(guān)于POI數(shù)據(jù)研究熱度一直持續(xù)上升,發(fā)展前景廣闊。根據(jù)以上分析總結(jié):(1)POI 數(shù)據(jù)的應(yīng)用熱點(diǎn)多圍繞城市主題;(2)與遙感影像、人口數(shù)據(jù)、手機(jī)信令數(shù)據(jù)、夜間燈光數(shù)據(jù)等其他多源異構(gòu)數(shù)據(jù)的融合利用,可進(jìn)一步拓展應(yīng)用范圍,并深度挖掘目標(biāo)影響因素,支撐科學(xué)決策與實(shí)施優(yōu)化調(diào)整;(3)POI數(shù)據(jù)與各類機(jī)器學(xué)習(xí)算法的結(jié)合更加緊密,對(duì)識(shí)別城市邊界、智能推薦等有著新的啟示,未來可通過集成化、智能化的地理信息管理服務(wù)平臺(tái)來指導(dǎo)城市群的協(xié)同發(fā)展;(4)針對(duì)POI數(shù)據(jù)本身的研究是目前該領(lǐng)域的研究洼地,如建立統(tǒng)一POI 數(shù)據(jù)結(jié)構(gòu)模型實(shí)現(xiàn)數(shù)據(jù)互通使用、增強(qiáng)POI 數(shù)據(jù)質(zhì)量保障能力提高數(shù)據(jù)利用效能等。
隨著數(shù)字城市、智慧城市和鄉(xiāng)村振興事業(yè)的建設(shè)和發(fā)展需要,以及人工智能技術(shù)的逐步成熟,POI 數(shù)據(jù)的智能化采集與處理、精細(xì)化分析與應(yīng)用,將會(huì)得到飛速發(fā)展,應(yīng)用領(lǐng)域?qū)?huì)越來越廣,相關(guān)研究也將更加注重處理多源空間數(shù)據(jù)融合、提高空間精度、揭示各項(xiàng)空間功能分布特征背后的生成機(jī)理。同時(shí),也應(yīng)著聚焦到POI 數(shù)據(jù)本身的全面研究中,著眼于實(shí)現(xiàn)POI 數(shù)據(jù)的同名同質(zhì)和個(gè)性化共存,建立統(tǒng)一的具有可擴(kuò)展性數(shù)據(jù)模型結(jié)構(gòu),形成全國(guó)統(tǒng)一標(biāo)準(zhǔn),踐行低碳發(fā)展思路。