• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于新浪微博數(shù)據(jù)的時空分布特征研究

      2017-05-16 19:24:37盧宇航
      科教導(dǎo)刊·電子版 2017年7期
      關(guān)鍵詞:西安市時段可視化

      盧宇航

      摘 要 社交網(wǎng)絡(luò)的位置分享服務(wù)增加了社交數(shù)據(jù)的信息維度,使得社交網(wǎng)絡(luò)中存儲了豐富的位置信息資源。本文以新浪微博作為主要數(shù)據(jù)源,利用爬蟲技術(shù)采集數(shù)據(jù),通過對數(shù)據(jù)的處理分析以及可視化,得到西安市范圍內(nèi)微博數(shù)據(jù)的分布規(guī)律。

      關(guān)鍵詞 社交網(wǎng)絡(luò) 地理信息 數(shù)據(jù)可視化 時空分布

      1引言

      在移動互聯(lián)網(wǎng)技術(shù)高速發(fā)展、移動通訊網(wǎng)絡(luò)環(huán)境日益完善以及移動終端設(shè)備不斷普及的背景下,移動互聯(lián)網(wǎng)應(yīng)用逐漸滲透到人們生活的方面。根據(jù)中國互聯(lián)網(wǎng)絡(luò)信息中心發(fā)布的第39次《中國互聯(lián)網(wǎng)發(fā)展?fàn)顩r統(tǒng)計(jì)報告》,截至2016年12月,我國總體網(wǎng)民規(guī)模達(dá)7.31億,其中手機(jī)網(wǎng)民規(guī)模達(dá)6.95億,占比95.1%,且處于穩(wěn)步增長的態(tài)勢。社交網(wǎng)絡(luò)應(yīng)用與移動互聯(lián)網(wǎng)相結(jié)合,各大社交應(yīng)用為廣大用戶提供了一個開放性的服務(wù)平臺,為用戶的信息的交流與分享帶來了更為便捷和有效的方式。在社交網(wǎng)絡(luò)中,龐大的用戶基數(shù)產(chǎn)生了海量的數(shù)據(jù),這些來自用戶的數(shù)據(jù)已經(jīng)被視為軍事或是商業(yè)情報的重要來源。尤其是基于位置分享的社交網(wǎng)絡(luò)應(yīng)用,將用戶的分享信息與地理位置的實(shí)時記錄關(guān)聯(lián)起來,從而實(shí)現(xiàn)虛擬的網(wǎng)絡(luò)空間與現(xiàn)實(shí)世界的相互映射,為研究社交數(shù)據(jù)與現(xiàn)實(shí)世界之間的關(guān)系提供了機(jī)會。

      本文以新浪微博數(shù)據(jù)作為對象,利用爬蟲技術(shù)進(jìn)行數(shù)據(jù)采集,在對原始數(shù)據(jù)進(jìn)行預(yù)處理后,得到西安市范圍內(nèi)的微博數(shù)據(jù),在此基礎(chǔ)上對微博數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,構(gòu)建熱力圖模型,并實(shí)現(xiàn)數(shù)據(jù)可視化,探索西安市范圍內(nèi)微博數(shù)據(jù)的分布規(guī)律。

      2數(shù)據(jù)的采集與預(yù)處理

      本文使用基于Python的scrapy框架構(gòu)建數(shù)據(jù)爬蟲系統(tǒng),采用MongoDB作為存儲數(shù)據(jù)對微博數(shù)據(jù)進(jìn)行采集。在采集過程中,通過制定過濾規(guī)則對原始數(shù)據(jù)進(jìn)行預(yù)處理,從而獲得研究所需的目標(biāo)數(shù)據(jù)。具體操作方式:1. 檢測采集的數(shù)據(jù)中是否包含位置分享信息;2. 通過MongoDB的空間索引特性,利用西安市行政區(qū)劃的GeoJSON數(shù)據(jù)檢測所包含的位置是否屬于西安市范圍。將同時滿足以上兩點(diǎn)的數(shù)據(jù)視為可用數(shù)據(jù)存儲至數(shù)據(jù)庫中。

      3數(shù)據(jù)的處理與可視化

      3.1統(tǒng)計(jì)數(shù)據(jù)的時間分布

      將每天的時間從0點(diǎn)開始按照一個小時的間隔分為24個時段,解析每條微博的發(fā)布時間,分別統(tǒng)計(jì)各個時段的微博發(fā)布數(shù)量。由于各個時段的微博在發(fā)布數(shù)量上存在著巨大的差異,因此,在此基礎(chǔ)上,將每個時段的統(tǒng)計(jì)值均除以總的微博發(fā)布數(shù)量,得到每個時段的微博發(fā)布頻率,便于進(jìn)行數(shù)據(jù)的可視化。

      3.2統(tǒng)計(jì)數(shù)據(jù)的空間分布

      將所有微博數(shù)據(jù)的坐標(biāo)信息解析GeoJSON的標(biāo)準(zhǔn)格式,利用MongoDB在數(shù)據(jù)存儲層面建立空間索引。然后使用MongoDB的空間查詢命令統(tǒng)計(jì)西安市范圍內(nèi)微博數(shù)據(jù)在空間上的分布密度

      3.3數(shù)據(jù)可視化

      本選取了ECharts和Leaflet作為數(shù)據(jù)可視化工具,構(gòu)建可視化的靜態(tài)頁面。

      4微博數(shù)據(jù)的分布規(guī)律

      4.1在時間上的總體分布

      如圖1,顯示了西安市范圍內(nèi)微博發(fā)布數(shù)量頻率的各個時段分布情況,從圖中我們能夠直觀地看出微博發(fā)布頻率在時間上的變化趨勢,從0點(diǎn)開始用戶發(fā)布微博的頻率逐漸下降,進(jìn)入“休息時間”,在上午的5點(diǎn)至6點(diǎn)達(dá)到最低值;上午6點(diǎn)以后,直至夜里12點(diǎn),用戶發(fā)布微博的頻率總體呈現(xiàn)上升趨勢,其中在6:00 – 12:00與18:00 – 次日0:00這兩個時間段內(nèi)用戶的發(fā)布頻率顯著上升,在12:00 – 18:00的時間段內(nèi)微博發(fā)布頻率則相對平穩(wěn)。

      綜上所述,用戶發(fā)布微博的頻率在一天之內(nèi)的變化趨勢是顯著的。通過對用戶發(fā)布微博頻率的觀察,結(jié)合其所在的地理位置信息,可以了解到用戶在微博平臺上的使用習(xí)慣,根據(jù)用戶的活躍時間,適時而有針對性地進(jìn)行營銷推廣或是輿情監(jiān)測,實(shí)現(xiàn)相關(guān)資源的合理分配和有效利用具有一定的參考價值。

      4.2在空間上的分時段分布

      由于單個小時時間內(nèi)的數(shù)據(jù)量相對要小且每個小時之間的數(shù)據(jù)變化不明顯,不適合綜合分析各個時段的空間分布規(guī)律,因此,從0點(diǎn)每隔4個小時劃分一個時段,將24個小時重新劃分為6個時段,得到西安市范圍內(nèi)微博數(shù)據(jù)分時段空間分布圖,如圖 2所示。

      從微博數(shù)據(jù)的空間位置分布來看,在0:00-4:00時段,微博數(shù)據(jù)主要沿地鐵二號線周邊分布,呈線狀和散點(diǎn)狀分布;在4:00-8:00時段,微博數(shù)據(jù)的分布的熱力度值進(jìn)入一天中的最低值,呈現(xiàn)零星散點(diǎn)分布;在8:00-12:00時段,微博數(shù)據(jù)的熱力度開始進(jìn)入“活躍狀態(tài)”,在地鐵二號線南段沿線、綜合商業(yè)娛樂中心、高校等區(qū)域聚集;在12:00-16:00、16:00-20:00的兩個時段,相較于上個時段分布范圍更加趨向于向西安市“中軸線”區(qū)域集中;在20:00-24:00時段,“中軸線”區(qū)域的熱度得到提供且向外擴(kuò)散,同時,其他區(qū)域的散點(diǎn)分布也得到了提高,微博數(shù)據(jù)的熱力度進(jìn)入一天中的峰值時段。

      通過對分時段空間分布情況的總結(jié),在一定程度上反映了城市人群活動的時空規(guī)律。從微博數(shù)據(jù)的熱度分布上,我們能夠分析得到西安市微博人群活動的熱點(diǎn)區(qū)域和活動時間;從另一方面,也可以了解到城市不同區(qū)域現(xiàn)實(shí)發(fā)展水平。在城市規(guī)劃、城市管理等方面具有一定的指導(dǎo)意義。

      5總結(jié)

      本文以新浪微博數(shù)據(jù)為研究數(shù)據(jù),以西安市為研究區(qū)域,通過對微博數(shù)據(jù)的采集、存儲、處理和可視化展示,實(shí)現(xiàn)對西安市微博數(shù)據(jù)分布規(guī)律的探索和分析,其中隱含的人群活動信息對營銷推廣、輿情監(jiān)測以及城市規(guī)劃等方面具有輔助決策支持的意義。

      參考文獻(xiàn)

      [1] 王紅梅. 移動互聯(lián)網(wǎng)現(xiàn)狀與趨勢淺析[C]// 中國通信學(xué)會信息通信網(wǎng)絡(luò)技術(shù)委員會2011年年會. 2011:74-79.

      [2] 中國互聯(lián)網(wǎng)絡(luò)信息中心.中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報告[EB/OL].(2017/01) http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201701/P020170123364672657408.pdf

      [3] Goodchild, Michael F. Citizens as Sensors: The World of Volunteered Geography[J]. GeoJournal, 2007, 69(4):211-221.

      猜你喜歡
      西安市時段可視化
      基于CiteSpace的足三里穴研究可視化分析
      基于Power BI的油田注水運(yùn)行動態(tài)分析與可視化展示
      云南化工(2021年8期)2021-12-21 06:37:54
      家鄉(xiāng)
      河北畫報(2020年16期)2020-08-26 08:01:20
      基于CGAL和OpenGL的海底地形三維可視化
      西安市第四醫(yī)院
      “融評”:黨媒評論的可視化創(chuàng)新
      傳媒評論(2019年4期)2019-07-13 05:49:14
      四個養(yǎng)生黃金時段,你抓住了嗎
      123的幾種說法
      基于CA-Markov模型的西安市熱環(huán)境模擬研究
      傍晚是交通事故高發(fā)時段
      关岭| 临猗县| 南木林县| 凤山市| 清流县| 镇赉县| 武功县| 彰武县| 昌黎县| 滨州市| 米林县| 扶沟县| 宁城县| 句容市| 深泽县| 甘南县| 赣榆县| 宿松县| 呼和浩特市| 黎平县| 宜兰县| 荥经县| 贵阳市| 仲巴县| 信丰县| 宝山区| 镇沅| 夹江县| 巨野县| 那曲县| 梅河口市| 灵山县| 同心县| 肇州县| 安新县| 疏勒县| 安平县| 邯郸县| 仁布县| 灌云县| 泸定县|