陳沖 陶慧青 張鋒 王偉 李俊徽
摘要:針對(duì)互聯(lián)網(wǎng)氣象服務(wù)手段與產(chǎn)品千篇一律現(xiàn)狀,提出了基于CRAP架構(gòu)的系統(tǒng)設(shè)計(jì),將信息采集、云庫集成、分析系統(tǒng)與主動(dòng)推送融合為一體提升氣象服務(wù)能力,系統(tǒng)依托天氣羅盤及智慧氣象等浙江省氣象局的服務(wù)平臺(tái)和出口積累的用戶行為數(shù)據(jù),挖掘用戶訪問量、訪問偏好和訪問時(shí)長(zhǎng)等信息,結(jié)合用戶畫像分析方案得出規(guī)律性特征,指導(dǎo)氣象服務(wù)信息技術(shù)開發(fā)策略和氣象服務(wù)產(chǎn)品研發(fā),最終實(shí)現(xiàn)氣象服務(wù)產(chǎn)品個(gè)性化無感推送。經(jīng)實(shí)驗(yàn)和應(yīng)用表明,利用基于用戶畫像的氣象服務(wù)系統(tǒng)較好地提升了用戶體驗(yàn),為互聯(lián)網(wǎng)式的氣象服務(wù)向智能化、智慧化氣象服務(wù)發(fā)展提供了參考。
關(guān)鍵詞:用戶畫像;氣象服務(wù);CR AP;個(gè)性化;無感推送;智能
中圖分類號(hào):P409;TP399文獻(xiàn)標(biāo)志碼:A文章編號(hào):1008-1739(2021)23-61-5
0引言
隨著互聯(lián)網(wǎng)氣象服務(wù)發(fā)展,氣象產(chǎn)品趨同態(tài)勢(shì)嚴(yán)重[1-3],用戶體驗(yàn)感下滑,氣象服務(wù)與用戶需求不一致導(dǎo)致矛盾進(jìn)一步加劇,如何掌握用戶對(duì)氣象信息的個(gè)性化需求成為公眾氣象服務(wù)的一大痛點(diǎn)[4-8]。
本文提出了基于CRAP架構(gòu)(Collection信息采集+RDS云庫集成+Analysis分析系統(tǒng)+Push-Service主動(dòng)推送服務(wù)),對(duì)浙江氣象服務(wù)出口采集氣象用戶行為信息進(jìn)行分析,完成靶向氣象服務(wù)產(chǎn)品自動(dòng)化加工,最終再次通過服務(wù)出口實(shí)現(xiàn)個(gè)性化主動(dòng)智能推送服務(wù)的方案。解決了分眾場(chǎng)景不同用戶對(duì)氣象服務(wù)產(chǎn)品的具體需求,實(shí)現(xiàn)氣象服務(wù)由用戶主動(dòng)獲取氣象信息變?yōu)楦兄脩粜枨?,智能推送個(gè)性化氣象信息,有效提升了用戶的體驗(yàn)感。
1系統(tǒng)設(shè)計(jì)
1.1用戶行為采集系統(tǒng)
用戶行為采集系統(tǒng)即CRAP架構(gòu)中的Collection,本文針對(duì)天氣羅盤、智慧氣象[9]等浙江省氣象局服務(wù)平臺(tái)和出口的大量用戶日常使用偏好等基礎(chǔ)數(shù)據(jù)[10-13],對(duì)其進(jìn)行了分布式標(biāo)準(zhǔn)化分析、處理并存放于數(shù)據(jù)存儲(chǔ)中心統(tǒng)一管理,形成用戶畫像基礎(chǔ)數(shù)據(jù)庫。
數(shù)據(jù)采集方式主要是頁面標(biāo)簽法[14-16],將定制化的JavaScript等代碼植入服務(wù)平臺(tái),當(dāng)用戶對(duì)平臺(tái)頁面中的標(biāo)簽進(jìn)行操作時(shí),觸發(fā)采集機(jī)制,該辦法盡可能滿足了當(dāng)前平臺(tái)的服務(wù)模式,能夠在不影響用戶體驗(yàn)的前提下較全面地采集用戶體驗(yàn)的行為數(shù)據(jù)。對(duì)上述平臺(tái)的各大功能子模塊植入埋點(diǎn),部分埋點(diǎn)位置如圖1~圖3所示。
當(dāng)用戶訪問平臺(tái)或者各模塊時(shí),觸發(fā)當(dāng)前監(jiān)測(cè)事件,采集數(shù)據(jù)的腳本代碼才會(huì)被觸發(fā),從而采集用戶行為數(shù)據(jù)。埋點(diǎn)技術(shù)有2個(gè)比較明顯的優(yōu)勢(shì):每一個(gè)用戶的操作行為都是被單獨(dú)監(jiān)測(cè)采集的,在一個(gè)頁面文件中可能會(huì)存在多個(gè)函數(shù)被植入多段代碼,這樣可以保證監(jiān)測(cè)的每一個(gè)用戶的交互行為事件是獨(dú)立并且完整的;其次是每一個(gè)頁面都是獨(dú)立的,因此采集到的數(shù)據(jù)沒有重復(fù)性減少冗余,利于后期CRAP架構(gòu)中RDS云庫上的存儲(chǔ)。因此,本文在進(jìn)行埋點(diǎn)之前先整理并設(shè)計(jì)好需要采集的數(shù)據(jù)類型,具體植入采集數(shù)據(jù)的位置等。部分信息采集字段如表1所示。
信息采集表的字段將為RDS建表字段設(shè)立奠定基礎(chǔ),而RDS用戶行為記錄表則作為用戶推送服務(wù)產(chǎn)品研發(fā)的基礎(chǔ)依據(jù),主要對(duì)用戶行為數(shù)據(jù)記錄統(tǒng)計(jì),有助于確定用戶使用習(xí)慣、當(dāng)前狀態(tài)等信息,便于根據(jù)實(shí)際情況進(jìn)行智能定制產(chǎn)品,也有助于后續(xù)改進(jìn)或者優(yōu)化相應(yīng)的推送服務(wù)產(chǎn)品。
采集數(shù)據(jù)儲(chǔ)存于RDS阿里云庫與OSS對(duì)象存儲(chǔ),由結(jié)構(gòu)化的數(shù)據(jù)庫表以及JSON、txt等數(shù)據(jù)類型組成,RDS記錄表如圖4所示?;诎⒗镌频拇鎯?chǔ)方案,使得系統(tǒng)支持高并發(fā)讀寫,性能優(yōu)良。同時(shí),接口服務(wù)使用的是阿里云企業(yè)級(jí)分布式應(yīng)用(EDAS),具備高效、可靠、易拓展等巨大優(yōu)勢(shì)[17-23]。
1.2用戶行為采集系統(tǒng)
用戶行為分析系統(tǒng)即CRAP架構(gòu)中的Analysis分析系統(tǒng),該系統(tǒng)主要針對(duì)存儲(chǔ)于RDS與OSS的用戶行為信息進(jìn)行進(jìn)一步分析與研究,從數(shù)據(jù)中了解用戶在氣象應(yīng)用時(shí)的瀏覽方式,訪問的氣象要素與行為習(xí)慣等信息自動(dòng)研制定制化氣象服務(wù)產(chǎn)品,具體定制產(chǎn)品對(duì)應(yīng)方案如表2所示,并以API形式提供中間件,該分析方案的主服務(wù)部署于阿里云上自建的推送服務(wù)集群中,以較高性能與可靠性來獲取詳細(xì)的用戶行為信息及分析結(jié)果,用戶的行為分析系統(tǒng)整體架構(gòu)如圖5所示。
該系統(tǒng)的個(gè)性化推送產(chǎn)品所使用數(shù)據(jù)源眾多,因此該系統(tǒng)針對(duì)浙江省氣象局氣象實(shí)況、預(yù)報(bào)等數(shù)據(jù)特征,研發(fā)了針對(duì)性較高的解析與加工程序,同時(shí)將其解析中間件存儲(chǔ)于阿里云OSS,Hbase,Redis等供后期調(diào)用。對(duì)于數(shù)據(jù)庫中的數(shù)據(jù),為了保證訪問程序性能與服務(wù)器性能,采用將數(shù)據(jù)存儲(chǔ)為JSON、XML等格式作為二次交換文件使用,用戶行為分析系統(tǒng)可視化流程如圖6所示。
用戶行為分析系統(tǒng)包含用戶訪問氣象要素分析、用戶訪問氣象頻道分析、用戶訪問時(shí)間、位置分析及其他功能使用率分析等。目前用戶行為分析系統(tǒng)智能分析的氣象服務(wù)產(chǎn)品方向達(dá)13個(gè),含上下班天氣、氣象類指數(shù)、交通氣象安全、短臨天氣、環(huán)境、臺(tái)風(fēng)以及觀潮等。
1.3個(gè)性化氣象服務(wù)無感推送系統(tǒng)
2應(yīng)用情況
基于用戶畫像的氣象服務(wù)系統(tǒng)于2020年11月正式應(yīng)用于浙江省氣象服務(wù)中心開發(fā)的《智慧氣象》App、《天氣羅盤》App等服務(wù)出口,自該系統(tǒng)應(yīng)用起至2021年6月,《智慧氣象》App用戶累計(jì)活躍數(shù)達(dá)130萬,月均活躍數(shù)達(dá)20萬,相較于之前有了明顯提升,同時(shí),基于《天氣羅盤》App的主動(dòng)推送服務(wù)達(dá)到近30萬次。系統(tǒng)推送效果如圖8所示。
根據(jù)浙江氣象服務(wù)出口用戶活躍度數(shù)據(jù)庫查詢,集成了用戶畫像氣象服務(wù)系統(tǒng)的《智慧氣象》App、《天氣羅盤》App等服務(wù)出口,自2020年11月至今,用戶活躍度總體穩(wěn)步提升,用戶活躍度如圖9所示,因此,該系統(tǒng)有效提升了用戶的體驗(yàn)感,得到了良好的服務(wù)回饋。
3結(jié)束語
實(shí)踐證明,基于用戶畫像的氣象服務(wù)系統(tǒng)較好地解決了分眾場(chǎng)景不同用戶對(duì)氣象服務(wù)產(chǎn)品的具體需求,實(shí)質(zhì)上是將氣象服務(wù)由用戶主動(dòng)獲取氣象信息變?yōu)榱烁兄脩粜枨?,再將用戶所需氣象服?wù)產(chǎn)品推送給用戶。一方面,該系統(tǒng)讓用戶無需再通過互聯(lián)網(wǎng)檢索其所需常規(guī)氣象信息;另一方面,系統(tǒng)提供的氣象信息正對(duì)性更強(qiáng),用戶個(gè)性化服務(wù)特征更為顯著。為進(jìn)一步加強(qiáng)應(yīng)用效果,下一步可以擴(kuò)大收集范圍接入第三方的用戶行為數(shù)據(jù),同時(shí)不斷完善CRAP技術(shù)架構(gòu),開展大量的訓(xùn)練,改進(jìn)應(yīng)用功能和服務(wù)體驗(yàn)。
參考文獻(xiàn)
[1] COFINO A S,GUTIéRREZ J M,JAKUBIAK B, et al. Implementation of Data Mining Techniques for Meteorological Applications[M].Realizing Teracomputing,2003.
[2]方學(xué)鋒.試析互聯(lián)網(wǎng)與氣象服務(wù)的融合與發(fā)展[J].科學(xué)與財(cái)富,2017(33):137.
[3]華巖.山東氣象局氣象服務(wù)產(chǎn)業(yè)發(fā)展戰(zhàn)略研究[D].濟(jì)南:山東大學(xué),2006.
[4] WU X,CA O Y,GAO G,et al. Relationship Among Public Cognition, Perceived Value, and Meteorological Service Satisfaction[J].TropicalConservation Science,2019,12(5): 1-5.
[5] NIE, FengYing. A Value-oriented Model of Big Data-driven Knowledge Management and Collaborative Services: Ameteorological Service Case[C]//International Conference on Information Management. Chengdu:IEEE, 2017:511-516.
[6]廖賢達(dá),姚學(xué)民,黃學(xué)忠.行業(yè)氣象服務(wù)要點(diǎn)探討[J].氣象研究與應(yīng)用,2008,29(4):86-89.
[7] BRUNO L,TORDK.Calculating Workplace Wbgt from Meteorological Data: A Tool for Climate Change Assessment[J].Ind Health,2012,50(4):267-278.
[8]徐鵬,張瑋,沈文穎.全媒體時(shí)代公眾氣象服務(wù)發(fā)展淺析[J].科技傳播,2017,9(8):87-88.
[9]馬琰鋼,沈萍月,鄧闖.基于ArcGIS Mobile的“智慧氣象”數(shù)據(jù)服務(wù)技術(shù)研究[J].數(shù)字技術(shù)與應(yīng)用, 2015(9):62.
[10]李建,張鋒,陳沖,等基于AI智能語音交互氣象服務(wù)的研究與應(yīng)用[J].計(jì)算機(jī)技術(shù)與發(fā)展,2020,30(12):197-202.
[11]尚燕敏,曹亞男,韓毅,等.基于主題和大眾影響的用戶動(dòng)態(tài)行為傾向預(yù)測(cè)[J].計(jì)算機(jī)學(xué)報(bào),2018,41(7):1431-1447.
[12]廖祥文,鄭候東,劉盛華,等.基于用戶行為的情感影響力和易感性學(xué)習(xí)[J].計(jì)算機(jī)學(xué)報(bào),2017,40(4):955-969.
[13]孟祥武,李瑞昌,張玉潔,等.基于用戶軌跡數(shù)據(jù)的移動(dòng)推薦系統(tǒng)研究[J].軟件學(xué)報(bào),2018,29(10):3111-3133.
[14]宋杰,王大玲,鮑玉斌,等.基于頁面Block的Web檔案采集和存儲(chǔ)[J].軟件學(xué)報(bào),2008(2):275-290.
[15]王雅坤.電商網(wǎng)站用戶行為實(shí)時(shí)監(jiān)控系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].北京:北京交通大學(xué),2016.
[16]李冰.基于Android日志的APP用戶行為分析研究與實(shí)現(xiàn)[D].北京:北京郵電大學(xué),2018.
[17]陳金光.基于阿里云的Kubernetes容器云平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[D].杭州:浙江大學(xué),2018.
[18]楊挺,王萌,張亞健,等.云計(jì)算數(shù)據(jù)中心HDFS差異性存儲(chǔ)節(jié)能優(yōu)化算法[J].計(jì)算機(jī)學(xué)報(bào),2019,42(4):721-735.
[19]黃華,彭蓉,馮在文.基于行為的大規(guī)模云工作流模型庫高效檢索方法研究[J].計(jì)算機(jī)學(xué)報(bào),2018,41(6):1018-1034.
[20]牛祿青.阿里云:創(chuàng)新云計(jì)算[J].新經(jīng)濟(jì)導(dǎo)刊,2013(3): 66-68.
[21]駱小龍,虞開森,余金銘,等.基于阿里云的臺(tái)風(fēng)路徑實(shí)時(shí)發(fā)布系統(tǒng)研究[J].計(jì)算機(jī)時(shí)代,2015(2):15-18.
[22]蘇鵬,劉甚靈,張春元.多云存儲(chǔ)網(wǎng)關(guān)設(shè)計(jì)和實(shí)現(xiàn)[J].計(jì)算機(jī)研究與發(fā)展,2015,52(S2):43-48.
[23]翁湦元,單杏花,閻志遠(yuǎn),等.基于Kubernetes的容器云平臺(tái)設(shè)計(jì)與實(shí)踐[J].鐵路計(jì)算機(jī)應(yīng)用,2019,28(12):49-53.