• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      鐵路旅客用戶畫像系統(tǒng)設(shè)計(jì)與應(yīng)用研究

      2018-08-07 01:28:58張軍鋒
      關(guān)鍵詞:畫像旅客標(biāo)簽

      張軍鋒

      (中國鐵道科學(xué)研究院集團(tuán)有限公司 電子計(jì)算技術(shù)研究所,北京 100081)

      國務(wù)院《關(guān)于促進(jìn)大數(shù)據(jù)發(fā)展的行動綱要》強(qiáng)調(diào)以企業(yè)為主體、以市場為導(dǎo)向,加大政策支持大數(shù)據(jù)產(chǎn)業(yè)發(fā)展力度,深化大數(shù)據(jù)在各行業(yè)創(chuàng)新應(yīng)用,催生新業(yè)態(tài)、新模式。大數(shù)據(jù)技術(shù)和業(yè)態(tài)的成熟也為鐵路部門實(shí)現(xiàn)數(shù)據(jù)驅(qū)動和業(yè)務(wù)創(chuàng)新提供了強(qiáng)有力的支撐。目前鐵路部門已經(jīng)形成了以12306、95306

      為代表的一系列互聯(lián)網(wǎng)服務(wù)平臺[1],在現(xiàn)有基礎(chǔ)之上,采用大數(shù)據(jù)技術(shù),開展用戶畫像、精準(zhǔn)營銷、延伸服務(wù)等“互聯(lián)網(wǎng)+”產(chǎn)業(yè)升級已經(jīng)具備條件,也是產(chǎn)業(yè)發(fā)展的大勢所趨。

      用戶畫像系統(tǒng)是對現(xiàn)實(shí)生活中的用戶行為進(jìn)行數(shù)據(jù)建模,以不同的數(shù)據(jù)維度對用戶進(jìn)行刻畫。通過對用戶的人口屬性、行為偏好等主要信息進(jìn)行建模分析,從而抽象出能夠讓人理解的語義標(biāo)簽,通過標(biāo)簽來形成一個(gè)用戶的信息全貌,為進(jìn)一步分析

      和利用這些信息提供數(shù)據(jù)基礎(chǔ)。目前在航空、電信、銀行和互聯(lián)網(wǎng)行業(yè),許多公司已經(jīng)建立并應(yīng)用了用戶畫像系統(tǒng),在提升用戶體驗(yàn)、精準(zhǔn)營銷、效益提升方面取得了很好的效果[2-3]。

      本文針對鐵路行業(yè)大數(shù)據(jù)應(yīng)用—旅客用戶畫像系統(tǒng)進(jìn)行了探索:對鐵路用戶的行為、交易等數(shù)據(jù)進(jìn)行采集,綜合運(yùn)用統(tǒng)計(jì)學(xué)模型、文本挖掘、機(jī)器學(xué)習(xí)等多種技術(shù),把海量數(shù)據(jù)轉(zhuǎn)化成簡潔、形象、人機(jī)可理解的畫像標(biāo)簽,通過與應(yīng)用系統(tǒng)對接,支撐客運(yùn)產(chǎn)品優(yōu)化、個(gè)性化服務(wù)、數(shù)據(jù)增值服務(wù)等業(yè)務(wù)的開展,從而充分發(fā)揮數(shù)據(jù)的基礎(chǔ)資源作用和創(chuàng)新引擎作用,助力鐵路部門提升客戶服務(wù)能力和 核心競爭力。

      1 旅客用戶畫像系統(tǒng)架構(gòu)設(shè)計(jì)

      鐵路旅客用戶畫像系統(tǒng)依托基礎(chǔ)運(yùn)行環(huán)境提供線性伸縮的計(jì)算存儲資源,采用基于Hadoop的大數(shù)據(jù)體系架構(gòu)[4-6],通過采集、匯聚內(nèi)部數(shù)據(jù)和外部數(shù)據(jù),為廣告綜合投放子系統(tǒng)、數(shù)據(jù)分析子系統(tǒng)、在線交易子系統(tǒng)以及客運(yùn)相關(guān)服務(wù)提供實(shí)時(shí)的用戶畫像數(shù)據(jù)訪問接口,支撐精準(zhǔn)廣告投放、客戶推薦服務(wù)、客運(yùn)輔助決策支持等業(yè)務(wù),如圖1所示。系統(tǒng)主要包括:

      (1)實(shí)現(xiàn)系統(tǒng)大數(shù)據(jù)計(jì)算存儲、數(shù)據(jù)匯聚、數(shù)據(jù)分析的基礎(chǔ)運(yùn)行環(huán)境;

      (2)獲取鐵路客運(yùn)業(yè)務(wù)系統(tǒng)數(shù)據(jù)、網(wǎng)站用戶行為數(shù)據(jù)的采集系統(tǒng);

      (3)用于實(shí)現(xiàn)鐵路用戶畫像標(biāo)簽定義、管理、計(jì)算、分析和呈現(xiàn)的業(yè)務(wù)平臺;

      (4)與外部系統(tǒng)交互的數(shù)據(jù)服務(wù)接口平臺。

      圖1 用戶畫像系統(tǒng)總體架構(gòu)

      2 旅客用戶畫像系統(tǒng)實(shí)現(xiàn)

      用戶畫像即用戶信息標(biāo)簽化,就是從用戶原始數(shù)據(jù)到用戶標(biāo)簽的分析轉(zhuǎn)換過程——通過對匯聚的海量用戶數(shù)據(jù)的分析挖掘,形成每個(gè)用戶的特征標(biāo)簽集合,并對外提供基于用戶特征標(biāo)簽的數(shù)據(jù)服務(wù)的過程。它的核心工作是為用戶打標(biāo)簽,打標(biāo)簽的重要目的之一是為了讓人能夠理解并且方便計(jì)算機(jī)處理。標(biāo)簽通常是人為規(guī)定的高度精煉的特征標(biāo)識,既能夠很方便地被人理解,也能夠方便機(jī)器進(jìn)行提取和聚合分析。

      構(gòu)建用戶畫像標(biāo)簽體系包含以下步驟。

      2.1 數(shù)據(jù)源分析

      構(gòu)建用戶畫像是對用戶信息的還原,涉及的數(shù)據(jù)源盡可能包括用戶相關(guān)的所有數(shù)據(jù)。通過對鐵路客票系統(tǒng)相關(guān)數(shù)據(jù)源的分析,根據(jù)標(biāo)簽的特性將數(shù)據(jù)分成靜態(tài)數(shù)據(jù)和動態(tài)數(shù)據(jù)。靜態(tài)數(shù)據(jù)包括人口屬性、社會屬性、賬戶屬性等;動態(tài)數(shù)據(jù)包括乘車、購票、支付、查詢、咨詢行為等方面數(shù)據(jù)。

      2.2 設(shè)計(jì)標(biāo)簽

      標(biāo)簽和標(biāo)簽規(guī)則需要人為定義,通過對目標(biāo)的確定和數(shù)據(jù)的分析,定義出對應(yīng)的標(biāo)簽,最終為用戶打上標(biāo)簽。根據(jù)用戶畫像標(biāo)簽實(shí)現(xiàn)方式和應(yīng)用場景的不同,鐵路旅客用戶畫像系統(tǒng)的標(biāo)簽可以分成事實(shí)標(biāo)簽、業(yè)務(wù)標(biāo)簽、模型標(biāo)簽等類型,如圖2所示。

      2.3 標(biāo)簽實(shí)現(xiàn)

      標(biāo)簽實(shí)現(xiàn)是數(shù)據(jù)建模和流程化的過程,即根據(jù)定義好的標(biāo)簽,確定采用什么樣的方式為用戶打上標(biāo)簽的過程。鐵路旅客用戶畫像系統(tǒng)在技術(shù)上使用了離線的MapReduce/Pig/Hive、準(zhǔn)實(shí)時(shí)的spark/impala、數(shù)據(jù)挖掘的R/mahout/sparkmllib等數(shù)據(jù)處理技術(shù),結(jié)果存儲到Hbase和Elasticsearch快速檢索引擎上,以供數(shù)據(jù)服務(wù)接口實(shí)現(xiàn)快速訪問。鐵路旅客用戶畫像系統(tǒng)建模的方式包括直接取值、統(tǒng)計(jì)分析、業(yè)務(wù)規(guī)則、預(yù)測模型等幾種類型,流程示意圖,如圖3所示。

      3 旅客用戶畫像系統(tǒng)應(yīng)用

      目前,鐵路旅客用戶畫像系統(tǒng)設(shè)計(jì)并建成了包括事實(shí)標(biāo)簽、業(yè)務(wù)標(biāo)簽和模型標(biāo)簽在內(nèi)的一整套標(biāo)簽體系,數(shù)量超過1 500個(gè),涵蓋了旅客的基礎(chǔ)屬性(姓名、性別、年齡、常駐地等)、出行行為(出行次數(shù)、出發(fā)城市、到達(dá)城市、席位等級等)、交易行為(線上線下選擇、支付方式、退改簽情況等、出行規(guī)律、消費(fèi)習(xí)慣、潛在消費(fèi))等多個(gè)方面。

      圖2 旅客用戶畫像標(biāo)簽體系

      圖3 標(biāo)簽建立流程示意

      建立用戶畫像系統(tǒng)的目的是為了幫助業(yè)務(wù)部門了解自己的用戶,便于在產(chǎn)品設(shè)計(jì)、旅客服務(wù)過程中做到目標(biāo)明確、高效和精準(zhǔn)。結(jié)合目前鐵路業(yè)務(wù)現(xiàn)狀,旅客用戶畫像系統(tǒng)在下述幾個(gè)方面可以進(jìn)行業(yè)務(wù)對接和應(yīng)用。

      3.1 旅客行為分析

      通過對旅客成分結(jié)構(gòu)、產(chǎn)品選擇行為、購票行為、旅行行為等方面進(jìn)行分析,可以發(fā)現(xiàn)群體旅客特征、個(gè)體旅客特征與客運(yùn)產(chǎn)品的關(guān)系。

      3.1.1 旅客成分結(jié)構(gòu)

      通過分析得到鐵路旅客的組成情況,以做好鐵路產(chǎn)品設(shè)計(jì)和服務(wù)提供的數(shù)據(jù)支撐。例如:

      (1)性別比例;(2)旅客區(qū)域(城市)比例; (3)各年齡段比例;(4)各票種的比例。

      3.1.2 產(chǎn)品選擇行為分析

      旅客在進(jìn)行產(chǎn)品選擇時(shí),會受多種因素的影響。通過下列分析,有助于分析判定旅客選擇客運(yùn)產(chǎn)品的影響因素,為產(chǎn)品設(shè)計(jì)提供依據(jù)。

      (1)按旅客選擇的列車類型分析;(2)按旅客選擇的鋪別和席別分析;(3)按旅客選擇的票價(jià)區(qū)間分析;(4)按旅客乘車?yán)锍谭治?;?)按旅客選擇的列車開點(diǎn)分析;(6)按旅客選擇的列車到點(diǎn)分析;(7)按旅客選擇列車擔(dān)當(dāng)企業(yè)分析。

      3.1.3 交易行為分析

      通過交易記錄的分析,發(fā)現(xiàn)旅客在購票交易過程中的行為特點(diǎn),以針對性的做好售票組織和服務(wù)工作。(1)購票渠道分析;(2)互聯(lián)網(wǎng)換

      票分析;(3)電訂取票分析;(4)自助售票分析;(5)支付方式分析;(6)預(yù)售規(guī)律;(7)通票、聯(lián)程、往返票分析;(8)退票時(shí)間規(guī)律;(9)改簽時(shí)間規(guī)律;(10)改簽分類分析。

      3.1.4 旅客乘車行為分析

      通過對旅客出行行為的分析,可以發(fā)現(xiàn)需要重點(diǎn)關(guān)注的旅客,從而進(jìn)行產(chǎn)品推薦或者個(gè)性化服務(wù),提升旅客出行體驗(yàn)。(1)按旅客出行目的分析:通過設(shè)計(jì)合理的模型進(jìn)行評判,將出行目的分為旅游、商務(wù)、公務(wù)、探親、民工、學(xué)生、通勤職工等;(2)按旅客出行頻度分析:按出行次數(shù)對旅客進(jìn)行分群分析,得到潛在的常旅客用戶;(3)按旅客出行范圍分析:按行政區(qū)劃進(jìn)行出行范圍分析,如省內(nèi)客流、省間客流;(4)按旅客出行行程分析:按旅客出行行程進(jìn)行分析,由聚類模型分析得到旅客行程的合理劃分。

      3.2 精準(zhǔn)營銷

      通過構(gòu)建的鐵路旅客用戶畫像,為旅客建立了人口屬性、出行行為、交易行為等多維度的標(biāo)簽,通過對多維度標(biāo)簽的篩選、聚類,找出符合要求的特定人群,然后在推薦平臺為人群制定對應(yīng)的營銷策略,并利用廣告平臺實(shí)現(xiàn)對用戶群體的精準(zhǔn)營銷。

      基于鐵路旅客用戶畫像數(shù)據(jù)的推薦系統(tǒng)利用Elasticsearch強(qiáng)大的組合和聚合搜索能力,提供快速的標(biāo)簽篩選能力,在此基礎(chǔ)上利用機(jī)器學(xué)習(xí)算法——基于用戶的協(xié)同過濾算法,根據(jù)用戶的偏好實(shí)現(xiàn)用戶聚類,即將相似度較高的用戶分為一個(gè)群體,在用戶訪問時(shí)進(jìn)行信息的推送,從而實(shí)現(xiàn)產(chǎn)品的精準(zhǔn)推薦。

      用戶定量標(biāo)簽的相似度計(jì)算方法[7-8]:

      式(1)中,wk表示第k個(gè)定量標(biāo)簽的權(quán)重;sim(profilek(ui),profilek(uj)),表示用戶ui和用戶uj在第k個(gè)定量標(biāo)簽的相似度。

      3.3 數(shù)據(jù)核驗(yàn)

      央行發(fā)布的《非銀行支付機(jī)構(gòu)網(wǎng)絡(luò)支付業(yè)務(wù)管理辦法》于2016年7月1日起正式實(shí)施。其要求支付機(jī)構(gòu)為客戶開立支付賬戶的,應(yīng)當(dāng)對客戶實(shí)行實(shí)名制管理。在推行和實(shí)施的過程中,第三方支付平臺需要簡化用戶核驗(yàn)流程,在提高用戶體驗(yàn)的情況下完成用戶的核驗(yàn),故需要借助外部系統(tǒng)提供的核驗(yàn)服務(wù)。目前鐵路互聯(lián)網(wǎng)售票系統(tǒng)注冊用戶突破2.5億,乘車旅客信息超過5億,旅客信息基本都是通過實(shí)名制核驗(yàn)的,所有的數(shù)據(jù)真實(shí)可靠,所以鐵路互聯(lián)網(wǎng)數(shù)據(jù)服務(wù)平臺可以對第三方支付平臺提供身份核驗(yàn)服務(wù),助力第三方支付平臺實(shí)名制的實(shí)施。

      因此,數(shù)據(jù)核驗(yàn)是鐵路部門實(shí)現(xiàn)數(shù)據(jù)共享、數(shù)據(jù)共創(chuàng)和數(shù)據(jù)增值的重要業(yè)務(wù)。系統(tǒng)基于旅客用戶畫像系統(tǒng),為第三方系統(tǒng)提供不同查詢條件的服務(wù)接口,包括姓名、證件號和手機(jī)號的比對。

      3.4 互聯(lián)網(wǎng)售票系統(tǒng)風(fēng)險(xiǎn)防控

      鐵路12306互聯(lián)網(wǎng)售票系統(tǒng)為旅客提供便捷購票的同時(shí),也成為部分機(jī)構(gòu)和個(gè)人囤票、倒賣的途徑。如何對互聯(lián)網(wǎng)售票系統(tǒng)存在的惡意訪問進(jìn)行有效防控,構(gòu)造公平、和諧的購票環(huán)境是永恒的主題[9]?;诋嬒裣到y(tǒng)對用戶行為進(jìn)行深入分析挖掘之后,評估存在異常的用戶行為,針對性地研究相關(guān)風(fēng)險(xiǎn)控制手段形成風(fēng)險(xiǎn)控制系統(tǒng),實(shí)現(xiàn)應(yīng)用防火墻(WAF)成為行之有效的方法。

      風(fēng)險(xiǎn)防控系統(tǒng)覆蓋了風(fēng)險(xiǎn)識別、風(fēng)險(xiǎn)控制、風(fēng)險(xiǎn)告警等環(huán)節(jié),主要功能包括:

      (1)用戶風(fēng)險(xiǎn)等級管理。結(jié)合業(yè)務(wù)系統(tǒng)的用戶特點(diǎn),綜合考慮和分析用戶的各類特征因素并進(jìn)行分類,通過用戶評級列表可以展現(xiàn)基于風(fēng)險(xiǎn)評估的評級結(jié)果。(2)規(guī)則管理平臺。規(guī)則引擎基于多維度的風(fēng)險(xiǎn)特征、靈活的風(fēng)控模型,可以準(zhǔn)確地分析識別惡意訪問行為,經(jīng)過規(guī)則判斷的每一條數(shù)據(jù),綜合各個(gè)維度的分?jǐn)?shù),形成最終的評分,最終建議該條請求拒絕或者通過。(3)統(tǒng)計(jì)分析。按照風(fēng)險(xiǎn)性質(zhì)和類型、業(yè)務(wù)類型、風(fēng)險(xiǎn)趨勢、風(fēng)險(xiǎn)核查等不同角度進(jìn)行統(tǒng)計(jì),通過可視化輔助監(jiān)控人員全面了解當(dāng)前系統(tǒng)的運(yùn)行狀況,并將相關(guān)統(tǒng)計(jì)分析結(jié)果運(yùn)用在優(yōu)化風(fēng)險(xiǎn)規(guī)則上。(4)報(bào)警監(jiān)控。對系統(tǒng)分析出的異常行為,依據(jù)規(guī)則達(dá)到風(fēng)險(xiǎn)告警閥值時(shí)進(jìn)行告警,以便管理人員及時(shí)人工介入處理。(5)風(fēng)險(xiǎn)控制。實(shí)現(xiàn)通用安全防御、基于IP的流量控制、IP黑白名單、統(tǒng)一資源定位符(URL)黑白名單、用戶名黑白名單、用戶/URL/IP高頻控制、業(yè)務(wù)流程控制、監(jiān)控、管理、多樣化的安全管控措施等業(yè)務(wù)或管理功能。

      4 結(jié)束語

      通過運(yùn)用大數(shù)據(jù)技術(shù),設(shè)計(jì)了鐵路行業(yè)的旅客用戶畫像系統(tǒng),并基于該系統(tǒng)進(jìn)行了業(yè)務(wù)應(yīng)用的探索。目前,旅客行為分析、數(shù)據(jù)核驗(yàn)和互聯(lián)網(wǎng)售票系統(tǒng)風(fēng)險(xiǎn)控制應(yīng)用已經(jīng)部署上線、進(jìn)入試運(yùn)行階段,精準(zhǔn)營銷相關(guān)功能正在開發(fā)過程中,后續(xù)將在完善現(xiàn)有應(yīng)用的基礎(chǔ)上,積極探索新的業(yè)務(wù)模式和方法,通過不斷的完善、優(yōu)化、豐富,充分發(fā)揮鐵路旅客用戶畫像系統(tǒng)在客運(yùn)產(chǎn)品設(shè)計(jì)、旅客服務(wù)水平提升方面的支撐作用。

      猜你喜歡
      畫像旅客標(biāo)簽
      威猛的畫像
      非常旅客意見簿
      “00后”畫像
      畫像
      無懼標(biāo)簽 Alfa Romeo Giulia 200HP
      車迷(2018年11期)2018-08-30 03:20:32
      不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
      海峽姐妹(2018年3期)2018-05-09 08:21:02
      我是人
      故事大王(2018年3期)2018-05-03 09:55:52
      給小旅客的禮物
      空中之家(2016年1期)2016-05-17 04:47:43
      標(biāo)簽化傷害了誰
      基于多進(jìn)制查詢樹的多標(biāo)簽識別方法
      惠东县| 泌阳县| 澳门| 平舆县| 若羌县| 昌黎县| 喀喇| 竹北市| 寿宁县| 霍林郭勒市| 县级市| 兴宁市| 茌平县| 靖安县| 湘潭市| 茂名市| 长沙县| 西峡县| 丹阳市| 崇礼县| 莫力| 长武县| 九寨沟县| 海南省| 汶上县| 龙江县| 正宁县| 扶绥县| 鱼台县| 莆田市| 兴安盟| 财经| 临朐县| 合江县| 霸州市| 安岳县| 海门市| 合山市| 瓮安县| 克什克腾旗| 固镇县|