• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    一種多視角用戶畫像體系知識(shí)圖譜構(gòu)建方法簡(jiǎn)述

    2020-09-29 07:54:12劉文敏孟繁瑞
    科學(xué)與信息化 2020年25期
    關(guān)鍵詞:用戶畫像知識(shí)圖譜

    劉文敏 孟繁瑞

    摘 要 在互聯(lián)網(wǎng)應(yīng)用大爆發(fā)背景下,用戶畫像技術(shù)得到廣泛應(yīng)用,但現(xiàn)有的基于虛擬身份信息的用戶畫像難以針對(duì)同一人進(jìn)行有效關(guān)聯(lián)。本文提出了通過不同虛擬身份用戶的行為、內(nèi)容抽取靜態(tài)用戶畫像標(biāo)簽,以實(shí)現(xiàn)關(guān)聯(lián)用戶真實(shí)身份、動(dòng)態(tài)融合用戶畫像標(biāo)簽的知識(shí)圖譜構(gòu)建思路和方法。

    關(guān)鍵詞 用戶畫像;知識(shí)圖譜;虛擬身份;用戶標(biāo)簽

    根據(jù)相關(guān)部門統(tǒng)計(jì), 2020年第一季度,我國(guó)網(wǎng)民規(guī)模達(dá)到9.04億,互聯(lián)網(wǎng)普及率更是達(dá)到64.5%,互聯(lián)網(wǎng)已成為人民生活不可或缺的一部分。近年來,用戶畫像技術(shù)在各個(gè)領(lǐng)域得到了廣泛應(yīng)用,但現(xiàn)有用戶畫像數(shù)據(jù)的采集大多基于虛擬身份信息,用戶的各虛擬身份之間難以有效關(guān)聯(lián),想要進(jìn)一步更為完整、全面、精確的刻畫用戶畫像困難重重。為初步構(gòu)建解決上述問題的方法,本文將通過用戶行為、內(nèi)容等方面,多視角研究用戶畫像關(guān)聯(lián)關(guān)系,從而拓展用戶畫像能力,提高用戶畫像質(zhì)量。

    1用戶畫像相關(guān)背景

    用戶畫像研究領(lǐng)域中,相關(guān)研究多集中在推薦系統(tǒng)等商業(yè)領(lǐng)域,研究對(duì)象往往是使用某一產(chǎn)品或者服務(wù),以及具有相似背景、興趣的用戶群體所呈現(xiàn)出的具有共同特征的集合,即挖掘用戶群體顯著特征的概念模型[1]。對(duì)于用戶畫像應(yīng)用,目前一般集中在三個(gè)方面。一是User Portrait即用戶肖像,主要應(yīng)用于用戶肖像的繪畫;二是Persona即用戶畫像,主要應(yīng)用于創(chuàng)造一個(gè)虛擬用戶,更加關(guān)注用戶建模和模擬用戶技巧;三是User Profile即用戶文件,主要應(yīng)用于描述用戶興趣的文件,更加體現(xiàn)用戶個(gè)性化的需求,側(cè)重于存儲(chǔ)數(shù)據(jù)及其結(jié)構(gòu)。視角不同,方法不同。按研究視角,用戶畫像方法可歸結(jié)為四類進(jìn)行分類,即基于虛構(gòu)的視角、基于目標(biāo)導(dǎo)向的視角、基于角色的視角以及基于參與的視角。其中,基于虛構(gòu)視角的用戶畫像方法建立在主觀設(shè)想上,后面三種人物畫像方法通過采集用戶數(shù)據(jù)來支撐畫像結(jié)果。用戶畫像作為用戶細(xì)分的一項(xiàng)基礎(chǔ)性工作,在商業(yè)系統(tǒng)中,往往通過挖掘海量數(shù)據(jù)中用戶相關(guān)行為數(shù)據(jù),標(biāo)記出用戶的屬性、特點(diǎn)、行為、傾向等,再對(duì)每一細(xì)分群體的典型特征進(jìn)行抽象,從而實(shí)現(xiàn)對(duì)用戶準(zhǔn)確分類、深刻理解,最后實(shí)現(xiàn)對(duì)互聯(lián)網(wǎng)用戶的精準(zhǔn)管理,甚至是行為推斷、傾向引導(dǎo)。用戶畫像技術(shù)在微觀層面揭示了單個(gè)用戶的信息行為特征,能夠直觀地體現(xiàn)用戶偏好領(lǐng)域、情感強(qiáng)度、態(tài)度傾向、認(rèn)知與感知等,用戶畫像技術(shù)在宏觀層面顯現(xiàn)群體行為,更能夠從更高層次體現(xiàn)集體情感傾向。

    2用戶畫像體系知識(shí)圖譜構(gòu)建思路

    知識(shí)圖譜是一種可視化的知識(shí)領(lǐng)域映射,用戶畫像體系知識(shí)圖譜建立在用戶畫像標(biāo)簽基礎(chǔ)上,重在展現(xiàn)標(biāo)簽之間相互聯(lián)系。對(duì)用戶畫像打標(biāo)簽的過程,主要根據(jù)人口統(tǒng)計(jì)學(xué)方法,搜集、整理、分析和運(yùn)用各種能夠反應(yīng)用戶畫像的真實(shí)數(shù)據(jù),再按統(tǒng)一標(biāo)準(zhǔn)結(jié)構(gòu)抽取用戶畫像屬性指標(biāo),從而真實(shí)反映現(xiàn)實(shí)社會(huì)生產(chǎn)中的各種數(shù)量表現(xiàn)、數(shù)量關(guān)系及其變動(dòng)的規(guī)律性,最終期望能夠揭示人群現(xiàn)象和過程的本質(zhì)聯(lián)系,以及人群總體的規(guī)模、結(jié)構(gòu)、分布及其發(fā)展變化的趨勢(shì)。本文利用靜態(tài)和動(dòng)態(tài)兩類指標(biāo)構(gòu)建用戶畫像體系。其中,靜態(tài)指標(biāo)是指能夠從現(xiàn)網(wǎng)數(shù)據(jù)中直接提取的屬性信息。動(dòng)態(tài)指標(biāo)則是指利用靜態(tài)屬性抽象出來的標(biāo)簽化屬性[2]。

    3用戶畫像體系知識(shí)圖譜構(gòu)建方法

    (1)靜態(tài)虛擬身份抽取。一般來說,采集靜態(tài)指標(biāo),需要事先規(guī)劃好畫像的維度及數(shù)據(jù)需求。以從某知識(shí)庫中抽取靜態(tài)虛擬身份為例,可抽取如下數(shù)據(jù)組。①標(biāo)識(shí)信息屬性組。該屬性組可以根據(jù)IP、終端、常用ID等能顯著區(qū)分虛擬身份類別,生成唯一虛擬身份標(biāo)識(shí)。②終端信息屬性組。該屬性組可以針對(duì)已生成的能夠標(biāo)識(shí)終端的標(biāo)識(shí)信息等虛擬身份標(biāo)識(shí),并提取設(shè)備相關(guān)屬性。③網(wǎng)絡(luò)信息屬性組。該屬性組可以針對(duì)已生成的標(biāo)識(shí)信息,關(guān)聯(lián)IP、MAC等虛擬身份標(biāo)識(shí),提取網(wǎng)絡(luò)相關(guān)等屬性。④身份信息屬性組,關(guān)聯(lián)性別、民族等屬性。⑤位置信息屬性組,關(guān)聯(lián)位置、進(jìn)入時(shí)間、離開時(shí)間、停留時(shí)間等屬性。⑥信息行為屬性組,關(guān)聯(lián)url、搜索詞等屬性。⑦經(jīng)濟(jì)行為屬性組,關(guān)聯(lián)收支、類別、收支、類別等屬性。⑧交互行為屬性組,形成虛擬身份之間的交互行為。⑨虛擬身份關(guān)聯(lián)屬性組,利用各表內(nèi)虛擬身份及各類標(biāo)識(shí)符之間交叉重疊關(guān)系,評(píng)價(jià)虛擬身份與虛擬身份關(guān)聯(lián)權(quán)重。

    (2)身份融合及動(dòng)態(tài)真實(shí)身份標(biāo)簽融合。利用上一步產(chǎn)生的各類虛擬身份屬性,通過虛擬身份關(guān)聯(lián)關(guān)系及權(quán)重與用戶相結(jié)合。同時(shí),在靜態(tài)指標(biāo)的基礎(chǔ)上,抽取共性特征形成標(biāo)簽,進(jìn)而進(jìn)一步構(gòu)建動(dòng)態(tài)指標(biāo)。

    (3)知識(shí)圖譜構(gòu)建與管理。用戶畫像知識(shí)圖譜是一個(gè)動(dòng)態(tài)發(fā)展、不停迭代的過程,為確保用戶畫像質(zhì)量,需要建立統(tǒng)一的標(biāo)準(zhǔn)工作流,從而實(shí)現(xiàn)全生命周期規(guī)范化管理,具體流程如下。①需求收集。溝通各方,形成統(tǒng)一化模板,收集整理標(biāo)簽畫像需求,建立人物畫像標(biāo)簽需求庫。②設(shè)計(jì)驗(yàn)證。組織業(yè)內(nèi)專家,對(duì)需求庫中的需求進(jìn)行評(píng)審,對(duì)具有相關(guān)性的需求進(jìn)行合并,以盡量少的標(biāo)簽覆蓋需求庫,初步建立用戶畫像知識(shí)圖譜,并通過系統(tǒng)性的分析、試驗(yàn)等方式驗(yàn)證標(biāo)簽效果。③動(dòng)態(tài)調(diào)整。在生產(chǎn)過程中,對(duì)知識(shí)圖譜中的每個(gè)標(biāo)簽進(jìn)行評(píng)估,分析標(biāo)簽之間的相關(guān)性,對(duì)具有相關(guān)性的標(biāo)簽進(jìn)行合并,對(duì)功能低的標(biāo)標(biāo)簽進(jìn)行刪除。對(duì)生產(chǎn)中的產(chǎn)生的新屬性評(píng)估后加入新標(biāo)簽。標(biāo)簽的合并、刪除以及加入需要有嚴(yán)格的人工審核機(jī)制。上述過程循環(huán)進(jìn)行,達(dá)到讓用戶畫像效果階梯式上升目的[3]。

    4結(jié)束語

    為了提高分析效率,理想化的用戶畫像體系知識(shí)圖譜各個(gè)維度,即標(biāo)簽應(yīng)該是相互獨(dú)立的,以減少冗余信息,通過不同標(biāo)簽的組合能夠明確指向到某一類或者目標(biāo)人群,這需要從頂層設(shè)計(jì)入手構(gòu)建用戶畫像體系,然后通過試驗(yàn)分析驗(yàn)證體系的有效性。但在實(shí)際實(shí)踐中,目前已有的畫像系統(tǒng)多采用自底向上的方法進(jìn)行設(shè)計(jì),僅依靠單一數(shù)據(jù)必然難以達(dá)到理想化目的,本文初步探索了如何利用自底向上及自頂向下相結(jié)合的方式從多個(gè)視角構(gòu)建用戶畫像知識(shí)圖譜。用戶畫像本身作為一項(xiàng)系統(tǒng)級(jí)技術(shù),更需要根據(jù)數(shù)據(jù)特點(diǎn),自底向上建設(shè)知識(shí)庫,自頂向下用戶畫像設(shè)計(jì)體系,才能最終得到切實(shí)好用、準(zhǔn)確、真實(shí)的用戶畫像數(shù)據(jù)。

    參考文獻(xiàn)

    [1] 亓叢,吳俊.用戶畫像概念溯源與應(yīng)用場(chǎng)景研究[J].重慶交通大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2017(5):86-87.

    [2] 佚名.第45次中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告[ED/OL]. http://www.cac.gov.cn/2020-04/27/c_1589535470378587.htm,2020-4-28.

    [3] 李保澄,劉碩.基于用戶畫像技術(shù)的公安教育大數(shù)據(jù)應(yīng)用[J].廣西警察學(xué)院學(xué)報(bào),2018(3):124-128.

    猜你喜歡
    用戶畫像知識(shí)圖譜
    貝葉斯網(wǎng)絡(luò)在用戶畫像構(gòu)建中的研究
    把聲音的魅力發(fā)揮到極致
    國(guó)內(nèi)圖書館嵌入式服務(wù)研究主題分析
    國(guó)內(nèi)外政府信息公開研究的脈絡(luò)、流派與趨勢(shì)
    移動(dòng)用戶畫像構(gòu)建研究
    近十五年我國(guó)小學(xué)英語教學(xué)研究的熱點(diǎn)、問題及對(duì)策
    基于知識(shí)圖譜的產(chǎn)業(yè)集群創(chuàng)新績(jī)效可視化分析
    基于知識(shí)圖譜的智慧教育研究熱點(diǎn)與趨勢(shì)分析
    基于微博的大數(shù)據(jù)用戶畫像與精準(zhǔn)營(yíng)銷
    從《ET&S》與《電化教育研究》對(duì)比分析中管窺教育技術(shù)發(fā)展
    泸水县| 读书| 万年县| 彝良县| 赣榆县| 沈阳市| 青河县| 朝阳市| 前郭尔| 泗水县| 永善县| 临夏市| 尉氏县| 河北省| 集贤县| 泗洪县| 宝应县| 通化县| 麻江县| 威宁| 内丘县| 台中县| 合作市| 江达县| 江安县| 南漳县| 响水县| 三原县| 海原县| 义马市| 车险| 海口市| 常山县| 泾阳县| 崇文区| 华坪县| 河曲县| 三亚市| 营口市| 新郑市| 乌什县|