居松 江蘇省廣播電視總臺(tái)
當(dāng)今世界處于數(shù)據(jù)爆炸的時(shí)代,用戶數(shù)據(jù)作為寶貴的資源顯得愈發(fā)重要。在國家層面推進(jìn)三網(wǎng)融合發(fā)展及三網(wǎng)融合業(yè)務(wù)快速發(fā)展的大背景下,如何充分利用IPTV電視的網(wǎng)絡(luò)特性,收集利用真實(shí)全量的數(shù)據(jù),對(duì)新媒體的發(fā)展、節(jié)目開發(fā)、業(yè)務(wù)運(yùn)營有著重要的戰(zhàn)略意義。研究針對(duì)海量用戶數(shù)據(jù)的多維度建模方法,設(shè)計(jì)聚類、分類相結(jié)合的數(shù)據(jù)挖掘算法,可起到為三網(wǎng)融合、新媒體的發(fā)展增加催化劑、助推劑的作用。
EPG探針即外掛式的EPG腳本,嵌入在EPG代碼中,用于監(jiān)聽用戶點(diǎn)擊行為,觸發(fā)用戶點(diǎn)擊事件,并實(shí)時(shí)向后端發(fā)送固定規(guī)范的消息文本。
在EPG服務(wù)器各節(jié)點(diǎn)掛載EPG探針,用戶打開頁面并收看節(jié)目時(shí),會(huì)觸發(fā)探針事件產(chǎn)生采集行為,機(jī)頂盒對(duì)用戶操作信息進(jìn)行計(jì)算機(jī)編碼匯聚后,以負(fù)載均衡集群的方式,實(shí)時(shí)地將固定規(guī)范的收視數(shù)據(jù)轉(zhuǎn)發(fā)到后端大數(shù)據(jù)統(tǒng)計(jì)和分析系統(tǒng),生成業(yè)務(wù)部門所需要的各類智能報(bào)表。
EPG探針的應(yīng)用具有如下優(yōu)勢(shì):
(1)更客觀
忠實(shí)的記錄了用戶使用IPTV業(yè)務(wù)過程中的每一次行為動(dòng)作,避免了不確定性的人工干預(yù),保證了原始數(shù)據(jù)的客觀性。
圖1 采集處理流程
(2)更實(shí)時(shí)
可基于Flume+ Spark Streaming實(shí)時(shí)采集計(jì)算框架,不僅能實(shí)時(shí)采集處理用戶的收視行為數(shù)據(jù),還能根據(jù)業(yè)務(wù)需求實(shí)時(shí)向用戶反饋推薦信息。
(3)更精確
無論是采集還是回傳,秒級(jí)的顆粒度,對(duì)于節(jié)目運(yùn)營、產(chǎn)品推送、頁面設(shè)計(jì)等有著革命性的指導(dǎo)意義。
(4)更全面
探針相較于傳統(tǒng)的收視統(tǒng)計(jì)手段,有著更全面的采集能力,比如頁面、專題、流向等相關(guān)數(shù)據(jù),傳統(tǒng)的收視數(shù)據(jù)里是沒有的。
入口的價(jià)值用不著多說,這里的入口,既指EPG推薦位入口,亦泛指各EPG頁面及頁面入口。傳統(tǒng)的話單數(shù)據(jù),并沒有入口相關(guān)的數(shù)據(jù)支持,所以業(yè)務(wù)運(yùn)營人員對(duì)于入口的認(rèn)知更加依賴于長期的運(yùn)營經(jīng)驗(yàn),偏主觀一點(diǎn)。相比之下,EPG探針可根據(jù)實(shí)際業(yè)務(wù)需求,在需要統(tǒng)計(jì)的入口位置進(jìn)行埋碼,這樣收集到的數(shù)據(jù)就客觀且準(zhǔn)確得多了。實(shí)時(shí)大數(shù)據(jù)統(tǒng)計(jì)分析系統(tǒng)(以下簡稱“實(shí)時(shí)系統(tǒng)”)生成的入口數(shù)據(jù)報(bào)表,對(duì)實(shí)際運(yùn)營的指導(dǎo)作用,可參考以下幾個(gè)維度:
(1)同一節(jié)目在各頁面占比率
以《瘋狂動(dòng)物城》為例,這部片子可以推送到EPG主模板,也可以推送到電影子專區(qū)或少兒子專區(qū),根據(jù)實(shí)時(shí)系統(tǒng)生成的報(bào)表能夠看到《瘋狂動(dòng)物城》在各個(gè)頁面各個(gè)位置的占比率,這對(duì)于業(yè)務(wù)運(yùn)營人員在什么頁面什么入口推送什么類型的增值產(chǎn)品,具有客觀的指導(dǎo)意義。
(2)同一頁面在各入口點(diǎn)擊率
對(duì)同一個(gè)頁面中的不同位置進(jìn)行埋碼,根據(jù)實(shí)時(shí)系統(tǒng)生成的報(bào)表能夠看到各個(gè)位置的點(diǎn)擊率,這不僅能夠指導(dǎo)業(yè)務(wù)運(yùn)營人員對(duì)于頁面入口的價(jià)值評(píng)估及相應(yīng)的產(chǎn)品推送,還能夠指導(dǎo)頁面設(shè)計(jì)人員對(duì)于頁面入口的設(shè)計(jì)評(píng)估及優(yōu)化。
(3)頁面占比及轉(zhuǎn)化率
對(duì)不同頁面進(jìn)行埋碼,實(shí)時(shí)系統(tǒng)能夠統(tǒng)計(jì)到各個(gè)頁面實(shí)時(shí)在線人數(shù),各頁面之間的跳轉(zhuǎn)路徑,以及各頁面的轉(zhuǎn)化率,在頁面邏輯優(yōu)化方面,給予頁面設(shè)計(jì)人員更多的設(shè)計(jì)思路
內(nèi)容一直是業(yè)務(wù)運(yùn)營的主體,傳統(tǒng)的內(nèi)容運(yùn)營,在保證直輪播、點(diǎn)播及回看質(zhì)量的同時(shí),更注重的是推送的入口。在實(shí)時(shí)大數(shù)據(jù)的潮流面前,內(nèi)容不僅僅是內(nèi)容本身,它與更多的元素(用戶、時(shí)間等)產(chǎn)生聯(lián)系,所以內(nèi)容運(yùn)營不可避免會(huì)做出相應(yīng)的優(yōu)化。這對(duì)實(shí)際運(yùn)營的指導(dǎo)作用,可參考以下幾個(gè)維度:
(1)內(nèi)容熱度
實(shí)時(shí)系統(tǒng)可以輕松統(tǒng)計(jì)出各類內(nèi)容的熱度排行,為業(yè)務(wù)運(yùn)營人員對(duì)各個(gè)版塊的內(nèi)容推送、以及后續(xù)的內(nèi)容采購提供了數(shù)據(jù)支撐。
(2)時(shí)間趨勢(shì)
同一內(nèi)容在不同時(shí)間段的表現(xiàn),也不盡相同。工作日和雙休日,早晨、中午和晚上,都有著一定的差異性和規(guī)律性。實(shí)時(shí)系統(tǒng)可以實(shí)時(shí)統(tǒng)計(jì)出各類內(nèi)容在不同時(shí)間段的收視表現(xiàn),業(yè)務(wù)運(yùn)營人員可據(jù)此有針對(duì)地推送更易轉(zhuǎn)化的增值內(nèi)容。
(3)產(chǎn)品定價(jià)
增值產(chǎn)品是IPTV業(yè)務(wù)盈利的重要工具,內(nèi)容如何定價(jià),定價(jià)多少,都得有可靠的數(shù)據(jù)支撐。實(shí)時(shí)系統(tǒng)可以統(tǒng)計(jì)各類定價(jià)產(chǎn)品的訂購情況,輔助業(yè)務(wù)運(yùn)營人員制定定價(jià)策略,同時(shí)可以實(shí)時(shí)驗(yàn)證定價(jià)變更后的訂購效果。
(4)內(nèi)容標(biāo)簽
內(nèi)容本身的編目信息,決定了內(nèi)容標(biāo)簽的先天屬性。而用戶是有標(biāo)簽屬性的,根據(jù)不同用戶不同時(shí)段的點(diǎn)擊,實(shí)時(shí)系統(tǒng)可以豐富內(nèi)容的標(biāo)簽屬性,內(nèi)容庫中數(shù)百萬計(jì)的內(nèi)容標(biāo)簽,是各類智能推薦的數(shù)據(jù)前提。
“智能推薦”“千人千面”,是近年來百談不厭的話題。電視機(jī)前手拿遙控器的到底是什么樣的用戶?他或她在不同時(shí)段下的收視偏好是什么?這些都是業(yè)務(wù)運(yùn)營人員迫切想要知道的。實(shí)時(shí)系統(tǒng)能夠根據(jù)用戶行為對(duì)用戶進(jìn)行畫像,并針對(duì)不同用戶不同時(shí)段進(jìn)行個(gè)性化推送。有時(shí),一廂情愿只會(huì)事倍功半,而投其所好卻能四兩撥千斤。這對(duì)實(shí)際運(yùn)營的指導(dǎo)作用,可參考以下幾個(gè)維度:
(1)用戶畫像
用戶的屬性從哪里來?用戶的每一次行為都會(huì)被實(shí)時(shí)系統(tǒng)記錄,并對(duì)用戶的頁面跳轉(zhuǎn)路徑、觀看內(nèi)容屬性、產(chǎn)品訂購行為等進(jìn)行分析,以生成用戶的屬性。生成的屬性有很多,可以是收視標(biāo)簽、行為標(biāo)簽、身份等級(jí)等。根據(jù)相關(guān)的智能推薦算法,可以在EPG各推薦位、詳情頁、播控頁面或者推薦專區(qū)等位置,針對(duì)各個(gè)用戶進(jìn)行個(gè)性化內(nèi)容的推送。
(2)時(shí)段精分
IPTV是一項(xiàng)以家庭為收看對(duì)象的電視服務(wù),而每個(gè)家庭收視群體又是由不同年齡性別的家庭成員構(gòu)成。那么同一機(jī)頂盒用戶在一天或一段時(shí)間里的表現(xiàn),也不盡相同。比如在工作日的白天,中老年人占比更多;晚上小孩放學(xué)、年輕人下班,對(duì)應(yīng)的占比會(huì)更多等。實(shí)時(shí)系統(tǒng)可以針對(duì)各個(gè)用戶各個(gè)時(shí)段里不同收視特征進(jìn)行建模分類,生成每個(gè)家庭用戶各自的分時(shí)段收視偏好標(biāo)簽庫,以生成個(gè)性化內(nèi)容推送給用戶。
IPTV因其基于IP網(wǎng)絡(luò)的特點(diǎn),天生具有雙向互動(dòng)的優(yōu)勢(shì),既能夠采集到所有用戶的行為數(shù)據(jù),也能夠?qū)崟r(shí)地向用戶進(jìn)行反饋推送。通過EPG探針定制采集全網(wǎng)用戶操作行為數(shù)據(jù),可實(shí)時(shí)展示用戶在線情況等數(shù)據(jù),并通過每日深入分析獲得詳細(xì)的運(yùn)行情況;在內(nèi)容、用戶、產(chǎn)品、頁面、時(shí)間等多維度給予運(yùn)營工作更多的支持;憑借統(tǒng)計(jì)實(shí)時(shí)業(yè)務(wù)數(shù)據(jù)和用戶流向來合理調(diào)配節(jié)目推薦,優(yōu)化頁面編排,增加節(jié)目收視等;配合運(yùn)營部門, 實(shí)現(xiàn)從業(yè)務(wù)到數(shù)據(jù),數(shù)據(jù)到指標(biāo),指標(biāo)到?jīng)Q策,再從決策來優(yōu)化業(yè)務(wù),實(shí)現(xiàn)用戶體驗(yàn)和業(yè)務(wù)盈利的提升。