滑云飛 北京天馬網(wǎng)視科技有限公司
荔枝云大數(shù)據(jù)應(yīng)用以及新業(yè)務(wù)展望
滑云飛 北京天馬網(wǎng)視科技有限公司
本文結(jié)合江蘇廣電總臺荔枝云項目,介紹了荔枝云大數(shù)據(jù)應(yīng)用及新業(yè)務(wù)的展望。
荔枝云 大數(shù)據(jù)應(yīng)用 新業(yè)務(wù)
“荔枝云”平臺是江蘇廣電總臺面對媒體融合發(fā)展態(tài)勢,以新技術(shù)、新應(yīng)用為引領(lǐng),全力打造的“云·組團·多終端”新型傳播體系的重要組成部分,力求借助新媒體提升傳統(tǒng)媒體收視率和影響力,整合傳統(tǒng)媒體資源助力新媒體,雙輪驅(qū)動,一體化發(fā)展。荔枝云新聞媒體大數(shù)據(jù)分析平臺建設(shè)項目榮獲了設(shè)備協(xié)會頒發(fā)的科技創(chuàng)新獎。
荔枝云是江蘇廣電總臺面對媒體融合建設(shè)的混合云的新型業(yè)務(wù)平臺,主要支撐江蘇廣電總臺全媒體新聞的生產(chǎn),是一個綜合型的平臺。在這個平臺上我們主要做了媒體大數(shù)據(jù)的分析,媒體大數(shù)據(jù)分析是整個平臺的核心。
新聞媒體大數(shù)據(jù)分析平臺作為“荔枝云”平臺的核心功能區(qū)域之一,承載著全臺資源的收集、整理、歸納、聚類、關(guān)聯(lián)等自動化處理分析工作,為全平臺提供數(shù)據(jù)的支撐。新聞媒體大數(shù)據(jù)分析平臺好比“荔枝云”的“大腦”,在動態(tài)匯集到海量的新聞線索與素材后,運用其大數(shù)據(jù)分析能力使得新聞線索更立體,新聞熱點更直觀,為新聞工作者提供了精準的數(shù)據(jù)信息呈現(xiàn)。
在這個媒體分析平臺上,日前已經(jīng)完成了日均可以完成五萬多的圖、文、音視頻的處理。整個大數(shù)據(jù)分兩方面,一方面是大數(shù)據(jù)的頂層技術(shù),技術(shù)是一個工具。針對傳統(tǒng)的媒體行業(yè),必須有相應(yīng)的大數(shù)據(jù)應(yīng)用模型,才能很好的利用它。
大數(shù)據(jù)應(yīng)用主要有三個關(guān)鍵點。第一個關(guān)鍵點是大數(shù)據(jù)的采集,采集這一塊主要包括互聯(lián)網(wǎng)數(shù)據(jù)的采集、社交媒體數(shù)據(jù)的采集、臺內(nèi)資源的采集,以及建成的媒資系統(tǒng)、采編播系統(tǒng),都要進行采集。大數(shù)據(jù)采集是整個后續(xù)業(yè)務(wù)的基礎(chǔ),大數(shù)據(jù)分析必須具備多種格式、多種來源的數(shù)據(jù)采集工作。
第二個關(guān)鍵點是要對各個來源的數(shù)據(jù)進行分析,通過熱點發(fā)現(xiàn)、數(shù)據(jù)關(guān)聯(lián)最后達到用戶想要的結(jié)果。
第三個關(guān)鍵點是大數(shù)據(jù)搜索。這三個關(guān)鍵點組成了大數(shù)據(jù)應(yīng)用的技術(shù)。
互聯(lián)網(wǎng)及社交媒體資源在新聞網(wǎng)站、視頻網(wǎng)站和微信微博及論壇都可以進行數(shù)據(jù)采集,包括網(wǎng)頁評論、閱讀量,這些數(shù)據(jù)都可以進行采集。
計算機能夠理解的是文字信息,對圖片或者視頻內(nèi)容,計算機是無法理解的。必須把這種視頻或者是圖片非結(jié)構(gòu)化的數(shù)據(jù)轉(zhuǎn)變成結(jié)構(gòu)化的數(shù)據(jù),通過大數(shù)據(jù)自然語言分析能力進行最終應(yīng)用的呈現(xiàn)。
應(yīng)用數(shù)據(jù)分析的基礎(chǔ)模型,主要包括了去重、熱點發(fā)現(xiàn)、情感分析、自動據(jù)類和信息關(guān)聯(lián)。
圖1 媒體大數(shù)據(jù)應(yīng)用技術(shù)
(1)大數(shù)據(jù)分析--熱點資訊
荔枝云主要是為節(jié)目生產(chǎn)提供數(shù)據(jù)支撐的,會實時從互聯(lián)網(wǎng)上獲取所有相關(guān)的新聞資源,這些資源進入到我們的系統(tǒng)之后,首先要對它的數(shù)據(jù)進行選取,發(fā)現(xiàn)熱點新聞并為節(jié)目生產(chǎn)提供線索的支撐,把每天的熱點實時發(fā)布出去。
(2)大數(shù)據(jù)分析--智能專題
圖2 基于自然語言的數(shù)據(jù)分析能力
圖3 大數(shù)據(jù)分析--熱點資訊
圖4 大數(shù)據(jù)分析--智能專題
圖5 大數(shù)據(jù)分析—事件脈絡(luò)
因為一個事件是一個持續(xù)性的事件,根據(jù)這些熱點會形成智能的專題。前兩天鹽城的災(zāi)害,也在第一時間由系統(tǒng)自動把網(wǎng)絡(luò)上關(guān)于鹽城災(zāi)害所有的有關(guān)報道,形成了一個智能的專題提供給節(jié)目的編輯,還可為新聞工作者提供相關(guān)數(shù)據(jù),這就是智能專題。
智能專題里分了幾個模塊,比如說地區(qū)的熱點、主流媒體關(guān)于專題的報道、專題報道里的焦點人物,還有兩微一端的話題熱議,都會進行分模塊的呈現(xiàn)。可根據(jù)整個事件在網(wǎng)絡(luò)上的發(fā)酵時間,形成一個事件的脈絡(luò)。即這個事件從什么時間開始發(fā)生,在中間經(jīng)歷了什么樣的過程,到最后什么時間事件結(jié)束,會清晰地形成一個事件的整體脈絡(luò),讓節(jié)目的制作人員在做專題報道的時候,能夠更加深入地去了解這個事件背后的故事。
(3)大數(shù)據(jù)分析--情感分析
大數(shù)據(jù)分析有一個情感分析的功能,可以通過語義的分析,了解到這篇報道的文章是正面的還是負面的,或者是中性的。針對用戶的評論數(shù)據(jù)的話語可以分析出用戶評論對這一篇報道是什么樣的態(tài)度。
圖6 大數(shù)據(jù)分析--情感分析
以上是一些比較基礎(chǔ)的數(shù)據(jù)分析模型,后續(xù)要借助大數(shù)據(jù)分析做更多的事情。
(1)用戶行為分析
用戶行為分析將是后續(xù)在荔枝云平臺上面重點去做的事情。首先要對用戶行為的數(shù)據(jù)進行采集,主要是從三方面對數(shù)據(jù)進行采集。一是要細化平臺內(nèi)用戶行為記錄,定制記錄規(guī)范標準,包括:登錄、瀏覽、查閱、關(guān)注、收藏、下載,對這些數(shù)據(jù)進行日后統(tǒng)計。二是對接第三方用戶行為記錄,包括:APP,網(wǎng)站上的一些注冊用戶,公眾號、微信、微博互動數(shù)據(jù)接入。三是要對接商業(yè)數(shù)據(jù)用戶畫像,進行ID匹配。例如,阿里的用戶畫像,百度的用戶畫像,這個是針對用戶分析日后要做的三方面的工作。
臺內(nèi)的用戶分類主要有三類,第一類是平臺自有用戶。收集自有用戶的數(shù)據(jù),更好的為臺內(nèi)的工作人員提供數(shù)據(jù)服務(wù),改善用戶的體驗,讓他能夠制作出更好的節(jié)目。
圖7 臺內(nèi)用戶分類
第二類是平臺內(nèi)第三方用戶。主要包括微信、微博粉絲等第三方注冊用戶,我們會分析粉絲的行為及興趣點,有針對性的推薦一些他興趣關(guān)注的數(shù)據(jù)。
第三類是平臺外用戶。需要通過互聯(lián)網(wǎng)、搜索引擎甚至是其他的電商,導(dǎo)入一些商業(yè)的用戶數(shù)據(jù),對日后電視臺的生產(chǎn)經(jīng)營進行鋪墊。
最終要形成全臺用戶行為數(shù)據(jù)庫,主要是做一些廣告投放、增值內(nèi)容服務(wù)的推送,包括品牌的經(jīng)營及推廣。
(2)應(yīng)用大數(shù)據(jù)的分析能力
要有針對性的對電視臺內(nèi)的自有欄目建立影響力的模型,要有針對性的對欄目的數(shù)據(jù)進行特定的采集,包括互聯(lián)網(wǎng)上傳播的一些數(shù)據(jù)、微信、微博、APP,還有第三方搜索引擎的數(shù)據(jù)。每一檔欄目的受眾和播出形式是不一樣的,所以在前期會考慮對全國受眾影響力比較大的金牌欄目。對此,我們需要采集一些數(shù)據(jù),最后就是我們分析出所有數(shù)據(jù)的呈現(xiàn)及結(jié)果的展示,包括每天的報道量,它各個平臺的播放量在、傳播量,在各個媒體行業(yè)、報紙、門戶網(wǎng)站、網(wǎng)絡(luò)視頻及電視上的傳播趨勢。最后通過數(shù)據(jù)的分析可以了解到這個欄目播出以后,收視的用戶最關(guān)注的是哪些明星或者是哪些嘉賓,可以展示出與他關(guān)聯(lián)的一些詞語。
圖8 實時監(jiān)測植入式廣告大數(shù)據(jù)
圖9 提升全媒體互動體驗 增強現(xiàn)實
(3)要做植入式廣告的大數(shù)據(jù)
現(xiàn)在廣告基本上都是按照一檔欄目來進行投放的,實際上廣告商在投放這個欄目以后,并不清楚廣告在整個欄目當中播放了幾次,通過視頻的處理技術(shù),我們可以了解到廣告投放以后,在整個欄目里面出現(xiàn)了多少次,出現(xiàn)了多長時間,可以保證廣告監(jiān)播的查全率。結(jié)合周邊的數(shù)據(jù),廣告的價值和廣告的效應(yīng)會得到相應(yīng)的提升。
(4)要做增強現(xiàn)實技術(shù)
針對特定圖象建立識別的云服務(wù),利用云端服務(wù)的方式使用終端。我們的APP通過掃描一張圖片,可以識別出相應(yīng)的視頻,或是其他有價值的一些商品。這一塊涉及到整個業(yè)務(wù)流程就是圖象的樣本采集,然后建立映射關(guān)系的。以后的在線購買,可以進行一些APP用戶的互動,并獲取用戶的體驗,增強終端用戶的粘性。它應(yīng)用的效果就是掃一掃看視頻、聽音樂,或者是參與互動、在線購買的方式。
通過建設(shè)媒體行業(yè)大數(shù)據(jù)的分析系統(tǒng),后續(xù)可以做很多的應(yīng)用,包括對接智慧城市的一些數(shù)據(jù),像智慧旅游、智慧交通、智慧醫(yī)療。電視臺是政府的宣傳窗口,現(xiàn)在視頻內(nèi)容越來越重要,很多本地的一些針對的視頻資料,包括傳統(tǒng)的地域文化內(nèi)容,只有在電視臺才會播放。通過智慧旅游,可以隨時隨地到一個旅游景點,可以找到旅游景點歷史宣傳片和歷史資料視頻,可以很直觀的了解當?shù)氐奈幕?/p>
最后我們要通過媒體大數(shù)據(jù)的分析平臺,來實現(xiàn)電視臺經(jīng)濟效益的變現(xiàn),最終把這些數(shù)據(jù)轉(zhuǎn)換成經(jīng)濟價值,讓它產(chǎn)生一個長期的社會效益和經(jīng)濟效益,對廣電的內(nèi)容實現(xiàn)價值內(nèi)容的變現(xiàn)。