摘要:本文探討市級媒體數(shù)據(jù)中臺的項(xiàng)目背景、方法論、建設(shè)流程、應(yīng)用實(shí)踐、創(chuàng)新性及落地成效,并分析數(shù)據(jù)中臺在媒體行業(yè)數(shù)智化轉(zhuǎn)型中的重要作用。通過數(shù)據(jù)資產(chǎn)管理、智能分析、發(fā)布展示和共享服務(wù),數(shù)據(jù)中臺對推動媒體數(shù)智化轉(zhuǎn)型具有積極作用。
關(guān)鍵詞:數(shù)據(jù)中臺 數(shù)據(jù)倉庫 標(biāo)簽 內(nèi)容推薦 精準(zhǔn)運(yùn)營
在數(shù)字化轉(zhuǎn)型的大潮中,市級媒體作為地方信息傳播的重要載體,面臨內(nèi)容生產(chǎn)、精準(zhǔn)分發(fā)及用戶運(yùn)營等多方面挑戰(zhàn)。隨著大數(shù)據(jù)、云計(jì)算等技術(shù)的快速發(fā)展,建設(shè)市級媒體數(shù)據(jù)中臺已成為提升媒體融合發(fā)展的關(guān)鍵舉措。本文探討如何通過數(shù)據(jù)中臺的建設(shè),實(shí)現(xiàn)市級媒體資源的有效整合與高效利用,從而提升媒體服務(wù)的智能化、精準(zhǔn)化水平。
一、建設(shè)背景
2020年4月15日,湖州市新聞傳媒中心推出官方移動新媒體客戶端“南太湖號”。在過去三年中,客戶端迅速發(fā)展,排名穩(wěn)居全省前二。
然而,隨著平臺用戶數(shù)量的持續(xù)攀升,我們面臨一系列新的挑戰(zhàn)和問題。首先,我需要準(zhǔn)確了解用戶需求,更加精準(zhǔn)地觸達(dá)和運(yùn)營用戶;其次,每天產(chǎn)生的大量數(shù)據(jù)——包括內(nèi)容數(shù)據(jù)、用戶數(shù)據(jù)和服務(wù)數(shù)據(jù)——需要被有效地開發(fā)和利用;再次,隨著平臺功能的不斷豐富和日活的穩(wěn)步提升,我們急切需要找到流量變現(xiàn)的有效途徑;最后是如何解決信息過剩問題,及時洞察社會熱點(diǎn),為采編人員賦能。
二、建設(shè)方案
數(shù)據(jù)中臺旨在通過技術(shù)賦能與模式創(chuàng)新,全面提升媒體綜合競爭力,確保其在媒體融合發(fā)展的浪潮中保持領(lǐng)先地位,實(shí)現(xiàn)用戶價值、數(shù)據(jù)價值、商業(yè)價值與社會價值的和諧共生。
市級媒體數(shù)據(jù)中臺的建設(shè)主要分為數(shù)據(jù)資產(chǎn)化、智能化、場景化和服務(wù)化四個階段。各階段任務(wù)如下:
數(shù)據(jù)資產(chǎn)化,即通過數(shù)據(jù)采集、處理、存儲和治理,形成統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)和數(shù)據(jù)資源管理體系,將數(shù)據(jù)轉(zhuǎn)化為資產(chǎn)。數(shù)據(jù)智能化,即利用AI智能技術(shù)和人工相結(jié)合的方式,開展文字、圖片、音視頻的數(shù)據(jù)標(biāo)引工作,實(shí)現(xiàn)內(nèi)容資源的數(shù)據(jù)化,并挖掘數(shù)據(jù)之間的關(guān)聯(lián),提升數(shù)據(jù)的潛在價值。數(shù)據(jù)場景化,即根據(jù)媒體機(jī)構(gòu)的具體業(yè)務(wù)需求,將數(shù)據(jù)應(yīng)用于新聞生產(chǎn)、運(yùn)營、發(fā)布等多個場景,形成可持續(xù)的媒體數(shù)據(jù)與服務(wù)支撐平臺。數(shù)據(jù)服務(wù)化,即提供統(tǒng)一的數(shù)據(jù)服務(wù)功能,包括數(shù)據(jù)查詢、數(shù)據(jù)分析、數(shù)據(jù)可視化等,為前臺應(yīng)用提供能力支撐。
項(xiàng)目前期,經(jīng)過多輪細(xì)致比較和分析,最終確定一套基于阿里云“Dataworks+MaxCompute”的總體技術(shù)架構(gòu)方案。這一方案利用阿里云在大數(shù)據(jù)處理和云計(jì)算領(lǐng)域的實(shí)踐積累,通過Dataworks提供的強(qiáng)大數(shù)據(jù)開發(fā)、數(shù)據(jù)集成和數(shù)據(jù)資產(chǎn)管理能力,以及MaxCompute提供的海量數(shù)據(jù)存儲和高速計(jì)算能力,湖州市新聞傳媒中心得以構(gòu)建一個高效、穩(wěn)定、可擴(kuò)展的數(shù)據(jù)中臺。
數(shù)據(jù)資源整合及數(shù)倉建設(shè)分為三個階段。
1.建設(shè)用戶數(shù)據(jù)倉庫,形成用戶畫像子庫。我們將媒體用戶數(shù)據(jù)高效整合至數(shù)據(jù)中臺,借助“南太湖號”App用戶ID作為唯一標(biāo)識“OneID”,有效串聯(lián)用戶的全部基礎(chǔ)數(shù)據(jù)和行為數(shù)據(jù),打造一個精確、全面、統(tǒng)一且有效的用戶數(shù)據(jù)體系。在此基礎(chǔ)上,我們進(jìn)一步對用戶數(shù)據(jù)深度清洗、建模與智能化打標(biāo),精心構(gòu)建一套包含3個層級、10個維度的全方位用戶標(biāo)簽體系。這一體系涵蓋用戶的人口屬性、平臺偏好、地理位置、閱讀習(xí)慣、消費(fèi)行為、服務(wù)需求等多個方面,為用戶畫像的繪制提供有力支持。截至目前,我們已成功為230萬注冊用戶完成打標(biāo)工作,每位用戶平均擁有203個標(biāo)簽,為后續(xù)的數(shù)據(jù)分析和精準(zhǔn)營銷奠定堅(jiān)實(shí)基礎(chǔ)。
2.建設(shè)內(nèi)容數(shù)據(jù)倉庫,形成新聞分析子庫。我們將大數(shù)據(jù)與大模型深度結(jié)合,運(yùn)用文章分類、關(guān)鍵詞提取、情感傾向分析、圖片識別及視頻分析等AI能力,對內(nèi)部生產(chǎn)及全網(wǎng)采集的內(nèi)容數(shù)據(jù)精準(zhǔn)打標(biāo)。我們制定一套全面的內(nèi)容標(biāo)簽體系,涵蓋內(nèi)容分類、關(guān)鍵信息,如人、事、地、物、組織、傳播熱度及正負(fù)面評價等多個維度。截至目前,我們已成功采集并整合500余個媒體賬號的數(shù)據(jù),匯聚本地各類新聞內(nèi)容高達(dá)1000萬條,每條內(nèi)容平均被打上20個標(biāo)簽,為新聞內(nèi)容的深度分析和精準(zhǔn)推送提供強(qiáng)有力的數(shù)據(jù)支撐。
3.建設(shè)專題庫,形成數(shù)據(jù)分析子庫。鑒于“南太湖號”客戶端應(yīng)用廣泛且功能多樣的特點(diǎn),我們在數(shù)據(jù)中臺構(gòu)建多個專題庫,覆蓋本地政策、消費(fèi)行為、綠色生活等若干細(xì)分領(lǐng)域,提供更加專業(yè)化、精準(zhǔn)化、靈活化的數(shù)據(jù)支持。這些專題庫不僅深化數(shù)據(jù)新聞報道的內(nèi)涵,還為智庫研究提供有力支撐,同時推動多個應(yīng)用場景的建設(shè),促進(jìn)數(shù)據(jù)的高效共享與利用。目前,我們已成功發(fā)布一系列具有影響力的報告,如《春節(jié)消費(fèi)報告》《招聘市場洞察》《電動車騎行安全調(diào)研報道》等。另外,我們推動多個應(yīng)用場景的建設(shè),如“共享停車”“食安有道”“工會服務(wù)”等。這些成果不僅展現(xiàn)數(shù)據(jù)價值,也為政府決策、企業(yè)運(yùn)營和社會治理提供有益參考。
三、應(yīng)用領(lǐng)域
經(jīng)過兩年多的媒體中臺實(shí)踐,我們成功將數(shù)據(jù)接口、數(shù)據(jù)報告和數(shù)據(jù)模型等不同形式的數(shù)據(jù)產(chǎn)品從中臺層逐漸透出到應(yīng)用層,為內(nèi)外部發(fā)展賦能,成效明顯。主要運(yùn)用場景如下:
1.賦能內(nèi)容——智媒云采編系統(tǒng)
(1)內(nèi)容生產(chǎn)。數(shù)據(jù)中臺內(nèi)容倉庫與中心全媒體采編系統(tǒng)深度融合。通過全網(wǎng)數(shù)據(jù)采集,匯聚本地各類新聞內(nèi)容,并通過中臺打標(biāo)形成政策、民生、文化、科技、旅游、生活等26個熱點(diǎn)專題。借助趨勢分析和熱點(diǎn)預(yù)判,更加精準(zhǔn)地指導(dǎo)采編工作。同時,中臺與本地氣象預(yù)警、120急救、119火警等系統(tǒng)實(shí)時連通,確保信息在最早時間發(fā)布,快速響應(yīng)現(xiàn)場需求,提升媒體“及時響應(yīng)”能力。
(2)精準(zhǔn)分發(fā)?;谟脩魳?biāo)簽和內(nèi)容標(biāo)簽,我們自主研發(fā)黨媒推薦算法。根據(jù)用戶地理位置、所在部門、系列報道和興趣愛好等維度,實(shí)現(xiàn)內(nèi)容側(cè)的精準(zhǔn)分發(fā)。該推薦算法于2023年3月在“南太湖號”客戶端首頁上線,實(shí)現(xiàn)內(nèi)容分發(fā)“千人千面”,滿足受眾個性化信息需求,提高新聞內(nèi)容曝光轉(zhuǎn)化,提升用戶體驗(yàn)。
(3)內(nèi)容評價。我們將稿件閱讀數(shù)據(jù)、互動數(shù)據(jù)和全網(wǎng)轉(zhuǎn)載數(shù)據(jù)接入數(shù)據(jù)中臺,并以中臺MaxCompute云計(jì)算能力為支撐,定制開發(fā)傳播力計(jì)算模型,通過該模型對稿件的傳播效果量化評價,實(shí)現(xiàn)對稿件傳播效果的動態(tài)監(jiān)測。目前傳播力指數(shù)已在傳播分析、稿費(fèi)計(jì)算、考核排名等方面深入運(yùn)用。
2.賦能運(yùn)營——數(shù)據(jù)決策指揮系統(tǒng)
通過自主可控的數(shù)據(jù)采集分析工具,全面采集“南太湖號”端內(nèi)外數(shù)據(jù),包括App、H5、Web等,并通過數(shù)據(jù)中臺清洗、處理和計(jì)算,從而形成面向業(yè)務(wù)人員和管理人員可看、可分析、分決策的數(shù)據(jù)指標(biāo)系統(tǒng)。隨著中心指標(biāo)體系的建立和運(yùn)用,逐步建立目標(biāo)設(shè)定、指標(biāo)拆解、過程監(jiān)控、效果復(fù)盤、分析建議的數(shù)據(jù)運(yùn)營閉環(huán)機(jī)制。中心運(yùn)營人員理念逐步向數(shù)據(jù)化靠攏。內(nèi)容運(yùn)營、用戶運(yùn)營、商戶運(yùn)營、活動運(yùn)營等方面,由原來的粗放式向 精細(xì)化轉(zhuǎn)變。
3.賦能經(jīng)營——“湖廣通”智慧廣告系統(tǒng)
“湖廣通”智慧廣告系統(tǒng)的誕生,是對數(shù)據(jù)中臺用戶標(biāo)簽體系的深度運(yùn)用。通過該系統(tǒng),廣告主在投放廣告時可根據(jù)廣告內(nèi)容圈選特定的目標(biāo)人群,包括用戶的常住地、性別、年齡、職業(yè)、消費(fèi)偏好等標(biāo)簽,使得廣告精準(zhǔn)地向目標(biāo)用戶投放,最終實(shí)現(xiàn)按點(diǎn)擊付費(fèi)、按效果付費(fèi)。這一轉(zhuǎn)變促進(jìn)媒體廣告營收模式從傳統(tǒng)的廣告位獨(dú)占向個性化、精準(zhǔn)化和效果導(dǎo)向轉(zhuǎn)變,不僅為廣告主帶來更好的體驗(yàn)和更大的價值回報,也為中心提升廣告經(jīng)營收益。
4.賦能社會治理——“綠色生活碼”應(yīng)用
憑借數(shù)據(jù)中臺綠色低碳專題庫的數(shù)據(jù)基礎(chǔ)優(yōu)勢,湖州市傳媒中心成為全市綠色數(shù)字生活領(lǐng)域公共數(shù)據(jù)授權(quán)運(yùn)營單位,通過融合媒體用戶數(shù)據(jù)、社會數(shù)據(jù)和政府公共數(shù)據(jù),建設(shè)“綠色生活碼”應(yīng)用,解決全市市民用戶碳減排成果量化難、低碳生活踐行情況評價困難等問題,形成了全面、多維、豐富的市民個人碳畫像。該應(yīng)用是媒體利用數(shù)據(jù)賦能、深化數(shù)據(jù)運(yùn)用、參與社會治理的有益探索。
如今,數(shù)據(jù)資產(chǎn)的重要性日益凸顯。媒體數(shù)據(jù)作為一類重要的數(shù)據(jù)資產(chǎn),具有較高的價值和潛力。媒體單位通過深入挖掘和分析自身數(shù)據(jù)資產(chǎn),通過數(shù)據(jù)交易、合作共享等方式與其他行業(yè)數(shù)據(jù)互通和資源整合,從而提高采編改革和傳播效力,獲得社會效益與經(jīng)濟(jì)效益雙豐收。
(作者馬翔系湖州市新聞傳媒中心科技研發(fā)部副主任;作者姚滿琳系湖州市新聞傳媒中心數(shù)據(jù)運(yùn)營部主管;作者邱利中系湖州市新聞傳媒中心科技研發(fā)部導(dǎo)師;作者施穎涌系湖州市新聞傳媒中心數(shù)據(jù)運(yùn)營部數(shù)據(jù)開發(fā)工程師)
責(zé)任編輯:苗權(quán)譽(yù)