清華大學(xué)新聞與傳播學(xué)院教授、副院長陳昌鳳在2013年第1期《新聞與寫作》刊文,介紹了“大數(shù)據(jù)”對于媒體的價(jià)值。“大數(shù)據(jù)”是指無法在一定時(shí)間內(nèi)用常規(guī)軟件工具對其內(nèi)容進(jìn)行抓取、管理和處理的數(shù)據(jù)集合,其主要特點(diǎn)是海量、非結(jié)構(gòu)化和半結(jié)構(gòu)化、實(shí)時(shí)處理,業(yè)界將其歸納為4個(gè)“V”:Volume(數(shù)據(jù)量大),Variety(數(shù)據(jù)類型多樣),Velocity(處理速度快),Value(價(jià)值密度低)。
新聞界是數(shù)據(jù)的重要應(yīng)用者,在互聯(lián)網(wǎng)時(shí)代媒體經(jīng)營、新聞實(shí)務(wù)等幾乎一切都離不開“大數(shù)據(jù)”、數(shù)據(jù)挖掘。西方媒體出現(xiàn)了不少專門與數(shù)據(jù)打交道的記者,通過數(shù)據(jù)挖掘的方式進(jìn)行新聞報(bào)道,在繁雜瑣碎的非結(jié)構(gòu)化數(shù)據(jù)之中,發(fā)現(xiàn)常規(guī)新聞中不能體現(xiàn)的邏輯,幫助讀者對新聞事件進(jìn)行深度解讀。參考他們的經(jīng)驗(yàn),可以發(fā)現(xiàn):正在或剛發(fā)生的、讀者關(guān)注的重大新聞事件,通過用數(shù)據(jù)挖掘得出的不同視角,可以豐富讀者對事件的認(rèn)知。數(shù)據(jù)挖掘也用于日常報(bào)道,從而對現(xiàn)實(shí)世界做出更深入的解釋。如彭博社以2004年底聯(lián)想和IBM簽合同為起點(diǎn),對比了世界五大個(gè)人電腦生產(chǎn)商的股價(jià)變化,發(fā)現(xiàn)聯(lián)想和IBM股價(jià)8年中上漲均超過100%,其它則有不同程度下降。數(shù)字很說明問題,也是對質(zhì)疑者的有力回?fù)簟6龑I(yè)金融數(shù)據(jù)機(jī)構(gòu)外,媒體有很多途徑可獲得相關(guān)數(shù)據(jù)。如網(wǎng)絡(luò)公開的股票市場數(shù)據(jù)等。此外,讀者的“大數(shù)據(jù)”也蘊(yùn)藏著尚未挖掘的巨大價(jià)值,數(shù)字發(fā)行的價(jià)值被嚴(yán)重低估,讀者的個(gè)人資料和其瀏覽的內(nèi)容,以及它們與互聯(lián)網(wǎng)“噪音”之間有怎么樣的對比?這些是尚未被挖掘的最大價(jià)值來源。