文|曾凡斌
(作者為暨南大學新聞與傳播學院講師,中國人民大學新聞學院博士研究生,本研究是2012年廣州市哲學社會科學發(fā)展“十二五”規(guī)劃課題一般項目“互聯(lián)網(wǎng)使用時間、使用方式對現(xiàn)實政治參與的影響——基于對廣州市網(wǎng)民的實證分析”,項目號為2012YB31)
隨著博客,微博,社會網(wǎng)絡網(wǎng)站,云計算、物聯(lián)網(wǎng)等技術的興起,數(shù)據(jù)正以前所未有的速度不斷增長,于是出現(xiàn)了“大數(shù)據(jù)”時代?!按髷?shù)據(jù)”不僅是科研的熱門課題,也是產(chǎn)業(yè)界的熱門,更受到其他各界的密切關注。2008年9月自然雜志發(fā)表一組文章“Big data:The future of biocuration”,“Big data: Wikiomics”, “Big data: Distilling meaning from data”來探討大數(shù)據(jù)的出現(xiàn)。科學雜志在2011年2月推出???,主要圍繞著科學研究中大數(shù)據(jù)的問題展開討論。2012年3月,美國奧巴馬政府發(fā)布了“大數(shù)據(jù)發(fā)展計劃”,計劃在科學研究、環(huán)境、生物醫(yī)學等領域利用大數(shù)據(jù)技術進行突破?!按髷?shù)據(jù)”(Big Data),指信息或數(shù)據(jù)量的巨大,數(shù)據(jù)的單位,已經(jīng)從G和T發(fā)展到P、E、Z等為計量單位,其中1TB=1024GB,而1ZB卻等于10億TB。如此龐大的數(shù)據(jù)將對傳統(tǒng)媒介經(jīng)營管理方式產(chǎn)生什么影響?傳媒又應如何應對它呢?
傳統(tǒng)的媒介經(jīng)營管理方式或者是建立在經(jīng)驗的基礎上,或者是建立在傳統(tǒng)數(shù)據(jù)基礎上,如抽樣獲得,通過財務軟件獲得,這樣的數(shù)據(jù)往往是結構化的數(shù)據(jù),或者是有關聯(lián)的數(shù)據(jù),是管理員按照事先設定的程序獲得的。如調(diào)查讀者,聽眾,網(wǎng)民可通過嚴格的隨機抽樣獲得,并且通過樣本來推斷總體,而對于傳媒內(nèi)容的財務數(shù)據(jù)則可通過財務軟件了解進,銷,存,工資,成本,收入,利潤等多種經(jīng)營數(shù)據(jù),以滿足對數(shù)據(jù)的分析和決策。
然而,“大數(shù)據(jù)”通常為非結構化數(shù)據(jù),并包含彼此可能無關聯(lián)的數(shù)據(jù)集,例如來自各種獨立數(shù)據(jù)流(如Twitter、社交網(wǎng)站、傳統(tǒng)CRM、調(diào)查結果、人口數(shù)據(jù)、缺陷數(shù)據(jù)等)的數(shù)據(jù),這不同于通常彼此相關的傳統(tǒng)數(shù)據(jù)集。于是,“大數(shù)據(jù)”分析通常會突破傳統(tǒng)數(shù)據(jù)庫以及分析流程和系統(tǒng)的界限。首先,數(shù)據(jù)集規(guī)??赡苓^大;其次,數(shù)據(jù)集彼此無關聯(lián);最后,“大數(shù)據(jù)”需要極為快速地分析。分析這些“大數(shù)據(jù)”,傳統(tǒng)的方法和人才就不能適應新的需求了。分析大數(shù)據(jù),就要依賴新興技術(如Hadoop Map Reduce)、R統(tǒng)計語言,以及并行多處理、高速聯(lián)網(wǎng)、快速I/O存儲(包括基于閃存的新興存儲)等全新的高性能基礎架構解決方案。此外,大數(shù)據(jù)分析還需要新型技術工作者:數(shù)據(jù)科學家,甚至是數(shù)據(jù)藝術家。為此,傳媒就要采用新的技術方法和使用新的人才才能適應“大數(shù)據(jù)”的要求。
對“大數(shù)據(jù)”的分析使傳媒經(jīng)營管理者實時的了解環(huán)境內(nèi)外的最新最全的信息,并從中得出大量深刻見解,改善經(jīng)營管理的水平和方法。例如,F(xiàn)armville的制作公司Zynga每天生成超過15 TB的新數(shù)據(jù),并通過對玩家行為的持續(xù)數(shù)據(jù)分析結果,測試、調(diào)整和優(yōu)化游戲中的特性,其實現(xiàn)了鼓勵玩家行動起來,以促進玩家針對游戲的種種元素支付真正的錢,并保持玩家對游戲的興趣。于是,雖然在線游戲Farmville是一款非常簡單的游戲,但是由于其背后有著對大數(shù)據(jù)分析的支持,其也能不斷的飛速發(fā)展。當傳媒管理者對數(shù)據(jù)有較為完善分析能力時,其對事件的把握及預測能力就會增強,通過對大數(shù)據(jù)分析、預測會使得決策更為精準。
經(jīng)營管理就是決策,決策需要信息。決策過程實際上就是一個信息輸入、信息輸出及信息反饋的循環(huán)過程。應對大數(shù)據(jù)的挑戰(zhàn),媒介經(jīng)營管理需要在新聞生產(chǎn)、受眾調(diào)查、效果研究等方面進行創(chuàng)新。
媒介經(jīng)營管理首先離不開新聞生產(chǎn),傳統(tǒng)的新聞生產(chǎn)無奈于依靠作者的采訪和編輯的加工,評論等,但現(xiàn)在新聞生產(chǎn)的創(chuàng)新也可利用大數(shù)據(jù)了,大數(shù)據(jù)時代數(shù)據(jù)成為新聞的核心資源之一,數(shù)據(jù)不僅可以作為新聞報道的內(nèi)容,數(shù)據(jù)對于某個事件發(fā)生的原因、狀況的揭示會比記者的觀察與調(diào)查更準確,更有說服力。例如,英國《衛(wèi)報》解讀2011年騷亂的事件,除了采用常規(guī)的社會科學研究方法,如采訪調(diào)查外,還請了曼徹斯特大學的專業(yè)人士對250多萬條的與騷亂有關的Twitter信息進行大數(shù)據(jù)的分析,在此基礎上做成了《暴徒的告白》,這個信息量是非常大的,包括抓取微博的信息,網(wǎng)絡上的信息,如果沒有大數(shù)據(jù)的分析方法,是不可能實現(xiàn)的。通過大數(shù)據(jù)生產(chǎn)的新聞往往給用戶提供耳目一新的新聞感官和認識世界的圖景。
其次,媒介經(jīng)營管理離不開受眾的調(diào)查,受眾調(diào)查的創(chuàng)新也可利用大數(shù)據(jù),與傳統(tǒng)的抽樣調(diào)查相比,媒體可以利用大數(shù)據(jù)更為精確辨識到受眾群構成及其特定階段的具體需求,可以據(jù)此階段性地調(diào)整新聞生產(chǎn)中各類信息的權重,針對性地提供新聞信息服務、增加客戶粘度。例如,愛點擊iClick自主研發(fā)的XMO受眾解決方案(XMOAudienceSolution)可以接觸到最細分的受眾。愛點擊iClick與上百營銷者合作推出上千個在線營銷活動,并在過程中累積了上億的受眾數(shù)據(jù),結合第三方數(shù)據(jù),強強聯(lián)合推出22種精選細分受眾群體。這些受眾群體按行業(yè)(例如:旅游、銀行、金融以及教育)、生活方式和興趣(例如:性價比追求者、商務人士、吃貨等等)劃分,以切合廣告主不同的需要。《美國新聞業(yè)2011年度報告》報告認為,在媒體市場已成為買方市場之后,用戶決定著哪些內(nèi)容以哪些方式呈現(xiàn)。媒體業(yè)的未來屬于那些“既懂得公眾不斷變化的行為,也能準確投放內(nèi)容,并將廣告按每個用戶偏好投放的人”。因此,利用大數(shù)據(jù)來進行受眾調(diào)查的創(chuàng)新有利于促進媒介經(jīng)營管理的精確化。
最后,效果研究的創(chuàng)新可利用大數(shù)據(jù),效果研究是傳播學研究的重點,也是媒介經(jīng)營管理關注的重點。受眾接觸了媒介尤其是廣告信息時候,其認知、情感、態(tài)度、行為如何發(fā)生變化,傳統(tǒng)的問卷調(diào)查采用受眾的自我報告難以獲得精確的信息,控制實驗往往又是在小群體中進行,難以真正的推進到總體。而大數(shù)據(jù)下的數(shù)以億計的高速度、低成本的運算器,計算機,傳感器,網(wǎng)絡平臺使得獲得準確的受眾效果數(shù)據(jù)成為可能。這方面一個重要的例子是美國的Facebook,由于數(shù)以萬計的Facebook用戶的個人信息,個人習慣都在網(wǎng)站中出現(xiàn),所以Facebook可以通過大數(shù)據(jù)分析后再將其賣給企業(yè),企業(yè)再根據(jù)每個人的特點投放最個性化的廣告,于是,當網(wǎng)民使用Facebook時,他(或她)只會看到自己最想看的廣告,從而實現(xiàn)傳播效果的最優(yōu)化。
總之,只有通過媒介經(jīng)營管理這幾個方面的創(chuàng)新,才能真正使得媒介的經(jīng)營管理方式由經(jīng)驗型向科學型管理轉變。而基于大數(shù)據(jù)的科學型管理必然是精確、全面、立體而富有預測性的。
在“大數(shù)據(jù)”的環(huán)境下,媒介經(jīng)營管理怎樣才能實現(xiàn)由經(jīng)驗型向科學型管理?這就需要進行數(shù)據(jù)挖掘,從“大數(shù)據(jù)”中尋找規(guī)律,才能為科學型的媒介經(jīng)營管理奠定基礎。數(shù)據(jù)挖掘出現(xiàn)于20世紀80年代后期,90年代有了突飛猛進的發(fā)展。美國麻省理工學院在2001年1月份的《科技評論》(Technology Review)提出將在未來5年對人類產(chǎn)生重大影響的10大新興技術,其中第3項就是數(shù)據(jù)挖掘。
數(shù)據(jù)挖掘(Data Mining)是通過分析每個數(shù)據(jù),從大量數(shù)據(jù)中尋找其規(guī)律的技術,主要有數(shù)據(jù)準備、規(guī)律尋找和規(guī)律表示3個步驟。數(shù)據(jù)挖掘的任務有關聯(lián)分析、聚類分析、分類分析、異常分析、特異群組分析和演變分析等。數(shù)據(jù)挖掘是一種決策支持過程,它主要基于人工智能、機器學習、模式識別、統(tǒng)計學、數(shù)據(jù)庫、可視化技術等,高度自動化地分析企業(yè)的數(shù)據(jù),做出歸納性的推理,從中挖掘出潛在的模式,幫助決策者調(diào)整市場策略,減少風險,做出正確的決策。
數(shù)據(jù)挖掘已經(jīng)在企業(yè)的經(jīng)營管理中發(fā)揮了很大的作用,而我國的傳媒經(jīng)營管理也開始利用其為管理服務。例如,作為北京地區(qū)有線廣播電視網(wǎng)絡的建設開發(fā)、經(jīng)營、管理和維護的運營商——歌華有線,其正在建設的呼叫中心系統(tǒng),專門引入商業(yè)智能,實現(xiàn)信息數(shù)據(jù)的深度挖掘,并以報表、圖形的方式對大量的數(shù)據(jù)信息進行實時的網(wǎng)絡在線分析,為歌華有線的業(yè)務經(jīng)營提供了有力的分析工具。而新華社2008-2015年《工作設想》就有關于數(shù)據(jù)挖掘的思想,如在關于多媒體數(shù)據(jù)庫建設目標中明確提出要強化搜索查詢功能,提高搜索查詢速度和準確率的思路。
在網(wǎng)絡媒體的經(jīng)營管理中,數(shù)據(jù)挖掘技術更是建立在博客、微博、社交網(wǎng)絡網(wǎng)站這些網(wǎng)民行為的大數(shù)據(jù)基礎上。例如,騰訊擁有超過7.52億QQ即時通訊活躍賬戶,1億微信用戶、4.25億微博用戶和超過1億的視頻用戶。在積累了個人用戶多方面的海量數(shù)據(jù)后,2012年騰訊提出了“大數(shù)據(jù)營銷”的概念。騰訊網(wǎng)總編輯陳菊紅表示“將從這些海量數(shù)據(jù)中挖掘、分辨出用戶的行為模式、興趣偏好等,打造專屬于每個人的智慧門戶?!彬v訊不僅在各大產(chǎn)品線中都設置了數(shù)據(jù)挖掘團隊,還在和一些第三方數(shù)據(jù)挖掘公司、營銷公司展開合作洽談,充分挖掘用戶在網(wǎng)上的行為、關系、UGC(用戶產(chǎn)生的內(nèi)容)等數(shù)據(jù),“通過合理的方法找到對企業(yè)有幫助的數(shù)據(jù),并且將營銷預算合理的分配在為數(shù)眾多的數(shù)據(jù)來源平臺上”,從而提高營銷效率。
“大數(shù)據(jù)”通常是非結構化數(shù)據(jù),通過數(shù)據(jù)挖掘技術在非結構化的數(shù)據(jù)中獲取規(guī)律性的東西,應該是管理者夢寐以求的,也必然會對管理思維、管理方法、管理手段帶來變革性的革命。傳媒是一個典型加工信息的組織,在加工信息的過程中,必然會接觸到大量的數(shù)據(jù),在傳統(tǒng)的經(jīng)驗管理中,對數(shù)據(jù)的忽視或者先入為見的猜測,都帶來過深刻的教訓,后來在抽樣技術,統(tǒng)計分析的支持下,雖然可以分析數(shù)據(jù)的結果,但其往往是結構化的數(shù)據(jù),面對新媒體所帶來的非結構化的大數(shù)據(jù),需要利用更為復雜的數(shù)據(jù)挖掘技術才能顯示現(xiàn)內(nèi)部的規(guī)律,使傳播效果達到最優(yōu)化,而復雜的數(shù)據(jù)挖掘技術則需要建立更為先進的分析工具和分析人才的基礎上,惟其如此,大數(shù)據(jù)才能真正的引領一場管理革命。