邢曉光
摘要:隨著大數(shù)據(jù)時代的到來,傳播學研究的主要方法逐步由以抽樣調(diào)查為主的傳統(tǒng)方式向綜合利用大數(shù)據(jù)參與的新方法轉(zhuǎn)變。本文將重點展示數(shù)據(jù)挖掘技術(shù)在傳播學研究領域內(nèi)的應用案例,并將之與傳統(tǒng)研究方法進行比較,對二者在研究目的、研究手段、研究過程及其邏輯等方面進行區(qū)別,從而說明大數(shù)據(jù)處理信息方式對傳播學在方法論上的積極影響。
關(guān)鍵詞:大數(shù)據(jù);傳播學;研究方式;轉(zhuǎn)變
1 傳統(tǒng)抽樣隨機樣本轉(zhuǎn)變?yōu)榇髷?shù)據(jù)方法下的全體數(shù)據(jù)
在新聞傳播學領域,針對一般受訪者測量其認知、態(tài)度與行為選擇時,傳統(tǒng)的研究方法以隨機抽樣或固定樣本為主,具體通過深度訪談、問卷調(diào)查、實驗法等方式。隨著社交媒體深入人們的生活,人們表現(xiàn)自我的方式更為個性化、多元化,展現(xiàn)的渠道也日益多樣化。在此背景下,研究人員可以通過在網(wǎng)絡上對研究對象的“電子蹤跡”進行搜索、采集、分析、發(fā)掘和利用,即可獲得足以反饋其心理動向與行為舉止的海量數(shù)據(jù)。這就是將大數(shù)據(jù)方法引入傳播學研究領域的重要表現(xiàn)。并且,大數(shù)據(jù)研究方法,可以輕松捕捉與處理一些傳統(tǒng)抽樣方法無法采集的細節(jié)信息。比如,受到樣本數(shù)量的限制,以往的抽樣方法往往無法呈現(xiàn)出30歲以下、接受過大學教育、年收入10萬以上、定居于城市的女性研究對象的情況。顯然,數(shù)據(jù)挖掘技術(shù)彌補了新聞傳播學傳統(tǒng)研究方法上的不足。
需要說明的是,利用數(shù)據(jù)挖掘技術(shù)在傳播學之中進行研究與調(diào)查,是具有特定對象、具體主體的數(shù)據(jù)搜集與處理,譬如某部電影的票房數(shù)據(jù)、某個公眾號的用戶數(shù)據(jù)等等,換句話說,是采用了累進的在線網(wǎng)民數(shù)據(jù)的不斷更新而獲得的樣本,并不是隨機樣本。這種樣本的實際質(zhì)量與傳統(tǒng)方式得到的樣本質(zhì)量,沒有絕對的偏向優(yōu)劣。在一些具體的案例上,大數(shù)據(jù)處理信息的方法,并不能完全替代過去的抽樣調(diào)查。
2 傳統(tǒng)方法與大數(shù)據(jù)方式在研究目的上的區(qū)別
在傳播學研究領域,過去常用的抽樣調(diào)查方法,是以追求因果關(guān)系為第一研究目標的。這種因果關(guān)系的成立,必須首先滿足由因及果的時間順序關(guān)系,結(jié)果隨原因的變化而變化的共變關(guān)系,因果二者之外無其他影響變量的非虛假關(guān)系。
相較于此,大數(shù)據(jù)方法之下,研究人員首先著眼的是研究因素的相關(guān)性,比如電影票房與網(wǎng)絡搜索數(shù)量之間不存在邏輯上的因果聯(lián)系,但是存在著一定的相關(guān)性。因此,傳播學的傳統(tǒng)研究方法,可以描述事情的狀況,也可以表述傳播理論,但應用數(shù)據(jù)發(fā)掘與分析技術(shù)的方法,則可以更多傾向于對事件發(fā)展的預測,在現(xiàn)代商業(yè)市場之中具備更高的實際價值與利用潛力。而在理論研究領域,大數(shù)據(jù)方法也能夠解釋一些長期未有定論或進展的話題。
3 大數(shù)據(jù)方法放棄了追求處理信息的精確性
與傳統(tǒng)處理方法后能夠保證并追求數(shù)據(jù)的精確性不同,大數(shù)據(jù)方法處理現(xiàn)代數(shù)字信息時往往需要降低或放棄這種精確度。主要的原因如下:
第一,海量樣本數(shù)據(jù)。首先,傳統(tǒng)抽樣調(diào)查之中,可供搜集研究的樣本往往有限,研究人員客觀條件下需保證樣本數(shù)據(jù)的精確度,其中采用一些能夠減少錯誤產(chǎn)生概率的方法和策略,對數(shù)據(jù)進行整理和補充,都是具備可操作性的。但是這種清理數(shù)據(jù)的方式,在大數(shù)據(jù)方法之下無法實行,首要原因就是樣本數(shù)量龐大,人工復查不現(xiàn)實;其次就是大數(shù)據(jù)方法搜羅的信息無法保證標準完全一致;最重要的是,當今市場交易中,數(shù)據(jù)量的龐大在商業(yè)領域上能夠創(chuàng)造的價值遠高于傳統(tǒng)調(diào)查之中的一點精確性。需要說明的是,從統(tǒng)計學的角度上看,傳統(tǒng)抽樣調(diào)查方法以概率獲取樣本,能夠在抽取樣本的過程中減少人為誤差,進而確保了樣本具備代表性,但是通過大數(shù)據(jù)方法往往不以概率抽取,樣本實際不具備帶表情,誤差存在且一般較大。
第二,平均值接近定值。當數(shù)據(jù)基數(shù)越大時,其平均值將愈加接近一個固定的平均值;單薄的個體資料可能容易出現(xiàn)錯誤,但是總體性的數(shù)據(jù)其平均后傾向于某個定值,這就是所謂的“平均人”理論。在大數(shù)據(jù)應用過程中尤為明顯,以挖掘網(wǎng)絡民眾的收入資料為例,其中一部分網(wǎng)民會適當減少收入數(shù)據(jù),而有的則會做出相反的行為選擇,最終結(jié)果平均值往往接近一個定值。
第三,數(shù)字資料非結(jié)構(gòu)化。當今網(wǎng)絡之中大約95%的數(shù)字資料具有非結(jié)構(gòu)化特征,這與傳統(tǒng)研究之中充斥的大量結(jié)構(gòu)化數(shù)據(jù)有極大的不同。非結(jié)構(gòu)化數(shù)字信息包括,圖片、視頻等等,這些內(nèi)容難以精確化,只有在保證其自身多元、多樣的基礎之上,才能為應用數(shù)據(jù)挖掘與分析技術(shù)提供可能性。
此外,相對于傳統(tǒng)研究結(jié)果只能單一通過文字或圖表來呈現(xiàn)的情況,大數(shù)據(jù)對新聞傳播領域話題的表達有更多可視化展現(xiàn)方法,包括圖解、圖形、動畫等等。通過大數(shù)據(jù)可視化方法傳遞的信息內(nèi)容,減少了傳統(tǒng)方式的乏味與枯燥,提高了數(shù)據(jù)的可閱讀性與生動性,增強了讀者與文本之間的互動性。
4 結(jié)語
隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)挖掘技術(shù)與海量樣本信息為新聞傳播研究領域帶來一場革命性的變化,特別在調(diào)查方法與研究理念上,新的技術(shù)手段對整個學界產(chǎn)生了深刻的影響。然而,新事物在發(fā)展過程之中,需要一定時間為大眾所接受,這一方面出于受眾自身的主觀因素,同時也出于技術(shù)本身就是雙刃劍,大數(shù)據(jù)研究方法也不例外。作為一種工具、手段的大數(shù)據(jù)研究方法,與傳播學傳統(tǒng)調(diào)查方法一樣,研究人員在利用之時必須趨利避害,具體問題具體分析,在恰當?shù)闹黝}與合適的語境之下充分發(fā)揮大數(shù)據(jù)對新聞傳播學的研究價值。
參考文獻:
[1]倪寧,金韶.大數(shù)據(jù)時代的精準廣告及其傳播策略——基于場域理論視角[J].現(xiàn)代傳播(中國傳媒大學學報),2014(02).
[2]楊雅.大數(shù)據(jù)分析與可視化技術(shù):新聞傳播的新范式——“大數(shù)據(jù)與新聞傳播創(chuàng)新”研討會綜述[J].國際新聞界,2014(03).
[3]劉義昆.大數(shù)據(jù)時代的數(shù)據(jù)新聞生產(chǎn):現(xiàn)狀、影響與反思[J].現(xiàn)代傳播(中國傳媒大學學報),2014(11).
[4]胥琳佳.大數(shù)據(jù)對于傳播學研究內(nèi)容和方法的影響——基于社交媒體和移動互聯(lián)網(wǎng)的思考[J].中國出版,2013(18).