• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      大數(shù)據(jù)與新聞傳播研究:熱點(diǎn)與反思*

      2017-01-27 06:13:52張志安曹艷輝
      中國出版 2017年10期
      關(guān)鍵詞:研究

      □文│張志安 曹艷輝

      隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、傳感器、云計算等信息技術(shù)的發(fā)展,人類進(jìn)入數(shù)字化生存時代,個人的表達(dá)行為、搜索行為、交易行為、移動行為等都被數(shù)字化記錄和存儲,構(gòu)成海量、多樣、變動、真實的大數(shù)據(jù)。2012 年格雷布林克在《紐約時報》的一篇專欄中宣稱,“大數(shù)據(jù)時代”已經(jīng)來臨。自此,大數(shù)據(jù)迅速升溫成全球性話題,甚至上升到各國發(fā)展的國家戰(zhàn)略層面。哈佛大學(xué)教授加里·金更是預(yù)言,大數(shù)據(jù)是一場“革命”,它將改變社會各個領(lǐng)域的發(fā)展方式和進(jìn)程,“無論學(xué)術(shù)界、商界還是政府,所有領(lǐng)域都將開始這種進(jìn)程”。

      大數(shù)據(jù)資源和技術(shù)能否帶來新的研究范式,給“理論貧困,內(nèi)卷化嚴(yán)重”(李金銓語)的新聞傳播研究提供理論與方法上的創(chuàng)新?在實務(wù)層面,大數(shù)據(jù)將如何影響新聞生產(chǎn)、廣告營銷等實踐,是否會給處于焦慮轉(zhuǎn)型期的新聞業(yè)帶來新的發(fā)展機(jī)遇?倚重數(shù)據(jù)挖掘的認(rèn)知思維和實務(wù)操作是否會引發(fā)新的法律倫理風(fēng)險?針對這些問題,我們以“大數(shù)據(jù)”(big data)作為檢索關(guān)鍵詞,對 2011-2016年間發(fā)表在新聞傳播學(xué)領(lǐng)域 SSCI、CSSCI 期刊及少數(shù)專業(yè)期刊上的相關(guān)研究成果進(jìn)行回顧,評述大數(shù)據(jù)語境下的新聞傳播學(xué)研究熱點(diǎn)并進(jìn)行反思,以期為大數(shù)據(jù)時代的新聞傳播研究創(chuàng)新提供一些啟示。

      一、理論驅(qū)動的大數(shù)據(jù)實證研究

      帕克指出,“大數(shù)據(jù)方法和資源變得日益重要,是因為它能提供其他方法無法獲得的數(shù)據(jù)和洞察”。[1]理論驅(qū)動的大數(shù)據(jù)實證研究是指運(yùn)用大規(guī)模數(shù)據(jù)和大數(shù)據(jù)方法所進(jìn)行的實證研究,其目的是為了理論檢驗或理論修正,而非對大數(shù)據(jù)進(jìn)行解釋、背書、批判,或?qū)Υ髷?shù)據(jù)在新聞傳播實務(wù)中的運(yùn)用進(jìn)行點(diǎn)評、預(yù)測。相關(guān)研究集中發(fā)表在新聞傳播類 SSCI 期刊上,研究對象涵蓋傳播主體、傳播內(nèi)容、傳播過程、傳播效果等范疇,涉及政治傳播、健康傳播、風(fēng)險傳播、跨文化傳播、組織傳播等研究議題,而國內(nèi)期刊上鮮有相關(guān)研究。

      1.傳播主體與關(guān)系網(wǎng)絡(luò)

      互聯(lián)網(wǎng)的興起正在重構(gòu)人們的連接、表達(dá)與交流方式,也激發(fā)了研究者對公共領(lǐng)域、民主協(xié)商的想象與爭議。許多學(xué)者在探討,網(wǎng)絡(luò)新媒體是在復(fù)興自由討論的“公共領(lǐng)域”,還是在強(qiáng)化同質(zhì)化聯(lián)結(jié)的“回音壁”(Echo Chamber)效應(yīng)?網(wǎng)絡(luò)傳播究竟是去中心化,還是再中心化?針對這些爭議性問題,一些學(xué)者突破以往基于有限樣本或單個事件的研究范式,嘗試?yán)猛铺?、論壇等平臺上的大數(shù)據(jù)對傳播主體及關(guān)系網(wǎng)絡(luò)進(jìn)行研究。

      政治同質(zhì)化問題非常重要,關(guān)系到網(wǎng)絡(luò)媒體是支持公共領(lǐng)域的形成還是助長黨派的群體極化,但以往研究聚焦于個案研究??迫R奧尼等人[2]根據(jù)美國推特用戶分享的內(nèi)容來識別其政治立場,然后創(chuàng)新性地根據(jù)民主黨用戶(n=782,371)、共和黨用戶(n=72,302)、民主黨官方賬號(n=108)、共和黨官方賬號(n=130)之間的社交關(guān)系網(wǎng)絡(luò)分析(每一個節(jié)點(diǎn)代表一個推特用戶,連線代表推特用戶之間的粉絲關(guān)系)來計算推特用戶的政治同質(zhì)化(指推特用戶的社交關(guān)系網(wǎng)絡(luò)中,與之具有相同政治立場的推特用戶所占的比例)程度。研究發(fā)現(xiàn),民主黨人的社交關(guān)系網(wǎng)絡(luò)呈現(xiàn)出更高的政治同質(zhì)化現(xiàn)象,共和黨人對共和黨官方賬號的關(guān)注程度高于民主黨人。而在具有互粉關(guān)系的網(wǎng)絡(luò)中,推特用戶的政治同質(zhì)化程度更高。由此,研究者建議應(yīng)該考慮政治文化、用戶行為對網(wǎng)絡(luò)政治同質(zhì)化的影響。該研究突破了以往個案研究的局限,呈現(xiàn)了主流社交媒體平臺上的政治同質(zhì)化全景、解釋了影響政治同質(zhì)化現(xiàn)象的重要因素,這對中國網(wǎng)民的同質(zhì)化研究同樣具有啟示作用。

      另有一些研究表明,互聯(lián)網(wǎng)確實改變了傳播主體的權(quán)力結(jié)構(gòu),但占中心位置的傳播者不一定導(dǎo)致實質(zhì)性話語壟斷,這對精確測量網(wǎng)絡(luò)意見領(lǐng)袖和辯證看待網(wǎng)絡(luò)傳播中的權(quán)力結(jié)構(gòu)具有借鑒意義。例如,弗里龍和卡普夫[3]以 2012 年美國總統(tǒng)競選電視辯論有關(guān)的 190 萬條推文作為研究對象,將評論人分為傳統(tǒng)政治精英(政客、主流媒體及記者)、橋接型精英(娛樂明星、運(yùn)動員及其他名人)、非精英(戲謔賬號和普通賬號)三大類。通過對評論人之間的轉(zhuǎn)發(fā)關(guān)系進(jìn)行網(wǎng)絡(luò)分析后,發(fā)現(xiàn)非傳統(tǒng)政治精英在網(wǎng)絡(luò)中處于中心位置,尤其是針對羅姆尼的評論,非精英賬戶的評論遠(yuǎn)比政治精英受歡迎。另外,格雷厄姆和賴特[4]分析了一個論壇的發(fā)帖主體,發(fā)現(xiàn)該論壇有 2052 名高級發(fā)帖者(superposters),僅占發(fā)帖者人數(shù)的 0.4% ,卻貢獻(xiàn)了 47%的帖子(n=25,000,000)。但進(jìn)一步對其中 25 名高級發(fā)帖者的發(fā)帖內(nèi)容(n=40,044)進(jìn)行質(zhì)化分析后發(fā)現(xiàn),大部分帖子并沒有阻止其他用戶發(fā)帖或攻擊別人。

      2.傳播內(nèi)容與公眾輿論

      社交媒體日益成為公開表達(dá)、輿論演變的重要場域。社交媒體上的自我表達(dá)或內(nèi)容生產(chǎn)呈現(xiàn)哪些規(guī)律?社交媒體平臺的政治傳播遵循什么邏輯?如何通過社交媒體大數(shù)據(jù)獲知公眾對風(fēng)險議題的情緒態(tài)度?一些研究者試圖通過對大規(guī)模的社交媒體文本數(shù)據(jù)分析來回答這些問題。

      已有研究發(fā)現(xiàn),社交媒體上的自我呈現(xiàn)、內(nèi)容生產(chǎn)受文化因素、發(fā)布終端等因素影響,這些研究不僅突破了以往小樣本調(diào)研和實驗法的局限性,而且使文化、表情、情緒等抽象或難以測量的概念得以精準(zhǔn)量化。例如,帕克等人[5]基于“傳播中的文化差異理論”和“面部表情的心理學(xué)研究”提出研究假設(shè),然后通過推特大數(shù)據(jù)比較了不同文化群體在表情符號使用中的差異。該研究采集了 2006~2009 年間 78 個國家 5400 多萬推特用戶發(fā)表的 17 億多條推文,研究證明來自個體主義文化的用戶更喜歡使用水平型的表情符號(如 :)或:-))來表達(dá)情緒,而來自集體主義文化的用戶更喜歡使用垂直型的表情符號(如 ^_^ 或 ^.^)。默西等人[6]的研究顯示,社交媒體上的內(nèi)容生產(chǎn)與使用行為具有相關(guān)性。他們以 2.35 億條推文作為研究樣本,運(yùn)用社會心理學(xué)理論比較了不同平臺上推文的語言風(fēng)格差異,研究表明通過移動終端發(fā)布的推文在語言風(fēng)格上更以自我為中心、消極情緒的詞匯使用比例更高,但在語言的性別類型和公共性方面沒有顯著的差異。

      已有研究還發(fā)現(xiàn),社交媒體上的政治評論遵循混合媒介系統(tǒng)(a hybrid media system)模式。容赫爾從時間和內(nèi)容兩個維度比較了 2009 年德國聯(lián)邦大選期間推特上的政治評論和傳統(tǒng)新聞媒體的政治報道,研究發(fā)現(xiàn) :推特用戶對政黨的評論與傳統(tǒng)媒體報道遵循不同的時間動態(tài),但對政客的評論與傳統(tǒng)媒體報道呈現(xiàn)相似時間動態(tài) ;推特上的政治評論內(nèi)容時而像傳統(tǒng)新聞媒體的報道那樣,突出個性化、競爭性等新聞價值取向,時而遵循網(wǎng)絡(luò)表達(dá)邏輯,如突出非傳統(tǒng)黨派的動員、質(zhì)疑和諷刺政客等。[7]該研究的創(chuàng)新之處是將大數(shù)據(jù)量化研究和小樣本質(zhì)化研究相結(jié)合,從時間和內(nèi)容兩個維度呈現(xiàn)了傳統(tǒng)媒體和社交媒體上政治評論生產(chǎn)的差異性。

      在風(fēng)險傳播研究方面,Kim(金)等學(xué)者認(rèn)為有必要通過推特用戶的情感表達(dá)來衡量公眾對爭議性風(fēng)險議題的態(tài)度。他們對 2010 年 10 月~ 2013年 9 月 3 年間與核能有關(guān)的 2900 多萬條推文進(jìn)行分析。研究表明,2011 年日本福島核事故發(fā)生后,帶有外部信息鏈接(如網(wǎng)絡(luò)新聞)的推文數(shù)量遠(yuǎn)遠(yuǎn)超過不帶鏈接的推文數(shù)量 ;而計算機(jī)輔助的語義分析結(jié)果顯示,對核能的悲觀情緒一直是公眾輿論的主基調(diào)。[8]該研究的主要貢獻(xiàn)有兩點(diǎn) :一是宏觀呈現(xiàn)了公眾在社交媒體上的信息分享特征,二是通過社交媒體文本的情感分析來測量公眾的情緒態(tài)度。

      3.政治傳播、健康傳播與效果研究

      在新的傳媒生態(tài)下,研究者總是在試圖回答“傳統(tǒng)新聞媒體是否仍然能夠顯著影響公眾輿論”“社交媒體平臺的公共對話是否具有設(shè)置媒體議程的潛力”“受眾反映是否可以通過更有效的方式測量與評估”等問題。[9]近年來,一些學(xué)者開始利用大數(shù)據(jù)來檢驗政治和健康傳播領(lǐng)域的傳播效果。

      “議程設(shè)置”一直是傳播學(xué)效果研究中的經(jīng)典理論,諸多研究已對不同議題、不同媒體、不同受眾的議程設(shè)置效果進(jìn)行檢驗,但受制于自我報告數(shù)據(jù)所導(dǎo)致的一致性偏差。而用戶在社交媒體上的表達(dá)行為反映了公眾真實的議題關(guān)注,由此一些學(xué)者借助網(wǎng)絡(luò)大數(shù)據(jù)對政治傳播中的議程設(shè)置動態(tài)和效果進(jìn)行研究。例如,紐曼等學(xué)者通過對 2012 年美國社交媒體和傳統(tǒng)媒體中 29 個政治議題文本的時間序列分析后發(fā)現(xiàn),議程設(shè)置是一個多元、復(fù)雜的互動過程,而非傳統(tǒng)媒體與社交媒體之間的單向流動。該研究采集了 1 億活躍推特用戶、1.6 億活躍博客用戶、30 萬論壇用戶的社交媒體數(shù)據(jù)和在線報刊、廣播電視上的傳統(tǒng)媒體數(shù)據(jù)。[10]同樣,瓦戈等學(xué)者利用 2012 年美國總統(tǒng)競選期間的推特大數(shù)據(jù)檢驗了議程融合(agenda melding)和網(wǎng)絡(luò)議程設(shè)置(Network Agenda Setting)理論,該研究發(fā)現(xiàn)“垂直型”媒體中的議題網(wǎng)絡(luò)能更好地預(yù)測奧巴馬支持者關(guān)注的議題網(wǎng)絡(luò),“水平型”媒體中的議題網(wǎng)絡(luò)能更好地預(yù)測羅姆尼支持者關(guān)注的議題網(wǎng)絡(luò)。[11]這些研究不僅避免了自我報告數(shù)據(jù)的缺陷,還通過議題之間的社會關(guān)系網(wǎng)絡(luò)分析豐富了議程設(shè)置的測量維度。

      在健康傳播領(lǐng)域,美國疾病控制與預(yù)防中心在2012 年發(fā)起一場名為“來自戒煙者的忠告”的全國性控?zé)熯\(yùn)動,廣告宣傳幾乎覆蓋美國所有的媒體。盡管一些證據(jù)表明控?zé)熯\(yùn)動能夠改變目標(biāo)對象的態(tài)度和行為,但恐懼訴求的說服效果卻一直存在爭議。針對這一爭議,埃梅里等學(xué)者以懷特提出的“擴(kuò)展平行過程模型”(Extended Parallel Process Model)作為理論框架,以推特用戶在自然、真實情境中發(fā)表的與該運(yùn)動有關(guān)的非重復(fù)推文作為研究對象。該研究發(fā)現(xiàn)高達(dá) 87% (167,867) 的文本顯示接受恐懼訴求信息,7% (14,281) 的文本表明拒絕信息,僅有 6% (11,521) 的文本忽視恐懼信息。[12]由此可見,恐懼訴求在戒煙宣傳中確實具有顯著的說服效果,對理論的檢驗和傳播實踐都具有指導(dǎo)意義。

      二、數(shù)據(jù)驅(qū)動的研究范式創(chuàng)新

      從已有的大數(shù)據(jù)實證研究來看,研究者主要的數(shù)據(jù)來源是推特、YouTube、臉書等社交媒體,絕大部分研究都使用了推特這一開放性社交平臺的數(shù)據(jù)。與以往的研究范式不同,研究者不再通過問卷調(diào)查、訪談等方式獲取調(diào)查對象的“自我報告”數(shù)據(jù),[13]而是以精練的“關(guān)鍵詞”和編程算法來建立數(shù)據(jù)集 ;原有的抽樣邏輯被顛覆,研究者關(guān)注的焦點(diǎn)從“代表性的小樣本”轉(zhuǎn)向“選擇性的全樣本”;而最為顯著的變化莫過于數(shù)據(jù)規(guī)模的激增和數(shù)據(jù)類型的變化,盡管學(xué)界對“大數(shù)據(jù)”的量級并未達(dá)成共識,但已有研究中樣本規(guī)模多則上億,少則數(shù)萬,且多為非結(jié)構(gòu)化的文本、鏈接、表情符號等。正因為數(shù)據(jù)采集方式的改變、抽樣方式的顛覆和數(shù)據(jù)分析難度的大幅度提升,研究者的思維與方法也在改變。一些學(xué)者甚至認(rèn)為大數(shù)據(jù)將改變我們對“研究”的認(rèn)知。[14]

      1.重相關(guān)輕因果的大數(shù)據(jù)思維

      舍恩伯格在其所著的《大數(shù)據(jù)時代》一書中明確指出大數(shù)據(jù)顛覆了人類傳統(tǒng)的思維方式,具體包括 :總體樣本取代隨機(jī)樣本、對不精確的容忍度增加、相關(guān)關(guān)系取代因果關(guān)系。他的觀點(diǎn)被許多學(xué)者奉為圭臬,鮮有學(xué)者深究其背后的商業(yè)邏輯和認(rèn)知誤區(qū)。

      例如,喻國明[15]在《大數(shù)據(jù)方法 :新聞傳播理論與實踐的范式創(chuàng)新》中指出 :“新聞傳播的理論與實踐正在經(jīng)受大數(shù)據(jù)思維的改變……大數(shù)據(jù)思維只關(guān)注‘相關(guān)性’,而不再關(guān)注‘因果’關(guān)系……對大數(shù)據(jù)的研究,發(fā)生了從‘隨機(jī)樣本’到‘總體’的研究范式改變,對其研究的重點(diǎn)正從‘理論’向‘算法’與‘規(guī)則’轉(zhuǎn)換……‘理論’的指導(dǎo)價值正在下降?!敝叵嚓P(guān)、輕因果的大數(shù)據(jù)思維也體現(xiàn)在實證研究中,如一些研究結(jié)果顯示,不同終端上發(fā)布的推文在語言風(fēng)格上存在差異[16]、不同文化地理位置發(fā)布的推文在表情符號的使用上存在差異等。[17]事實上,這些研究只是驗證了相關(guān)性,因為缺乏對其他重要變量的控制而不能證明因果關(guān)系。還有一些學(xué)者認(rèn)為,利用大數(shù)據(jù)研究傳播現(xiàn)象首先關(guān)注相關(guān)關(guān)系,主要用于商業(yè)預(yù)測,如網(wǎng)民的搜索量和電影票房之間并無因果邏輯關(guān)系,只存在相關(guān)關(guān)系。但這種思維范式的轉(zhuǎn)變導(dǎo)致基于大數(shù)據(jù)的傳播學(xué)研究“重數(shù)據(jù)輕理論、重相關(guān)輕因果、重挖掘輕闡釋、重軟件輕開發(fā)。[18]

      用相關(guān)關(guān)系取代因果關(guān)系,主要是基于時間成本考慮的商業(yè)邏輯,另一方面也得益于多維度的海量數(shù)據(jù)能夠廣泛建立各種相關(guān)性分析。必須認(rèn)識到學(xué)術(shù)研究與商業(yè)預(yù)測的價值追求不同,搜索量與票房之間的相關(guān)性對于商業(yè)預(yù)測來說已經(jīng)很有意義,但對學(xué)術(shù)研究來說還缺少理論深度。當(dāng)然,相關(guān)性常常隱含因果關(guān)系,如“搜索量”可以理解為“關(guān)注度高”,關(guān)注度與購票行為之間存在因果關(guān)系。尤其是具有準(zhǔn)確預(yù)測力的相關(guān)性,更有可能隱藏某些深層次的因果關(guān)系。此外,一些學(xué)者質(zhì)疑大數(shù)據(jù)樣本的代表性,指出大數(shù)據(jù)的“全樣本”不等同于人口普查中的“總體”,其代表性和可信度存在嚴(yán)重問題。[19]筆者認(rèn)為,大數(shù)據(jù)雖不是傳統(tǒng)意義上的“總體”,但數(shù)據(jù)的代表性和可信度并非不可解決的問題。首先,不是所有的研究都需要對社會全體公眾進(jìn)行分析,很多研究只需要采集某一事件、某一話題、某一平臺的全部數(shù)據(jù)進(jìn)行分析 ;其次,隨著網(wǎng)絡(luò)普及率和使用程度的提升,互聯(lián)網(wǎng)大數(shù)據(jù)的現(xiàn)實意義和理論價值將不斷提升 ;再者,大數(shù)據(jù)的樣本規(guī)模大,一定比例的個體信息噪音不會影響總體結(jié)果,且通過數(shù)據(jù)抓取關(guān)鍵詞的精準(zhǔn)設(shè)置、算法優(yōu)化及數(shù)據(jù)清洗,可以大大提高信效度。此外,多維度的信息匹配可以增加精確性。

      2.跨學(xué)科的大數(shù)據(jù)分析方法

      龐大的數(shù)據(jù)規(guī)模和非結(jié)構(gòu)化的數(shù)據(jù)類型已經(jīng)遠(yuǎn)遠(yuǎn)超過人工分析能力,傳統(tǒng)的統(tǒng)計分析工具和人工編碼方式顯得捉襟見肘。而過去 10 年里,計算科學(xué)和工程學(xué)已經(jīng)發(fā)展出一系列算法來自動處理大規(guī)模數(shù)據(jù),這些方法正在被本學(xué)科的大數(shù)據(jù)實證研究所吸納。[20]正如帕克所言,大數(shù)據(jù)運(yùn)動通常和大規(guī)模社會網(wǎng)絡(luò)分析、自動化的數(shù)據(jù)挖掘、可視化的數(shù)據(jù)集呈現(xiàn)、計算機(jī)輔助內(nèi)容分析相聯(lián)系。[21]筆者將根據(jù)國內(nèi)外大數(shù)據(jù)實證研究和大數(shù)據(jù)方法探討的相關(guān)文獻(xiàn),梳理新聞傳播研究領(lǐng)域常用的大數(shù)據(jù)分析方法。

      第一類是基于詞典的文本分析工具(Dictionary-Based Text Analysis),是當(dāng)前社會科學(xué)研究領(lǐng)域中最為流行、便捷的計算機(jī)輔助內(nèi)容分析方法,可以根據(jù)詞典中關(guān)鍵詞所屬類別自動對文本內(nèi)容進(jìn)行編碼。[22]國外常用的分析工具有 LIWC(語言查詢和詞匯統(tǒng)計)、WordStat(詞匯統(tǒng)計)、IAT(內(nèi)隱聯(lián)想測驗)、SentiStrength(情感傾向分析)、General Inquirer(通用查詢)、 Opinion Finder(意見發(fā)覺者)、GPOMS(Google-Profile of MoodStates 谷歌情緒記錄畫像)等,可用于在線文本的議題分析、情感分析、語言風(fēng)格分析等。例如,康威等學(xué)者采用WordStat 對推文中的傳播議題進(jìn)行內(nèi)容編碼;[23]默西等學(xué)者借助 IAT 對推文的語言風(fēng)格進(jìn)行自動編碼 ;[24]由彭尼貝克教授開發(fā)的LIWC 可以對文本中的認(rèn)知、情緒等 64 項基礎(chǔ)指標(biāo)進(jìn)行編碼,且有中文版 C-LIWC。詞典、詞表是該類分析工具的核心,研究者經(jīng)常根據(jù)具體的分析文本進(jìn)行更新,有時還根據(jù)研究目的創(chuàng)建新的詞典。例如,Guo(郭氏)等人對美國總統(tǒng)競選期間提及“奧巴馬”或“羅姆尼”的推文議題進(jìn)行編碼時,首先根據(jù)已有研究成果和部分推文的人工內(nèi)容編碼確立 16 個議題,接著由編碼員精練設(shè)定每個議題的關(guān)鍵詞清單,然后根據(jù)關(guān)鍵詞清單來識別每一條推文是否包括一些或所有的議題,最后分別計算提及“奧巴馬”和“羅姆尼”的議題比例。[25]

      第二類是機(jī)器學(xué)習(xí)(machine learning),包括無監(jiān)督的機(jī)器學(xué)習(xí)和有監(jiān)督的機(jī)器學(xué)習(xí),是基于數(shù)據(jù)經(jīng)驗來識別提取數(shù)據(jù)類型、做出決策的算法。從本質(zhì)上說,無監(jiān)督的機(jī)器學(xué)習(xí)算法是試圖識別數(shù)據(jù)中“隱藏的結(jié)構(gòu)”,最常用的工具是 “潛在話題分析算法”(LDA)。有學(xué)者通過實證研究的方式,比較了基于詞典的分析工具和 LDA 無監(jiān)督機(jī)器學(xué)習(xí)兩種計算機(jī)輔助內(nèi)容分析方法的信效度,其研究發(fā)現(xiàn)后者的信效度更高。[26]有監(jiān)督的機(jī)器學(xué)習(xí)能在監(jiān)督訓(xùn)練過程中判別分類正確與否,常見的操作流程是 :先由人工編碼一定規(guī)模的樣本作為機(jī)器學(xué)習(xí)的范例,對人工編碼結(jié)果進(jìn)行信效度檢驗后再訓(xùn)練機(jī)器學(xué)習(xí)模型對文本進(jìn)行自動分類。例如,一些研究者在訓(xùn)練算法對推特文本進(jìn)行情感分析時,先讓10個訓(xùn)練有素的編碼員對 248 條推文樣本進(jìn)行人工編碼,分為樂觀、悲觀、中立三類,檢驗信效度后再監(jiān)督機(jī)器準(zhǔn)確分類。[27]也有的是根據(jù)數(shù)據(jù)庫中的大量樣本作為機(jī)器學(xué)習(xí)范例,比如科萊奧尼等人選用了 59,757 條政治新聞標(biāo)題和 166,337 條非政治新聞標(biāo)題作為機(jī)器學(xué)習(xí)判別推特內(nèi)容政治性的范例。[28]

      第三類是復(fù)雜社會網(wǎng)絡(luò)分析,常用的分析工具有 Ucinet、Gephi、Pejak。復(fù)雜性主要表現(xiàn)為結(jié)構(gòu)復(fù)雜、節(jié)點(diǎn)數(shù)目巨大、節(jié)點(diǎn)和鏈接會隨著時間變化而產(chǎn)生或消失。就分析工具本身而言,Ucinet 是目前社會網(wǎng)絡(luò)分析中使用最廣的軟件,但其上限只能處理 3 萬多個數(shù)據(jù)點(diǎn),而 Gephi、Pajek 的數(shù)據(jù)處理能力能達(dá)到百萬級;Gephi 的可視化效果最好,Pejak 便于輸出統(tǒng)計圖表。在大數(shù)據(jù)實證研究中,社會網(wǎng)絡(luò)分析常用于傳播者之間的關(guān)系、傳播議題之間的關(guān)系分析。譬如,有研究基于推特上的民主黨用戶、共和黨用戶、民主黨官方賬號、共和黨官方賬號之間的社交關(guān)系網(wǎng)絡(luò)分析,以此計算不同黨派推特用戶的政治同質(zhì)化程度。[29]瓦戈等學(xué)者在研究網(wǎng)絡(luò)議程設(shè)置時,對推特上每天同時出現(xiàn)的議題進(jìn)行網(wǎng)絡(luò)分析。[30]筆者認(rèn)為,復(fù)雜社會網(wǎng)絡(luò)分析還可以清晰勾勒網(wǎng)絡(luò)傳播圖譜和識別網(wǎng)絡(luò)意見領(lǐng)袖,在新聞傳播領(lǐng)域的大數(shù)據(jù)實證研究中將越發(fā)受到重視。

      從本質(zhì)上說,大數(shù)據(jù)分析工具的使用是為了將非結(jié)構(gòu)的大數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化的小數(shù)據(jù)。在大數(shù)據(jù)實證研究中,一些研究者先通過機(jī)器學(xué)習(xí)等方式獲得結(jié)構(gòu)化編碼數(shù)據(jù)后,再使用時間序列分析、t 檢驗等傳統(tǒng)社會科學(xué)統(tǒng)計方法進(jìn)行分析。此外,網(wǎng)絡(luò)大數(shù)據(jù)同樣包含了新聞傳播研究所需要的大量結(jié)構(gòu)化數(shù)據(jù),如網(wǎng)頁訪問量、微博轉(zhuǎn)發(fā)量、微博評論量、微信閱讀量、點(diǎn)贊量、粉絲數(shù)等。這些數(shù)據(jù)的統(tǒng)計相對簡單,但也可作為受眾需求和傳播效果分析的重要指標(biāo),可以借助傳統(tǒng)的 spss、excel 等統(tǒng)計分析軟件即可。

      三、實務(wù)導(dǎo)向的大數(shù)據(jù)應(yīng)用研究

      一般而言,學(xué)術(shù)研究包括理論研究、應(yīng)用研究和歷史研究三個方面。在大數(shù)據(jù)語境下,新聞傳播實踐會發(fā)生哪些變化?一些研究者以實務(wù)為導(dǎo)向,探討了大數(shù)據(jù)對新聞生產(chǎn)、廣告營銷的影響。

      1.大數(shù)據(jù)與數(shù)據(jù)新聞生產(chǎn)

      受大數(shù)據(jù)思潮影響,國內(nèi)外學(xué)者都高度重視和普遍看好數(shù)據(jù)新聞的發(fā)展趨勢和前景。正如劉義昆、彭蘭等學(xué)者指出,數(shù)據(jù)新聞是新聞界在大數(shù)據(jù)時代應(yīng)對時代變遷的重要舉措,是新聞業(yè)未來的發(fā)展趨勢,大數(shù)據(jù)技術(shù)正在對今天的新聞業(yè)形成沖擊,主要體現(xiàn)在大數(shù)據(jù)技術(shù)將滲透到新聞生產(chǎn)的核心環(huán)節(jié)、重樹新聞質(zhì)量標(biāo)桿、提升受眾反饋等。[31][32]從發(fā)表情況來看,張帆和吳俊對 2011 -2015 年英美大數(shù)據(jù)新聞研究的 29 篇文獻(xiàn)進(jìn)行梳理,其研究發(fā)現(xiàn)國外學(xué)者的研究議題集中在“新聞生產(chǎn)流程、報道內(nèi)容、數(shù)據(jù)素養(yǎng)和倫理道德” 四個方面。[33]國內(nèi)學(xué)者除了引介和評述國外相關(guān)研究成果外,還對大數(shù)據(jù)時代的數(shù)據(jù)新聞生產(chǎn)、數(shù)據(jù)新聞案例、可視化傳播路徑以及大數(shù)據(jù)與新聞理念創(chuàng)新等進(jìn)行研究。

      許多學(xué)者認(rèn)為,大數(shù)據(jù)將重構(gòu)新聞生產(chǎn)流程與傳播形態(tài)。國內(nèi)學(xué)者指出,大數(shù)據(jù)技術(shù)將滲透到新聞生產(chǎn)的核心環(huán)節(jié),包括新聞線索的發(fā)現(xiàn)、信息采集、對新聞稿件的篩選等。[34]國外學(xué)者對數(shù)據(jù)新聞生產(chǎn)流程的研究主要集中在數(shù)據(jù)采集、數(shù)據(jù)處理和數(shù)據(jù)可視化三個方面,數(shù)據(jù)的主要來源有政府機(jī)構(gòu)、非政府機(jī)構(gòu)、社交媒體等,但也受到數(shù)據(jù)保護(hù)法的諸多限制。[35]從新聞形態(tài)來看,數(shù)據(jù)新聞改變了以文字為中心的傳統(tǒng)新聞敘事方式,數(shù)據(jù)新聞的可視化呈現(xiàn)日益受到業(yè)界重視。劉義昆歸納了數(shù)據(jù)新聞可視化呈現(xiàn)的主要方式,包括信息圖、動態(tài)地圖、靜態(tài)地圖、曲線圖或圖表、HTML5(超文本標(biāo)記語言)等,指出目前國內(nèi)新聞媒體使用最多的是靜態(tài)信息圖,而國外數(shù)據(jù)新聞報道相對更多使用交互性動態(tài)圖表形式。[36]

      對于數(shù)據(jù)新聞的報道理念,學(xué)者們既有共識,也存在分歧。一般認(rèn)為,數(shù)據(jù)驅(qū)動的調(diào)查性報道將重塑新聞報道標(biāo)桿。如彭蘭指出,“與記者在某一個視野有限的觀察點(diǎn)上對事物進(jìn)行的觀察與分析不同的是,有效加工的大規(guī)模數(shù)據(jù)可以揭示更大范圍內(nèi)的或更接近事實的情狀,從而也為報道的深入提供了基礎(chǔ)”。[37]錢進(jìn)和周俊認(rèn)為,“數(shù)據(jù)新聞與調(diào)查性新聞報道有著一定的相似,即強(qiáng)調(diào)通過對數(shù)據(jù)(對后者來說是事實)的分析來挖掘現(xiàn)象背后意義,這恰恰承載著新聞業(yè)在社會化媒體時代重塑其權(quán)威的期望”。[38]王斌也指出,數(shù)據(jù)驅(qū)動的調(diào)查性新聞給媒體帶來工作層面的一個躍遷,即從關(guān)注社會表層現(xiàn)實到發(fā)掘社會深層現(xiàn)實,這在一定程度提高了媒體對社會現(xiàn)象的把握能力、改進(jìn)了客觀性的具體踐行方式。[39]

      但學(xué)界對大數(shù)據(jù)新聞的“預(yù)測性”卻有著不同的見解。不少學(xué)者對大數(shù)據(jù)預(yù)測性新聞寄予厚望,認(rèn)為“數(shù)據(jù)正變得越來越重要,這并不是因為數(shù)據(jù)的量大,而是我們擁有了工具和能力去分析數(shù)據(jù),找出模式、結(jié)構(gòu)并揭示趨勢”。[40]有學(xué)者認(rèn)為,目前媒體報道中關(guān)于某一事物走向的判斷主要來自于個別專家的分析,這種方法的局限性顯而易見,如果媒體能廣泛借助大數(shù)據(jù)技術(shù)來進(jìn)行重大趨勢的預(yù)測與分析,其預(yù)測的準(zhǔn)確程度及新聞的有用性可能得到有效提升。[41]但有些學(xué)者批判性地指出不要迷信數(shù)據(jù)權(quán)威和防范數(shù)據(jù)陷阱。如左艷紅強(qiáng)調(diào),大可不必將大數(shù)據(jù)過于神化,大數(shù)據(jù)質(zhì)量、新聞從業(yè)者的數(shù)據(jù)分析能力及價值判斷力等都會制約新聞內(nèi)容生產(chǎn),對數(shù)據(jù)產(chǎn)生誤讀。[42]羅弦梳理了網(wǎng)絡(luò)新聞生產(chǎn)中大數(shù)據(jù)運(yùn)用的各類亂象,包括數(shù)據(jù)保護(hù)、數(shù)據(jù)殘缺與數(shù)據(jù)污染等,這些都會制約數(shù)據(jù)新聞的公信力。[43]

      另一個爭議點(diǎn)是數(shù)據(jù)新聞的“敘事性”。王強(qiáng)指出,數(shù)據(jù)新聞?wù)谫栽叫侣劦臄⑹聝r值,新聞生產(chǎn)正面臨著敘事危機(jī)。[44]丁柏銓同樣認(rèn)為,數(shù)據(jù)新聞業(yè)并不擅長講生動的和有意味的故事,數(shù)據(jù)新聞在能顯示新聞價值的地方常常捉襟見肘,表現(xiàn)不了事實的復(fù)雜內(nèi)涵,如各種力量之間的暗中博弈或幕后交易。[45]常江等學(xué)者對央視“據(jù)說”系列報道的研究發(fā)現(xiàn),“盡管大數(shù)據(jù)技術(shù)在總體上提升了電視新聞的可觀賞性并直接帶來了收視率的提升,但數(shù)據(jù)呈現(xiàn)并未成為有機(jī)的新聞敘事元素”。[46]但有些學(xué)者卻認(rèn)為,數(shù)據(jù)新聞雖缺少生動有趣的細(xì)節(jié),但在中觀、宏觀敘事上具有獨(dú)特的優(yōu)勢,可以彌補(bǔ)傳統(tǒng)新聞宏觀敘事的不足。[47]

      2.大數(shù)據(jù)與精準(zhǔn)營銷傳播

      大數(shù)據(jù)正在從數(shù)據(jù)和技術(shù)層面重構(gòu)新的營銷體系,[48]廣告投放方式及產(chǎn)業(yè)鏈變革乃重要組成部分。大數(shù)據(jù)驅(qū)動的精準(zhǔn)廣告投放主要通過目標(biāo)消費(fèi)者的精準(zhǔn)定位、消費(fèi)需求的精準(zhǔn)挖掘、廣告投放的精準(zhǔn)可控、廣告效果的精準(zhǔn)評估 4 個方面來實現(xiàn)。[49]廣告的精準(zhǔn)投放依賴于精準(zhǔn)的受眾分析。大數(shù)據(jù)的出現(xiàn)為我們把握新媒體時代消費(fèi)者屬性提供了一個全新的視角,分析結(jié)果具有預(yù)測性、評價性(受眾反饋與評價)和可視化等。[50]以海量、非結(jié)構(gòu)化為特征的用戶及其行為軌跡的數(shù)據(jù),成為新媒體場域中擁有巨大廣告價值的特殊“資本”。[51]基于大數(shù)據(jù)的精準(zhǔn)廣告不僅驅(qū)動廣告走向“精準(zhǔn)”“可預(yù)測性”及“個性化”的新階段,而且還將從產(chǎn)業(yè)基礎(chǔ)、產(chǎn)業(yè)鏈條、產(chǎn)業(yè)業(yè)態(tài)、運(yùn)作模式等維度重構(gòu)未來廣告產(chǎn)業(yè)。例如數(shù)據(jù)和技術(shù)成為廣告業(yè)的核心要素,大量技術(shù)背景的廣告需求方平臺公司(DSP,Demand-Side Platform)、 廣 告 供 應(yīng) 方 平 臺 公司(SSP,Supply-Side Platform)、數(shù)據(jù)管理公司已經(jīng)成為廣告產(chǎn)業(yè)的新型市場參與主體。[52]

      基于大數(shù)據(jù)的受眾研究還將服務(wù)于媒體的內(nèi)容布局和盈利模式。楊迪雅、劉旸以美國視頻網(wǎng)站網(wǎng)飛(Netflix)為例,發(fā)現(xiàn)該網(wǎng)站記錄觀眾從登錄到結(jié)束的全部觀影過程,包括每一次點(diǎn)擊、播放、暫停次數(shù)、觀看時間等多維大數(shù)據(jù),分析結(jié)果可應(yīng)用于排行榜單、指導(dǎo)購片、挑選劇集的演員和導(dǎo)演等。一個經(jīng)典案例是網(wǎng)飛通過大數(shù)據(jù)分析預(yù)先發(fā)現(xiàn)喜歡觀看 1990 版《紙牌屋》的影迷們同時喜歡看導(dǎo)演大衛(wèi)·芬奇(David Fincher)與奧斯卡影帝凱文·斯派恩(Kevin Spacey)的作品,因此新版紙牌屋邀請了二位加盟,播出后果然大獲成功。[53]

      綜上所述,大數(shù)據(jù)正在從廣告?zhèn)鞑?、受眾分析、?nèi)容布局、盈利模式等維度建構(gòu)全新的精準(zhǔn)營銷體系。但也有一些學(xué)者對此提出質(zhì)疑。例如,富爾戈尼在《大數(shù)據(jù) :數(shù)字廣告的朋友,還是敵人》一文中指出,實時大數(shù)據(jù)是一把“雙刃劍”,為消費(fèi)者、零售商和市場營銷人員提供了有效率的信息、新的能力和從未有過的機(jī)會,但傾向于培養(yǎng)短期決策的心態(tài),從長期來看會損害品牌資產(chǎn)。[54]

      四、大數(shù)據(jù)引發(fā)的倫理法制研究

      不少對大數(shù)據(jù)進(jìn)行批判性思考的學(xué)者都喜歡引用克蘭茲貝格的觀點(diǎn),即“技術(shù)既不是好的,也不是壞的,更不是中立的……技術(shù)發(fā)展對社會生態(tài)的影響常常超越技術(shù)設(shè)備和實踐本身”。[55]在眾多研究者憧憬和探索大數(shù)據(jù)應(yīng)用的美好前景時,一些學(xué)者批判性地審視大數(shù)據(jù)可能引發(fā)的法律倫理風(fēng)險,追問“大數(shù)據(jù)的使用是在幫助我們創(chuàng)造更好的工具、服務(wù)和公共產(chǎn)品,還是迎來新一波的侵犯隱私和侵入營銷浪潮?或者說是用于追蹤抗議和壓制言論的手段?大數(shù)據(jù)會提升對社會現(xiàn)象認(rèn)知和傳播文化的研究,還是會限制對真相的認(rèn)知或改變我們對研究的理解?大數(shù)據(jù)預(yù)測權(quán)威是賦予個體更多自主選擇權(quán)力,還是在干預(yù)個體自主性和社會現(xiàn)實?”等問題。[56][57]

      1.數(shù)據(jù)開放侵犯個人隱私

      田新玲和黃芝曉學(xué)者指出,“大數(shù)據(jù)時代,公共數(shù)據(jù)開放作為一種自由、平等、開放、協(xié)作的人類開源精神,卻在公共云端侵害了個人數(shù)據(jù)隱私權(quán)”。[58]尼爾從數(shù)據(jù)的采集、存儲、分享、使用四個方面,詳細(xì)分析了大數(shù)據(jù)對隱私、安全和消費(fèi)者權(quán)益的消極影響。[59]

      濫用大數(shù)據(jù)侵犯個人隱私的主體眾多。這種情況在商業(yè)領(lǐng)域更為濫用,谷歌、亞馬遜、臉書,中國的百度、阿里、騰訊等企業(yè)主導(dǎo)著全球的數(shù)據(jù),在大數(shù)據(jù)精準(zhǔn)營銷、即刻分析、智能決策模式下,用戶的行為心理、興趣愛好等內(nèi)心領(lǐng)域被一一窺見。[60]邱林川發(fā)現(xiàn),中國的數(shù)據(jù)挖掘公司不需要像西方同行那樣聘請律師就可以獲取大量數(shù)據(jù),像百度這樣的公司在大數(shù)據(jù)抓取中扮演重要角色,他們將用戶的資料、活動和 UGC(用戶生產(chǎn)內(nèi)容)內(nèi)容轉(zhuǎn)化為公司資產(chǎn),盡管部分?jǐn)?shù)據(jù)開放給了公眾,但真正的目的為了實現(xiàn)個性化的廣告推送和精準(zhǔn)營銷。[61]

      法律維權(quán)難度大。為保護(hù)個人數(shù)據(jù)隱私和信息安全,不少國家與地區(qū)頒布了“個人數(shù)據(jù)保護(hù)法”,將隱私權(quán)的邊界從“私密領(lǐng)域”擴(kuò)展到“信息自主”“信息隱私”,并提出“被遺忘權(quán)”的概念。[62]但在實踐中,哪些信息屬于個人隱私、哪些信息可以公開、如何公開等問題頗具爭議,缺乏相應(yīng)的道德標(biāo)桿和精細(xì)化的法律準(zhǔn)則,且大數(shù)據(jù)環(huán)境下搜索和濫用個人信息的主體眾多,渠道隱蔽,導(dǎo)致舉證難度極大,即便舉證成功,也很難保證勝算和評估損失。[63]例如,楊秀的研究發(fā)現(xiàn),《中國互聯(lián)網(wǎng)定向廣告用戶信息保護(hù)行業(yè)框架標(biāo)準(zhǔn)》雖將身份關(guān)聯(lián)信息作為隱私權(quán)保護(hù)的重點(diǎn)對象,但在文件中使用了“合理”“適當(dāng)”“有效”等諸多表述模糊的詞語,且沿用了“告知—同意”這一國際上普遍的做法,難以落實用戶對個人信息的決定權(quán)。[64]

      2.干預(yù)公民自由與社會公正

      大數(shù)據(jù)引發(fā)了烏托邦與反烏托邦的話語:一方面被視為強(qiáng)大的工具,具有解決社會弊病的潛能,諸如癌癥研究、恐怖主義和氣候變化等;另一方面,大數(shù)據(jù)又被視為令人不安的“獨(dú)裁者”,諸如侵犯隱私、減少公民自由、增加國家和公司的控制能力等。[65]大數(shù)據(jù)對公民自由、社會公正的干預(yù),主要體現(xiàn)在不同主體的數(shù)據(jù)獲取能力差異,大數(shù)據(jù)正在建構(gòu)新的數(shù)據(jù)鴻溝和社會監(jiān)控體系。邱林川指出,到目前為止,大數(shù)據(jù)只是增加了有錢人和有權(quán)人獲取數(shù)據(jù)的能力,大數(shù)據(jù)私有化、商業(yè)化的倫理問題與資本主義的原始積累并無二致。斯諾登之類的事件表明,無論是民主國家還是非民主國家,政府總是以最快速、最便捷、最有策略的方式掌握數(shù)據(jù),用于監(jiān)控和社會控制,而互聯(lián)網(wǎng)用戶則不斷喪失自己對線上活動的控制權(quán)。[66]

      另外,“國內(nèi)外新聞與傳播前沿問題跟蹤研究”課題組引介了 2014 年以來歐美學(xué)刊中關(guān)于大數(shù)據(jù)研究的 7 篇反思性文章,這些研究反思了大數(shù)據(jù)監(jiān)控的模式、后果和風(fēng)險,指出我們將處在一個監(jiān)控?zé)o所不在的“傳感器社會”,應(yīng)該反思權(quán)力、監(jiān)視、隱私、控制、社會分類等問題,有文章同樣提及了棱鏡事件美國政府對民眾數(shù)據(jù)的大規(guī)模監(jiān)視。[67]

      五、結(jié)語與建議

      近年來,大數(shù)據(jù)儼然成為社會各界追捧的熱點(diǎn)議題,業(yè)界、學(xué)界、政界共建“大數(shù)據(jù)變革神話”。在新聞傳播研究領(lǐng)域,理論驅(qū)動的大數(shù)據(jù)實證研究、數(shù)據(jù)驅(qū)動的研究范式創(chuàng)新、實務(wù)導(dǎo)向的大數(shù)據(jù)應(yīng)用研究以及大數(shù)據(jù)引發(fā)的倫理風(fēng)險研究成為本學(xué)科新的研究熱點(diǎn),但總的來說還處于未成熟的初期階段。

      已有的大數(shù)據(jù)實證研究為新聞傳播領(lǐng)域的研究范式創(chuàng)新提供了可供借鑒的范例和想象的空間。這些研究創(chuàng)新性地運(yùn)用網(wǎng)絡(luò)大數(shù)據(jù),不僅突破了傳統(tǒng)數(shù)據(jù)采集方式和抽樣方法的局限性,豐富了政治傳播、健康傳播、跨文化傳播、風(fēng)險傳播、組織傳播方面的研究成果,更重要的是引入了計算機(jī)輔助內(nèi)容分析、復(fù)雜社會網(wǎng)絡(luò)分析等大數(shù)據(jù)方法,拓展了傳播主體關(guān)系網(wǎng)絡(luò)、傳播內(nèi)容和公眾輿論、傳播信息流、傳播效果等領(lǐng)域的研究路徑,這對本學(xué)科的研究范式創(chuàng)新起到了示范性作用。但這些大數(shù)據(jù)實證研究也存在局限:一是分析變量單一,缺少控制變量 ;二是數(shù)據(jù)抓取的精準(zhǔn)性和代表性、計算機(jī)輔助內(nèi)容分析的信效度檢驗還有待進(jìn)一步提升 ;三是雖有理論對話,但多用于檢驗和修正已有的經(jīng)典理論,在理論創(chuàng)新方面仍顯不足。因此,未來的大數(shù)據(jù)實證研究應(yīng)進(jìn)一步重視數(shù)據(jù)的代表性和純凈性、優(yōu)化計算機(jī)輔助分析的詞典和算法,以及充分發(fā)揮大數(shù)據(jù)方法在傳播關(guān)系研究和傳播過程信息流研究中的優(yōu)勢。

      大數(shù)據(jù)實證研究鮮有發(fā)表在國內(nèi)期刊上,國內(nèi)的大數(shù)據(jù)研究熱潮目前還是“虛熱”狀態(tài),還處在為大數(shù)據(jù)背書和想象大數(shù)據(jù)應(yīng)用的初期階段。為何國內(nèi)學(xué)者少有應(yīng)用大數(shù)據(jù)來創(chuàng)新研究路徑?最大的困難在于大數(shù)據(jù)方法的掌握和運(yùn)用,一是如何從海量的網(wǎng)絡(luò)數(shù)據(jù)中抽取有價值的傳播信息,二是如何對大規(guī)模的非結(jié)構(gòu)化大數(shù)據(jù)進(jìn)行統(tǒng)計分析。由此,本文綜述了學(xué)界有關(guān)大數(shù)據(jù)思維的探討,并詳細(xì)歸納了目前社會科學(xué)研究中常用的大數(shù)據(jù)方法。在筆者看來,“用相關(guān)性取代因果關(guān)系”是商業(yè)邏輯對學(xué)術(shù)研究價值取向的誤導(dǎo),網(wǎng)絡(luò)大數(shù)據(jù)雖非傳統(tǒng)意義上的總體,但處理得當(dāng)依然具有很高的學(xué)術(shù)研究價值。從已有的實證研究來看,常用的大數(shù)據(jù)研究方法可以歸為三大類 :一是基于詞典的文本分析,如 LIWC(語言查詢和詞匯統(tǒng)計)、WordStat(詞匯統(tǒng)計)、IAT(內(nèi)隱聯(lián)想測驗)等;二是機(jī)器學(xué)習(xí),包括無監(jiān)督的機(jī)器學(xué)習(xí)和有監(jiān)督的機(jī)器學(xué)習(xí) ;三是社會網(wǎng)絡(luò)分析,常用的工具有Ucinet、Gephi、Pejak。

      實務(wù)層面,學(xué)者們深刻意識到大數(shù)據(jù)資源和技術(shù)將重構(gòu)新聞生產(chǎn)、營銷體系,尤其重視大數(shù)據(jù)時代數(shù)據(jù)新聞、精準(zhǔn)營銷的發(fā)展。許多學(xué)者認(rèn)為數(shù)據(jù)新聞是新聞界在大數(shù)據(jù)時代應(yīng)對時代變遷的重要舉措,大數(shù)據(jù)技術(shù)將重構(gòu)新聞生產(chǎn)流程和重塑深度報道標(biāo)桿,但學(xué)界對大數(shù)據(jù)新聞的“預(yù)測性”和“敘事性”卻存在不同的見解。在大數(shù)據(jù)與精準(zhǔn)營銷的研究中,學(xué)者們認(rèn)為大數(shù)據(jù)正在從受眾分析、廣告投放、內(nèi)容布局、盈利模式等維度建構(gòu)新的精準(zhǔn)營銷體系,但也有國外學(xué)者對大數(shù)據(jù)的商業(yè)應(yīng)用邏輯提出質(zhì)疑,警示基于大數(shù)據(jù)的實時精準(zhǔn)營銷傾向于培養(yǎng)短期決策心態(tài),長期來看會損害品牌資產(chǎn)。從已有的應(yīng)用研究來看,學(xué)者們建構(gòu)了許多大數(shù)據(jù)應(yīng)用的神話,但普遍缺少實證材料,未來應(yīng)該進(jìn)一步實地考察新聞媒體、廣告公司、視頻網(wǎng)站等機(jī)構(gòu)是如何采納大數(shù)據(jù)技術(shù),以及新聞傳播從業(yè)者人才如何適應(yīng)大數(shù)據(jù)時代的變革。

      和所有新傳播技術(shù)的興起一樣,大數(shù)據(jù)同樣引發(fā)了烏托邦和反烏托邦的話語修辭,一方面被視為創(chuàng)新研究范式、重構(gòu)新聞生產(chǎn)和營銷傳播體系的強(qiáng)大工具,另一方面也引起一些學(xué)者對大數(shù)據(jù)運(yùn)用可能引發(fā)的法律倫理問題進(jìn)行批判與反思。由此,已有研究在“變革”與“反思”的雙重語境下展開,憧憬“變革”的話語占據(jù)主導(dǎo)地位,“重構(gòu)”“變革”“激蕩”“革命”“改變”“范式創(chuàng)新”等詞匯高頻率出現(xiàn)在論文標(biāo)題中,而有關(guān)大數(shù)據(jù)的反思性研究國內(nèi)外都比較少。從已有研究來看,學(xué)者們主要擔(dān)憂大數(shù)據(jù)應(yīng)用侵犯個人隱私和信息安全、干預(yù)公民自由和社會公平、數(shù)據(jù)殘缺污染導(dǎo)致認(rèn)知陷阱等。如何規(guī)避和化解大數(shù)據(jù)運(yùn)用的倫理風(fēng)險,特別是如何平衡數(shù)據(jù)開放與個人隱私、數(shù)據(jù)權(quán)威與數(shù)據(jù)陷阱、數(shù)據(jù)鴻溝與社會公平、數(shù)據(jù)服務(wù)與個體自主、數(shù)據(jù)預(yù)測與社會現(xiàn)實等悖論關(guān)系將是未來的研究重點(diǎn)之一。

      注釋 :

      [1][21]Parks, M.R.Big Data in CommunicationResearch: Its Contents and Discontents[J].Journal ofCommunication, 2014(64)

      [2][28][29]Colleoni,E.,Rozza A., & Arvidsson, A.Echo Chamber or Public Sphere? Predicting PoliticalOrientation and Measuring Political Homophily in TwitterUsing Big Data[J].Journal of Communication,2014 (64)

      [3]Freelon,D & Karpf,D. Of big birds and bayonets:hybrid Twitter interactivity in the 2012[J].Presidentialdebates,Information, Communication & Society, 2015(18)

      [4]Graham,T & Wright,S. Discursive Equality and EverydayTalk Online: The Impact of “Super participants”[J].Journal of Computer-Mediated Communication, 2014(19)

      [5][17]Park,J.,Baek,Y.M, & Cha,M. Cross-CulturalComparison of Nonverbal Cues in Emoticons on Twitter:Evidence from Big Data Analysis[J].Journal ofCommunication, 2014(64)

      [6][16][24] Murthy,D., Bowman,S., Gross,A., & McGarry,M.Do We Tweet Differently From Our Mobile Devices? A Studyof Language Differences on Mobile and Web-Based TwitterPlatforms[J].Journal of Communication, 2015 (65)

      [7]Jungherr,A.The Logic of Political Coverage onTwitter:Temporal Dynamics and Content[J].Journal ofCommunication,2014(64)

      [8][27]Kim,J.,Brossard,D.,Scheufele,D.A., &Xenos,M.“Shared”Information in the Age of Big Data:Exploring Sentiment Expression Related to NuclearEnergy on Twitter[J].Journalism & Mass CommunicationQuarterly,2016(2)

      [9][20][22][25][26]Guo,L., Vargo,C.J., Pan,Z., Ding,W.,&Ishwar,P. Big Social Data Analytics in Journalism andMass Communication: Comparing Dictionary-Based TextAnalysis and Unsupervised Topic Modeling[J].Journalism &Mass Communication Quarterly,2016,93(2)

      [10][13]Neuman,W.R.,Guggenheim,L.,Jang,S.M., & Bae,S.Y.The Dynamics of Public Attention: Agenda-Setting TheoryMeets Big Data[J].Journal of Communication,2014(64)

      [11][30]Vargo,C.L.,Guo, L.,McCombs,M., & Shaw,D.L.Network Issue Agendas on Twitter During the 2012 U.S.Presidential Election[J].Journal of Communication,2014(64)

      [12]Emery,S.L.,Szczypka, G.,Abril,E.P., Kim,Y., &Vera,L.Are You Scared Yet? Evaluating Fear AppealMessages in Tweets About the Tips Campaign[J].Journal ofCommunication,2014(64)

      [14][56][65]boyd d and Crawford K (2012) Critical questions forBig Data:provocations for a cultural,technological, andscholarly phenomenon[J].Information, Communication &Society,2015(5),20

      [15]喻國明.大數(shù)據(jù)方法:新聞傳播理論與實踐的范式創(chuàng)新[J].新聞與寫作,2014(12)

      [18][19]蘇林森,易偉芳.大數(shù)據(jù)技術(shù)對傳播研究方法的影響與挑戰(zhàn)[J].現(xiàn)代傳播,2014(11)

      [23]Conway,B.A., Kenski,K., & Wang, D. The Rise ofTwitter in the Political Campaign: Searching forIntermedia Agenda-Setting Effects in the PresidentialPrimary[J].Journal of Computer-Mediated Communication,2015(20)

      [31][36]劉義昆.大數(shù)據(jù)時代的數(shù)據(jù)新聞生產(chǎn):現(xiàn)狀、影響與反思[J].現(xiàn)代傳播,2014(11)

      [32][34][37][41]彭蘭.“大數(shù)據(jù)”時代:新聞業(yè)面臨的新震蕩[J].編輯之友,2013(1)

      [33][35]張帆,吳俊.2011-2015:大數(shù)據(jù)背景下英美數(shù)據(jù)新聞研究述評[J].國際新聞界,2016(1)

      [38]錢進(jìn),周俊.從出現(xiàn)到擴(kuò)散:社會實踐視角下的數(shù)據(jù)新聞[J].新聞記者,2015(2)

      [39]王斌.大數(shù)據(jù)與新聞理念創(chuàng)新——以全球首屆“數(shù)據(jù)新聞獎”為例[J].編輯之友,2013(6)

      [40]方潔,顏冬.全球視野下的“數(shù)據(jù)新聞”:理念與實踐[J].國際新聞界,2013(6)

      [42]左艷紅.大數(shù)據(jù)對新聞內(nèi)容生產(chǎn)的局限[J].編輯之友,2014(8)

      [43]羅弦.網(wǎng)絡(luò)新聞生產(chǎn)中大數(shù)據(jù)運(yùn)用的倫理問題及編輯對策[J].科技與出版,2015(1)

      [44]王強(qiáng).“數(shù)據(jù)驅(qū)動”與“敘述驅(qū)動”:數(shù)據(jù)新聞生產(chǎn)的雙重動力[J].編輯之友,2015(3)

      [45]丁柏銓.數(shù)據(jù)新聞:價值與局限[J].編輯之友,2014(7)

      [46]常江,文家寶,劉詩瑤.電視數(shù)據(jù)新聞報道的探索與嘗試——以中央電視臺《晚間新聞》“據(jù)”說系列報道為例[J].新聞記者,2014(5)

      [47]郎勁松,楊海.數(shù)據(jù)新聞:大數(shù)據(jù)時代新聞可視化傳播的創(chuàng)新路徑[J].現(xiàn)代傳播,2014(3)

      [48]黃升民,劉珊.“大數(shù)據(jù)”背景下營銷體系的解構(gòu)與重構(gòu)[J].現(xiàn)代傳播,2012(11)

      [49][51]倪寧,金韶.大數(shù)據(jù)時代的精準(zhǔn)廣告及其傳播策略——基于場域理論視角[J].現(xiàn)代傳播,2014(2)

      [50]聶磊.新媒體環(huán)境下大數(shù)據(jù)驅(qū)動的受眾分析與傳播策略[J].新聞大學(xué),2014(2)

      [52]鞠宏磊,黃琦翔,王宇婷.大數(shù)據(jù)精準(zhǔn)廣告的產(chǎn)業(yè)重構(gòu)效應(yīng)研究[J].新聞與傳播研究,2015(8)

      [53]楊迪雅,劉旸.以美國Netflix為例看大數(shù)據(jù)時代視頻網(wǎng)站內(nèi)容布局[J].現(xiàn)代傳播,2013(12)

      [54]Fulgoni G.Big Data:Friend or Foe of DigitalAdvertising?Five Ways Marketers Should Use DigitalBig Data to Their Advantage[J].Journal of AdvertisingResearch, 2013, 53(4)

      [55]Kranzberg,M.Technology and history: kranzberg’slaws[J].Technology and Culture, 1986,27(3)

      [57][61][66] Qiu,J.L.Reflections on Big Data:“Justbecause it is accessible does not make it ethical”Media[J].Culture & Society, 2015, 37(7)

      [58][60]田新玲,黃芝曉.“公共數(shù)據(jù)開放”與“個人隱私保護(hù)”的悖論[J].新聞大學(xué),2014(6)

      [59]Nir, K. Big data’s impact on privacy, security andconsumer welfare[J].Telecommunications Policy,2014,38(11):1134-1145

      [62]周麗娜.大數(shù)據(jù)背景下的網(wǎng)絡(luò)隱私法律保護(hù):搜索引擎、社交媒體與被遺忘權(quán)[J].國際新聞界,2015(8)

      [63]劉小霞,陳秋月.大數(shù)據(jù)時代的網(wǎng)絡(luò)搜索與個人信息保護(hù)[J].現(xiàn)代傳播,2014(5)

      [64]楊秀.大數(shù)據(jù)時代定向廣告中的個人信息保護(hù)——《中國互聯(lián)網(wǎng)定向廣告用戶信息保護(hù)行業(yè)框架標(biāo)準(zhǔn)》分析[J].國際新聞界,2015(5)

      [67]“國內(nèi)外新聞與傳播前沿問題跟蹤研究”課題組.大數(shù)據(jù)實踐與硏究:批判性反思與研究推動[J].新聞與傳播研究,2015(8)

      猜你喜歡
      研究
      FMS與YBT相關(guān)性的實證研究
      2020年國內(nèi)翻譯研究述評
      遼代千人邑研究述論
      視錯覺在平面設(shè)計中的應(yīng)用與研究
      科技傳播(2019年22期)2020-01-14 03:06:54
      關(guān)于遼朝“一國兩制”研究的回顧與思考
      EMA伺服控制系統(tǒng)研究
      基于聲、光、磁、觸摸多功能控制的研究
      電子制作(2018年11期)2018-08-04 03:26:04
      新版C-NCAP側(cè)面碰撞假人損傷研究
      關(guān)于反傾銷會計研究的思考
      焊接膜層脫落的攻關(guān)研究
      電子制作(2017年23期)2017-02-02 07:17:19
      那曲县| 兴安盟| 正定县| 高唐县| 阳春市| 土默特右旗| 萍乡市| 宜良县| 梅州市| 镇沅| 招远市| 德令哈市| 莱西市| 建宁县| 昌都县| 怀安县| 桂林市| 板桥市| 大新县| 昭通市| 高唐县| 南宁市| 白玉县| 民勤县| 光泽县| 彰化县| 旅游| 威海市| 遂昌县| 甘南县| 武山县| 瓦房店市| 盐亭县| 唐山市| 浦城县| 府谷县| 顺义区| 闽清县| 花垣县| 锡林浩特市| 桑日县|