□文│夏雨禾
習(xí)近平總書記在黨的十九大報(bào)告中提出,要“高度重視傳播手段建設(shè)和創(chuàng)新,提高新聞輿論傳播力、引導(dǎo)力、影響力和公信力”。[1]在技術(shù)日新月異的傳播語境中,提出“傳播手段建設(shè)和創(chuàng)新”,具有重大現(xiàn)實(shí)指導(dǎo)意義。傳播手段,指的是為達(dá)到特定傳播目的而使用的工具、方法和技巧。推動(dòng)傳播手段建設(shè)和創(chuàng)新,并不單純指技術(shù)層面的問題,“任何技術(shù)都體現(xiàn)人的目的要求,人將自己在社會中形成的生活與生產(chǎn)目的注入到技術(shù)中,使技術(shù)具有了在社會中形成的意義”,[2]就此而言,傳播手段建設(shè)和創(chuàng)新是一個(gè)目標(biāo)指向鮮明的系統(tǒng)工程,其重心并不在于技術(shù)本身,而是在充分認(rèn)知技術(shù)本質(zhì)和運(yùn)行邏輯的基礎(chǔ)上,確定以何種方式、方法恰如其分地運(yùn)用技術(shù)手段來提高新聞輿論傳播力、引導(dǎo)力、影響力和公信力。
本文的研究,將圍繞大數(shù)據(jù)思維中的新聞生產(chǎn)、新聞生產(chǎn)中大數(shù)據(jù)技術(shù)的運(yùn)作邏輯和應(yīng)用場景、大數(shù)據(jù)時(shí)代新聞生產(chǎn)流程重構(gòu)面臨的風(fēng)險(xiǎn)等問題展開探討和分析,以期拋磚引玉。
大數(shù)據(jù)這個(gè)概念正面臨被濫用的風(fēng)險(xiǎn),似乎規(guī)模龐大的數(shù)據(jù)集合都可以被稱為大數(shù)據(jù),這是一個(gè)認(rèn)知誤區(qū)。大數(shù)據(jù)是特定技術(shù)條件下的產(chǎn)物,即通過網(wǎng)絡(luò)和計(jì)算機(jī)技術(shù)進(jìn)行捕捉、存儲,并可以被用于管理和分析的數(shù)據(jù)集合。
大數(shù)據(jù)的本質(zhì)特征并不只是它的規(guī)模,更在于它的三個(gè)主要特性。
其一,在線性。大數(shù)據(jù)來自于在線行為,只有在線行為所產(chǎn)生的“數(shù)據(jù)足跡”才有可能通過網(wǎng)絡(luò)和計(jì)算機(jī)技術(shù)進(jìn)行抓取、捕獲和存儲。因此,任何離線或線下行為所產(chǎn)生的數(shù)據(jù)信息,比如,線下調(diào)研所產(chǎn)生的數(shù)據(jù)集合,無論規(guī)模多大,也不能稱為大數(shù)據(jù)。
其二,流動(dòng)性。大數(shù)據(jù)在形態(tài)上具有“液態(tài)”流動(dòng)性特征,由于大規(guī)模網(wǎng)絡(luò)節(jié)點(diǎn)的在線行為無時(shí)不刻都在生產(chǎn)數(shù)據(jù),由此而生成的數(shù)據(jù)集合并不是一成不變的靜態(tài)存在,而是處于變動(dòng)不居的迭代更新狀態(tài)。因此,大數(shù)據(jù)具有很好的流動(dòng)性和成長性,這是通常所說的數(shù)據(jù)庫所不具備的。
其三,精準(zhǔn)性。大數(shù)據(jù)在質(zhì)量上具有精準(zhǔn)性特征?!熬敝妇_,大數(shù)據(jù)是在線行為的“全景”記錄,任何肉眼無法察覺甚至是自身未曾留意的“蛛絲馬跡”都有可能被記錄,因此數(shù)據(jù)的“粒度”很高;[3]與此同時(shí),由于大數(shù)據(jù)具有迭代更新的流動(dòng)性特征,這就有利于形成有效的優(yōu)化和反饋機(jī)制,相應(yīng)的,數(shù)據(jù)對在線行為的描述或標(biāo)簽也不是一成不變,而是不斷趨于準(zhǔn)確。
表面來看,大數(shù)據(jù)是一堆無組織且雜亂無章的數(shù)據(jù)集合,其間卻隱含著很多肉眼無法識別的規(guī)律和趨勢特征。要從沙粒般的數(shù)據(jù)中識別這些規(guī)律或趨勢特征,就必須借助于“算法”。所謂算法,即通過計(jì)算機(jī)解決、分析問題的策略和方法體系,簡而言之,就是計(jì)算的方法和技巧。相應(yīng)的,利用算法對大量的數(shù)據(jù)進(jìn)行分析,進(jìn)而揭示數(shù)據(jù)中隱藏的關(guān)系、模式和趨勢,這個(gè)過程就被稱作是“數(shù)據(jù)挖掘”。[4]大數(shù)據(jù)離不開算法,可以說,沒有算法的大數(shù)據(jù)只是一堆冰冷、無用的數(shù)字“垃圾”。從這個(gè)角度來看,稱算法為大數(shù)據(jù)的“靈魂”毫不為過。近年來,隨著數(shù)據(jù)科學(xué)和統(tǒng)計(jì)學(xué)的發(fā)展,算法領(lǐng)域的創(chuàng)新層出不窮,而突飛猛進(jìn)的計(jì)算機(jī)技術(shù)更是讓各式各樣的算法“如虎添翼”。
大數(shù)據(jù)并不是簡單的技術(shù),更是一種集在線化、數(shù)據(jù)化和算法化于一體的思維方式。大數(shù)據(jù)思維方式中的新聞生產(chǎn),同樣也必須滿足在線化、數(shù)據(jù)化和算法化“三大需求”。
一是看是否已經(jīng)實(shí)現(xiàn)在線化。從某種程度上說,傳統(tǒng)媒體布局“中央廚房”“三微一端”,其目的之一就是試圖通過在線化改造的方式,提升新聞生產(chǎn)的效率和質(zhì)量,從表面上看,已經(jīng)滿足了在線化的需求。
二是看是否已經(jīng)形成數(shù)據(jù)反饋系統(tǒng)。在線化只是一個(gè)開端,關(guān)鍵是要看能否產(chǎn)生數(shù)據(jù)反饋并形成源源不斷的數(shù)據(jù)流,為新聞生產(chǎn)提供全新的動(dòng)力源。如果布局“中央廚房”“三微一端”只考慮“播”而很少顧及“傳”的問題,其所導(dǎo)致的可能性后果就是,很少甚至是沒有數(shù)據(jù)反饋,無法滿足數(shù)據(jù)挖掘的需求,新聞生產(chǎn)對接大數(shù)據(jù)技術(shù)將只能是“空中樓閣”。
三是看是否具備數(shù)據(jù)挖掘能力。在擁有反饋數(shù)據(jù)流的情形下,是否擁有特定的算法模型,挖掘新聞生產(chǎn)所需的素材或信息,將數(shù)據(jù)轉(zhuǎn)化為新聞生產(chǎn)中的“現(xiàn)實(shí)生產(chǎn)力”。值得注意的是,這種“現(xiàn)實(shí)生產(chǎn)力”并不是新聞報(bào)道的內(nèi)容,而是提升新聞生產(chǎn)效率和質(zhì)量的手段。
綜上所述,大數(shù)據(jù)思維中的新聞生產(chǎn),既不是將大數(shù)據(jù)作為新聞報(bào)道的內(nèi)容,也不是單純的技術(shù)應(yīng)用,而是如何通過在線化、數(shù)據(jù)化和算法化三個(gè)環(huán)節(jié),讓大數(shù)據(jù)真正服務(wù)于新聞生產(chǎn)的實(shí)踐需求,這也是大數(shù)據(jù)時(shí)代傳播手段建設(shè)和創(chuàng)新的重要原則。
在傳統(tǒng)的新聞生產(chǎn)流程中,人是唯一的主體性因素。這雖然可以在最大程度上保證新聞傳播活動(dòng)的可控性水平,但其間也不可避免地會摻雜大量與人有關(guān)的“非生產(chǎn)性”因素。比如,權(quán)力結(jié)構(gòu)、從業(yè)者個(gè)人經(jīng)驗(yàn)、程式化的工作流程、人際關(guān)系的協(xié)調(diào)、重復(fù)性或事務(wù)性的活動(dòng)等,都有可能會對新聞生產(chǎn)造成干擾。更為重要的是,由于技術(shù)能力有限,傳統(tǒng)新聞生產(chǎn)始終無法突破“傳—受”之間的隔閡,縱使是借助受眾調(diào)查等手段,也無法得到全面、動(dòng)態(tài)的反饋信息,這就使得新聞生產(chǎn)難以擺脫“閉門造車”式的困局。
大數(shù)據(jù)時(shí)代來臨后,“人—機(jī)”關(guān)系格局發(fā)生了變化,上述問題有望得到較為徹底地解決。在傳統(tǒng)編程環(huán)境下,計(jì)算機(jī)只不過是聽令于人的“工具”,它根據(jù)人發(fā)出的指令執(zhí)行運(yùn)算任務(wù),再將運(yùn)算的結(jié)果反饋給人。大數(shù)據(jù)時(shí)代來臨后,上述邏輯發(fā)生了變化,如下圖所示,計(jì)算機(jī)在給定算法模型和樣本數(shù)據(jù)集的情況下,可以以“自我反饋”的方式對樣本數(shù)據(jù)集所隱藏的關(guān)系、特征、模式等信息進(jìn)行歸納,在此基礎(chǔ)上,設(shè)定算法模型的參數(shù)或閾值,并繼續(xù)對新的數(shù)據(jù)流進(jìn)行自動(dòng)跟蹤分析;值得關(guān)注的是,算法模型的參數(shù)和閾值并非一成不變,還可以根據(jù)新數(shù)據(jù)流的反饋信息不斷進(jìn)行自我調(diào)整和優(yōu)化,使分析的結(jié)果更趨準(zhǔn)確。由于這個(gè)過程與人的學(xué)習(xí)過程非常相似,因此被稱為是“機(jī)器學(xué)習(xí)”。不難發(fā)現(xiàn),機(jī)器學(xué)習(xí)的過程中,計(jì)算機(jī)、算法和數(shù)據(jù)三者之間構(gòu)成了一個(gè)相對獨(dú)立的反饋閉環(huán),計(jì)算機(jī)的“工具性”角色趨于蛻變。
圖 機(jī)器學(xué)習(xí)中的反饋閉環(huán)
在機(jī)器學(xué)習(xí)的環(huán)境下,人只需提供“教材”即算法模型和樣本數(shù)據(jù)集,計(jì)算機(jī)就能夠“自主學(xué)習(xí)”并相對獨(dú)立地完成原本應(yīng)該由人來完成的許多工作,它不僅可以將人從許多費(fèi)時(shí)、費(fèi)力以及重復(fù)性的勞動(dòng)中解放出來,更為重要的是,它為消除新聞生產(chǎn)過程中許多“非生產(chǎn)性”的干擾因素提供了全新的思路,這主要體現(xiàn)在以下四種典型的應(yīng)用場景。
雪到底是誰造的呢?動(dòng)物們爭論不休。鼴鼠爬爬怕鳥,所以盡管他期待看雪,卻又畏懼哥哥們口中描述的像白鳥一樣的雪花。媽媽說,死去的鼴鼠會變成白色,去天上造雪,可小貓頭鷹堅(jiān)持說,造雪的是死去的貓頭鷹。生命旅程,往復(fù)不息,“雪”成為引導(dǎo)我們坦然面對死亡的線索。死后的動(dòng)物化作白色的精靈去云上造雪,美好的想象化解了死亡的傷痛,《是誰造了雪?》因而成為讀者愛不釋手的“生命之書”。
應(yīng)用場景一:機(jī)器寫作。即給定計(jì)算機(jī)特定的樣本數(shù)據(jù)集如財(cái)經(jīng)類、體育類、環(huán)境類報(bào)道或相關(guān)領(lǐng)域的研究報(bào)告,以及特定的算法模型,計(jì)算機(jī)經(jīng)過“學(xué)習(xí)”以后,就可以根據(jù)數(shù)據(jù)源的動(dòng)態(tài)變化直接生成新聞報(bào)道。比如,新華社的“快筆小新”、南方都市報(bào)的“小南”、第一財(cái)經(jīng)的“DT稿王”等機(jī)器寫稿人,依循的就機(jī)器寫作的原理。隨著物聯(lián)網(wǎng)社會的到來,只要機(jī)器寫稿人與植有傳感器的終端設(shè)備相連接,便可根據(jù)傳感器反饋的數(shù)據(jù)自動(dòng)生成新聞報(bào)道。由于計(jì)算機(jī)的運(yùn)算能力遠(yuǎn)超人類,所以機(jī)器寫稿人的工作效率極高。據(jù)相關(guān)報(bào)道,騰訊寫稿機(jī)器人“夢幻寫手”(DreamWriter)財(cái)經(jīng)+科技應(yīng)用的發(fā)稿量已經(jīng)超過了2000篇/天,體育稿量也達(dá)到了500篇/天。[5]這種出稿速度顯然是人力所無法匹敵的。
應(yīng)用場景二:用戶畫像。即以數(shù)據(jù)挖掘的方式對人的在線化行為留下的“數(shù)據(jù)足跡”進(jìn)行分析,并添加各種標(biāo)簽。但凡用戶有在線的媒體使用行為,其ID、終端、位置、時(shí)長、頻度和軌跡等數(shù)據(jù)就會被記錄,媒體也就有機(jī)會獲取用戶行為的“全樣本記錄”。當(dāng)然,在擁有開放數(shù)據(jù)源的情形下,用戶的其他“數(shù)據(jù)分身”如社交、消費(fèi)、流量等數(shù)據(jù)信息還可以幫助媒體了解用戶更為多維、立體的生活“畫像”,從而使新聞生產(chǎn)更加有的放矢。當(dāng)然,在社交媒體迅速崛起的背景下,新聞生產(chǎn)的信息來源也日益增多,用戶畫像還有助于媒體在追蹤信息來源“數(shù)據(jù)足跡”的基礎(chǔ)之上,對他們提供新聞線索的價(jià)值、可信度等進(jìn)行評估,有效防止虛假信息和謠言的擴(kuò)散。
應(yīng)用場景三:文本挖掘。除了能夠?qū)τ脩暨M(jìn)行“畫像”之外,大數(shù)據(jù)技術(shù)還可以對海量的網(wǎng)絡(luò)信息進(jìn)行“畫像”,即通過分詞、向量化處理等技術(shù)手段,對以自然語言方式呈現(xiàn)的網(wǎng)絡(luò)信息進(jìn)行快速分類并添加標(biāo)簽,從而將采編人員從繁重的新聞背景資料檢索、組織等事務(wù)性工作中解放出來。除此之外,文本挖掘還有助于從海量的信息中快速辨識熱點(diǎn)和有價(jià)值的新聞線索,使新聞主題的發(fā)現(xiàn)與跟蹤、熱點(diǎn)趨勢預(yù)測等工作更具科學(xué)性,進(jìn)而有效解決困擾新聞生產(chǎn)中經(jīng)驗(yàn)主義、權(quán)威主義等問題。
應(yīng)用場景四:推薦系統(tǒng)。即在對用戶“畫像”或用戶新聞產(chǎn)品選擇和使用行為進(jìn)行推算的基礎(chǔ)上,“投其所好”向用戶推送他們可能喜歡的新聞產(chǎn)品。推薦系統(tǒng)一般用于新聞產(chǎn)品的分發(fā)環(huán)節(jié),它有助于將新聞產(chǎn)品更加精準(zhǔn)地“送達(dá)”有需要的用戶,從而實(shí)現(xiàn)所謂的“定制化推送”。
不難發(fā)現(xiàn),上述應(yīng)用場景已經(jīng)基本上實(shí)現(xiàn)了對新聞生產(chǎn)各環(huán)節(jié)的全程覆蓋,機(jī)器寫作部分地取代了新聞生產(chǎn)中的人工寫稿,大幅提升了新聞生產(chǎn)的工作效率;用戶畫像和文本挖掘使新聞生產(chǎn)不再是“閉門造車”,不僅擺脫了經(jīng)驗(yàn)主義和權(quán)威主義的困擾,還有助于媒體從浩如煙海的用戶和信息中迅速找到可靠的信息來源和新聞素材;推薦系統(tǒng)則有望解決新聞傳播活動(dòng)中的“傳—受”隔閡,使千人千面、精確到達(dá)的理想化傳播生態(tài)成為可能。當(dāng)然,從技術(shù)發(fā)展的角度來看,機(jī)器學(xué)習(xí)還只是初級階段,隨著以人工神經(jīng)網(wǎng)絡(luò)算法體系為基礎(chǔ)的深度學(xué)習(xí)技術(shù)的出現(xiàn),上述應(yīng)用場景的面向領(lǐng)域?qū)⒏鼮閺V闊。2017年12月,中國第一個(gè)媒體人工智能平臺——新華社的“媒體大腦”已投入運(yùn)行。據(jù)報(bào)道,該系統(tǒng)除了能夠?qū)崿F(xiàn)機(jī)器學(xué)習(xí)的各種應(yīng)用場景之外,還能利用深度學(xué)習(xí)技術(shù),幫助媒體在海量的新聞圖片中精確識別圖片中的人物,并可以構(gòu)建圖像中人物的關(guān)系圖譜。[6]深度學(xué)習(xí)技術(shù)的應(yīng)用和推廣,預(yù)示著新聞生產(chǎn)將真正邁入人工智能時(shí)代。
技術(shù)的變革雖然能夠給新聞生產(chǎn)帶來諸多美好的“愿景”,但并不意味著,前方就是一路坦途。大數(shù)據(jù)時(shí)代新聞生產(chǎn)流程的重構(gòu),首先要解決好數(shù)據(jù)來源問題,還必須直面因“人—機(jī)”關(guān)系格局變化而產(chǎn)生的新型風(fēng)險(xiǎn)。
數(shù)據(jù)是大數(shù)據(jù)時(shí)代新聞生產(chǎn)的生命線和動(dòng)力源,新聞生產(chǎn)流程的重構(gòu)是以數(shù)據(jù)流為基礎(chǔ)的,離開數(shù)據(jù)一切都只是空談。因此,搭建多樣化的數(shù)據(jù)共享平臺,從各個(gè)渠道獲取滿足新聞生產(chǎn)所需的數(shù)據(jù),已經(jīng)是迫在眉睫。整合媒體“三微一端”聯(lián)動(dòng)優(yōu)勢,讓來自各媒體端口的數(shù)據(jù)“匯聚成流”,是獲取數(shù)據(jù)的現(xiàn)實(shí)途徑之一。2017年8月19日,《人民日報(bào)》社發(fā)起建設(shè)“全國黨媒公共平臺”,目前已經(jīng)有200多家黨媒加盟,其目的之一,就是匯集來自各黨媒在線端口的反饋數(shù)據(jù),供所有加盟者分享使用。[7]當(dāng)然,除縱向整合媒體自身的反饋數(shù)據(jù)之外,地方性媒體還可以通過橫向打通的方式,對接本地的政務(wù)數(shù)據(jù)和服務(wù)數(shù)據(jù),擴(kuò)大新聞生產(chǎn)的數(shù)據(jù)來源。
除解決數(shù)據(jù)來源問題之外,大數(shù)據(jù)技術(shù)給新聞生產(chǎn)帶來了全新風(fēng)險(xiǎn)也不容小覷。第一,機(jī)器寫作自動(dòng)生成的新聞稿件,可能會因“把關(guān)人”缺失而產(chǎn)生不良社會后果。比如,2016年1月4日,央視新聞、澎湃新聞發(fā)布消息稱江西九江發(fā)生6.9級地震,事后就被證明是機(jī)器寫稿人根據(jù)“地震臺網(wǎng)自動(dòng)后臺錄入信息”而導(dǎo)致的“烏龍”事件。第二,文本挖掘技術(shù)雖然有助于新聞主題的發(fā)現(xiàn)與追蹤,但也可能導(dǎo)致的新聞主題大規(guī)模同質(zhì)化現(xiàn)象。第三,基于用戶偏好的推薦系統(tǒng)雖然可以實(shí)現(xiàn)“定制化推送”,但傳播學(xué)意義上的“回音壁”效應(yīng)卻有可能導(dǎo)致用戶在不斷重復(fù)的自我證實(shí)中強(qiáng)化固定成見,從而身陷“信息繭房”。在這樣的情況下,新聞傳播的輿論引導(dǎo)和社會整合功能將愈發(fā)難以實(shí)現(xiàn)。
上述新型風(fēng)險(xiǎn)的產(chǎn)生,均與技術(shù)語境變遷背景下“人—機(jī)”關(guān)系格局的變化密切相關(guān)。事實(shí)上,無論計(jì)算機(jī)的“學(xué)習(xí)”能力多么強(qiáng)大,新聞生產(chǎn)流程中人的主體性地位依然不能喪失,構(gòu)建以人為主導(dǎo)的“人—機(jī)”新型協(xié)作系統(tǒng)勢在必行。第一,把關(guān)機(jī)制的重塑。目前,用戶畫像和文本挖掘等應(yīng)用雖然已經(jīng)不同程度涉及“把關(guān)”環(huán)節(jié),但很難保證沒有“漏網(wǎng)之魚”,比如,各種擦邊性質(zhì)的不良內(nèi)容,與意識形態(tài)相關(guān)的政治、宗教等敏感信息等。因此,有必要建立以人工審核、用戶舉報(bào)和計(jì)算機(jī)過濾于一體的多元主體新型把關(guān)機(jī)制,從源頭上防范風(fēng)險(xiǎn)的產(chǎn)生。第二,技術(shù)規(guī)則的設(shè)置。樣本數(shù)據(jù)集和算法之間的搭配使用充滿著辯證關(guān)系,不同樣本數(shù)據(jù)集或算法所導(dǎo)致的“學(xué)習(xí)”效果有可能大相徑庭,即使同一樣本數(shù)據(jù)集和算法搭配使用的情況下,不同參數(shù)和閾值的設(shè)置同樣也會影響數(shù)據(jù)解讀的科學(xué)性。在這樣的情況下,科學(xué)設(shè)置技術(shù)規(guī)則和標(biāo)準(zhǔn),對樣本數(shù)據(jù)集和算法的采用方式、流程等作出具體規(guī)定,就顯得十分必要。第三,評價(jià)機(jī)制的建立。作為大數(shù)據(jù)時(shí)代傳播手段建設(shè)和創(chuàng)新的有機(jī)組成部分,新聞生產(chǎn)的流程重構(gòu)始終是以服務(wù)于新聞輿論工作為目標(biāo)指向的。就此而言,探索建立一套多維度的評價(jià)指標(biāo)體系,從傳播力、引導(dǎo)力、影響力和公信力等角度對新聞生產(chǎn)中大數(shù)據(jù)技術(shù)應(yīng)用的效果進(jìn)行評價(jià),也是勢在必行。
參考文獻(xiàn):
[1]習(xí)近平.決勝全面建成小康社會 奪取新時(shí)代中國特色社會主義偉大勝利——在中國共產(chǎn)黨第十九次全國代表大會上的報(bào)告[N].新華社北京2017年10月27日電
[2]肖峰.論技術(shù)的社會形成[J].中國社會科學(xué),2002(6)
[3]數(shù)據(jù)的“粒度”,即數(shù)據(jù)的細(xì)化程度。細(xì)化程度越高,粒度就越小;反之,細(xì)化程度越低,粒度就越大
[4]涂子沛.大數(shù)據(jù)[M].南寧:廣西師范大學(xué)出版社,2013:98
[5]趙思強(qiáng).世界互聯(lián)網(wǎng)大會頻頻提及的“人工智能”,到底如何影響傳媒業(yè)[EB/OL].來自微信公眾號“傳媒茶話會”,2017-12-05
[6]新京報(bào).新華社已搭建人工智能平臺[EB/OL].2017-12-05,http://bigdata.idcquan.com/news/132012.shtml
[7]葉蓁蓁.黨管數(shù)據(jù)是必然趨勢,黨媒要抓住數(shù)據(jù)機(jī)會[EB/OL].來自微信公眾號“傳媒茶話會”,2017-12-07