文_周建國 徐 潔
作為大數(shù)據(jù)時代一種獨特的融合報道方式和創(chuàng)新新聞形態(tài),數(shù)據(jù)新聞以數(shù)據(jù)為核心驅(qū)動力,以可視化為主要呈現(xiàn)方式,依托數(shù)據(jù)來講故事,改變了傳統(tǒng)新聞生產(chǎn)模式和敘事模式。在媒體深度融合和媒體數(shù)字生態(tài)圈構(gòu)建的大背景下,數(shù)據(jù)新聞可以說是“融合進(jìn)行曲中的創(chuàng)新樂章”。
今年初,錢江晚報·小時新聞客戶端成立“數(shù)據(jù)新聞實驗室”,新創(chuàng)欄目“有個數(shù)”,對數(shù)據(jù)新聞的生產(chǎn)與傳播作了一些粗淺嘗試。“有個數(shù)”以熱點話題為切入點,基于數(shù)據(jù)挖掘、篩選,將“資訊+數(shù)據(jù)”二者智能結(jié)合,通過數(shù)據(jù)的獲取與分析,把新聞背后的故事,通過數(shù)字化、可視化、交互化的形式,進(jìn)行直觀呈現(xiàn),讓新聞從可讀變成“可視”,從靜態(tài)變成動態(tài),實現(xiàn)單向傳播向互動式、服務(wù)式、沉浸式、場景式傳播轉(zhuǎn)變。近一年來,數(shù)據(jù)新聞實驗室發(fā)布20余篇數(shù)據(jù)新聞產(chǎn)品,點擊閱讀量過百萬。
本文從話題關(guān)切、數(shù)據(jù)驅(qū)動、創(chuàng)意呈現(xiàn)三個方面,即數(shù)據(jù)新聞的內(nèi)容、手段、形態(tài),淺析小時新聞數(shù)據(jù)新聞實驗室的探索,以及實踐中的瓶頸與突破。
“數(shù)據(jù)新聞”,或稱“數(shù)據(jù)驅(qū)動新聞”,是“基于數(shù)據(jù)的抓取、挖掘、統(tǒng)計、分析和可視化呈現(xiàn)的新型新聞報道方式”,即運用各種技術(shù)軟件來抓取、處理、分析和形象化呈現(xiàn)數(shù)據(jù),挖掘數(shù)據(jù)化敘事的新聞價值。數(shù)據(jù)新聞融合報道的發(fā)展方向,正契合媒體融合向縱深發(fā)展的大勢,代表著未來新聞業(yè)發(fā)展的一大方向。國內(nèi)媒體如人民網(wǎng)、新華網(wǎng)、澎湃新聞等均在數(shù)據(jù)新聞報道中早有布局。
數(shù)據(jù)新聞的出發(fā)點是“服務(wù)公眾利益”。所有數(shù)據(jù)的處理和呈現(xiàn),歸根究底,是為了通過數(shù)據(jù)尋求真相,用數(shù)據(jù)說話,通過數(shù)據(jù)分析來挖掘現(xiàn)象背后的意義,讓公眾了解數(shù)據(jù)變遷的內(nèi)涵及宏觀數(shù)據(jù)如何影響每個人。這一點,無論是國際上旨在表彰全球最優(yōu)秀數(shù)據(jù)新聞產(chǎn)品的Sigma數(shù)據(jù)新聞獎,還是國內(nèi)的中國數(shù)據(jù)內(nèi)容大賽,都把它作為一件優(yōu)秀數(shù)據(jù)新聞作品的重要評判標(biāo)準(zhǔn)。
“服務(wù)公眾利益”這個出發(fā)點,同樣是區(qū)域性都市類媒體小時新聞做數(shù)據(jù)新聞的總體路徑指向。在實際操作中,結(jié)合錢江晚報·小時新聞聚焦都市大生活的定位,我們賦予“服務(wù)公眾利益”以更生活化的解讀:用戶關(guān)切。本地化、生活化是小時新聞的定位,同樣是我們跟進(jìn)數(shù)據(jù)新聞的標(biāo)準(zhǔn)。從這個角度看,我們的數(shù)據(jù)新聞實踐,更多是偏服務(wù)性的話題新聞,而不是嚴(yán)格意義上的調(diào)查型數(shù)據(jù)新聞。
一種是循著熱點事件或話題,找到可操作的角度和數(shù)據(jù);一種是從老百姓最關(guān)注的領(lǐng)域諸如房子車子教育等話題里尋找小切口。
比如今年歐洲杯時,對丹麥球員埃里克森的急救,被奉為教科書式救援。而杭州是全國最早布局AED的城市之一,也是國內(nèi)首個AED立法的城市?!栋l(fā)生萬一時,杭州救命的AED夠用嗎》快速對接杭州急救中心,對設(shè)備在杭州的分布、使用情況、志愿者配備、存在問題等進(jìn)行梳理,有科普,也有服務(wù)性。
對一些本地用戶關(guān)注的社會生活類選題,我們嘗試盡量通過數(shù)據(jù)梳理分析,從中找到一個大家普遍可能感興趣的話題去體現(xiàn)“用戶關(guān)注”。比如我們一口氣梳理了杭州截至2020年12月底85次共5000萬人次參與的車牌搖號數(shù)據(jù)(從2014年5月首次搖號開始),得出了搖車牌背后科學(xué)或玄學(xué)的結(jié)論:你搖了那么多次搖不到,隔壁老王為啥搖了幾次就中了;到底是什么影響了你的運氣;實在搖不到我該出多少錢競拍……兼容趣味性與實用性。
《隔壁老王為什么比我們先搖到車牌》
對用戶有用,即數(shù)據(jù)新聞的應(yīng)用,同樣是“服務(wù)公眾利益”的一個重要衡量方面。一個出色的數(shù)據(jù)新聞產(chǎn)品,同時也應(yīng)該成為用戶工具,能讓用戶在新聞應(yīng)用中發(fā)現(xiàn)自己的故事,或者找到與他們最相關(guān)的資訊。首屆Sigma數(shù)據(jù)新聞獎中,就設(shè)有“最佳新聞應(yīng)用獎”。但在實際操作中,限于數(shù)據(jù)獲取及技術(shù)處理難題,數(shù)據(jù)新聞產(chǎn)品的應(yīng)用還很難做到,所以我們嘗試通過線下互動去彌補(bǔ)應(yīng)用的不足?!陡改浮袄^承”你的手機(jī)之后,都在干什么》關(guān)注了中老年人的數(shù)字鴻溝,我們通過對一定年齡段手機(jī)用戶的畫像和應(yīng)用偏好值,來觀察生活在杭州這座“智慧之城”里的老人們的數(shù)字生活。報道發(fā)布后,我們又聯(lián)合浙江省圖書館發(fā)起教老年人使用智能手機(jī)的公益活動,通過這種信息+服務(wù)的方式,疊加線下活動,體現(xiàn)“陪伴型”媒體的人文關(guān)懷和社會責(zé)任。
數(shù)據(jù)新聞是“數(shù)據(jù)驅(qū)動的報道”,開放的數(shù)據(jù)是數(shù)據(jù)新聞的核心驅(qū)動力和基本要素??梢哉f,大數(shù)據(jù)讓我們能以一種前所未有的可量化的維度,去探究事件背后的某種關(guān)聯(lián)。我們通過把文本、視頻、音頻等資料數(shù)據(jù)化、結(jié)構(gòu)化、知識化處理,探索有意義的數(shù)據(jù)聯(lián)系,從中挖掘新聞報道,將孤立的“新聞事件”擴(kuò)展為“情景報道”,從用文字講故事到用數(shù)據(jù)講故事。它的獨特之處在于,你把數(shù)據(jù)放一起后,會找到一些規(guī)律或異常,可以提供現(xiàn)場采訪看不到的角度。
實踐中最典型的一則數(shù)據(jù)新聞,是2010年10月23日英國《衛(wèi)報》刊登的伊拉克戰(zhàn)爭日志。這是一幅借用谷歌地圖提供的免費軟件制作的點圖,39.1萬條數(shù)據(jù)來自維基解密。它將伊拉克戰(zhàn)爭中所有人員傷亡情況均標(biāo)注于地圖,地圖上一個紅點就代表一次傷亡事件,點開紅點就是這次傷亡事件的基本新聞要素。沒有多余的文字,點圖上密布的紅點卻顯得格外觸目驚心。在這里,數(shù)據(jù)就是真相,數(shù)據(jù)就是新聞。
什么樣的數(shù)據(jù)資源能夠幫助我們更靠近上述目標(biāo)?如何在紛繁復(fù)雜的數(shù)據(jù)中挖掘,篩選出有價值、有意義的信息?實際操作中,我們獲取數(shù)據(jù)的途徑主要有以下幾種:
1.政府及相關(guān)組織公開數(shù)據(jù):政務(wù)網(wǎng)站、政府工作報告、規(guī)劃等。目前國家、省級和市級的一些開放數(shù)據(jù)平臺基本上都能找到每一年的相關(guān)數(shù)據(jù)。
2.高校、智庫、學(xué)術(shù)刊物、行業(yè)協(xié)會的發(fā)布,或第三方機(jī)構(gòu)發(fā)布的數(shù)據(jù),但很多都不公開或者需要有償獲?。?/p>
3.基于權(quán)威媒體公開報道的梳理,包括歷年來本報報道的相關(guān)數(shù)據(jù)梳理與分析;
4.現(xiàn)在很多商業(yè)公司、互聯(lián)網(wǎng)平臺掌握著大量與公眾生活相關(guān)的數(shù)據(jù),例如出行、消費等,在評估公益性、權(quán)威性、科學(xué)性等維度下,我們會主動尋求這方面的資源支持與合作;
5.自主采集,通過編程用計算機(jī)語言來爬出想要的互聯(lián)網(wǎng)數(shù)據(jù),但這一方法具有時間、金錢成本和技術(shù)門檻的限制,需要專業(yè)技術(shù)人員才能實現(xiàn)。
數(shù)據(jù)新聞的核心是對大數(shù)據(jù)的處理運用?!缎l(wèi)報》的伊拉克戰(zhàn)爭日志新聞中,涉及數(shù)據(jù)量多達(dá)39.1萬條。就小時新聞數(shù)據(jù)實驗室近一年的嘗試來看,在數(shù)據(jù)獲取上,數(shù)據(jù)來源單一、分布不均衡,數(shù)據(jù)開放程度有限等問題是數(shù)據(jù)新聞生產(chǎn)的主要障礙之一。作為重要數(shù)據(jù)源的政府部門提供的數(shù)據(jù)存在一定滯后性,媒體想要進(jìn)一步掌握更為詳實、個性化的數(shù)據(jù)較難。而一些機(jī)構(gòu)提供的數(shù)據(jù)以及受眾參與調(diào)查的數(shù)據(jù)有時不夠客觀全面,運用到報道中會造成數(shù)據(jù)分析結(jié)果的偏差。所以在實踐中,經(jīng)常是多種渠道、手段組合在一起。
比如《隔壁老王為什么比我們先搖到車牌》,我們梳理了杭州實施小客車搖號以來共85次搖號結(jié)果。車管所官網(wǎng)會發(fā)布每月小客車牌照的申請審核結(jié)果和搖號結(jié)果,但是不提供下載,所以需要用爬蟲程序來抓取數(shù)據(jù)并結(jié)構(gòu)化。
我們也會和一些平臺合作。比如今年的世界睡眠日的稿子——《你的手機(jī)正在暴露你的睡眠秘密》,我們就是和“個推”合作,通過手機(jī)用戶的位置和應(yīng)用偏好值來觀察杭州“睡不著”人群。
《你的手機(jī)正在暴露你的睡眠秘密》
數(shù)據(jù)新聞中的數(shù)據(jù)也不只局限在統(tǒng)計數(shù)據(jù),純文本的內(nèi)容,或是空間數(shù)據(jù),在數(shù)據(jù)新聞產(chǎn)品的制作中也會經(jīng)常被用到。比如近期我們和復(fù)旦大學(xué)新聞學(xué)院合作的《從2944首宋詩里,找尋桂花樹下同樣的打開方式》,就是對《全宋詩(詞)》收錄的29萬首詩詞進(jìn)行文本分析,找出桂花詩和賞桂相關(guān)的生活場景。
從國內(nèi)外數(shù)據(jù)新聞獲獎作品來看,數(shù)據(jù)開放程度不同,獲得公開數(shù)據(jù)難易程度不同,也決定了衡量數(shù)據(jù)指標(biāo)時側(cè)重點的不一樣。相比而言,Sigma數(shù)據(jù)新聞獎更強(qiáng)調(diào)技術(shù)如何助力數(shù)據(jù)開放,為了鼓勵數(shù)據(jù)開放與共享,首屆Sigma數(shù)據(jù)新聞獎專設(shè)了“數(shù)據(jù)開放獎”,中國數(shù)據(jù)內(nèi)容大賽則更強(qiáng)調(diào)技術(shù)運用助力既有信息的梳理、描述和視覺呈現(xiàn)。
《從2944首宋詩里,找尋桂花樹下同樣的打開方式》
事實確實如此。由于實際操作中大數(shù)據(jù)獲取的難度,我們更多時候只能基于“小數(shù)據(jù)”的梳理分析來達(dá)到目的,比如通過統(tǒng)計、抽樣調(diào)查、實驗等傳統(tǒng)手段方法獲取樣本數(shù)據(jù)。
雖然數(shù)據(jù)新聞并不等同于新聞可視化,但實踐中,大多數(shù)據(jù)新聞以可視化為主要呈現(xiàn)方式,即把數(shù)據(jù)放入一定的情境中進(jìn)行展示,從而體現(xiàn)易讀性、直觀性、交互性和沉浸性。可視化呈現(xiàn)包括可視化數(shù)據(jù)圖、互動圖表和網(wǎng)絡(luò)在線演示等。
在我們的既定印象中,數(shù)據(jù)往往是枯燥的,是令人畏懼的,身邊大多數(shù)文科出身的小伙伴都說“看到一堆數(shù)據(jù)就頭疼”。即便已經(jīng)從挖掘到的紛繁數(shù)據(jù)里,清理出有價值、有意義的數(shù)字,它依然是冰冷的。
數(shù)據(jù)可視化有助于將枯燥的數(shù)據(jù)信息以及錯綜的關(guān)系鏈以形象、生動、簡單的方式呈現(xiàn),增強(qiáng)用戶交互式、沉浸式閱讀體驗。不論是Sigma數(shù)據(jù)新聞獎還是中國數(shù)據(jù)內(nèi)容大賽,都非常注重可視化的呈現(xiàn)。2020年Sigma數(shù)據(jù)新聞獎的“最佳數(shù)據(jù)可視化報道榮譽(yù)獎”頒給了一則關(guān)于“為什么你的智能手機(jī)導(dǎo)致你的‘短信脖子’”的作品。2020年中國數(shù)據(jù)內(nèi)容大賽的“最佳移動交互設(shè)計”獎則頒給了澎湃新聞《東京奧運會前,我們讓所有奧運冠軍一起PK了一把》。前者在易讀性和直觀性上有很好的體現(xiàn),后者的可視化效果和沉浸式體驗很吸引用戶。
2020年中國數(shù)據(jù)內(nèi)容大賽的“最佳移動交互設(shè)計”獎
如何把單調(diào)的數(shù)據(jù)做出想象力?我們在數(shù)據(jù)可視化上也做了一些嘗試,希望在清楚展現(xiàn)數(shù)據(jù)的同時,加入設(shè)計與美學(xué)的體驗,讓枯燥乏味的數(shù)字和解釋變得生動起來。
比如加入動態(tài)圖。動態(tài)圖示相對而言更加生動,能更直接展現(xiàn)變化和縱深感?!陡r視頻穿越時光,去看看杭州一路走來的樣子》這個作品,我們讓直方圖隨著時間變化,讀者可以很明顯地看到杭州的行政區(qū)劃在72年間的變化,也可以很明顯地看到“擁江發(fā)展”的推進(jìn)。
動畫視頻也是一種有效嘗試。今年7月的鄭州大雨,大家都知道雨很大,但從數(shù)字上看,幾百毫米的降雨量沒有感性認(rèn)識,所以我們換了一個浙江人民都熟悉的量詞來類比——西湖——一個城市,1個小時里倒進(jìn)103個西湖,讀者就有了直觀的感受。在此基礎(chǔ)上,我們把這個類比做成動態(tài)數(shù)據(jù)圖示,結(jié)合現(xiàn)場畫面混剪、配音,生動易懂。
傳播形態(tài)的互動化、可視化已經(jīng)成為數(shù)據(jù)新聞的發(fā)展趨勢。如上提到的圖表、動畫、H5等不同呈現(xiàn)形態(tài)的數(shù)據(jù)可視化產(chǎn)品,其適合的內(nèi)容和傳播途徑都不一樣,但它們都必須服務(wù)于簡明敘事的需要,不能為了數(shù)據(jù)而數(shù)據(jù),為了設(shè)計而設(shè)計。但實踐中,數(shù)據(jù)新聞的可視化呈現(xiàn)仍以靜態(tài)的圖表和圖形化處理為主,交互程度較低,視覺元素和交互設(shè)計的多樣化還不夠,難以有效引發(fā)閱讀興趣。
作為一種跨學(xué)科、跨領(lǐng)域的融合報道形式,數(shù)據(jù)新聞以其話題關(guān)切、數(shù)據(jù)驅(qū)動、創(chuàng)意呈現(xiàn),豐富了融合報道的產(chǎn)品形態(tài),催生了媒體融合變革機(jī)制的內(nèi)驅(qū)力,有助于推動媒體融合縱深發(fā)展,但它同時也對新聞從業(yè)者提出了更高的要求。一方面,我們很少能找到現(xiàn)成可遵循的標(biāo)準(zhǔn)和經(jīng)驗,只能在不斷變化中摸索——數(shù)據(jù)開放、技術(shù)加持,以及流程再造、體制機(jī)制的創(chuàng)新。另一方面,數(shù)據(jù)新聞短期內(nèi)難以找到市場化應(yīng)用的路徑,很多時候只能作為一種純新聞產(chǎn)品生產(chǎn),在市場化的壓力下,尤其需要媒體有潛心做內(nèi)容的定力和遠(yuǎn)見去支撐。
團(tuán)隊組建上,數(shù)據(jù)新聞團(tuán)隊需要技術(shù)、設(shè)計、采編等不同知識背景人員的結(jié)合,向更多元的媒體形態(tài)拓展。因此,必須打破傳統(tǒng)新聞生產(chǎn)中的部門限制,再造采編流程,把技術(shù)和設(shè)計嵌入采編團(tuán)隊,組建包括設(shè)計、技術(shù)和傳統(tǒng)采編人員在內(nèi)的數(shù)據(jù)新聞團(tuán)隊,進(jìn)行融合新聞生產(chǎn)。
5G時代,技術(shù)引領(lǐng)。近一年來的實踐表明,基于傳統(tǒng)媒體轉(zhuǎn)型過來的媒體平臺,由于技術(shù)人才、技術(shù)積累等“先天不足”,在技術(shù)工具的運用、技術(shù)支撐數(shù)據(jù)處理等方面,存在亟待補(bǔ)足的短板,難以做到真正的“數(shù)據(jù)驅(qū)動新聞”,離真正意義上的“數(shù)據(jù)驅(qū)動媒體”更是任重道遠(yuǎn)。
在這之前,破題可以先從向外借力尋求合作開始。目前很多高校的新聞學(xué)院都開設(shè)了“數(shù)據(jù)挖掘與可視化”的相關(guān)課程,具有科技與技術(shù)牽引的先天條件,更具有數(shù)據(jù)分析能力。而媒體為創(chuàng)作者提供平臺的同時,也能幫助他們進(jìn)行社會轉(zhuǎn)化。今年以來,小時新聞數(shù)據(jù)實驗室就和復(fù)旦大學(xué)、浙江大學(xué)兩所高校先后進(jìn)行了合作,結(jié)合高校產(chǎn)研理論優(yōu)勢和新聞媒體專業(yè)優(yōu)勢進(jìn)行數(shù)據(jù)新聞產(chǎn)品合作?!稄?944首宋詩里,找尋桂花樹下同樣的打開方式》就是“有個數(shù)”和復(fù)旦大學(xué)“復(fù)數(shù)實驗室”的合作產(chǎn)品。
此外,如何加強(qiáng)數(shù)據(jù)新聞產(chǎn)品傳播的大流量和效應(yīng)?如何加強(qiáng)數(shù)據(jù)新聞的市場化應(yīng)用,通過“數(shù)據(jù)說話”為垂直領(lǐng)域的經(jīng)營需求疊加核心競爭力?如何破題社會資本對數(shù)據(jù)可視化產(chǎn)品的投入與開發(fā)?等等,這些都是下一階段必須厘清的問題。