唐 錚,李開宇
(1.中國人民大學 新聞學院,北京100872;2.清華大學 計算機系,北京100091)
媒體融合帶來了新聞內容生產的組織機制重構,將新聞生產者大量轉化為全媒體生產者,由此促進了新聞生產力的提升。而隨著融合背景下的媒體日漸增加且內容產品日益豐富,如何對新機構下的新內容產品進行效能評估便成為擺在眼前的迫切問題。既有的媒體效能評估大多基于單一媒介類型的單一新聞產品,并長期處在隨機性和任意性較強的狀態(tài)下,難以適應媒體融合下內容生產力改造后的實際需求。本研究力求從大數據角度出發(fā),基于媒體運行的真實數據,將新聞從生產者的特性進行量化建模,從“人力—產出”的角度為這一實際困境提出或可實踐的解決方案。
融合格局下,傳統(tǒng)媒體在宣傳理念、新聞生產模式、傳播技術、載體更新等各方面實施組織重構和業(yè)務再造。在這一過程中,新聞工作者逐漸告別新聞常規(guī),即日常完成新聞工作的一系列模式化的、常規(guī)的、重復的實踐和形式(1)Shoemaker,P.J.,Reese,S.D. ,“Mediating the message”.London:White Plains Longman.1996,p105.,新聞生產也隨之進入“一次采集、多次生成”的融合生產模式。
融合型記者成為大勢所趨,單個新聞工作者常常肩負著同時生產不同體裁、不同形式新聞作品的任務。在這一過程中,有新聞工作者成長為全媒體生產者的自我提升,也有組織調整例如搭建“中央廚房”的結構性助力。以上融合機制重構均以媒體能夠持續(xù)地產出高質量、跨媒體形態(tài)的融合性內容產品為目標。隨著內容生產者的素質提升、內容生產平臺的科學化以及一些更為先進的內容管理系統(tǒng)的引入,新聞生產的單位時間越來越短。尼格倫(Nygren)在2009 年的調查表明,傳統(tǒng)媒體的記者一天可以制作2 到3 條新聞,但在網絡媒體工作的記者效率最高的可以達到一天5 到10 條(2)Preston.P,“Making the news:Journalism and news cultures in Europe”,New York:Routledge,2009,p.66.。
新聞內容作為高流動性的信息綜合體,其生產過程高度機動而不可控,在生產中需要包含結構化的經驗,獨到見解,對經驗的反思以及有價值的、整合的相關信息(3)Davenport,T.H.,Prusak,L.“Working knowledge:How org-anization manage what they know”,Boston:Harvard Bus-iness School Press,1998,p.108.,完成創(chuàng)造性工作是新聞從業(yè)者的核心價值所在。正因其顯著的創(chuàng)造性、靈活性和機動性,此前包括媒體在內的內容生產機構一直無法針對新聞內容生產設立精準的效能評估方法。傳統(tǒng)媒體的內容生產機制和考核標準,是以專業(yè)機構持續(xù)穩(wěn)定地生產單一屬性的新聞產品為前提,內核是沿用“信息收集—把關人篩選—分發(fā)”的機制模式,效能衡量體系也相應地為原有載體服務,采用工作量統(tǒng)計和打分評估等手段,對于新聞生產者進行評價。
目前媒體使用較為廣泛的新聞生產效能評估方式主要有以下幾種:(:(1)完全按量評價;(;(2)完全按質評價;(;(3)質、量結合評價。這三種主流衡量方式分別對應知識組織效能評估的三種主流視角,即行為視角、效果視角和能力視角。
行為視角下的效能被定義為“一套與組織或個體所工作的組織單位的目標相關的行為”(4)Murphy G.“Human Resource Management”,NewYork:Internantional Journal of Project Management,1993,pp.3-12.。在行為論視角下,行為被視為效能的最核心體現。使用這種方式的媒體效能評估單純以新聞發(fā)布數量(條數、字數、時長等)為衡量指標。
基于效果視角,特別是以實踐為導向的效能評價體系中,大多將績效理解為結果。BerMrdin 將績效定義為“在特定的時間內,由特定的工作職能或活動產生的產出紀錄,工作績效的總和相當于關鍵和必要工作職能中績效的總和(或平均值)”(5)理查德·威廉姆斯:《業(yè)績管理》,趙政斌譯,大連:東北財經大學出版社,1999 年版,第81 頁。。使用這種方式的媒體效能評估單純以新聞發(fā)布質量(版面位置、時段、社會評價)為衡量指標。
而McBer 咨詢公司和Spencer 倡導從能力角度衡量效能,認為基于能力的判斷是“向前看”的績效管理方式(6)French W.“Human resource management”.Boston:Hongton Miffin Company.1990,Chapter20.,這一觀點將效能進行了更為立體化的解構,將其對應為與組織戰(zhàn)略目標、用戶滿意感及投資相關的過程與結果的綜合體。使用這種方式的媒體效能評估既計算新聞產品的發(fā)布數量,同時通過打分、定級等方式界定質量,再計算綜合指標得到最終結果。
然而,以上三種方式在媒體融合背景下都出現了障礙,無法有效地界定內容生產的效能?!靶Ч暯恰弊⒅睾饬磕繕伺c結果,但融媒體新聞生產工作是創(chuàng)造性的、獨特的、機動的,幾乎不可能在內容生產前就清晰明確地做出結果定義。目標只能是在進行中不斷調整、修正和明確。因而,僅僅以效果為導向有明顯的不足之處?!靶袨橐暯恰卑研侣勆a者的作品數量作為重點衡量目標,這與新聞生產者的熟練程度、努力程度和資源駕馭能力直接相關,但完成創(chuàng)造性工作是新聞從業(yè)者的核心價值所在,單純以數量定江山,是對新聞生產的簡單化和庸俗化。而在新聞生產中,生產者的能力、潛力往往難以從其工作的過程或工作表現中體現出來,特別是在媒體融合時代,“中央廚房”式的集約化社會化生產日成主流,一則新聞產品往往由整個團隊甚至由外部支援來支撐,所以“能力視角”也難以完成對新聞內容生產效能的準確評估。
以上分析證明,目前傳統(tǒng)媒體內部在融合背景下尚未形成一種有效的績效評價管理機制,難以配合媒體深度融合轉型發(fā)展戰(zhàn)略目標的實現。
大數據技術的完善和媒體融合的不斷推進,給效能評估的進一步量化提供了可能。移動媒體時代,新聞信息從生產、發(fā)布、反饋等各環(huán)節(jié)的效果都是可定量化分析的。根據后臺數據,媒體不但可以監(jiān)測到新聞內容的點擊率、瀏覽量、轉載率、評論情況、情感極性(7)Alexandra Balahur, Hristo Tanev:“Detecting Event-Related Links and Sentiments from Social Media Texts”,Sofia, Bulgaria: ACL (Conference System Demonstrations)2013:pp.25-30.,從而了解讀者閱讀偏好,把握報道節(jié)奏,策劃報道內容,也能夠將大數據應用于媒介組織架構和效能評估,使得新聞生產者和媒體組織之間通過更科學的評價體系,建立互信、支持和協(xié)作的“雙向依賴”關系。
建立科學而全面的效能評估體系是一個長期而綜合的過程,需要大量數據支撐。本研究旨在使用定量方式,基于媒體真實運行數據的推演,將上海某媒體的真實內容生產及人力運轉數據用于構建模型,將真實數據代入模型進行“空轉”,這一設計參考了我國在重慶、上海進行的“房地產稅空轉”體系實踐,以及借鑒了人民日報“中央廚房”從無到有的機制搭建經驗。把真實的數據帶入到仿真體系中加以驗證,能夠從一定程度上看到效能模型在媒體現有體系下運行時的真實狀況,進而提出媒介融合背景下媒體調整和改進效能評估機制的新模式。
基于既往數據的相對缺乏和內容生產的機動性,構建這個初級模型時暫且排除了其他更為復雜的變量,而只是以“人力—產出”的邏輯來推導內容生產的效能最優(yōu)。
這一模型基于下述邏輯:如果將新聞生產視為人的創(chuàng)意性生產,那么,新聞產出與人力(包括時間、精力、創(chuàng)意性生產的工作狀態(tài)等)直接相關,而這種相關性可以用具體的具有可解釋性的模型來描述。同時,假設新聞生產的數量在非重大影響(例如重大自然災害、重大突發(fā)新聞等)的情況下,在一定程度上是存在周期性的。也就是說,持續(xù)增加的工作時間并不能使得新聞產量無限量擴張,新聞產量在受到人力限制的同時還會受到新聞資源的限制。另外,新聞工作者一旦不眠不休地進行新聞生產的話,會因為創(chuàng)造力下降而影響新聞的產量。因此對于實際新聞生產而言,通過建立模型來找到關鍵性節(jié)點,以便確定生產效能,是有意義的。
因而,模型以真實新聞生產量為基礎參考值,以生產周期為變量,可以得出現階段新聞內容生產力下的呈理想化狀態(tài)的新聞產量。進而在工作人數不變的前提下,可以獲知實際新聞生產量和理想化產量之間的邏輯關系,由此為制定科學的新聞效能產出提供依據。
于2014 年提速建設的媒體融合改革為研究提供了可靠的數據源。自2014 年媒體融合全面提速以來,新聞生產的硬件配置及軟件配備全面升級,全面的數字化和線上化成為各個媒體在融合時的必要項。本研究所采集的數據,便源自上海某媒體近年來的相關真實數據:
1.使用線上簽到工具,統(tǒng)計記者的日均工時和年均工作日。這部分數據能夠提供該媒體從事新聞生產的人員的準確數量,并提供他們的工作時長。
2.使用多媒體處理系統(tǒng),統(tǒng)計新聞產品的生產周期。這部分數據來自于媒體的數字化處理系統(tǒng)。按照媒體的要求,所有內容產品都要在該媒體的多媒體數字化處理系統(tǒng)上上傳并簽發(fā),通過“大花臉”功能記錄全部流程。由此可以記錄新聞作品從入庫提交、修改、簽發(fā)的全過程中每個節(jié)點的時間,從而得知新聞作品的生產時長。
3.該媒體2017 年8 月3 日至2019 年12 月31 日的每月新聞生產量。這部分數據來自于數字化處理系統(tǒng)的后臺統(tǒng)計功能。根據這一功能,能夠準確列出該媒體在此期間的每日新聞生產量,并根據需求進行相應的分類和歸并。
根據該媒體的大數據記錄進行清洗和梳理后,得出的數據如下:
1.根據媒體稿件入庫記錄,獲得該媒體2017 年8 月3 日至2019 年12 月31 日共881 天的數據。
2.根據線上簽到工具上的數據記錄,該媒體共有新聞生產者126 人,平均工作時長為9.7 小時(法定工作時長8 小時),年平均工作日為304.3 天(2018 年法定工作日為252 天,2019 年法定工作日為250 天)。
3.根據多媒體處理系統(tǒng)上的數據記錄,2017 年8 月3 日至2019 年12 月31 日該媒體共計生產新聞作品40 673 件,分為文字稿件、圖片稿件和音視頻稿件三類,并得到這三類稿件在2017 年8 月至2019 年12月的每天的新聞產量。
4.通過新聞編輯文稿系統(tǒng)修改功能,能夠記錄每篇稿件的入庫、修改過程、簽發(fā)過程等每一步驟的時間。在媒體融合進程中,多數媒體已經實現了這一功能的實現及運用。這一功能被媒體俗稱“大花臉”功能,可以被用來界定每篇新聞的生產周期長度。根據“大花臉”功能,對以上三類新聞的生產周期進行統(tǒng)計,取平均數±5%的區(qū)間,得到如下結果:文字稿件的生產周期為4.9~25.7 小時,圖片稿件的生產周期為2.4~4.5小時,音視頻稿件的生產周期為14.3~48.9 小時。
繼而,基于數據清洗技術(8)Xu Chu, Ihab F. Ilyas, Sanjay Krishnan, Jiannan Wang:“Data Cleaning: Overview and Emerging Challenges”, San Francisco:SIGMOD Confer?ence ,2016,pp.2201-2206.對數據的空值與非法值進行了清洗與修正,使得數據的取值在合理的范圍內,之后在底層使用MongoDB 作為基本的數據管理引擎。
建模過程中引入人工智能領域的前沿技術——神經網絡技術,從既有的數據當中通過機器學習算法,得出規(guī)律,繼而通過數學模型來描述人力與產出之間的關系。神經網絡技術模擬人腦的神經元結構,通過構造多層次的網絡結構,來表征數據特征(輸入)與因變量(輸出)之間的關系(9)Lecun Y,Bengio Y,Hinton G,“Deep Learning”,No.521(7553),Nature,2015,p.436.。
舉例來講,如果想要知道一處房產的屬性與房價之間的關系,可以將屬性X(建筑面積、使用面積、城市、地段、樓層、朝向和是否有電梯等)作為自變量,而將房屋的價格Y 作為因變量。假設因變量和自變量之間存在某種關系滿足Y=f(X),當今后給定一個新的房屋的基本屬性值時,便可以預測該房屋的房價。機器學習中的回歸問題(10)Ripley,Brian D,“Pattern Recognition and Neural Networks”.Cambridge:Cambridge University Pess,2009,pp.97-118.,也就是如何在給定一部分真實數據情況下(同時包含因變量與自變量),去尋找一個最可能真實的模型f。而深度學習理論假設函數f是由一個網狀的神經元結構組成的,以自變量作為第0層,網狀結構的每一層會對上一層的輸入進行一次非線性的變換,從而計算出最終的結果。
本文將基于以上理論和數據,尋找合適的自變量表達方式,去對媒體內容生產者工時投入進行量化。同時尋找合適的網絡模型參數,通過機器學習算法確定一個最為合理的模型,從而建模出生產者工時與產出模型,用于完成媒體產出效益最優(yōu)化的預測。
本節(jié)著重研究這樣一個問題“給定一個媒體生產組織(例如,某上海媒體),已知其過往的具體工時X與真實產出數據Y,如何尋找模型f,可以近似描述工時與產出的關系,即“Y≈f(x)”。
模型的雛形出于最樸素的邏輯“人力—產出”,也就是說,無論媒體形態(tài)和最終產品發(fā)生了什么變化,現階段的新聞內容生產仍然基本全部依靠于人力,因此“新聞工作者的數量和產能——新聞內容產品”之間存在緊密的正相關性。而后一層層對問題進行具象化,不斷在機器學習的過程中加入各種參數和影響因素,最終得到可解釋性較高的“新聞發(fā)稿量預測模型”。
首先,建模中考慮一種簡單的映射關系,假設共有n個生產者(實際數據為126),定義每天的工作時長為X(小時)=[X1,X2......Xn],其中Xi表示第i個生產者本日的工作時長。相應的總產量為Y=[Y1,Y2,Y3],Y1,Y2,Y3分別表示文字稿件,圖片稿件和視頻稿件的產出。如果兩者之間存在簡單的映射關系,則可以表示為簡單的Y=f(X),即給定X即可通過其映射關系找到Y。
其中的函數f可以使用多種方式來表達,其中最簡潔的形式是使用線性模型進行回歸分析,擬合出X與Y的關系。本模型使用更復雜的方式,即深度神經網絡,給予足夠多的網絡層數,通過調參技巧學習出精確的模型參數。
在使用數據集訓練模型之前,需要先將整個數據集分為訓練集、驗證集和測試集。訓練集是用來訓練模型的,通過嘗試不同的方法和思路使用訓練集來訓練不同的模型,再通過驗證集使用交叉驗證來挑選最優(yōu)的模型,再通過不斷地迭代,來改善模型在驗證集上的性能,最后再通過測試集來評估模型的性能。數據集劃分得越好,模型的應用部署就越強,但如果劃分不好,則會大大影響模型的應用部署。在建模時,基于交叉驗證的準則(11)周志華:《機器學習》.北京:清華大學出版社2016 年版,第210-219 頁。將881 條數據進行切分,其中500 條用于訓練,100 條用作驗證集,其余281 條用于下一節(jié)進行最優(yōu)產出模型擬合。在這一過程中,使用損失函數來描述模型的精準程度,即真實數據與預測值之間的誤差。
理論上來講,隨著模型訓練的過程,參數將會越來越精準,相應的損失(LOSS)應該越來越小,然而,當下展示出的學習過程并沒有明顯使LOSS 變小,而當模型逐漸變得復雜,層數增多時,損失函數漸漸出現明顯變化。這說明模型選擇并不合理。應該進一步思考加入更為合理的系數,發(fā)掘更合理的模型。
結合實際情況則能夠發(fā)現:一個部門的實際工作產出不應該只取決于新聞工作者的工作時間,還應當取決于當前這一天的具體時間屬性。例如,這一天是周一還是周五對于新聞工作者來講是不同的,不僅他們的工作熱情不同,實際生活中,可供加工的新聞素材也可能不同。其次,要看這一個工作日是否是假日,是否是重大節(jié)日,這些信息都應當被編碼在輸入項X當中,因為是否是假日,個人工作熱情應當不同,是否是節(jié)日,可能產生的新聞數量與話題度就不同,例如,重大的節(jié)日一般會有許多活動和紀念儀式可供報道。其次,還需要考慮一年當中各個月份中由于季節(jié)性,會導致新聞內容的具體產出出現差異(包含陽歷、陰歷)。因此,應該基于這樣的考慮,增加時間屬性特征的系數。
因此在不考慮隨機擾動的情況下,額外編碼了上述五種信息,編碼規(guī)則如表1。
表1 基于時間屬性的編碼信息
在實際情況中,具體的新聞內容生產過程其實相當于一個時序序列,因此在考慮某一個時間點的產量時,不可忽略前面若干個時間點的產量,也就是說,7 月12 日的新聞生產量其實對于7 月13 日是有影響的,兩者并不是孤立的存在,其中存在時序關系。因此,應該基于這樣的考慮,增加基于時序關系特征的系數。
根據這個因素,設定為第i天,Yi的產量應當同時取決于Xi和Yi-1,Yi-2,......Y1兩個因素,由此得出的模型為:Yi=g(Xi|Yi-1,Yi-2,......Y1)。在實際中,為了簡化模型,同時為了使模型具有更高的合理性,通常認為當前狀態(tài)量只和前一狀態(tài)量有關,即滿足齊次馬爾科夫性(12)張波,張景肖:《應用隨機過程》,北京:清華大學出版社2004 年版,第28-59 頁。,這一性質使得模型的求解更為便利,同時,假如采取遞推的鏈式法則,第i- 1 個變量里面,實則已經包含了前i- 2 個變量的信息,因此,形如Yi=g(Xi|Yi-1)的形式對于求解參數更為方便。
經過數據工程方法處理,得到更全面的向量后,運用循環(huán)神經網絡(RNN)進行建模。這是一種經過實踐證明在處理時序序列時優(yōu)于隱馬爾科夫模型的一種方式。在經典的神經網絡模型中,隱藏層的值只取決于x輸入,然而在本例中,需要考慮到當前狀態(tài)可能不僅與當前輸入有關,還與上一狀態(tài)有關,因此其相應的結構應該表達如圖1 所示,其中y為實際產出,W 為相應的權重。最終計算得出的結果如圖2 所示。
圖1 循環(huán)神經網絡(RNN)示意圖
圖2 損失函數在模型訓練過程中的變化(越小代表性能越好):循環(huán)神經網絡
然而,目前的模型仍然包含兩個重要缺陷:(:(1)從模型可解釋性的角度,需要對于上述提出的方法進行進一步的改進,考慮到現實生活中,內容生產對于歷史數據應當是具有記憶性的,即假如去年的10 月1 日印象發(fā)稿量非常大,那么將可以判斷出今年10 月1 日的發(fā)稿量也會比較大。(2)模型進行學習的參數與前一階段的數據有關,在具體實現中,由于神經元個數過多,特別容易出現參數累計相乘后出現數值膨脹或萎縮的情況,導致數值不穩(wěn)定,出現所謂的“梯度爆炸”與“梯度消失”的情況,即當神經網絡很深時,梯度呈指數級增長,不穩(wěn)定的數值造成模型失當。梯度爆炸和梯度消失的問題在循環(huán)神經網絡中最為常見。
針對上述兩個問題,引入長短記憶神經網絡(LSTM)予以解決(13)Greff,Klaus,Srivastava,Rupesh Kumar,Koutník,Jan,etc,“LSTM:A Search Space Odyssey”,NewYork :IEEE Transactions on Neural Networks&Learning Systems,vol.28(10),2015,pp.2222-2232.。該網絡在1997 年被學者Hochreiter和Schmidhuber 引入,用于解決具有長依賴特性的時序數據建模。通過LSTM 可以對于有效的信息進行保留。從而解決對于模型輸出預測的長依賴問題。如果將預測結果的誤差求均值后作為偏差量,能夠得出結果如圖3。
圖3 損失函數在模型訓練過程中的變化:LSTM 模型
在LSTM 模型中,損失越小代表性能越好。從圖上可以看出,經過幾次調整,模型已經逐漸收斂,誤差值非常小。通過前期的參數調整與數據工程,這一模型在該數據集上可達到平均90%以上的準確率(Preci?sion)和召回率(Recall),據此可以使用這個模型去進一步預測新聞內容生產量及生產效能。
根據此前得出的模型,本節(jié)將解決這樣一個問題——“在假定人力不變的前提下,制定多少新聞內容生產數量時,效能是最優(yōu)的”。
由于單日的新聞內容產量具有較大隨機性,容易受到突發(fā)事件和各種偶然因素的干擾,因此在模型中把時間軸放寬至以月度為單位,依據上一節(jié)計算所得的模型,計算在未來一段時間內單月的新聞產量如何達到最優(yōu)效能。
首先,在假定工作總人數不變的前提下,根據模型預測出該媒體后281 天的內容生產產出數量,作為輸入值,并以真實的281 天數據作為輸出值,在模型中擬合出預期產出與真實產出之間的關系,并對這一擬合結果進行觀測和分析。這一擬合的實際意義在于:如果將預期產出理解為該媒體的管理者給新聞工作者下達的工作任務,那么根據預期產出對真實產出的影響就可以真切地觀測出,在人力不變的情況下,新聞內容生產將在何時出現變化節(jié)點,又將在何時達到最優(yōu)化的生產效能。因此,這一結果將有助于衡量真實的新聞工作,為媒體管理者在融媒體變化大勢下更科學準確地下達新聞生產任務提供重要的參考。
其次,在融合媒體背景下,全媒體記者成為必需,一則新聞內容通常會由單人進行采寫,隨后以文字、圖片或音視頻等不同的方式單一發(fā)布或結合多種形式融合發(fā)布。不同新聞內容所耗費時間不同,會導致新聞產出量的差異。根據該上海媒體的真實數據,文字稿件的生產周期為4.9~25.7 小時(平均時間15.3 小時),圖片稿件的生產周期為2.4~4.5 小時(平均3.45 小時),音視頻稿件的生產周期為14.3~48.9 小時(平均31.6小時)。在計算中,使用平均數對新聞產出總量進行量化。根據生產周期的平均時間計算,文字、圖片、音視頻的新聞生產時長比例約為30:7:63。音視頻新聞的生產時長是圖片新聞生產時長的7 倍。在假定人力不變的前提下,這三類新聞內容的總量必然符合恒定的總工時所能出產的新聞產量,且三類內容呈現此消彼長的關系。
第三,研究中使用的全部是真實數據,實際新聞內容產量是由該媒體的126 名在職新聞工作者完成的,因此,預期新聞產量仍以126 人作為基礎量,并在輸入數值時折算為126 人的工作總時長。
基于以上三點,以預期生產時間作為橫坐標,以實際產出作為縱坐標,進行擬合操作,擬合結果如圖4所示。
圖4 期望發(fā)稿量與真實發(fā)稿量模型預測
擬合結果得到了四個坐標節(jié)點,分別是(20 160,20 160)、(42 012,47 106)、(60 480,28 130)和(37 599,46 023)。這四個節(jié)點標記了新聞內容生產效能的變化。在(20 160,20 160)之前,新聞內容的預期產出和實際產出呈45°直線。在(20160,20160)和(42012,47106)之間,新聞內容的預期產出和實際產出呈上升拋物線,并在(42 012,47 106)這一坐標點上達到最高值。在(42 012,47 106)和(60 480,28 130)之間,新聞內容的預期產出和實際產出呈下降拋物線,并在(60480,28130)之后,呈水平直線。在拋物線左側(37599,46023)坐標點之前,導數值低于1,在此點之后導數值高于1。也就是說,(,(37599,46023)是拋物線與水平坐標軸的夾角呈45°的分界線。
由此,基于總工時則能夠計算出三種不同形式的新聞內容的生產量。由于總工時確定之下,三種不同形式的新聞內容產量是互相約束、此消彼長的,便可以描繪出三種稿件的生產占用時間的比例隨不同工作期望下的不同結果,如圖5 所示。
圖5 各類稿件占比隨月總工時的變化
根據圖5,隨著月度總工時的上升,文字類新聞的比例逐漸增加,音視頻類新聞的比例則呈現逐步減少的趨勢,圖片類新聞基本保持恒定。
通過使用上海某媒體600 天新聞生產的真實數據,長短記憶神經網絡(LSTM)模型計算后得到了對后續(xù)281 天新聞生產預期數據的推演,并與真實的281 天相比對,得到了期望發(fā)稿量與真實發(fā)稿量模型的預測結果。根據這一結果,可以得出以下結論:
(1)坐標點(20 160,20 160)約為126 名在職新聞工作者每天工作8 小時,每月工作20 天的總工作時長,與法定工作時間基本吻合。也就是說,在不需加班的情況下,真實新聞產量與預期呈現線性對應關系,所有預期的新聞產量都能夠被如期完成。而坐標點(60 480,28 130)為126 名在職新聞工作者每人每天工作16 小時,每月工作30 天,這一工作時長形成了超平面,是新聞生產者的工作負荷極限。當預期新聞產量所需的工作時長超過這一負荷極限后,無論再怎么增加預期,都不能帶來新聞真實產量的增長。這兩個坐標點成為了工作時長的下限和上限。
(2)根據擬合結果,最優(yōu)的預期新聞產量就是在預期總工時達到42 012 小時,即126 名在職新聞工作者大約每月工作時長約333 小時的時候,實際新聞產量可達到47 106 小時的效果,這一新聞產量也是實際內容生產總量的峰值。
(3)在(42 012,47 106)節(jié)點左側,拋物線呈上升狀態(tài),表明提高預期對于新聞效能有正向的促進作用。而當超過(42 012,47 106)這一節(jié)點,拋物線呈下降狀態(tài),表明繼續(xù)提高預期對于新聞工作者有負向的促進作用,真實新聞產量隨著預期目標的上升而緩慢增長。
(4)在拋物線左側,(,(37 599,46 023)坐標點之前的導數值高于1,在此點之后導數值低于1。這意味著,在(37 599,46 023)點之前,增加預期對新聞工作者的激勵作用比45°對角線的效率更高。這一節(jié)點,即126名在職新聞工作者大約每月工作時長約298 小時的時候,實際新聞產量可達到42 012 小時的效果。而在(37 599,46 023)至(42 012,47 106)這個區(qū)間內,即使真實發(fā)稿量仍能夠隨著期望發(fā)稿量呈現正向增長,但是其增益速度已經低于期望的增長速度。也就是說,如果在這一區(qū)間內再繼續(xù)給新聞工作者加壓,他們雖然還能根據預期目標增加新聞產量,但是已經顯示出力有不逮,難以繼續(xù)。
綜上,這一模型的擬合結論提供了一個全新的視角:按照既有的真實數據計算,126 名新聞工作者在法定工作時間內能夠完成所有預期任務,且呈現出工作量不飽和、積極性未被充分調動激發(fā)的狀況。在達到法定的工作時長并繼續(xù)調高預期目標后,擬合曲線呈現拋物線上升,這證明了適度的工作壓力反而能夠更加充分地調動和激發(fā)新聞工作者的工作積極性,達到更高的效能。然而,這種超出預期的實際工作量增長并不能長時間持續(xù),拋物線增長漸趨平緩,在到達(37 599,46 023)坐標點時角度小于45°,這表明新聞工作者在持續(xù)增加的預期目標壓力之下無法保持足夠的工作積極性,真實新聞產量逐漸放緩。進而,拋物線在到達頂峰后進一步下降。這是由于新聞業(yè)是一個創(chuàng)造性的工作,過高的預期產量會造成新聞工作者的過度焦慮、體力不濟等,反而會傷害新聞效能。最終,當工作壓力超出新聞工作者的能力,形成超平面,屆時預期新聞產量對于實際不起作用。
因此,根據擬合結果,管理者日常的最優(yōu)預期效能目標可以制定在拋物線起點至45°角的坐標點之間,即工作時長在每月20 160 小時到37 599 小時之間。當遇到重大新聞或者重要突發(fā)事件時,可短暫將最優(yōu)效能目標調高至拋物線45°角至頂點之間,即工作時長在每月37 599 小時和每月42 012 小時之間,但總工時42 012 小時是總工作量的極限峰值。
根據圖5 即各類稿件占比隨月總工時的變化圖可以觀察出,當工作時間的預期要求較短時,新聞生產者一般會保持一個合理的生產數量,三類新聞產出的比例比較均衡。而當預期任務要求過高時,生產者會為了追求更多的新聞產量,刻意選擇生產周期更短的新聞類型,即生產更多的文字稿件和圖片稿件,而減少視頻類稿件的產出,這從新聞內容生產上講是一種不健康的規(guī)劃方式。因此管理者應當制定適中的工作計劃,以期達到合理的生產比例。
本研究主要做出了兩個貢獻:首先,提出將媒體的生產特征量化的方式并使用真實數據進行建模。在量化的過程中同時考慮了某媒體的基本屬性和時序屬性,基于此,做出的模型可以預測每日的發(fā)稿數量。本文使用的方法可以對更為復雜場景下的異構數據生產進行預測,在基于更大的數據量與更多維的數據描述下,可以得到更為精準的模型。其次,根據模型擬合了預期投入與真實產出之間的關系,因此可以更為科學和準確地制定出新聞內容生產量的預期目標。如果在相應數據支持下,這一模型可以應用于類似于新聞生產的知識性生產環(huán)境,如著作、文章等,針對具體情況,給出期望情況下能獲得最高產出的產量預期。
本研究還存在以下幾點改進空間:
(1)在應用循環(huán)神經網絡進行產出預測時,需要提取更多的特征,來更加多維地建模描述一個媒體的生產能力。(2)目前的模型可以相對較準確地對單個新聞機構或知識生產型單位進行效能評估,但無法在更大的范圍內使用。未來可以對內容產出進行更加細化的分類,進一步精準測算各類產出之間的約束關系(相關系數),如規(guī)制、外界影響等,以期得到更好的預測結果。(3)目前的新聞生產效能模型主要基于“人力—產出”這一邏輯,而忽視了近年來越來越多的機器人寫作或其他智能化新聞生產方式,且新聞產出仍以傳統(tǒng)的文字、圖片、音視頻類作品為主。當新聞生產環(huán)境隨著科技發(fā)展而發(fā)生變化,或當AR、VR等實驗性新聞產品的比例增加時,本模型無法對于屆時的新聞生產效能做出評估。