基于用戶閱讀及相關行為的數據挖掘和開發(fā)是出版行業(yè)新的盈利增長點和核心競爭力之所在,只要出版集團給予其靈活的試錯機制,一定能給出版機構帶來新的業(yè)務領域和社會價值。
近來,大數據成為社會熱議,其技術特征成為人們津津樂道的話題,每個行業(yè)都在了解和評估其對自身的潛在影響。對于出版業(yè)來講,信息技術的沖擊已不陌生,十余年前開始就在探討數字化出版,這些年來從出版介質、出版內容、到出版流程都發(fā)生了很大變化。當新一代信息技術又在深刻影響社會時,我們關注的是,從數字化和數據化,到底有什么觀念性的變革?在認識大數據技術特點的同時,如何識別和研判出版業(yè)的可能性行動空間?
據國際數據公司(IDC)統(tǒng)計,僅2011年全球被創(chuàng)建和復制的數據量即達1.8ZB,相當于有史以來所有印刷材料數據量的近萬倍,而這樣龐大的數據量每兩年將翻一番。海量數據蘊涵著高昂價值。全球知名咨詢公司麥肯錫提出,“數據,已經滲透到當今每一個行業(yè)和業(yè)務職能領域,成為重要的生產因素。人們對海量數據的挖掘和運用,預示著新一波生產率增長和消費者盈余浪潮的到來”。
與大數據的增長形成對比的是,傳統(tǒng)媒介面臨的沖擊并沒有縮減趨勢。最近幾年,美國《洛基山新聞報》《舊金山紀事報》《芝加哥論壇報》《塔克森市民報》和《費城問詢報》等報紙先后破產或宣布破產;《基督教科學箴言報》和《西雅圖郵報》轉型為電子報;就連《華爾街日報》也出現(xiàn)變賣房地產緩解資金緊張狀況。中國廣告協(xié)會報刊分會、央視市場研究媒介智訊發(fā)布的《中國報紙廣告市場分析報告》中稱,2013年6月,報紙廣告降幅從1~5月的3.6%急劇擴大到6.1%,雖然還小于去年同期7.6%的降幅,但報紙廣告持續(xù)下降的趨勢、降幅進一步擴大的可能在加劇[1]。
而紙質圖書出版也不容樂觀,中國出版科學研究所公布的第5次“全國國民閱讀調查”顯示,2008年網絡閱讀首次超過了紙質閱讀。其中,紙質閱讀和網絡閱讀分別占閱讀總量的34.7%和36.5%。從近十年的情況來看,傳統(tǒng)的發(fā)行方式也備受挑戰(zhàn),書店業(yè)務不斷縮減。2003年的“全國國民閱讀調查”時我國讀者選書信息渠道占前三位的主要是讀者“自己逛書店、書攤、書市”,“報紙雜志上的書評與推薦”和“聽別人介紹”;如今網絡銷售早就成為圖書銷售的第一渠道,互聯(lián)網上的書評與推薦等數字信息的作用愈加顯著。
互聯(lián)網帶來的數據大爆炸已經持續(xù)了十幾年,信息不再是稀缺資源,而積累得越來越多的海量數據讓社會民眾對深加工、條理化乃至信息背后社會規(guī)律的需求也開始提升,紙質媒體的產品形態(tài)和傳播介質難以滿足民眾的信息消費需求,因此轉型是必然選擇。
一、資源聚合:大數據的規(guī)?;尸F(xiàn)
海量的平凡數據匯集起來的力量越來越受關注。大數據的核心在于對人類行為規(guī)律以及社會問題發(fā)展的預測,而預測系統(tǒng)之所以能夠成功,關鍵在于它們建立在海量數據基礎之上。大數據為人類生活創(chuàng)造了前所未有的可量化的維度,以前很多單純依靠人類經驗的判斷會被基于海量數據量化計算的預測替代。
大數據對出版業(yè)來說是一場脫胎換骨的產品形態(tài)和業(yè)務形態(tài)革命。報紙通常具有豐富的信息資源優(yōu)勢。長期以來,報紙累積了豐富的信息資料庫,是報紙的重要“不動產”,目前有一些行業(yè)報開始借助自身的信息和資源優(yōu)勢,通過對現(xiàn)有資源的深度挖掘,創(chuàng)新性地選擇開發(fā)新的稀缺內容成果,這可能成為未來行業(yè)報轉型的重要方向之一。
如行業(yè)報在多年的運作中,積累了多年來行業(yè)市場的變化數據,《中國黃金報》積累了精確到國內每個礦每月黃金生產量的數據,甚至還有不少國外的數據。這些連續(xù)的稀缺資源以往只堆積在報社內部,簡單作為寫作的參考,只需進一步深加工,就能對行業(yè)的發(fā)展情況得到第三方的客觀分析,發(fā)揮巨大的潛在價值。除此之外,報紙還積累了對歷時較長的某些重大事件走向、政策變遷的橫向信息積累和縱向信息梳理,這些都是大數據時代的“小分子”。
此外,在自身報道領域內的延伸數據的挖掘也可以給報社帶來新的效益,不少報紙針對自身的報道領域和輿情信息成立了數據挖掘部門,為行業(yè)提供參考。環(huán)球輿情調查中心是《環(huán)球時報》旗下專業(yè)從事輿情調查研究和咨詢服務的機構,通過對熱點事件的輿情監(jiān)測和調查,服務社會公共利益,透視中國社會主流訴求,并有效擴大媒體的影響力?!吨袊噲蟆纺壳耙呀浗⑵鹆藝壹壠嚠a業(yè)資訊、信息數據庫——“有數”平臺?!坝袛怠泵刻鞆陌▏鴥韧鈱I(yè)傳統(tǒng)媒體、門戶網站的汽車頻道、相關部委和汽車廠商的官方網站,以及新聞、論壇、博客在內的8000多個網站收集超過百萬次新聞資訊、帖子、博客等內容,進而從中搜索、發(fā)現(xiàn)、整合出汽車行業(yè)的“信息脈搏”,形成了自己的拳頭產品——中國汽車品牌排行榜,為行業(yè)和企業(yè)的進一步品牌塑造提供參考。
通過成立新型的數據挖掘部門,報紙的業(yè)務領域不斷拓展,報紙?zhí)峁┑男畔热莺头湛梢匝苌叫袠I(yè)相關的學術部門、政府部門、公關公司、甚至廣告商本身等方面,大大拓展了媒體信息服務的空間和盈利空間。
二、用戶挖掘:大數據的情境化開發(fā)
在圖書出版業(yè),對出版物印數、售價、庫存的預測更考驗著出版社對市場的把握能力。因此,讀者的“大數據”蘊藏著尚未被挖掘的巨大價值,行為數據可用于使得出版物更能吸引讀者,并為內容發(fā)行商帶來更大的利益,利用大數據進行精準營銷將會極大地提高出版企業(yè)的競爭能力。
在出版新業(yè)態(tài)中,原有產業(yè)鏈條上的印制環(huán)節(jié)大為削弱,設計環(huán)節(jié)愈發(fā)重要。最重要的新特點之一是互動性的增強,如何讓出版物更受歡迎?如何給出版物定價?如何預測銷售情況從而調整出版量和庫存情況?以往往往依賴于傳統(tǒng)的經驗,但在大數據時代,社會化媒體和電子閱讀習慣的逐漸普及使得基于社會網絡上諸如用戶行為記錄、用戶需求信息、用戶交易記錄、用戶評價信息、甚至閱讀強度等各類數據唾手可得。這些海量的數據都可以作為影響出版物內容走向的重要信息。通過這些信息,可以得到讀者對于出版內容的評價,如果能量化用戶對于書籍的閱讀題材、閱讀場所、閱讀時長、標注章節(jié)和重復瀏覽內容,大數據暢銷書生產會爆發(fā)出更強的生命力。
出版社已經開始運用這些數據。Coliloquy出版的電子書允許讀者自己設計人物角色和情節(jié)線索,經數據分析,讓作家調整故事迎合大眾口味[2]。出版《哈利·波特》小說的Scholastic出版社通過建立在線游戲,追蹤最吸引人的線索和角色,以此為構思基礎創(chuàng)作了《39條線索》系列小說,成為又一本全球暢銷書[3]。
我國也有出版機構已經開始重視對這些數據的搜集和挖掘,很多出版集團的網站都不僅僅只是新書發(fā)布的平臺,也承擔起了新書銷售的任務。新華文軒出版?zhèn)髅皆诖蛟熳约何能幘W上售書平臺的同時還打造了“九月網”數字推送平臺。網站對傳統(tǒng)紙質圖書進行數字化,深度加工成電子書,向廣大讀者提供了搜書、閱讀、互動分享、購買于一體的網絡服務平臺。用戶可以在直接在網站上對書籍先進行試讀,然后再決定是否購買電子書或者紙質圖書,同時擁有紙墨書香和電子版的便捷。用戶在購買或者免費獲得電子書以后,用戶能夠在線閱讀和下載到本地閱讀。而用戶在購書的同時,留下的各種數據可以被深加工作為出版物生產和銷售的依據。除官網之外,文軒網的平臺上還在外部和一些合作媒體,或者其他電商平臺開展合作以獲取數據。文軒通過搭建出版物協(xié)同供應平臺,與當當網、亞馬遜、京東、天貓等知名電商以及上千家網絡小說書店合作,目前已處理訂單80萬張,交易金額50億。
三、關系經濟:大數據的結構化經營
過去50年,《紐約時報》共產生了30億單詞,而現(xiàn)在Twitter每一天都產生80億單詞;人類每一天產生約15PB數據,是全美學術類圖書館圖書的8倍。自從2004年社交媒體出現(xiàn)之后,所有的情況都改變了。今天80%的數據都是非結構化的數據,并且這些數據都是個人行為的數據。
隨著社會化媒體的來臨,未來數據挖掘的核心業(yè)務除了傳統(tǒng)的具體量化數據,還有一類抽象數據——社會關系更值得關注:社會關系超過信息本身成為勾連起整個社會最為核心的資源。精確的具體數據一旦與社交媒體的關系數據相結合,對未來的預測會非常準。賓夕法尼亞州政府曾分析全州感冒藥品的銷量,對比系統(tǒng)保存的歷史數據,以確定可能發(fā)生的大面積流感。分析兒童的就癥率,對比歷史數據,以確定可能發(fā)生的大面積流感。同時州政府對Twitter進行文本分析,實時監(jiān)控各個地區(qū)的流感爆發(fā)、傳播、分布情況。
整合量化數據和關系數據對傳媒行業(yè)而言也有1+1>2的效果。據國外消息報道,路透社根據中國相關的新聞公開報道,建立了中國縣團級以上領導的工作關系和社會活動的數據庫資源,可以隨時對任何縣團級以上的官員之間的社會關系進行直觀化呈現(xiàn),這種對關系數據的挖掘和再生產能夠有效提高內容生產的效率和質量。
而對于出版業(yè)而言,除了在內容生產上的幫助,量化數據和關系數據的挖掘和整合還對出版物的發(fā)行和銷售有非常重要的意義。通過對用戶注冊信息、用戶行為記錄、用戶交易記錄、用戶評價信息等具體數據背后的關系進行整合,出版業(yè)能夠對出版物進行更高效的推送,方便讀者從海量的出版物中尋找到自己心儀的內容產品。對于出版業(yè)來說,關系挖掘和關系再生產成為挖掘的核心業(yè)務,在具體業(yè)務上可以表現(xiàn)為以下幾個方面:
第一是基于關系挖掘的內容服務。通過關系數據的挖掘,拓展內容生產的邊界,提高內容生產的質量;通過關系數據的挖掘,了解讀者的個性化需求,并為讀者提供更能滿足其需求的內容服務。
第二是基于關系挖掘的廣告服務。通過數據挖掘和呈現(xiàn)為廣告主服務,強調廣告即內容,通過社交興趣圖譜將內容推送給可能感興趣的用戶,激勵用戶分享創(chuàng)造口碑效應,還可以利用數據中心,對廣告效果進行評估,不斷優(yōu)化方案。
第三是基于關系挖掘的監(jiān)測服務??梢酝ㄟ^技術手段對客戶的數據挖掘和數據分析,掌握用戶的基本社會網絡及潛在需求;另外通過關系流監(jiān)測,可以向用戶提供一些實用化和個性化的收費信息,如向商務人士提供整合后的商界名人對經濟形勢深度分析等信息。
第四是關系挖掘的整合、嫁接服務。整合整個行業(yè)的數據,勾連產業(yè)鏈條不同環(huán)節(jié),使得所有數據匯合,在整個社會中創(chuàng)建有效利益分享機制,內容公司、廣告公司、數據公司、應用公司等構成有機的生態(tài)鏈和產業(yè)鏈。
出版業(yè)的數據挖掘雖然現(xiàn)在還處在探索階段,但未來的發(fā)展趨勢應該比較明確:出版業(yè)未來從事的是關系經濟(Ties economic),即基于社會關系之間的嵌入、維系、沉淀、連接、整合等一系列行為而產生的經濟效益和社會效益都可以成為關系經濟[4]?;谟脩糸喿x及相關行為的數據挖掘和開發(fā)是出版行業(yè)新的盈利增長點和核心競爭力之所在,只要給予其靈活的試錯機制,一定能給出版機構帶來新的業(yè)務領域和社會價值。
(作者單位:中國人民大學新聞學院)
參考文獻
[1] 晉雅芬. 報告稱上半年報紙廣告全方位衰退[N].中國新聞出版報,2013-07-31.
[2] Dennis Abrams. Coliloquy: Choosing Your Own Adventure 21st-Century Style, Publishing Perspectives. http://publishingperspectives.com/2012/10/coliloquy-choosing-your-own-adventure-21st-century-style.
[3] 圖書館和出版社如何迎接大數據時代?[N].中國出版?zhèn)髅缴虉螅?013-08-20.
[4] 李彪. 微博盈利模式之惑——以新浪微博為例[J].青年記者,2012(16):66-68.