大數(shù)據(jù)的迅猛發(fā)展雖然為華文出版的壯大提供了許多難能可貴的機(jī)遇和優(yōu)質(zhì)條件,但真正被出版及其他文化創(chuàng)意產(chǎn)業(yè)充分挖掘和利用起來的并不多,要成功獲得想要的大數(shù)據(jù)并得心應(yīng)手的應(yīng)用也并不容易。
對于終日與媒介和信息打交道的出版人來說,“大數(shù)據(jù)”顯然已不是一個陌生的詞匯。近年來,IBM、甲骨文、EMC、SAP等國際IT巨頭掀起針對數(shù)據(jù)管理及分析廠商的收購熱潮,總耗資超過400億美元;2012年1月,達(dá)沃斯世界經(jīng)濟(jì)論壇將大數(shù)據(jù)列為討論主題之一;2012年3月,奧巴馬政府發(fā)布“大數(shù)據(jù)發(fā)展計(jì)劃”,并稱其為“未來的新石油”;而幾乎同時,我國科技部在發(fā)布的“‘十二五’國家科技計(jì)劃信息技術(shù)領(lǐng)域2013年度備選項(xiàng)目征集指南”中把“大數(shù)據(jù)研究”列在了首位。大數(shù)據(jù)到底是什么,何以有這樣的威力?華文出版迎向這樣一個大數(shù)據(jù)時代,將面臨怎樣的機(jī)遇與挑戰(zhàn)?筆者經(jīng)過對業(yè)界的觀察和查閱大量資料,試做淺論。
一、何為“大數(shù)據(jù)”
依據(jù)麥肯錫的定義,大數(shù)據(jù)是指無法在一定時間內(nèi)用傳統(tǒng)數(shù)據(jù)庫軟件工具對其內(nèi)容進(jìn)行抓取、管理和處理的數(shù)據(jù)集合。它定義的就是大量的、多樣的、快速流動的信息。這是一個內(nèi)容極其龐大的集合,甚至可以說描述了時下人類活動和社會發(fā)展的基本軌跡。Mckinsey&Company發(fā)布的報告《大數(shù)據(jù):創(chuàng)新、競爭和生產(chǎn)力的下一個前沿》解釋說,大數(shù)據(jù)的興起源于數(shù)據(jù)生產(chǎn)和收集能力及速度的大幅提升。當(dāng)人、設(shè)備和傳感器通過數(shù)字網(wǎng)絡(luò)連接起來,產(chǎn)生、傳送、分享和訪問數(shù)據(jù)的能力也徹底變革。IBM將大數(shù)據(jù)的特點(diǎn)歸納為“4V”,即數(shù)據(jù)體量(Volumes)巨大、數(shù)據(jù)類別(Variety)繁多、價值(Value)密度低、處理速度(Velocity)快。人們迫不及待地?fù)肀Т髷?shù)據(jù),是因?yàn)檫@些數(shù)據(jù)經(jīng)過恰當(dāng)?shù)姆治鎏幚砜僧a(chǎn)生巨大價值。淘寶網(wǎng)每日新增的交易數(shù)據(jù)達(dá)10TB;eBay分析平臺日處理數(shù)據(jù)量高達(dá)100PB,超過了美國納斯達(dá)克交易所全天的數(shù)據(jù)處理量;亞馬遜每秒鐘處理72.9筆訂單。市場研究公司Gartner曾預(yù)計(jì):大數(shù)據(jù)2013年將直接或間接拉動全球960億美元的IT支出,2014年將達(dá)1200億美元,2016年達(dá)到2320億美元,2015年全球?qū)⑿略?40萬個IT崗位以支持大數(shù)據(jù)。IDC調(diào)查顯示,中國大數(shù)據(jù)市場未來5年將以51.4%的速度增長。
二、大數(shù)據(jù)助力華文出版實(shí)現(xiàn)共贏
1. 出版商與讀者的共贏
隨著時代的發(fā)展,當(dāng)下的讀者呈現(xiàn)出許多新的特征。作為閱讀和購買圖書的主力,當(dāng)下華文出版要更多的服務(wù)于80后、90后和00后。這些讀者是沒有歷史記憶的一代,過往許多文學(xué)作品中帶有的那種歷史沉重感,那些憤世嫉俗的,帶有強(qiáng)烈意識形態(tài)的內(nèi)容已無法讓他們產(chǎn)生強(qiáng)烈的共鳴。另外,這些在互聯(lián)網(wǎng)環(huán)境下成長起來的讀者,已漸漸變成了“smart buyer”(智能消費(fèi)者),他們可以獲知大量的信息,活躍度高,隨意性強(qiáng),不按傳統(tǒng)思路出牌。快節(jié)奏的社會生活和科技發(fā)展將隔代人之間的思維鴻溝不斷拉大,也拉動讀者的品位隨著潮流不斷變化,及時準(zhǔn)確地把握讀者需求似乎愈發(fā)變成一件比捕風(fēng)捉影還要困難的事。而大數(shù)據(jù)能做的,首先就是讓我們相對深入和客觀地了解這些“反傳統(tǒng)”的讀者。只要恰當(dāng)篩選分析,數(shù)據(jù)是不會說謊的。
博客、微博、各式移動終端等媒介產(chǎn)生的大數(shù)據(jù),正是流行風(fēng)尚、讀者特征、讀者興趣等信息最真實(shí)、最新鮮的反應(yīng)。如基于通訊錄的社交網(wǎng)絡(luò)就融合了個體信息消費(fèi)特點(diǎn)和群體互動性。它可以記錄用戶之間的關(guān)系、各自狀態(tài)、位置等,又讓用戶得以充分地互動和展示自我。相比傳統(tǒng)的決策方式,依托大數(shù)據(jù)得出的讀者需求、選題策劃、印數(shù)估算等不過分依賴個人經(jīng)驗(yàn),又可規(guī)范和易傳達(dá)工作方法和路徑,顯得有理有據(jù),客觀公正。當(dāng)當(dāng)網(wǎng)、亞馬遜、豆瓣等圖書銷售平臺的“購買了本書的人還看過” “推薦購買組合”等推薦購買信息,都是基于用戶瀏覽記錄等相關(guān)數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析而得出的結(jié)果,即“如果客戶購買了出版物A,那么,在x%的情況下,也可能購買出版物B”。
這種“if A than B”的數(shù)據(jù)分析邏輯還是相對簡易的淺層分析。數(shù)據(jù)挖掘和分析的方法還有很多,如社會網(wǎng)絡(luò)分析、聯(lián)系發(fā)現(xiàn)、數(shù)據(jù)流挖掘等。如借助網(wǎng)絡(luò)分析技術(shù),通過讀者購買行為的鏈接數(shù)據(jù)挖掘就能發(fā)現(xiàn)傳銷顧客網(wǎng)絡(luò),從而制定營銷策略找出利潤最大化的讀者群。又如從人際關(guān)系網(wǎng)絡(luò)節(jié)點(diǎn)的中心度來分析競爭對手,從而得出正確的競爭策略?;ヂ?lián)網(wǎng)是一個龐大而開放的大數(shù)據(jù)獲取平臺,它不但可以采集企業(yè)自身、競爭對手、供應(yīng)商等組織的網(wǎng)站信息及其網(wǎng)絡(luò)用戶的行為數(shù)據(jù),同時還能將企業(yè)內(nèi)部各個系統(tǒng)數(shù)據(jù)整合在一起,更為重要的是能將物聯(lián)網(wǎng)、移動網(wǎng)、人際關(guān)系網(wǎng)絡(luò)接連在一起,為數(shù)據(jù)的傳輸和共享提供條件。
通過對大數(shù)據(jù)進(jìn)行充分有效的挖掘分析,出版商可以及時發(fā)現(xiàn)讀者需求和優(yōu)質(zhì)的作者、作品資源,優(yōu)化圖書出版結(jié)構(gòu),分析競爭優(yōu)勢,最大限度地實(shí)現(xiàn)按需印刷,節(jié)約出版資源,提升出版企業(yè)的效益及綜合實(shí)力,出版更精美、更受讀者喜愛的圖書。而對于讀者來說,大數(shù)據(jù)不僅讓他們買到更優(yōu)質(zhì)的出版物,而且能更方便快捷的獲得自己想要的,有更舒適的購買和閱讀體驗(yàn)。再者,大數(shù)據(jù)其實(shí)有很高的精密度,可以較傳統(tǒng)數(shù)據(jù)更好地反映出讀者的差異性,甚至精細(xì)到每個讀者的個性化需求。這就讓那些“小眾”而有“長尾”的需求得以凸顯和被滿足。如此種種,無疑是出版商與讀者的共贏。
2. 出版商與運(yùn)營商的共贏
從前出版數(shù)據(jù)采集主體主要是出版企業(yè)自身和專業(yè)服務(wù)機(jī)構(gòu),兩者相互補(bǔ)充。其中企業(yè)內(nèi)部的數(shù)據(jù)大部分由企業(yè)自身采集,企業(yè)外部的數(shù)據(jù)除了企業(yè)自身采集一部分,大部分依賴外部的專業(yè)服務(wù)機(jī)構(gòu)來完成采集,包括宏觀環(huán)境、產(chǎn)業(yè)、競爭對手等的數(shù)據(jù),這些數(shù)據(jù)一般被少數(shù)幾個數(shù)據(jù)商或行業(yè)巨頭所掌握。在大數(shù)據(jù)時代,一方面大多數(shù)華文出版企業(yè)自身分析大量非線性數(shù)據(jù)的能力和支持設(shè)備都比較有限,一方面僅憑專業(yè)數(shù)據(jù)分析機(jī)構(gòu)提供的數(shù)據(jù)成本較高且無法及時有效的滿足企業(yè)需要。此時,另一個商業(yè)主體——電商平臺、移動設(shè)備、社交網(wǎng)絡(luò)平臺等的運(yùn)營商,就顯得格外搶眼。長期的網(wǎng)絡(luò)交易、用戶積累等,讓這些運(yùn)營商掌握了大量消費(fèi)者的數(shù)據(jù)信息。例如,阿里巴巴之所以能夠率先開啟所謂的“大數(shù)據(jù)營銷”,與其多年來對于數(shù)據(jù)收集和分析能力的重視是分不開的。大布局策略下,阿里巴巴利用淘寶網(wǎng)、天貓商城等平臺,積累了大量的客戶特性、資金使用狀況等信息,擁有了龐大的數(shù)據(jù)庫基底和數(shù)據(jù)處理能力。出版企業(yè)對于高質(zhì)量數(shù)據(jù)的需求催生了出版商與平臺運(yùn)營商的合作共贏。
首先,運(yùn)營商向出版商提供數(shù)據(jù)信息,乃至提供部分?jǐn)?shù)據(jù)分析處理服務(wù),是將閑置的數(shù)據(jù)價值最大化的過程,使數(shù)據(jù)的價值得以充分反饋出來,又服務(wù)于產(chǎn)品的生產(chǎn)者。運(yùn)營商可因此獲得部分收益,又可從合作中獲得啟示,發(fā)現(xiàn)現(xiàn)有數(shù)據(jù)的其他價值。同時,和出版商密切合作也可更清晰地對平臺上的海量數(shù)據(jù)進(jìn)行分類和價值評估,并依據(jù)數(shù)據(jù)分析結(jié)果不斷完善運(yùn)營平臺的結(jié)構(gòu)和內(nèi)容。
而出版商從運(yùn)營商處獲得數(shù)據(jù)或數(shù)據(jù)分析服務(wù),則可順利獲得大量最前沿的出版物市場數(shù)據(jù)信息,及時有效地分析出版熱點(diǎn)和盲點(diǎn),剖析讀者行為特點(diǎn),篩選目標(biāo)讀者,從而發(fā)現(xiàn)優(yōu)秀選題并完成精準(zhǔn)的讀者定位,實(shí)現(xiàn)精準(zhǔn)營銷。與專業(yè)分析機(jī)構(gòu)獲取的數(shù)據(jù)相比,這些數(shù)據(jù)內(nèi)容有交叉性,更豐富,時效性更強(qiáng)。而且許多數(shù)據(jù)雖看似雜亂,但實(shí)際已經(jīng)平臺結(jié)構(gòu)設(shè)置的引導(dǎo)完成了一定的預(yù)處理,優(yōu)秀的編輯可以比較容易找到數(shù)據(jù)的分類規(guī)律并發(fā)現(xiàn)有價值的信息。另外,對于出版商來說,運(yùn)營商的廣闊平臺無疑是開展出版社形象宣傳、出版物宣傳、廣告的絕佳場所。推送精準(zhǔn)廣告可以說是平臺運(yùn)營商盈利前景最為廣闊的模式。
3.“大出版”與“文創(chuàng)融合”的共贏
大數(shù)據(jù)能夠福澤的不僅是傳統(tǒng)的出版業(yè),對包括影視、動漫、游戲等領(lǐng)域在內(nèi)的“大出版”產(chǎn)業(yè),對出版與其他文化創(chuàng)意產(chǎn)業(yè)的融合,都有著極大的推動作用。大數(shù)據(jù)的極強(qiáng)時效性和豐富性不僅可以讓包括出版在內(nèi)的文化創(chuàng)意產(chǎn)業(yè)發(fā)現(xiàn)最新商機(jī),更關(guān)鍵的是這種商機(jī)是可見、可證明的,是可有的放矢地實(shí)施改進(jìn)的。實(shí)際上,大數(shù)據(jù)留下的不只是人們的活動軌跡,許多時候,它們是一種決策依據(jù),一種信心的來源,一種說服力。
2012年內(nèi)地電影票房達(dá)到了170.73億元,同比增長30.18%,是10年前的18倍。其實(shí),讓中國電影讀懂觀眾的一大利器就是大數(shù)據(jù)。樂視影業(yè)是在郭敬明的電影《小時代》殺青之后才成為電影營銷方的。促使他們做出這個決定的原因就是工作人員在搜索《致我們終將逝去的青春》的相關(guān)微博數(shù)時,偶然發(fā)現(xiàn)《小時代》的討論是前者的8倍,而郭敬明的同名小說就擁有2400萬的讀者。這還不是事件的終結(jié)點(diǎn)。因?yàn)橛写髷?shù)據(jù)的支撐,樂視很快鎖定了營銷方案并完美執(zhí)行——從郭敬明和演員組粉絲中擴(kuò)散出三個目標(biāo)人群,著力進(jìn)行視頻營銷和網(wǎng)站推廣。對于樂視影業(yè)來說,從2013年3月到《小時代》第一部電影上映前,預(yù)告片點(diǎn)擊量已達(dá)到4000萬,社交媒體上有超過200萬人參與相關(guān)活動,推廣城市60個——而最終,這些數(shù)據(jù)被拿來說服了影院排片。
在發(fā)現(xiàn)商機(jī)和勇敢決策后,大數(shù)據(jù)也是文化創(chuàng)意產(chǎn)業(yè)發(fā)展的后盾,可以保證決策得以適時地調(diào)整和修正。貝瓦網(wǎng)是一個提供原創(chuàng)歌謠、電子書、益智游戲、學(xué)習(xí)軟件等內(nèi)容的早教網(wǎng)站?,F(xiàn)在它已經(jīng)是一個有200余名員工,1000萬注冊用戶,20萬付費(fèi)用戶,月收入500萬的大公司了。而最初創(chuàng)業(yè)的靈感就源于創(chuàng)始人楊威在網(wǎng)上為女兒搜索兒歌時發(fā)現(xiàn)新內(nèi)容、好內(nèi)容匱乏。通過線下調(diào)研和分析搜索數(shù)據(jù),楊威創(chuàng)業(yè)初期重視的是兒歌MV、電子故事讀本和游戲。但一段時間以后,團(tuán)隊(duì)通過對網(wǎng)站訪問量的分析發(fā)現(xiàn)曾認(rèn)為最受歡迎的故事電子書因?yàn)樵缙陂_發(fā)階段缺乏互動性,并沒有很好的反響,兒歌卻意外獲得很高的關(guān)注度,于是及時調(diào)整了研發(fā)重心。
三、大數(shù)據(jù)應(yīng)用,得心應(yīng)手不容易
大數(shù)據(jù)的迅猛發(fā)展雖然為華文出版的壯大提供了許多難能可貴的機(jī)遇和優(yōu)質(zhì)條件,但真正被出版及其他文化創(chuàng)意產(chǎn)業(yè)充分挖掘和利用起來的并不多,要成功獲得想要的大數(shù)據(jù)并得心應(yīng)手的應(yīng)用也并不容易。大數(shù)據(jù)為華文出版帶來的挑戰(zhàn),可簡要從技術(shù)方面和意識方面來進(jìn)行說明。
1. 技術(shù)方面:應(yīng)用環(huán)境差,專業(yè)人才匱乏
當(dāng)下我國出版業(yè)的大數(shù)據(jù)應(yīng)用環(huán)境亟待改觀。這主要?dú)w結(jié)為:其一,大數(shù)據(jù)本身體量龐大、種類繁多、價值密度低,多有垃圾信息和不實(shí)信息,應(yīng)用難度大。國際著名科技咨詢機(jī)構(gòu)Gartner的調(diào)查顯示,全球財(cái)富1000強(qiáng)企業(yè)中,超過25%的企業(yè)信息系統(tǒng)中存在不正確或不準(zhǔn)確的數(shù)據(jù)。出版業(yè)最直觀的就是充斥各大電商平臺和社交網(wǎng)絡(luò)的“水軍”評論,如果不加以剔除,他們的言論會對出版商基于數(shù)據(jù)分析判斷的客觀性造成極大干擾。其二,出版企業(yè)普遍不具備儲存和分析大數(shù)據(jù)的軟硬件環(huán)境。一方面要保證可持續(xù)不斷的獲得最新數(shù)據(jù)就要有相應(yīng)的網(wǎng)絡(luò)帶寬和儲存設(shè)備。IDC研究報告稱,未來10年管理數(shù)據(jù)的服務(wù)器數(shù)量要增加10倍,才能對應(yīng)大數(shù)據(jù)的增長速度。而由于大數(shù)據(jù)是結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)混雜,現(xiàn)有的數(shù)據(jù)庫分析軟件已不能將它們很好地抓取、分析處理和可視化了。另一方面對于原有數(shù)據(jù)和不斷生成的新數(shù)據(jù),如果要全面地展開分析可能需要繁瑣的數(shù)字化過程,且必須保證各個系統(tǒng)的兼容性。設(shè)備巨大的能源消耗量也是大數(shù)據(jù)發(fā)展的一大瓶頸。其三,數(shù)據(jù)安全堪憂。站在讀者的角度來說,出版商可以獲得什么樣的數(shù)據(jù),哪些屬于個人隱私?出版商對于所得數(shù)據(jù)有怎樣的保護(hù)義務(wù)?怎樣保證讀者的個人隱私不外泄,分析的各項(xiàng)數(shù)據(jù)結(jié)果不外泄?這些問題都需要我們深入思考和解決。
編輯出版人員數(shù)據(jù)采集、分析和處理能力的匱乏也是出版業(yè)適應(yīng)大數(shù)據(jù)時代的一大短板。多數(shù)編輯出版人員連最基本的流處理、批處理等數(shù)據(jù)分析處理方法都一知半解,更何況現(xiàn)在企業(yè)急需的是“數(shù)據(jù)科學(xué)家”式的高端專業(yè)人才?!皵?shù)據(jù)學(xué)家”也不是一般IT部門的程序員或工程師,而是集出版基礎(chǔ)知識、數(shù)學(xué)和統(tǒng)計(jì)學(xué)技能及社會網(wǎng)絡(luò)、社會心理學(xué)、行為學(xué)知識于一身的人。不僅要求對基本的數(shù)據(jù)規(guī)律和模型有所認(rèn)識,還要有理論思維,具備綜合深入思考的能力。
2. 意識方面:要葆有“經(jīng)營的初心”
臺灣《商業(yè)周刊》創(chuàng)辦人,現(xiàn)任臺灣最大出版集團(tuán)——城邦出版集團(tuán)副董事長何飛鵬先生寫過一篇文章,名字叫《經(jīng)營的初心》?!敖?jīng)營的初心”是何飛鵬先生化自日本著名企業(yè)家、管理學(xué)家稻盛和夫自述的一個概念。做任何事業(yè)都要具備經(jīng)營的初心——不能單純想著盈利,要對社會有貢獻(xiàn),對人類有幫助,企業(yè)的經(jīng)營才有價值。經(jīng)營出版事業(yè)更應(yīng)當(dāng)如此。大數(shù)據(jù)時代,我們固然可以洞察讀者的偏好,完成精準(zhǔn)的造勢和營銷,但是萬不能盯著數(shù)據(jù)線交叉出的利潤最高點(diǎn)而忘了出版工作的職能。要積極給讀者正向的引導(dǎo),服務(wù)讀者的同時也要培養(yǎng)優(yōu)秀的讀者。同時要保持一份出版工作特有的靈動與純潔,敢于做出超前的判斷,不能完全依附于數(shù)據(jù)。
Facebook工程總監(jiān)Parikh說:“大數(shù)據(jù)的意義在于真正對你的生意有內(nèi)在的洞見?!贝髷?shù)據(jù)時代的頭浪剛剛拍打過來,華文出版面對其迅猛之勢必然會在經(jīng)營環(huán)境、人力物力、經(jīng)營意識等方面遭遇困難和曲折。相信經(jīng)過華文出版產(chǎn)業(yè)不斷地自我完善,一定能夠?qū)崿F(xiàn)出版商與讀者、平臺運(yùn)營商及其他文化創(chuàng)意產(chǎn)業(yè)主體之間的廣泛共贏。
(作者單位:北京印刷學(xué)院)
參考文獻(xiàn)
[1]孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計(jì)算機(jī)研究與發(fā)展,2013(1):146-169.
[2]顧芳,劉旭峰,左超.大數(shù)據(jù)背景下運(yùn)營商移動互聯(lián)網(wǎng)發(fā)展策略研究[J].郵電設(shè)計(jì)技術(shù),2012(8):21-24.
[3]高鵬.黑龍江電視臺:當(dāng)新媒體遇到“大數(shù)據(jù)”[J].廣播與電視技術(shù),2012(10):38-43.