崔永政
大數(shù)據(jù)來勢(shì)洶洶,正在改變著世界,出版業(yè)自然也不例外,部分出版單位已經(jīng)開始涉足大數(shù)據(jù)分析。但對(duì)于大多數(shù)出版單位而言,大數(shù)據(jù)依然顯得很神秘。什么是大數(shù)據(jù)?通過百度百科查詢可知,大數(shù)據(jù)是指無法在一定時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。出版業(yè)有大數(shù)據(jù)嗎?大家說法不一,但大部分人對(duì)出版業(yè)有大數(shù)據(jù)是持肯定態(tài)度的。那到底什么是出版大數(shù)據(jù)呢?目前百度百科和其他百科未能搜到相關(guān)詞條。在“出版業(yè)供給側(cè)結(jié)構(gòu)性改革解決之道·優(yōu)化供給優(yōu)控庫存2016年度峰會(huì)”上,國家新聞出版廣電總局?jǐn)?shù)字出版司原副司長馮宏聲提出了新聞出版業(yè)大數(shù)據(jù)基本體系,把新聞出版業(yè)大數(shù)據(jù)大致劃分為五個(gè)層面:一是新聞出版生產(chǎn)過程中產(chǎn)生的內(nèi)容資源數(shù)據(jù),這是出版業(yè)最為核心的層面;二是所有產(chǎn)品信息的基礎(chǔ)數(shù)據(jù),是產(chǎn)品層;三是出版產(chǎn)品流通中所產(chǎn)生的數(shù)據(jù),包括整個(gè)出版業(yè)務(wù)運(yùn)行狀況的信息,是業(yè)務(wù)層;四是市場(chǎng)層,主要是產(chǎn)品的消費(fèi)數(shù)據(jù);五是用戶層,主要包括消費(fèi)者的反饋數(shù)據(jù),記錄了廣大用戶的行為數(shù)據(jù)和評(píng)價(jià)信息。
目前業(yè)界普遍認(rèn)為,出版社圖書出版的每一個(gè)環(huán)節(jié)都離不開大數(shù)據(jù)。出版社應(yīng)該在以下五個(gè)方面運(yùn)用好大數(shù)據(jù)。
出版社通過調(diào)查問卷的方式收集讀者數(shù)據(jù),然后對(duì)讀者數(shù)據(jù)進(jìn)行分析,可以了解讀者對(duì)產(chǎn)品的喜好,這樣就可以讓編輯有針對(duì)性地策劃、生產(chǎn)出符合讀者潛在需求的出版物。出版社可以積極與掌握線上相關(guān)讀者數(shù)據(jù)的客戶合作,分析讀者使用搜索功能的海量數(shù)據(jù),從中發(fā)掘出讀者的偏好趨勢(shì)和圖書市場(chǎng)的潛在需求。此外,出版社可以通過對(duì)微博、微信上以及在線閱讀網(wǎng)站等與圖書相關(guān)的關(guān)鍵詞進(jìn)行排序,挖掘近期熱門的內(nèi)容題材和作者。
在確定印量的環(huán)節(jié),通過對(duì)同類書的市場(chǎng)熱度、作者的影響力和已出版同類圖書的銷售庫存情況進(jìn)行分析,出版社可以推測(cè)出這本書的首印量大概是多少。新書首印的數(shù)量不僅影響成本控制,更重要的是它關(guān)系到出版社的贏利,印多了不僅達(dá)不到預(yù)期的利潤,而且還會(huì)增加多余的庫存,從而占用出版社大量資金,為了避免這種情況的出現(xiàn),出版社對(duì)新書首印量的數(shù)據(jù)性分析顯得尤為重要,這有助于首印數(shù)的決策參考。
目前,出版社重印書的發(fā)貨碼洋約占當(dāng)年出版社總發(fā)貨碼洋的60%~80%(不同類型的出版社略有不同),重印書是出版社重要的利潤來源。在圖書重印前,如果出版社對(duì)每一本書的印制、發(fā)貨和銷售數(shù)據(jù)進(jìn)行分析,出版社就可以合理確定圖書印數(shù)并制定相應(yīng)印制計(jì)劃,這樣就能保證圖書不斷貨,而且可以避免多印。
出版效率就是品種效率,是出版社單位時(shí)間內(nèi)所出版的品種數(shù)量,它是衡量出版社一個(gè)類別是否盈利的重要指標(biāo)。出版社可以通過對(duì)相關(guān)數(shù)據(jù)的整理分析做出以上各個(gè)品種的出版效率線柱圖,以供出版決策參考。
每個(gè)出版社都有自己的定位和出版方向,出版的品種和類別也各不相同,那怎樣才能讓出版的產(chǎn)品既不會(huì)偏離既定出版方向又能精益求精呢?通過出版大數(shù)據(jù)的分析得以實(shí)現(xiàn)。把社里近三年內(nèi)出版的品種庫存數(shù)據(jù)調(diào)出來逐一進(jìn)行分析:出版效率高,市場(chǎng)份額大而且收益較好的品種出版社應(yīng)該持續(xù)投入,保持優(yōu)勢(shì);出版效率比較低,但市場(chǎng)占有率高的品種,也應(yīng)該保持優(yōu)勢(shì);出版效率高但市場(chǎng)占有率低利潤不高的品種屬于問題產(chǎn)品,需要重點(diǎn)改進(jìn);出版效率和市場(chǎng)占有率都比較低,利潤也低的品種可以選擇放棄,把節(jié)省的資源投入其他幾個(gè)類別的產(chǎn)品中去。
在圖書營銷環(huán)節(jié),圖書精準(zhǔn)營銷可以通過大數(shù)據(jù)來實(shí)現(xiàn)。在大數(shù)據(jù)出現(xiàn)前,對(duì)讀者閱讀愛好的調(diào)查大部分是抽樣調(diào)查,而大數(shù)據(jù)出現(xiàn)后可以通過對(duì)相關(guān)數(shù)據(jù)(如讀者的閱讀愛好與習(xí)慣,不同地區(qū)讀者偏愛的圖書類型,哪些圖書容易組合在一起進(jìn)行銷售等數(shù)據(jù))的分析,就能發(fā)現(xiàn)讀者的需求和愛好,出版社能更有針對(duì)性地進(jìn)行圖書營銷。通過對(duì)這些數(shù)據(jù)的收集、整理和加工分析,可以找到有價(jià)值的統(tǒng)計(jì)規(guī)律。出版社也可以對(duì)社交網(wǎng)站用戶間關(guān)系進(jìn)行大數(shù)據(jù)分析,通過數(shù)據(jù)分析可以發(fā)現(xiàn)有著不同性格、興趣愛好和消費(fèi)能力的小群體。這些小群體就是我們要找的細(xì)分的目標(biāo)市場(chǎng)。專業(yè)出版物常常只適合于小眾市場(chǎng)的需求,出版社如果在這些小群體進(jìn)行專業(yè)出版物的營銷活動(dòng),則會(huì)取得良好的營銷效果。在大數(shù)據(jù)分析的幫助下,出版社對(duì)不同的讀者進(jìn)行定向的新書信息推送和廣告投放,會(huì)使?fàn)I銷更富有針對(duì)性,營銷效果會(huì)更好。
在工作中經(jīng)常碰到這樣的情況:手里有一大把的數(shù)據(jù),但不知道該從何處下手去分析這些數(shù)據(jù),或者是結(jié)果雖然分析出來了,但不是自己想要的,這時(shí)候大多數(shù)人會(huì)覺得是自己掌握的知識(shí)不夠多,統(tǒng)計(jì)數(shù)據(jù)的軟件用得不夠熟練或者不合適,甚至認(rèn)為需要特殊的統(tǒng)計(jì)分析軟件才能得到分析結(jié)果。其實(shí),這都不是問題所在,因?yàn)閿?shù)據(jù)的分析能力不是體現(xiàn)在我們掌握什么工具上,更重要的是我們用什么樣的思維方式去分析。在信息時(shí)代背景下,數(shù)據(jù)的收集、整理、分析和挖掘,是出版社每個(gè)編輯或是營銷人員都應(yīng)該具備的基本素養(yǎng)。
我們?nèi)粘W龅臄?shù)據(jù)分析表通常有兩種:一種是數(shù)據(jù)明細(xì)表,也叫源數(shù)據(jù)表;另一種是統(tǒng)計(jì)表,也叫分類匯總表。前者必須用正確的方法做;后者只需通過軟件就可以轉(zhuǎn)化而來。
圖表制作需遵循五大原則:(1)確定表達(dá)主題或目的;(2)確定圖表格式;(3)選擇數(shù)據(jù)并制作圖表;(4)檢查是否真實(shí)有效的展示數(shù)據(jù);(5)檢查是否表達(dá)了你的觀點(diǎn)。
數(shù)據(jù)分析過程主要包括以下六個(gè)方面。
第一,明確分析思路和目的。這是數(shù)據(jù)分析的前提,如果沒有思路和目的,我們就不知道需要搜集哪些數(shù)據(jù),不知道要從哪個(gè)角度入手進(jìn)行數(shù)據(jù)分析等。這一步要實(shí)現(xiàn)需要我們了解業(yè)務(wù)、精通業(yè)務(wù),在這個(gè)基礎(chǔ)上還必須了解出版社用什么分析系統(tǒng),知道系統(tǒng)能導(dǎo)出哪些數(shù)據(jù),而且對(duì)這些數(shù)據(jù)之間的關(guān)系要了如指掌,這樣我們才知道要解決什么樣問題,需要哪些方面數(shù)據(jù),才能有目的地去搜集相關(guān)數(shù)據(jù)。
第二,數(shù)據(jù)的收集。收集數(shù)據(jù)一般有兩種方式:一種方式是由業(yè)務(wù)系統(tǒng)直接導(dǎo)入,其中包括編務(wù)、營銷和印制等系統(tǒng);另一種方式就是直接把收集的數(shù)據(jù)人工錄入。
第三,數(shù)據(jù)的處理。數(shù)據(jù)的處理主要包括這幾個(gè)方面:(1)對(duì)重復(fù)和缺失數(shù)據(jù)處理;(2)對(duì)數(shù)據(jù)邏輯錯(cuò)誤的檢查;(3)數(shù)據(jù)排列及字段匹配等。通過對(duì)不規(guī)范的數(shù)據(jù)進(jìn)行處理后形成一張一維源數(shù)據(jù)表,在這個(gè)基礎(chǔ)上我們?cè)儆谜_的方式做出數(shù)據(jù)明細(xì)表,這個(gè)表必須規(guī)范而且要滿足我們分析所需的維度,這點(diǎn)非常重要。
第四,數(shù)據(jù)的分析。數(shù)據(jù)分析都是在匯總表的基礎(chǔ)上做的,匯總表通過數(shù)據(jù)透視表變換而來,通過數(shù)據(jù)透視表,你隨時(shí)可以變出你想要的匯總表。
第五,數(shù)據(jù)的展現(xiàn)。做完了數(shù)據(jù)分析,需要簡(jiǎn)明扼要地展現(xiàn)分析結(jié)果。人類對(duì)圖像的理解力和記憶力要遠(yuǎn)遠(yuǎn)高于文字或數(shù)字,所以圖表就成為我們匯報(bào)工作中不可缺失的重要元素。只要能準(zhǔn)確、直觀地詮釋數(shù)據(jù),就是一張好的圖表。
第六,撰寫數(shù)據(jù)分析報(bào)告。數(shù)據(jù)分析報(bào)告的主要作用有三個(gè):(1)展示分析結(jié)果;(2)給出解決方案;(3)提供輔助決策。專業(yè)的數(shù)據(jù)分析報(bào)告能夠充分展示我們?cè)诠ぷ髦兴〉玫某煽?。撰寫?shù)據(jù)分析報(bào)告要避免兩個(gè)問題:一是沒有對(duì)報(bào)告進(jìn)行解讀;二是沒有提出有效見解和可行性建議,沒有讓領(lǐng)導(dǎo)看出應(yīng)該在哪方面進(jìn)行改進(jìn)。不管用Word還是ppt,我們?cè)谶\(yùn)用表格的時(shí)候,必須用相匹配的數(shù)量級(jí),單位一定要標(biāo)注清楚,要讓看數(shù)據(jù)的人一目了然。整個(gè)分析報(bào)告要結(jié)合實(shí)際業(yè)務(wù),要有理有據(jù),有可供領(lǐng)導(dǎo)選擇的結(jié)果。
在大數(shù)據(jù)時(shí)代,數(shù)據(jù)本身就是重要的資源。這種資源只有深入挖掘才能發(fā)現(xiàn)其潛藏的巨大價(jià)值。出版社應(yīng)該清醒地認(rèn)識(shí)到,自身所擁有的豐富內(nèi)容資源,本身就是一個(gè)龐大的數(shù)據(jù)庫。大數(shù)據(jù)為傳統(tǒng)出版業(yè)提供了一種更新的思維方式和別樣的思考模式,它改變了傳統(tǒng)數(shù)據(jù)時(shí)代人們注重探尋因果關(guān)系和追求數(shù)據(jù)精確性的思維習(xí)慣。