姚永春
大數(shù)據(jù)應(yīng)用通常需要依賴數(shù)據(jù)公司的外部數(shù)據(jù)服務(wù),但外部數(shù)據(jù)服務(wù)能否取得良好的效果,取決于出版企業(yè)對(duì)自己的需求和目標(biāo)是否有明確清晰的刻畫(huà)。出版企業(yè)如果缺乏明確的大數(shù)據(jù)應(yīng)用規(guī)劃,再好的大數(shù)據(jù)技術(shù)服務(wù)也難有用武之地。
這是一個(gè)概念層出不窮的時(shí)代,有些概念不過(guò)是曇花一現(xiàn),有些卻注定會(huì)改變整個(gè)人類社會(huì)的發(fā)展軌跡,“大數(shù)據(jù)”當(dāng)是后者中的一個(gè)。自20世紀(jì)80年代被提出,到現(xiàn)今炙手可熱,“大數(shù)據(jù)”概念在一番沉寂后,終于迎來(lái)“大爆發(fā)”。《自然》《科學(xué)》等重要刊物相繼推出“大數(shù)據(jù)”專刊,美英等國(guó)政府及聯(lián)合國(guó)先后提出與大數(shù)據(jù)相關(guān)的發(fā)展計(jì)劃。2013年,Gartner將大數(shù)據(jù)列為在未來(lái)三年將對(duì)企業(yè)的長(zhǎng)期計(jì)劃、規(guī)劃和行動(dòng)方案產(chǎn)生重大影響的十大戰(zhàn)略技術(shù)之一,更讓其商業(yè)實(shí)踐如火如荼:IBM、微軟、甲骨文、EMC等大數(shù)據(jù)行業(yè)公司設(shè)計(jì)出各種“硬件+軟件+數(shù)據(jù)”的整體解決方案,提供基礎(chǔ)性服務(wù);亞馬遜、臉譜、谷歌、沃爾瑪、淘寶、百度、阿里巴巴、騰訊等企業(yè),通過(guò)深度挖掘自身積累的海量用戶數(shù)據(jù),在精準(zhǔn)營(yíng)銷、個(gè)性化服務(wù)等各個(gè)業(yè)務(wù)領(lǐng)域積極嘗試大數(shù)據(jù)應(yīng)用,布局大數(shù)據(jù)業(yè)務(wù)體系。同時(shí)根據(jù)Gartner的一份名為《2013年大數(shù)據(jù)普及程度背后的炒作》的報(bào)告,64%的受訪企業(yè)表示他們正在或即將進(jìn)行大數(shù)據(jù)工作。
出版企業(yè)顯然沒(méi)有理由漠視大數(shù)據(jù)的存在及其作為一股強(qiáng)大的技術(shù)變革力量對(duì)商品生產(chǎn)、營(yíng)銷、消費(fèi)以及文化領(lǐng)域等方面的影響。出版業(yè)就實(shí)質(zhì)而言,自古就是數(shù)據(jù)的生產(chǎn)與集成部門,承擔(dān)著生產(chǎn)、收集、管理、分析、發(fā)布數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)知識(shí)化轉(zhuǎn)化的任務(wù)。換言之,出版業(yè)是數(shù)據(jù)高度密集型行業(yè)。據(jù)麥肯錫公司下屬全球研究所的一份報(bào)告,美國(guó)傳媒業(yè)擁有715拍字節(jié)的數(shù)據(jù)總量,在所調(diào)查的17個(gè)行業(yè)中位居第三[1]。問(wèn)題在于,出版企業(yè)該如何把握大數(shù)據(jù)帶來(lái)的機(jī)遇,真正從“大數(shù)據(jù)金礦”中獲得價(jià)值呢?
舍恩伯格在《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》中分析了有信息化基礎(chǔ)的非互聯(lián)網(wǎng)公司的大數(shù)據(jù)價(jià)值鏈。根據(jù)他的觀點(diǎn),大數(shù)據(jù)的價(jià)值創(chuàng)造源自數(shù)據(jù)本身、處理數(shù)據(jù)的技能以及利用數(shù)據(jù)的創(chuàng)新思維三個(gè)方面,對(duì)應(yīng)三種商業(yè)模式:掌控大數(shù)據(jù)并利用海量數(shù)據(jù)的授權(quán)使用獲取收益,如twitter;掌握大數(shù)據(jù)技術(shù)并通過(guò)提供技術(shù)服務(wù)獲取收益,如Teradata;通過(guò)挖掘數(shù)據(jù)價(jià)值并整合創(chuàng)新獲取收益,如Jetpac。以此觀照大數(shù)據(jù)之于出版企業(yè)的價(jià)值,顯然,出版企業(yè)不太可能轉(zhuǎn)型為大數(shù)據(jù)技術(shù)的掌控者和服務(wù)提供商,而作為大數(shù)據(jù)的掌控者和價(jià)值挖掘者,不僅符合出版企業(yè)知識(shí)生產(chǎn)、傳播和積累的功能定位,而且能夠充分發(fā)揮出版企業(yè)既有的資源優(yōu)勢(shì)和智力優(yōu)勢(shì)。與之對(duì)應(yīng),筆者認(rèn)為,傳統(tǒng)出版企業(yè)要掘金“大數(shù)據(jù)”,必須在兩個(gè)層面進(jìn)行合理規(guī)劃——大數(shù)據(jù)構(gòu)建層面和大數(shù)據(jù)應(yīng)用層面。
一、大數(shù)據(jù)構(gòu)建層面:從建立大數(shù)據(jù)庫(kù)到部署云環(huán)境,搭建出版企業(yè)的大數(shù)據(jù)平臺(tái)
在大數(shù)據(jù)時(shí)代,數(shù)據(jù)本身是“寶藏”,可以創(chuàng)造價(jià)值。傳統(tǒng)出版時(shí)代積累的海量數(shù)據(jù)及出版活動(dòng)中源源不斷產(chǎn)生的新數(shù)據(jù),是“大知識(shí)”“大科學(xué)”的重要源泉,是出版企業(yè)重要的新經(jīng)濟(jì)利益來(lái)源。但正如舍恩伯格強(qiáng)調(diào)的,良好的信息基礎(chǔ)是企業(yè)獲得大數(shù)據(jù)價(jià)值的前提。只有擁有PB級(jí)甚至TB、ZB級(jí)的多樣化數(shù)據(jù),且保證這些數(shù)據(jù)能夠便捷地進(jìn)行關(guān)聯(lián),出版企業(yè)才能夠通過(guò)對(duì)大數(shù)據(jù)的授權(quán)使用或相關(guān)關(guān)系分析生成有價(jià)值的數(shù)據(jù)產(chǎn)品獲益,才可能形成自身的大數(shù)據(jù)價(jià)值鏈。所以,出版企業(yè)必須著力夯實(shí)數(shù)據(jù)基礎(chǔ),搭建一個(gè)標(biāo)準(zhǔn)化、可橫向拓展的統(tǒng)一數(shù)據(jù)平臺(tái),擴(kuò)大數(shù)據(jù)規(guī)模,擴(kuò)展數(shù)據(jù)容量,收集、存儲(chǔ)更全面、更翔實(shí)、更完備、更有效的出版數(shù)據(jù)及相關(guān)數(shù)據(jù),成為規(guī)模數(shù)據(jù)擁有者。大數(shù)據(jù)構(gòu)建,是出版企業(yè)真正成為數(shù)據(jù)驅(qū)動(dòng)型企業(yè),掘金大數(shù)據(jù)的根本。
出版企業(yè)大數(shù)據(jù)構(gòu)建層面的工作可以從兩個(gè)方面展開(kāi):一是事實(shí)信息數(shù)據(jù)化,主要通過(guò)大數(shù)據(jù)庫(kù)建設(shè)完成;二是內(nèi)部數(shù)據(jù)與外部數(shù)據(jù)的對(duì)接與整合,主要通過(guò)出版企業(yè)云環(huán)境的部署實(shí)現(xiàn)。
1.建立出版企業(yè)的大數(shù)據(jù)庫(kù)
“大數(shù)據(jù)存在前提是客觀事物的活動(dòng)狀態(tài)得以便捷高效、低成本、全方位地?cái)?shù)字化記錄”。[2]出版企業(yè)在多年數(shù)字化探索中,雖然已經(jīng)部分實(shí)現(xiàn)了事實(shí)信息的數(shù)據(jù)化,有了一定的數(shù)據(jù)積累,比如,許多出版企業(yè)通過(guò)ERP系統(tǒng),積累了選題、發(fā)行、財(cái)務(wù)、人事管理等方面的內(nèi)部信息。但整體而言,還是存在數(shù)據(jù)資源數(shù)量少,類型單一,缺乏關(guān)聯(lián)等問(wèn)題,遠(yuǎn)遠(yuǎn)無(wú)法滿足掘金大數(shù)據(jù)的需要。這也是目前出版企業(yè)的數(shù)字化實(shí)踐主要停留在“從既有的出版資源中遴選優(yōu)秀、暢銷的內(nèi)容進(jìn)行數(shù)字化生產(chǎn)”[3]層面的重要原因。大數(shù)據(jù)的本義是龐大的數(shù)據(jù)集,具有規(guī)模大、種類多等特點(diǎn)。根據(jù)IDC對(duì)大數(shù)據(jù)的定義,大數(shù)據(jù)要收集超過(guò)100TB的數(shù)據(jù),或從小數(shù)據(jù)開(kāi)始,但數(shù)據(jù)每年增長(zhǎng)60%以上[4]。顯然,出版企業(yè)屬于定義中的后一種情況。因此,出版企業(yè)要做的事是,以既有ERP系統(tǒng)數(shù)據(jù)資源為基礎(chǔ),充分實(shí)現(xiàn)事實(shí)信息數(shù)字化,并進(jìn)一步擴(kuò)大數(shù)據(jù)來(lái)源,特別要增加對(duì)各類實(shí)時(shí)流數(shù)據(jù)的收集和存儲(chǔ),提升數(shù)據(jù)的精細(xì)化程度。
大數(shù)據(jù)資源繁雜、增長(zhǎng)迅速,出版企業(yè)在建立自己的大數(shù)據(jù)庫(kù)之前,必須依據(jù)大數(shù)據(jù)應(yīng)用目標(biāo)定義自身的價(jià)值數(shù)據(jù)標(biāo)準(zhǔn),確定大數(shù)據(jù)收集、存儲(chǔ)的類型和范圍?;诔霭嫫髽I(yè)掘金大數(shù)據(jù)的需要,筆者以為,出版企業(yè)的大數(shù)據(jù)庫(kù)可以由以下類型數(shù)據(jù)集構(gòu)成。(1)讀者數(shù)據(jù)集:讀者數(shù)據(jù)一直是出版企業(yè)重點(diǎn)收集存儲(chǔ)的數(shù)據(jù),但傳統(tǒng)讀者信息主要是人口統(tǒng)計(jì)指標(biāo)信息,如性別、年齡、文化層次等,這些相對(duì)靜態(tài)的數(shù)據(jù)很難滿足數(shù)字出版的需要。大數(shù)據(jù)庫(kù)中的讀者數(shù)據(jù)集,更強(qiáng)調(diào)對(duì)與讀者消費(fèi)行為相關(guān)的動(dòng)態(tài)數(shù)據(jù)的抓取,比如通過(guò)Cookie技術(shù)獲取讀者瀏覽網(wǎng)頁(yè)、搜索和評(píng)論圖書(shū)產(chǎn)品、閱讀狀態(tài)等行為數(shù)據(jù),通過(guò)這些數(shù)據(jù),出版企業(yè)可以獲得關(guān)于讀者在購(gòu)買偏好、購(gòu)買意愿、購(gòu)買頻率、購(gòu)買周期、忠誠(chéng)度、滿意度、營(yíng)銷手段適應(yīng)性等方面的豐富數(shù)據(jù),有利于出版企業(yè)準(zhǔn)確把握讀者的閱讀與消費(fèi)脈動(dòng),實(shí)現(xiàn)供給與需求的精準(zhǔn)匹配。(2)產(chǎn)品數(shù)據(jù)集:主要收集、存儲(chǔ)出版企業(yè)自己生產(chǎn)的各類有形產(chǎn)品數(shù)據(jù),包括內(nèi)容數(shù)據(jù)集和銷售數(shù)據(jù)集。內(nèi)容數(shù)據(jù)集收集、存儲(chǔ)服務(wù)于產(chǎn)品定制化生產(chǎn)和數(shù)據(jù)創(chuàng)意服務(wù)的產(chǎn)品內(nèi)容數(shù)據(jù),可以在出版企業(yè)內(nèi)容數(shù)字化的過(guò)程中一并建立。銷售數(shù)據(jù)集可以在現(xiàn)有ERP系統(tǒng)中的選題信息基礎(chǔ)上進(jìn)行擴(kuò)充,增加出版物在載體形態(tài)(如紙質(zhì)版、Pad版、手機(jī)版、網(wǎng)絡(luò)版等)、不同載體形態(tài)的銷售狀況、生命周期、銷售淡旺季、營(yíng)銷分類、促銷手段適應(yīng)性、替代與互補(bǔ)品種等方面的數(shù)據(jù)。如果出版企業(yè)提供出版服務(wù),應(yīng)獨(dú)立建立出版服務(wù)數(shù)據(jù)集。(3)供應(yīng)鏈數(shù)據(jù)集:可在現(xiàn)有ERP發(fā)行系統(tǒng)信息的基礎(chǔ)上升級(jí)而成,重要的是,不僅要收集出版企業(yè)既有供應(yīng)鏈上各級(jí)批發(fā)商、零售商的相關(guān)數(shù)據(jù),也要收集行業(yè)供應(yīng)鏈數(shù)據(jù),特別是電子商務(wù)方面的數(shù)據(jù)。對(duì)供應(yīng)鏈數(shù)據(jù)的采集,除了運(yùn)營(yíng)效率、成本、市場(chǎng)覆蓋面等基礎(chǔ)數(shù)據(jù),要注意針對(duì)每類產(chǎn)品甚至每件產(chǎn)品實(shí)時(shí)追蹤其供應(yīng)或銷售數(shù)據(jù),以及時(shí)調(diào)整其供應(yīng)鏈構(gòu)成,保證產(chǎn)品生產(chǎn)或銷售取得最大收益。(4)營(yíng)銷活動(dòng)數(shù)據(jù)集:數(shù)字時(shí)代,營(yíng)銷是與內(nèi)容創(chuàng)新并重的出版企業(yè)競(jìng)爭(zhēng)優(yōu)勢(shì)來(lái)源。營(yíng)銷活動(dòng)的投入產(chǎn)出比如何,與產(chǎn)品、讀者的適應(yīng)性如何,線上線下?tīng)I(yíng)銷活動(dòng)的關(guān)系是互補(bǔ)還是替代……這些都是大數(shù)據(jù)時(shí)代出版企業(yè)應(yīng)該收集也可以收集得到的數(shù)據(jù)。(5)作者數(shù)據(jù)集:包括作者的性別、年齡、主要作品等基本數(shù)據(jù)及動(dòng)態(tài)行為數(shù)據(jù),如作者新近發(fā)布的微博、參與的互動(dòng)話題、新加入的圈子等。這些動(dòng)態(tài)數(shù)據(jù),對(duì)出版企業(yè)的選題創(chuàng)新、作者開(kāi)發(fā)都有積極意義。(6)其他數(shù)據(jù)集:如版權(quán)數(shù)據(jù)集、財(cái)務(wù)數(shù)據(jù)集、人事數(shù)據(jù)集等。
出版企業(yè)在建立大數(shù)據(jù)庫(kù)的過(guò)程中,要逐步形成數(shù)據(jù)收集網(wǎng)絡(luò),擴(kuò)大數(shù)據(jù)存儲(chǔ)范圍。不能僅僅局限于傳統(tǒng)ERP信息源,或者業(yè)務(wù)與社交數(shù)據(jù)源,還應(yīng)該把對(duì)出版活動(dòng)有較大影響的其他數(shù)據(jù)源囊括進(jìn)來(lái),比如二維碼信息,源自信息亭、車載娛樂(lè)系統(tǒng)等智能系統(tǒng)和網(wǎng)絡(luò)邊緣設(shè)備傳感器生成的內(nèi)容,搜索、移動(dòng)、網(wǎng)絡(luò)分析工具產(chǎn)生的數(shù)據(jù)等,這些復(fù)雜的流數(shù)據(jù)是大數(shù)據(jù)的重要組成部分,是企業(yè)打造個(gè)性化客戶服務(wù)的全新信息價(jià)值寶庫(kù)。在數(shù)據(jù)類型方面,大數(shù)據(jù)庫(kù)建設(shè)的重點(diǎn)是突破傳統(tǒng)ERP系統(tǒng)主要采集結(jié)構(gòu)化數(shù)據(jù)的局限,增加對(duì)半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的收集和存儲(chǔ),如各種文本、文檔、圖像、音頻、視頻、社交媒體中與出版活動(dòng)相關(guān)的、能產(chǎn)生商業(yè)價(jià)值的數(shù)據(jù)。當(dāng)然,在擴(kuò)大數(shù)據(jù)收集范圍的同時(shí)必須注意數(shù)據(jù)質(zhì)量,并根據(jù)企業(yè)發(fā)展需要隨時(shí)對(duì)數(shù)據(jù)資源進(jìn)行增減。
2.部署出版企業(yè)的云環(huán)境
大數(shù)據(jù)庫(kù)的建立強(qiáng)調(diào)的是出版企業(yè)的內(nèi)部信息化基礎(chǔ)建設(shè),借用時(shí)髦的概念,可以稱之為出版企業(yè)的“私有云”建設(shè)。但必須指出的是,如果這個(gè)大數(shù)據(jù)庫(kù)只是做到了自身規(guī)模的快速膨脹,卻未能有效地嵌入互聯(lián)網(wǎng)數(shù)據(jù)鏈中,那么,它仍然屬于“信息孤島”,并不比傳統(tǒng)ERP先進(jìn)多少,換言之,它的大數(shù)據(jù)價(jià)值十分有限。而且,實(shí)事求是地說(shuō),出版企業(yè)大數(shù)據(jù)庫(kù)的容量一定是有限的,因?yàn)槠錈o(wú)法承擔(dān)對(duì)更高性能基礎(chǔ)設(shè)備的投資。另一方面,數(shù)字時(shí)代企業(yè)的邊界在逐漸消融,“企業(yè)應(yīng)該作為開(kāi)放的系統(tǒng)與外界進(jìn)行溝通”,“應(yīng)有效整合企業(yè)、產(chǎn)業(yè)、地區(qū)、國(guó)家甚至全世界高層次的經(jīng)濟(jì)系統(tǒng),以更多的外部資源來(lái)謀取更廣闊的發(fā)展空間”[4]。從這個(gè)角度看,出版企業(yè)要充分獲取大數(shù)據(jù)商業(yè)價(jià)值,必須善于借力外部數(shù)據(jù)資源——各種公共和共享的數(shù)據(jù)資源,如政務(wù)數(shù)據(jù)源、商務(wù)數(shù)據(jù)源、普查數(shù)據(jù)等。此外,更加重要的是,大數(shù)據(jù)必須與云計(jì)算結(jié)合,才能完成由“數(shù)據(jù)垃圾”向“信息金礦”的華麗轉(zhuǎn)身。所以,出版企業(yè)大數(shù)據(jù)構(gòu)建的最終目標(biāo)是部署自己的云環(huán)境,利用云基礎(chǔ)架構(gòu)實(shí)現(xiàn)大數(shù)據(jù)價(jià)值挖掘。
出版企業(yè)的云環(huán)境部署,較為可行的是在私有云的基礎(chǔ)上創(chuàng)建混合云,或添加大數(shù)據(jù)分析至內(nèi)部服務(wù)。同時(shí)要善于利用公有云中的重要外部資源和應(yīng)用程序,借助公有云服務(wù)補(bǔ)充內(nèi)部資源,實(shí)現(xiàn)企業(yè)內(nèi)外數(shù)據(jù)、多方平臺(tái)數(shù)據(jù)的整合。比如,可以利用政府公開(kāi)數(shù)據(jù),獲取社會(huì)經(jīng)濟(jì)文化發(fā)展數(shù)據(jù)和相關(guān)行業(yè)數(shù)據(jù);利用銀行信息系統(tǒng),獲取讀者的金融信息、信用信息;利用亞馬遜、當(dāng)當(dāng)網(wǎng)、京東商城的用戶行為數(shù)據(jù),獲取有關(guān)讀者、市場(chǎng)、圖書(shū)產(chǎn)品方面的信息。隨著大數(shù)據(jù)分析和云計(jì)算技術(shù)的發(fā)展,甲骨文、微軟、谷歌以及許多不知名的數(shù)據(jù)公司,都開(kāi)始提供專業(yè)服務(wù)幫助企業(yè)部署云環(huán)境,其中不乏出版云平臺(tái),如云漢公司與IBM打造的“中國(guó)出版發(fā)行交易云平臺(tái)”、方正阿帕比公司的“阿帕比云出版服務(wù)平臺(tái)”,出版企業(yè)也可通過(guò)購(gòu)買其一攬子解決方案,實(shí)現(xiàn)“私有云”與這些云平臺(tái)的精準(zhǔn)對(duì)接,構(gòu)建滿足自身需求的云環(huán)境。需要提醒的是,云環(huán)境的構(gòu)建強(qiáng)調(diào)與外部的關(guān)聯(lián)和對(duì)接,可能會(huì)帶來(lái)一些安全隱患,所以,在部署云環(huán)境的過(guò)程中,出版企業(yè)一定要注意保護(hù)私有云中的敏感數(shù)據(jù)。
二、大數(shù)據(jù)應(yīng)用層面:從營(yíng)銷領(lǐng)域的試水到全業(yè)務(wù)覆蓋,從數(shù)據(jù)產(chǎn)品到數(shù)據(jù)創(chuàng)意服務(wù)
大數(shù)據(jù)的最終意義是“獲得洞察力和價(jià)值”[5],大數(shù)據(jù)應(yīng)用的核心是通過(guò)對(duì)數(shù)據(jù)的知識(shí)化促成正確決策和高效行動(dòng)。因此,大數(shù)據(jù)之于出版企業(yè)的應(yīng)用價(jià)值,首先在于通過(guò)數(shù)據(jù)分析優(yōu)化出版流程,節(jié)約運(yùn)營(yíng)成本,提高經(jīng)營(yíng)管理效率。從當(dāng)前大數(shù)據(jù)技術(shù)發(fā)展現(xiàn)狀及出版企業(yè)的實(shí)際出發(fā),出版企業(yè)在這一層面的大數(shù)據(jù)應(yīng)用,最好采取與大數(shù)據(jù)技術(shù)供應(yīng)商或數(shù)據(jù)分析公司合作的模式,將后者的分析結(jié)果應(yīng)用于出版社的各項(xiàng)活動(dòng)中。同時(shí),從既有數(shù)據(jù)基礎(chǔ)看,先試水大數(shù)據(jù)營(yíng)銷,再嘗試選題策劃與作品創(chuàng)作的創(chuàng)新,最后覆蓋全業(yè)務(wù)鏈,較為可行。大數(shù)據(jù)在出版企業(yè)的商業(yè)應(yīng)用還有一個(gè)重要方面,即“以數(shù)據(jù)為核心”的產(chǎn)品生產(chǎn)與服務(wù)提供,也就是出版企業(yè)作為大數(shù)據(jù)價(jià)值的挖掘者和轉(zhuǎn)化者,通過(guò)對(duì)大數(shù)據(jù)的有效整合分析和價(jià)值挖掘,向社會(huì)提供數(shù)據(jù)產(chǎn)品或數(shù)據(jù)創(chuàng)意服務(wù)。
1. 以大數(shù)據(jù)分析實(shí)現(xiàn)精準(zhǔn)營(yíng)銷,促進(jìn)出版流程優(yōu)化,提高經(jīng)營(yíng)管理效率
在零售、電子商務(wù)等領(lǐng)域,借助大數(shù)據(jù)實(shí)施精準(zhǔn)營(yíng)銷的成功案例已為數(shù)不少。在圖書(shū)營(yíng)銷方面,亞馬遜、當(dāng)當(dāng)?shù)染W(wǎng)站的薦書(shū)服務(wù)也廣為人知。實(shí)際上,當(dāng)前的技術(shù)條件已經(jīng)能夠支持出版企業(yè)在大數(shù)據(jù)營(yíng)銷方面走得更遠(yuǎn)?!娥囸I游戲》在北美上映時(shí),出版商即通過(guò)電子閱讀器獲得了有關(guān)讀者閱讀該書(shū)的速度、標(biāo)注行為、閱讀第一冊(cè)后立即購(gòu)買第二冊(cè)等信息[6]。Coliloquy是專為亞馬遜kindle提供浪漫小說(shuō)的電子書(shū)公司,它甚至根據(jù)對(duì)浪漫小說(shuō)讀者閱讀狀態(tài)的統(tǒng)計(jì)分析,“勾勒出讀者眼中完美男人的標(biāo)準(zhǔn)——有著純正歐洲口音、30歲上下、黑頭發(fā)、綠眼睛”[6]?,F(xiàn)在,亞馬遜、谷歌、蘋果及其他很多數(shù)據(jù)公司都能夠有效地捕捉關(guān)于讀者閱讀狀態(tài)和消費(fèi)行為的具體數(shù)據(jù),如讀者的地理分布、對(duì)閱讀內(nèi)容的偏好、閱讀時(shí)長(zhǎng)、閱讀深度、相關(guān)廣告點(diǎn)擊次數(shù)與瀏覽時(shí)長(zhǎng)、頁(yè)面功能按鈕點(diǎn)擊習(xí)慣、價(jià)格敏感性等。所以,對(duì)出版企業(yè)來(lái)說(shuō),使用數(shù)據(jù)公司的服務(wù)掌握讀者瀏覽、閱讀、購(gòu)買、標(biāo)注等閱讀行為信息,進(jìn)行大數(shù)據(jù)營(yíng)銷,增強(qiáng)營(yíng)銷活動(dòng)的效果,發(fā)現(xiàn)更加細(xì)膩的營(yíng)銷機(jī)會(huì),改善讀者消費(fèi)體驗(yàn),無(wú)疑是掘金大數(shù)據(jù)最快捷的路徑。巴諾書(shū)店在銷售非小說(shuō)和長(zhǎng)篇紀(jì)實(shí)類文學(xué)作品時(shí),就會(huì)根據(jù)數(shù)據(jù)分析采取相應(yīng)對(duì)策,比如,在讀者可能產(chǎn)生閱讀倦怠的內(nèi)容節(jié)點(diǎn),添加視頻、網(wǎng)頁(yè)鏈接或其他多媒體資源,改善讀者閱讀體驗(yàn),吸引讀者繼續(xù)閱讀[6]?!兜谝回?cái)經(jīng)》《華爾街日?qǐng)?bào)》《新京報(bào)》等國(guó)內(nèi)媒體也開(kāi)始與數(shù)據(jù)公司友盟合作,進(jìn)行類似嘗試。
通過(guò)大數(shù)據(jù)分析提高選題策劃的市場(chǎng)適應(yīng)性和作品創(chuàng)作的針對(duì)性,是值得出版企業(yè)期待的一項(xiàng)大數(shù)據(jù)應(yīng)用。雖然出版界還沒(méi)有《紙牌屋》這種大數(shù)據(jù)排列組合的直接產(chǎn)物,但“Coliloquy模式”[7]也開(kāi)啟了讀者介入作品創(chuàng)作過(guò)程之門,作者會(huì)根據(jù)讀者偏好流數(shù)據(jù)隨時(shí)調(diào)整故事內(nèi)容,讀者可以決定故事的發(fā)展和結(jié)局。Scholastic的全球暢銷書(shū)《39條線索》系列,是通過(guò)對(duì)在線游戲玩家數(shù)據(jù)的追蹤和挖掘,找到其中最吸引人的線索和角色后策劃出版的。谷歌圖書(shū)數(shù)據(jù)庫(kù)應(yīng)用甚至顯示,高質(zhì)量的數(shù)據(jù)分析可以應(yīng)用于科學(xué)研究并生成部分研究成果。正如豆瓣上一篇日志的觀點(diǎn):“如果我們能量化用戶的閱讀題材、閱讀場(chǎng)所、閱讀時(shí)長(zhǎng)、標(biāo)注章節(jié)和重復(fù)瀏覽內(nèi)容,大數(shù)據(jù)時(shí)代的快銷書(shū)指日可待。”[8]可見(jiàn),以大數(shù)據(jù)分析為基礎(chǔ)創(chuàng)新出版物內(nèi)容與形式,構(gòu)思選題,實(shí)現(xiàn)內(nèi)容的個(gè)性化定制,甚至在大數(shù)據(jù)分析的基礎(chǔ)上直接完成作品,在不遠(yuǎn)的將來(lái)會(huì)是出版企業(yè)大數(shù)據(jù)的核心應(yīng)用之一。
大數(shù)據(jù)最終將應(yīng)用于出版企業(yè)的各個(gè)業(yè)務(wù)環(huán)節(jié),幫助出版企業(yè)優(yōu)化業(yè)務(wù)流程,提高運(yùn)營(yíng)效率。國(guó)內(nèi)一些學(xué)者在這方面多有論述。吳鋒指出,“大數(shù)據(jù)對(duì)科技期刊出版具有革命性影響,將推進(jìn)科技期刊編輯流程的再優(yōu)化、科技期刊出版業(yè)態(tài)的多媒體化和科技期刊評(píng)價(jià)規(guī)則的多元化”。[9]王鈺通過(guò)分析破壞性創(chuàng)新和大數(shù)據(jù)對(duì)圖書(shū)銷售的影響,探討了大數(shù)據(jù)時(shí)代書(shū)店和出版社圖書(shū)銷售改進(jìn)策略[10]。當(dāng)然,大數(shù)據(jù)于出版企業(yè)管理效率提升的作用,必須建立在數(shù)據(jù)打通的基礎(chǔ)上,包括讀者行為數(shù)據(jù)、出版者行為數(shù)據(jù)及出版企業(yè)內(nèi)部銷售數(shù)據(jù)、營(yíng)銷數(shù)據(jù)、庫(kù)存數(shù)據(jù)、選題數(shù)據(jù)等全部數(shù)據(jù)的打通。只有數(shù)據(jù)貫通,出版企業(yè)才能有效實(shí)施大數(shù)據(jù)監(jiān)控,使各部門之間協(xié)調(diào)一致,最終獲得經(jīng)營(yíng)管理效率的提高。
需要指出的是,在大數(shù)據(jù)應(yīng)用的這一層面,大數(shù)據(jù)對(duì)出版企業(yè)是一種商業(yè)成本、經(jīng)濟(jì)投入,傳統(tǒng)出版企業(yè)究竟能否獲得令人滿意的投入產(chǎn)出比尚待驗(yàn)證。而且,如前所述,這一大數(shù)據(jù)應(yīng)用通常需要依賴數(shù)據(jù)公司的外部數(shù)據(jù)服務(wù),但外部數(shù)據(jù)服務(wù)能否取得良好的效果,取決于出版企業(yè)對(duì)自己的需求和目標(biāo)是否有明確清晰的刻畫(huà)。出版企業(yè)如果缺乏明確的大數(shù)據(jù)應(yīng)用規(guī)劃,再好的大數(shù)據(jù)技術(shù)服務(wù)也難有用武之地。所以,在大數(shù)據(jù)應(yīng)用的這一層面,出版企業(yè)的當(dāng)務(wù)之急是設(shè)計(jì)大數(shù)據(jù)應(yīng)用藍(lán)圖,從試水大數(shù)據(jù)營(yíng)銷穩(wěn)步推廣到覆蓋全業(yè)務(wù)領(lǐng)域。
2.數(shù)據(jù)產(chǎn)品生產(chǎn)與數(shù)據(jù)創(chuàng)意服務(wù)提供
大數(shù)據(jù)和云計(jì)算對(duì)出版產(chǎn)業(yè)的影響,絕不只是技術(shù)變革,而是深刻的產(chǎn)業(yè)變革。一方面,“大數(shù)據(jù)時(shí)代使媒介融合集成的全媒體趨勢(shì)、信息技術(shù)與媒體技術(shù)交匯的信息媒體化趨勢(shì)加強(qiáng)”,出版企業(yè)需要重新界定出版產(chǎn)品和出版服務(wù)的范圍;另一方面,“企業(yè)界限、定位不再清晰,信息資源被重新分配,合作方式被不斷改寫(xiě)”[11],出版企業(yè)面臨市場(chǎng)邊界消失及眾多新進(jìn)入者攜信息技術(shù)優(yōu)勢(shì)不斷掠奪、蠶食傳統(tǒng)及數(shù)字出版市場(chǎng)的挑戰(zhàn),需要充分挖掘大數(shù)據(jù)價(jià)值,重新設(shè)計(jì)出版產(chǎn)品和出版服務(wù)?!耙詳?shù)據(jù)為核心”的產(chǎn)品生產(chǎn)和服務(wù)提供,成為出版企業(yè)應(yīng)對(duì)“經(jīng)營(yíng)橫向跨界、產(chǎn)業(yè)越界混融、生產(chǎn)與消費(fèi)合一”趨勢(shì)的重要的大數(shù)據(jù)應(yīng)用。
程曉龍與王明亮的“大數(shù)據(jù)出版”設(shè)想可以說(shuō)是對(duì)大數(shù)據(jù)這一應(yīng)用的具體描述。程曉龍認(rèn)為,“數(shù)字出版或許應(yīng)該首先是數(shù)據(jù)出版,它整合、梳理大量?jī)?nèi)容資料,全面、細(xì)致囊括相關(guān)知識(shí),是海量數(shù)據(jù)、龐大數(shù)據(jù)庫(kù)的有效管理。其次,它將是數(shù)據(jù)關(guān)系的智能服務(wù),能夠智能挖掘、匹配一切閱讀興趣,為讀者的沉浸閱讀、深入學(xué)習(xí)提供內(nèi)容和工具,是滿足閱讀需求的數(shù)據(jù)綜合服務(wù)。最后,數(shù)字出版必將成為大數(shù)據(jù)出版,即以內(nèi)容為基準(zhǔn),包含各種服務(wù)的PB級(jí)大數(shù)據(jù);處理速度迅速、涵蓋多種類型以及信息感知無(wú)處不在、隨機(jī)變化但智慧關(guān)聯(lián)”。[12]王明亮以《中國(guó)統(tǒng)計(jì)年鑒數(shù)據(jù)庫(kù)》(CSYD)的出版為例提出“大數(shù)據(jù)出版”構(gòu)想。在他看來(lái),大數(shù)據(jù)時(shí)代的出版者需要“真正理解內(nèi)容,不斷地深入挖掘各種用戶、讀者研究和學(xué)習(xí)的需求,把出版看成是對(duì)讀者提供知識(shí)服務(wù)的過(guò)程”;“大數(shù)據(jù)出版”的核心不是出版圖書(shū)也不是發(fā)布數(shù)據(jù)信息,是“把有意義的每一條數(shù)據(jù)及其數(shù)據(jù)關(guān)系都看成是一個(gè)出版產(chǎn)品”,向讀者“提供數(shù)據(jù)服務(wù)”;更進(jìn)一步,“大數(shù)據(jù)出版”還可以指微數(shù)據(jù)與微數(shù)據(jù)在“大數(shù)據(jù)云層”中的“強(qiáng)耦合”[13]。一言以蔽之:將數(shù)據(jù)及其相互關(guān)系視為出版產(chǎn)品,為讀者提供數(shù)據(jù)關(guān)系的智能服務(wù)。
數(shù)據(jù)產(chǎn)品生產(chǎn),是指出版企業(yè)作為數(shù)據(jù)整合機(jī)構(gòu),通過(guò)對(duì)龐大的結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的分析挖掘,提煉出有價(jià)值的關(guān)于各個(gè)行業(yè)發(fā)展趨勢(shì)、市場(chǎng)行情等預(yù)測(cè)性信息,以數(shù)據(jù)圖譜或趨勢(shì)性信息的方式提供給社會(huì),供各行各業(yè)決策時(shí)參考。數(shù)據(jù)創(chuàng)意服務(wù)的實(shí)質(zhì)類似于咨詢服務(wù),出版企業(yè)通過(guò)對(duì)數(shù)據(jù)的深度挖掘與解讀,形成不同領(lǐng)域的創(chuàng)意,然后提供給相關(guān)領(lǐng)域的企業(yè)或政府部門,由后者付諸實(shí)踐。數(shù)據(jù)產(chǎn)品生產(chǎn)與數(shù)據(jù)創(chuàng)意服務(wù)提供對(duì)出版企業(yè)并非遙不可及。目前出版企業(yè)正在嘗試的將雜志或圖書(shū)內(nèi)容“碎片化”后再根據(jù)讀者需求重新整合的做法,實(shí)際就是一種數(shù)據(jù)產(chǎn)品生產(chǎn)模式。路透社的金融信息產(chǎn)品,更是典型的數(shù)據(jù)產(chǎn)品。IBM的創(chuàng)意食譜,已經(jīng)是數(shù)據(jù)分析的結(jié)果。不少出版企業(yè)將產(chǎn)品線延伸至在線服務(wù)領(lǐng)域,如中啟創(chuàng)科技與南開(kāi)大學(xué)出版社合作開(kāi)啟的“教育云平臺(tái)”、科大訊飛的“暢言教育資源云服務(wù)平臺(tái)”等,為教師、學(xué)生、出版社等提供空間及應(yīng)用服務(wù),可視為數(shù)據(jù)創(chuàng)意服務(wù)的萌芽。當(dāng)然,這與“以數(shù)據(jù)為核心”的數(shù)據(jù)產(chǎn)品生產(chǎn)與數(shù)據(jù)創(chuàng)意服務(wù)還有較大距離。一則,數(shù)據(jù)產(chǎn)品與數(shù)據(jù)創(chuàng)意服務(wù)中的“數(shù)據(jù)”,并不專指?jìng)鹘y(tǒng)出版物的內(nèi)容數(shù)據(jù),更意指出版企業(yè)在私有云和公有云中能夠獲取的全部數(shù)據(jù);二則,數(shù)據(jù)產(chǎn)品與數(shù)據(jù)創(chuàng)意服務(wù)是建立在數(shù)據(jù)關(guān)系基礎(chǔ)上的,強(qiáng)調(diào)數(shù)據(jù)與數(shù)據(jù)的精確匹配;三則,數(shù)據(jù)產(chǎn)品與數(shù)據(jù)創(chuàng)意服務(wù)的提供很多時(shí)候是一體的,是一種綜合智能服務(wù)。
三、 結(jié)語(yǔ)
大數(shù)據(jù)給傳統(tǒng)出版企業(yè)帶來(lái)了新的機(jī)遇,但傳統(tǒng)出版企業(yè)要真正通過(guò)大數(shù)據(jù)獲得“大利潤(rùn)”“大發(fā)展”殊非易事。正如Gartner的調(diào)查所顯示的,許多企業(yè)對(duì)于大數(shù)據(jù)應(yīng)用其實(shí)非常迷茫,不知道要做什么,怎么做。筆者不揣簡(jiǎn)陋,對(duì)出版企業(yè)在大數(shù)據(jù)構(gòu)建和大數(shù)據(jù)應(yīng)用兩個(gè)層面的規(guī)劃略作構(gòu)想,期冀對(duì)傳統(tǒng)出版企業(yè)掘金大數(shù)據(jù)有所裨益。最后還想強(qiáng)調(diào)的一點(diǎn)是,兩個(gè)層面的工作需要同時(shí)展開(kāi),數(shù)據(jù)規(guī)?;c數(shù)據(jù)價(jià)值挖掘需要同步。
(作者單位:武漢大學(xué)信息管理學(xué)院)
參考文獻(xiàn)
[1] 涂子沛. 大數(shù)據(jù):正在到來(lái)的數(shù)據(jù)革命,以及它如何改變政府、商業(yè)和我們的生活[M].桂林:廣西師范大學(xué)出版社,2012:37.
[2]吳鋒.“大數(shù)據(jù)時(shí)代”科技期刊的出版革命及面臨挑戰(zhàn)[J].出版發(fā)行研究,2013(8):66-70.
[3]劉志偉.云計(jì)算大數(shù)據(jù)升溫中探模式[N].中國(guó)出版?zhèn)髅缴虉?bào),2013-11-08(01).
[4]馬建光等.大數(shù)據(jù)的概念、特征及其應(yīng)用[J].國(guó)防科技,2013(2):11.
[5]余建斌,趙展慧.大數(shù)據(jù)崛起[N].人民日?qǐng)?bào),2013-02-22(20).
http://whb.news365.com.cn/wh/201207/t20120709_515721.html.
[6]陳硯青,徐璐明.小心:你讀書(shū)時(shí),“書(shū)”也在讀你[N/OL].文匯報(bào),2012-07-09. http://whb.news365.com.cn/wh/201207/t20120709_515721.html.
[7]Coliloquy:讀者和作者互動(dòng) 換個(gè)方式講故事[OL].http://tech.qq.com/a/20120119/000286.htm.
[8]楊鑫倢.終有一天 大數(shù)據(jù)會(huì)“顛覆”出版業(yè)[N/OL].IT時(shí)報(bào),2013-08-19. http://it.sohu.com/20130819/n384494421.shtml.
[9]吳鋒.“大數(shù)據(jù)時(shí)代”科技期刊的出版革命及面臨挑戰(zhàn)[J].出版發(fā)行研究,2013(8):66-70.
[10]王鈺.破壞性創(chuàng)新、大數(shù)據(jù)與圖書(shū)銷售[J].科技與出版,2013(6):85-87.
[11][法]喬治·納漢. 趙春雷編譯.“大數(shù)據(jù)”時(shí)代的計(jì)算機(jī)信息處理技術(shù)[J].世界科學(xué),2012(2).
[12]程曉龍. 數(shù)字出版的未來(lái):從“小數(shù)據(jù)”到“大數(shù)據(jù)”[N].中國(guó)新聞出版報(bào),2013-08-29(005).
[13]王明亮.關(guān)于“大數(shù)據(jù)出版”的一些體會(huì)和猜想[N].中國(guó)新聞出版報(bào),2013-08-29(005).