姜軍?
摘 要:“互聯(lián)網(wǎng)+”時(shí)代的到來(lái)讓各行業(yè)發(fā)展變得無(wú)所不能,且形成了資源融合并用的發(fā)展態(tài)勢(shì)。現(xiàn)如今,圖書(shū)出版市場(chǎng)在用戶需求方面不能及時(shí)有效滿足客戶需求,社會(huì)經(jīng)濟(jì)效益產(chǎn)能下降,正處于求新求變的轉(zhuǎn)折期。本文就基于“互聯(lián)網(wǎng)+”時(shí)代背景下的關(guān)鍵技術(shù)融合,探討了基于大數(shù)據(jù)信息采集和數(shù)據(jù)挖掘技術(shù)輔助下的圖書(shū)選題策劃新方案,證明了“互聯(lián)網(wǎng)+”思維在當(dāng)代圖書(shū)出版市場(chǎng)運(yùn)作中的有效性。
關(guān)鍵詞:“互聯(lián)網(wǎng)+”思維;圖書(shū)選題策劃;數(shù)據(jù)挖掘
中圖分類號(hào):G232.1 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-8122(2016)05-0024-02
選題策劃一直以來(lái)都被視為是圖書(shū)出版工作的重要源泉及核心,這是因?yàn)閮?yōu)秀的選題策劃可以深入讀者的內(nèi)心,探尋他們的精神文化需求,也能發(fā)揮媒介效應(yīng),拓展市場(chǎng)開(kāi)發(fā)路徑,對(duì)圖書(shū)知識(shí)領(lǐng)域做出全面性的前瞻預(yù)測(cè)和判斷。在“互聯(lián)網(wǎng)+”概念提出以后,基于數(shù)字科學(xué)互聯(lián)網(wǎng)技術(shù)的圖書(shū)選題策劃環(huán)境與出版環(huán)境也發(fā)生了巨變。因此,出版社也應(yīng)該積極調(diào)整圖書(shū)選題策劃戰(zhàn)略,多多利用“互聯(lián)網(wǎng)+”配合傳統(tǒng)出版技術(shù)與選題策劃技術(shù)來(lái)實(shí)現(xiàn)全新的企業(yè)發(fā)展策略,為全媒體時(shí)代下的圖書(shū)選題策劃創(chuàng)造新思路、新模式,同時(shí)也極力發(fā)揮選題策劃的立體化、全方位規(guī)模,為市場(chǎng)建立圖書(shū)知識(shí)品牌,為選題策劃工作增值增效。
一、“互聯(lián)網(wǎng)+”思維與圖書(shū)選題策劃
1.“互聯(lián)網(wǎng)+”思維的具體內(nèi)涵
本文所談到的“互聯(lián)網(wǎng)+”思維是基于圖書(shū)選題策劃的互聯(lián)網(wǎng)科學(xué)技術(shù)運(yùn)用,即“互聯(lián)網(wǎng)+圖書(shū)選題策劃”。圖書(shū)選題策劃是一項(xiàng)貫穿于出版社圖書(shū)制作始終的內(nèi)容,隨著當(dāng)代社會(huì)對(duì)文化知識(shí)的需求量變大,圖書(shū)市場(chǎng)競(jìng)爭(zhēng)的日趨激烈,出版社也面臨著必須革新,創(chuàng)造新業(yè)態(tài)的局面。因此在圖書(shū)從組稿、編輯、設(shè)計(jì)、宣傳到銷售等一系列流程中融入“互聯(lián)網(wǎng)+”思維,不但能夠提升圖書(shū)選題策劃的效率與創(chuàng)造性,也能提升出版社自身與市場(chǎng)、與它社的溝通能力,進(jìn)而根據(jù)市場(chǎng)發(fā)展趨勢(shì)來(lái)第一時(shí)間調(diào)整圖書(shū)選題策劃藍(lán)圖,最大限度地規(guī)避市場(chǎng)風(fēng)險(xiǎn)所帶來(lái)的不必要損失,這也是“互聯(lián)網(wǎng)+”思維在圖書(shū)選題策劃過(guò)程中的價(jià)值內(nèi)涵所在。
2.圖書(shū)的選題策劃
圖書(shū)選題策劃是圖書(shū)出版前期的重要工作,它是為了達(dá)到圖書(shū)制作的特定目標(biāo)而制定的相關(guān)計(jì)劃方案。出版社將圖書(shū)選題策劃視為是一項(xiàng)特殊的系統(tǒng)工程,這就是因?yàn)樗倪x題策劃過(guò)程會(huì)貫穿整個(gè)圖書(shū)出版的始終,對(duì)出版社全員的業(yè)務(wù)能力都是一種深度考量。具體來(lái)說(shuō),圖書(shū)的選題策劃應(yīng)該被歸納為5個(gè)步驟。
步驟1:收集信息。圖書(shū)選題策劃是系統(tǒng)工程,更是創(chuàng)意工作,所以大量的創(chuàng)意信息是不可或缺的。收集信息時(shí),應(yīng)主要注意所收集信息的用途以及對(duì)有價(jià)值信息的捕捉。前者所考察的是圖書(shū)編輯的能力,而后者則強(qiáng)調(diào)對(duì)圖書(shū)市場(chǎng)的了解程度。
步驟2:立題。立題,即為圖書(shū)確立中心思想,并在掌握大量的信息基礎(chǔ)上,建立工作實(shí)際目標(biāo),確立圖書(shū)選題。立題需要注意三方面:第一,要以出版社的特色來(lái)進(jìn)行定位,爭(zhēng)取打造特色品牌并試圖闖開(kāi)市場(chǎng);第二,在策劃大眾讀物時(shí),應(yīng)該開(kāi)放視野,挖掘大眾閱讀興趣,找準(zhǔn)切入點(diǎn);第三,一定要把握時(shí)代脈搏。
步驟3:市場(chǎng)調(diào)查。圖書(shū)市場(chǎng)調(diào)查是選題策劃中的重要一環(huán),因?yàn)樗鼡?dān)負(fù)著選題的確定與出版社的投資問(wèn)題。當(dāng)選題與投資落實(shí)以后,就要開(kāi)始進(jìn)入選題工作。選題的根本在于多多調(diào)查圖書(shū)市場(chǎng)、社會(huì)各個(gè)層面,了解市場(chǎng)中一切與所策劃選題圖書(shū)相關(guān)的知識(shí)業(yè)務(wù)領(lǐng)域。同時(shí)要了解同行的動(dòng)態(tài),確立自身競(jìng)爭(zhēng)優(yōu)勢(shì),打好圖書(shū)未來(lái)銷售策略的前期基礎(chǔ)。
步驟4:市場(chǎng)定位及生產(chǎn)。當(dāng)圖書(shū)選題確定并做好市場(chǎng)調(diào)查后就要實(shí)施市場(chǎng)定位工作,該工作的重點(diǎn)在于確認(rèn)市場(chǎng)調(diào)查結(jié)果,并確定圖書(shū)的開(kāi)本、用材以及整體設(shè)計(jì)風(fēng)格,然后再根據(jù)市場(chǎng)狀況為圖書(shū)設(shè)定頁(yè)碼、定價(jià),并根據(jù)不同的目標(biāo)讀者來(lái)定位市場(chǎng)前期銷售計(jì)劃。
在生產(chǎn)制作層面,則意味著項(xiàng)目投資的正式開(kāi)始。在這一環(huán)節(jié)中,出版社要控制的是生產(chǎn)費(fèi)用以及印刷質(zhì)量,希望在印刷前將一切質(zhì)量問(wèn)題完全解決。
步驟5:營(yíng)銷策劃。營(yíng)銷策劃也是選題策劃的最終環(huán)節(jié),它的基本實(shí)施步驟有兩點(diǎn)。其一,在圖書(shū)出版前的營(yíng)銷策劃,這段時(shí)間內(nèi)要為圖書(shū)的出版積極造勢(shì),以達(dá)到一定的宣傳效果;其二,在圖書(shū)出版后的營(yíng)銷策劃則主要包含兩個(gè)層面的工作,首先就是要做好線上線下渠道的圖書(shū)發(fā)行工作,確保沒(méi)有任何侵權(quán)行為發(fā)生,并保證圖書(shū)在最快時(shí)間內(nèi)在最廣范圍內(nèi)上架鋪貨銷售;其次就是面向目標(biāo)讀者,引發(fā)他們購(gòu)買行為的圖書(shū)發(fā)行后宣傳活動(dòng)及營(yíng)銷活動(dòng),確保圖書(shū)持續(xù)保持穩(wěn)定的銷量。
二、互聯(lián)網(wǎng)+數(shù)據(jù)挖掘技術(shù)的圖書(shū)選題策劃
1.數(shù)據(jù)的提取
以國(guó)內(nèi)某圖書(shū)購(gòu)物網(wǎng)站為例,它的每一個(gè)圖書(shū)商品頁(yè)面都涵蓋了圖書(shū)的相關(guān)信息框、圖書(shū)文本屬性,可以利用網(wǎng)頁(yè)信息抽取技術(shù)來(lái)對(duì)網(wǎng)頁(yè)中的數(shù)據(jù)進(jìn)行數(shù)據(jù)信息挖掘,并最終放入到圖書(shū)的原信息資源庫(kù)中,它可以作為隨后圖書(shū)選題策劃的元數(shù)據(jù)來(lái)使用。
基于“互聯(lián)網(wǎng)+”環(huán)境,選擇網(wǎng)頁(yè)抓取技術(shù),從圖書(shū)中抓取圖書(shū)實(shí)體信息與市場(chǎng)需求信息,構(gòu)建相應(yīng)的資源庫(kù)。因此,該圖書(shū)購(gòu)物網(wǎng)站的圖書(shū)元數(shù)據(jù)提取模擬過(guò)程如下:
首先,先提取圖書(shū)的ISBN號(hào),并為圖書(shū)信息附加如“按銷量排名”“猜你喜歡”等URL標(biāo)識(shí)參數(shù),拼接成為該網(wǎng)站圖書(shū)的高級(jí)搜索URL。
第二,模擬HTTP請(qǐng)求,在html中抽取相關(guān)的商品鏈接,并最終獲取該網(wǎng)站圖書(shū)商品的真實(shí)html鏈接與商品ID。
第三,根據(jù)上一步驟而得到html地址,并通過(guò)http請(qǐng)求來(lái)獲得圖書(shū)商品的具體頁(yè)面信息,此時(shí)利用網(wǎng)頁(yè)抓取技術(shù)抓取圖書(shū)中的詳細(xì)數(shù)據(jù),可將其作為出版社圖書(shū)信息的資源庫(kù)資料。
第四,再根據(jù)第二步來(lái)獲取圖書(shū)商品的ID,并根據(jù)互聯(lián)網(wǎng)中的圖書(shū)信息拼接它的圖書(shū)評(píng)價(jià)頁(yè)面URL,抽取用戶的評(píng)價(jià)詳情,作為選題策劃的市場(chǎng)動(dòng)態(tài)信息數(shù)據(jù)備用。
2.選題策劃的數(shù)據(jù)挖掘
選題策劃的數(shù)據(jù)挖掘基于兩點(diǎn)完成,淺度挖掘和深度挖掘。以某書(shū)《投資是一場(chǎng)旅行》為例,以下為它的選題策劃數(shù)據(jù)淺度挖掘與深度挖掘分析。
首先,淺度挖掘會(huì)根據(jù)所收集的《投資是一場(chǎng)旅行》的元數(shù)據(jù)與市場(chǎng)數(shù)據(jù)來(lái)進(jìn)行對(duì)比性的市場(chǎng)數(shù)據(jù)統(tǒng)計(jì)分析,并淺度挖掘其內(nèi)在比較有利的選題策劃信息。例如可以在網(wǎng)站直觀看到的讀者評(píng)價(jià)、銷量等。根據(jù)這些信息來(lái)為圖書(shū)選題策劃奠定信息資源基礎(chǔ)。
其次是深度挖掘。深度挖掘相對(duì)復(fù)雜,它根據(jù)圖書(shū)的選題策劃信息,利用到了貝葉斯算法,并基于大量數(shù)據(jù)來(lái)得出分析結(jié)果。貝葉斯算法的整個(gè)流程要?jiǎng)澐譃槿蟛糠?。首先是?zhǔn)備階段,網(wǎng)站系統(tǒng)會(huì)根據(jù)圖書(shū)選題策劃基本數(shù)據(jù)來(lái)生成相對(duì)應(yīng)的訓(xùn)練數(shù)據(jù),也同時(shí)為第二部分分類規(guī)則提供相應(yīng)數(shù)據(jù)參考;第二部分的主要任務(wù)則為建模,系統(tǒng)會(huì)自動(dòng)根據(jù)客戶需求來(lái)生成相關(guān)的訓(xùn)練數(shù)據(jù),并計(jì)算其中各個(gè)類別的計(jì)算數(shù)據(jù)。在每個(gè)被計(jì)算的圖書(shū)信息屬性中,都要為圖書(shū)選題策劃信息劃分屬性類別,并在信息發(fā)生的前提下驗(yàn)證信息出現(xiàn)概率,進(jìn)而建立貝葉斯模型;最后一部分則為分類階段,系統(tǒng)會(huì)自動(dòng)根據(jù)第二部分所建立的貝葉斯模型,對(duì)圖書(shū)選題策劃中的樣本計(jì)算設(shè)計(jì)概率,進(jìn)而獲得較大的信息分了概率,并推測(cè)出圖書(shū)選題策劃樣本的屬性歸類,最后獲得選題策劃信息。
3.互聯(lián)網(wǎng)+數(shù)據(jù)挖掘的圖書(shū)選題策劃設(shè)計(jì)
(1)需求分析
出版社一定要根據(jù)圖書(shū)市場(chǎng)的發(fā)展走勢(shì)、消費(fèi)者的現(xiàn)實(shí)需求反饋以及媒體的評(píng)價(jià)、圖書(shū)應(yīng)力狀況來(lái)獲取輿情信息。充分利用“互聯(lián)網(wǎng)+”技術(shù),將各個(gè)環(huán)節(jié)與互聯(lián)網(wǎng)融為一體,提升數(shù)據(jù)量,加快數(shù)據(jù)傳輸速度,并獲取利于選題策劃的相關(guān)信息。另外,為了滿足互聯(lián)網(wǎng)用戶的現(xiàn)實(shí)需求,應(yīng)該在系統(tǒng)設(shè)計(jì)中滿足選題策劃需求,基于數(shù)據(jù)挖掘來(lái)將圖書(shū)的選題策劃工作劃分為四大模塊:圖書(shū)元數(shù)據(jù)與市場(chǎng)信息提取模塊、圖書(shū)市場(chǎng)信息管理模塊、圖書(shū)市場(chǎng)信息存儲(chǔ)模塊以及數(shù)據(jù)挖掘模塊。采用Jsoup軟件進(jìn)行數(shù)據(jù)提取分析,并利用Hadoop分布式文件系統(tǒng)來(lái)存儲(chǔ)和管理大量的圖書(shū)信息,為以后的選題策劃奠定資源基礎(chǔ)。
(2)相關(guān)功能設(shè)計(jì)
這里要利用到Jsoup軟件工具對(duì)圖書(shū)選題策劃數(shù)據(jù)進(jìn)行有效提取與分析,同時(shí)基于Hadoop生態(tài)系統(tǒng)技術(shù)來(lái)為圖書(shū)市場(chǎng)挖掘有效信息,以供選題策劃使用。它所涉及的相關(guān)功能主要有以下三點(diǎn)。
第一,圖書(shū)的元數(shù)據(jù)與市場(chǎng)信息提取。該功能基于互聯(lián)網(wǎng)HTTP模擬技術(shù)完成,可以直接獲取圖書(shū)商品的信息頁(yè)面,并通過(guò)超文本文件分析與處理來(lái)去除無(wú)用信息,獲取相應(yīng)圖書(shū)中所存在的市場(chǎng)信息、用戶行為信息以及元信息數(shù)據(jù)等等。對(duì)它們的提取有利于出版社的信息數(shù)據(jù)庫(kù)建立。
第二,數(shù)據(jù)挖掘模塊。如上文提到,它被分為深度與淺度挖掘兩種。對(duì)于海量的數(shù)據(jù)選擇而言,它有利于對(duì)出版社圖書(shū)選題策劃的信息功能分類,并深入選題策劃內(nèi)容。
最后是信息反饋,通過(guò)分析選題策劃結(jié)果所涉及的圖書(shū)制作交互日志來(lái)進(jìn)一步獲取數(shù)據(jù)挖掘方案,幫助出版社明確圖書(shū)選題策劃決策。
三、總 結(jié)
在“互聯(lián)網(wǎng)+”時(shí)代,出版社應(yīng)該妥善合理地選擇相關(guān)選題策劃技術(shù),并圍繞“互聯(lián)網(wǎng)+”這一理念來(lái)豐富自己的技術(shù)理念與技術(shù)實(shí)操效果,充分發(fā)揮某些技術(shù)交流平臺(tái)的作用來(lái)完善圖書(shū)選題策劃市場(chǎng)。正如文中所提到的信息采集與數(shù)據(jù)挖掘技術(shù),將圖書(shū)選題策劃的運(yùn)用科學(xué)化、人性化、豐富化。
參考文獻(xiàn):
[1] 余人,段雨濛.“互聯(lián)網(wǎng)+”時(shí)代圖書(shū)選題創(chuàng)意從哪里來(lái)[J].出版廣角,2015(14).
[2] 徐劍.大數(shù)據(jù)時(shí)代圖書(shū)選題信息的采集模式研究[D].安徽大學(xué), 2015.
[3] 李汶羲.基于數(shù)據(jù)挖掘的選題策劃的研究與設(shè)計(jì)[D].北方工業(yè)大學(xué),2015.
[責(zé)任編輯:思涵]