【摘 要】傳統(tǒng)出版單位的數(shù)字化轉(zhuǎn)型升級與融合發(fā)展是我國“十三五”期間數(shù)字出版行業(yè)發(fā)展的核心動力。在實(shí)現(xiàn)這一跨越性發(fā)展的過程中,傳統(tǒng)出版單位,特別是擁有細(xì)分行業(yè)領(lǐng)域?qū)I(yè)數(shù)字內(nèi)容資源的出版單位,如何利用數(shù)字內(nèi)容資源優(yōu)勢,實(shí)現(xiàn)從數(shù)字化內(nèi)容服務(wù)到知識服務(wù)的轉(zhuǎn)型發(fā)展,是最重要的破局點(diǎn)。
【關(guān) 鍵 詞】知識產(chǎn)權(quán);數(shù)字出版;知識服務(wù)模式;創(chuàng)新
【作者單位】劉化冰,知識產(chǎn)權(quán)出版社有限責(zé)任公司。
一、數(shù)字出版轉(zhuǎn)型升級中的知識服務(wù)
近十余年來,我國數(shù)字出版行業(yè)從起步到不斷發(fā)展壯大,在經(jīng)歷一個高速發(fā)展的階段。2015年,我國數(shù)字出版行業(yè)營業(yè)總收入超過4400億元,成為新聞出版業(yè)重要的經(jīng)濟(jì)增長點(diǎn)和主體產(chǎn)業(yè)。2016年《新聞出版業(yè)數(shù)字出版“十三五”時期發(fā)展規(guī)劃》發(fā)布以來,我國數(shù)字出版行業(yè)正朝著年均保持17%以上增速的發(fā)展目標(biāo)不斷前進(jìn)[1]。數(shù)字出版行業(yè)版圖主要由互聯(lián)網(wǎng)期刊、電子圖書、數(shù)字報紙、博客、在線音樂、網(wǎng)絡(luò)動漫、移動出版、網(wǎng)絡(luò)游戲、在線教育和互聯(lián)網(wǎng)廣告等構(gòu)成。但在這當(dāng)中,以傳統(tǒng)出版單位為主力的互聯(lián)網(wǎng)期刊、電子圖書、數(shù)字報紙等產(chǎn)業(yè)的規(guī)模,目前在整個數(shù)字出版行業(yè)中所占比重卻低得驚人[2]。
傳統(tǒng)出版單位的數(shù)字化轉(zhuǎn)型升級與融合發(fā)展仍具有巨大的發(fā)展空間,是我國“十三五”期間數(shù)字出版行業(yè)發(fā)展的核心動力。而在實(shí)現(xiàn)這一跨越性發(fā)展的過程中,傳統(tǒng)出版單位,特別是擁有細(xì)分行業(yè)領(lǐng)域?qū)I(yè)數(shù)字內(nèi)容資源的出版單位,如何利用數(shù)字內(nèi)容資源優(yōu)勢,實(shí)現(xiàn)從數(shù)字化內(nèi)容服務(wù)到知識服務(wù)的轉(zhuǎn)型發(fā)展,是最重要的破局點(diǎn)。
目前,我國許多大中型出版社已經(jīng)實(shí)現(xiàn)專業(yè)領(lǐng)域的內(nèi)容資源數(shù)字化、體系化和標(biāo)準(zhǔn)化建設(shè),并依托具有獨(dú)特優(yōu)勢的專業(yè)領(lǐng)域數(shù)字內(nèi)容資源,開展了以數(shù)字內(nèi)容的組織、序化、檢索和傳遞為主要形式,滿足用戶特定信息獲取需求的信息服務(wù)工作。實(shí)現(xiàn)知識服務(wù)模式的轉(zhuǎn)型,還需要在經(jīng)過加工組織的數(shù)據(jù)資源基礎(chǔ)上,實(shí)現(xiàn)不同信息源之間的關(guān)聯(lián)、整合和資源集聚,并進(jìn)一步對內(nèi)容資源進(jìn)行分析、重組、集成,使之成為具有價值的知識。同時,針對用戶特定知識需求問題,經(jīng)過信息分析、重組、創(chuàng)新、集成,形成知識需求問題的綜合解決方案。
在以上的知識服務(wù)模式中,對數(shù)字內(nèi)容資源的利用,已經(jīng)不局限于數(shù)據(jù)本身,而是要基于特定的問題需求,在更多形式類型的數(shù)字內(nèi)容資源中通過深度關(guān)聯(lián)、組織和挖掘,產(chǎn)生更多的二次元、三次元甚至更高次元的知識資源來滿足社會需求。簡單來說,以往的信息服務(wù)模式是一種“鉆取式”的服務(wù),即用戶從海量的信息庫當(dāng)中通過檢索、篩選和分析,抽絲剝繭地挖掘出自己需要的知識。而知識服務(wù)則是通過各種技術(shù)處理產(chǎn)生更多具有價值的知識資源,以推送的方式,將知識直接呈現(xiàn)在用戶面前,用戶可以根據(jù)自身需要從中進(jìn)行抽取選擇。形象地說,知識服務(wù)是一種“抽取式”服務(wù)。
二、互聯(lián)網(wǎng)時代,數(shù)字出版行業(yè)發(fā)展知識服務(wù)所面臨的新挑戰(zhàn)和機(jī)遇
互聯(lián)網(wǎng)時代促使大數(shù)據(jù)資源產(chǎn)生、共享、集聚和關(guān)聯(lián),使得數(shù)字化內(nèi)容資源以不同產(chǎn)品形式、服務(wù)形態(tài)和運(yùn)營模式快速發(fā)展。對于數(shù)字出版行業(yè)而言,這既是一個最好的時代,也是一個最嚴(yán)峻的時代。發(fā)展知識服務(wù)模式,并不是一種全新的理念,而是在互聯(lián)網(wǎng)時代下,數(shù)字出版行業(yè)發(fā)展的必然選擇之一。新形勢下,數(shù)字出版行業(yè)發(fā)展知識服務(wù)模式挑戰(zhàn)和機(jī)遇并存。
第一,互聯(lián)網(wǎng)技術(shù)的發(fā)展。Web2.0模式的蓬勃發(fā)展,使得以用戶信息產(chǎn)生和共享為核心的互聯(lián)網(wǎng)信息內(nèi)容急速膨脹。通過移動端、PC端和無線端,各類數(shù)字化內(nèi)容不斷搶奪信息入口。如今,通過人們的眼球、耳膜乃至觸覺所接收的各種信息呈幾何級數(shù)增長。這讓我們在更加便捷地獲取知識的同時,也必須忍受超載的信息負(fù)荷。在這個信息膨脹的時代,用戶主動獲取信息的積極性正在急劇下降,傳統(tǒng)數(shù)據(jù)庫內(nèi)容加搜索引擎的服務(wù)模式已經(jīng)不是用戶的第一選擇。更多用戶更愿意接收通過用戶畫像、智能挖掘、點(diǎn)評排名等方式推送的精準(zhǔn)知識,同時他們也希望推送過程能夠?qū)崿F(xiàn)無效信息和垃圾信息的過濾。
第二,知識付費(fèi)服務(wù)模式逐步實(shí)現(xiàn)。首先,由于用戶通過互聯(lián)網(wǎng)所能夠接收到的信息內(nèi)容越來越豐富,因此他們更希望接收一些高質(zhì)量和提供優(yōu)質(zhì)用戶體驗(yàn)的信息內(nèi)容。其次,由于互聯(lián)網(wǎng)支付手段的完善與發(fā)展,用戶對高質(zhì)量信息資源的消費(fèi)和付費(fèi)習(xí)慣已經(jīng)逐步養(yǎng)成。再次,C端用戶在互聯(lián)網(wǎng)信息消費(fèi)方面已經(jīng)具有較大規(guī)模。這些使得以往數(shù)字出版行業(yè)中不太可能實(shí)現(xiàn)的一些知識付費(fèi)服務(wù)模式逐步具備可以實(shí)現(xiàn)商業(yè)化的土壤,但其中關(guān)鍵的依然是產(chǎn)品內(nèi)容質(zhì)量和服務(wù)品質(zhì)的提升。
第三,數(shù)字出版行業(yè)的發(fā)展。這一定程度上使得傳統(tǒng)出版行業(yè)結(jié)束了相對單一的產(chǎn)品形態(tài)發(fā)展模式,轉(zhuǎn)而形成產(chǎn)品與服務(wù)多元化的服務(wù)體系。基于互聯(lián)網(wǎng)產(chǎn)生的數(shù)字出版產(chǎn)品與服務(wù),品種眾多、內(nèi)容多元、服務(wù)模式各異??梢哉f,數(shù)字出版的發(fā)展,一方面使得用戶信息消費(fèi)的選擇更多,另一方面也催生了數(shù)字出版行業(yè)的細(xì)分市場。數(shù)字出版行業(yè)的市場細(xì)分主要體現(xiàn)在兩個方面。
一是基于專業(yè)內(nèi)容領(lǐng)域的細(xì)分,新聞出版領(lǐng)域的特點(diǎn)之一就是廣泛傳播人類社會的各種知識信息,因此內(nèi)容資源涉及的相關(guān)行業(yè)領(lǐng)域眾多。隨著數(shù)字出版的發(fā)展和直達(dá)用戶的信息傳播服務(wù)的出現(xiàn),用戶對精準(zhǔn)投放信息和專業(yè)內(nèi)容資源產(chǎn)生了迫切需求,更多用戶希望通過專業(yè)內(nèi)容資源平臺,得到不同專業(yè)領(lǐng)域中關(guān)于知識內(nèi)容資源的專業(yè)化、特色化服務(wù)。二是基于產(chǎn)品服務(wù)形態(tài)的用戶細(xì)分。當(dāng)下互聯(lián)網(wǎng)期刊、電子圖書、數(shù)字報紙等產(chǎn)品主力消費(fèi)人群逐步形成,不同類型的數(shù)字產(chǎn)品和服務(wù)不太可能像傳統(tǒng)圖書一樣適合廣泛的用戶群體,而是轉(zhuǎn)向了特定消費(fèi)人群和消費(fèi)渠道。因此,數(shù)字出版產(chǎn)品與服務(wù)的發(fā)展,應(yīng)當(dāng)更多聚焦到解決特定用戶需求、服務(wù)特定用戶群體上。
三、知識產(chǎn)權(quán)領(lǐng)域知識服務(wù)的現(xiàn)狀與思考
多年來筆者有幸參與知識產(chǎn)權(quán)專業(yè)領(lǐng)域數(shù)字出版的一些工作,并在工作中見證了這一領(lǐng)域的不斷發(fā)展。與其他領(lǐng)域不同,知識產(chǎn)權(quán)專業(yè)領(lǐng)域的數(shù)字出版發(fā)展較早,在20世紀(jì)90年代就開展了專利內(nèi)容資源的數(shù)字化建設(shè)。2000年,中國知識產(chǎn)權(quán)網(wǎng)最先開通了中外專利信息檢索服務(wù),實(shí)現(xiàn)了對國內(nèi)外專利信息的一站式檢索,這也是國內(nèi)探索知識產(chǎn)權(quán)數(shù)字內(nèi)容資源信息服務(wù)的開端。
傳統(tǒng)意義上的知識產(chǎn)權(quán)內(nèi)容資源包括專利、商標(biāo)、著作權(quán)、植物新品種、集成電路布圖設(shè)計專有權(quán)、標(biāo)準(zhǔn)及科技成果等數(shù)據(jù)信息。具體情況如下。
第一,專利數(shù)據(jù)資源。全球?qū)@暾埩恳堰_(dá)到億級以上,涵蓋了科技信息、法律信息和經(jīng)濟(jì)信息,專利從申請到公開、授權(quán)、復(fù)審、無效、運(yùn)營等環(huán)節(jié)都會產(chǎn)生大量數(shù)據(jù)。
第二,著作權(quán)數(shù)據(jù)資源。論文、圖書、書畫、音像作品等創(chuàng)作內(nèi)容皆為著作權(quán)數(shù)據(jù)信息,囊括了不同領(lǐng)域、不同類型的數(shù)據(jù)。
第三,其他知識產(chǎn)權(quán)數(shù)據(jù)。除了上述專利數(shù)據(jù)和著作權(quán)數(shù)據(jù),工業(yè)領(lǐng)域有作為產(chǎn)品標(biāo)識的商標(biāo)數(shù)據(jù),農(nóng)業(yè)領(lǐng)域有培育植物新品種權(quán)數(shù)據(jù),半導(dǎo)體領(lǐng)域有集成電路布圖設(shè)計專有權(quán)數(shù)據(jù),計算機(jī)領(lǐng)域有軟件著作權(quán)數(shù)據(jù),此外,還有企業(yè)商業(yè)情報數(shù)據(jù)及科技成果數(shù)據(jù)等。
以上知識產(chǎn)權(quán)數(shù)據(jù)信息蘊(yùn)含了豐富的科技信息、法律信息和經(jīng)濟(jì)信息,具有重要的科技價值、法律價值和經(jīng)濟(jì)價值。
如何開展知識產(chǎn)權(quán)領(lǐng)域?qū)I(yè)內(nèi)容資源的知識服務(wù),筆者認(rèn)為主要的方式有兩種。一是data from data(數(shù)據(jù)生數(shù)據(jù))。知識產(chǎn)權(quán)(特別是專利)自身就具有知識內(nèi)容屬性并得到了應(yīng)用,在這些內(nèi)容資源的基礎(chǔ)上,可以不斷加工、挖掘以產(chǎn)生具有應(yīng)用價值的知識資源。二是data to data(數(shù)據(jù)聯(lián)數(shù)據(jù))。知識產(chǎn)權(quán)內(nèi)容資源不僅具有豐富的內(nèi)涵,也具備與其他數(shù)據(jù)相關(guān)聯(lián)的紐帶,通過知識產(chǎn)權(quán)數(shù)據(jù)與其他各種數(shù)據(jù)資源互聯(lián)互通,最終整合產(chǎn)生的數(shù)據(jù)將具有新的知識價值。from data to data,即只有發(fā)掘數(shù)據(jù)更多的用途,使其產(chǎn)生更多的價值,知識服務(wù)才可能找到更多應(yīng)用場景,才可以做更多的事情。
從未來發(fā)展來看,知識產(chǎn)權(quán)專業(yè)內(nèi)容資源的知識服務(wù),主要可以拓展的應(yīng)用場景有以下幾個。第一是政務(wù)管理。知識產(chǎn)權(quán)內(nèi)容資源對于政府決策和事務(wù)管理的價值不僅體現(xiàn)在各種分析研究報告中,趨勢預(yù)測、動態(tài)監(jiān)控、行業(yè)管理、績效評價、政務(wù)管理……很多方面都可能應(yīng)用到知識產(chǎn)權(quán)相關(guān)的知識服務(wù)。第二是技術(shù)創(chuàng)新。實(shí)現(xiàn)多種知識產(chǎn)權(quán)數(shù)據(jù)內(nèi)容的互聯(lián)互通,可以讓我們更加全面地描繪出行業(yè)、技術(shù)領(lǐng)域的技術(shù)面貌和發(fā)展路線,甚至繪制出完美的知識圖譜。第三是科技金融。知識產(chǎn)權(quán)的價值展現(xiàn)是知識服務(wù)的主要方向之一。在其他領(lǐng)域已經(jīng)實(shí)現(xiàn)通過知識服務(wù)發(fā)現(xiàn)潛在價值和商機(jī)的背景下,在金融領(lǐng)域我們需要結(jié)合更多的知識資源和采用先進(jìn)的算法模型來實(shí)現(xiàn)知識產(chǎn)權(quán)的價值。第四是社交。關(guān)注知識產(chǎn)權(quán)的人來自各行各業(yè),其中有科研工作者、發(fā)明家、企業(yè)家、服務(wù)者、政府官員、藝術(shù)家、法務(wù)工作者、投資人等,這些人群通過知識產(chǎn)權(quán)的權(quán)利效應(yīng)產(chǎn)生不同程度的關(guān)聯(lián),他們是知識產(chǎn)權(quán)知識服務(wù)的精準(zhǔn)用戶。
四、知識產(chǎn)權(quán)領(lǐng)域知識服務(wù)新模式的探索實(shí)踐
在知識產(chǎn)權(quán)領(lǐng)域傳統(tǒng)信息服務(wù)基礎(chǔ)上,筆者所在團(tuán)隊(duì)近年來不斷探索全新的知識服務(wù)模式。通過積累和加工數(shù)字內(nèi)容資源,知識產(chǎn)權(quán)出版社有限責(zé)任公司目前已形成了國內(nèi)規(guī)模最大、資源種類最多的知識產(chǎn)權(quán)大數(shù)據(jù)資源庫,實(shí)現(xiàn)了專利、商標(biāo)、版權(quán)等多種知識產(chǎn)權(quán)數(shù)據(jù)內(nèi)容資源的整合和關(guān)聯(lián)。同時,基于這些數(shù)字內(nèi)容資源,開發(fā)建設(shè)中國知識產(chǎn)權(quán)大數(shù)據(jù)與智慧服務(wù)系統(tǒng)——知了網(wǎng)、專利代理機(jī)構(gòu)導(dǎo)航評價系統(tǒng)、企業(yè)知識產(chǎn)權(quán)商情服務(wù)系統(tǒng)——知企查等產(chǎn)品。下面筆者就這些知識服務(wù)產(chǎn)品的部分應(yīng)用場景和服務(wù)模式進(jìn)行介紹。
1.垂直導(dǎo)航技術(shù)應(yīng)用
在中國知識產(chǎn)權(quán)大數(shù)據(jù)與智慧服務(wù)系統(tǒng)中,我們在檢索結(jié)果中引入了垂直導(dǎo)航技術(shù),用戶可以在專利搜索結(jié)果的概覽界面上,查看左側(cè)的分類項(xiàng)數(shù)據(jù)導(dǎo)航條。不同的檢索系統(tǒng)中,數(shù)據(jù)導(dǎo)航條設(shè)置的項(xiàng)目是不同的。
這些數(shù)據(jù)導(dǎo)航條的設(shè)置,可以讓用戶快速了解當(dāng)前專利檢索的結(jié)果當(dāng)中各類型數(shù)據(jù)的分布情況,既可以幫助用戶快速了解數(shù)據(jù)信息,又可以給用戶的數(shù)據(jù)應(yīng)用提供引導(dǎo)。例如,當(dāng)用戶通過區(qū)域代碼檢索江蘇省的全部專利文獻(xiàn)的時候,他們可以從不同維度上了解相應(yīng)專利數(shù)據(jù)的統(tǒng)計結(jié)果,并進(jìn)一步查閱相關(guān)的數(shù)據(jù)信息。通過這些數(shù)據(jù)導(dǎo)航條,用戶可以了解到江蘇省歷年專利申請情況,當(dāng)前有效、無效和在審查專利的分布情況,專利運(yùn)營轉(zhuǎn)化的情況以及技術(shù)合作的情況,等等。
專利導(dǎo)航條則可以幫助用戶進(jìn)一步優(yōu)化專利檢索策略,實(shí)現(xiàn)更加符合檢索需求的專利檢索。例如,用戶可以查閱當(dāng)前檢索結(jié)果中的IPC分布情況,查看當(dāng)前檢索結(jié)果中都有哪些關(guān)鍵詞,以及其中主要的專利申請人的情況,等等。
而且,垂直導(dǎo)航技術(shù)還可以幫助用戶快速定位自己感興趣的專利數(shù)據(jù)。這樣,用戶就不必每次在檢索過程中去設(shè)計復(fù)雜煩瑣的檢索表達(dá)式,只需要事先鎖定檢索范圍,就可以準(zhǔn)確查詢他們所需要的專利文獻(xiàn)信息。這種模式,可以幫助用戶快速定位所關(guān)注的知識情報。
2.可視化檢索應(yīng)用
通過采用知識圖譜的理念和技術(shù),我們可以讓用戶在可視化的環(huán)境中完成專利檢索的工作。傳統(tǒng)模式下,專利檢索的步驟包括確定檢索主題、確定專利的分類位置和關(guān)鍵詞,構(gòu)建檢索策略、實(shí)施初步檢索,調(diào)整完善檢索策略,對檢索結(jié)果進(jìn)行修補(bǔ),完成檢索過程五步。在這種模式下,完成一次專業(yè)化的專利檢索,信息工程師往往需要花費(fèi)大量時間進(jìn)行檢索表達(dá)式的編輯,確定檢索分類位置和查找同義詞、相關(guān)詞。并且,在這個過程中,用戶往往需要查詢和閱讀大量文獻(xiàn),才能更好地確定檢索所用的關(guān)鍵詞和分類號。
而采用如圖1的可視化檢索方式,可以建立仿人工思維的智能化檢索模式。我們直接輸入需要檢索的原始文本內(nèi)容,系統(tǒng)就會自動進(jìn)行關(guān)鍵詞的抽取,并進(jìn)一步聯(lián)想到這些關(guān)鍵詞的相關(guān)詞、分類位置和申請人等知識,通過對這些知識的組合,就可以讓用戶快速構(gòu)建起較為專業(yè)的專利檢索表達(dá)式。
3.構(gòu)建行業(yè)和企業(yè)級知識圖譜
行業(yè)和企業(yè)級知識圖譜的構(gòu)建與常規(guī)的行業(yè)、企業(yè)專利分析不盡相同。通過構(gòu)建知識圖譜,可以建立更多維度的數(shù)據(jù)關(guān)聯(lián),從而可以從更多的視角洞悉行業(yè)和企業(yè)的知識產(chǎn)權(quán)情況。
以企業(yè)為例,圖2中展現(xiàn)的是企業(yè)知識圖譜構(gòu)建的全過程。首先,企業(yè)從互聯(lián)網(wǎng)和各種數(shù)據(jù)庫中獲取與企業(yè)相關(guān)的各種數(shù)據(jù)信息,通過算法的抽取和集成,抽取其中的企業(yè)實(shí)體名稱及各種事先定義好的屬性信息,再通過人工篩查分類,形成基于RDF三元組的各種企業(yè)和屬性標(biāo)準(zhǔn)知識庫。其次,這些知識庫可以進(jìn)一步與企業(yè)相關(guān)的各種知識產(chǎn)權(quán)信息關(guān)聯(lián),包括專利、商標(biāo)、標(biāo)準(zhǔn)和著作權(quán)等信息,這樣就構(gòu)成了企業(yè)知識產(chǎn)權(quán)知識庫。采用知識圖譜對這些知識庫進(jìn)行深度分析挖掘,就可以形成不同維度(企業(yè)本身、行業(yè)、區(qū)域等)的知識圖譜。
通過這些知識圖譜,我們可以挖掘分析企業(yè)的知識產(chǎn)權(quán)創(chuàng)新能力,可以用不同的指標(biāo)分析企業(yè)整體知識產(chǎn)權(quán)情況,包括其專利權(quán)利狀況、總體數(shù)量、運(yùn)營情況、主要研發(fā)團(tuán)隊(duì)、專利代理情況、技術(shù)領(lǐng)域情況,等等,可以進(jìn)一步關(guān)聯(lián)企業(yè)的工商、金融等情報信息,并實(shí)現(xiàn)對企業(yè)商標(biāo)、版權(quán)和標(biāo)準(zhǔn)等知識產(chǎn)權(quán)信息的關(guān)聯(lián)發(fā)現(xiàn)。
總之,基于知識產(chǎn)權(quán)大數(shù)據(jù),知識產(chǎn)權(quán)領(lǐng)域知識服務(wù)的探索還有很長的路要走,特別是人工智能技術(shù)的引入,為我們進(jìn)一步開展基于專業(yè)內(nèi)容資源基礎(chǔ)的深度知識服務(wù)提供了想象的空間。
|參考文獻(xiàn)|
[1]新聞出版業(yè)數(shù)字出版“十三五”時期發(fā)展規(guī)劃[Z]. 國家新聞出版廣電總局,2016.
[2]2015—2016中國數(shù)字出版產(chǎn)業(yè)年度報告[Z]. 中國新聞出版研究院,2016.