聶靜 沈菁
摘要 數(shù)字出版技術(shù)的飛速發(fā)展,日益強(qiáng)化對(duì)辭書(shū)版權(quán)的保護(hù)力度。以信息網(wǎng)絡(luò)作為產(chǎn)品傳播途徑的數(shù)字出版技術(shù),已經(jīng)能夠有效地保證對(duì)辭書(shū)的使用必須事先獲得權(quán)利人的授權(quán);有效防止對(duì)整部辭書(shū)的非法復(fù)制;嚴(yán)格監(jiān)控對(duì)辭書(shū)條目的分批復(fù)制,及時(shí)制止惡意復(fù)制傾向;對(duì)侵權(quán)者不惜成本、用原始手段抄襲辭書(shū)條目的行為,也能較便捷地查核??梢哉f(shuō),隨著現(xiàn)代數(shù)字化信息技術(shù)的快速發(fā)展而形成的數(shù)字出版方式,已經(jīng)能夠?yàn)閿?shù)字化辭書(shū)提供比紙質(zhì)辭書(shū)強(qiáng)大得多的版權(quán)保護(hù)支持。
關(guān)鍵詞 數(shù)字出版 信息技術(shù) 辭書(shū) 版權(quán)保護(hù)
關(guān)于數(shù)字出版,目前國(guó)際上還沒(méi)有一致公認(rèn)的定義。在我國(guó)出版界,較為通行的觀點(diǎn)認(rèn)為“數(shù)字出版是指利用數(shù)字技術(shù)進(jìn)行內(nèi)容編輯加工,并通過(guò)網(wǎng)絡(luò)傳播數(shù)字內(nèi)容產(chǎn)品的一種新型出版方式”(新聞出版總署《關(guān)于加快我國(guó)數(shù)字出版產(chǎn)業(yè)發(fā)展的若干意見(jiàn)》)。筆者也認(rèn)同這一觀點(diǎn),所以,下文的“數(shù)字出版”都僅指上述意義上的出版方式。
數(shù)字出版的產(chǎn)品采用的是符合國(guó)際標(biāo)準(zhǔn)的編碼數(shù)字形式,不需與具有一定外在形態(tài)的物質(zhì)載體固定在一起。出版者將各種信息(文字、圖片、聲音、活動(dòng)影像等)轉(zhuǎn)換成編碼數(shù)字集合體,再以數(shù)字流的形式傳輸給消費(fèi)者。消費(fèi)者接受、使用數(shù)字出版產(chǎn)品,都需要利用自己預(yù)先配備的電子設(shè)備進(jìn)行解碼,把編碼數(shù)字還原成人可以感知的信息形式。通俗地說(shuō),數(shù)字出版是“只售內(nèi)容,不賣(mài)載體”。這與其他各種出版物的銷(xiāo)售是根本不同的。
不少人認(rèn)為,數(shù)字化的辭書(shū)具有無(wú)損復(fù)制、易于分發(fā)等重要特征,因此容易被人隨意非法復(fù)制并通過(guò)各類(lèi)信息網(wǎng)絡(luò)分發(fā)、傳播,這必將給辭書(shū)作者和出版者造成嚴(yán)重的損失。然而筆者以為,隨著現(xiàn)代數(shù)字化信息技術(shù)的快速發(fā)展而形成的數(shù)字出版方式,已經(jīng)能夠?yàn)閿?shù)字化辭書(shū)提供比紙質(zhì)辭書(shū)強(qiáng)大得多的版權(quán)保護(hù)支持。本文試對(duì)此進(jìn)行分析,以求教于方家、學(xué)者。
一、數(shù)字出版能保證對(duì)辭書(shū)的使用必須得到授權(quán)
數(shù)字出版能通過(guò)數(shù)字版權(quán)管理(Digital Rights Management,以下簡(jiǎn)稱(chēng)DRM)系統(tǒng)對(duì)辭書(shū)的使用進(jìn)行控制。這一系統(tǒng)依靠數(shù)據(jù)加密、訪(fǎng)問(wèn)控制、身份認(rèn)證、密鑰管理等一系列技術(shù)手段,只允許得到合法授權(quán)的消費(fèi)者使用相應(yīng)辭書(shū)。
DRM系統(tǒng)采用密碼學(xué)原理,將數(shù)字化內(nèi)容打包、加密,使之成為標(biāo)準(zhǔn)DRM內(nèi)容格式文件。這種文件須利用相應(yīng)的密鑰解密后,才可以反轉(zhuǎn)為人類(lèi)感官能夠辨識(shí)的信息內(nèi)容。數(shù)字辭書(shū)上網(wǎng)之后,DRM系統(tǒng)還能夠控制消費(fèi)者對(duì)該辭書(shū)的訪(fǎng)問(wèn)。消費(fèi)者如果要查閱某種辭書(shū),必須先向DRM系統(tǒng)的“許可證管理”子系統(tǒng)提出申請(qǐng)并履行一定手續(xù)(如付費(fèi)),才能得到密鑰和授權(quán)證書(shū),同時(shí)系統(tǒng)自動(dòng)將消費(fèi)者的身份信息和終端設(shè)備信息記載在案。消費(fèi)者使用某種辭書(shū)時(shí),DRM系統(tǒng)首先根據(jù)由消費(fèi)者所登錄的“DRM代理”子系統(tǒng)發(fā)來(lái)的密鑰、消費(fèi)者身份及其終端設(shè)備信息,判斷該消費(fèi)者是否有權(quán)使用這種數(shù)字辭書(shū)。如果判斷結(jié)果為“否”,系統(tǒng)就會(huì)自動(dòng)拒絕消費(fèi)者的登錄請(qǐng)求;如果結(jié)果為“是”,系統(tǒng)便自動(dòng)創(chuàng)建版權(quán)對(duì)象。版權(quán)對(duì)象的作用是根據(jù)授權(quán)證書(shū)的描述對(duì)有關(guān)辭書(shū)內(nèi)容的使用權(quán)利進(jìn)行限定。版權(quán)對(duì)象中也包括內(nèi)容密鑰,以保證消費(fèi)者只有拿到相應(yīng)的“鑰匙”才能開(kāi)啟對(duì)應(yīng)的內(nèi)容。版權(quán)對(duì)象本身也由DRM系統(tǒng)加密,以防止他人非法修改授權(quán)的種類(lèi)和范圍。在版權(quán)對(duì)象創(chuàng)建后,系統(tǒng)應(yīng)消費(fèi)者的請(qǐng)求將有關(guān)辭書(shū)的內(nèi)容打包,與版權(quán)對(duì)象一起,通過(guò)一定的機(jī)制、形式傳遞給“DRM代理”子系統(tǒng),再由“DRM代理”解析、解密內(nèi)容并提供給消費(fèi)者使用。這個(gè)過(guò)程大致如圖1所示。
由上可見(jiàn),出版者將數(shù)字出版產(chǎn)品傳輸給獲得有效授權(quán)的消費(fèi)者時(shí)是“一對(duì)一”地嚴(yán)格定向的,授權(quán)過(guò)程相當(dāng)嚴(yán)密。傳輸過(guò)程中承載數(shù)字流形式產(chǎn)品的臨時(shí)物質(zhì)載體是電流、光電波或電磁波,而傳輸過(guò)程結(jié)束后,相應(yīng)的編碼數(shù)字集合體在臨時(shí)物質(zhì)載體上就不再存在,任何第三方都不可能接觸到。至于在消費(fèi)者自備的終端設(shè)備上,相應(yīng)的數(shù)字出版產(chǎn)品是僅僅臨時(shí)存在還是可永久存儲(chǔ),可由出版者利用數(shù)字技術(shù)實(shí)現(xiàn)有效控制。這就可以有效地保證使用數(shù)字化辭書(shū)的消費(fèi)者都是獲得合法授權(quán)的,從而保證辭書(shū)著作權(quán)人和出版者的利益不受侵害。同時(shí),雖然過(guò)程繁復(fù),但因?yàn)槎际怯捎?jì)算機(jī)系統(tǒng)自動(dòng)完成的,不需人工處理,并且數(shù)據(jù)量小,所以速度很快,營(yíng)運(yùn)成本也非常低廉。
二、數(shù)字出版能對(duì)整部辭書(shū)的版權(quán)實(shí)現(xiàn)保護(hù)
辭書(shū)版權(quán)保護(hù)的重要作用之一,就是防止非法復(fù)制(包括打?。?,尤其是防止對(duì)整部辭書(shū)的非法復(fù)制。采用電子出版物形式(即知識(shí)內(nèi)容、消費(fèi)者操作系統(tǒng)和載體都結(jié)合在一起銷(xiāo)售的產(chǎn)品)出版數(shù)字辭書(shū),數(shù)字辭書(shū)遭受盜版的危險(xiǎn)性非常大。當(dāng)年光盤(pán)版《中國(guó)大百科全書(shū)》被非法復(fù)制的不幸遭遇,辭書(shū)界人士都還記憶猶新。現(xiàn)在,數(shù)字出版可以有效防止整部辭書(shū)被非法復(fù)制。
消費(fèi)者對(duì)辭書(shū)的正常使用,一般都是查閱其中的某些條目,而不是通讀整部辭書(shū)。因此,利用與“云技術(shù)”相結(jié)合的數(shù)據(jù)庫(kù)出版技術(shù),是辭書(shū)數(shù)字出版的主要方向。在這種出版環(huán)境中,消費(fèi)者可以從儲(chǔ)存海量信息的在線(xiàn)數(shù)據(jù)庫(kù)中選擇獲得自己所需要的信息,但是不能獲取數(shù)據(jù)庫(kù)的全部?jī)?nèi)容。
出版者可以把定稿的辭書(shū)內(nèi)容進(jìn)行數(shù)字化結(jié)構(gòu)標(biāo)引,建立基礎(chǔ)數(shù)據(jù)庫(kù),并通過(guò)統(tǒng)一規(guī)范的平臺(tái)管理和運(yùn)營(yíng)。目前,主要采用“可擴(kuò)展標(biāo)記語(yǔ)言”(Extensible Markup Language,以下簡(jiǎn)稱(chēng)XML)對(duì)數(shù)字內(nèi)容進(jìn)行結(jié)構(gòu)化標(biāo)引。XML是國(guó)際上通用的標(biāo)引工具,具有良好的自描述性、可擴(kuò)展性等優(yōu)點(diǎn),可以對(duì)異質(zhì)的多個(gè)數(shù)據(jù)源進(jìn)行結(jié)構(gòu)化,以統(tǒng)一的數(shù)據(jù)格式重現(xiàn)給讀者。同時(shí),標(biāo)準(zhǔn)化的數(shù)據(jù)庫(kù)內(nèi)容,便于實(shí)施查詢(xún)、插入、更新、刪除等操作。
運(yùn)用與云技術(shù)相結(jié)合的數(shù)據(jù)庫(kù)出版方式,能使辭書(shū)的每個(gè)條目都相對(duì)獨(dú)立地存在于數(shù)據(jù)庫(kù)中,儲(chǔ)存在出版者的服務(wù)器上。消費(fèi)者使用辭書(shū)時(shí),服務(wù)器的數(shù)據(jù)庫(kù)搜索查詢(xún)系統(tǒng)按照查閱需求,只把相應(yīng)的一個(gè)或若干個(gè)條目的內(nèi)容加密后發(fā)送到消費(fèi)者終端設(shè)備,而不會(huì)顯示整部辭書(shū)的結(jié)構(gòu)和所有條目的內(nèi)容。同時(shí),出版者服務(wù)器發(fā)送的內(nèi)容僅僅是臨時(shí)性地進(jìn)入消費(fèi)者終端設(shè)備內(nèi)存并在屏幕上顯示,當(dāng)消費(fèi)者退出閱讀界面后,內(nèi)存中的信息即自動(dòng)清除,不能長(zhǎng)久保存。就是說(shuō),消費(fèi)者通常不可能把整部辭書(shū)下載并保存到自己的終端設(shè)備上。此過(guò)程如圖2所示。
這樣,未得到作者或出版者授權(quán)的任何人就難以擅自復(fù)制某種數(shù)字化辭書(shū)的全部?jī)?nèi)容,甚至由于不能觀看到整部辭書(shū),所以連剽竊辭書(shū)的總體框架結(jié)構(gòu)都是很難的。
相比紙質(zhì)辭書(shū)或光盤(pán)版電子辭書(shū)經(jīng)常被人輕易地整書(shū)復(fù)制的高風(fēng)險(xiǎn),數(shù)字出版技術(shù)對(duì)辭書(shū)版權(quán)的保護(hù)無(wú)疑有巨大的進(jìn)步。
三、數(shù)字出版能對(duì)辭書(shū)內(nèi)容的部分復(fù)制進(jìn)行有效監(jiān)控
辭書(shū)中的條目具有相對(duì)獨(dú)立性,除了少量的副條(參見(jiàn)條)外,絕大部分正條能夠?qū)δ硞€(gè)知識(shí)點(diǎn)或信息項(xiàng)提供相對(duì)完整的解釋?zhuān)哂兄R(shí)自足性。所以,辭書(shū)條目常常能夠獨(dú)立使用,而依據(jù)某種特點(diǎn)選擇一定數(shù)量的條目按一定次序匯編在一起,即能組成一部辭書(shū)。也正是因?yàn)檫@個(gè)特點(diǎn),以往的辭書(shū)版權(quán)侵權(quán)者大都是從若干部辭書(shū)中大量抄襲條目,然后重新編排一下,就將其作為自己“編纂”的辭書(shū)。
在數(shù)字出版中,辭書(shū)條目的內(nèi)容是要按照消費(fèi)者的查閱需求在其接收終端屏幕上顯示的。這樣,如果有人利用獲得正常授權(quán)的機(jī)會(huì),將屏幕上顯示的條目?jī)?nèi)容逐一復(fù)制后粘貼到一個(gè)自己新建的文件中,那么,經(jīng)過(guò)多次反復(fù)操作,豈不是仍然能夠把某種數(shù)字辭書(shū)的內(nèi)容全部變成自己能夠掌控并隨意使用的電子文件?這種可能性是存在的。我們?nèi)粘I暇W(wǎng)查詢(xún)到的內(nèi)容信息,往往都能用類(lèi)似方法將之復(fù)制下來(lái),然后保存為一個(gè)新的電子文件,雖然有時(shí)會(huì)丟失一些格式。
然而,目前數(shù)字出版技術(shù)已經(jīng)可對(duì)消費(fèi)者復(fù)制屏幕內(nèi)容的行為進(jìn)行有效控制。如位于上海浦東張江國(guó)家數(shù)字出版基地的上海精靈天下數(shù)字技術(shù)有限公司針對(duì)數(shù)字出版物版權(quán)保護(hù)需求開(kāi)發(fā)的軟件系統(tǒng),就能對(duì)消費(fèi)者的復(fù)制行為進(jìn)行控制。其中最為嚴(yán)格的控制,是不允許消費(fèi)者對(duì)屏幕上出現(xiàn)的內(nèi)容進(jìn)行包括打印在內(nèi)的任何方式的復(fù)制,甚至連一般計(jì)算機(jī)操作系統(tǒng)自帶的或第三方軟件提供的“截屏”功能、屏幕錄像功能等,都被禁止。當(dāng)然,考慮到消費(fèi)者在進(jìn)行研究、創(chuàng)作的過(guò)程中常常會(huì)產(chǎn)生的文獻(xiàn)引用和搜集相關(guān)資料的善意需求(這屬于著作權(quán)法允許的合理使用范圍),這個(gè)數(shù)字版權(quán)保護(hù)系統(tǒng)也能夠允許消費(fèi)者少量復(fù)制屏幕上顯示的內(nèi)容,但是權(quán)利人(著作權(quán)人或出版權(quán)享有者)可以結(jié)合使用時(shí)間、操作次數(shù)、內(nèi)容數(shù)量制定相應(yīng)的授權(quán)范圍。例如:對(duì)每天可以復(fù)制的次數(shù)、每次可以復(fù)制的字符數(shù)量進(jìn)行自動(dòng)控制,一旦某個(gè)消費(fèi)者對(duì)某部辭書(shū)內(nèi)容的復(fù)制超過(guò)限額,系統(tǒng)就自動(dòng)不再允許復(fù)制。假如有人企圖通過(guò)在許多天內(nèi)多次復(fù)制的方法來(lái)獲得一部辭書(shū)的全部?jī)?nèi)容,系統(tǒng)也能根據(jù)該消費(fèi)者復(fù)制同一部辭書(shū)內(nèi)容的總次數(shù)和復(fù)制字符總量等操作記錄,及時(shí)發(fā)現(xiàn)這種惡意復(fù)制的征兆,并提出警告;如果該消費(fèi)者繼續(xù)進(jìn)行這種惡意復(fù)制,系統(tǒng)就會(huì)自動(dòng)取消其查閱、使用該辭書(shū)的權(quán)利。
允許消費(fèi)者有限復(fù)制辭書(shū)的部分內(nèi)容,既有利于消費(fèi)者對(duì)辭書(shū)的參考使用,又能較有效地防范侵害權(quán)利人權(quán)益的不法行為。這可以說(shuō)是數(shù)字出版對(duì)辭書(shū)版權(quán)保護(hù)的重要貢獻(xiàn)。
四、數(shù)字出版便于查核辭書(shū)遭侵權(quán)的事實(shí)
辭書(shū)的使用價(jià)值在于它所承載的精神文化內(nèi)容,而這些內(nèi)容絕大部分是用文字表述的;同時(shí),辭書(shū)作為出版物需要向社會(huì)傳播,讓公眾能夠認(rèn)知其承載的精神文化內(nèi)容,從而實(shí)現(xiàn)價(jià)值和使用價(jià)值。這樣,從根本上說(shuō),只要允許他人看到辭書(shū)的內(nèi)容,就無(wú)法避免被人復(fù)制。譬如:將屏幕上顯示的條目?jī)?nèi)容逐一抄寫(xiě)下來(lái)或直接錄入另一臺(tái)計(jì)算機(jī);組織許多人利用不同的終端設(shè)備分別訪(fǎng)問(wèn)同一部辭書(shū),然后按分工在有限復(fù)制的額度內(nèi)復(fù)制部分條目,再把這些條目匯總成書(shū);分別登錄訪(fǎng)問(wèn)若干部屬于同一學(xué)科或?qū)I(yè)領(lǐng)域的不同辭書(shū),先將其中涉及某一分支領(lǐng)域的部分條目復(fù)制下來(lái),再重新組合成書(shū),等等。對(duì)類(lèi)似的復(fù)制行為,顯然,無(wú)論采用什么技術(shù)都不能絕對(duì)禁止。雖然復(fù)制者為此需要付出很高的人力成本和時(shí)間成本,但還是能夠規(guī)避數(shù)字版權(quán)保護(hù)技術(shù),把他人的辭書(shū)作品據(jù)為己有。
可見(jiàn),數(shù)字出版能夠防范侵權(quán)者利用電子手段輕易地非法復(fù)制辭書(shū),卻無(wú)法禁止他們用比較原始的手段剽竊已出版的辭書(shū),只是增加了剽竊的難度,并極大地提高了侵權(quán)的成本。因?yàn)榭床坏綌?shù)字化辭書(shū)的現(xiàn)成詞目單,侵權(quán)者僅僅為弄清楚某部辭書(shū)的收詞狀況,就必須將成千上萬(wàn)個(gè)字符作為關(guān)鍵字逐一進(jìn)行查詢(xún),需要花費(fèi)很多精力和時(shí)間,而要調(diào)查一部紙質(zhì)辭書(shū)的總體框架結(jié)構(gòu)則幾乎是輕而易舉的。
數(shù)字出版技術(shù)雖然不能達(dá)到絕對(duì)禁止剽竊辭書(shū)內(nèi)容的目標(biāo),但是,一旦侵權(quán)行為發(fā)生,在查核侵權(quán)事實(shí)上,與紙質(zhì)辭書(shū)相比還是具有很大優(yōu)勢(shì)的。
20世紀(jì)90年代,中國(guó)曾發(fā)生過(guò)《語(yǔ)言大典》剽竊《辭?!啡舾筛戒浐汀冬F(xiàn)代漢語(yǔ)詞典》《中國(guó)成語(yǔ)大辭典》中許多條目的辭書(shū)侵權(quán)大案。因?yàn)樯姘皋o書(shū)都是紙質(zhì)本,人民法院在審理此案時(shí),為了查核清楚侵權(quán)的事實(shí),曾委托許多專(zhuān)家花費(fèi)數(shù)月時(shí)間對(duì)這些辭書(shū)的內(nèi)容逐一進(jìn)行人工比對(duì)并按內(nèi)容的相同程度進(jìn)行統(tǒng)計(jì)。最后,法院根據(jù)剽竊的事實(shí)依法認(rèn)定《語(yǔ)言大典》確實(shí)侵權(quán),并判侵權(quán)人承擔(dān)相應(yīng)的法律責(zé)任。
在數(shù)字出版條件下,如果A辭書(shū)的權(quán)利人懷疑B辭書(shū)存在侵權(quán)嫌疑,可以先按A辭書(shū)的詞目單(可集中于某一部類(lèi)的詞目,也可隨機(jī)抽取各類(lèi)詞目)搜集B辭書(shū)中相應(yīng)的若干條目作為樣本,然后利用文本比較軟件對(duì)比分析這些樣本條目的內(nèi)容,統(tǒng)計(jì)出完全相同、部分相同和基本不同的條目各占多少比例,從而大致上判斷某辭書(shū)是否存在侵權(quán)的嫌疑。
經(jīng)過(guò)樣本對(duì)比基本確認(rèn)B辭書(shū)有侵權(quán)嫌疑后,A辭書(shū)的權(quán)利人可以先申請(qǐng)對(duì)樣本條目的來(lái)源、內(nèi)容對(duì)比結(jié)果進(jìn)行公證,然后向法院申請(qǐng)?jiān)V前證據(jù)保全,由法院責(zé)令侵權(quán)嫌疑人提交B辭書(shū)全部條目的電子文件。這時(shí),A辭書(shū)權(quán)利人就可以利用文本比較軟件比對(duì)B辭書(shū)中與A辭書(shū)所收詞目相同的全部條目,并對(duì)軟件統(tǒng)計(jì)出的相同程度為40%~80%(若條目中相同的內(nèi)容不足40%,一般可視為屬于合理使用的參考、借鑒)的那部分條目進(jìn)行人工復(fù)核,主要是核查那些相同的部分是否屬于條目的實(shí)質(zhì)性?xún)?nèi)容,從而為法院依法審理、判決提供充分的證據(jù)。
可見(jiàn),與完全由人工核查紙質(zhì)辭書(shū)的條目相比,利用數(shù)字技術(shù)核查數(shù)字化辭書(shū)的條目?jī)?nèi)容需要花費(fèi)的人力較少,而且速度非??臁4送?,如果A辭書(shū)在發(fā)布前對(duì)每個(gè)條目都進(jìn)行過(guò)數(shù)字水印技術(shù)(即在文字、圖片等媒體材料中嵌入人類(lèi)感官不能直接感知的隱蔽型版權(quán)標(biāo)志)處理,而在B辭書(shū)相應(yīng)條目中軟件中檢測(cè)到了相同的版權(quán)標(biāo)志,那就為認(rèn)定侵權(quán)提供了鐵證,而且速度更快,核查操作也更便捷。
當(dāng)然,對(duì)于印刷型的侵權(quán)嫌疑辭書(shū),核查的過(guò)程會(huì)稍復(fù)雜一些。權(quán)利人需要先把相應(yīng)辭書(shū)的樣本條目轉(zhuǎn)換成電子文件并進(jìn)行人工校對(duì),然后才能利用文本比較軟件進(jìn)行條目?jī)?nèi)容比對(duì)。當(dāng)然,在向法院提起訴訟后,可以申請(qǐng)法院責(zé)令侵權(quán)嫌疑人提交印刷型辭書(shū)的電子排版文件,從而再對(duì)全部條目?jī)?nèi)容進(jìn)行數(shù)字化比對(duì)。
(責(zé)任編輯 李瀟瀟)