摘 要:在人工智能時(shí)代,數(shù)據(jù)挖掘技術(shù)已成為科技創(chuàng)新與經(jīng)濟(jì)文化生活領(lǐng)域的重要技術(shù)。中國(guó)現(xiàn)行著作權(quán)例外制度無(wú)法使數(shù)據(jù)挖掘脫離著作權(quán)侵權(quán)窠臼。借鑒域外立法與司法經(jīng)驗(yàn),構(gòu)建數(shù)據(jù)挖掘例外制度,是我國(guó)創(chuàng)新發(fā)展的需要。以目的是否具有商業(yè)性進(jìn)行區(qū)分,將非商業(yè)目的下的數(shù)據(jù)挖掘納入合理使用制度范疇,將商業(yè)目的下的數(shù)據(jù)挖掘納入法定許可制度范疇,實(shí)現(xiàn)權(quán)利人利益與社會(huì)公益的平衡。
關(guān)鍵詞:數(shù)據(jù)挖掘;例外制度;合理使用;法定許可;利益平衡
中圖分類號(hào):F49;TP311.13
文獻(xiàn)標(biāo)識(shí)碼:A
doi:10.3969/j.issn.1672-2272.202404153
Analysis of Limitations and Exceptions in Data Mining in the Era of Artificial Intelligence
Cong Yike
(School of Intellectual Property, East China University of Political Science and Law, Shanghai 200042,China)
Abstract: In the era of artificial intelligence, data mining has become an important technical tool in the field of scientific and technological innovation and economic and cultural life. The current copyright exception system in our country can not make data mining out of the pattern of copyright infringement. Learning from foreign legislative and judicial experience and building an exception system for data mining is the need of China’s innovative development. According to whether the purpose is commercial, data mining for non-commercial purposes is included in the scope of the fair use system, and data mining for commercial purposes is included in the scope of the statutory licensing system, so as to achieve the balance between the interests of right holders and social welfare.
Key Words:Data Mining;Exceptions;Fair Use;Statutory Permission; Balance of Interests
0 引言
人工智能時(shí)代,計(jì)算機(jī)信息技術(shù)迅速發(fā)展,數(shù)據(jù)呈指數(shù)級(jí)爆炸式增長(zhǎng)。運(yùn)用數(shù)據(jù)挖掘技術(shù)對(duì)海量數(shù)據(jù)信息進(jìn)行規(guī)模化高效挖掘、處理和分析成為科研活動(dòng)、教學(xué)活動(dòng)、商業(yè)活動(dòng)等自然與人文社會(huì)科學(xué)各領(lǐng)域的迫切需求。但數(shù)據(jù)挖掘涉及對(duì)大量受著作權(quán)保護(hù)的數(shù)據(jù)內(nèi)容的復(fù)制、使用,受到著作權(quán)法的限制。諸多國(guó)家已經(jīng)建立數(shù)據(jù)挖掘的例外制度,為我國(guó)相關(guān)制度的構(gòu)建提供了借鑒。
1 數(shù)據(jù)挖掘在人工智能時(shí)代的應(yīng)用
數(shù)據(jù)挖掘在國(guó)際著作權(quán)中表述為Text and Data Mining(簡(jiǎn)稱TDM),譯作文本與數(shù)據(jù)挖掘。此處的數(shù)據(jù)不包含文本等文字信息在內(nèi)的狹義數(shù)據(jù),TDM則包含對(duì)文本的挖掘與文本信息外其他類型數(shù)據(jù)的挖掘。本文所討論的數(shù)據(jù)挖掘,數(shù)據(jù)采用廣義概念,包括文本在內(nèi)的一切符號(hào)信息,與國(guó)際著作權(quán)中的TDM具有相同的含義。數(shù)據(jù)挖掘是一種通過(guò)對(duì)海量數(shù)據(jù)進(jìn)行挖掘、分析后從中得出有價(jià)值信息與知識(shí)的計(jì)算機(jī)處理技術(shù)。2019年生效的《歐盟數(shù)字化單一市場(chǎng)版權(quán)指令》規(guī)定,數(shù)據(jù)挖掘是以獲取信息為目的,對(duì)數(shù)字格式的文本與數(shù)據(jù)采取的自動(dòng)分析手段,獲取的信息包括但不限于模式、趨勢(shì)與相關(guān)關(guān)系等。因此,可以將數(shù)據(jù)挖掘劃分為以下3個(gè)階段:①數(shù)據(jù)準(zhǔn)備階段,將作為挖掘?qū)ο蟮臄?shù)據(jù)信息進(jìn)行復(fù)制與抓取,這一步驟中數(shù)據(jù)信息被復(fù)制并存儲(chǔ)于網(wǎng)絡(luò)服務(wù)器中;②數(shù)據(jù)處理階段,將數(shù)據(jù)進(jìn)行轉(zhuǎn)化并挖掘分析,數(shù)據(jù)轉(zhuǎn)化是指將數(shù)據(jù)準(zhǔn)備階段獲取的數(shù)據(jù)信息轉(zhuǎn)化為計(jì)算機(jī)可以處理的結(jié)構(gòu)化數(shù)據(jù),挖掘分析是依靠計(jì)算機(jī)算法對(duì)經(jīng)過(guò)轉(zhuǎn)化的結(jié)構(gòu)化數(shù)據(jù)進(jìn)行歸類、比較與解析,并從中發(fā)現(xiàn)潛在的規(guī)律與信息,生成模型、趨勢(shì)、相關(guān)性等新知識(shí);③結(jié)果輸出階段,通過(guò)可視化手段將之前過(guò)程中得到的挖掘結(jié)果進(jìn)行呈現(xiàn),數(shù)據(jù)挖掘?qū)A繑?shù)據(jù)的復(fù)制、轉(zhuǎn)碼改變了只能抽取少量數(shù)據(jù)樣本進(jìn)行樣本分析的研究方法,而是可以處理分析與研究問(wèn)題相關(guān)的所有數(shù)據(jù),能夠更加全面、透徹地把握龐雜數(shù)據(jù)之間的相關(guān)關(guān)系。
1.1 以機(jī)器學(xué)習(xí)改變傳統(tǒng)人工閱讀模式
數(shù)據(jù)挖掘作為一種新型研究工具,通過(guò)算法技術(shù)自動(dòng)分析海量數(shù)據(jù)資料,得出相關(guān)規(guī)律、趨勢(shì)等新的知識(shí)與信息,節(jié)省了人力查閱海量數(shù)據(jù)資料的時(shí)間與精力。研究人員如果想查詢針對(duì)某一特定問(wèn)題的所有資料,面對(duì)龐雜的專著與文獻(xiàn),純粹依靠人工進(jìn)行閱讀與分析需要耗費(fèi)數(shù)年,研究效率極低。而運(yùn)用數(shù)據(jù)挖掘技術(shù),以“機(jī)器閱讀”取代傳統(tǒng)的“人工閱讀”,從海量的文獻(xiàn)數(shù)據(jù)中找到與研究活動(dòng)聯(lián)系最密切的資料,再經(jīng)過(guò)聚類、分析篩選出相關(guān)核心信息。這樣不僅將人類閱讀時(shí)間減少80%,極大提升閱讀效率,還同時(shí)將數(shù)據(jù)管理效率提升了50%[1]。機(jī)器閱讀是機(jī)器學(xué)習(xí)的一項(xiàng)重要內(nèi)容。以數(shù)據(jù)為基礎(chǔ)的機(jī)器學(xué)習(xí)是人工智能技術(shù)的核心,是現(xiàn)代人工智能技術(shù)中的重要方法。其技術(shù)內(nèi)容是從觀測(cè)數(shù)據(jù)中尋找規(guī)律,同時(shí)利用這些規(guī)律對(duì)未來(lái)數(shù)據(jù)或無(wú)法觀測(cè)的數(shù)據(jù)進(jìn)行預(yù)測(cè)[2]。數(shù)據(jù)挖掘技術(shù)是機(jī)器學(xué)習(xí)的基石,機(jī)器學(xué)習(xí)對(duì)數(shù)據(jù)潛在規(guī)律的發(fā)現(xiàn)與對(duì)未來(lái)趨勢(shì)的預(yù)測(cè)建立在計(jì)算機(jī)對(duì)海量數(shù)據(jù)挖掘與分析上。數(shù)據(jù)挖掘技術(shù)對(duì)機(jī)器學(xué)習(xí)乃至整體人工智能技術(shù)的發(fā)展具有重要推動(dòng)作用。因此,數(shù)據(jù)挖掘是機(jī)器與深度學(xué)習(xí)的基石,利用計(jì)算機(jī)分析大量數(shù)據(jù)并使用認(rèn)知技術(shù)來(lái)發(fā)展學(xué)習(xí)模式的能力是人工智能存在的基礎(chǔ)[3]。
1.2 應(yīng)用于抗擊新冠肺炎疫情
2020年新冠肺炎疫情發(fā)生后,數(shù)據(jù)挖掘技術(shù)應(yīng)用于疫情動(dòng)態(tài)檢測(cè)、防控措施匹配等方面,為打贏抗疫之戰(zhàn)提供了重要保障。清華大學(xué)AMiner團(tuán)隊(duì)在數(shù)據(jù)挖掘服務(wù)的基礎(chǔ)上研發(fā)上線“知識(shí)疫圖”系統(tǒng),通過(guò)對(duì)繁雜的數(shù)據(jù)信息進(jìn)行挖掘分析,梳理出疫情發(fā)展脈絡(luò),讓公眾及時(shí)了解疫情動(dòng)態(tài)、輔助公眾參透疫情惠民政策、密切關(guān)注疫情對(duì)公眾社交與心理的影響。“知識(shí)疫圖”系統(tǒng)對(duì)專家、論文、媒體平臺(tái)訊息等數(shù)據(jù)進(jìn)行挖掘,以時(shí)間軸的方式集中呈現(xiàn)了最新學(xué)術(shù)成果與疫情動(dòng)態(tài)信息。除此之外,“知識(shí)疫圖”還收集、展示并持續(xù)更新疫情下,各級(jí)政府、組織、機(jī)構(gòu)制定的惠民惠企政策信息,用戶可以通過(guò)地圖對(duì)各地的政策進(jìn)行查詢和搜索,幫助群眾和企業(yè)了解疫情優(yōu)惠政策動(dòng)向,合理安排調(diào)整生產(chǎn)生活。同時(shí),“知識(shí)疫圖”通過(guò)采集微信等社交程序的數(shù)據(jù)研究用戶的在線社交行為,生成研究分析圖,并憑此分析結(jié)果指導(dǎo)協(xié)助有關(guān)部門對(duì)重點(diǎn)疫情地區(qū)群體進(jìn)行心理疏導(dǎo)與行為干預(yù),防止群眾因?yàn)橐咔樵虺霈F(xiàn)大規(guī)模心理問(wèn)題與沖動(dòng)行為[4]。
1.3 應(yīng)用于數(shù)據(jù)新聞
數(shù)據(jù)新聞是人工智能時(shí)代高速發(fā)展的互聯(lián)網(wǎng)與大數(shù)據(jù)相結(jié)合的媒體融合背景下興起的新型新聞形式[5]。與傳統(tǒng)的新聞形式相比,面對(duì)突發(fā)新聞事件,數(shù)據(jù)新聞無(wú)需等待記者實(shí)地調(diào)研,而是能夠通過(guò)迅速整合與新聞相關(guān)的海量數(shù)據(jù)資源,豐富記者采集數(shù)據(jù)的渠道,提升效率。作為一種新的新聞表現(xiàn)形式,數(shù)據(jù)新聞依靠數(shù)據(jù)分析與計(jì)算機(jī)技術(shù)在新聞敘述中使用數(shù)據(jù)來(lái)呈現(xiàn)傳統(tǒng)新聞形式中用文字難以表述的內(nèi)容;或通過(guò)數(shù)據(jù)分析問(wèn)題,并對(duì)此進(jìn)行挖掘最終獲得新聞[6]。由此可見數(shù)據(jù)新聞的生成離不開數(shù)據(jù)挖掘技術(shù)對(duì)數(shù)據(jù)的收集、挖掘與分析,數(shù)據(jù)挖掘是數(shù)據(jù)新聞的基礎(chǔ)。
1.4 應(yīng)用于人工智能創(chuàng)作
人工智能創(chuàng)作是人工智能技術(shù)發(fā)展的產(chǎn)物。人工智能創(chuàng)作的過(guò)程是通過(guò)搜集、積累海量現(xiàn)有作品創(chuàng)建語(yǔ)料數(shù)據(jù)庫(kù),繼而對(duì)該語(yǔ)料庫(kù)進(jìn)行計(jì)算機(jī)處理與算法分析,最終機(jī)械式輸出成果[7]。數(shù)據(jù)挖掘技術(shù)應(yīng)用于語(yǔ)料數(shù)據(jù)庫(kù)的生成與處理,海量搜尋并復(fù)制現(xiàn)有作品后對(duì)其進(jìn)行轉(zhuǎn)換、分析、編排等處理并在結(jié)果輸出階段以人工智能所作新作品的形式展現(xiàn)數(shù)據(jù)挖掘結(jié)果。例如2022年問(wèn)世的人工智能數(shù)字作畫便是將畫家或消費(fèi)者的想法輸入電腦,計(jì)算機(jī)程序通過(guò)對(duì)海量的畫作進(jìn)行分析、挖掘、篩選后挑選出與要求最相符的作品并在此基礎(chǔ)上進(jìn)行二創(chuàng)[8]。
除上述領(lǐng)域外,數(shù)據(jù)挖掘技術(shù)在科學(xué)研究、商業(yè)決策、風(fēng)險(xiǎn)預(yù)測(cè)、投資金融等領(lǐng)域也擁有廣泛適用空間與諸多成功案例。面對(duì)海量數(shù)據(jù),僅僅依靠人工處理不僅成本過(guò)于高昂且越發(fā)變得不可行,提升效率與減少耗費(fèi)的需要客觀上促使數(shù)據(jù)挖掘成為必須實(shí)行的項(xiàng)目[9]。數(shù)據(jù)挖掘已經(jīng)成為現(xiàn)實(shí)普遍運(yùn)用的技術(shù)手段,對(duì)我國(guó)經(jīng)濟(jì)社會(huì)發(fā)展起到了重要作用。
2 中國(guó)《著作權(quán)法》對(duì)數(shù)據(jù)挖掘的限制
數(shù)據(jù)挖掘技術(shù)對(duì)經(jīng)濟(jì)社會(huì)發(fā)展的意義日趨顯著,但是作為挖掘?qū)ο蟮臄?shù)據(jù)信息屬于受著作權(quán)法保護(hù)的作品范疇,數(shù)據(jù)挖掘過(guò)程中涉及的復(fù)制、轉(zhuǎn)換等行為符合著作權(quán)法框架下著作權(quán)侵權(quán)行為認(rèn)定。同時(shí),我國(guó)著作權(quán)例外規(guī)則采用封閉式列舉,法定許可與合理使用的情形中不包含數(shù)據(jù)挖掘,現(xiàn)行著作權(quán)例外規(guī)則無(wú)法為數(shù)據(jù)挖掘提供豁免,使得數(shù)據(jù)挖掘在應(yīng)用時(shí)陷入著作權(quán)侵權(quán)困境,阻礙數(shù)據(jù)挖掘技術(shù)的推進(jìn)。
2.1 對(duì)海量數(shù)據(jù)的復(fù)制行為侵犯復(fù)制權(quán)
數(shù)據(jù)挖掘在最初的數(shù)據(jù)準(zhǔn)備階段會(huì)對(duì)作為挖掘?qū)ο蟮臄?shù)據(jù)材料進(jìn)行大規(guī)模的復(fù)制,在服務(wù)器中形成相對(duì)穩(wěn)定的復(fù)制件。目前由于技術(shù)的限制,數(shù)據(jù)挖掘系統(tǒng)在對(duì)挖掘?qū)ο筮M(jìn)行復(fù)制時(shí)無(wú)法清晰識(shí)別挖掘?qū)ο蟮臋?quán)利狀態(tài),即無(wú)法判定復(fù)制的對(duì)象是否是經(jīng)過(guò)權(quán)利人授權(quán)的客體。而挖掘?qū)ο蟮臄?shù)量龐大且繁雜,因此大多數(shù)情況下的數(shù)據(jù)挖掘行為在未獲權(quán)利人許可的情況下便已實(shí)施海量復(fù)制,對(duì)挖掘?qū)ο髾?quán)利人的復(fù)制權(quán)造成侵犯。
同時(shí),數(shù)據(jù)挖掘系統(tǒng)對(duì)于挖掘?qū)ο蟮膹?fù)制不能構(gòu)成臨時(shí)復(fù)制。臨時(shí)復(fù)制指的是計(jì)算機(jī)運(yùn)行所必須的系統(tǒng)軟件在計(jì)算機(jī)運(yùn)行過(guò)程中自動(dòng)進(jìn)入計(jì)算機(jī)內(nèi)存,從而在計(jì)算機(jī)內(nèi)存中形成對(duì)軟件存儲(chǔ)信息的臨時(shí)存儲(chǔ)。一旦計(jì)算機(jī)關(guān)機(jī)或運(yùn)行新的指令,內(nèi)存中暫時(shí)儲(chǔ)存的信息就會(huì)消失[10]。歐盟《關(guān)于協(xié)調(diào)信息社會(huì)版權(quán)及相關(guān)權(quán)利的指令》第5條規(guī)定:一項(xiàng)短暫或附帶性的臨時(shí)復(fù)制行為,如果它是技術(shù)過(guò)程中不可或缺的必要組成部分,且惟一目的是使作品或其他客體在網(wǎng)絡(luò)中與第三方之間通過(guò)媒介進(jìn)行傳輸或合法使用成為可能,且該行為沒有獨(dú)立的經(jīng)濟(jì)意義,該臨時(shí)復(fù)制行為不受復(fù)制權(quán)的控制。臨時(shí)復(fù)制行為的構(gòu)成需滿足“時(shí)間上具有短暫性”與“復(fù)制行為不具有獨(dú)立經(jīng)濟(jì)意義”。時(shí)間上的短暫性要求計(jì)算機(jī)系統(tǒng)能夠自動(dòng)消除所存儲(chǔ)的信息,這些隨著計(jì)算機(jī)的運(yùn)行而自動(dòng)生成于系統(tǒng)中的信息停留時(shí)間極為短暫,無(wú)法被計(jì)算機(jī)讀取與再現(xiàn)。但是在數(shù)據(jù)挖掘中,準(zhǔn)備階段被固定于計(jì)算機(jī)服務(wù)器的數(shù)據(jù)信息是以穩(wěn)定形態(tài)存在的,已經(jīng)在本地計(jì)算機(jī)中形成了長(zhǎng)久、穩(wěn)定的復(fù)制件,可以被計(jì)算機(jī)所讀取、再現(xiàn)。復(fù)制行為的獨(dú)立經(jīng)濟(jì)價(jià)值體現(xiàn)在著作權(quán)人通過(guò)向公眾提供該復(fù)制行為所形成的復(fù)制件,使作品流通并獲得經(jīng)濟(jì)報(bào)酬[11]。臨時(shí)復(fù)制中計(jì)算機(jī)系統(tǒng)里形成的短暫附帶性存儲(chǔ),其存儲(chǔ)信息是伴隨計(jì)算機(jī)運(yùn)行與瀏覽、傳輸?shù)倪^(guò)程而存在,不能脫離該行為過(guò)程被單獨(dú)傳播或利用。但數(shù)據(jù)挖掘準(zhǔn)備階段形成的挖掘?qū)ο髲?fù)制件是穩(wěn)定的存在于計(jì)算機(jī)系統(tǒng)中,并脫離系統(tǒng)運(yùn)行過(guò)程而獨(dú)立存在,行為人能夠?qū)⒋祟悘?fù)制件進(jìn)行單獨(dú)的傳播與利用,因而數(shù)據(jù)挖掘準(zhǔn)備階段的復(fù)制行為具有獨(dú)立經(jīng)濟(jì)意義,不能將其納入“臨時(shí)復(fù)制”的例外中。
2.2 對(duì)數(shù)據(jù)的轉(zhuǎn)換與處理侵犯改編權(quán)
數(shù)據(jù)挖掘過(guò)程中的數(shù)據(jù)處理階段涉及對(duì)數(shù)據(jù)的轉(zhuǎn)碼,將作為挖掘?qū)ο蟮臄?shù)據(jù)信息轉(zhuǎn)化成可供計(jì)算機(jī)處理的結(jié)構(gòu)化數(shù)據(jù)。在未獲授權(quán)情況下,這一行為會(huì)侵害權(quán)利人的改編權(quán)。轉(zhuǎn)碼行為改變了挖掘?qū)ο蟮谋磉_(dá)方式,但并未改變數(shù)據(jù)的實(shí)質(zhì)內(nèi)容。著作權(quán)法上的改編權(quán)是指在保留原作品基本內(nèi)容的情況下,改變作品表現(xiàn)形式、給作品增加新的獨(dú)創(chuàng)性表達(dá)從而創(chuàng)作出新作品的行為。因此,數(shù)據(jù)挖掘中的轉(zhuǎn)碼行為與著作權(quán)法上的改變行為,本質(zhì)都是在保留原對(duì)象實(shí)質(zhì)內(nèi)容的前提下改變其表現(xiàn)形式最終形成新的對(duì)象,轉(zhuǎn)碼行為落入改編權(quán)規(guī)制的范圍。
2.3 現(xiàn)行著作權(quán)例外制度無(wú)法對(duì)數(shù)據(jù)挖掘提供適當(dāng)豁免
著作權(quán)的例外制度包括合理使用制度與法定許可制度?,F(xiàn)行著作權(quán)法明確規(guī)定法定許可僅適用于教科書編寫、報(bào)刊轉(zhuǎn)載、錄音制品制作與播放他人已發(fā)表作品,數(shù)據(jù)挖掘并無(wú)解釋適用的空間。
我國(guó)《著作權(quán)法》二十四條規(guī)定的合理使用制度,對(duì)于適用情形的規(guī)定留有解釋空間,從主體、使用數(shù)量與行為方式3個(gè)角度對(duì)數(shù)據(jù)挖掘技術(shù)進(jìn)行分析,研究其能否落入合理使用制度的規(guī)制范疇。
2.3.1 主體不適合
我國(guó)《著作權(quán)法》二十四條第(一)項(xiàng)規(guī)定的“個(gè)人使用例外”的行為要件是為“個(gè)人”學(xué)習(xí)、研究或欣賞,使用他人已發(fā)表的作品。這里要求的行為主體是“個(gè)人”。數(shù)據(jù)挖掘作為一項(xiàng)以大數(shù)據(jù)為基礎(chǔ)的高新技術(shù),無(wú)論是技術(shù)研發(fā)還是技術(shù)實(shí)施都需要投入大量成本,需要雄厚的物質(zhì)與技術(shù)支撐,個(gè)人不具備這樣物質(zhì)技術(shù)條件。因此,開展數(shù)據(jù)挖掘的主體通常是公司或機(jī)構(gòu)而非個(gè)人。我國(guó)《著作權(quán)法》二十四條第(六)項(xiàng)規(guī)定的“教學(xué)科研例外”為了教學(xué)或科研目的而使用的主體是教學(xué)或科研人員。實(shí)踐中,數(shù)據(jù)挖掘行為的開展越來(lái)越多的采用科研機(jī)構(gòu)與商業(yè)機(jī)構(gòu)合作的模式,即公私合營(yíng)的PPP(Public—Private—Partnership)模式,科研機(jī)構(gòu)提供技術(shù),商業(yè)機(jī)構(gòu)提供資金支持。但《著作權(quán)法》第(六)項(xiàng)將使用主體框定在教學(xué)、科研人員中,當(dāng)數(shù)據(jù)挖掘有商業(yè)機(jī)構(gòu)參與其中時(shí),便無(wú)法滿足該項(xiàng)合理使用條款的主體要求。
2.3.2 使用的數(shù)量不符合要求
我國(guó)《著作權(quán)法》二十四條第(一)項(xiàng)供個(gè)人學(xué)習(xí)研究的范疇下,除了滿足“個(gè)人使用”這個(gè)主體要件,還要求對(duì)作品使用的數(shù)量是“少量”,大量復(fù)制并使用作品的行為仍不屬于合理使用的范疇。此外,《著作權(quán)法》二十四條第(六)項(xiàng)規(guī)定為了教學(xué)或科研目的“少量復(fù)制”已發(fā)表作品,也是將數(shù)量限定在“少量”之范圍內(nèi)。但數(shù)據(jù)挖掘在前期的數(shù)據(jù)處理階段需要復(fù)制海量作品,對(duì)海量作品數(shù)據(jù)與信息的復(fù)制與抓取是數(shù)據(jù)挖掘開展的前提,因此數(shù)據(jù)挖掘過(guò)程中對(duì)作品的復(fù)制行為不符合合理使用的數(shù)量要求。
2.3.3 行為模式不符合要求
我國(guó)《著作權(quán)法》二十四條第(二)項(xiàng)規(guī)定的“適當(dāng)引用”的例外,其行為模式是指以介紹、評(píng)論為目的,適當(dāng)引用他人已發(fā)表作品,或者對(duì)某個(gè)問(wèn)題進(jìn)行解釋說(shuō)明。然而數(shù)據(jù)挖掘是通過(guò)對(duì)作品相關(guān)信息的抓取和分析從而得出最終結(jié)果。同時(shí),適當(dāng)引用往往是對(duì)作品的片段進(jìn)行引用,而數(shù)據(jù)挖掘是在對(duì)整篇作品復(fù)制后再對(duì)其中的有用信息進(jìn)行抓取。兩者無(wú)論是在行為目的與行為方式上都迥異。因此,數(shù)據(jù)挖掘不屬于“適當(dāng)引用”的行為范疇。我國(guó)《著作權(quán)法》第二十四條第(八)項(xiàng)規(guī)定了“館藏作品復(fù)制例外”。此項(xiàng)規(guī)定的復(fù)制館藏作品只能出于陳列或保存作品的需要,該項(xiàng)例外針對(duì)的是保存館藏作品的行為而非對(duì)館藏作品實(shí)施數(shù)據(jù)挖掘的行為?!缎畔⒕W(wǎng)絡(luò)傳播權(quán)保護(hù)條例》第七條對(duì)網(wǎng)絡(luò)環(huán)境下的“館藏作品復(fù)制例外”做了補(bǔ)充,規(guī)定出于陳列或保存版本的需要,而以數(shù)字化形式復(fù)制的作品需得已經(jīng)或?yàn)l臨損毀、丟失,存儲(chǔ)形式已過(guò)時(shí)或在市場(chǎng)上無(wú)法購(gòu)買或只能以明顯高于標(biāo)定的價(jià)格購(gòu)買。而數(shù)據(jù)挖掘中所復(fù)制的對(duì)象并不滿足前述要求,所以“館藏作品復(fù)制例外”的規(guī)則無(wú)法適用于數(shù)據(jù)挖掘行為。
3 數(shù)據(jù)挖掘行為的司法實(shí)踐
我國(guó)司法實(shí)踐中有關(guān)數(shù)據(jù)挖掘的案例逐年增多,由于現(xiàn)行著作權(quán)法對(duì)數(shù)據(jù)挖掘行為的限制,我國(guó)大部分法院依照著作權(quán)法的規(guī)定將涉及數(shù)據(jù)挖掘的相關(guān)案例作侵權(quán)判定,但也有少數(shù)法院突破著作權(quán)法的封閉式規(guī)定,開放性適用“三步檢驗(yàn)法”將數(shù)據(jù)挖掘認(rèn)定為合理使用,納入著作權(quán)侵權(quán)例外中,但這種做法在我國(guó)司法實(shí)踐中仍屬特例,不具普遍適用性。
3.1 涉及數(shù)據(jù)挖掘的司法案例
3.1.1 "案例一
涉案作品系由原告叢文輝創(chuàng)作,原登載于天涯社區(qū),但在天涯社區(qū)刪除該作品后5個(gè)月,通過(guò)搜狗公司經(jīng)營(yíng)的搜索引擎網(wǎng)站進(jìn)行搜索時(shí)仍能搜索到該作品的網(wǎng)頁(yè)快照。原告叢文輝以被告行為侵犯其信息網(wǎng)絡(luò)傳播權(quán)為由向法院起訴。二審法院認(rèn)為涉案網(wǎng)頁(yè)快照提供行為屬于信息網(wǎng)絡(luò)傳播行為,該行為雖然屬于受到著作權(quán)法控制的行為,但依據(jù)但并不會(huì)對(duì)叢文輝的權(quán)益造成不合理?yè)p害。二審法院指出一項(xiàng)行為如果對(duì)著作權(quán)人造成不合理?yè)p害,就要求該行為能構(gòu)成對(duì)權(quán)利作品的實(shí)質(zhì)性替代。此案中,網(wǎng)頁(yè)快照無(wú)法實(shí)質(zhì)性替代涉案作品,也不會(huì)影響涉案作品的正常使用,如果把該行為認(rèn)定為侵權(quán)會(huì)對(duì)公眾利益造成不合理的影響。因此搜狗公司通過(guò)搜索引擎提供叢文輝作品網(wǎng)頁(yè)快照的行為符合合理使用的實(shí)質(zhì)要件,構(gòu)成合理使用行為。
3.1.2案例二
精倫公司通過(guò)相關(guān)技術(shù)從互聯(lián)網(wǎng)上抓取影視鏈接地址,并由其提供的播放器進(jìn)行播放。精倫H3播放器以及精倫公司的服務(wù)器只存儲(chǔ)影視內(nèi)容的鏈接地址,不存儲(chǔ)影視內(nèi)容,影視內(nèi)容是由第三方互聯(lián)網(wǎng)服務(wù)器存儲(chǔ)提供,用戶通過(guò)精倫電子的搜索、鏈接服務(wù),將第三方網(wǎng)站上的影視作品內(nèi)容進(jìn)行獲取與播放。精倫公司依據(jù)前述過(guò)程向公眾提供涉案影片鏈接時(shí)并未取得影片著作權(quán)人美亞公司的許可,也未支付相應(yīng)對(duì)價(jià)。二審法院認(rèn)定涉案精倫H3播放器的電視頁(yè)面出現(xiàn)了不同的作品和類型分類,并對(duì)這些信息進(jìn)行編輯、分類、排行、評(píng)分、推薦。這表明精倫公司在主觀上有將涉案影視作品在內(nèi)的一系列由該網(wǎng)站進(jìn)行檢索并提供鏈接的作品向用戶進(jìn)行推演的態(tài)度,在明知自己沒有獲取權(quán)利人許可的情況下,仍使其產(chǎn)品用戶獲取相關(guān)影視作品,通過(guò)信息網(wǎng)絡(luò)傳播涉案作品,主觀上具有過(guò)錯(cuò),構(gòu)成信息網(wǎng)絡(luò)傳播權(quán)侵權(quán)。
3.1.3 案例三
深圳聚領(lǐng)威鋒公司通過(guò)其應(yīng)用程序“石頭閱讀特別版”,通過(guò)網(wǎng)絡(luò)爬蟲工具追蹤用戶喜愛的網(wǎng)絡(luò)小說(shuō),在作者每次更新后該程序便會(huì)搜索整個(gè)中文網(wǎng)絡(luò),將相關(guān)作品整理并提供給用戶。被告未經(jīng)許可在該程序中向公眾提供了包括涉案作品在內(nèi)的多部作品的下載服務(wù)。法院在判決中指出,用戶在點(diǎn)擊涉案作品的詳情界面的鏈接后并未出現(xiàn)網(wǎng)頁(yè)跳轉(zhuǎn),而是直接顯示了涉案作品的完整內(nèi)容,被告的涉案行為侵犯了原告享有的信息網(wǎng)絡(luò)傳播權(quán)。
3.2 對(duì)中國(guó)數(shù)據(jù)挖掘司法實(shí)踐的評(píng)析
盡管我國(guó)現(xiàn)行《著作權(quán)法》合理使用規(guī)定中“三步檢驗(yàn)法”的適用具有封閉性,只能適用于法定的十三種合理使用情形,不包括數(shù)據(jù)挖掘,但從我國(guó)法院目前涉及數(shù)據(jù)挖掘行為的司法判決來(lái)看,少數(shù)法院已經(jīng)突破了著作權(quán)法封閉性規(guī)定,結(jié)合合理使用四要素,并采用三步檢驗(yàn)法對(duì)數(shù)據(jù)挖掘進(jìn)行分析,并作出合理使用認(rèn)定[12]。這一做法減少了數(shù)據(jù)挖掘所受的法律禁錮,有利于促進(jìn)數(shù)據(jù)挖掘技術(shù)的發(fā)展與運(yùn)用,提升我國(guó)相關(guān)行業(yè)的技術(shù)競(jìng)爭(zhēng)力。但該做法存有弊端,一方面與《著作權(quán)法》的明文規(guī)定相沖突;另一方面由于缺乏成文法的指引,實(shí)踐中往往判決標(biāo)準(zhǔn)多樣化,影響司法公正性[13]。
目前,開放性適用三步檢驗(yàn)法將數(shù)據(jù)挖掘行為判定為合理使用的法院仍是少數(shù),大多數(shù)法院在相關(guān)案件中依據(jù)著作權(quán)法的明文規(guī)定,不將數(shù)據(jù)挖掘納入合理使用的范疇,按照著作權(quán)侵權(quán)的判定思路對(duì)此類案件進(jìn)行審理。如果行為人運(yùn)用數(shù)據(jù)挖掘技術(shù)向公眾提供檢索結(jié)果后,在未經(jīng)權(quán)利人許可的情況下直接在行為人網(wǎng)站上向公眾提供被檢索作品內(nèi)容,該行為毫無(wú)疑問(wèn)侵犯了權(quán)利人的信息網(wǎng)絡(luò)傳播權(quán)。但是,如果行為人通過(guò)設(shè)置淺層鏈接(用戶在點(diǎn)擊鏈接后會(huì)離開設(shè)鏈網(wǎng)站,而進(jìn)入被鏈接的網(wǎng)站),使公眾在行為人的瀏覽器或網(wǎng)站中通過(guò)檢索尋得被檢索作品后需得跳轉(zhuǎn)到第三方網(wǎng)站方能獲取完整作品,那么設(shè)置鏈接這一行為本身不侵權(quán)。司法實(shí)踐中,第三方網(wǎng)站往往也未獲得權(quán)利人的許可,擅自使用并傳播作品構(gòu)成侵權(quán),法院便將案件爭(zhēng)議焦點(diǎn)放置于提供數(shù)據(jù)挖掘技術(shù)行為人的主觀過(guò)錯(cuò)上,以此判定行為人是否構(gòu)成幫助侵權(quán)。中國(guó)法院在處理此類案件時(shí)甚少關(guān)注數(shù)據(jù)挖掘行為本身的性質(zhì),其裁判焦點(diǎn)在于數(shù)據(jù)挖掘之后對(duì)挖掘結(jié)果的呈現(xiàn)方式,以此來(lái)確定是否構(gòu)成侵權(quán)。
4 部分國(guó)家數(shù)據(jù)挖掘著作權(quán)例外制度的構(gòu)建
與中國(guó)對(duì)數(shù)據(jù)挖掘予以限制的立法現(xiàn)狀相比,許多發(fā)達(dá)國(guó)家對(duì)數(shù)據(jù)挖掘已經(jīng)在立法與司法領(lǐng)域設(shè)置例外,為其發(fā)展減少版權(quán)障礙。此外,關(guān)于數(shù)據(jù)挖掘的例外規(guī)定實(shí)際上構(gòu)成發(fā)達(dá)國(guó)家之間在技術(shù)發(fā)展與進(jìn)步上的競(jìng)爭(zhēng),顯現(xiàn)在美國(guó)、日本和歐盟及其成員國(guó)關(guān)于數(shù)據(jù)挖掘例外的立法改革中[14]。
4.1 美國(guó)
美國(guó)《版權(quán)法》107條規(guī)定了合理使用的4個(gè)要素:①使用的目的與性質(zhì),即使用是否出于商業(yè)目的;②被使用作品的性質(zhì);③使用的數(shù)量與質(zhì)量使用即使用是否涉及原作品的實(shí)質(zhì)性內(nèi)容、使用部分在原作中的比重;④使用行為對(duì)原作品潛在市場(chǎng)或者價(jià)值的影響。美國(guó)司法實(shí)踐中法官在援引合理使用條款判定數(shù)據(jù)挖掘性質(zhì)時(shí)主要從“使用的目的和性質(zhì)”要件出發(fā),認(rèn)為運(yùn)用數(shù)據(jù)挖掘技術(shù)建立搜索引擎對(duì)作品進(jìn)行檢索的過(guò)程中,對(duì)作品的復(fù)制與處理均屬于轉(zhuǎn)換性使用,無(wú)法替代原作品且不會(huì)對(duì)原作品市場(chǎng)產(chǎn)生負(fù)面的影響。同時(shí)轉(zhuǎn)換性使用的認(rèn)定使美國(guó)法院削弱了四要素中,要素三的影響,即在數(shù)據(jù)挖掘中即使是對(duì)作品全文而非部分片段進(jìn)行復(fù)制,但因其在使用目的上具有高度轉(zhuǎn)換性,仍將其納入合理使用的范疇,在此情形下,要素三無(wú)法決定合理使用的認(rèn)定[15]。諸多案件中,可作典型案例的兩個(gè)案件分別是Authors Guild v HathiTrust(以下稱HathiTrust案)與Authors Guild v Google,Inc(以下稱 Google圖書館案)。
在HathiTrust案中,HathiTrust 數(shù)字圖書館允許 Google對(duì)其館藏所有作品進(jìn)行全文掃描形成作品的數(shù)字化版本,并提供給HathiTrust及相關(guān)高校圖書館使用。HathiTrust的用戶可以對(duì) HathiTrust 數(shù)字圖書館中的所有作品通過(guò)檢索詞進(jìn)行全文搜索,但搜索結(jié)果僅能顯示檢索詞出現(xiàn)的頁(yè)碼,以及該檢索詞在該頁(yè)碼出現(xiàn)的頻率。法院認(rèn)定HathiTrust 的全文檢索本質(zhì)上是一種數(shù)據(jù)挖掘技術(shù)的應(yīng)用,其不再是單純適用原作品,而是衍生出了新的科研用途,具有較強(qiáng)的轉(zhuǎn)換性[16],故認(rèn)定為合理使用。
在 Google圖書館案中,Google 對(duì)參與其項(xiàng)目的幾個(gè)圖書館中近兩千萬(wàn)本圖書進(jìn)行了全文電子化掃描,其中除了公有領(lǐng)域的作品,還包括仍在保護(hù)期限之內(nèi)的大量作品。在對(duì)仍受版權(quán)保護(hù)的作品進(jìn)行掃描時(shí),Google 并沒有取得版權(quán)人同意,也沒有向版權(quán)人支付任何報(bào)酬。Google 將掃描后的電子版圖書向用戶提供片段瀏覽服務(wù),在用戶通過(guò)輸入檢索詞后,檢索并顯示作品片段。片段瀏覽服務(wù)本事上是對(duì)數(shù)據(jù)挖掘技術(shù)的應(yīng)用。此糾紛在美國(guó)持續(xù)了超過(guò)10年,直到2016年法院最終認(rèn)定,片段瀏覽旨在為用戶提供更為完善的文字搜索工具,與圖書原有使用目的完全不同,具有較高的轉(zhuǎn)換性,應(yīng)當(dāng)認(rèn)定為合理使用[17]。
4.2 日本
2020年日本修訂的《著作權(quán)法》規(guī)定,為了創(chuàng)造新知識(shí)和信息,任何主體都可以利用公眾可獲得或已發(fā)表的作品進(jìn)行計(jì)算機(jī)化數(shù)據(jù)分析并提供分析結(jié)果(即進(jìn)行數(shù)據(jù)挖掘),但明知構(gòu)成侵權(quán)或?qū)⒉缓侠淼負(fù)p害版權(quán)人利益的除外。日本《著作權(quán)法》對(duì)數(shù)據(jù)挖掘的目的規(guī)定較寬松,沒有限制在商業(yè)性范疇。
4.3 歐盟
歐盟在2016年發(fā)布的《數(shù)字化單一市場(chǎng)指令》(提案)中第3條規(guī)定了出于科學(xué)研究目的適用數(shù)據(jù)挖掘技術(shù)的例外規(guī)則。其規(guī)定:成員國(guó)應(yīng)對(duì)第2001/29/EC號(hào)指令第2條,第96/9/EC號(hào)指令第5(a)和7(1)條與本指令第11(1)條規(guī)定的權(quán)利作出例外規(guī)定,允許研究機(jī)構(gòu)出于科學(xué)研究目的對(duì)其合法訪問(wèn)的作品或其他客體進(jìn)行數(shù)據(jù)挖掘。最終于2019年生效的歐盟《數(shù)字化單一市場(chǎng)版權(quán)指令》第3條基本保留了指令草案第3條的規(guī)定,但是在科研目的下,數(shù)據(jù)挖掘例外規(guī)則的適用主體從草案規(guī)定中單一的研究機(jī)構(gòu)拓展至研究機(jī)構(gòu)和文化遺產(chǎn)機(jī)構(gòu),允許這兩類非商業(yè)性機(jī)構(gòu)采用復(fù)制、提取的方式進(jìn)行數(shù)據(jù)挖掘。同時(shí)《數(shù)字化單一市場(chǎng)版權(quán)指令》(2019)增加了第4條作為新的數(shù)據(jù)挖掘例外規(guī)則。與第3條有所區(qū)別,第4條并未將數(shù)據(jù)挖掘的目的限定在第3條所述的科學(xué)研究目的,也未對(duì)主體進(jìn)行限制。第4條第(3)項(xiàng)允許權(quán)利人事先以恰當(dāng)方式保留數(shù)據(jù)挖掘的權(quán)利,而第3條并無(wú)此項(xiàng)規(guī)定。這意味著對(duì)權(quán)利人出于科研目的下的數(shù)據(jù)挖掘行為進(jìn)行限制與規(guī)避和聲明或合同條款無(wú)效,權(quán)利人無(wú)權(quán)對(duì)科研目的下的數(shù)據(jù)挖掘行為進(jìn)行保留。但權(quán)利人有權(quán)對(duì)科研目的外的數(shù)據(jù)挖掘行為進(jìn)行保留,在權(quán)利人未對(duì)此項(xiàng)權(quán)利做出保留聲明的情況下,可以推定權(quán)利人默示允許第三人就其享有權(quán)利的作品展開數(shù)據(jù)挖掘。因此,歐盟發(fā)布的《數(shù)字化單一市場(chǎng)版權(quán)指令》(2019)第4條對(duì)于不限目的且不限主體的數(shù)據(jù)挖掘行為采用默示許可的授權(quán)方式。
4.4 英國(guó)
2014 年英國(guó)修訂的《版權(quán)、設(shè)計(jì)和專利法案1988》中第 29A條規(guī)定,一切主體對(duì)于其合法獲取的作品基于非商業(yè)性研究目的,為了對(duì)作品實(shí)施數(shù)據(jù)挖掘與分析而進(jìn)行的復(fù)制行為,不構(gòu)成版權(quán)侵權(quán)。同時(shí),合同中對(duì)權(quán)利人就前述不侵權(quán)的數(shù)據(jù)挖掘行為進(jìn)行保留與限制的條款無(wú)效。
4.5 德國(guó)
德國(guó)2017年修訂的《著作權(quán)與鄰接權(quán)法》關(guān)于數(shù)據(jù)挖掘的例外規(guī)定,為了自動(dòng)分析大量的作品(原始資料)以便于科學(xué)研究,可以復(fù)制所需的原始資料創(chuàng)建可供分析和使用的資料庫(kù),并出于非商業(yè)目的向特定主體提供資料庫(kù)。因此,德國(guó)數(shù)據(jù)挖掘例外適用的行為不限于復(fù)制,還包括在一定范圍內(nèi)向公眾提供復(fù)制行為生成的復(fù)制件,但此項(xiàng)傳播例外必須出于非商業(yè)目的,而對(duì)與復(fù)制行為則沒有限定目的。
4.6 法國(guó)
法國(guó)2016年修訂的《知識(shí)產(chǎn)權(quán)法典》規(guī)定,一切主體出于非商業(yè)性科學(xué)研究目的,為實(shí)施數(shù)據(jù)挖掘而對(duì)其合法獲取的科學(xué)作品,以及數(shù)據(jù)庫(kù)進(jìn)行復(fù)制與提取的行為不侵犯版權(quán)。
5 建立數(shù)據(jù)挖掘例外制度建議
國(guó)際社會(huì)在立法與司法層面創(chuàng)建的數(shù)據(jù)挖掘例外為中國(guó)數(shù)據(jù)挖掘的著作權(quán)限制建立例外制度提供了借鑒。數(shù)據(jù)挖掘例外規(guī)則是著作權(quán)法利益平衡原則的重要體現(xiàn),旨在權(quán)利人與數(shù)據(jù)挖掘行為人、私人利益與公共利益之間達(dá)成新的平衡點(diǎn)[18],既保護(hù)著作權(quán)人的利益從而促進(jìn)文化創(chuàng)作;又正視數(shù)據(jù)挖掘技術(shù)對(duì)社會(huì)發(fā)展的重要作用,促進(jìn)技術(shù)進(jìn)步,實(shí)現(xiàn)社會(huì)公共利益。為了實(shí)現(xiàn)這一平衡,我國(guó)需要在著作權(quán)立法層面構(gòu)建合理的數(shù)據(jù)挖掘例外制度。
5.1 對(duì)商業(yè)目的與非商業(yè)目的下的數(shù)據(jù)挖掘?qū)嵭小半p軌制”
數(shù)據(jù)挖掘技術(shù)在實(shí)踐中應(yīng)用的目的整體可分為商業(yè)目的與非商業(yè)目的兩類。從國(guó)際實(shí)踐來(lái)看,歐盟的數(shù)據(jù)挖掘默示許可模式、日本的例外規(guī)定與美國(guó)的合理使用的司法實(shí)踐未將非商業(yè)目的作為數(shù)據(jù)挖掘例外適用的前提,而歐盟的數(shù)據(jù)挖掘一般例外規(guī)則與英國(guó)、法國(guó)、德國(guó)的數(shù)據(jù)挖掘例外規(guī)定均將數(shù)據(jù)挖掘的目的限制于非商業(yè)目的。
作為一項(xiàng)高效率地對(duì)大數(shù)據(jù)進(jìn)行分析后發(fā)現(xiàn)潛在有用信息的過(guò)程[19],人工智能時(shí)代,數(shù)據(jù)挖掘應(yīng)用的領(lǐng)域愈發(fā)廣泛。除了傳統(tǒng)科學(xué)研究領(lǐng)域,在政府決策、企業(yè)決策、商業(yè)策略抉擇、信息中介服務(wù)等領(lǐng)域,運(yùn)用數(shù)據(jù)挖掘技術(shù)對(duì)海量信息進(jìn)行提取、分析并從中得出結(jié)果也對(duì)相關(guān)領(lǐng)域的發(fā)展具有重要意義。這些領(lǐng)域既包含商業(yè)領(lǐng)域,又包含非商業(yè)領(lǐng)域,因此無(wú)論是商業(yè)目的下的數(shù)據(jù)挖掘還是非商業(yè)目的下的數(shù)據(jù)挖掘,其適用都對(duì)社會(huì)發(fā)展具有重要意義,都應(yīng)該建立著作權(quán)例外制度,掃除阻礙其發(fā)展的著作權(quán)障礙。但商業(yè)目的下的數(shù)據(jù)挖掘同非商業(yè)目的相比,其應(yīng)用往往會(huì)給使用者帶來(lái)巨大利潤(rùn),出于權(quán)利義務(wù)平衡的考慮,行為人出于商業(yè)目的實(shí)施數(shù)據(jù)挖掘行為時(shí),應(yīng)該承擔(dān)較非商業(yè)目的下的數(shù)據(jù)挖掘更多的義務(wù)。因此,我國(guó)在數(shù)據(jù)挖掘例外制度立法構(gòu)建中,應(yīng)該對(duì)商業(yè)目的下和非商業(yè)目的下的數(shù)據(jù)挖掘?qū)嵭小半p軌制”規(guī)定,避免一刀切。
5.2 將非商業(yè)目的下的數(shù)據(jù)挖掘納入合理使用范疇
非商業(yè)目的下的數(shù)據(jù)挖掘,例如基于非商業(yè)性科學(xué)研究的數(shù)據(jù)挖掘或?yàn)榱藢?shí)現(xiàn)公共服務(wù)目的進(jìn)行的商業(yè)挖掘,其在適用中增進(jìn)了實(shí)現(xiàn)了社會(huì)公共利益,且行為人并未從數(shù)據(jù)挖掘中獲取私利,因此在滿足一定條件的情形下應(yīng)將其納入合理使用的范疇。
5.2.1 主體
當(dāng)前,非商業(yè)機(jī)構(gòu)與商業(yè)性機(jī)構(gòu)合作開展技術(shù)開發(fā)越發(fā)普遍,PPP模式下,有了商業(yè)性機(jī)構(gòu)的資金支持,在開展數(shù)據(jù)挖掘等技術(shù)過(guò)程時(shí)效率大幅提升。如果對(duì)商業(yè)性主體加以限制,就將排除PPP模式的合法性,因此在滿足非商業(yè)目的前提下,適用數(shù)據(jù)挖掘合理使用規(guī)則時(shí)無(wú)需再對(duì)主體是否具有商業(yè)性進(jìn)行區(qū)分。
5.2.2 客體
數(shù)據(jù)挖掘?qū)ο笫呛A壳曳彪s的數(shù)據(jù)與信息,目前由于技術(shù)限制數(shù)據(jù)挖掘在實(shí)施前無(wú)法判斷挖掘?qū)ο蟮膩?lái)源合法性,若因挖掘?qū)ο髞?lái)源不合法而將違法性延伸至挖掘結(jié)果,將造成技術(shù)投入的浪費(fèi)。因此,科研機(jī)構(gòu)在沒有合法接觸權(quán)的情況下應(yīng)當(dāng)有權(quán)實(shí)施數(shù)據(jù)挖掘,而權(quán)利人對(duì)此可以要求使用人支付合理的許可費(fèi)[20],直接否定了合法來(lái)源要件。但若將合法來(lái)源要件摒棄,可能出現(xiàn)行為人故意通過(guò)購(gòu)買盜版資源等低成本手段非法獲取數(shù)據(jù)挖掘材料,這會(huì)極大損害挖掘?qū)ο髾?quán)利人的合法權(quán)益,打破利益平衡機(jī)制。所以,客體合法來(lái)源要件在適用時(shí)應(yīng)考慮行為人的主觀狀態(tài),排除惡意使用人,允許善意使用人在繳納許可費(fèi)后繼續(xù)實(shí)施。
5.2.3 行為方式
數(shù)據(jù)挖掘在數(shù)據(jù)準(zhǔn)備階段與數(shù)據(jù)處理階段分別涉及對(duì)的數(shù)據(jù)信息的復(fù)制與轉(zhuǎn)換,所謂轉(zhuǎn)換即歐盟指令與法國(guó)《知識(shí)產(chǎn)權(quán)法典》規(guī)定的提取行為,進(jìn)入改編權(quán)的范疇。德國(guó)還規(guī)定了基于非商業(yè)目的下的向公眾傳播行為,即將數(shù)據(jù)挖掘過(guò)程中復(fù)制階段產(chǎn)生的復(fù)制件集合提供給公眾,這一行為超出了數(shù)據(jù)挖掘技術(shù)目的的范疇,不合理地限制了挖掘?qū)ο笾鳈?quán)人的權(quán)益。
5.3 商業(yè)目的下的數(shù)據(jù)挖掘納入法定許可范疇
綜上所述,在諸多商業(yè)領(lǐng)域,數(shù)據(jù)挖掘技術(shù)起到重要作用,若數(shù)據(jù)挖掘在商業(yè)領(lǐng)域的運(yùn)用遭到著作權(quán)限制,將不利于行業(yè)發(fā)展。同時(shí),如果采納歐盟的默示許可立法模式,將數(shù)據(jù)挖掘的授權(quán)權(quán)利交由挖掘?qū)ο蟮臋?quán)利人,則可能導(dǎo)致壟斷。能夠提供高額許可費(fèi)的規(guī)模較大的機(jī)構(gòu)掌握大批量材料的數(shù)據(jù)挖掘權(quán),而財(cái)力相對(duì)薄弱的小機(jī)構(gòu)無(wú)法掌握可供挖掘的材料,規(guī)模較大的市場(chǎng)主體占據(jù)了優(yōu)勢(shì),逐漸形成市場(chǎng)壟斷。為了避免這一情況,本文認(rèn)為可以對(duì)商業(yè)目的下的數(shù)據(jù)挖掘行為設(shè)置法定許可,對(duì)他人作品實(shí)施數(shù)據(jù)挖掘時(shí)可以不經(jīng)權(quán)利人許可但應(yīng)向其支付報(bào)酬。關(guān)于該項(xiàng)法定許可下客體規(guī)定、主體要求與行為方式應(yīng)與非商業(yè)目的下數(shù)據(jù)挖掘合理使用規(guī)則一致。
綜上,我國(guó)《著作權(quán)》法在下次修訂中,可在合理使用條款下增設(shè)非商業(yè)性數(shù)據(jù)挖掘的例外情形:機(jī)構(gòu)或個(gè)人基于非商業(yè)目的利用數(shù)據(jù)挖掘技術(shù)對(duì)他人作品進(jìn)行復(fù)制與轉(zhuǎn)換,可以不經(jīng)著作權(quán)人許可且無(wú)需支付報(bào)酬,但不得將復(fù)制結(jié)果向他人提供。同時(shí),在法定許可條款下增設(shè)商業(yè)性數(shù)據(jù)挖掘的例外情形:機(jī)構(gòu)或個(gè)人基于商業(yè)目的利用數(shù)據(jù)挖掘技術(shù)對(duì)合法獲得的他人作品進(jìn)行復(fù)制與轉(zhuǎn)換,可以不經(jīng)著作權(quán)人許可但需向其支付報(bào)酬,且不得將復(fù)制結(jié)果向他人提供。對(duì)于挖掘?qū)ο髞?lái)源的限制,商業(yè)目的與非商業(yè)目的下的數(shù)據(jù)挖掘例外條款應(yīng)采相同規(guī)定:在挖掘?qū)ο蟛⒎切袨槿撕戏ǐ@取的作品時(shí),如行為人知道或應(yīng)該知道作品來(lái)源違法,則數(shù)據(jù)挖掘行為構(gòu)成侵權(quán);反之,數(shù)據(jù)挖掘行為不構(gòu)成侵權(quán),但行為人應(yīng)向權(quán)利人支付許可費(fèi)。
6 "結(jié)語(yǔ)
數(shù)據(jù)挖掘作為人工智能時(shí)代的重要技術(shù)工具,解開束縛其的著作權(quán)為其發(fā)展應(yīng)用提供便利是時(shí)代的選擇。歐洲各國(guó)、美國(guó)、日本均在立法與司法上為數(shù)據(jù)挖掘設(shè)置著作權(quán)例外,給中國(guó)提供了參考借鑒。中國(guó)應(yīng)完善著作權(quán)立法,以數(shù)據(jù)挖掘是否具有商業(yè)目的進(jìn)行劃分,將非商業(yè)目的下的數(shù)據(jù)挖掘納入合理范疇,將商業(yè)目的下的數(shù)據(jù)挖掘納入法定許可范疇。
參考文獻(xiàn)
參考文獻(xiàn):
[1] DIANE MCDONALD.Value and benefits of text mining[EB/OL].(2020-01-03)[2024-03-03]. https://beta.jisc.ac.uk/reports/value-and-benefits-of-text-mining.
[2] 中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院.人工智能標(biāo)準(zhǔn)化白皮書[EB/OL]. (2018-01-24) [2024-03-05].https://www.cesi.cn/201801/3545.html.
[3] EUROPEAN UNION.Maximising the benefits of Artificial Intelligence through future-proof rules on Text and Data Mining[EB/OL]. (2018-04-09) [2024-03-05] https://eare.eu/open-letter-maximising-the-benefits-of-artificial-intelligence-through-future-proof-rules-on-text-and-data-mining/.
[4] 張鵬,何文莉. AI+大數(shù)據(jù),新冠肺炎知識(shí)智能服務(wù)應(yīng)用大揭秘[EB/OL].(2020-05-28)[2024-03-05] https://zhuanlan.zhihu.com/p/144251783.
[5] 賈磊.數(shù)據(jù)新聞數(shù)據(jù)挖掘的著作權(quán)侵權(quán)風(fēng)險(xiǎn)與例外制度構(gòu)建[J].新聞愛好者,2020(6):42-45.
[6] 吳小坤.數(shù)據(jù)新聞:理論承遞、概念適用與界定維度[J].新聞與傳播研究,2017,24(10):120-126.
[7] 曹源.人工智能創(chuàng)作物獲得版權(quán)保護(hù)的合理性[J].科技與法律,2016(3):488-508.
[8] 高笑笑. 人工智能對(duì)著作權(quán)制度的法律挑戰(zhàn)與機(jī)遇——以ChatGPT生成“作品”為例 [J]. 科技創(chuàng)業(yè)月刊, 2023, 36(10): 30-34.
[9] 楊娟.文本與數(shù)據(jù)挖掘合理使用例外規(guī)范的體系化設(shè)置[J].圖書館論壇,2020,40(4):141-150.
[10] KATRINE LEVIN.Intellectual property law-Mai V. Peak.Should loading operating system software into RAM constitute copyright infringement[J]. Golden Gate University Law Review,1994,24(1) :649-683.
[11] 王遷.網(wǎng)絡(luò)環(huán)境中的著作權(quán)保護(hù)研究[M].北京:法律出版社,2011.
[12] 李楊.著作權(quán)合理使用制度的體系構(gòu)造與司法互動(dòng)[J].法學(xué)評(píng)論,2020,38(4):88-97.
[13] 張惠彬,肖啟賢.人工智能時(shí)代文本與數(shù)據(jù)挖掘的版權(quán)豁免規(guī)則建構(gòu)[J].科技與法律(中英文),2021(6):74-84.
[14] MICHAEL CA RROLL.Copyright and the progress of science: why text and data mining is lawful[J]. U C Davis Law Review,2019,53(2):893-964.
[15] 羅嬌,張曉林.支持文本與數(shù)據(jù)挖掘的著作權(quán)法律政策建議[J].中國(guó)圖書館學(xué)報(bào),2018,44(3):21-34.
[16] 萬(wàn)勇,劉永沛.伯克利科技與法律評(píng)論:美國(guó)知識(shí)產(chǎn)權(quán)經(jīng)典案例年度評(píng)論(2013)[M].北京: 知識(shí)產(chǎn)權(quán)出版社,2016.
[17] VICTORIA CAMPBELL.Authors Guild v. Google, Inc. [J].De Paul Journal of Art, Technology and Intellectual Property Law, 2016,27(1):59-72.
[18] 唐思慧.大數(shù)據(jù)環(huán)境下文本和數(shù)據(jù)挖掘的版權(quán)例外研究——以歐盟《DSM版權(quán)指令》提案為視角[J].知識(shí)產(chǎn)權(quán),2017(10):109-116.
[19] 徐軒,孫益武.英國(guó)數(shù)據(jù)挖掘著作權(quán)例外條款研究及其啟示[J].圖書館建設(shè),2015(9):10-14.
[20] RETO M. HI CHTER. Position statement of the Max Planck institute for innovation and competition on the proposed mode modernisation of European copyright rules[J]. Max Planck Institute for Innovation and Competition Research Paper,2017,9(2):7-10.
(責(zé)任編輯:要 毅)