曹迪龍,楊文暉,苗 放
(1.成都理工大學(xué) 信息科學(xué)與技術(shù)學(xué)院,四川 成都 610000;2.成都理工大學(xué),四川 成都 610000;3.成都大學(xué)大數(shù)據(jù)研究院,四川 成都 610000)
傳統(tǒng)著作者維護(hù)作品版權(quán)一般是通過實體憑證,或第三方機(jī)構(gòu)認(rèn)證,如通過出版社出版實體作品等。資產(chǎn)的流通也普遍依賴于實體書籍的售賣,這不僅導(dǎo)致著作者本人不能全部得到其作品所獲取的所有利益,同時也面臨著盜版、侵權(quán)等一系列問題。5G時代的來臨,使得互聯(lián)網(wǎng)越來越多地應(yīng)用于日常生活,加之互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,資產(chǎn)數(shù)字化也在不斷增速。理論上一切可標(biāo)準(zhǔn)化數(shù)字化的實體作品都會逐步成為數(shù)字資產(chǎn),常見的數(shù)字資產(chǎn)包括數(shù)字積分、虛擬貨幣、電子優(yōu)惠券、虛擬游戲道具等[1]。作品數(shù)字化實現(xiàn)了著作者本人與其數(shù)字作品之間形成直接聯(lián)系,避免了像出版社這樣的第三方代理機(jī)構(gòu)對作品進(jìn)行管理、出版和售賣等操作的現(xiàn)象。但同時也加大了著作者本人對其作品權(quán)屬認(rèn)定的難度,由于網(wǎng)絡(luò)開放程度大,且沒有統(tǒng)一的數(shù)字作品存儲地,這使得數(shù)字作品存在被篡改的風(fēng)險,直接導(dǎo)致數(shù)字資產(chǎn)的流失。
根據(jù)統(tǒng)計數(shù)據(jù)顯示,2019年全國著作權(quán)登記總量達(dá)4 186 549件,同比增長21.09%。作品登記總量達(dá)2 701 564件,同比增長14.86%。其中科技文化領(lǐng)域內(nèi)容被侵權(quán)最嚴(yán)重,每兩位作者里就會有一位被侵權(quán)。從作者層面看,2019年被侵權(quán)的作者占全體作者的23%,從內(nèi)容層面上看,平均每篇內(nèi)容的被侵權(quán)量為3.64次。由此可見,數(shù)字作品權(quán)屬的保護(hù)仍面臨著不小的困難,如何保障著作者本人的權(quán)益成為當(dāng)前網(wǎng)絡(luò)環(huán)境中作品數(shù)字化所面臨的難題。
2008年中本聰首次發(fā)表論文《比特幣:一種點(diǎn)對點(diǎn)電子現(xiàn)金系統(tǒng)》[2],并且于2009年發(fā)布首個比特幣區(qū)塊鏈系統(tǒng)。區(qū)塊鏈技術(shù)具有去中心化、可追蹤可溯源,以及分布式架構(gòu)等特點(diǎn),形成一種沒有中心機(jī)構(gòu),多方協(xié)作且無需信任的分布式系統(tǒng)。由于各方互不信任,且維護(hù)同一賬本,極大地降低了出現(xiàn)錯誤記錄的風(fēng)險。
基于區(qū)塊鏈的數(shù)字作品自動定價和交易系統(tǒng),允許任何有資格的個人或機(jī)構(gòu)在系統(tǒng)中發(fā)布和管理數(shù)字作品。該系統(tǒng)采用區(qū)塊鏈的一致性機(jī)制、分布式分類賬和鏈?zhǔn)綌?shù)據(jù)塊存儲技術(shù),具有以下優(yōu)點(diǎn):①交易雙方無需信任即可實現(xiàn)數(shù)字作品的安全交易;②系統(tǒng)自動制定數(shù)字作品價格,避免出現(xiàn)惡意交易虛擬貨幣,或惡意提高作品價格的現(xiàn)象;③利用鏈接存證,減小了區(qū)塊鏈的存儲壓力;④實時同步分布式分類賬,實現(xiàn)實時對賬和交易結(jié)算;⑤交易數(shù)據(jù)具有安全、不可篡改的特點(diǎn),且能夠追蹤溯源,避免了出現(xiàn)交易抵賴的現(xiàn)象。
從本質(zhì)上講,區(qū)塊鏈?zhǔn)且粋€共享數(shù)據(jù)庫,其中存儲的數(shù)據(jù)或信息具有“不可偽造”、“全程跟蹤”、“可追溯”、“公開透明”和“集體維護(hù)”的特點(diǎn)[3]。由于區(qū)塊鏈具有這些特點(diǎn),它奠定了堅實的“信任”基礎(chǔ),創(chuàng)造了可靠的“合作”機(jī)制,使得其在金融等領(lǐng)域中有著廣闊的應(yīng)用場景。區(qū)塊鏈技術(shù)是近年來出現(xiàn)的一種新技術(shù),由去中心化和非對稱數(shù)據(jù)加密、時間戳、分布式計算、共識算法等經(jīng)典計算機(jī)技術(shù)組成[4-6]。區(qū)塊鏈將加密技術(shù)與分布式消息傳輸協(xié)議相結(jié)合,將對賬過程簡化為共享的分布式總賬形式,通過分散式協(xié)作隊總賬進(jìn)行維護(hù)不僅提高了數(shù)據(jù)處理效率,還完成了信息的共享,同時確保了數(shù)據(jù)的安全,避免數(shù)據(jù)被篡改。區(qū)塊鏈技術(shù)與傳統(tǒng)技術(shù)相比,在持續(xù)性、兼容性、共享信息和互聯(lián)性等方面具有顯著優(yōu)勢[7]。
區(qū)塊鏈基礎(chǔ)架構(gòu)模型如圖1所示。
圖1 區(qū)塊鏈基礎(chǔ)架構(gòu)模型
區(qū)塊鏈有三種類型,即公有區(qū)塊鏈、聯(lián)合(行業(yè))區(qū)塊鏈以及私有區(qū)塊鏈,其主要特點(diǎn)如下:
公有區(qū)塊鏈(public block chains):世界上所有的個人和團(tuán)體都可以進(jìn)行交易,交易可以得到有效的確認(rèn),并且所有人都可以參與到共識過程中來。
聯(lián)合(行業(yè))區(qū)塊鏈(consortium block chains):預(yù)先選擇一些節(jié)點(diǎn)作為記賬人,節(jié)點(diǎn)選擇權(quán)是由某一個群體內(nèi)部決定,這些節(jié)點(diǎn)的具有決定區(qū)塊生成的權(quán)利,其他節(jié)點(diǎn)可以參與到交易過程,但不過問記賬過程。
私有區(qū)塊鏈(private block chains):僅僅利用區(qū)塊鏈的總記賬技術(shù)進(jìn)行記賬,可以是某個團(tuán)體或是某個人,獨(dú)享該區(qū)塊鏈的寫入權(quán)限。
共識機(jī)制是通過特殊的節(jié)點(diǎn)投票,在很短的時間內(nèi)完成對事務(wù)的驗證和確認(rèn),是使區(qū)塊鏈成為一種自信任體制的核心前提。區(qū)塊鏈的自信任主要體現(xiàn)在不需要存在一個可信的中心化機(jī)構(gòu),用戶在區(qū)塊鏈中不需要信任交易的對方,只需要信任軟件系統(tǒng)在區(qū)塊鏈協(xié)議下實現(xiàn)交易即可。
現(xiàn)今區(qū)塊鏈中的共識機(jī)制主要分為四類:工作量證明機(jī)制(proof of work,PoW),主要應(yīng)用于比特幣網(wǎng)絡(luò),但由于PoW在比特幣網(wǎng)絡(luò)中的應(yīng)用已經(jīng)吸引了全球計算機(jī)大部分的算力,同時基于PoW的挖礦行為還造成了大量資源的浪費(fèi),達(dá)成共識所需要的周期也較長,因此該機(jī)制并不適用于其他應(yīng)用場景。權(quán)益證明機(jī)制(proof of stake,PoS),與PoW的區(qū)別在于不需要證明人執(zhí)行一定的計算工作,只要求證明人提供一定數(shù)量加密貨幣的所有權(quán)即可。但本質(zhì)上與PoW一樣,需要網(wǎng)絡(luò)中的節(jié)點(diǎn)進(jìn)行挖礦運(yùn)算。股份授權(quán)證明機(jī)制(delegated proof of stake,DPOS),是一種新的保障網(wǎng)絡(luò)安全的共識機(jī)制,類似于董事會投票,通過全體節(jié)點(diǎn)選出具有代表資格的一定數(shù)量的節(jié)點(diǎn)進(jìn)行確認(rèn)區(qū)塊、維持系統(tǒng)有序運(yùn)行。同時全體節(jié)點(diǎn)也具有罷免代表的權(quán)利,從而實現(xiàn)實時民主。DPOS可以大大縮小參與驗證和記賬節(jié)點(diǎn)的數(shù)量,從而達(dá)到秒級的共識驗證。Pool驗證池是在傳統(tǒng)分布式一致性技術(shù)的基礎(chǔ)上建立的,輔以數(shù)據(jù)驗證機(jī)制,是當(dāng)前區(qū)塊鏈廣泛使用的一種共識機(jī)制。但其也存在一些不足,該共識機(jī)制實現(xiàn)的分布式程度不如PoW機(jī)制等[8]。
分布式賬本是基于計算能力和密碼學(xué)的突破,并結(jié)合一些新的有趣算法的發(fā)現(xiàn)和使用,所形成的一種由大型網(wǎng)絡(luò)中的全部參與者共享、復(fù)制和同步的數(shù)據(jù)庫。該分布具有唯一性:不通過某個中心機(jī)構(gòu)與各節(jié)點(diǎn)通信完成記錄,而是有各個節(jié)點(diǎn)獨(dú)立地構(gòu)造和保持。網(wǎng)絡(luò)中的每個用戶處理同一個事務(wù),得出各自結(jié)論,然后對結(jié)論進(jìn)行投票,采用少數(shù)服從多數(shù)的方式,得到最終結(jié)論,一旦達(dá)成共識,分布式賬本就會更新,所以節(jié)點(diǎn)都會保留自己的賬本副本。
分布式賬本技術(shù)顛覆傳統(tǒng)的賬本模式。第一,分布式賬本是基于分布式共識算法建立的,其記錄的非簡單的一串?dāng)?shù)字,而是數(shù)據(jù)流;第二,記賬方法屬于第三方記賬;第三,共享記賬,所有節(jié)點(diǎn)在同一賬本上共享及共同管理賬目信息;第四,它是一種不僅可以記錄資金流,同時也可以記錄信息流的全信息賬本。
深度學(xué)習(xí)算法通過對海量數(shù)據(jù)進(jìn)行分割,提取出大量的隱性元素,并根據(jù)多維標(biāo)簽對數(shù)據(jù)進(jìn)行分類,得到具有參考意義的摘要信息。根據(jù)深度學(xué)習(xí)算法可以設(shè)計一種針對數(shù)字作品的自動定價模型。模型架構(gòu)如圖2所示。
圖2 自動定價模型架構(gòu)
把數(shù)字作品的相關(guān)特征輸入模型的輸入層,然后對不同類型的數(shù)據(jù)進(jìn)行處理和嵌入。具體方法是先將數(shù)字作品標(biāo)題和數(shù)字作品描述這種非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行預(yù)處理,即分詞操作,獲得每個單詞的索引,然后將每個詞的索引轉(zhuǎn)換為嵌入層中相應(yīng)的詞向量。對于標(biāo)題長度和描述長度等這種結(jié)構(gòu)化數(shù)據(jù)則轉(zhuǎn)化為相應(yīng)的數(shù)值,在嵌入層中轉(zhuǎn)化為對應(yīng)的嵌入向量[9]。
通過雙向門控循環(huán)單元[10](bi-directional gated recurrent unit,BiGRU)對得到的數(shù)字作品標(biāo)題和數(shù)字作品描述的詞向量序列中的文本語義進(jìn)行建模,再結(jié)合其他輸入數(shù)據(jù)的詞嵌入進(jìn)行拼接得到完整的矩陣[11],最后使用深度人工神經(jīng)網(wǎng)絡(luò)進(jìn)行特征的提取和組合[12-14]。
區(qū)塊鏈作為一種去中心化數(shù)據(jù)庫,其數(shù)據(jù)是存儲在每一個區(qū)塊中,雖然區(qū)塊鏈的賬本在每個節(jié)點(diǎn)中都留有副本,但是區(qū)塊鏈上的存儲空間仍舊是極其寶貴和有限的。存儲較大內(nèi)容的數(shù)據(jù)會占用區(qū)塊鏈的存儲空間。因此對于數(shù)字作品這類可能占用空間較大的數(shù)據(jù),采用鏈接存證的方式將其存儲在區(qū)塊鏈上。
鏈接存證是將數(shù)字作品的內(nèi)容的哈希值和數(shù)字作品的URL地址一同進(jìn)行保存上鏈[15]。數(shù)字作品內(nèi)容的哈希值通常稱為“數(shù)字指紋”,因為哈希值的長度是有限的,無論內(nèi)容多大,其哈希值長度是不會改變的,因此存儲這樣一個哈希值對區(qū)塊鏈來講毫無壓力。雖然數(shù)字指紋可以驗證數(shù)字作品是否被篡改,但無法查看到其原文是什么,因此將數(shù)字作品的URL地址與數(shù)字指紋一同上鏈,這樣既能減小區(qū)塊鏈的存儲壓力,驗證數(shù)字作品真實性,同時也能夠得到原文。
區(qū)塊鏈數(shù)字作品自動定價與交易系統(tǒng)主要實現(xiàn)個人發(fā)行、管理以及交易流通數(shù)字作品的功能。根據(jù)與數(shù)字作品的關(guān)聯(lián)程度,系統(tǒng)業(yè)務(wù)可以分為兩類:
(1)核心業(yè)務(wù):數(shù)字作品的登記、存儲、交易等業(yè)務(wù)。
(2)非核心業(yè)務(wù):系統(tǒng)使用者的注冊、瀏覽、管理等業(yè)務(wù)。
該系統(tǒng)分為客戶端和區(qū)塊鏈節(jié)點(diǎn)服務(wù)器兩部分??蛻舳酥饕瓿煞呛诵臉I(yè)務(wù),以及遞交核心業(yè)務(wù)到區(qū)塊鏈節(jié)點(diǎn)服務(wù)器處理。區(qū)塊鏈節(jié)點(diǎn)服務(wù)器主要完成核心業(yè)務(wù),即執(zhí)行交易過程,將交易結(jié)果打包成塊,通過共識機(jī)制以后寫入?yún)^(qū)塊鏈分類賬。用戶注冊系統(tǒng)時,會隨機(jī)分配到一臺區(qū)塊鏈節(jié)點(diǎn)服務(wù)器成為該服務(wù)器中的一個節(jié)點(diǎn),隨著用戶的增多,可以組成一個分布式的區(qū)塊鏈節(jié)點(diǎn)網(wǎng)絡(luò)。系統(tǒng)整體架構(gòu)如圖3所示。
圖3 系統(tǒng)整體架構(gòu)
與傳統(tǒng)的集中式管理系統(tǒng)相比,該系統(tǒng)在客戶端采用傳統(tǒng)架構(gòu),而區(qū)塊鏈服務(wù)器節(jié)點(diǎn)網(wǎng)絡(luò)采用分布式架構(gòu),因此具有如下優(yōu)勢:
(1)節(jié)點(diǎn)網(wǎng)絡(luò)采用去中心化架構(gòu),實現(xiàn)每個用戶對其所有的數(shù)字作品進(jìn)行自主管理,用戶之間直接交易,無需第三方信任機(jī)構(gòu)。
(2)利用PoS共識機(jī)制,在一定程度上減少了數(shù)字運(yùn)算帶來的消耗,不需要消耗大量能源挖礦,性能也得到了相應(yīng)的提升,縮短了達(dá)成共識的時間,且與PoW有相同的容錯性,更加環(huán)保。
(3)區(qū)塊鏈節(jié)點(diǎn)網(wǎng)絡(luò)執(zhí)行核心業(yè)務(wù),廣播整個網(wǎng)絡(luò)交易信息,并進(jìn)行一致確認(rèn),以確保交易數(shù)據(jù)的有效性和透明度。
(4)非核心業(yè)務(wù)采用傳統(tǒng)中心化架構(gòu),與核心業(yè)務(wù)分開管理,互不影響。
系統(tǒng)的邏輯層可分為應(yīng)用層、服務(wù)層和區(qū)塊鏈層。應(yīng)用層主要負(fù)責(zé)系統(tǒng)用戶注冊/登錄、數(shù)字作品注冊和交易操作。服務(wù)層連接應(yīng)用層和區(qū)塊鏈層,提供一些用戶服務(wù)功能和接口等。區(qū)塊鏈層主要包括區(qū)塊鏈服務(wù)器、共識機(jī)制、網(wǎng)絡(luò)通信模塊等。三層結(jié)構(gòu)組成一種自下而上的以區(qū)塊鏈為核心的邏輯層次,系統(tǒng)整體邏輯層次如圖4所示。
圖4 系統(tǒng)整體邏輯層次
該系統(tǒng)中的非核心業(yè)務(wù)與一般中心化管理系統(tǒng)相類似,即用戶注冊登錄等信息保存數(shù)據(jù)庫中,調(diào)用接口執(zhí)行相應(yīng)命令。核心業(yè)務(wù)主要有兩部分,一是數(shù)字作品的登記上鏈,用戶將數(shù)字作品在客戶端上傳存儲到區(qū)塊鏈節(jié)點(diǎn)區(qū)塊中,這時區(qū)塊鏈系統(tǒng)會接收消息并廣播全網(wǎng),達(dá)成共識后,記錄該數(shù)字作品到賬本中;二是數(shù)字作品的交易流程,用戶在客戶端提交交易申請,區(qū)塊鏈系統(tǒng)接收到申請后會執(zhí)行交易流程,并廣播全網(wǎng)達(dá)成共識,記錄交易信息到賬本中,返回交易結(jié)果給客戶端。客戶端處理非核心業(yè)務(wù),并獲取交易結(jié)果,將最終的交易信息返回給用戶。具體業(yè)務(wù)邏輯如圖5所示。
圖5 系統(tǒng)業(yè)務(wù)邏輯
3.2.1 用戶注冊
當(dāng)用戶在客戶端注冊時,將生成一對公鑰和私鑰,私鑰用戶自己留存,公鑰由系統(tǒng)直接編碼形成用戶ID,記錄在客戶端數(shù)據(jù)庫中,同時將公鑰發(fā)送給某個區(qū)塊鏈服務(wù)器。區(qū)塊鏈服務(wù)器對用戶的注冊信息進(jìn)行驗證,驗證通過以后,簽名并存儲用戶信息到區(qū)塊鏈中,成為鏈上的一個節(jié)點(diǎn)塊,區(qū)塊鏈系統(tǒng)廣播整個網(wǎng)絡(luò),達(dá)成共識并記錄到賬本中,完成用戶注冊。
3.2.2 數(shù)字作品登記
用戶需要在客戶端對數(shù)字作品進(jìn)行登記,登記信息包括:數(shù)字作品標(biāo)題、數(shù)字作品描述(簡介)、作品類型和大小。系統(tǒng)會根據(jù)用戶輸入的數(shù)據(jù)使用自動定價模型,得到數(shù)字作品的價格,該價格不可更改。同時,還需要用戶上傳數(shù)字作品,客戶端會將數(shù)字作品進(jìn)行哈希加密(SHA256),并上傳至文件存儲服務(wù)器,返回文件URL地址。然后客戶端會將數(shù)字作品的哈希值和URL地址,即數(shù)字作品的鏈?zhǔn)酱孀C,提交給區(qū)塊鏈系統(tǒng)。區(qū)塊鏈系統(tǒng)收到數(shù)據(jù)后進(jìn)行全網(wǎng)廣播、共識,并記錄到賬本中,完成數(shù)字作品登記。
3.2.3 數(shù)字作品交易
用戶提交交易申請到區(qū)塊鏈系統(tǒng),系統(tǒng)會首先驗證交易發(fā)起者的身份,然后查詢其賬戶余額是否充足,如果余額不足則交易失?。蝗绻囝~充足則返回交易結(jié)果。交易流程如圖6所示。
圖6 系統(tǒng)交易流程
系統(tǒng)測試主要是對系統(tǒng)性能和業(yè)務(wù)流程進(jìn)行測試。采用黑盒測試技術(shù)對系統(tǒng)業(yè)務(wù)流程進(jìn)行測試,模擬從用戶注冊到交易完成一系列操作,以檢驗系統(tǒng)業(yè)務(wù)流程是否完整。系統(tǒng)性能測試則采用實驗的方式,得到從并發(fā)交易開始到完成交易時,系統(tǒng)的交易處理率和交易平均延時。
利用三臺虛擬機(jī)搭建分布式測試環(huán)境,每臺虛擬機(jī)采用相同操作系統(tǒng)和系統(tǒng)設(shè)置。在局域網(wǎng)中測試了系統(tǒng)的性能,并采用了相同的算法機(jī)制,以減少網(wǎng)絡(luò)環(huán)境和算法對實驗結(jié)果的影響。
系統(tǒng)在一定時間內(nèi)成功完成和提交的事務(wù)數(shù)與事務(wù)總數(shù)的比值即為事務(wù)處理率。系統(tǒng)完成一個事務(wù)所花費(fèi)的平均時間就是該事務(wù)的平均延遲。計算公式如下:
事務(wù)平均延時=事務(wù)總延時/事務(wù)筆數(shù)
事務(wù)處理率=正常通過事務(wù)數(shù)/總事務(wù)數(shù)
根據(jù)測試得到的數(shù)據(jù)結(jié)果可知,在具有三個節(jié)點(diǎn)的分布式區(qū)塊鏈網(wǎng)絡(luò)中,當(dāng)使用PoS共識機(jī)制時,平均事務(wù)延遲隨著并發(fā)事務(wù)數(shù)量的增加而增加,同時交易處理率隨之下降。當(dāng)并發(fā)交易數(shù)在350筆時,交易處理率開始下降,交易平均延時開始增加。綜上所述,該系統(tǒng)在接收并發(fā)交易數(shù)據(jù)小于350筆時,系統(tǒng)性能達(dá)到最好的效果,此時系統(tǒng)的單筆交易延時為5 s~10 s。
針對傳統(tǒng)的中心化系統(tǒng)存在的信任依賴度高、透明度低、維護(hù)成本較高等缺點(diǎn),設(shè)計了一種基于區(qū)塊鏈的數(shù)字作品自動定價與交易系統(tǒng),在保障數(shù)字作品著作人權(quán)益的同時,能夠?qū)崿F(xiàn)用戶之間直接交易。對系統(tǒng)所使用的技術(shù)及其設(shè)計框架和業(yè)務(wù)流程進(jìn)行了介紹,該系統(tǒng)具有無需第三方信任機(jī)構(gòu)、自動制定數(shù)字作品價格、使用鏈接存證等特點(diǎn)。最后對系統(tǒng)性能進(jìn)行了測試和分析,由測試結(jié)果可知雖然系統(tǒng)可以達(dá)到預(yù)期的效果,但距離實際應(yīng)用的要求仍然有著不小的距離。因此,下一步將在充分發(fā)展系統(tǒng)優(yōu)勢的同時,解決系統(tǒng)所存在的問題,實現(xiàn)更加理想的交易處理能力。