張長(zhǎng)魯,張 健
(1.北京信息科技大學(xué) 經(jīng)濟(jì)管理學(xué)院,北京 100192;2.綠色發(fā)展大數(shù)據(jù)決策北京市重點(diǎn)實(shí)驗(yàn)室,北京 100192)
區(qū)塊鏈起源于化名為“中本聰”(Satoshi Nakamoto)的學(xué)者在2008年發(fā)表的奠基性論文《比特幣:一種點(diǎn)對(duì)點(diǎn)電子現(xiàn)金系統(tǒng)》,是以比特幣為代表的去中心化點(diǎn)對(duì)點(diǎn)數(shù)字貨幣的核心支撐技術(shù)。近年來(lái),隨著比特幣的火爆而逐步引起各類組織和學(xué)者的關(guān)注,區(qū)塊鏈具有去中心化、不可篡改、可追溯等特性,徹底顛覆了傳統(tǒng)中心化組織思想,未來(lái)有望引發(fā)商業(yè)模式創(chuàng)新乃至社會(huì)運(yùn)行方式變革。
當(dāng)前以聯(lián)合國(guó)、國(guó)際貨幣基金組織、歐盟等為代表的國(guó)際組織和美國(guó)、英國(guó)、日本等多個(gè)國(guó)家政府高度重視區(qū)塊鏈的發(fā)展。中國(guó)政府也積極部署區(qū)塊鏈技術(shù)研究與應(yīng)用創(chuàng)新,不斷提升區(qū)塊鏈研究的戰(zhàn)略定位。2016年國(guó)務(wù)院印發(fā)《“十三五”國(guó)家信息化規(guī)劃》,將區(qū)塊鏈技術(shù)列為戰(zhàn)略性前沿技術(shù);2018年工信部印發(fā)《工業(yè)互聯(lián)網(wǎng)發(fā)展行動(dòng)計(jì)劃(2018—2020年)》,鼓勵(lì)區(qū)塊鏈等新興前沿技術(shù)在工業(yè)互聯(lián)網(wǎng)中的應(yīng)用研究與探索;2019年習(xí)近平總書記在主持中共中央政治局第十八次學(xué)習(xí)時(shí)強(qiáng)調(diào):“要把區(qū)塊鏈作為核心技術(shù)自主創(chuàng)新的重要突破口,加快推動(dòng)區(qū)塊鏈技術(shù)和產(chǎn)業(yè)創(chuàng)新發(fā)展”。
與官方政府組織的高度重視相呼應(yīng),學(xué)術(shù)界對(duì)區(qū)塊鏈的研究也在如火如荼地開展。以中國(guó)知網(wǎng)核心期刊數(shù)據(jù)庫(kù)為例,2015年發(fā)表的區(qū)塊鏈相關(guān)文獻(xiàn)僅有2篇,2019年達(dá)到了581篇,發(fā)文量呈指數(shù)級(jí)增長(zhǎng)。作為新興研究領(lǐng)域,了解當(dāng)前研究進(jìn)程、剖析未來(lái)研究趨勢(shì)尤為重要。然而,隨著發(fā)文量的增多,以及各學(xué)科領(lǐng)域的百花齊放,難以直觀了解區(qū)塊鏈研究框架、熱點(diǎn)主題和未來(lái)趨勢(shì),因此有必要對(duì)區(qū)塊鏈領(lǐng)域的研究文獻(xiàn)進(jìn)行系統(tǒng)梳理。
以往針對(duì)區(qū)塊鏈文獻(xiàn)進(jìn)行梳理的研究可以分為兩類:一是綜述類文獻(xiàn),該類文獻(xiàn)一般從定性分析的角度,論述區(qū)塊鏈的有關(guān)概念、核心技術(shù)、研究現(xiàn)狀、現(xiàn)存問(wèn)題和未來(lái)趨勢(shì)。如袁勇等闡述了區(qū)塊鏈的基本原理、核心技術(shù)與應(yīng)用現(xiàn)狀,介紹了基于區(qū)塊鏈的平行社會(huì)發(fā)展趨勢(shì)[1];曾詩(shī)欽等闡述了區(qū)塊鏈基本原理和概念,并設(shè)計(jì)了一個(gè)層次化區(qū)塊鏈技術(shù)體系,將現(xiàn)有針對(duì)區(qū)塊鏈的研究納入該體系中[2]。二是計(jì)量類文獻(xiàn),該類文獻(xiàn)一般以文獻(xiàn)計(jì)量為主要手段,通過(guò)對(duì)現(xiàn)有文獻(xiàn)的統(tǒng)計(jì)分析,從文獻(xiàn)時(shí)間序列、主要研究機(jī)構(gòu)、學(xué)科分布、熱點(diǎn)主題挖掘的視角進(jìn)行論述。如汪園等開展的都是這類研究[3-4]。
綜述類文獻(xiàn)以定性分析、歸納總結(jié)為主,容易受研究者主觀觀念、所處學(xué)科領(lǐng)域以及學(xué)術(shù)研究履歷的影響,因此針對(duì)區(qū)塊鏈的綜述類研究經(jīng)常出現(xiàn)客觀性和凝練度不夠的問(wèn)題。計(jì)量類文獻(xiàn)大都采用相似的視角進(jìn)行分析,區(qū)別主要在于文獻(xiàn)的時(shí)空范圍、個(gè)別分析角度不同。如上文所述的學(xué)者中,有針對(duì)國(guó)內(nèi)文獻(xiàn)進(jìn)行計(jì)量分析的,也有針對(duì)國(guó)內(nèi)外文獻(xiàn)進(jìn)行對(duì)比分析的;檢索文獻(xiàn)有截至2017年的,也有截至2018年的,但主體研究?jī)?nèi)容大體都是按照“文獻(xiàn)的時(shí)空分布→研究者合作關(guān)系→基于關(guān)鍵詞詞頻和共現(xiàn)的熱點(diǎn)分析→未來(lái)展望”思路展開。該類研究能夠在一定程度上揭示區(qū)塊鏈研究概貌,但以關(guān)鍵詞的詞頻或中心度表征的研究熱度只能代表研究者的關(guān)注點(diǎn),卻并不能有效聚焦凝練研究主題,更不能對(duì)主題內(nèi)涵進(jìn)行解讀。
為此,本文從主題挖掘的視角對(duì)國(guó)內(nèi)區(qū)塊鏈相關(guān)文獻(xiàn)進(jìn)行分析,不同于傳統(tǒng)的文獻(xiàn)計(jì)量方法,本文采用系統(tǒng)聚類方法,以Jaccard系數(shù)進(jìn)行文獻(xiàn)相似度衡量,將文獻(xiàn)進(jìn)行主題聚類;采用信息增益法計(jì)算各關(guān)鍵詞對(duì)各類主題的貢獻(xiàn)度,進(jìn)而利用高信息增益關(guān)鍵詞揭示主題內(nèi)涵;并根據(jù)各類主題相似性歸納構(gòu)建區(qū)塊鏈研究框架體系;最后,通過(guò)各主題的文獻(xiàn)量及其時(shí)間序列,分析得出當(dāng)前的熱點(diǎn)主題和未來(lái)的研究趨勢(shì)。
以主題為區(qū)塊鏈且關(guān)鍵詞中包含區(qū)塊鏈為檢索式,在中國(guó)知網(wǎng)期刊數(shù)據(jù)庫(kù)中進(jìn)行文獻(xiàn)檢索,期刊來(lái)源類別設(shè)定為核心期刊,檢索年限截至2020年,檢索時(shí)點(diǎn)為2020年3月1日,共檢索出1 143篇相關(guān)文獻(xiàn);對(duì)初步檢索文獻(xiàn)進(jìn)行篩選,去除新聞報(bào)道、評(píng)論短文、訪談及其他非學(xué)術(shù)論文,將剩余915篇精選文獻(xiàn)作為本文研究對(duì)象。
運(yùn)用Bicomb軟件,提取915篇文獻(xiàn)的關(guān)鍵詞,對(duì)關(guān)鍵詞進(jìn)行同義合并處理,最終提取1 974個(gè)關(guān)鍵詞,生成915×1 974的關(guān)鍵詞詞篇矩陣,以此作為系統(tǒng)聚類的數(shù)據(jù)來(lái)源。詞篇矩陣見表1。
表1 區(qū)塊鏈詞篇矩陣
表中每一行代表一篇文獻(xiàn),每一列代表一個(gè)關(guān)鍵詞,單元格中數(shù)字1代表相應(yīng)行中的文獻(xiàn)包含對(duì)應(yīng)列中的關(guān)鍵詞,0表示該關(guān)鍵詞未在相應(yīng)的文獻(xiàn)中出現(xiàn)。
對(duì)詞篇矩陣進(jìn)行系統(tǒng)聚類分析。由于關(guān)鍵詞詞篇矩陣屬于零值較多的稀疏矩陣,研究中主要關(guān)注關(guān)鍵詞在詞篇中的出現(xiàn)情況,即取值為1的情形,因此詞篇矩陣數(shù)據(jù)屬于典型的非對(duì)稱二分類數(shù)據(jù)。結(jié)合詞篇矩陣上述典型特征,采用系統(tǒng)聚類的組內(nèi)聯(lián)接聚類方法,利用Jaccard系數(shù)進(jìn)行文獻(xiàn)相似度衡量。
對(duì)詞篇矩陣來(lái)說(shuō),Jaccard系數(shù)是兩篇文獻(xiàn)包含的關(guān)鍵詞交集大小與兩篇文獻(xiàn)包含的關(guān)鍵詞并集大小之比,Jaccard系數(shù)越大說(shuō)明文獻(xiàn)相似度越高。Jaccard系數(shù)見式(1):
(1)
其中,a表示一篇文獻(xiàn)的關(guān)鍵詞集合,b表示另一篇文獻(xiàn)的關(guān)鍵詞集合,|a∩b|表示兩篇文獻(xiàn)共同包含的關(guān)鍵詞數(shù)量,|a∪b|表示兩篇文獻(xiàn)包含的所有關(guān)鍵詞數(shù)量。相較于常用的簡(jiǎn)單匹配系數(shù)法,Jaccard系數(shù)不考慮兩篇文獻(xiàn)同時(shí)不含有的關(guān)鍵詞,避免了詞篇矩陣稀疏性對(duì)文獻(xiàn)相似性度量的影響,因此能夠取得較為理想的聚類效果。系統(tǒng)聚類樹狀圖見圖1。
圖1 區(qū)塊鏈文獻(xiàn)聚類樹狀圖
在進(jìn)行主題聚類時(shí),主題類別的數(shù)量應(yīng)當(dāng)適中,類別太少,文獻(xiàn)分布則過(guò)于集中,類別太多,文獻(xiàn)分布則過(guò)于分散,都不便于探索區(qū)塊鏈領(lǐng)域研究的規(guī)律及特征。由圖1可知,當(dāng)聚類距離閾值界于24~25時(shí)能夠?qū)?dāng)前國(guó)內(nèi)區(qū)塊鏈領(lǐng)域的研究文獻(xiàn)合理地劃分為21類主題,本文取閾值為24.5,聚類結(jié)果見表2。
由表2可知,不同類別所包含的文獻(xiàn)數(shù)量有較大差異,其中第2類和第7類文獻(xiàn)量均在100篇以上,屬于熱點(diǎn)主題;除此之外,其余主題類別所包含文獻(xiàn)數(shù)量相差不大,最少的為第19類的11篇,最多的為第21類的72篇,這一現(xiàn)象說(shuō)明當(dāng)前區(qū)塊鏈研究領(lǐng)域相對(duì)分散,多個(gè)主題尚處于起步探索階段。
表2 區(qū)塊鏈文獻(xiàn)聚類結(jié)果
在聚類分析的基礎(chǔ)上,為準(zhǔn)確地解析每一類研究主題的內(nèi)涵,需要提取最能反映該類主題特征的關(guān)鍵詞,在此基礎(chǔ)上進(jìn)行主題凝練。
本文采用信息增益(IG)方法進(jìn)行主題特征詞提取,該方法依據(jù)特征詞能夠?yàn)榉诸愊到y(tǒng)貢獻(xiàn)的信息量大小來(lái)選擇主題特征詞。這一思想不僅符合人們的認(rèn)知習(xí)慣,易于理解,且具有較好的特征提取效果。本文根據(jù)每個(gè)關(guān)鍵詞為相應(yīng)類別帶來(lái)的信息量來(lái)衡量該關(guān)鍵詞對(duì)相應(yīng)類別的重要度;如果某關(guān)鍵詞帶來(lái)的信息增益越多,則其對(duì)該主題就越重要,越能夠區(qū)分該類主題與其他主題,體現(xiàn)類別主題特征。通常,某關(guān)鍵詞(tk)的信息增益等于不考慮該關(guān)鍵詞時(shí)類別X的信息熵H(X)和考慮該關(guān)鍵詞后該類別信息熵H(X|tk)的差值。
類別X的信息熵H(X)見式(2):
(2)
為計(jì)算考慮關(guān)鍵詞tk后類別X的信息熵H(X|tk),假定a表示關(guān)鍵詞tk在X類文獻(xiàn)中出現(xiàn)的篇數(shù),b表示關(guān)鍵詞tk在非X類文獻(xiàn)中出現(xiàn)的篇數(shù),c表示關(guān)鍵詞在X類文獻(xiàn)中未出現(xiàn)的篇數(shù),d表示關(guān)鍵詞在非X類文獻(xiàn)中未出現(xiàn)的篇數(shù)。則H(X|tk)見式(3):
(3)
關(guān)鍵詞tk的信息增益見式(4):
IG(tk)=H(X)-H(X|tk)
(4)
計(jì)算1 974個(gè)關(guān)鍵詞與21類主題的信息增益,并選取每一主題中信息增益排序前10的關(guān)鍵詞,具體運(yùn)算結(jié)果見表3。
表3 前十位高信息增益關(guān)鍵詞及主題定義
將信息增益顯著高于其他關(guān)鍵詞的特征詞稱為核心特征詞,通過(guò)每一主題的核心特征詞對(duì)該主題進(jìn)行定義,并結(jié)合其他高增益關(guān)鍵詞對(duì)每類主題的研究?jī)?nèi)容進(jìn)行歸納描述。具體如下:
第一類主題的核心特征詞為“大數(shù)據(jù)”。該主題主要針對(duì)區(qū)塊鏈與大數(shù)據(jù)的融合應(yīng)用開展研究,以期破解以往大數(shù)據(jù)應(yīng)用實(shí)踐中的弱數(shù)據(jù)可用性與數(shù)據(jù)安全問(wèn)題、大數(shù)據(jù)交易中的權(quán)益保護(hù)問(wèn)題[5]。故將該主題定義為“區(qū)塊鏈+大數(shù)據(jù)”研究。
第二類主題的核心特征詞為“智能合約”。智能合約是區(qū)塊鏈的核心技術(shù)之一,該主題主要圍繞智能合約的技術(shù)原理、合約設(shè)計(jì)及優(yōu)化、合約應(yīng)用等問(wèn)題展開研究[6]。故將該主題定義為“智能合約”研究。
第三類主題的核心特征詞為“隱私保護(hù)”。隱私保護(hù)問(wèn)題具有兩面性:首先,區(qū)塊鏈的匿名特性使得其在用戶隱私保護(hù)方面大有用武之地;但同時(shí)隱私保護(hù)又是區(qū)塊鏈自身發(fā)展中亟需解決的問(wèn)題。因此,該主題一方面運(yùn)用區(qū)塊鏈的匿名性和加密保護(hù)特性解決醫(yī)療數(shù)據(jù)共享、物聯(lián)網(wǎng)數(shù)據(jù)共享、共享經(jīng)濟(jì)發(fā)展等領(lǐng)域的隱私保護(hù)問(wèn)題[7];另一方面,則是針對(duì)區(qū)塊鏈交易信息全網(wǎng)廣播、私鑰丟失、“偽匿名”等可能導(dǎo)致的個(gè)人隱私泄漏問(wèn)題開展研究,逐步完善區(qū)塊鏈隱私保護(hù)功能[8]。故將該主題定義為“隱私保護(hù)”研究。
第四類主題的核心特征詞為“供應(yīng)鏈”。供應(yīng)鏈?zhǔn)怯晒?yīng)商、制造商、分銷商、零售商及最終消費(fèi)者多主體共同構(gòu)成的復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu),需要處理物流、信息流、資金流等多類型核心數(shù)據(jù)。該主題針對(duì)區(qū)塊鏈與供應(yīng)鏈融合應(yīng)用模式,基于區(qū)塊鏈的供應(yīng)鏈生態(tài)圈搭建、物流信息共享等核心問(wèn)題展開研究[9]。故將該主題定義為“區(qū)塊鏈+供應(yīng)鏈”研究。
第五類主題的核心特征詞為“電子文件”。電子文件范圍廣泛,電子檔案、數(shù)字音樂(lè)、數(shù)字出版物等知識(shí)產(chǎn)權(quán)載體都可以納入電子文件的范疇;其他高增益特征詞包括檔案管理、版權(quán)保護(hù)、真實(shí)性、電子檔案等。綜合來(lái)看,該類研究主要針對(duì)各類電子文件的真實(shí)性和版權(quán)保護(hù)展開研究,運(yùn)用區(qū)塊鏈的不可篡改性保護(hù)電子文件的真實(shí)性,解決可信任問(wèn)題;運(yùn)用區(qū)塊鏈的可追溯性解決侵權(quán)和版權(quán)保護(hù)問(wèn)題[10]。故將該主題定義為“區(qū)塊鏈+電子文件保護(hù)”研究。
第六類主題的核心特征詞為“信息安全”。結(jié)合其他高增益特征詞,不難發(fā)現(xiàn):該類主題主要運(yùn)用門限環(huán)簽名、屬性基加密和訪問(wèn)控制等手段實(shí)現(xiàn)數(shù)據(jù)保護(hù)和數(shù)據(jù)安全追溯,確保數(shù)據(jù)一致性,實(shí)現(xiàn)信息安全[11]。故將該主題定義為“區(qū)塊鏈+信息安全”研究。
第七類主題的核心特征詞為“金融創(chuàng)新”,其他高增益特征詞包括區(qū)塊鏈、智能合約、數(shù)字資產(chǎn)、去中心化、電子商務(wù)、電子證據(jù)等。綜合來(lái)看,該主題主要基于對(duì)區(qū)塊鏈技術(shù)特性的分析,研究基于區(qū)塊鏈的金融創(chuàng)新問(wèn)題,具體包括區(qū)塊鏈在金融領(lǐng)域應(yīng)用的可行性分析,區(qū)塊鏈金融模式、架構(gòu)創(chuàng)新,以及區(qū)塊鏈金融安全分析等[12]。故將該主題定義為“區(qū)塊鏈+金融創(chuàng)新”研究。
第八類主題的核心特征詞為“人工智能”。該主題主要針對(duì)區(qū)塊鏈和人工智能的融合應(yīng)用展開研究,認(rèn)為區(qū)塊鏈4.0可能是區(qū)塊鏈+人工智能的融合,兩者融合能夠相互賦能,人工智能有助于解決區(qū)塊鏈的效率問(wèn)題、安全問(wèn)題和優(yōu)化問(wèn)題;而區(qū)塊鏈有助于促進(jìn)人工智能所依賴的數(shù)據(jù)共享和智能設(shè)備的協(xié)作。區(qū)塊鏈與人工智能、云計(jì)算、互聯(lián)網(wǎng)+等新一代信息技術(shù)的融合發(fā)展最終將促進(jìn)數(shù)字經(jīng)濟(jì)的發(fā)展[13]。故將該主題定義為“區(qū)塊鏈+人工智能”研究。
第九類主題的核心特征詞為“跨境電商”。從其他高增益關(guān)鍵詞看,該主題的研究視角包括與跨境電商緊密相關(guān)的跨境物流、跨境支付、出口供應(yīng)鏈、國(guó)際貿(mào)易、結(jié)算風(fēng)險(xiǎn)等,旨在運(yùn)用區(qū)塊鏈技術(shù)破解跨境電商在上述方面存在的難題[14]。故將該主題定義為“區(qū)塊鏈+跨境電商”研究。
第十類主題的核心特征詞為“圖書館”。該主題主要研究區(qū)塊鏈在圖書館場(chǎng)景中的應(yīng)用,其他高增益特征詞包括:風(fēng)險(xiǎn)、關(guān)聯(lián)性、讀者個(gè)人信息、服務(wù)轉(zhuǎn)型、資源重構(gòu)等,結(jié)合其他高增益特征詞可知:當(dāng)前主要圍繞圖書館服務(wù)模式轉(zhuǎn)型、數(shù)字資源建設(shè)與共享和讀者個(gè)人信息保護(hù)等相關(guān)問(wèn)題展開研究[15]。故將該主題定義為“區(qū)塊鏈+圖書館”研究。
第十一類主題的核心特征詞為“互聯(lián)網(wǎng)金融”。互聯(lián)網(wǎng)金融是互聯(lián)網(wǎng)技術(shù)與金融業(yè)融合而形成的新興業(yè)態(tài),互聯(lián)網(wǎng)金融在發(fā)展過(guò)程中面臨著譬如征信管理、風(fēng)險(xiǎn)防控等亟待解決的問(wèn)題;而區(qū)塊鏈為這些問(wèn)題的解決帶來(lái)了契機(jī)。該主題圍繞區(qū)塊鏈與互聯(lián)網(wǎng)金融融合發(fā)展開展研究,研究視角主要包括:區(qū)塊鏈+互聯(lián)網(wǎng)金融應(yīng)用模式分析、互聯(lián)網(wǎng)金融征信管理、風(fēng)險(xiǎn)防控等[16]。故將該主題定義為“區(qū)塊鏈+互聯(lián)網(wǎng)金融”研究。
第十二類主題的核心特征詞為“去中心化”。去中心化是區(qū)塊鏈最典型的特征,它徹底顛覆了以往的中心化組織思想,有望構(gòu)造一種全新的社會(huì)關(guān)系結(jié)構(gòu)。區(qū)塊鏈去中心化的實(shí)現(xiàn)依賴于智能合約、信任機(jī)制和數(shù)據(jù)不可篡改等技術(shù)。該主題圍繞區(qū)塊鏈去中心化這一本質(zhì)特征開展技術(shù)原理與應(yīng)用創(chuàng)新研究[17]。故將該主題定義為“去中心化”研究。
第十三類主題的核心特征詞為“能源互聯(lián)網(wǎng)”。能源互聯(lián)網(wǎng)借助電網(wǎng)技術(shù)和新一代信息技術(shù)的融合,實(shí)現(xiàn)多主體共同參與的分布式能量采集、存儲(chǔ)和交易,是區(qū)塊鏈的典型應(yīng)用領(lǐng)域。該主題主要圍繞能源互聯(lián)網(wǎng)的多主體協(xié)同自治,用戶偏好匹配、需求響應(yīng),及交易效率提升等核心議題開展研究[18-19]。故將該主題定義為“區(qū)塊鏈+能源互聯(lián)網(wǎng)”研究。
第十四類主題中各特征詞信息增益差異不大,沒(méi)有明顯占優(yōu)的核心特征詞,但不難發(fā)現(xiàn)激勵(lì)機(jī)制、納稅遵從、稅收管理、稅收風(fēng)險(xiǎn)管理、稅收征管模型等關(guān)鍵詞都是稅收領(lǐng)域相關(guān)的研究?jī)?nèi)容??梢娫撝黝}主要圍繞稅收管理問(wèn)題,運(yùn)用區(qū)塊鏈技術(shù)加強(qiáng)稅收征管,降低稅收風(fēng)險(xiǎn),實(shí)現(xiàn)納稅遵從[20]。故將該主題定義為“區(qū)塊鏈+稅收政務(wù)”研究。
第十五類主題的核心特征詞為“比特幣”。比特幣是區(qū)塊鏈應(yīng)用最早也最為成熟的領(lǐng)域,當(dāng)前主要圍繞首次幣發(fā)行(ICO)融資方式、特點(diǎn)與監(jiān)管,比特幣擴(kuò)容及比特幣交易溯源等問(wèn)題開展研究[21-22]。故將該主題定義為“比特幣”研究。
第十六類主題的核心特征詞為“金融科技”。金融科技(FinTech)是以區(qū)塊鏈、大數(shù)據(jù)、人工智能等為代表的新一代信息技術(shù)在金融領(lǐng)域的應(yīng)用,金融科技的應(yīng)用促使了金融創(chuàng)新,但同時(shí)也衍生出諸多金融風(fēng)險(xiǎn),使得金融監(jiān)管面臨全新挑戰(zhàn)。該主題的其他高增益特征詞包括:監(jiān)管科技、金融監(jiān)管、監(jiān)管沙盒、法鏈、監(jiān)管沙箱等,不難發(fā)現(xiàn)該主題主要圍繞金融科技與監(jiān)管展開[23]。故將該主題定義為“金融科技與監(jiān)管”研究。
第十七類主題的核心特征詞為“身份認(rèn)證”。該主題針對(duì)傳統(tǒng)中心化環(huán)境中身份認(rèn)證方式暴露的安全問(wèn)題和弊端,探討基于區(qū)塊鏈的身份認(rèn)證方式、認(rèn)證效率優(yōu)化及匿名身份認(rèn)證監(jiān)管等問(wèn)題[24-26],并將其應(yīng)用于車聯(lián)網(wǎng)、電力系統(tǒng)及電子商務(wù)等場(chǎng)景下的身份認(rèn)證中。故將該主題定義為“區(qū)塊鏈+身份認(rèn)證”研究。
第十八類主題的核心特征詞為“聯(lián)盟鏈”。聯(lián)盟鏈?zhǔn)且环N介于公有鏈和私有鏈之間的區(qū)塊鏈形態(tài),其效率相較于公有鏈顯著提升,同時(shí)又避免了私有鏈僅適用于機(jī)構(gòu)內(nèi)部,數(shù)據(jù)可能被機(jī)構(gòu)修改的風(fēng)險(xiǎn)。聯(lián)盟鏈在確保數(shù)據(jù)安全和隱私保護(hù)的前提下,打破了信息孤島,能夠?qū)崿F(xiàn)有限主體內(nèi)數(shù)據(jù)可信共享。聯(lián)盟鏈在科學(xué)研究領(lǐng)域數(shù)據(jù)共享、數(shù)字圖書館信息資源共享、學(xué)習(xí)數(shù)據(jù)存儲(chǔ)等有限參與主體場(chǎng)景中應(yīng)用廣泛。故將該主題定義為“聯(lián)盟鏈”研究。
第十九類主題的核心特征詞為“供應(yīng)鏈金融”。供應(yīng)鏈金融是依托供應(yīng)鏈上的真實(shí)交易,以整體供應(yīng)鏈信用為依托,為供應(yīng)鏈融資企業(yè)提供靈活運(yùn)用金融產(chǎn)品和服務(wù)的一整套融資方案。區(qū)塊鏈為供應(yīng)鏈金融的創(chuàng)新實(shí)踐提供了可能。該主題圍繞基于區(qū)塊鏈的供應(yīng)鏈金融模式創(chuàng)新、融資服務(wù)平臺(tái)構(gòu)建等問(wèn)題開展研究[27-28]。故將該主題定義為“區(qū)塊鏈+供應(yīng)鏈金融”研究。
第二十類主題的核心特征詞為“數(shù)字貨幣”。區(qū)塊鏈促進(jìn)了以比特幣、天秤幣為代表的數(shù)字貨幣的發(fā)展,結(jié)合該主題的其他高增益特征詞可知,該主題主要圍繞數(shù)字貨幣的發(fā)展演化及數(shù)字貨幣的匿名性和可監(jiān)管等議題展開研究[29-30]。故將該主題定義為“區(qū)塊鏈+數(shù)字貨幣”研究。
第二十一類主題的核心特征詞為“共識(shí)機(jī)制”。共識(shí)機(jī)制是區(qū)塊鏈的核心支撐之一,決定了區(qū)塊鏈的性能效率、安全性和可拓展性。針對(duì)共識(shí)機(jī)制的研究主要集中在兩個(gè)方面:一是對(duì)現(xiàn)有共識(shí)機(jī)制和共識(shí)算法的綜述和應(yīng)用,二是對(duì)共識(shí)機(jī)制和共識(shí)算法的優(yōu)化、改進(jìn)和創(chuàng)新[31-32]。故將該主題定義為“共識(shí)機(jī)制”研究。
對(duì)區(qū)塊鏈21類研究主題按照性質(zhì)相似原則進(jìn)行歸納以構(gòu)建區(qū)塊鏈研究框架體系。其中,去中心化、智能合約、共識(shí)機(jī)制、聯(lián)盟鏈等主題都是圍繞區(qū)塊鏈自身理論和核心技術(shù)開展的研究,區(qū)塊鏈+大數(shù)據(jù)、區(qū)塊鏈+人工智能則是從融合賦能的角度研究大數(shù)據(jù)、人工智能與區(qū)塊鏈的融合發(fā)展,因此這六類主題可歸納為區(qū)塊鏈基礎(chǔ)研究。隱私保護(hù)、電子文件保護(hù)、信息安全和身份認(rèn)證這四類主題,是基于區(qū)塊鏈去中心化、去信任化、匿名性和可追溯等特性進(jìn)行的功能性研究,將這四類主題歸納為區(qū)塊鏈功能研究。金融創(chuàng)新、供應(yīng)鏈、跨境電商、互聯(lián)網(wǎng)金融、供應(yīng)鏈金融、能源互聯(lián)網(wǎng)、金融科技及其監(jiān)管、數(shù)字貨幣、比特幣、稅收政務(wù)和圖書館等11個(gè)研究主題是區(qū)塊鏈在不同場(chǎng)景下的應(yīng)用,稱之為區(qū)塊鏈應(yīng)用研究。
由此形成了區(qū)塊鏈“基礎(chǔ)層、功能層、應(yīng)用層”三層研究框架,基礎(chǔ)層研究是針對(duì)區(qū)塊鏈自身理論和技術(shù)問(wèn)題進(jìn)行的研究,是功能層拓展和應(yīng)用場(chǎng)景創(chuàng)新的基礎(chǔ);功能層研究聯(lián)結(jié)基礎(chǔ)性研究和應(yīng)用性研究,一方面結(jié)合區(qū)塊鏈基礎(chǔ)理論和技術(shù)創(chuàng)新,衍生挖掘更多的實(shí)用功能,另一方面,功能拓展又為應(yīng)用場(chǎng)景創(chuàng)新提供了支撐;應(yīng)用層研究是區(qū)塊鏈在各應(yīng)用場(chǎng)景的落地實(shí)踐,同時(shí)實(shí)踐中的需求痛點(diǎn)又會(huì)促進(jìn)區(qū)塊鏈基礎(chǔ)創(chuàng)新和功能拓展。
區(qū)塊鏈研究框架體系見圖2。
圖2 區(qū)塊鏈研究框架體系
區(qū)塊鏈研究框架中各層面及各主題2015—2020年文獻(xiàn)分布及各主題年均增長(zhǎng)率見表4。
表4 區(qū)塊鏈各層面及各主題文獻(xiàn)年度分布
為準(zhǔn)確把握各主題的研究熱度和未來(lái)趨勢(shì),參照波士頓矩陣思想,依據(jù)主題文獻(xiàn)量和文獻(xiàn)增長(zhǎng)率兩個(gè)維度構(gòu)造主題分布矩陣??紤]到2020年文獻(xiàn)不是全年的數(shù)據(jù),因此在計(jì)算各主題累計(jì)文獻(xiàn)量和文獻(xiàn)年均增長(zhǎng)率時(shí)采用的時(shí)間區(qū)間為2015—2019年。文獻(xiàn)量的臨界值設(shè)定為各主題均衡發(fā)展?fàn)顟B(tài)下的文獻(xiàn)量,即2015年至2019年文獻(xiàn)總量除以主題數(shù),計(jì)算可得文獻(xiàn)量臨界值為39.62;增長(zhǎng)率的臨界值設(shè)定為各主題文獻(xiàn)年均增長(zhǎng)率的均值,計(jì)算可得臨界值為1.37。依據(jù)文獻(xiàn)量和增長(zhǎng)率的閾值,將文獻(xiàn)量劃分為多和少兩個(gè)區(qū)域,增長(zhǎng)率劃分為高和低兩個(gè)區(qū)域,構(gòu)造區(qū)塊鏈研究四象限分布圖。
其中,第一象限為(高發(fā)文量,高增長(zhǎng)率)組合,該象限內(nèi)的主題發(fā)文量高,且增長(zhǎng)率也高,表明相關(guān)主題受到學(xué)者的廣泛、持續(xù)的關(guān)注,稱之為當(dāng)前熱點(diǎn)區(qū)。第二象限為(低發(fā)文量,高增長(zhǎng)率)組合,該象限內(nèi)的主題當(dāng)前累計(jì)發(fā)文量不高,但表現(xiàn)出高速增長(zhǎng)的態(tài)勢(shì),是未來(lái)研究的焦點(diǎn),稱之為未來(lái)趨勢(shì)區(qū)。第三象限為(低發(fā)文量,低增長(zhǎng)率)組合,處于該象限的主題研究成果較少,且沒(méi)有明顯的增長(zhǎng)態(tài)勢(shì),表明相關(guān)主題還沒(méi)有進(jìn)行深入研究,受關(guān)注度不高,稱之為初始探索期。第四象限為(高發(fā)文量,低增長(zhǎng)率)組合,處于該象限的主題前期累計(jì)研究成果很多,但增長(zhǎng)率較低,屬于成熟穩(wěn)定區(qū)。根據(jù)以上四象限劃分,結(jié)合各主題累計(jì)文獻(xiàn)量和文獻(xiàn)增長(zhǎng)率構(gòu)建區(qū)塊鏈主題分布矩陣見圖3。
圖3 區(qū)塊鏈主題分布矩陣
依據(jù)表4和圖3進(jìn)行區(qū)塊鏈熱點(diǎn)主題及未來(lái)趨勢(shì)分析如下:
從總體上看,區(qū)塊鏈研究可以劃分為兩個(gè)階段:第一個(gè)階段為2015—2016年,該階段區(qū)塊鏈相關(guān)文獻(xiàn)較少且增長(zhǎng)緩慢,處于初步發(fā)展期;第二個(gè)階段為2017—2020年,該階段區(qū)塊鏈研究迅速升溫,研究成果呈線性增長(zhǎng)態(tài)勢(shì)。
從三個(gè)層面上看,區(qū)塊鏈基礎(chǔ)研究和應(yīng)用研究均衡發(fā)展,文獻(xiàn)量均為394篇,表明當(dāng)前國(guó)內(nèi)學(xué)者既關(guān)注區(qū)塊鏈基礎(chǔ)理論和核心技術(shù)的突破,同時(shí)又不斷探索區(qū)塊鏈的應(yīng)用場(chǎng)景創(chuàng)新。而區(qū)塊鏈的功能層研究則相對(duì)薄弱,文獻(xiàn)量?jī)H為127篇,表明學(xué)者對(duì)區(qū)塊鏈可以解決哪些現(xiàn)實(shí)問(wèn)題、如何解決這些現(xiàn)實(shí)問(wèn)題關(guān)注較少;這將不利于區(qū)塊鏈在各應(yīng)用場(chǎng)景中的深度應(yīng)用,可能會(huì)導(dǎo)致應(yīng)用層研究的淺嘗輒止。這是后續(xù)研究需要關(guān)注的問(wèn)題。
從具體研究主題上看,第2類主題“智能合約”、第5類主題“電子文件保護(hù)”、第7類主題“金融創(chuàng)新”和第21類主題“共識(shí)機(jī)制”處于當(dāng)前熱點(diǎn)區(qū),是當(dāng)前區(qū)塊鏈領(lǐng)域的研究熱點(diǎn)。第6類主題“信息安全”、第8類主題“人工智能”、第16類主題“金融科技與監(jiān)管”、第17類主題“身份認(rèn)證”處于未來(lái)趨勢(shì)區(qū),這四類主題文獻(xiàn)增長(zhǎng)迅速,是未來(lái)研究的趨勢(shì)所在。第12類主題“去中心化”和第15類主題“比特幣”處于成熟穩(wěn)定區(qū),針對(duì)這兩類主題的研究已有較多的文獻(xiàn)成果,文獻(xiàn)增長(zhǎng)放緩,表明這兩類主題的研究在一定程度上相較于其他主題較為成熟。第1類主題“大數(shù)據(jù)”、第4類主題“供應(yīng)鏈”、第9類主題“跨境電商”、第10類主題“圖書館”、第11類主題“互聯(lián)網(wǎng)金融”、第13類主題“能源互聯(lián)網(wǎng)”、第14類主題“稅收政務(wù)”、第18類主題“聯(lián)盟鏈”、第19類主題“供應(yīng)鏈金融”及第20類主題“數(shù)字貨幣”處于初始探索期,這十一類主題累計(jì)發(fā)文量較少,且文獻(xiàn)增長(zhǎng)率較低,其原因可能是此前相關(guān)主題沒(méi)有引起研究者的重視,也可能是相關(guān)主題的研究遇到一些短時(shí)難以突破瓶頸,或者是相關(guān)主題并不是社會(huì)需求痛點(diǎn)所在;針對(duì)初始探索區(qū)的相關(guān)主題,要結(jié)合社會(huì)現(xiàn)實(shí)需求、當(dāng)前技術(shù)條件等綜合考慮,有些主題可能會(huì)演變到未來(lái)趨勢(shì)區(qū),成為未來(lái)研究的熱點(diǎn),而有些主題則可能由于不符合現(xiàn)實(shí)需求或囿于現(xiàn)實(shí)條件逐步停滯,淡出研究者視線。
區(qū)塊鏈作為一項(xiàng)顛覆式技術(shù)和創(chuàng)新型模式,未來(lái)有可能改變傳統(tǒng)社會(huì)和各行各業(yè)的運(yùn)行方式。中國(guó)在以蒸汽動(dòng)力、電氣為代表的科技革命中遠(yuǎn)遠(yuǎn)落后于西方國(guó)家,在以電子計(jì)算機(jī)、互聯(lián)網(wǎng)為代表的信息革命中通過(guò)改革開放趕上了時(shí)代的末班車,通過(guò)不斷追趕和自主創(chuàng)新,在信息通訊領(lǐng)域已躋身科技強(qiáng)國(guó)之列;而以區(qū)塊鏈為代表的新一代科技革命已然在世界范圍內(nèi)拉開帷幕,只有不斷加強(qiáng)區(qū)塊鏈基礎(chǔ)理論、核心技術(shù)和應(yīng)用模式創(chuàng)新,才能站在浪潮之巔,走在理論最前沿、占據(jù)創(chuàng)新制高點(diǎn)、取得產(chǎn)業(yè)新優(yōu)勢(shì)。
本文以CNKI核心期刊數(shù)據(jù)庫(kù)中區(qū)塊鏈相關(guān)主題的915篇文獻(xiàn)為研究對(duì)象,采用Jaccard系統(tǒng)聚類方法將當(dāng)前文獻(xiàn)進(jìn)行主題分類;運(yùn)用關(guān)鍵詞信息增益方法解讀各主題內(nèi)涵,最終歸納構(gòu)建了一套三層二十一類的區(qū)塊鏈研究框架體系。結(jié)合文獻(xiàn)時(shí)間序列分析,提出區(qū)塊鏈研究四象限矩陣,分析認(rèn)為當(dāng)前中國(guó)區(qū)塊鏈基礎(chǔ)理論、技術(shù)創(chuàng)新和應(yīng)用探索的研究協(xié)同發(fā)展,后續(xù)需要增強(qiáng)隱私保護(hù)、信息安全等區(qū)塊鏈功能拓展研究。從具體主題上看,“去中心化”“比特幣”主題的研究已相對(duì)成熟,熱度有所減退;“智能合約”“共識(shí)機(jī)制”“金融創(chuàng)新”等主題是當(dāng)前研究熱點(diǎn);“信息安全”“人工智能”“金融科技與監(jiān)管”“身份認(rèn)證”等主題或可成為未來(lái)研究趨勢(shì);“聯(lián)盟鏈”“數(shù)字貨幣”等十一類主題處于初始探索期,其后續(xù)的演化依賴于社會(huì)現(xiàn)實(shí)需求和技術(shù)支撐程度。