• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    科學(xué)數(shù)據(jù)“東數(shù)西算”組織機(jī)制與傳輸模式研究

    2023-11-08 05:46:38方肖胡正銀韓銳鄭亮
    關(guān)鍵詞:東數(shù)西算東數(shù)區(qū)塊

    方肖,胡正銀*,韓銳,鄭亮

    1.中國(guó)科學(xué)院成都文獻(xiàn)情報(bào)中心,四川 成都 610299

    2.中國(guó)科學(xué)院聲學(xué)研究所,北京 100190

    3.國(guó)家超級(jí)計(jì)算成都中心,四川 成都 610299

    引 言

    “東數(shù)西算”是國(guó)家重大發(fā)展戰(zhàn)略[1],科學(xué)數(shù)據(jù)作為“數(shù)據(jù)”的重要組成部分,已成為國(guó)家科技創(chuàng)新發(fā)展和經(jīng)濟(jì)社會(huì)發(fā)展的重要基礎(chǔ)性戰(zhàn)略資源,科學(xué)研究也已步入數(shù)據(jù)密集型的“第四范式”時(shí)代[2]?,F(xiàn)階段科學(xué)數(shù)據(jù)存儲(chǔ)主要集中于東部地區(qū)[3],而東部地區(qū)資源緊張不能滿足科學(xué)數(shù)據(jù)研究分析所需的海量算力、電力資源??茖W(xué)數(shù)據(jù)“東數(shù)西算”具備較大的經(jīng)濟(jì)價(jià)值和推動(dòng)西部地區(qū)產(chǎn)業(yè)發(fā)展的能力,因此有必要對(duì)該過(guò)程的組織機(jī)制和傳輸模式進(jìn)行研究,助力國(guó)家“東數(shù)西算”重大戰(zhàn)略。

    1 科學(xué)數(shù)據(jù)“東數(shù)西算”組織機(jī)制

    當(dāng)前,國(guó)家“東數(shù)西算”工程重點(diǎn)關(guān)注布局在政務(wù)、金融、交通、企業(yè)、醫(yī)療、教育等能夠快速轉(zhuǎn)化數(shù)字經(jīng)濟(jì)價(jià)值的領(lǐng)域[4]。科學(xué)數(shù)據(jù)“東數(shù)西算”在相關(guān)研究領(lǐng)域具有經(jīng)濟(jì)價(jià)值與迫切性,能夠?yàn)榭蒲袡C(jī)構(gòu)節(jié)省大量科研經(jīng)費(fèi),但科學(xué)數(shù)據(jù)偏向于基礎(chǔ)研究,直接轉(zhuǎn)化經(jīng)濟(jì)價(jià)值較低,拉動(dòng)地方GDP的效果遠(yuǎn)低于其他數(shù)字經(jīng)濟(jì)領(lǐng)域。因此,地方政府會(huì)根據(jù)科學(xué)項(xiàng)目的影響力給予較多的政策支持,但直接資源投入相對(duì)較少。從組織機(jī)制的角度對(duì)科學(xué)數(shù)據(jù)的處理大致可以分為以下3種模式。

    1.1 單機(jī)構(gòu)模式

    單機(jī)構(gòu)模式是指獨(dú)立的研究機(jī)構(gòu)依托國(guó)家財(cái)政支持或自籌經(jīng)費(fèi)等形式,開(kāi)展科學(xué)數(shù)據(jù)的生產(chǎn)、傳輸、處理。一些大型的基礎(chǔ)科學(xué)項(xiàng)目、大科學(xué)裝置例如500 m口徑球面射電望遠(yuǎn)鏡(FAST)[5]、錦屏地下實(shí)驗(yàn)室[6]等多采用該模式。

    單機(jī)構(gòu)模式的優(yōu)點(diǎn)在于研究機(jī)構(gòu)自建實(shí)驗(yàn)探測(cè)裝置用于科學(xué)數(shù)據(jù)的生成,自建私有數(shù)據(jù)存儲(chǔ)設(shè)施進(jìn)行科學(xué)數(shù)據(jù)的存儲(chǔ)和計(jì)算,科學(xué)數(shù)據(jù)自產(chǎn)、自存、自用,安全可控,效率高。但也存在一些問(wèn)題,例如:(1)自建數(shù)據(jù)存儲(chǔ)設(shè)施需要投入大量建設(shè)資源,消耗研究經(jīng)費(fèi);(2)科學(xué)數(shù)據(jù)每年持續(xù)增長(zhǎng),自建的數(shù)據(jù)存儲(chǔ)設(shè)施難以進(jìn)行配套升級(jí);(3)自建數(shù)據(jù)存儲(chǔ)設(shè)施選址需考慮政策、安全、地理等多方面因素,如離實(shí)驗(yàn)裝置所在地較遠(yuǎn)還需要投入數(shù)據(jù)傳輸資源;(4)需要配備專(zhuān)門(mén)的運(yùn)維團(tuán)隊(duì),相關(guān)專(zhuān)業(yè)人才需要的培養(yǎng)周期較長(zhǎng);(5)每年需要消耗相應(yīng)的運(yùn)維經(jīng)費(fèi),所依托的實(shí)驗(yàn)項(xiàng)目結(jié)題后,后續(xù)運(yùn)維經(jīng)費(fèi)來(lái)源存在問(wèn)題;(6)自建數(shù)據(jù)存儲(chǔ)設(shè)施所服務(wù)的實(shí)驗(yàn)項(xiàng)目結(jié)題后,相關(guān)計(jì)算、存儲(chǔ)資源難以轉(zhuǎn)化再利用。從科學(xué)數(shù)據(jù)自主安全可控的角度出發(fā),研究機(jī)構(gòu)大多傾向于單機(jī)構(gòu)模式,但該模式的局限性會(huì)制約大科學(xué)裝置、大型基礎(chǔ)科研項(xiàng)目的研究與發(fā)展。

    1.2 公共科學(xué)數(shù)據(jù)中心模式

    公共科學(xué)數(shù)據(jù)中心模式是指匯集大量計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)資源形成實(shí)體機(jī)構(gòu)為科研用戶提供一站式科學(xué)數(shù)據(jù)處理服務(wù),通過(guò)集中存儲(chǔ)計(jì)算、統(tǒng)一管理,高效利用軟硬件資源,避免資源閑置和數(shù)據(jù)孤島。目前,我國(guó)已建成了包括國(guó)家地震科學(xué)數(shù)據(jù)中心、國(guó)家人口健康科學(xué)數(shù)據(jù)中心等20個(gè)國(guó)家級(jí)科學(xué)數(shù)據(jù)中心[7],但這些數(shù)據(jù)中心多集中于我國(guó)東部。

    建立公共科學(xué)數(shù)據(jù)中心是科學(xué)數(shù)據(jù)共享、多學(xué)科融合發(fā)展的趨勢(shì)[8],但也存在一些問(wèn)題,例如:(1)資源投入巨大,如表1所示前期投入保守估計(jì)達(dá)數(shù)億級(jí)別;(2)目前科學(xué)數(shù)據(jù)中心主要依托科學(xué)數(shù)據(jù)提供機(jī)構(gòu)建立,研究機(jī)構(gòu)將科學(xué)數(shù)據(jù)存入公共數(shù)據(jù)中心的意愿不高;(3)缺乏盈利模式,難以維系每年海量的運(yùn)維費(fèi)用。

    表1 公共科學(xué)數(shù)據(jù)中心投入估算Table 1 Investment estimation for public scientific data centers

    鑒于公共科學(xué)數(shù)據(jù)中心模式存在的問(wèn)題,大多數(shù)地方政府對(duì)建立公共科學(xué)數(shù)據(jù)中心持慎重態(tài)度,希望充分整合利用現(xiàn)有資源,形成具體的科研服務(wù)示范之后再逐步推動(dòng)數(shù)據(jù)中心的實(shí)體建設(shè)。

    1.3 科研聯(lián)盟模式

    在科學(xué)數(shù)據(jù)“東數(shù)西算”過(guò)程中,可以通過(guò)眾多機(jī)構(gòu)利用各自現(xiàn)有的資源來(lái)完成科學(xué)數(shù)據(jù)的“東數(shù)西算”,各機(jī)構(gòu)之間形成類(lèi)似聯(lián)盟的組織。如表2所示,在這個(gè)過(guò)程中各機(jī)構(gòu)扮演的角色大體可以分為五類(lèi),并且各角色的訴求也各不相同。科學(xué)數(shù)據(jù)使用者對(duì)科學(xué)數(shù)據(jù)以及相關(guān)計(jì)算資源服務(wù)的需求是促進(jìn)科學(xué)數(shù)據(jù)在不同機(jī)構(gòu)間流通的重要因素,科學(xué)數(shù)據(jù)的所有者在同意使用者的需求申請(qǐng)后通過(guò)傳輸者將數(shù)據(jù)傳遞給科學(xué)數(shù)據(jù)的處理者,處理者將數(shù)據(jù)進(jìn)行計(jì)算之后將結(jié)果返回,存儲(chǔ)者在這一過(guò)程中提供協(xié)助。通過(guò)這一過(guò)程既利用了西部地區(qū)的資源優(yōu)勢(shì),相對(duì)低成本地完成了科學(xué)數(shù)據(jù)的計(jì)算需求,又為參與的各機(jī)構(gòu)帶來(lái)了經(jīng)濟(jì)收益盤(pán)活閑置資源,以較低的投入帶動(dòng)地方產(chǎn)業(yè)發(fā)展。

    表2 科學(xué)數(shù)據(jù)“東數(shù)西算”中各機(jī)構(gòu)扮演角色及訴求Table 2 The roles and demands played by various institutions under “East-West Computing Resource Transfer”

    科研聯(lián)盟模式充分整合利用現(xiàn)有資源、前期投入較少、形成示范之后更容易逐步推動(dòng)項(xiàng)目的升級(jí)和發(fā)展。相較而言,該模式在科學(xué)數(shù)據(jù)“東數(shù)西算”過(guò)程中最具經(jīng)濟(jì)性和可實(shí)施性,當(dāng)聯(lián)盟成員較少時(shí)機(jī)構(gòu)之間容易協(xié)調(diào),但隨著聯(lián)盟成員的不斷增多,需要研究構(gòu)建一種傳輸模型保證科學(xué)數(shù)據(jù)流通過(guò)程清晰明確、可記錄、可回溯,才能在界定各方的權(quán)責(zé)利益時(shí)有所依據(jù),保證科學(xué)數(shù)據(jù)的安全可信,形成科學(xué)數(shù)據(jù)“東數(shù)西算”的順暢鏈條。

    2 科研聯(lián)盟模式下的科學(xué)數(shù)據(jù)傳輸模型

    科研聯(lián)盟的模式可以有效整合利用現(xiàn)有資源,實(shí)現(xiàn)閑置資源的再利用,在不增加大量投入的情況下,完成科學(xué)數(shù)據(jù)的“東數(shù)西算”。但是這個(gè)過(guò)程涉及很多不同的組織機(jī)構(gòu),需要建立信任機(jī)制,使科學(xué)數(shù)據(jù)流動(dòng)的整個(gè)過(guò)程有跡可循,確??茖W(xué)數(shù)據(jù)安全和權(quán)責(zé)清晰。本文基于聯(lián)盟鏈的相關(guān)理論[9],結(jié)合科研聯(lián)盟模式下科學(xué)數(shù)據(jù)“東數(shù)西算”的具體應(yīng)用場(chǎng)景,構(gòu)建基于科研聯(lián)盟的科學(xué)數(shù)據(jù)傳輸模型,以期促進(jìn)科學(xué)數(shù)據(jù)安全流通與高效利用。

    2.1 聯(lián)盟鏈在科研聯(lián)盟場(chǎng)景下的適用性分析

    區(qū)塊鏈?zhǔn)且环N計(jì)算機(jī)技術(shù)的新型應(yīng)用模式,可以做到點(diǎn)對(duì)點(diǎn)傳輸、分布式數(shù)據(jù)存儲(chǔ)、共識(shí)機(jī)制、加密算法等。其本質(zhì)是基于互聯(lián)網(wǎng)的一種新型的信息傳輸方式,即可以實(shí)現(xiàn)多個(gè)信息化系統(tǒng)間的廣播式數(shù)據(jù)交互的技術(shù)。區(qū)塊鏈技術(shù)的主要優(yōu)勢(shì)是分布式和去中心化,信息的不可篡改,基于共識(shí)機(jī)制的信息傳輸和共享,從而實(shí)現(xiàn)在各類(lèi)型場(chǎng)景下均能確保信息安全的目的[10]。

    區(qū)塊鏈大體上可以分為3 類(lèi),公有鏈、私有鏈和聯(lián)盟鏈。公有鏈各個(gè)節(jié)點(diǎn)可以自由地加入和退出網(wǎng)絡(luò),并參加鏈上數(shù)據(jù)的讀寫(xiě),讀寫(xiě)時(shí)以扁平的拓?fù)浣Y(jié)構(gòu)互聯(lián)互通,網(wǎng)絡(luò)中不存在任何中心化的服務(wù)端節(jié)點(diǎn);聯(lián)盟鏈各個(gè)節(jié)點(diǎn)一般會(huì)有與之對(duì)應(yīng)的實(shí)體機(jī)構(gòu)組織,必須通過(guò)授權(quán)后才能加入或退出網(wǎng)絡(luò),各機(jī)構(gòu)組織組成利益相關(guān)的聯(lián)盟,共同維護(hù)區(qū)塊鏈的健康運(yùn)轉(zhuǎn);而私有鏈的各節(jié)點(diǎn)寫(xiě)入權(quán)限則收歸內(nèi)部控制,而讀取權(quán)限可根據(jù)實(shí)際需求選擇性地對(duì)外開(kāi)放[11]。對(duì)于科研聯(lián)盟這種由不同實(shí)體機(jī)構(gòu)組成,且科學(xué)數(shù)據(jù)規(guī)模有限的情況,采取聯(lián)盟鏈的方式進(jìn)行科學(xué)數(shù)據(jù)傳輸模型構(gòu)建是一種合適的選擇。

    聯(lián)盟鏈?zhǔn)且环N部分去中心化的、參與節(jié)點(diǎn)事先確定好的區(qū)塊鏈,其特點(diǎn)介于公有鏈和私有鏈之間,信息數(shù)據(jù)訪問(wèn)只在其內(nèi)部,交易確認(rèn)速度較快,其信息數(shù)據(jù)保有一定程度的隱私性[12]。當(dāng)前聯(lián)盟鏈已經(jīng)在金融領(lǐng)域、生命健康領(lǐng)域等多個(gè)領(lǐng)域有著廣泛的應(yīng)用,根據(jù)聯(lián)盟成員的權(quán)限和數(shù)據(jù)范圍對(duì)上鏈信息數(shù)據(jù)進(jìn)行監(jiān)管,保證權(quán)責(zé)清晰和數(shù)據(jù)安全。當(dāng)前比較流行的聯(lián)盟鏈項(xiàng)目主要有:區(qū)塊鏈服務(wù)網(wǎng)絡(luò)BSN、企業(yè)以太坊聯(lián)盟(EEA)、超級(jí)賬本(Hyperledger)、中國(guó)分布式總賬基礎(chǔ)協(xié)議聯(lián)盟(ChinaLedger)、R3 區(qū)塊鏈聯(lián)盟等[13]。Yang等[14]構(gòu)建了聯(lián)盟鏈的Hyperledger Fabric 系統(tǒng),如圖1 所示,該系統(tǒng)的邏輯架構(gòu)主要分為成員管理、共識(shí)機(jī)制、智能合約三部分。

    圖1 聯(lián)盟鏈Hyperledger Fabric系統(tǒng)邏輯架構(gòu)Fig.1 Logical architecture of the Hyperledger Fabric system in the alliance chain

    成員管理可以對(duì)科研聯(lián)盟內(nèi)部成員的身份、權(quán)限進(jìn)行管理確認(rèn),分配相應(yīng)的登錄方式和屬性證書(shū)。共識(shí)機(jī)制在科研聯(lián)盟的應(yīng)用場(chǎng)景下可以采用BFT-DPoS 共識(shí)機(jī)制進(jìn)行輪流記賬[15],由聯(lián)盟的成員機(jī)構(gòu)節(jié)點(diǎn)周期性地投票選舉出受信任的數(shù)個(gè)超級(jí)節(jié)點(diǎn),由超級(jí)節(jié)點(diǎn)輪流或者隨機(jī)進(jìn)行記賬產(chǎn)生區(qū)塊。同時(shí),這些超級(jí)節(jié)點(diǎn)也將對(duì)產(chǎn)生的新區(qū)塊進(jìn)行投票,只有當(dāng)通過(guò)的票數(shù)超過(guò)閾值才會(huì)達(dá)成共識(shí)。智能合約是一種特殊類(lèi)型的程序,是情景對(duì)應(yīng)型的計(jì)算機(jī)程序或事務(wù)協(xié)議,能夠?qū)换?shù)據(jù)開(kāi)展接受、處理、存儲(chǔ)、發(fā)送等操作,實(shí)現(xiàn)科研聯(lián)盟內(nèi)部數(shù)據(jù)靈活的管理與控制。智能合約需要自動(dòng)化的數(shù)據(jù)、過(guò)程、系統(tǒng)的組合與相互協(xié)調(diào),將科研聯(lián)盟內(nèi)部的協(xié)議、合約代碼化嵌入計(jì)算機(jī)程序,具有自動(dòng)化執(zhí)行、去中心化、不可篡改性、無(wú)需信任和高效性等特征,能夠部署在數(shù)據(jù)區(qū)塊、交互環(huán)節(jié)、有形或無(wú)形資產(chǎn)中,實(shí)現(xiàn)基于軟件定義的可編程控制系統(tǒng)[16]。

    在科研聯(lián)盟的模式下,需要科學(xué)數(shù)據(jù)可以在不同機(jī)構(gòu)之間根據(jù)預(yù)先設(shè)置的規(guī)則快捷地進(jìn)行傳輸,數(shù)據(jù)的流通傳遞過(guò)程需要被記錄下來(lái),并且相關(guān)的記錄數(shù)據(jù)要保證真實(shí)性和完整性,從而為界定各機(jī)構(gòu)權(quán)責(zé)利益提供依據(jù)。同時(shí),科學(xué)數(shù)據(jù)的安全性至關(guān)重要,要保證數(shù)據(jù)提供者對(duì)數(shù)據(jù)的所有權(quán)以及數(shù)據(jù)不被隨意篡改和泄露。聯(lián)盟鏈技術(shù)將記錄科學(xué)數(shù)據(jù)流通過(guò)程的信息數(shù)據(jù)按照一定順序進(jìn)行存儲(chǔ)排列,可以清楚獲取信息數(shù)據(jù)的源頭以及科學(xué)數(shù)據(jù)的流通過(guò)程記錄。信息數(shù)據(jù)以哈希值的方式存儲(chǔ)于區(qū)塊鏈上,具有不可逆性,可以保證上鏈的信息數(shù)據(jù)無(wú)法被隨意篡改。通過(guò)該機(jī)制對(duì)數(shù)據(jù)流通的過(guò)程信息進(jìn)行記錄,使科研聯(lián)盟模式下的科學(xué)數(shù)據(jù)流動(dòng)具備溯源能力。聯(lián)盟鏈具有非對(duì)稱(chēng)性加密算法、多通道隔離賬本以及智能合約等技術(shù),可以保證存儲(chǔ)的信息數(shù)據(jù)不被篡改,科學(xué)數(shù)據(jù)傳輸是在聯(lián)盟成員之間,減少了數(shù)據(jù)泄露和惡意篡改風(fēng)險(xiǎn)。因此,聯(lián)盟鏈的相關(guān)技術(shù)特征十分切合科研聯(lián)盟模式下的數(shù)據(jù)傳輸需求[17]。

    2.2 基于聯(lián)盟鏈的數(shù)據(jù)傳輸模型構(gòu)建

    如圖2所示,HAN等[18]學(xué)者提出了一種基于聯(lián)盟鏈的數(shù)據(jù)共享安全保護(hù)模型。在該模型下不同的數(shù)據(jù)存儲(chǔ)于不同的數(shù)據(jù)庫(kù),并且集中存放于存儲(chǔ)層。區(qū)塊的創(chuàng)建和廣播在區(qū)塊鏈服務(wù)層完成,接口層為各種信息交換提供接口的連接層。智能合約層為用戶提供各種類(lèi)型的合約服務(wù),包括合約日志記錄、數(shù)據(jù)記錄等。應(yīng)用層為用戶成員提供各種服務(wù),實(shí)現(xiàn)用戶對(duì)數(shù)據(jù)的傳輸和共享。該模型為提高數(shù)據(jù)安全水平,進(jìn)行了層級(jí)功能細(xì)分,構(gòu)建出了通用數(shù)據(jù)傳輸模型的清晰整體架構(gòu),并著重解釋了區(qū)塊鏈的創(chuàng)建,利用多節(jié)點(diǎn)投票機(jī)制加強(qiáng)了區(qū)塊鏈的抗風(fēng)險(xiǎn)能力。

    在科研聯(lián)盟的應(yīng)用場(chǎng)景下,涉及科學(xué)數(shù)據(jù)的提供方式、按規(guī)則傳輸機(jī)制、數(shù)據(jù)獲取索引上鏈、科學(xué)數(shù)據(jù)本體另行存儲(chǔ)等特征,通用的科學(xué)數(shù)據(jù)共享模型并不完全適用。因此,本文結(jié)合通用科學(xué)數(shù)據(jù)共享模型與科研聯(lián)盟應(yīng)用場(chǎng)景下的具體特征,構(gòu)建了科研聯(lián)盟模式下基于聯(lián)盟鏈的科學(xué)數(shù)據(jù)傳輸模型,以便科學(xué)數(shù)據(jù)在聯(lián)盟內(nèi)部能快速流通并且保證數(shù)據(jù)流通過(guò)程有跡可循。

    如圖3所示,該模型主要分為4層,其中數(shù)據(jù)提供層描述了科研聯(lián)盟中科學(xué)數(shù)據(jù)的來(lái)源,多是大科學(xué)裝置、實(shí)驗(yàn)探測(cè)器等??茖W(xué)數(shù)據(jù)的原始數(shù)據(jù)量龐大,無(wú)法上鏈進(jìn)行存儲(chǔ),通常采用分布式本地存儲(chǔ)方式,同時(shí)將數(shù)據(jù)的獲取信息進(jìn)行上鏈存儲(chǔ)。數(shù)據(jù)處理者在聯(lián)盟鏈內(nèi)得到數(shù)據(jù)獲取信息之后還需要數(shù)據(jù)提供者提供外部權(quán)限,才能最終訪問(wèn)到科學(xué)數(shù)據(jù),通過(guò)多層監(jiān)控機(jī)制保證了數(shù)據(jù)的安全。該層補(bǔ)充了通用模型中對(duì)科學(xué)數(shù)據(jù)來(lái)源部分的不清晰,以此體現(xiàn)原始科學(xué)數(shù)據(jù)的合理性、完整性和真實(shí)性。

    圖3 科研聯(lián)盟模式下科學(xué)數(shù)據(jù)傳輸模型Fig.3 Scientific data transmission model under the mode of scientific research alliance

    存儲(chǔ)層通過(guò)云存儲(chǔ)等網(wǎng)絡(luò)存儲(chǔ)形式以及加密存儲(chǔ)等技術(shù),對(duì)科學(xué)數(shù)據(jù)獲取信息和聯(lián)盟鏈信息進(jìn)行存儲(chǔ)。聯(lián)盟鏈數(shù)據(jù)庫(kù)分為協(xié)議合約數(shù)據(jù)庫(kù)、科學(xué)數(shù)據(jù)獲取路徑數(shù)據(jù)庫(kù)、聯(lián)盟成員數(shù)據(jù)庫(kù)、鏈上數(shù)據(jù)庫(kù),對(duì)不同的數(shù)據(jù)進(jìn)行分類(lèi)存儲(chǔ)。其中的科學(xué)數(shù)據(jù)獲取路徑數(shù)據(jù)庫(kù)保存了數(shù)據(jù)的獲取信息,在通用模型的基礎(chǔ)上進(jìn)一步對(duì)獲取路徑進(jìn)行了設(shè)置,保證了數(shù)據(jù)的隱私性,為數(shù)據(jù)溯源和隱秘傳輸提供了支持。

    數(shù)據(jù)處理層基于聯(lián)盟鏈理論構(gòu)建,主要包括成員管理、共識(shí)機(jī)制、智能合約3部分,科研聯(lián)盟中的機(jī)構(gòu)成員通過(guò)聯(lián)盟授權(quán)認(rèn)證之后才能擁有區(qū)塊鏈網(wǎng)絡(luò)中信息的訪問(wèn)權(quán)限,可以憑借聯(lián)盟成員的身份對(duì)聯(lián)盟鏈的數(shù)據(jù)進(jìn)行新增、使用、更新、維護(hù)。共識(shí)機(jī)制采用BFT-DPoS共識(shí)機(jī)制進(jìn)行輪流記賬,周期性地投票選舉超級(jí)節(jié)點(diǎn),由超級(jí)節(jié)點(diǎn)輪流或者隨機(jī)進(jìn)行記賬產(chǎn)生區(qū)塊??蒲新?lián)盟內(nèi)部機(jī)構(gòu)之間的協(xié)議合約,通過(guò)程序化形成智能合約。智能合約是具體的計(jì)算程序,在數(shù)據(jù)流通過(guò)程中只有滿足合約條件才會(huì)執(zhí)行其中的代碼,實(shí)現(xiàn)數(shù)據(jù)的流通、交互、獲取等請(qǐng)求。

    應(yīng)用層則是為聯(lián)盟成員機(jī)構(gòu)提供管理科學(xué)數(shù)據(jù)的相關(guān)功能,包括了科學(xué)數(shù)據(jù)確權(quán)、科學(xué)數(shù)據(jù)溯源、科學(xué)數(shù)據(jù)獲取、科學(xué)數(shù)據(jù)安全幾個(gè)方面。機(jī)構(gòu)成員可以通過(guò)以上功能對(duì)數(shù)據(jù)進(jìn)行獲取和處理,整個(gè)過(guò)程都會(huì)被記錄下來(lái),避免了數(shù)據(jù)被惡意篡改和濫用的風(fēng)險(xiǎn),使數(shù)據(jù)的安全得到保證。

    2.3 基于科研聯(lián)盟模式的數(shù)據(jù)傳輸模型討論

    成立科研聯(lián)盟是希望整合各機(jī)構(gòu)分散的資源,共同實(shí)現(xiàn)科學(xué)數(shù)據(jù)的“東數(shù)西算”。當(dāng)參與協(xié)作的機(jī)構(gòu)較少時(shí),可以通過(guò)互簽協(xié)議等方式明確權(quán)責(zé)利益。但當(dāng)參與機(jī)構(gòu)數(shù)量眾多時(shí)容易產(chǎn)生混亂,需要使科學(xué)數(shù)據(jù)的流動(dòng)有跡可循,以避免不必要的糾紛。為描述科學(xué)數(shù)據(jù)“東數(shù)西算”過(guò)程中原始科學(xué)數(shù)據(jù)的來(lái)源、存儲(chǔ)方式以及記錄科學(xué)數(shù)據(jù)在不同機(jī)構(gòu)間流動(dòng)的信息,構(gòu)建了基于聯(lián)盟鏈技術(shù)的科學(xué)數(shù)據(jù)傳輸模型。在這一模型中,科學(xué)數(shù)據(jù)的提供者、使用者、傳輸者、處理者均需要進(jìn)行注冊(cè)登記,基于智能合約進(jìn)行必要的身份驗(yàn)證。每位機(jī)構(gòu)成員都會(huì)獲得注冊(cè)證書(shū)和公私密鑰,用于驗(yàn)證其在聯(lián)盟鏈中的身份和訪問(wèn)權(quán)限。數(shù)據(jù)的提供者還會(huì)額外獲取數(shù)據(jù)所有權(quán)密鑰,用于數(shù)據(jù)確權(quán)。通過(guò)嚴(yán)格的成員身份認(rèn)證,加強(qiáng)數(shù)據(jù)流通過(guò)程的安全性。

    由于科學(xué)數(shù)據(jù)體量龐大,難以進(jìn)行上鏈存儲(chǔ),數(shù)據(jù)的提供者只需基于智能合約的標(biāo)準(zhǔn)將數(shù)據(jù)的獲取信息上傳至聯(lián)盟鏈中進(jìn)行存儲(chǔ)。數(shù)據(jù)的使用者、傳輸者、處理者在與提供者協(xié)商一致后,可以通過(guò)聯(lián)盟鏈進(jìn)行數(shù)據(jù)訪問(wèn)請(qǐng)求,該請(qǐng)求會(huì)被據(jù)實(shí)記錄至聯(lián)盟鏈中并啟動(dòng)廣播。在數(shù)據(jù)請(qǐng)求廣播之后,會(huì)對(duì)聯(lián)盟鏈中的數(shù)據(jù)信息進(jìn)行檢索,找到相應(yīng)的科學(xué)數(shù)據(jù)獲取信息,并在廣播之后將該信息發(fā)送給對(duì)應(yīng)的數(shù)據(jù)申請(qǐng)者。整個(gè)過(guò)程都將被聯(lián)盟鏈記錄且不可篡改,這就使數(shù)據(jù)在各機(jī)構(gòu)之間流通的過(guò)程清晰明確,為各機(jī)構(gòu)間的權(quán)責(zé)界定提供了依據(jù)。

    數(shù)據(jù)申請(qǐng)者在訪問(wèn)科學(xué)數(shù)據(jù)時(shí)還需要科學(xué)數(shù)據(jù)提供者外部審核批準(zhǔn)才能獲取到數(shù)據(jù),并且科學(xué)數(shù)據(jù)僅是經(jīng)傳輸者提供的網(wǎng)絡(luò)路徑傳輸至處理者進(jìn)行處理,處理結(jié)果再返回?cái)?shù)據(jù)申請(qǐng)者。這一過(guò)程中,數(shù)據(jù)是以流的形式進(jìn)行流通、處理、返回,杜絕了大量實(shí)體數(shù)據(jù)拷貝外泄,進(jìn)一步加強(qiáng)了數(shù)據(jù)的安全性。

    基于科研聯(lián)盟模式的科學(xué)數(shù)據(jù)傳輸模型主要描述了科學(xué)數(shù)據(jù)的來(lái)源、存儲(chǔ)以及如何記錄數(shù)據(jù)流通信息。通過(guò)聯(lián)盟鏈的相關(guān)技術(shù)對(duì)聯(lián)盟內(nèi)機(jī)構(gòu)進(jìn)行成員管理,記錄不同機(jī)構(gòu)之間數(shù)據(jù)申請(qǐng)、傳輸、使用的相關(guān)信息,以確保數(shù)據(jù)流通有跡可循,避免機(jī)構(gòu)眾多時(shí)產(chǎn)生糾紛??茖W(xué)數(shù)據(jù)的實(shí)體傳輸在機(jī)構(gòu)間達(dá)成一致且被聯(lián)盟鏈記錄流通信息后,由數(shù)據(jù)傳輸者通過(guò)實(shí)體網(wǎng)絡(luò)及相關(guān)傳輸技術(shù)完成。

    3 科研聯(lián)盟模式下的示范案例

    基于理論研究,聯(lián)合中國(guó)科技云成渝樞紐、中國(guó)科學(xué)院聲學(xué)研究所、上??萍即髮W(xué)、國(guó)家超級(jí)計(jì)算成都中心,合作開(kāi)展科學(xué)數(shù)據(jù)“東數(shù)西算”示范驗(yàn)證。并通過(guò)簽署“合作協(xié)議”、利用聯(lián)盟鏈記錄等方式,確保協(xié)作過(guò)程權(quán)責(zé)利益清晰,數(shù)據(jù)流通有跡可循。

    中國(guó)科技云成渝樞紐作為中國(guó)科技云[19]“十四五”規(guī)劃“四大樞紐”之一,是一項(xiàng)立足中國(guó)科學(xué)院,面向成都科學(xué)城,輻射成渝雙城經(jīng)濟(jì)圈重要科研機(jī)構(gòu)與大科學(xué)裝置的戰(zhàn)略性、基礎(chǔ)性新型國(guó)家級(jí)科研信息化基礎(chǔ)設(shè)施樞紐節(jié)點(diǎn)。在示范驗(yàn)證中作為數(shù)據(jù)傳輸者為科學(xué)數(shù)據(jù)傳輸提供節(jié)點(diǎn)中轉(zhuǎn)和網(wǎng)絡(luò)環(huán)境支持。

    SEANet[20]網(wǎng)絡(luò)技術(shù)是中國(guó)科學(xué)院聲學(xué)研究所主導(dǎo)研發(fā)的一種新型網(wǎng)絡(luò)傳輸協(xié)議用來(lái)替代傳統(tǒng)TCP/IP協(xié)議。它通過(guò)“一包一路由”的數(shù)據(jù)傳輸方式,使外部竊取監(jiān)聽(tīng)數(shù)據(jù)流更加困難,最多只能截取到數(shù)據(jù)包片段,難以獲取完整的數(shù)據(jù)信息,提高了數(shù)據(jù)傳輸?shù)陌踩浴M瑫r(shí)基于“一包一路由”,在數(shù)據(jù)傳輸過(guò)程中可以選擇最通暢的網(wǎng)絡(luò)路徑以及多網(wǎng)絡(luò)路徑傳輸,實(shí)現(xiàn)數(shù)據(jù)傳輸加速。在示范驗(yàn)證中聲學(xué)所作為數(shù)據(jù)傳輸者為科學(xué)數(shù)據(jù)傳輸提供網(wǎng)絡(luò)環(huán)境和安全傳輸技術(shù)加持。

    上??萍即髮W(xué)硬X射線自由電子激光裝置[21]作為科學(xué)數(shù)據(jù)提供者,在示范驗(yàn)證中提供大量相干衍射成像數(shù)據(jù)。國(guó)家超級(jí)計(jì)算成都中心,是西部地區(qū)首個(gè)國(guó)家超算中心,算力峰值性能300PFlops,具備豐富算力資源和西部地區(qū)能耗優(yōu)勢(shì),在示范驗(yàn)證中作為科學(xué)數(shù)據(jù)處理者。

    如圖4所示,上海的科學(xué)數(shù)據(jù)通過(guò)網(wǎng)絡(luò)經(jīng)中國(guó)科技云成渝樞紐傳輸?shù)絿?guó)家超算成都中心進(jìn)行運(yùn)算。針對(duì)上??萍即髮W(xué)到國(guó)家超級(jí)計(jì)算成都中心的遠(yuǎn)距離、高通量數(shù)據(jù)傳輸需求,充分利用中國(guó)科技云成渝樞紐節(jié)點(diǎn)的功能,發(fā)揮SEANet 網(wǎng)絡(luò)技術(shù)智能多路徑傳輸優(yōu)勢(shì),通過(guò)動(dòng)態(tài)多路徑優(yōu)化保證數(shù)據(jù)傳輸始終處于最優(yōu)網(wǎng)絡(luò)路徑,使硬X射線自由電子激光裝置相干衍射成像數(shù)據(jù)日均TB級(jí)海量圖像數(shù)據(jù)在廣域網(wǎng)上穩(wěn)定高效傳輸。如圖5 所示,基于SEANet 技術(shù)的傳輸網(wǎng)絡(luò)與傳統(tǒng)網(wǎng)絡(luò)進(jìn)行了性能測(cè)試對(duì)比,在相同出入口帶寬情況下,在UDP 協(xié)議512B 數(shù)據(jù)包模式下,傳統(tǒng)網(wǎng)絡(luò)速率僅為90Mbps,而采用SEANet獨(dú)有的多路徑傳輸后2 條路徑可達(dá)到250Mbps的傳輸速率,采用4 路徑可達(dá)到600Mbps 的速率;在UDP 協(xié)議1,250B 數(shù)據(jù)包模式下傳統(tǒng)網(wǎng)絡(luò)速率僅為100Mbps,而采用多路徑傳輸后2 條路徑可達(dá)到300Mbps的傳輸速率,采用4路徑可達(dá)到900Mbps的速率。由此可見(jiàn)基于SEANet的傳輸網(wǎng)絡(luò)傳輸性能優(yōu)于傳統(tǒng)網(wǎng)絡(luò)。

    圖5 基于SEANet技術(shù)的傳輸速率比較Fig.5 Comparison of transmission rates based on SEANet

    整個(gè)數(shù)據(jù)傳輸過(guò)程,充分整合利用現(xiàn)有的網(wǎng)絡(luò)、計(jì)算、存儲(chǔ)資源,在相對(duì)較少的投入下完成科學(xué)數(shù)據(jù)“東數(shù)西算”示范驗(yàn)證,為后續(xù)大規(guī)??茖W(xué)數(shù)據(jù)“東數(shù)西算”,充分利用西部地區(qū)資源優(yōu)勢(shì),帶動(dòng)西部地區(qū)產(chǎn)業(yè)發(fā)展做出了預(yù)研與示范。

    4 結(jié)論與展望

    科學(xué)數(shù)據(jù)“東數(shù)西算”具備經(jīng)濟(jì)價(jià)值和推動(dòng)西部地區(qū)產(chǎn)業(yè)發(fā)展的能力,通過(guò)眾多機(jī)構(gòu)整合利用現(xiàn)有資源共同完成科學(xué)數(shù)據(jù)“東數(shù)西算”的科研聯(lián)盟模式最具經(jīng)濟(jì)性和可行性?;诼?lián)盟鏈理論構(gòu)建的科學(xué)數(shù)據(jù)傳輸模型使得科學(xué)數(shù)據(jù)在各機(jī)構(gòu)間的流通過(guò)程清晰明確、可回溯、不可篡改,為機(jī)構(gòu)間權(quán)責(zé)利益的明確提供了可靠的依據(jù),能夠提高不同機(jī)構(gòu)參與科學(xué)數(shù)據(jù)流動(dòng)的積極性。建立科學(xué)的組織機(jī)制與傳輸模式能夠減少科學(xué)數(shù)據(jù)“東數(shù)西算”過(guò)程中的資源投入,提高數(shù)據(jù)傳輸效率,促進(jìn)科學(xué)數(shù)據(jù)安全流通與高效利用。

    當(dāng)前理論模型的研究還不夠深入,科學(xué)數(shù)據(jù)“東數(shù)西算”示范驗(yàn)證也僅僅是在少數(shù)機(jī)構(gòu)間完成,未來(lái)需要進(jìn)一步優(yōu)化理論模型,聯(lián)合更多機(jī)構(gòu)進(jìn)行大規(guī)模科學(xué)數(shù)據(jù)“東數(shù)西算”,充分利用西部地區(qū)資源優(yōu)勢(shì),帶動(dòng)西部地區(qū)產(chǎn)業(yè)發(fā)展。

    利益沖突聲明

    所有作者聲明不存在利益沖突關(guān)系。

    猜你喜歡
    東數(shù)西算東數(shù)區(qū)塊
    東數(shù)西算
    “東數(shù)西算”能為我們算出怎樣的未來(lái)
    “東數(shù)西算”,億萬(wàn)藍(lán)海
    華東科技(2022年3期)2022-04-15 01:46:40
    “東數(shù)西算”全面啟動(dòng)
    “東數(shù)西算”優(yōu)化全國(guó)數(shù)據(jù)中心布局
    河南科技(2021年16期)2021-11-28 10:55:23
    國(guó)家“東數(shù)西算”工程戰(zhàn)略支點(diǎn)確定 我國(guó)加快構(gòu)建新型算力網(wǎng)絡(luò)體系
    決策探索(2021年13期)2021-07-23 04:23:18
    “東數(shù)西算”重要性類(lèi)似于南水北調(diào)
    “東數(shù)西算”:努力構(gòu)建數(shù)字時(shí)代“經(jīng)濟(jì)新版圖”
    區(qū)塊鏈:一個(gè)改變未來(lái)的幽靈
    科學(xué)(2020年5期)2020-11-26 08:19:12
    區(qū)塊鏈:主要角色和衍生應(yīng)用
    科學(xué)(2020年6期)2020-02-06 08:59:56
    莲花县| 寿宁县| 屏山县| 仁怀市| 靖远县| 嘉义县| 府谷县| 绥芬河市| 无棣县| 沐川县| 青冈县| 胶州市| 淮安市| 伊金霍洛旗| 民和| 闸北区| 华容县| 民丰县| 天水市| 内黄县| 云浮市| 罗甸县| 花垣县| 隆化县| 南木林县| 民乐县| 平顶山市| 邵阳县| 荣昌县| 石狮市| 盐城市| 寻乌县| 隆子县| 万年县| 南通市| 宁陕县| 马山县| 兴业县| 江阴市| 平果县| 宿迁市|