摘? 要:隨著電子信息化的普及,電子健康記錄管理過程涉及的個(gè)人隱私問題顯得格外突出。針對醫(yī)療領(lǐng)域存在的隱私保護(hù)問題和醫(yī)療信息記錄的存儲問題,分析了區(qū)塊鏈技術(shù)如何處理該問題的方法,對區(qū)塊鏈的結(jié)構(gòu)和內(nèi)部處理方式進(jìn)行了研究,并給出了基于區(qū)塊鏈的電子健康記錄隱私保護(hù)設(shè)計(jì)方案。該方案具有較強(qiáng)的可實(shí)施性,對個(gè)人電子病例的隱私信息具有保護(hù)作用。
關(guān)鍵詞:電子健康記錄;區(qū)塊鏈;隱私保護(hù);醫(yī)療信息
中圖分類號:TP311? 文獻(xiàn)標(biāo)識碼:A 文章編號:2096-4706(2021)17-0169-04
Abstract: With the popularization of electronic informatization, the personal privacy involved in the process of electronic health record management is particularly prominent. Aiming at the problems of privacy protection and storage of medical information records in the medical field, this paper analyzes the methods of how blockchain technology deals with this problem, studies the structure and internal processing methods of blockchain, and gives the design scheme of privacy protection of electronic health records based on blockchain. The scheme has strong enforceability and can protect the privacy information of personal electronic cases.
Keywords: electronic health record; blockchain; privacy protection; medical information
0? 引? 言
醫(yī)療云數(shù)據(jù)泄露事件層出不窮,引發(fā)了醫(yī)療云存儲的信任危機(jī),對醫(yī)療數(shù)據(jù)的保護(hù)造成了嚴(yán)重不利的影響。2018年5月22日《巴爾的摩太陽報(bào)(Baltimore Sun)》刊登的一則報(bào)道:美國醫(yī)療公司LifeBridge Health受到惡意軟件的攻擊,可能導(dǎo)致患者的私人信息暴露超過一年的時(shí)間。
區(qū)塊鏈技術(shù)由于具有去中心化永久記錄和便于審計(jì)等特點(diǎn),可用于滿足隱私數(shù)據(jù)的完整性、可限制性以及可審計(jì)性等數(shù)據(jù)安全需求,因此可以作為隱私保護(hù)問題的有效解決方案[1]。
沒有健全完善的醫(yī)療隱私保護(hù)相關(guān)法律制度規(guī)范;患者未參與到電子健康檔案[2]的訪問控制策略中,不能實(shí)現(xiàn)個(gè)性化隱私保護(hù);醫(yī)療健康數(shù)據(jù)去隱私化面臨廣泛多樣攻擊,無法對數(shù)字簽名電子健康檔案實(shí)現(xiàn)數(shù)據(jù)溯源;大數(shù)據(jù)知識挖掘存在預(yù)測和泄漏潛在隱私信息的風(fēng)險(xiǎn)。
云技術(shù)在電子醫(yī)療應(yīng)用方面的高速發(fā)展給用戶帶來了巨大的便利。為有效管理和利用海量的電子病歷數(shù)據(jù),醫(yī)療機(jī)構(gòu)將耗費(fèi)巨大的人力、物力以及財(cái)力。雖然云計(jì)算與云存儲的出現(xiàn)在一定程度上為醫(yī)療機(jī)構(gòu)帶來了很大便利,但其仍然面臨著海量的數(shù)據(jù)存儲、數(shù)據(jù)隱私安全以及數(shù)據(jù)共享問題,因此設(shè)計(jì)一種安全高效的數(shù)據(jù)檢索方案[3]一直是國內(nèi)外學(xué)者研究的熱點(diǎn)。
基于機(jī)器學(xué)習(xí)的數(shù)據(jù)挖掘和隱私發(fā)現(xiàn)等新型攻擊手段出現(xiàn),也使得傳統(tǒng)的防御、檢測等安全控制措施暴露出嚴(yán)重不足[4,5]。區(qū)塊鏈技術(shù)作為比特幣的底層技術(shù)在金融和其他商業(yè)領(lǐng)域應(yīng)用已日趨成熟,同時(shí)在醫(yī)療領(lǐng)域也具有較大的應(yīng)用潛力,有助于推動(dòng)醫(yī)療體系變革,醫(yī)療數(shù)據(jù)的安全共享和協(xié)作[6]。
信息記錄存儲的安全和隱私保護(hù)問題在醫(yī)療信息系統(tǒng)顯得格外突出,梅穎結(jié)合區(qū)塊鏈和云存儲技術(shù),提出了一個(gè)醫(yī)療記錄安全存儲方案即健康鏈[7]。
針對區(qū)塊鏈保護(hù)隱私數(shù)據(jù),祝等人[8]提出了分層保護(hù)區(qū)塊鏈中的隱私問題。在數(shù)據(jù)加密搜索上,PKES(Public Key Encryption with Keyword Search)[9-11]方案僅僅支持關(guān)鍵字密文的相等查詢。Park等人[12]提出了支持關(guān)鍵字邏輯與查詢的公鑰加密概念(Public Key Encryption with Conjunctive Keyword Search, PECK),并給出了相應(yīng)的構(gòu)造。Boneh和Waters[13]擴(kuò)展了PKES的概念,提出了可搜索公鑰加密(Searchable Public Key Encryption)以支持關(guān)鍵字的邏輯與、子集、范圍比較等查詢。作為后續(xù)工作,Hwang等人[14]和Zhang等人[15]提出了更為高效的PECK方案。所有上述的方案都無法支持關(guān)鍵字的邏輯或查詢。Katz等人[16]提出了內(nèi)積謂詞加密(Inner-Product Predicate Encryption, IPE)的概念,并注意到內(nèi)積謂詞加密可以用來構(gòu)造支持復(fù)雜邏輯表達(dá)的可搜索公鑰加密,也即支持任意可用單調(diào)布爾邏輯表達(dá)式(包含任意多個(gè)邏輯與和邏輯或)表示的查詢。但也很難解決在云計(jì)算環(huán)境下,可支持隱私保護(hù)、支持復(fù)雜邏輯表達(dá)的有效可搜索加密方案。
依托云服務(wù)器在電子醫(yī)療環(huán)境中對個(gè)人健康記錄的使用情況,提出一種基于屬性代理重加密技術(shù)與容錯(cuò)機(jī)制相結(jié)合的多關(guān)鍵字檢索方案[17]。針對個(gè)人隱私保護(hù)問題,Swan等人[18]在應(yīng)用領(lǐng)域方面,針對個(gè)人隱私問題的嚴(yán)重性,認(rèn)為個(gè)人健康隱私數(shù)據(jù)不受侵犯的機(jī)制可以通過區(qū)塊鏈技術(shù)來保護(hù),但是卻不能給出應(yīng)用場景實(shí)現(xiàn)細(xì)節(jié)來解決對于個(gè)人隱私保護(hù)問題。而利用區(qū)塊鏈技術(shù)文獻(xiàn)[19,20]實(shí)現(xiàn)了保護(hù)個(gè)人隱私數(shù)據(jù)。Liang等人[21]在移動(dòng)醫(yī)療應(yīng)用程序中集成區(qū)塊鏈技術(shù)實(shí)現(xiàn)了數(shù)據(jù)共享和協(xié)作。
為了解決區(qū)塊鏈效率問題,一種采用輕量級的醫(yī)療區(qū)塊鏈架構(gòu),如LEILA ISMAIL[22]等人提出了通過將網(wǎng)絡(luò)參與者劃分成集群并為每個(gè)成員維護(hù)一份分類賬本來建立共享網(wǎng)絡(luò)。
1? 區(qū)塊鏈相關(guān)結(jié)構(gòu)
1.1? 區(qū)塊鏈結(jié)構(gòu)
由于區(qū)塊鏈具有防止篡改的特性,因而通過區(qū)塊鏈來存取敏感數(shù)據(jù)如醫(yī)療數(shù)據(jù)等。在區(qū)塊鏈中,數(shù)據(jù)以區(qū)塊的方式永久存儲,具體結(jié)構(gòu)如圖1所示。
區(qū)塊鏈的時(shí)間戳解決了區(qū)塊的排序問題,新區(qū)塊生成時(shí)便記錄著上一個(gè)區(qū)塊通過哈希計(jì)算得到的哈希值,實(shí)現(xiàn)了區(qū)塊密碼學(xué)鏈接。所有的信息的創(chuàng)建過程都可以通過區(qū)塊來表達(dá)。區(qū)塊頭和區(qū)塊體組成了區(qū)塊,以比特幣為例,區(qū)塊頭部分記錄了版本號、前一個(gè)區(qū)塊的哈希值、默克爾樹的根值、時(shí)間戳、目標(biāo)特征值和隨機(jī)數(shù)值;所有發(fā)生在區(qū)塊創(chuàng)建過程中進(jìn)行的數(shù)據(jù)的交易信息并經(jīng)過信息驗(yàn)證構(gòu)成了區(qū)塊體部分。區(qū)塊主標(biāo)識符是它的加密哈希值,即一個(gè)通過SHA256算法對區(qū)塊進(jìn)行兩次哈希計(jì)算得到的數(shù)字指紋,產(chǎn)生的32字節(jié)哈希值被稱為“頭哈?!?。第二種識別區(qū)塊的方式是按照該區(qū)塊在區(qū)塊鏈中的位置,即“塊高度”,如第一個(gè)區(qū)塊,其塊高度為0。
1.2? 默克爾樹結(jié)構(gòu)
默克爾樹的計(jì)算過程如圖2所示,交易按次序逐對計(jì)算,不足部分則自己和自己計(jì)算,最終結(jié)果稱為默克爾樹根(Merkle root)。其中sha256d( )指的是兩次調(diào)用sha256( )函數(shù),即sha256(sha256())。Sha256會(huì)把任意長度的字符串變成32Byte(256bit)的哈希值。Block中第一個(gè)交易(TA)是挖礦獎(jiǎng)勵(lì),礦工給自己充值。
2? 基于區(qū)塊鏈的電子健康記錄隱私保護(hù)設(shè)計(jì)方案
電子健康記錄隱私保護(hù)方案,此方案基于區(qū)塊鏈技術(shù)來實(shí)現(xiàn),具體設(shè)計(jì)過程如圖3所示。方案的設(shè)計(jì)過程包括四大部分:電子病例源的形成、電子健康記錄的分類提取、電子健康記錄的存儲和區(qū)塊鏈存儲保護(hù)電子健康記錄。
2.1? 電子病例源的形成
病人通過自己的手機(jī)授權(quán)網(wǎng)絡(luò)設(shè)備,此時(shí)傳感器設(shè)備采用感知的方式獲取病人的用戶認(rèn)證信息或者直接授權(quán)電子設(shè)備識別獲取個(gè)人用戶認(rèn)證信息;另外病人經(jīng)過醫(yī)院各種包含CT、核磁共振、B超、化驗(yàn)等檢查結(jié)果記錄,醫(yī)生診療的病例,住院記錄等形成的醫(yī)療信息。這些信息構(gòu)成了醫(yī)療電子記錄的來源。
2.2? 電子健康記錄的分類提取
對各種途徑獲取的醫(yī)療電子記錄按照表征進(jìn)行分類,提取其臨床表現(xiàn)、病原起因、常見病的基本特性等各類特征,然后采用分類器進(jìn)行特征化并應(yīng)用數(shù)值處理得到特征值,建立被分類樣本。
2.3? 電子健康記錄的存儲
下載開源庫(http://archive.ics.uci.edu/ml/datasets.php? format =&task=&att=&area =&numAtt = &numIns =&type = &sort = nameUp&view = table 網(wǎng)站和http:/ /people.Dbmi.columbia.edu/ ~friedma/Projects/DiseaseSymptomKB/index.html網(wǎng)站中的公開醫(yī)療數(shù)據(jù)集)集合的各類病例作為源樣本集,提取出有效的敏感信息或參數(shù)值作為特征值,對被分類樣本應(yīng)用深度學(xué)習(xí)方式進(jìn)行分類,存儲在深度學(xué)習(xí)服務(wù)器中,針對個(gè)人健康電子記錄中敏感信息進(jìn)行特殊處理,并將其安全轉(zhuǎn)存到電子健康記錄服務(wù)器中。
2.4? 區(qū)塊鏈存儲保護(hù)電子健康記錄
對于存儲在電子健康記錄服務(wù)器中的病例,提取出時(shí)間戳、構(gòu)造梅克爾樹、獲取病人ID等信息,構(gòu)造成區(qū)塊。利用區(qū)塊鏈技術(shù)將區(qū)塊鏈接起來,對其去中心化處理,進(jìn)而保護(hù)個(gè)人隱私。對于醫(yī)院不能輕易公開電子病例記錄相關(guān)數(shù)據(jù)和分享其數(shù)據(jù)給其他醫(yī)院和個(gè)人。因此,不會(huì)泄露病人的用戶信息,從而實(shí)現(xiàn)了電子健康病例的隱私保護(hù)。
病人所攜帶信息如圖4所示,包括用戶認(rèn)證信息,健康狀態(tài),既往疾病,生活行為表征,年齡,前期診斷信息。其中用戶認(rèn)證信息為私有信息,包括用戶ID,姓名,照片、家庭住址、家屬等信息。分析醫(yī)療數(shù)據(jù)個(gè)人隱私存在的形式。雖然無用戶姓名、身份證號等具體敏感信息,但通常以用戶的特征以及相應(yīng)特征概率的格式存在。例如:Id (包括passportId,cookies,IMEI等),gender:概率,age:概率,各種愛好(如電影:概率,看書:概率,運(yùn)動(dòng):概率),住址(精確到小區(qū)):概率。
3? 結(jié)? 論
本文給出了區(qū)塊鏈的基本結(jié)構(gòu),分析了區(qū)塊鏈技術(shù)應(yīng)用于電子健康記錄隱私保護(hù)方面的可行性,并給出了具體的設(shè)計(jì)方案。
目前,由于區(qū)塊鏈處理速度較慢、各大醫(yī)院的設(shè)備條件限制并缺乏相關(guān)專業(yè)技術(shù)人員,此方面的應(yīng)用還有較大難度。因而,需要建立大型統(tǒng)一標(biāo)準(zhǔn)化的處理框架,提供給用戶可操作性強(qiáng)的友好界面,并加快處理速度提高體驗(yàn)感,才能真正應(yīng)用到醫(yī)療平臺上。
參考文獻(xiàn):
[1] 章寧,鐘珊.基于區(qū)塊鏈的個(gè)人隱私保護(hù)機(jī)制 [J].計(jì)算機(jī)應(yīng)用,2017,37(10):2787-2793.
[2] 黃永剛.基于區(qū)塊鏈技術(shù)的電子健康檔案安全建設(shè) [J].中華醫(yī)學(xué)圖書情報(bào)雜志,2016,25(10):38-40+46.
[3] 劉新宇,李浪,肖斌斌.基于屬性代理重加密技術(shù)與可容錯(cuò)機(jī)制相結(jié)合的數(shù)據(jù)檢索方案 [J].計(jì)算機(jī)科學(xué),2018,45(7):162-166+196.
[4] 劉新宇,翁健,張悅,等.基于APK簽名信息反饋的Android惡意應(yīng)用檢測 [J].通信學(xué)報(bào),2017,38(5):190-198.
[5] 全國信息安全標(biāo)準(zhǔn)化技術(shù)委員會(huì).大數(shù)據(jù)安全標(biāo)準(zhǔn)化白皮書 [R/OL].(2017-04-08)http://www.cac.gov.cn/wxb_pdf/5583944.pdf.
[6] 趙延紅,原寶華,梁軍.區(qū)塊鏈技術(shù)在醫(yī)療領(lǐng)域中的應(yīng)用探討 [J].中國醫(yī)學(xué)教育技術(shù),2018,32(1):1-7.
[7] 梅穎.安全存儲醫(yī)療記錄的區(qū)塊鏈方法研究 [J].江西師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2017,41(5):484-490.
[8] 祝烈煌,高峰,沈蒙,等.區(qū)塊鏈隱私保護(hù)研究綜述 [J].計(jì)算機(jī)研究與發(fā)展,2017,54(10):2170-2186.
[9] BELLARE M,BOLDYREVA A,NEILL A O. Deterministic and efficiently searchable encryption [C]//CRYPTO 2007:Advances in Cryptology-CRYPTO 2007.Santa Barbara:Springer,2007:535-552.
[10] CRESCENZO G D,SARASWAT V. Public key encryption with searchable keywords based on jacobi symbols [C]//INDOCRYPT 2007:Progress in Cryptology-INDOCRYPT 2007.Chennai:Springer,2007:282-296.
[11] KHADER D. Public key encryption with keyword search based on k-resilient ibe [C]//ICCSA 2007:Computational Science and Its Applications-ICCSA 2007.Malaysia:Springer,2007:1086-1095.
[12] PARK D J,KIM K,LEE P J. Public key encryption with conjunctive field keyword search [C]//WISA 2004:Information Security Applications.Jeju Island:Springer,2004:73-86.
[13] BONEH D,WATERS B. Conjunctive,subset,and range queries on encrypted data. TCC 2007:Theory of Cryptography.Amsterdam:Springer,2007:535-554.
[14] HWANG Y H,LEE P J. Public key encryption with conjunctive keyword search and itsextension to a multi-user system [C]//Pairing 2007:Pairing-Based Cryptography-Pairing 2007.Tokyo:Springer,2007:2-22.
[15] DING M Z,GAO F,JIN Z P,et al. An efficient Public Key Encryption with Conjunctive Keyword Search scheme based on pairings [C]//2012 3rd IEEE International Conference on Network Infrastructure and Digital Content.Beijing:IEEE,2012:526-530.
[16] KATZ J,SAHAI A,WATERS B. Predicate encryption supporting disjunctions,polynomial equations,and inner products [J].Journal of Cryptology,2013,26:191-224.
[17] AU M H,TSANG P P,SUSILO W,et al. Dynamic universal accumulators for DDH groups and their application to attribute-based anonymous credential systems [C]//CT-RSA 2009:Topics in Cryptology-CT-RSA 2009.San Francisco:Springer,2009:295-308.
[18] SWANM M. Block chain thinking:the brain aside centralize dautonomous corporation [commentary] [J].IEEET echnology&Society Magazine,2015,34(4):41-52.
[19] ZYSKIND G,NATHAN O,PENTLAND A S. Decentralizing Privacy:Using Blockchain to Protect Personal Data [C]//Proceedings of the 2015 IEEE Security and Privacy Workshops.Washington DC:IEEE Computer Society,2015:180-184.
[20] MASLUK A,GOFMAN M. Protecting Personal Data with Blockchain Technology [J].Information Technology-New Generations,2018,738:119-125.
[21] LIANG X P,ZHAO J,SHETTY S,et al. Integrating blockchain for data sharing and collaboration in mobile healthcare applications [C]//2017 IEEE 28th Annual International Symposium on Personal,Indoor,and Mobile Radio Communications(PIMRC).Montreal:IEEE,2017:1-5.
[22] ISMAIL L,MATERWALA H,ZEADALLY S. Lightweight Blockchain for Healthcare [J].IEEE Access,2019,7:149935-149951.
作者簡介:劉新宇(1990—),男,漢族,湖南衡東人,助教,碩士,主要研究方向:區(qū)塊鏈應(yīng)用與公鑰密碼學(xué)。