魏 晉,降 惠,武麗娟
(長治醫(yī)學院計算機教學部,山西 長治 046000)
利用計算機技術、大數據技術對醫(yī)療數據進行挖掘與分析,發(fā)現(xiàn)醫(yī)療數據之間的潛在聯(lián)系及規(guī)律,是臨床診斷、精準醫(yī)療、疾病防控決策等領域進行科學研究的重要前提[1]。在這樣的背景下,人們對于醫(yī)療隱私數據的共享就提出了更高的要求。
當前,醫(yī)療數據大多處于“云”模式架構,數據在存儲、傳輸與科學計算等過程中存在被篡改、截取和泄露等較大風險,而且醫(yī)療數據具有較強的隱私性,在“云”模式架構下,要實現(xiàn)數據共享,就必須研究滿足其需求的具體方案。近年來研究者已提出多種方案,其中以區(qū)塊鏈技術為核心的數據共享方案較多[2-6],還有利用數據加密技術、用戶訪問控制等技術提出的共享方案[7-10]。在這些方案中,利用量子技術構建數據共享模型,實現(xiàn)醫(yī)療隱私數據共享的相關研究文獻非常少。因此,本文提出一個以通用盲量子計算協(xié)議為核心、實現(xiàn)對醫(yī)療隱私數據進行科學計算共享服務的模型方案,旨在為醫(yī)療隱私數據的共享提供一種新的解決思路。
對醫(yī)療數據進行整理、統(tǒng)計、挖掘與分析等科學計算,是在大數據技術背景下對醫(yī)療數據進行應用的一個重要內容[11]。當前,由于各個醫(yī)療機構的網絡資源有限,所以要完成大數據量的科學計算,就會上傳數據到第三方網絡計算服務器。而在數據傳輸、科學計算、算法執(zhí)行等多個環(huán)節(jié)都存在數據泄露與被篡改的風險。這成為制約醫(yī)療隱私數據共享的首要因素。
另外,為了避免在各個醫(yī)療機構之間傳輸數據的過程中出現(xiàn)安全問題,大多數的醫(yī)療機構采用了閉環(huán)管理模式。雖然隨著數據量的不斷增加,越來越多的醫(yī)療機構也采用了由第三方服務商提供對數據進行存儲、管理的模式。但是在這樣的管理模式下,數據更多的還是在第三方云存儲器與醫(yī)療機構內部二者之間閉環(huán)運行。無法保證在各個醫(yī)療機構、醫(yī)療區(qū)域之間實現(xiàn)數據安全共享,也是制約醫(yī)療隱私數據共享的一個重要原因。
盲量子計算(Blind Quantum Computation,簡稱BQC)是指用戶將用于計算的數據提交給量子計算服務器,在完成整個數據計算的過程中,量子計算服務器對用戶的數據輸入、數據計算方法以及計算結果等信息都無法獲取。通用盲量子計算協(xié)議在2009 年被提出[12],協(xié)議利用了量子糾纏、量子坍縮等量子特性,在計算過程中保證了數據在輸入、輸出與計算方法的保密性和安全性。盲量子計算的核心是:量子計算服務器通過量子比特糾纏構建磚墻態(tài),磚墻態(tài)結構如圖1所示,構建過程如下[12]:
圖1 盲量子計算磚墻態(tài)
(S1)將每行中的粒子對(i,j)和(i,j+1),執(zhí) 行GTRL-Z門操作。
(S2)如果j≡7(mod8),且i(mod2)≡0,則對(i,j)、(i+1,j)、(i,j+2)和(i+1,j+2),執(zhí)行GTRL-Z門操作。(S3)如 果j≡3(mod8),且i(mod2)?0,則 對(i,j)、(i+1,j)、(i,j+2)和(i+1,j+2),執(zhí)行GTRL-Z門操作。
磚墻態(tài)構建完成后,量子計算服務器通過測量磚墻態(tài)中量子比特的角度來完成計算任務,計算過程如下[13]:
(S4)Bob根據測量角度δx,y、測量基為在磚墻態(tài)中對量子比特進行測量,并將測量結果發(fā)回給Alice。如果rx,y=1,Alice將測量結果取反,否則保持原結果不變。
(S5)轉到(S3)開始下一次測量任務,當磚墻態(tài)中所有的量子比特都測量完成后,停止計算過程的循環(huán)。
我們提出的醫(yī)療隱私數據共享模型要解決兩個核心問題,一是要實現(xiàn)數據在進行科學計算過程中的保密性和安全性;二是要實現(xiàn)各個醫(yī)療機構、醫(yī)療區(qū)域之間的數據安全共享,使數據不再處于閉環(huán)模式。根據以上需求,我們提出的隱私數據共享模型分為數據檢索、數據傳輸與數據科學計算三個邏輯部分,模型結構如圖2所示。
圖2 醫(yī)療隱私數據共享模型結構
醫(yī)療數據存儲具有廣泛性和封閉性特點,通常保存在各個醫(yī)療機構中,或是第三方代理的云存儲中。如果每個請求進行數據共享的用戶,都向各個醫(yī)療機構或第三方云存儲服務器發(fā)出申請,并等待回應,這顯然是不現(xiàn)實的。為了解決這一問題,我們在提出的隱私數據共享模型方案中,引入了數據資源查詢服務器(Data Resource Query Server 簡稱DRQS)。DRQS不保存實際的醫(yī)療數據,只保存著來自于不同醫(yī)療機構中的各類型醫(yī)療數據的目錄索引信息,目錄索引信息包含了數據的來源、數量、體積與屬性等信息。為了保證目錄索引信息的即時性,DRQS 會定期根據各醫(yī)療機構發(fā)送的更新信息,來更新自己的目錄索引內容。數據檢索部分由請求進行數據共享的用戶、DRQS服務器和各個醫(yī)療機構組成。
當前我們的網絡還是以經典網絡為主,所以為了實現(xiàn)隱私數據共享模型的最大化經典,我們引入了可信任中心代理服務器(Trusted Central Proxy Server,簡稱TCPS)。通過引入TCPS 并應用少量的量子信道,在經典網絡的基礎上實現(xiàn)了模型中各模塊的數據傳輸任務。數據傳輸部分由各個醫(yī)療機構與TCPS之間的經典信道、TCPS 與盲量子服務器之間的量子信道、請求進行數據共享的用戶與TCPS 之間的經典信道共同組成。
數據科學計算部分由盲量子計算服務器與TCPS服務器組成,它是整個隱私數據共享模型的核心。對隱私數據進行科學計算是根據用戶提出的要求、以各個醫(yī)療機構發(fā)送的隱私數據為基礎、按照通用盲量子計算協(xié)議,由TCPS與盲量子計算服務器共同完成。
隱私數據共享模型的業(yè)務流程分為提出數據共享請求、數據資源檢索、數據傳輸、數據計算與數據結果查詢五個階段,業(yè)務流程如圖3 所示。我們通過從用戶提出醫(yī)療隱私數據共享請求、到最后用戶查詢計算結果的一次完整過程,來說明隱私數據共享模型的業(yè)務流程。
圖3 隱私共享模型業(yè)務流程
用戶首先需要在DRQS 中注冊身份,注冊完成后就可以根據自己的需求發(fā)出數據共享請求。DRQS 收到用戶的請求信息后,通過檢索數據目錄索引內容,確定對應數據資源的數量、來源與體積等信息。DRQS按照檢索結果向保存該數據信息的多個醫(yī)療機構發(fā)出指令,各個醫(yī)療機構在收到DRQS發(fā)出的指令后,開始在閉環(huán)網絡內按指令要求對醫(yī)療數據進行匯總、整理并做好傳輸數據的準備。
各個醫(yī)療機構將整理好的數據通過專用經典信道傳送到TCPS 服務器,TCPS 在確認收到信息后,賦予信息惟一的客戶服務編碼并發(fā)送給DRQS。在隱私數據計算階段,TCPS 首先將經典信息轉換為量子信息,而后,盲量子計算服務器開始構建磚墻態(tài),并與TCPS 共同執(zhí)行盲量子計算協(xié)議來完成計算任務。隱私數據計算完成后,在用戶登錄DRQS 獲取TCPS分配的客戶服務編碼后,就可以在TCPS 中查看計算結果。TCPS 會在用戶查看計算結果后,刪除所有的對應于該用戶的計算數據。
為了驗證數據共享模型的安全性,我們從提出數據共享請求與檢索、數據傳輸、數據計算與數據結果查詢四個方面進行安全性驗證,驗證內容如表1所示。
表1 隱私數據共享模型安全性驗證表
醫(yī)療隱私數據如何能安全的共享,以及將其應用于科學研究,一直受到研究者的關注。本文以通用盲量子計算協(xié)議算法為理論基礎,從提出共享隱私數據請求、數據資源查詢、隱私數據傳輸、對隱私數據進行科學計算,查看計算結果等流程入手,設計了一個具有醫(yī)療數據特點的隱私數據共享模型。該模型以經典網絡為基礎,在保證了資源投入最小、最大化經典的情況下,實現(xiàn)了對醫(yī)療隱私數據的共享。隨著研究的不斷深入,后期我們會不斷地改進醫(yī)療隱私數據共享模型方案,使得該方案更加科學與完善。