崔宇楊 ,許琳琳 ,陳雨琳 ,余澤華 ,李書艷
(1.徐州醫(yī)科大學(xué)醫(yī)學(xué)信息與工程學(xué)院,江蘇徐州 221000;2.徐州醫(yī)科大學(xué)醫(yī)學(xué)影像學(xué)院,江蘇徐州 221000)
醫(yī)療器械是一個具有多學(xué)科交叉、知識密集、資金集中等特點的高新技術(shù)產(chǎn)業(yè)。隨著遠程醫(yī)療、人工智能、云計算等新技術(shù)的應(yīng)用與發(fā)展,現(xiàn)階段醫(yī)療器械行業(yè)呈現(xiàn)出高度信息化、數(shù)字化和智能化的發(fā)展趨勢[1]。在新冠疫情影響、市場需求刺激和政策支持的大背景下,醫(yī)療器械在整個醫(yī)療行業(yè)中的重要地位越發(fā)凸顯,醫(yī)療器械市場正迎來巨大的發(fā)展機遇。但是,盡管我國醫(yī)療器械市場規(guī)模龐大,但在高端醫(yī)療器械領(lǐng)域中,國內(nèi)市場仍被大多數(shù)歐美企業(yè)所壟斷。
此外,統(tǒng)計顯示我國醫(yī)療器械行業(yè)中超過90%為中小型企業(yè),大都處于“小而散”的發(fā)展階段,對在醫(yī)療器械云端化過程中存在諸多技術(shù)及安全問題缺乏積累,導(dǎo)致市場競爭力有限,難以進入國際高端醫(yī)療器械市場,更不利于我國先進醫(yī)療技術(shù)的發(fā)展[2]。
因此通過對醫(yī)療器械快速云端部署的關(guān)鍵共性技術(shù)的研究及安全平臺的構(gòu)建,來為中小型企業(yè)實現(xiàn)醫(yī)療設(shè)備云端化提供解決方案和技術(shù)指導(dǎo)具有十分重要的現(xiàn)實意義。目前在醫(yī)療器械領(lǐng)域?qū)崿F(xiàn)快速云端信息化存在一些普遍的挑戰(zhàn)主要包括數(shù)據(jù)安全、數(shù)據(jù)傳輸、數(shù)據(jù)存儲和云端部署等方面。
在數(shù)據(jù)安全方面,醫(yī)療器械信息化過程面臨數(shù)據(jù)安全和隱私泄漏風(fēng)險。醫(yī)療器械云端信息化為醫(yī)療數(shù)據(jù)存儲、數(shù)據(jù)共享、遠程醫(yī)療提供了便利,但也加大了數(shù)據(jù)安全風(fēng)險,易出現(xiàn)數(shù)據(jù)訪問、數(shù)據(jù)隔離風(fēng)險,導(dǎo)致重要信息泄露或隱私信息被盜[3]。
在數(shù)據(jù)傳輸方面,云端通信傳輸過程中采用超密集型異構(gòu)模式的網(wǎng)絡(luò)架構(gòu),但這種通信模式對邊緣數(shù)據(jù)的傳輸存在部分延遲問題,面臨數(shù)據(jù)感知延時性問題。此外,云端平臺通常為多租戶框架,多方數(shù)據(jù)同時傳輸很容易構(gòu)成通信傳輸干擾或信道占用問題[4],甚至有可能造成數(shù)據(jù)傳輸錯誤,降低云端傳輸?shù)姆€(wěn)定性和可靠性。
在數(shù)據(jù)存儲方面,醫(yī)療數(shù)據(jù)云存儲存在數(shù)據(jù)兼容性差和效率低的問題。醫(yī)療器械涉及的數(shù)據(jù)類型繁雜多樣[5],云端需面對大吞吐場景。云端存儲必須提供高效的查詢方案和安全的存儲,以支持醫(yī)療診斷和數(shù)據(jù)分析需求。
在云端部署方面,醫(yī)療器械實現(xiàn)云端部署缺乏統(tǒng)一標準和安全管理平臺。醫(yī)療器械快速云端部署需要面對醫(yī)療器械與云端的集成、醫(yī)療器械的不同類型和生命周期,以及云端平臺的不同部署模式和架構(gòu)的問題[6]。
綜上所述,以上醫(yī)療器械實現(xiàn)云端化過程中存在的問題,密切相關(guān),互有聯(lián)系,是制約醫(yī)療器械實現(xiàn)快速云端化的關(guān)鍵問題。針對以上面臨的問題,本文以建立云端環(huán)境下數(shù)據(jù)安全和防護和隱私保護策略為基礎(chǔ)支撐,提出基于分布式云存儲和區(qū)塊鏈技術(shù)的多級云端存儲架構(gòu)作為平臺安全保障,同時創(chuàng)新性研究基于5G技術(shù)和差分隱私譜聚類算法的高效云端數(shù)據(jù)傳輸方案,最終融合以上多項關(guān)鍵技術(shù),構(gòu)建了一種適用于醫(yī)療器械實現(xiàn)快速云端化的安全技術(shù)平臺,助力實現(xiàn)醫(yī)療設(shè)備快速云端化和智能化。通過實驗對平臺性能測試,結(jié)果表明該平臺具有良好的數(shù)據(jù)安全性和可擴展性,能夠滿足醫(yī)療器械信息化的需求。
在總體架構(gòu)上,醫(yī)療器械快速云端部署安全平臺以云服務(wù)為基礎(chǔ),構(gòu)建基于BaaS 架構(gòu)的集管理服務(wù)、數(shù)據(jù)云存儲、安全共享和智能分析等功能為一體的安全云平臺模型,實現(xiàn)滿足數(shù)據(jù)安全云存儲服務(wù)、云端隱私保護和各類信息化的醫(yī)療器械快速接入服務(wù)等服務(wù)。首先,基于云計算技術(shù),結(jié)合多種云端化模塊,建立醫(yī)療器械管理服務(wù),實現(xiàn)包括設(shè)備管理、人員管理和系統(tǒng)管理等相關(guān)的服務(wù)功能,利用云計算提升整體醫(yī)療服務(wù)和管理水平。利用多個節(jié)點的虛擬服務(wù)器和分布式存儲模式,提供云端環(huán)境下海量圖像數(shù)據(jù)處理服務(wù)和海量存儲空間,以滿足醫(yī)療器械云端部署的數(shù)據(jù)存儲需求。采用混合云存儲架構(gòu),提供公有云和私有云兩種入口,公有云平臺存儲保密性要求不強的數(shù)據(jù)信息,私有云平臺存儲著重需要隱私保護的敏感信息。整體的平臺設(shè)計架構(gòu)具體如圖1所示。
圖1 基于BaaS架構(gòu)的醫(yī)療器械快速云端化安全平臺架構(gòu)圖
傳統(tǒng)的隱私保護方法往往存在數(shù)據(jù)失真或不完全保護的問題,隨著隱私保護日益?zhèn)涫荜P(guān)注,差分隱私[7]作為一種新興的隱私保護技術(shù)應(yīng)運而生。差分隱私技術(shù)的關(guān)鍵思想是在隱私與數(shù)據(jù)利用之間尋求平衡,通過對數(shù)據(jù)添加精確校準的噪聲,模糊具體信息,但盡可能保留整體數(shù)據(jù)在統(tǒng)計意義上的有效性和可用性。差分隱私數(shù)學(xué)定義如下:
定義1 差分隱私:假設(shè)存在一個函數(shù)A,使得A在給定的兩個近鄰數(shù)據(jù)集Q,Q′(即|||Q-Q′|1≤1)上得到的任一輸出集合B的概率滿足:
則稱該函數(shù)A滿足ε-differential privacy,簡寫為ε-DP。其中近鄰數(shù)據(jù)集(neighbordatasets)是指僅有1條記錄不同的兩個數(shù)據(jù)集,| || |1是指L1范式,Pr[]是指事件發(fā)生的概率。ε是隱私預(yù)算,其數(shù)值的大小代表隱私保護的程度。數(shù)值越小,隱私保護效果得越好。
可以通過對算法的輸入、目標函數(shù)、梯度或輸出添加符合特定機制的噪聲來實現(xiàn)差分隱私模型。噪聲的添加機制有適用于連續(xù)型數(shù)據(jù)普拉斯機制、適用于離散型數(shù)據(jù)的指數(shù)機制以及適用于圖像數(shù)據(jù)的高斯機制,而噪聲的大小和算法敏感度相關(guān)。
定義2 敏感度Δf:設(shè)有函數(shù)f:D→Rd,對于兩個近鄰數(shù)據(jù)集D,D’,敏感度為:
敏感度是計算待引入噪聲大小的重要參數(shù),它衡量了對數(shù)據(jù)集進行更改(例如剔除某條記錄)對結(jié)果造成的最大變化。
本研究根據(jù)醫(yī)療設(shè)備產(chǎn)生數(shù)據(jù)的類型和特點對數(shù)據(jù)進行分類管理,明確各類數(shù)據(jù)信息安全防護要求,完善信息安全管理機制,設(shè)置不同的敏感度等級并配備相應(yīng)的安全防護措施,提升此階段數(shù)據(jù)信息的抵抗能力。根據(jù)各類數(shù)據(jù)的特點,綜合采用數(shù)據(jù)加密技術(shù)和差分隱私保護機制對數(shù)據(jù)進行適當?shù)募用芎碗[私保護處理。
具體而言,擬使用安全管理機制、數(shù)據(jù)加密技術(shù)和差分隱私處理三個過程對醫(yī)療器械產(chǎn)生的數(shù)據(jù)進行全面的安全化處理。
過程一,制定完善的信息管理機制,加強數(shù)據(jù)訪問權(quán)限管理。在云端環(huán)境下,首先根據(jù)數(shù)據(jù)類型特點進行類別劃分,明確各類數(shù)據(jù)的安全防護要求,針對性設(shè)置不同防護措施。其次加強數(shù)據(jù)訪問權(quán)限管理,根據(jù)接入用戶和設(shè)備的數(shù)據(jù)訪問需求,設(shè)置不同的訪問權(quán)限,實現(xiàn)數(shù)據(jù)信息的綜合管理。此外,增加系統(tǒng)風(fēng)險監(jiān)管,實時監(jiān)控云端系統(tǒng)各項重要信息,重點包括對所有用戶進行身份識別認證,驗證用戶密鑰信息;及時掌握云服務(wù)器負載狀況,分析數(shù)據(jù)流量是否正常,避免數(shù)據(jù)信息被盜取。
過程二,根據(jù)上一過程中對數(shù)據(jù)的類別劃分,對于需要進行加密的數(shù)據(jù)采用數(shù)據(jù)加密算法進行加密處理。對于不同數(shù)據(jù),可分別使用不同的加密算法,如針對文本數(shù)據(jù)使RSA算法,并且在加密過程中默認選擇超長RSA密鑰,確保無法破譯密文,明顯提升平臺存儲數(shù)據(jù)的安全性。此外還可以使用CP-ABE 加密策略,結(jié)合云端重加密技術(shù)進行高性能加密處理,可以有效對重要數(shù)據(jù)進行重加密,增強數(shù)據(jù)的安全防護能力。
過程三,針對過程一中需要進行隱私化處理的敏感數(shù)據(jù),使用差分隱私機制進行隱私保護處理。這一過程首先需要對數(shù)據(jù)建立敏感度模型,根據(jù)數(shù)據(jù)隱私保護程度的不同劃分不同的敏感度等級,分別進行響應(yīng)的隱私保護處理。本項目中按照敏感系數(shù)取值范圍初步將敏感度等級劃分為三個等級,即輕度、中度敏和重度敏感數(shù)據(jù)。依據(jù)敏感度等級模型,可進一步將數(shù)據(jù)分為共享數(shù)據(jù)和非共享數(shù)據(jù),對于非共享數(shù)據(jù),可根據(jù)數(shù)據(jù)屬性特征分別采用拉普拉斯機制、指數(shù)機制和高斯機制進行差分隱私處理,從而有效實現(xiàn)隱私信息的保護。
譜聚類是當前機器學(xué)習(xí)領(lǐng)域研究的熱點,廣泛應(yīng)用于遙感測繪、自然語言處理和生物信息學(xué)等領(lǐng)域。與傳統(tǒng)k-means 算法和EM 算法相比,譜聚類算法適用于任意形狀的數(shù)據(jù)集,也無須事先假設(shè)數(shù)據(jù)的概率分布,算法思路簡單易于實現(xiàn)。
譜聚類算法的其基本原理在于:將樣本數(shù)據(jù)視為無向圖中的一個個頂點,然后基于相似性函數(shù)計算出各頂點間的相似度Wij,作為頂點間的權(quán)重,最后按照分割準則將圖分割,每一個子圖相當于一個簇。
在算法具體執(zhí)行過程中,相似性函數(shù)常采用高斯核函數(shù):
其中si,sj為樣本中的數(shù)據(jù)點,d(si,sj)是指數(shù)據(jù)點之間距離,一般指歐氏距離;σ為規(guī)模參數(shù),σ取值影響Wij的計算,間接影響了算法的聚類結(jié)果。不同數(shù)據(jù)集的最優(yōu)σ值也不一樣,因此實踐中σ的取值需要依據(jù)具體的數(shù)據(jù)集,多次實驗確定。
圖的分割準則主要有最小割集準則、比例割集準則、平均割集準則、多路規(guī)范割集準則等[8]。考慮到醫(yī)療數(shù)據(jù)的多樣性和復(fù)雜性,本文所使用的基于差分隱私保護的譜聚類算法采用多路規(guī)范割集準則:
基于差分隱私保護的譜聚類算法(DPSC)[9]在執(zhí)行過程中,需要先對原始數(shù)據(jù)進行隱私保護處理,然后再進行聚類操作。因此,可以將其分為隱私保護階段和聚類階段兩個部分。在隱私保護階段,通過差分隱私模型對原始數(shù)據(jù)添加噪聲,擾動具體信息,以保護個體隱私信息。在聚類階段,則使用處理后的數(shù)據(jù)進行聚類分析。具體流程如表1所示。
表1 差分隱私譜聚類算法
為有效處理醫(yī)療器械數(shù)據(jù)采集和傳輸過程中的意外產(chǎn)生的數(shù)據(jù)空缺值和噪聲值,平臺使用聚類算法從大量數(shù)據(jù)中過濾噪聲信號,并對正常數(shù)據(jù)進行標準化預(yù)處理,從而避免數(shù)據(jù)傳輸過程中出現(xiàn)的干擾對后續(xù)數(shù)據(jù)分析使用造成的影響。對于云端數(shù)據(jù)傳輸存在延時問題,構(gòu)建結(jié)合5G 通信技術(shù)的綜合傳輸響應(yīng)機制,加強大數(shù)據(jù)技術(shù)的充分利用,有效實現(xiàn)數(shù)據(jù)的分類多渠道傳輸,提升數(shù)據(jù)整體傳輸效率。
圖2 平臺醫(yī)療器械接入界面展示圖
具體實踐中,本文首先對從醫(yī)療器械接入的數(shù)據(jù)使用DPSC 算法進行聚類預(yù)處理。DPSC 將接入的每一個數(shù)據(jù)看作是圖中的一個節(jié)點,并按多路規(guī)范割集準則對圖分割來進行聚類,將所有數(shù)據(jù)分配到最近的簇中,然后將不屬于任何組或?qū)儆诜浅P〉慕M的數(shù)據(jù)點視為異常值,由此在實現(xiàn)隱私保護的前提下過濾出噪聲和異常數(shù)據(jù)。隨后將篩選出的正常數(shù)據(jù)進行標準化預(yù)處理,在提高數(shù)據(jù)傳輸效率的同時,保留相關(guān)統(tǒng)計特征,進而避免數(shù)據(jù)傳輸過程中出現(xiàn)的干擾對數(shù)據(jù)分析使用造成的影響。
最后,將準備進行云端傳輸?shù)臄?shù)據(jù)進行整合劃分,綜合利用云端技術(shù)優(yōu)勢,實行數(shù)據(jù)的分布式傳輸,提升數(shù)據(jù)整體傳輸效率。對于部分實時性要求較高的數(shù)據(jù),融合5G通信技術(shù)的綜合傳輸響應(yīng)機制,優(yōu)先采用5G 通信進行傳輸,在保障關(guān)鍵信息的及時傳輸?shù)那闆r下,進一步緩解傳輸和響應(yīng)的延時問題。
數(shù)據(jù)存儲是醫(yī)療器械云端化的重要部分,考慮到醫(yī)療器械產(chǎn)生的數(shù)據(jù)具有不同業(yè)務(wù)需求,整體的存儲方案設(shè)計采用多層級的分布式存儲結(jié)構(gòu),并將各存儲節(jié)點按需劃分為緩沖庫、數(shù)據(jù)倉庫、匯總庫、備份庫等不同存儲功能,以滿足不同設(shè)備對數(shù)據(jù)存儲和查詢的需求。此外針對一些特別重要的安全敏感數(shù)據(jù),為避免數(shù)據(jù)被私自盜用和修改,因此引入?yún)^(qū)塊鏈存儲方案。
具體設(shè)計中,充分考慮醫(yī)療器械存在的多種數(shù)據(jù)類型以及存儲要求,以滿足數(shù)據(jù)存儲和使用需求為目的,設(shè)計建立具有多層級的分布式存儲結(jié)構(gòu),提供關(guān)系型、列式、鍵值、文件等存儲服務(wù),具體包括緩沖庫、數(shù)據(jù)倉庫、匯總庫、備份庫等不同存儲功能的數(shù)據(jù)庫。其中數(shù)據(jù)倉庫作為數(shù)據(jù)存儲核心,其他數(shù)據(jù)庫作為輔助存儲,并配合形成完整的數(shù)據(jù)支撐架構(gòu)。輔助存儲系統(tǒng)實現(xiàn)包括任務(wù)調(diào)度、數(shù)據(jù)管理、運維監(jiān)控、日志管理等功能,對外可提供高效的數(shù)據(jù)查詢計算能力。緩沖數(shù)據(jù)庫負責(zé)接入原始數(shù)據(jù)并進行臨時存儲,接入方式以流、批數(shù)據(jù)為主要特點,負責(zé)對數(shù)據(jù)倉庫存儲節(jié)點進行數(shù)據(jù)更新,進行自動數(shù)據(jù)同步。匯總數(shù)據(jù)庫負責(zé)對原始數(shù)據(jù)結(jié)構(gòu)進行拆分、重組、關(guān)聯(lián),以形成相互關(guān)聯(lián)的匯總信息表,并針對具體的功能服務(wù),按數(shù)據(jù)類別、時間等字段類別進行匯總,目的是分離熱數(shù)據(jù)存儲庫,支持頻繁地讀寫和修改操作任務(wù)。備份庫目的則是保障數(shù)據(jù)安全,使用與緩沖數(shù)據(jù)庫相同的數(shù)據(jù)結(jié)構(gòu)進行同步數(shù)據(jù)備份。另一方面,考慮到醫(yī)療數(shù)據(jù)的特殊性,存在部分極為重要的敏感數(shù)據(jù)對存儲安全性要求極高。針對這類數(shù)據(jù)進一步融合以區(qū)塊鏈為基礎(chǔ)的存儲結(jié)構(gòu),實現(xiàn)去中心化的數(shù)據(jù)存儲,建立數(shù)據(jù)塊密碼安全機制,防止數(shù)據(jù)庫被隨意修改或損毀。
在平臺總體功能測試中,本文主要進行了數(shù)據(jù)共享、通信傳輸、數(shù)據(jù)安全、圖像處理和容災(zāi)備份等功能的測試。通過測試可知,平臺能夠?qū)崿F(xiàn)數(shù)據(jù)預(yù)處理,DPSC 算法能夠在添加少量噪聲的期刊下篩選異常值。此外,遠程醫(yī)療器械能夠迅速與平臺建立通信并上傳數(shù)據(jù),平臺端能夠正常響應(yīng)醫(yī)院端器械各項請求,在進行了相應(yīng)操作后自動將反饋結(jié)果給醫(yī)院端操控平臺。測試結(jié)果表明,本文提出的醫(yī)療器械快速云端部署安全平臺能夠滿足設(shè)計需求。
本文描述了醫(yī)療器械快速云端部署安全平臺總體架構(gòu)和各子模塊設(shè)計。該平臺基于BaaS架構(gòu),允許醫(yī)療器械快速接入、存儲數(shù)據(jù)和保障云端環(huán)境下數(shù)據(jù)隱私安全。本平臺有望為中小型企業(yè)提供可靠的技術(shù)方案,從根本上解決設(shè)備廠商實際中的難點和痛點,實現(xiàn)醫(yī)療器械的快速云端化、智能化,加速醫(yī)療器械產(chǎn)業(yè)發(fā)展,提高行業(yè)競爭力。