,
英國、美國、中國相繼開展了基于大規(guī)模人群隊列的精準(zhǔn)醫(yī)學(xué)計劃[1-3],數(shù)據(jù)規(guī)模達(dá)百萬級,多來源、多類型的大數(shù)據(jù)協(xié)調(diào)及管理成為精準(zhǔn)醫(yī)學(xué)研究和應(yīng)用的新挑戰(zhàn)。為了更深入了解面向精準(zhǔn)醫(yī)學(xué)的大規(guī)模人群隊列數(shù)據(jù)管理方法和關(guān)鍵技術(shù),本文主要介紹了美國“百萬老兵計劃”(Million Veteran Program,MVP)。它是一項國家級研究計劃,由美國退伍軍人事務(wù)部負(fù)責(zé)實施,目標(biāo)是為了幫助研究人員更好地理解基因組對健康和疾病的影響,用于改善退伍軍人的醫(yī)療健康及對特定疾病(糖尿病、癌癥等)進(jìn)行有效預(yù)防、診斷和治療[4]。
該計劃啟動于2011年,截至2016年7月,已在美國范圍內(nèi)的50多個站點(diǎn)招收了超過500 000的退伍軍人參與研究,并建立了美國國家級最大的存儲關(guān)聯(lián)遺傳、臨床、生活方式和軍事暴露等多種信息的數(shù)據(jù)庫。該計劃已支持完成超過175項有關(guān)心臟病、癌癥、心理健康和許多其他疾病危險因素或治療方法的研究評估[5],在其開展過程中所積累的大量基礎(chǔ)數(shù)據(jù)、臨床數(shù)據(jù)等也成為奧巴馬提出的美國精準(zhǔn)醫(yī)學(xué)計劃的重要數(shù)據(jù)來源。
MVP在人群招募、接收、數(shù)據(jù)采集、保存、數(shù)據(jù)協(xié)調(diào)管理、數(shù)據(jù)分析、數(shù)據(jù)安全和數(shù)據(jù)訪問的過程中,采取了較為系統(tǒng)和有效的組織管理措施、定義了明確的數(shù)據(jù)流程規(guī)范和指導(dǎo)方針,構(gòu)建了關(guān)于基因、部隊經(jīng)歷、生活方式和健康信息的數(shù)據(jù)庫和集成數(shù)據(jù)管理系統(tǒng),值得超大規(guī)模人群隊列數(shù)據(jù)管理研究借鑒和參考。
MVP主要招募軍人志愿者作為研究對象,所有參與者均為曾經(jīng)使用過美國退伍軍人事務(wù)部醫(yī)療系統(tǒng)的退伍軍人,自愿共享他們的醫(yī)療健康信息和基因信息。
MVP通過郵件邀請的方式進(jìn)行參與人群招募,郵件邀請函中介紹了MVP的研究內(nèi)容,以幫助參與者了解其研究中需要其參與的事項,包括完成關(guān)于個人健康和健康行為的調(diào)查問卷、提供用于基因組分析和未來研究的血液樣本、允許安全訪問與其健康管理相關(guān)的醫(yī)療信息(如過去和未來的健康記錄)、允許MVP員工因開展后續(xù)研究與之聯(lián)絡(luò)[6],還包括知情同意權(quán)益說明和基礎(chǔ)調(diào)查問卷。
有意愿參與的退伍軍人可以在閱讀知情同意權(quán)益說明后,完成問卷,同時預(yù)約研究訪談的時間。訪談時間確定后,參與者還將收到一封附有知情同意表的預(yù)約信,參與者可根據(jù)預(yù)約時間與退伍軍人事務(wù)部(Department of Veterans Affairs,VA)醫(yī)學(xué)中心研究網(wǎng)站的員工及研究組的成員面談。面談將幫助參與者深入了解MVP的目的、方法、風(fēng)險和收益,完成血液樣本采集和簽署必要的知情同意[7]或健康保險攜帶和責(zé)任法案(Health Insurance Portability and Accountability Act of 1996,HIPAA)授權(quán)表。最后,每個參與者還需完成一份關(guān)于其生活方式的調(diào)查問卷。
調(diào)查問卷收回后,退伍軍人事務(wù)中心機(jī)構(gòu)審查委員會(Institutional Review Board,IRB)負(fù)責(zé)對其進(jìn)行審核。如果參與者被MVP接收,退伍軍人健康管理醫(yī)療系統(tǒng)網(wǎng)站的員工將對其填寫的知情同意和HIPPA授權(quán)表進(jìn)行檢查和掃描,并將其發(fā)送到美國康州西黑文臨床流行病學(xué)研究中心(Clinical Epidemiology Research Center,CERC)。
研究中心負(fù)責(zé)檢查其填寫內(nèi)容的準(zhǔn)確性和完整性,隨后數(shù)據(jù)被錄入信息系統(tǒng)。每份調(diào)查問卷都會被編碼,用編碼替代參與者的姓名是為了保障參者隱私和方便實現(xiàn)對參與者招募、接收、樣本采集和使用的全過程追蹤。最終,生活方式調(diào)查問卷的數(shù)據(jù)和基礎(chǔ)調(diào)查問卷的數(shù)據(jù)將被整合存儲。
研究訪談的血液樣本采集遵循標(biāo)準(zhǔn)的操作流程規(guī)范,使用含有10ml乙二胺四乙酸(Ethylene Diamine Tetraacetic Acid,ETDA)抗凝劑血液收集試管裝載樣本。樣本經(jīng)離心處理后被放入凍存管保存,每個試管都會被分配一個2維條形碼標(biāo)簽,供機(jī)器自動讀取。
樣本收集后需要被連夜運(yùn)輸?shù)讲ㄊ款DVA中心生物倉儲存儲和進(jìn)行質(zhì)量評估/質(zhì)量控制,樣本將一直被存儲在中心生物倉儲中,直到它們被提供研究使用或因不再具有科學(xué)價值而被銷毀。關(guān)于樣本的采集、處理、狀態(tài)及出入庫時間等信息將被記錄到實驗室信息管理系統(tǒng)中。
血液樣本的基因組、表型和外顯子的分析等測序工作則由MVP的合同供應(yīng)商完成,供應(yīng)商需要遵循國際和VA測序相關(guān)標(biāo)準(zhǔn)保證測序質(zhì)量。
收集的MVP數(shù)據(jù),具有規(guī)模龐大、來源廣泛、類型多樣、格式豐富等特點(diǎn),不僅包括MVP參與者的自我問卷調(diào)查數(shù)據(jù)、生活方式調(diào)查數(shù)據(jù)、生物樣本數(shù)據(jù),還包括合同供應(yīng)商提供的基因型數(shù)據(jù)/序列數(shù)據(jù)以及VA國家數(shù)據(jù)系統(tǒng)中的數(shù)據(jù)(包括合作數(shù)據(jù)倉儲數(shù)據(jù)庫、國家病人醫(yī)療數(shù)據(jù)庫、VA生命狀態(tài)文件等)和非VA數(shù)據(jù)。
MVP研究涉及的數(shù)據(jù)內(nèi)容具體見表1。其中,MVP調(diào)查問卷數(shù)據(jù)主要來自基礎(chǔ)調(diào)查問卷和生活方式調(diào)查問卷?;A(chǔ)調(diào)查問卷數(shù)據(jù)是關(guān)于人口統(tǒng)計特征(性別、人種、婚姻、身高、體重等)、生理特征(發(fā)色、膚色、用手習(xí)慣等)、健康狀態(tài),活動和習(xí)慣、部隊經(jīng)歷、醫(yī)療歷史和醫(yī)療情況、遺傳病家族史;生活方式調(diào)查問卷包含更細(xì)致的補(bǔ)充性數(shù)據(jù),包括個人信息、個人習(xí)慣、鍛煉習(xí)慣、部隊和環(huán)境暴露情況、飲食習(xí)慣、幸福感知情況、男性/女性健康、藥物和維生素服用情況等內(nèi)容。
表1 MVP研究涉及的數(shù)據(jù)來源和內(nèi)容
MVP活動由多部門組織完成,具有清晰的管理組織結(jié)構(gòu)(圖1)[8]。VA中心辦公室/研究開發(fā)辦公室負(fù)責(zé)管理MVP各種資源、設(shè)計組織框架,安排和管理兩個基因組協(xié)調(diào)中心的活動?;蜥t(yī)學(xué)計劃咨詢委員會(Genomic Medicine Program Advisory Committee,GMPAC),由醫(yī)學(xué)基因組、基因組科學(xué)、醫(yī)療政策和管理、醫(yī)學(xué)信息學(xué)等領(lǐng)域的國內(nèi)和國際專家組成,負(fù)責(zé)有關(guān)基因醫(yī)學(xué)相關(guān)問題的咨詢工作。VA中心機(jī)構(gòu)審查委員會,負(fù)責(zé)保護(hù)研究對象的權(quán)益和引導(dǎo)每年的MVP審查。協(xié)議(招募材料)、知情同意權(quán)益和HIPPA授權(quán)表等都需要經(jīng)過中心機(jī)構(gòu)審查委員會的批準(zhǔn)??茖W(xué)審查委員會(Scientific Review Committee,SRC)負(fù)責(zé)對退伍軍人的樣本和數(shù)據(jù)進(jìn)行嚴(yán)格審查,審查通過后,樣本和數(shù)據(jù)才能被提供給研究者使用。該委員會還負(fù)責(zé)對提出數(shù)據(jù)使用申請的研究者所開展研究的科學(xué)性、數(shù)據(jù)請求必要性等方面進(jìn)行審查。
MVP執(zhí)行委員會監(jiān)管MVP的全部活動,執(zhí)行委員會由5個子委員會組成,主要職責(zé)是監(jiān)管和處理招募、通用政策和數(shù)據(jù)訪問、流行病學(xué)和表型、分子和生物化學(xué)分析、信息學(xué)和信息技術(shù)相關(guān)問題[4]。當(dāng)前MVP開展的活動由兩個VA基因組協(xié)調(diào)中心具體管理和開展。一個是波士頓馬薩諸塞老兵流行病學(xué)研究信息中心(Massachusetts Veterans Epidemiology Research and Information Center, MAVERIC)和合作研究計劃(Cooperative Studies Program,CSP)協(xié)調(diào)中心,主要負(fù)責(zé)招募參與者和管理中心生物倉儲和面向集成科學(xué)的基因組信息系統(tǒng)(Genomic Information System for Integrative Science,GenISIS);另一個是西黑文臨床流行病學(xué)研究中心和合作研究計劃協(xié)調(diào)中心,負(fù)責(zé)文件掃描,知情同意權(quán)益和HIPPA文檔監(jiān)管,MVP站點(diǎn)管理、預(yù)算管理及應(yīng)用項目管理等事務(wù)。兩個中心間也會進(jìn)行大量活動和信息的交互共享和配備大量人員用以支持所有活動持續(xù)開展。臨床研究藥物協(xié)調(diào)中心(Clinical Research Pharmacy Coordinating Center,CRPCC)支持對由VA和其他聯(lián)邦機(jī)構(gòu)引導(dǎo)的世界范圍多中心臨床實驗藥物和設(shè)備相關(guān)活動的管理。除這些部門以外,MVP在卡南代瓜市還設(shè)有一個信息中心,負(fù)責(zé)解答MVP相關(guān)問題、安排研究訪談的時間和輔助MVP網(wǎng)站招募工作。
圖1 MVP數(shù)據(jù)管理組織結(jié)構(gòu)
面向集成科學(xué)的基因組信息系統(tǒng)是MVP用于存儲、集成、檢索和分析數(shù)據(jù)的信息基礎(chǔ)架構(gòu)。數(shù)據(jù)被安全地存儲在GenISIS數(shù)據(jù)倉儲中,受到防火墻的保護(hù),GenISIS通過用戶角色和許可控制實現(xiàn)對系統(tǒng)和數(shù)據(jù)的訪問。
GenISIS包含5個主要功能[8]:提供參與者招募和接收軟件,提供報告環(huán)境,提供MVP收集樣本追蹤,提供安全的數(shù)據(jù)存儲,提供應(yīng)用于未來研究分析和保障安全的計算環(huán)境。GenISIS系統(tǒng)功能如圖2所示。
圖2 GenISIS系統(tǒng)功能
參與者招募和接收軟件主要實現(xiàn)招募和接收退伍軍人進(jìn)入隊列的功能,包括網(wǎng)站協(xié)調(diào)、呼叫中心、郵件中心和指揮控制中心等功能。報告環(huán)境主要實現(xiàn)對招募情報的報告功能,包括招募指示板、報告請求系統(tǒng)、詳細(xì)報告數(shù)據(jù)庫等。GenISIS數(shù)據(jù)倉儲用于存儲參與者的調(diào)查問卷數(shù)據(jù)、醫(yī)療數(shù)據(jù),還有來自非VA數(shù)據(jù)庫的一些輔助性數(shù)據(jù)。實驗室信息管理系統(tǒng)(Laboratory Information Management System,LIMS)支持實驗室信息管理,提供工作流、數(shù)據(jù)跟蹤和支持采樣追蹤和自動化液體處理,具有靈活的架構(gòu)和數(shù)據(jù)交換接口;還提供對所有關(guān)于生物樣本收集、運(yùn)輸、采樣處理和存儲的信息追蹤和與GenISIS信息的關(guān)聯(lián)。
GenISIS提供帶有分析工具的高性能安全計算環(huán)境。它提供的分析軟件包括SAS、R、Plink、ib2b等,用戶可以在線使用,也可通過上傳軟件進(jìn)行遠(yuǎn)程訪問,系統(tǒng)可根據(jù)用戶需求對分析軟件進(jìn)行更新升級??茖W(xué)環(huán)境能夠提供170TB的存儲區(qū)域網(wǎng)絡(luò)(Storage Area Network,SAN)、緩存空間以及192個節(jié)點(diǎn)的高性能集群,支持用戶完成高性能計算任務(wù);還支持對第三方知識庫(如NCBI等)的訪問。
GenISIS的數(shù)據(jù)流動過程見圖3。來自臨床信息系統(tǒng)的臨床數(shù)據(jù)、由供應(yīng)商提供的基因組數(shù)據(jù)和收集的調(diào)查問卷數(shù)據(jù)被存儲到GenISIS的數(shù)據(jù)倉庫中后,系統(tǒng)對這些數(shù)據(jù)進(jìn)行元數(shù)據(jù)抽取和編碼標(biāo)識分配、索引構(gòu)建和數(shù)據(jù)分類。經(jīng)知情同意管理者審核知情同意權(quán)益情況后,通過協(xié)調(diào)系統(tǒng)(Honest Broker),審核和標(biāo)準(zhǔn)化處理后的基因組數(shù)據(jù)、對應(yīng)的臨床數(shù)據(jù)和調(diào)查數(shù)據(jù)被關(guān)聯(lián)和整合起來,研究者可以通過術(shù)語和注釋服務(wù)器對集成的基因組、調(diào)查和臨床數(shù)據(jù)進(jìn)行注釋。
獲得授權(quán)的研究者可通過查詢接口訪問數(shù)據(jù),并通過查詢集市(Query Mart)檢索臨床和基因組信息,構(gòu)建研究應(yīng)用的隊列和子集數(shù)據(jù)。查詢的數(shù)據(jù)可被導(dǎo)出到GenISIS服務(wù)器研究數(shù)據(jù)集市中用于開展數(shù)據(jù)分析。GenISIS同時提供安全的高性能分析環(huán)境、用戶緩存空間和大量分析工具(如SAS、R、Matlab、Plink、ib2b、Perl/Bioperl等),允許用戶提交和管理他們的高性能計算任務(wù)。
圖3 GenISIS數(shù)據(jù)流
MVP涉及大量退伍老兵個人隱私數(shù)據(jù),因此十分重視數(shù)據(jù)隱私保護(hù)和安全問題,盡量降低參與者的風(fēng)險。退伍軍人事務(wù)部的研究者、美國其他聯(lián)邦醫(yī)療機(jī)構(gòu)和學(xué)術(shù)機(jī)構(gòu),只有通過退伍軍人事務(wù)部監(jiān)督委員會的批準(zhǔn),才可以獲取參與者樣本和健康信息用于未來的研究項目。具體而言,開展的研究必須滿足所有道德、科學(xué)和規(guī)范要求,并且需獲得退伍軍人事務(wù)部和其他監(jiān)督機(jī)構(gòu)的批準(zhǔn),只有獲得授權(quán)的研究者才能通過密鑰訪問樣本和數(shù)據(jù)。這些樣本和健康數(shù)據(jù)均需經(jīng)過匿名處理,采用特定編碼代替名字、地址、出生日期和社保號等個人標(biāo)識信息。除此之外,MVP必須嚴(yán)格遵守現(xiàn)有聯(lián)邦法律保護(hù)個人信息,主要包括《1974年隱私法案》《2002年電子政務(wù)法》《1996年健康保險流通與責(zé)任法案》(HIPAA)等關(guān)于醫(yī)療保健和個人信息的法規(guī)。這3項法規(guī)要求聯(lián)邦機(jī)構(gòu)建立安全措施保障統(tǒng)計記錄、個人信息和健康信息安全,避免對個人造成傷害。MVP在開展基因分析過程中,還借助《反基因信息歧視法案》(Genetic Information Nondiscrimination Act,GINA)來保護(hù)相關(guān)參與者的基因信息不被濫用和歧視。
MVP還接受NIH保密認(rèn)證保護(hù),保障數(shù)據(jù)不會被泄露給第三方,即便是有來自法庭的命令要求,數(shù)據(jù)也不會因此而被泄露[9]。排除一些特殊情況,如參與者或他們的家庭成員自愿發(fā)布了信息,或為避免對參與者和其他人造成嚴(yán)重傷害,MVP采取向當(dāng)局報告的必要措施以外,研究者可以依據(jù)這項認(rèn)證拒絕對參與者身份信息的請求。因為有NIH保密認(rèn)證的保護(hù),計劃相關(guān)研究者可豁免因被迫泄露關(guān)于參與者身份信息而收到法院傳票或任何民事、刑事、行政、立法、或其他聯(lián)邦,州或地方級別的訴訟。
MVP在管理、技術(shù)和操作等各個方面均采取了大量數(shù)據(jù)安全保護(hù)措施。在管理方面,通過制定有效的安全政策方針、信息安全規(guī)程來保障數(shù)據(jù)安全。MVP持續(xù)升級信息安全規(guī)程,要求開展VA健康研究的主要研究人員和其他工作人員需保證所有項目符合研究信息使用、存儲和安全要求[10]。如VA員工提出訪問敏感數(shù)據(jù)的請求要接受審查,包括對他們的職責(zé)和提出的數(shù)據(jù)訪問級別開展適當(dāng)?shù)谋尘罢{(diào)查。出于商業(yè)原因,VA也可能和其他聯(lián)邦或持有退伍軍人信息的商業(yè)實體一同合作,MVP要確保這些組織或?qū)嶓w也能夠采取適當(dāng)?shù)陌踩胧┍Wo(hù)敏感數(shù)據(jù)。
伴隨信息技術(shù)的飛速發(fā)展,MVP的活動越來越多地依賴于計算機(jī)系統(tǒng)和通信網(wǎng)絡(luò),包括數(shù)據(jù)的存儲、流程控制、分析、訪問和傳播等。為了能夠安全、可控地管理和使用數(shù)據(jù),在技術(shù)上,MVP建設(shè)了安全、穩(wěn)定的基礎(chǔ)設(shè)施和采用多種安全保障技術(shù);持續(xù)進(jìn)行軟件和設(shè)備升級,防止對未經(jīng)授權(quán)的敏感數(shù)據(jù)的訪問,其所有數(shù)據(jù)的管理和分析均在安全防火墻保護(hù)下開展。MVP相關(guān)研究設(shè)計、實施和操作涉及的各方面均需要通過嚴(yán)格審查,所有對數(shù)據(jù)庫的數(shù)據(jù)和樣本的訪問均需要經(jīng)過科學(xué)同行評議和機(jī)構(gòu)審查委員會的批準(zhǔn)。只有通過批準(zhǔn)的研究者才能通過密鑰訪問數(shù)據(jù)。訪問控制、在筆記本上安裝加密程序,對存儲隱私數(shù)據(jù)的移動電腦或便攜式存儲設(shè)備進(jìn)行加密等多種技術(shù)手段被應(yīng)用于MVP的數(shù)據(jù)安全保護(hù),防止未經(jīng)授權(quán)的敏感信息訪問和遠(yuǎn)程數(shù)據(jù)檢索。在人員管理方面,MVP積極對員工進(jìn)行數(shù)據(jù)隱私和安全責(zé)任強(qiáng)化教育及開展相關(guān)安全教育活動,提高員工對數(shù)據(jù)隱私和數(shù)據(jù)安全保護(hù)的個人責(zé)任重要性的認(rèn)識。
我國陸續(xù)開展了多項大規(guī)模人群隊列研究項目,如中國慢性病前瞻性研究項目[11]、泰州人群健康追蹤研究項目[12]等。在2016年和2017年開展的國家精準(zhǔn)醫(yī)學(xué)研究重點(diǎn)專項中也計劃建立多個大樣本人群隊列研究項目,通過管理、整合和分析基線數(shù)據(jù)、臨床數(shù)據(jù)和組學(xué)數(shù)據(jù)等多類型數(shù)據(jù),探索疾病發(fā)生、發(fā)展過程的內(nèi)在規(guī)律,實現(xiàn)疾病的預(yù)測、預(yù)防和個性化治療[13]。本文對美國“百萬老兵計劃”的大數(shù)據(jù)管理實踐進(jìn)行剖析,總結(jié)出以下5方面的特點(diǎn),希望能夠為開展我國精準(zhǔn)醫(yī)學(xué)大數(shù)據(jù)管理研究和應(yīng)用提供借鑒。
設(shè)置清晰、合理的管理組織架構(gòu)在超大規(guī)模隊列數(shù)據(jù)管理中至關(guān)重要。MVP不僅涉及對大量參與人群、招募網(wǎng)站、測序供應(yīng)商和臨床信息系統(tǒng)等人和系統(tǒng)的協(xié)調(diào)管理,還涉及多種來源、類型多樣的數(shù)據(jù)管理和多樣化數(shù)據(jù)流程、數(shù)據(jù)質(zhì)量的控制。MVP清晰的組織管理結(jié)構(gòu)為計劃實施起到了巨大作用。其設(shè)立多級委員會和多個協(xié)調(diào)中心,由辦公室總體統(tǒng)籌規(guī)劃、分中心組織協(xié)調(diào)開展數(shù)據(jù)采集、整合和分析,委員會監(jiān)督管理相結(jié)合,既能分工明確,各司其職;又能緊密配合,協(xié)同工作,及時溝通,實現(xiàn)從招募、接收、采樣、數(shù)據(jù)收集、管理、集成到分析和訪問控制的不同任務(wù)目標(biāo),有效推動MVP的實施進(jìn)展。
從問卷收集、樣本采集、基因測序到數(shù)據(jù)存儲、分析和訪問,MVP均有制定相關(guān)政策方針或規(guī)程指導(dǎo)控制數(shù)據(jù)流程和數(shù)據(jù)質(zhì)量。數(shù)據(jù)采集從人群招募、調(diào)查問卷填寫、知情同意簽署到問卷回收、數(shù)據(jù)存儲,MVP均提供明確的流程定義和清楚描述。一方面使參與者能夠準(zhǔn)確了解其在研究中的任務(wù)、責(zé)任、風(fēng)險和收益;另一方面,MVP也對數(shù)據(jù)的采集過程進(jìn)行了清晰定義,使數(shù)據(jù)流程透明化和規(guī)范化,對于血液樣本的采集、處理、存儲、運(yùn)輸、信息化管理和訪問控制也按照國際標(biāo)準(zhǔn)和VA標(biāo)準(zhǔn)進(jìn)行規(guī)范并進(jìn)行質(zhì)量評估和控制。在GenISIS系統(tǒng)內(nèi)、外部也對數(shù)據(jù)處理流程進(jìn)行了定義,并且通過數(shù)據(jù)詞典、數(shù)據(jù)標(biāo)準(zhǔn)、一致性檢查等進(jìn)行數(shù)據(jù)一致性、完整性和規(guī)范性控制。生物樣本及各類數(shù)據(jù)的標(biāo)準(zhǔn)化和質(zhì)量管理將決定并影響研究的結(jié)果,因而數(shù)據(jù)流程及質(zhì)量控制在精準(zhǔn)醫(yī)學(xué)大數(shù)據(jù)研究中不可或缺。
MVP建立大數(shù)據(jù)集成管理系統(tǒng)GenISIS,不僅實現(xiàn)了參與者招募、數(shù)據(jù)協(xié)調(diào)、信息溝通等功能,也實現(xiàn)了大數(shù)據(jù)存儲、整合、標(biāo)準(zhǔn)化處理、數(shù)據(jù)管理,高性能數(shù)據(jù)分析等功能;同時集成了多種數(shù)據(jù)資源,形成數(shù)據(jù)關(guān)聯(lián)。MVP還提供高性能的科學(xué)計算環(huán)境,集成多種數(shù)據(jù)分析工具,為研究者發(fā)現(xiàn)數(shù)據(jù)、利用數(shù)據(jù)、探索新知識、新模式提供了重要的基礎(chǔ)設(shè)施。集成數(shù)據(jù)管理系統(tǒng)流程設(shè)計較為合理,不僅考慮了數(shù)據(jù)隱私保護(hù),也在其中適當(dāng)嵌入了協(xié)調(diào)、審核機(jī)制,將平臺系統(tǒng)和政策規(guī)范緊密配合應(yīng)用,實現(xiàn)對MVP參與人員和海量數(shù)據(jù)的有效管理、追蹤、調(diào)度和提供滿足用戶需求的科學(xué)計算分析環(huán)境。
個人數(shù)據(jù)隱私保護(hù)在MVP被置于最高和優(yōu)先地位,不僅廣泛采納在國家層面已有的、成熟的個人信息保護(hù)相關(guān)法律、法規(guī)到計劃當(dāng)中;在計劃實施過程中也通過匿名處理、積極制定委員會或相關(guān)組織多級審查和安全控制制度,保障從人群隊列多類型數(shù)據(jù)采集、樣本采集、處理、運(yùn)輸、存儲、管理、分析到訪問、使用過程中的隱私安全。通過知情同意、HIPPA授權(quán)等方式讓參與者了解數(shù)據(jù)安全狀態(tài)和保護(hù)方式及通過明確的隱私保護(hù)政策、規(guī)定和許可保障超大規(guī)模人群隊列數(shù)據(jù)的訪問安全。
MVP是一個觀察性的長期大規(guī)模人群隊列研究,為保證參與者的最小風(fēng)險,VA注意提高數(shù)據(jù)安全技術(shù),持續(xù)對相關(guān)系統(tǒng)、軟件進(jìn)行升級更新,使用多重安全防御和管控策略防范安全威脅,保障系統(tǒng)平穩(wěn)、正常運(yùn)行,保障樣本、臨床等數(shù)據(jù)的妥善存儲和用于研究分析。但信息系統(tǒng)沒有絕對的安全,MVP也從通過落實安全管理制度、組織協(xié)調(diào)有關(guān)人員加強(qiáng)培訓(xùn)和安全教育,強(qiáng)化安全意識、責(zé)任義務(wù)和職業(yè)道德等方面保障數(shù)據(jù)采集、存儲、管理、高性能分析、訪問獲取等過程中的安全性、可用性、可控性和完整性,切實保障MVP數(shù)據(jù)和研究成果的安全。