• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      一種可簡化臨床試驗(yàn)數(shù)據(jù)分析的SAS數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換方法*

      2016-06-24 02:48:28東南大學(xué)公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計學(xué)系210009承曉華王詩遠(yuǎn)
      中國衛(wèi)生統(tǒng)計 2016年2期
      關(guān)鍵詞:原始數(shù)據(jù)數(shù)據(jù)結(jié)構(gòu)字符

      東南大學(xué)公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計學(xué)系(210009) 承曉華 王詩遠(yuǎn) 劉 沛

      ?

      一種可簡化臨床試驗(yàn)數(shù)據(jù)分析的SAS數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換方法*

      東南大學(xué)公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計學(xué)系(210009) 承曉華 王詩遠(yuǎn) 劉 沛△

      數(shù)據(jù)管理標(biāo)準(zhǔn)臨床數(shù)據(jù)交換標(biāo)準(zhǔn)協(xié)會(the clinical data interchange standards consortium,CDISC)建立了一系列標(biāo)準(zhǔn)來規(guī)范藥物臨床試驗(yàn)中的數(shù)據(jù)結(jié)構(gòu)和分庫方式以支持?jǐn)?shù)據(jù)采集、交換、遞交和儲存臨床試驗(yàn)數(shù)據(jù)[1]。數(shù)據(jù)結(jié)構(gòu)的標(biāo)準(zhǔn)化是臨床試驗(yàn)數(shù)據(jù)管理的規(guī)范化和自動化的前提,在CDISC標(biāo)準(zhǔn)的支持下根據(jù)臨床試驗(yàn)數(shù)據(jù)采集特點(diǎn)進(jìn)行規(guī)范化的數(shù)據(jù)管理為大勢所趨。現(xiàn)今臨床試驗(yàn)原始數(shù)據(jù)收集過程中,為方便病例報告表(case report form,CRF)的錄入常常將同一受試者的各種觀察結(jié)果,如基本信息、各階段訪視信息、實(shí)驗(yàn)室檢查數(shù)據(jù)、不良反應(yīng)和合并用藥等列于同一行中,得到同一條記錄內(nèi)具有多個觀察指標(biāo)(變量)的數(shù)據(jù)結(jié)構(gòu)。這種結(jié)構(gòu)因其與CRF的順序一致而具有錄入速度快和符合人們閱讀習(xí)慣,方便研究者觀察等諸多優(yōu)點(diǎn),但給不良事件、合并用藥以及不同時間段實(shí)驗(yàn)室數(shù)據(jù)的SAS編程造成了較大困難?;谠瓟?shù)據(jù)結(jié)構(gòu)編寫分析程序需要將涉及到的變量全部寫入程序中,過程繁復(fù)易出錯。目前對此問題的解決方法常常是采用數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換,將這種橫向結(jié)構(gòu)的數(shù)據(jù)轉(zhuǎn)換為縱向結(jié)構(gòu),本文基于此提出一種可簡化臨床試驗(yàn)數(shù)據(jù)分析的SAS數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換方法,可大大簡化臨床試驗(yàn)數(shù)據(jù)集預(yù)處理過程,并為后續(xù)的統(tǒng)計分析提供方便。

      方法介紹

      從實(shí)現(xiàn)數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換、盡可能減少人工操作成分和擴(kuò)大程序通用性角度出發(fā),利用SAS宏的字符運(yùn)算功能,實(shí)現(xiàn)僅修改個別宏參數(shù)達(dá)到不同域的原始橫向數(shù)據(jù)向縱向數(shù)據(jù)結(jié)構(gòu)的轉(zhuǎn)換。編程的基本思想為:通過對規(guī)則化命名的變量識別,從原始數(shù)據(jù)集提取所需變量信息并處理成各功能列表,將其應(yīng)用于列表處理和數(shù)組提取。具體編程的各個步驟思路介紹如下。

      1.定義宏參數(shù),這些宏參數(shù)是本程序應(yīng)用過程中唯一需要手工添加的部分。主要包含原始數(shù)據(jù)集、提取的變量和輸出數(shù)據(jù)集等。各個宏參數(shù)的名稱和含義見表1。

      表1 程序中使用的宏參數(shù)

      2.有效性驗(yàn)證,驗(yàn)證數(shù)據(jù)集參數(shù)是否合法,是否存在對應(yīng)數(shù)據(jù)集,操作變量是否存在于數(shù)據(jù)集中,外部路徑是否有效,并獲取變量信息。提取原始數(shù)據(jù)集每個變量的變量名,標(biāo)簽,長度和格式等信息并將其保存到新的數(shù)據(jù)集中。篩查非數(shù)據(jù)集變量并剔除。

      3.通過Scan函數(shù)[2]提取原始數(shù)據(jù)集中前綴符合Targetlist的全部變量,并通過截取尾墜相同的變量組,循環(huán)賦值獲得儲存目標(biāo)變量的宏變量。在此步驟中讀取目標(biāo)變量的順序即為Targetlist中宏參數(shù)的順序,因此最后輸出的數(shù)據(jù)集中的變量順序可以按照要求和目的不同而改動,且不用考慮變量的具體屬性。

      4.通過SAS Proc SQL過程[3-4]提取變量的類型(Type)、標(biāo)簽(Label)、縱向維數(shù),以及日期變量,并將各個變量名儲存至列表型宏變量中。這一步是后續(xù)實(shí)現(xiàn)自動化的關(guān)鍵,提取出的變量屬性用于之后變量的分類和定義,正是因?yàn)檫@一步使得定義宏參數(shù)時可以不再需要對數(shù)據(jù)進(jìn)行預(yù)處理以分別列出字符型和數(shù)值型兩個組。

      5.定義AddValueList,添加原始數(shù)據(jù)集中未包含的行信息。

      6.對整理好的變量按順序分別整理至字符型和數(shù)值型兩個數(shù)組,并保留變量原本的屬性,使用Compbl函數(shù)[2]將之前步驟中多余的空格去除。

      7.最后將之前制作好的數(shù)組和變量組合起來完成行×列的對應(yīng)賦值,形成縱向結(jié)構(gòu)的新數(shù)據(jù)集,見表2。表2程序先判斷是否存在字符型變量,若存在則進(jìn)行排列,數(shù)值型變量同理。然后再將原始數(shù)據(jù)集中的值賦值進(jìn)去,并使用自定義標(biāo)簽變量Tag判斷每條記錄是否為空,見程序第16行,以此輸出到兩個不同的數(shù)據(jù)集,分別為包含記錄的數(shù)據(jù)集和不包含記錄的數(shù)據(jù)集,方便之后的統(tǒng)計分析。

      表2 數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換數(shù)組讀取宏程序

      應(yīng)用實(shí)例

      以某乙肝疫苗合并用藥數(shù)據(jù)結(jié)構(gòu)變換為例,說明程序應(yīng)用結(jié)果,原始數(shù)據(jù)集結(jié)構(gòu)如表3。

      為了直觀展示宏程序功能,表3省略了一些中間變量,僅保留NA(藥物名稱)、FO(藥物劑量)和RO(給藥途徑)的前三條信息。由表3可知,原數(shù)據(jù)結(jié)構(gòu)將每個受試者合并用藥的信息列于不同的列中,形成眾多變量,這使得后續(xù)合并用藥率等的統(tǒng)計分析編程較為復(fù)雜。執(zhí)行如下程序:

      %TableFormTransform(DataIn =CRF,TargetList =%bquote(CM1NA,CM1FO,CM1RO),DataOut =CM,DataBlank =CM_Blank,Keeplist =,AddValueList=)

      這里原始數(shù)據(jù)集為CRF,目標(biāo)變量為字符型的CM1NA,和數(shù)值型的CM1FO和CM1RO,輸出的轉(zhuǎn)換后包含記錄的數(shù)據(jù)集為合并用藥數(shù)據(jù)集(concomitant medications,CM),不包含記錄的為CM_Blank,并保留原始數(shù)據(jù)集中記錄編號。這里這個數(shù)據(jù)集要做的是合并用藥的內(nèi)容,因而AddValueList沒有需要拼接的癥狀名稱,所以為空。運(yùn)行程序后則得到轉(zhuǎn)換后的數(shù)據(jù)集CM,如表4。

      比較表4和表3的數(shù)據(jù)結(jié)構(gòu)可知,本文給出的方法將位于不同列中的同屬性變量轉(zhuǎn)化為位于同列的一個變量,同時結(jié)構(gòu)轉(zhuǎn)換后的數(shù)據(jù)集中變量的排列順序即為TargetList中目標(biāo)變量的順序,這為后續(xù)合并用藥率等統(tǒng)計分析提供了方便。

      表3 某乙肝疫苗合并用藥原始數(shù)據(jù)結(jié)構(gòu)

      討 論

      將同一受試者的不同觀察指標(biāo)(多個變量)作為一條記錄列于同一行上的橫向數(shù)據(jù)結(jié)構(gòu)廣泛存在于臨床試驗(yàn)的數(shù)據(jù)庫中。誠然,這種數(shù)據(jù)結(jié)構(gòu)有利于數(shù)據(jù)管理者的數(shù)據(jù)錄入、數(shù)據(jù)核查和研究者對數(shù)據(jù)的認(rèn)識和觀察。但必須指出的是,這種“通用”的“標(biāo)準(zhǔn)”數(shù)據(jù)結(jié)構(gòu)常常給后續(xù)的統(tǒng)計分析帶來困難。使用這種數(shù)據(jù)結(jié)構(gòu)進(jìn)行統(tǒng)計分析,編寫的程序在不同的臨床試驗(yàn)中很難重復(fù)利用??v向數(shù)據(jù)結(jié)構(gòu)在統(tǒng)計分析時具有很高的效率,有著工作量小、能減少多變量編程過程中可能引起的失誤,并且有著程序更普遍適用性等優(yōu)點(diǎn)。在CDSIC標(biāo)準(zhǔn)中,研究數(shù)據(jù)表格模型(study data tabulation model,STDM)提交的數(shù)據(jù)格式也為縱向數(shù)據(jù);分析數(shù)據(jù)庫模型(analysis data model,ADam)模塊中基本數(shù)據(jù)結(jié)構(gòu)(basic data structure,DBS),每例受試者不同時點(diǎn)、不同分析指標(biāo)有一條或多條記錄,支持參數(shù)和非參數(shù)分析,這里的數(shù)據(jù)同樣也是縱向數(shù)據(jù)格式。藥物臨床試驗(yàn)中的數(shù)據(jù)管理方法多樣,實(shí)現(xiàn)數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換,通常有兩種思路,一是通過循環(huán)運(yùn)算,二是通過數(shù)組排列。這個過程往往需要對變量進(jìn)行一個個判斷,將其歸類或者重新定義屬性,若處理多個數(shù)據(jù)集,則需要較長時間,且易發(fā)生錯誤。因而,尋找一種高效方法對原始橫向數(shù)據(jù)結(jié)構(gòu)進(jìn)行轉(zhuǎn)換具有實(shí)際意義。

      本文所介紹的方法通過識別變量屬于字符型還是數(shù)值型后,直接將其原本的屬性即標(biāo)簽、格式、長度,通過SQL過程繼承下來,一步到位,不需要人為地對其進(jìn)行定義和選取。通常在數(shù)據(jù)結(jié)構(gòu)變換過程中,對字符型數(shù)據(jù)和數(shù)值型數(shù)據(jù)需要分別列出兩個數(shù)組,而本文介紹的程序通過創(chuàng)建宏變量進(jìn)行預(yù)處理識別變量的類型并將其歸入數(shù)值型和字符型兩個列表(List)中,為之后提出變量組成數(shù)組做預(yù)處理。最后得到的輸出數(shù)據(jù)集縱標(biāo)目的順序即為調(diào)用宏語句“TargetList =% Bquote(Parameter1,Parameter2…)”中宏參數(shù)的排列順序,在應(yīng)用時可以隨意調(diào)換參數(shù)位置并且不考慮這些變量是屬于數(shù)值還是字符型,為批量處理提供方便。

      表4 某乙肝疫苗合并用藥變換后的數(shù)據(jù)結(jié)構(gòu)

      臨床試驗(yàn)中數(shù)據(jù)采集、數(shù)據(jù)管理的規(guī)范化對保證臨床試驗(yàn)質(zhì)量十分重要,而目前國內(nèi)在這些方面和國外相比尚有較大差距。CDSIC標(biāo)準(zhǔn)給臨床試驗(yàn)數(shù)據(jù)標(biāo)準(zhǔn)化提供了基礎(chǔ)。本文以數(shù)據(jù)管理自動化為目標(biāo),編寫可以廣泛應(yīng)用于CDISC標(biāo)準(zhǔn)化命名變量的宏程序,實(shí)現(xiàn)數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換的規(guī)范化。需要注意的是,在實(shí)際工作中若臨床試驗(yàn)電子CRF數(shù)據(jù)設(shè)計的變量名不規(guī)范,則可采用本課題組先前提出的《流行病學(xué)調(diào)查報告數(shù)據(jù)標(biāo)準(zhǔn)化入口的SAS實(shí)現(xiàn)》[5]進(jìn)行變量命名的標(biāo)準(zhǔn)化,再配合本文方法,即可實(shí)現(xiàn)能廣泛應(yīng)用于臨床試驗(yàn)和/或流行病學(xué)現(xiàn)場調(diào)查的數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換。

      參考文獻(xiàn)

      [1]Team,C.S.D.S.Study Data Tabulation Model(SDTM).2008.http:/ / www.cdisc.org/ sdtm.

      [2]SAS Institute Inc.Sas9.1.3 Help and Documentation.Cary Nc:Sas Institute Inc,2003.

      [3]SAS Institute Inc.Sas Institute Inc .Sas9.1.3 Sql Procedure Users Guide.Cary,Nc,2006.

      [4]SAS Institute Inc.Sas Institute Inc .Base Sas9.1.3 Sql Procedure Guide:Statistical Procedures.Cary,Nc,2006.

      [5]王詩遠(yuǎn),劉沛.流行病學(xué)調(diào)查報告數(shù)據(jù)標(biāo)準(zhǔn)化入口的SAS實(shí)現(xiàn).中國衛(wèi)生統(tǒng)計,2013,30(1):114-118.

      (責(zé)任編輯:劉 壯)

      *基金項(xiàng)目:國家科技重大專項(xiàng)“艾滋病和病毒性肝炎等重大傳染病防治”(2011ZX10004-902)

      通信作者:△劉沛,E-mail:liupeiseu@126.com

      猜你喜歡
      原始數(shù)據(jù)數(shù)據(jù)結(jié)構(gòu)字符
      GOLDEN OPPORTUNITY FOR CHINA-INDONESIA COOPERATION
      尋找更強(qiáng)的字符映射管理器
      受特定變化趨勢限制的傳感器數(shù)據(jù)處理方法研究
      字符代表幾
      一種USB接口字符液晶控制器設(shè)計
      電子制作(2019年19期)2019-11-23 08:41:50
      消失的殖民村莊和神秘字符
      全新Mentor DRS360 平臺借助集中式原始數(shù)據(jù)融合及直接實(shí)時傳感技術(shù)實(shí)現(xiàn)5 級自動駕駛
      汽車零部件(2017年4期)2017-07-12 17:05:53
      “翻轉(zhuǎn)課堂”教學(xué)模式的探討——以《數(shù)據(jù)結(jié)構(gòu)》課程教學(xué)為例
      高職高專數(shù)據(jù)結(jié)構(gòu)教學(xué)改革探討
      中國市場(2016年45期)2016-05-17 05:15:48
      TRIZ理論在“數(shù)據(jù)結(jié)構(gòu)”多媒體教學(xué)中的應(yīng)用
      措勤县| 洪泽县| 商南县| 和静县| 瑞昌市| 开原市| 长海县| 宜宾县| 孙吴县| 定西市| 沈丘县| 明水县| 石家庄市| 闽侯县| 镇安县| 咸宁市| 丰城市| 济宁市| 屏边| 江山市| 磐安县| 和龙市| 姜堰市| 郯城县| 满洲里市| 中超| 石泉县| 手机| 绥芬河市| 惠水县| 金湖县| 塔河县| 射阳县| 老河口市| 简阳市| 乌审旗| 兖州市| 舟山市| 若尔盖县| 宣恩县| 佳木斯市|