潘俊霞,馬文娟,須凡帆,王璐
(無錫市疾病預(yù)防控制中心/南京醫(yī)科大學(xué)附屬無錫疾病預(yù)防控制中心,江蘇 無錫 214023)
2016年國務(wù)院印發(fā)《“健康中國2030”規(guī)劃綱要》,居民健康素養(yǎng)水平成為健康中國建設(shè)的13個(gè)主要指標(biāo)之一[1]。2012年起,居民健康素養(yǎng)監(jiān)測成為日常監(jiān)測工作,各省市采用國家統(tǒng)一問卷開展工作,為高質(zhì)量完成該工作,江蘇省率先開發(fā)出基于Andriod系統(tǒng)的健康素養(yǎng)現(xiàn)場調(diào)查軟件,在數(shù)據(jù)收集和質(zhì)量控制方面實(shí)現(xiàn)創(chuàng)新性突破[2]。但對于監(jiān)測問卷數(shù)據(jù)整理,目前多采用SPSS、Excel等軟件實(shí)現(xiàn),其操作繁瑣、可重復(fù)性差,費(fèi)時(shí)費(fèi)力,人為操作易發(fā)生錯(cuò)誤。SAS作為常用數(shù)據(jù)處理及統(tǒng)計(jì)分析軟件廣泛應(yīng)用于各領(lǐng)域,且SAS宏的高效性及便捷性能顯著提高數(shù)據(jù)分析工作效率和質(zhì)量[3]。本研究以全國居民健康素養(yǎng)監(jiān)測調(diào)查問卷(2020年版)為例,運(yùn)用SAS宏進(jìn)行數(shù)據(jù)管理,突破問卷題目和評分標(biāo)準(zhǔn)限制,實(shí)現(xiàn)居民健康素養(yǎng)監(jiān)測數(shù)據(jù)整理過程的標(biāo)準(zhǔn)化與規(guī)范化。
全國居民健康素養(yǎng)監(jiān)測調(diào)查問卷(2020版)由10個(gè)判斷題、26個(gè)單選題、16個(gè)多選題、1個(gè)情景題(3個(gè)單選題和1個(gè)多選題)以及基本情況等5部分構(gòu)成?,F(xiàn)場調(diào)查采用基于Andriod系統(tǒng)的健康素養(yǎng)現(xiàn)場調(diào)查軟件,問卷呈現(xiàn)在平板電腦(PAD)上,調(diào)查完成后調(diào)查員將數(shù)據(jù)通過PAD上傳到監(jiān)測后臺,可導(dǎo)出Excel格式的數(shù)據(jù)用于進(jìn)一步數(shù)據(jù)處理、統(tǒng)計(jì)分析等。
健康素養(yǎng)監(jiān)測數(shù)據(jù)管理主要是在統(tǒng)計(jì)分析前按照標(biāo)準(zhǔn)答案判斷問卷中題目的答案是否正確并根據(jù)國家標(biāo)準(zhǔn)生成3個(gè)維度、6大類健康問題及健康素養(yǎng)水平等分析變量,詳見表1。健康素養(yǎng)問卷共56題,總分66分,答對≥80%,即得分≥53分為具備健康素養(yǎng)。健康素養(yǎng)水平用具備健康素養(yǎng)的居民數(shù)占被調(diào)查居民總數(shù)的百分比來衡量。
采用SAS 9.4編寫程序,設(shè)計(jì)思路是設(shè)計(jì)Excel參數(shù)表,將宏參數(shù)寫入Excel,利用SAS與Excel結(jié)合,在程序運(yùn)行時(shí)利用X命令對宏參數(shù)進(jìn)行賦值[4],除底層基礎(chǔ)宏程序外,涉及2個(gè)關(guān)鍵宏程序,分別是%questionexcel(datain=,answerexcel=) 和%standardexcel(datain=, standardexcel=)。利用宏程序% questionexcel(datain=,answerexcel=)實(shí)現(xiàn)自動、批量判斷問卷中56道題目的答案是否正確并賦分,再根據(jù)國家制定的維度判斷標(biāo)準(zhǔn),利用%standardexcel(datain=,standardexcel=)計(jì)算3個(gè)維度、6大類重點(diǎn)健康問題及素養(yǎng)總得分,再判斷每項(xiàng)是否具備素養(yǎng)水平,如此便可自動化生成標(biāo)準(zhǔn)的分析數(shù)據(jù)集用于后續(xù)統(tǒng)計(jì)分析。受篇幅所限,列出宏程序%questionexcel(datain=,answerexcel=)中主要程序,如下所示:
以全國居民健康素養(yǎng)監(jiān)測調(diào)查問卷(2020年版)為例,按照國家標(biāo)準(zhǔn)判斷問卷答案是否正確并根據(jù)標(biāo)準(zhǔn)生成3個(gè)維度、6類重點(diǎn)健康問題及健康素養(yǎng)水平等分析變量,3維度及6類健康問題的劃分標(biāo)準(zhǔn)和具備該維度或該健康問題素養(yǎng)的界值見表1。
表1 2020年國家健康素養(yǎng)監(jiān)測題目維度劃分及判斷標(biāo)準(zhǔn)
proc sql noprint; select questionnum into :questionnumlist separated by "/" from_par; select newquestionnum into :newquestionnumlist separated by "/" from_par; select answer into :answerlist separated by "/" from_par; select score into :scorelist separated by "/" from_par;quit;/?利用sql根據(jù)參數(shù)表所賦的值,生成4個(gè)需要的宏變量并賦值?/data &datain.; set &datain.; %do p=1%to &answernobs; if%qscan(%bquote(&questionnumlist),&p,%bquote(/))="%qscan(%bquote(&answerlist),&p,%bquote(/))" then%qscan(%bquote(&newquestionnumlist),&p,%bquote(/))=%qscan(%bquote(&scorelist),&p,%bquote(/)); else%qscan(%bquote(&newquestionnumlist),&p,%bquote(/))=0; %end;run;/?根據(jù)用戶填寫的參數(shù)表生成數(shù)據(jù)集,再利用條件語句循環(huán)對數(shù)據(jù)集進(jìn)行計(jì)算并生成一系列分析變量?/
程序運(yùn)行過程首先是根據(jù)標(biāo)準(zhǔn)答案計(jì)算各題目得分,可通過運(yùn)行宏程序%questionexcel(datain=,answer-excel=)實(shí)現(xiàn),運(yùn)行參數(shù)表如圖1所示。第1列questionnum為原問卷中的題號,即程序自動讀取原始數(shù)據(jù)中該題的變量名;第2列newquestionnum為新生成的變量名;第3列answer為正確答案;第4列score為該題分值。故圖中第2行表示題目A01,正確答案answer是2,該題是單選題,分值為1,所以score填1;如果是多選題那么answer需要填正確答案如123,分值score相應(yīng)改為2。參數(shù)表填寫完成并保存后即可得出相應(yīng)的分析變量,即newquestionnum所對應(yīng)的各題目得分,如圖2所示。
圖1 計(jì)算各題目分?jǐn)?shù)的Excel參數(shù)表(節(jié)選)
圖2 生成各題目分?jǐn)?shù)SAS結(jié)果顯示(節(jié)選)
其次根據(jù)標(biāo)準(zhǔn)計(jì)算3維度、6類健康問題的得分和總分,并根據(jù)界值生成是否具備素養(yǎng)的變量,運(yùn)行宏程序%standardexcel(datain=,standardexcel=)即可實(shí)現(xiàn),運(yùn)行后參數(shù)表如圖3所示。以第2行為例,第1列wd1為新生成變量維度一:基本知識和理念的分?jǐn)?shù);第2列formula由表1中維度一的計(jì)算公式得出,即由判斷、單選、多選和情景題共22道相加得出;第3列cutoff是維度一具備素養(yǎng)的界值25;第4列stralabel為新生成變量wd1level,即維度一是否具備健康素養(yǎng),如果維度一的分?jǐn)?shù)大于等于界值25,則wd1level為1,否則為0。具體生成數(shù)據(jù)集結(jié)果如圖4所示。
圖3 計(jì)算3維度、6類問題分?jǐn)?shù)和總分并判斷是否具備素養(yǎng)的參數(shù)表
圖4 生成3維度、6類問題分?jǐn)?shù)并根據(jù)界值生成是否具備健康素養(yǎng)(節(jié)選)
健康素養(yǎng)是一個(gè)社會學(xué)指標(biāo),即反映我國社會發(fā)展的綜合指標(biāo)[5]。為及時(shí)了解我國城鄉(xiāng)居民健康素養(yǎng)水平及其變化趨勢,為制訂、完善衛(wèi)生健康相關(guān)政策提供依據(jù),監(jiān)測數(shù)據(jù)真實(shí)可信尤其關(guān)鍵。SAS軟件因其權(quán)威性廣泛應(yīng)用于醫(yī)藥、金融等領(lǐng)域,利用SAS宏對監(jiān)測數(shù)據(jù)進(jìn)行數(shù)據(jù)管理提升了數(shù)據(jù)真實(shí)性和可信度,未見其他常用數(shù)據(jù)處理軟件應(yīng)用于健康素養(yǎng)監(jiān)測數(shù)據(jù)整理的研究報(bào)道。
本研究采用SAS與Excel參數(shù)表結(jié)合的方式編寫宏程序,不受問卷評分標(biāo)準(zhǔn)改變的限制,僅須在填寫Excel參數(shù)表時(shí)將計(jì)算公式、分值、變量名等根據(jù)最新的問卷題目、評分標(biāo)準(zhǔn)等進(jìn)行修改而不需要修改宏程序本身就可以產(chǎn)生需要的統(tǒng)計(jì)分析數(shù)據(jù)庫,如不采用Excel參數(shù)表的形式,則一旦問卷內(nèi)容或者題目評分標(biāo)準(zhǔn)發(fā)生改變就需要更改程序,增加工作量,同時(shí),該方法對于其他學(xué)科的問卷調(diào)查數(shù)據(jù)管理過程也具有參考意義,拓寬了本程序的使用范圍。全國各級疾病預(yù)防控制機(jī)構(gòu)每年均開展居民健康素養(yǎng)調(diào)查,都需要對問卷數(shù)據(jù)進(jìn)行數(shù)據(jù)管理和統(tǒng)計(jì)分析,并逐級上報(bào)數(shù)據(jù)和統(tǒng)計(jì)分析結(jié)果,問卷題目有56題,如使用Excel手動計(jì)算需要逐題進(jìn)行操作,耗時(shí)費(fèi)力,還無法確保手工操作過程中不發(fā)生錯(cuò)誤,利用宏程序能使監(jiān)測數(shù)據(jù)管理過程快速、準(zhǔn)確地產(chǎn)生標(biāo)準(zhǔn)化分析數(shù)據(jù)庫,對各級監(jiān)測數(shù)據(jù)復(fù)核與匯總都具有實(shí)際意義,對疾病預(yù)防控制中心專業(yè)技術(shù)人員,尤其是基層工作人員具有很好的應(yīng)用價(jià)值。宏程序編譯成宏包并且提供使用示例后,僅須按照示例調(diào)用宏程序和填寫Excel參數(shù)表即可使用,對不熟悉SAS的工作者也易于上手,為健康素養(yǎng)監(jiān)測數(shù)據(jù)管理規(guī)范化提供了可能,大幅提高實(shí)際分析工作中數(shù)據(jù)處理效率。對于居民健康素養(yǎng)監(jiān)測而言,實(shí)現(xiàn)數(shù)據(jù)管理過程標(biāo)準(zhǔn)化后,可進(jìn)一步利用SAS軟件開發(fā)出統(tǒng)計(jì)分析宏程序包,以便實(shí)現(xiàn)統(tǒng)計(jì)分析和報(bào)表生成自動化,提高工作效率。