陳 鶴 劉 艷 伍小蘭 喬曉春
(1. 中國人民大學(xué) 公共管理學(xué)院,北京 100872;2. 北京大學(xué) 人口研究所,北京 100871;3. 中國老齡科學(xué)研究中心,北京 100054)
在2019年末,我國65歲及以上老年人口規(guī)模達到1.76億,占我國總?cè)丝诘?2.6%,占世界老年人口的1/5以上[1-2]。老年人健康狀況關(guān)系著我國醫(yī)療、養(yǎng)老和長期照護等社會保障體系的可持續(xù)性,也是實現(xiàn)健康老齡化和積極老齡化等理念的基石[3]。以Katz量表測量的老年人失能水平是目前國內(nèi)外學(xué)術(shù)界中應(yīng)用最廣泛的老年人健康評估指標之一[4-7]。我國也已經(jīng)積累了多個包含Katz量表的全國性社會調(diào)查數(shù)據(jù),在老年人失能水平研究中積累了豐富的成果[8-12]。
回顧上世紀九十年代早期,我國當時并沒有專門針對老年人、包含Katz量表的全國性調(diào)查。老年人被包含在目標群體為全人口或成年人的社會調(diào)查之中,例如,中國健康與營養(yǎng)調(diào)查(China Health and Nutrition Survey,簡稱CHNS)[13]。由于樣本量小,基于Katz量表估計的老年人失能水平缺乏代表性和穩(wěn)定性,在高齡老年人中尤其如此[14-15]。1998-2000年,中國老年健康影響因素跟蹤調(diào)查(Chinese Longitudinal Healthy Longevity Survey,簡稱CLHLS)[16]和中國城鄉(xiāng)老年人生活狀況抽樣調(diào)查(Sample Survey of the Aged Population in Urban/Rural China,簡稱SSAPUR)[17]的實施,顯著改善了老年人健康數(shù)據(jù)缺乏的局面。大約十年后,中國健康與養(yǎng)老追蹤調(diào)查(China Health and Retirement Longitudinal Study,簡稱CHARLS)[18]和中國老年社會追蹤調(diào)查(China Longitudinal Aging Social Survey,簡稱CLASS)[19]又進一步豐富了數(shù)據(jù)來源。CHARLS、CLASS、CLHLS和SSAPUR(各項調(diào)查按縮寫字母排序,下同)四項調(diào)查具有較好的全國代表性和良好的數(shù)據(jù)質(zhì)量[16-19],已經(jīng)構(gòu)成了我國老年人健康和相關(guān)問題研究的重要數(shù)據(jù)基石。Katz量表也在各項調(diào)查中得到了普遍應(yīng)用,促進了老年人失能水平的研究。與此同時,調(diào)查間Katz量表的可比性問題逐漸顯現(xiàn),依據(jù)這些數(shù)據(jù)得到的失能水平存在明顯的差異[20]。
理論上,由于測量對象相同,具有或具有較好代表性的各項調(diào)查數(shù)據(jù)得出的老年人失能水平應(yīng)該相近。然而,現(xiàn)有研究結(jié)果卻出現(xiàn)了相反的情況[8-12][21]。以針對60歲及以上老年人的研究為例,劉菂、代濤和黃菊利用CHARLS 2015數(shù)據(jù)得到的失能現(xiàn)患率為10.14%[21],中國人民大學(xué)中國調(diào)查與數(shù)據(jù)中心利用CLASS 2014數(shù)據(jù)得到的失能現(xiàn)患率為9.3%[19],黨俊武、魏彥彥和劉妮娜利用SSAPUR 2015得到的失能現(xiàn)患率為4.1%[17]。此外,根據(jù)吳炳義等對CLHLS 2014的分析顯示,老年人口中失能現(xiàn)患率為17.43%[22]。這種差異化的研究結(jié)果對評估老年人健康狀況和制定養(yǎng)老政策等都造成了一定程度的困擾。然而,關(guān)于老年人失能水平的差異化程度和原因一直缺少系統(tǒng)化的分析。
鑒于此,本文研究目的為:在增強數(shù)據(jù)間可比性的基礎(chǔ)上,比較分析CHARLS、CLASS、CLHLS和SSAPUR四項全國性社會調(diào)查數(shù)據(jù)中的老年人失能水平,嘗試分析失能水平差異出現(xiàn)的原因,并提供關(guān)于我國老年人失能水平的綜合估計和研究建議。
Katz量表也被稱為ADL指數(shù)(Index of ADL),主要通過日常生活活動能力來反映身體功能狀況。Katz量表最初主要應(yīng)用在醫(yī)療服務(wù)相關(guān)的場景,用于評估老年慢性病患者接受治療和診斷后的身體功能狀況[5-6]。國際文獻顯示,Katz量表具有良好的信度和效度[7]。同時,它具有題目數(shù)量少、操作簡便的優(yōu)勢。一些非專業(yè)人士在經(jīng)過培訓(xùn)后也可以使用該量表。因此,Katz量表后來逐漸被應(yīng)用到更廣泛的社會調(diào)查之中。圍繞研究目的,本文主要從測量維度和結(jié)果判定上進行總結(jié)。
在測量題目上,Katz量表包含洗澡(Bathing)、穿衣(Dressing)、上廁所(Using the toilet)、從床移動到椅子(Transferring from bed to chair),大小便控制(Continence)和吃飯(Feeding)六項活動。Katz等人發(fā)現(xiàn)個體身體功能喪失往往從復(fù)雜活動開始(如洗澡),逐漸擴展至簡單活動(如吃飯);身體功能恢復(fù)時則遵循相反順序。以上六項活動能夠較好地反映該過程。1963年,Katz等人在《JAMA》上提出的量表對活動和備選項進行了詳細描述,以減少因理解差異所造成的測量誤差[5]。例如,洗澡是指“使用濕浴巾擦身、盆浴或淋浴”,備選項包含“無需接受幫助(如果通常采用盆浴方式,可以自己進入或離開浴盆)”、“只在某一身體部分需要幫助(如背部或腿)”和“在超過一處身體部分需要幫助或無法自己洗浴”。國內(nèi)社會調(diào)查往往酌情調(diào)整了Katz量表的表述方式。仍以洗澡為例,表述為“您洗澡時是否需要他人幫助(包括擦洗上身或下身)嗎?”或直接簡化為“洗澡”。
在結(jié)果判定上,Katz等人最初設(shè)計了A-G和其他八個類別,代表不同的失能程度。例如,A代表最好的身體功能狀況,可以獨立完成所有活動;C代表無法獨立完成兩項活動(其中一項為洗澡);G代表無法獨立完成所有活動[5]。獨立完成意味著評估對象在無監(jiān)督、指導(dǎo)或他人積極輔助下可以獨立完成活動。這種計分方式復(fù)雜,影響了推廣度。目前研究中普遍采取計數(shù)法,即計算無法獨立完成的活動個數(shù),通過閥值來劃分為“失能-不失能”或“失能-半失能-不失能”等類別。例如,劉菂等人將在任一Katz量表活動上出現(xiàn)無法完成或完成有困難、需要幫助的情況定義為失能[21]。應(yīng)用計數(shù)法的前提是Katz量表具有良好的構(gòu)造效度(Construct validity),即六項活動反映了同一維度(Unidimensionality)[23-24]。然而,關(guān)于國內(nèi)各項社會調(diào)查中Katz量表是否具有構(gòu)造效度,尚缺乏足夠證據(jù);研究往往跳過該環(huán)節(jié)直接應(yīng)用計數(shù)法判斷是否失能。同時,關(guān)于Katz量表的信度分析也十分不足。這些都削弱了Katz量表在失能測量中的方法基礎(chǔ)。
CHARLS、CLASS、CLHLS和SSAPUR四項全國性社會調(diào)查數(shù)據(jù)中都包含了Katz量表,但是量表呈現(xiàn)方式不盡相同,并可能導(dǎo)致失能水平估計的差異。這至少包含以下方面:首先,各項調(diào)查對Katz量表中活動的表述方式不同,尤其是移動和大小便控制。關(guān)于移動的表述方式,CLHLS的“上下床、坐在椅子或凳子上或從凳子上站起來”和CLASS的“從床上移動到床邊的椅子上”,更接近Katz量表原版表述。CHARLS和SSAPUR則簡化為起床和下床。此外,關(guān)于大小便控制的表述方式,CLASS和SSAPUR采取了與Barthel量表類似的方式,將其拆分為小便失禁和大便失禁兩項活動。此外,CHARLS將受訪人能夠使用導(dǎo)尿管或尿袋視為小便自理,而CLASS則將使用導(dǎo)尿管定義為小便失禁。前者更傾向于功能發(fā)揮,而后者更傾向于醫(yī)學(xué)視角。其次,CHARLS明確指出活動困難“不包括那些預(yù)計在三個月內(nèi)能夠解決的問題”,其他調(diào)查沒有關(guān)于時間的明確限定。如果受訪人將無時間限定理解為當前狀況,考慮到身體功能恢復(fù)的可能性,CHALRS得到的失能水平應(yīng)低于其他其他調(diào)查(在其他條件均相同的情況下)。此外,CHARLS每項問題中設(shè)置了四個備選項,其他調(diào)查設(shè)置了三個備選項。CHARLS 2015備選項分別為“沒有困難”、“有困難但仍可以完成”、“有困難需要幫助”和“無法完成”;CLASS 2014為“不需要別人幫助”、“需要一些幫助”和“完全做不了”;CLHLS 2014關(guān)于洗澡的備選項為“不需要任何幫助”、“某一部位需要幫助”和“兩個部位以上需要幫助”(具體活動備選項有微調(diào));SSAPUR 2015為“做得了”、“有些困難”和“做不了”。
正如引言部分所示,利用不同全國性社會調(diào)查中Katz量表估計的老年人失能水平存在著明顯的差異[17][19][21][22]。絕大部分研究只使用一項調(diào)查數(shù)據(jù)。由于不同研究者的分析策略不同,不能對這些研究的結(jié)果進行簡單比較[20]。極少數(shù)研究同時使用了多種調(diào)查數(shù)據(jù),但是,往往覆蓋的數(shù)據(jù)不全面或沒有對失能現(xiàn)患率作系統(tǒng)性分析[22]。目前,僅有張文娟和魏蒙比較系統(tǒng)地分析了失能水平在調(diào)查間的差異程度,該研究梳理了失能的評價指標、樣本分布對老年人失能的影響和國內(nèi)相關(guān)調(diào)查及其失能水平,并進一步利用CLHLS 2011、CHARLS 2011和SSAPUR 2010進行分析,作者對如何基于Katz量表進行失能測量進行了統(tǒng)一化處理,比較分析了三項調(diào)查中得到的失能現(xiàn)患率,推斷我國老年人的失能現(xiàn)患率范圍為10.48%至13.31%,并結(jié)合抽樣方法、性別、年齡和居住地等變量分布探討了差異出現(xiàn)的原因。該研究還建議在未來相關(guān)調(diào)查研究中統(tǒng)一測量方法,并增大樣本規(guī)模特別是高齡老年人的數(shù)量,以減少由于樣本數(shù)量少、代表性不足帶來的估計偏差[20]。但是,由于該研究沒有估計失能現(xiàn)患率的置信區(qū)間,難以判斷調(diào)查間的差異是否具有統(tǒng)計顯著性,也沒有開展Katz量表的信效度分析。此外,研究所用的調(diào)查數(shù)據(jù)近年來都已經(jīng)更新,CLASS也成為新增數(shù)據(jù)來源。因而,有必要以新數(shù)據(jù)重新評估老年人失能水平,為制定養(yǎng)老政策提供實證支持。
本文將基于CHARLS、CLASS、CLHLS和SSAPUR四項全國性社會調(diào)查數(shù)據(jù)進行分析,利用Cronbach’s alpha系數(shù)和因子分析評估各調(diào)查中Katz量表的信度和構(gòu)造效度,通過失能測量統(tǒng)一化和性別-年齡標準化等增強數(shù)據(jù)可比性,采取失能現(xiàn)患率的點估計、置信區(qū)間以及失能人數(shù)等指標來分析老年人失能水平,并從抽樣方法、樣本分布、Katz量表呈現(xiàn)方式等方面分析各調(diào)查間失能水平差異出現(xiàn)的原因。
本文基于CHARLS 2015、CLASS 2014、CLHLS 2014和SSAPUR 2015四項社會調(diào)查數(shù)據(jù)進行分析。選擇這些年份的調(diào)查數(shù)據(jù)主要是為了盡量使結(jié)果在時間上具有可比性。同時,CLHLS 2014數(shù)據(jù)中60-64歲樣本量很少(61例),不但缺乏對全國該年齡組的代表性,而且可能造成失能估計的偏差。因此,本文將研究對象設(shè)定為65歲及以上的老年人。調(diào)查數(shù)據(jù)基本信息見表1。這些調(diào)查普遍具有或具有較好的全國代表性和良好的數(shù)據(jù)質(zhì)量[16-19],被廣泛應(yīng)用于我國老年健康研究中[9][11-12]。下面進行簡要的介紹。
表1 調(diào)查數(shù)據(jù)基本信息匯總
CHARLS是由北京大學(xué)國家發(fā)展研究院主持、北京大學(xué)中國社會科學(xué)調(diào)查中心與北京大學(xué)團委共同執(zhí)行的一項具有全國代表性的跨學(xué)科追蹤調(diào)查[18]。調(diào)查對象為我國45歲及以上的中老年人。CHARLS于2011年開展全國基線調(diào)查,覆蓋150個縣級單位,450個村級單位,約1萬戶家庭中的1.7萬人。這些樣本每兩到三年追蹤一次。調(diào)查采用多階段抽樣,在縣/區(qū)和村居抽樣階段均采取PPS抽樣方法,在抽樣設(shè)計上保障了全國代表性。CHARLS 2015總樣本量為21789,其中,65歲及以上樣本量為6519。
CLASS是由中國人民大學(xué)老年學(xué)研究所設(shè)計、中國人民大學(xué)中國調(diào)查與數(shù)據(jù)中心實施的一項全國性的追蹤社會調(diào)查項目,調(diào)查對象為60歲及以上人口[19]。CLASS于2014年開展第一次全國基線調(diào)查,每兩年追蹤一次,目前已完成2016年和2018年兩次追蹤調(diào)查。調(diào)查采取分層、多階段概率抽樣方法,選定縣級區(qū)域(包括縣、縣級市、區(qū))作為初級抽樣單位,村/居委會作為次級抽樣單位。CLASS 2014總樣本量為11511,其中,65歲及以上樣本量為8439。
CLHLS是由北京大學(xué)健康老齡與發(fā)展研究中心/國家發(fā)展研究院組織的一項全國性追蹤調(diào)查[16]。調(diào)查范圍覆蓋全國23個省/市/自治區(qū)。該調(diào)查在1998年進行基線調(diào)查(時稱中國高齡老人健康長壽影響因素調(diào)查),分別于2000、2002、2005、2008-2009、2011-2012、2014、2018年完成追蹤調(diào)查。基線時,CLHLS調(diào)查對象為80歲及以上的高齡老人,其后逐漸擴展至65歲及以上的老年人,并在部分年份或地區(qū)增加了65歲以下樣本。為了能夠調(diào)查到足夠多的最需照料的高齡老人,該調(diào)查的抽樣設(shè)計采用了多階段不等比例目標隨機抽樣方法,調(diào)查覆蓋地區(qū)人口約占全國總?cè)丝诘?5%[11]。CLHLS 2014總樣本量為7192,其中,65歲及以上樣本量為7107。
SSAPUR是由全國老齡委及中國老齡科學(xué)研究中心組織的一項具有全國代表性的調(diào)查[17]。調(diào)查對象為我國60歲及以上老年人。調(diào)查范圍覆蓋全國31個省、自治區(qū)、直轄市和新疆生產(chǎn)建設(shè)兵團。SSAPUR于2000年進行“中國城鄉(xiāng)老年人一次性抽樣調(diào)查”、2006年和2010年進行“中國城鄉(xiāng)老年人口狀況追蹤調(diào)查”、2015年進行第四次中國城鄉(xiāng)老年人生活狀況調(diào)查。其中,SSAPUR 2015采用分層、多階段PPS、最后階段等概率抽樣設(shè)計,所得樣本是近似自加權(quán)的。SSAPUR 2015總樣本量為224142,其中,65歲及以上樣本量為154143。
3.2.1 失能
基于Katz量表,本文通過洗澡、穿衣、上廁所、從床移動到椅子、大小便控制和吃飯六項活動的完成情況來評估受訪人的失能水平[5-6]。盡管各調(diào)查均包含了Katz量表,但在其呈現(xiàn)方式上存在差異(詳見文獻綜述部分)。為了盡量減少這些差異對失能水平可比性的負面影響,本文對各調(diào)查的失能測量進行了以下統(tǒng)一化處理[20]:
首先,測量項目處理。CLASS 2014和SSAPUR 2015對大小便控制的測量方式與Katz原版及其他調(diào)查不同。CLASS 2014拆分為大便失禁和小便失禁兩項活動。本文將“經(jīng)常有”大便失禁或小便失禁的受訪人定義為在大小便控制上無法自理。此外,SSAPUR 2015則將大小便失禁置于備選項中,“很多老年人有失禁的情況,您是否也有(多選題)?”備選項為“大便失禁”、“小便失禁”和“都沒有”。本文將選擇大便失禁”或“小便失禁”的受訪人定義為在大小便控制上無法自理。
其次,備選項處理。對于CHARLS 2015、CLASS 2014和CLHLS 2014中的Katz量表,本文均將選擇后兩個備選項的受訪人視為在某項活動上無法自理,即需要他人幫助才能完成該項活動,具有照護需求。SSAPUR 2015中Katz量表的第二個備選項“有些困難”沒有明確屬于“雖然有困難,但是可以獨立完成”還是“有困難,需要別人幫助才能完成”,無法確定在相應(yīng)活動中是否具有照護需求。為此,針對SSAPUR采取了兩種處理方式:將選擇第二或第三個備選項的受訪人均視為在某項活動上無法自理(簡稱SSAPUR 2015寬口徑);將選擇第三個備選項的受訪人視為在某項活動上無法自理(簡稱SSAPUR 2015窄口徑)。
最后,失能定義。本文將在至少1項活動上無法自理定義為失能,其中,1–2項活動無法自理為輕度失能,3–4項活動無法自理為中度失能,5–6項活動無法自理為重度失能。
3.2.2 其他變量
在分析失能水平分布時,本文還納入了5歲年齡組(65-69歲、70-74歲、75-79歲、80-84歲、85-89歲、90歲及以上)、性別(男性和女性)、居住地(城鎮(zhèn)和農(nóng)村)、婚姻狀況(在婚和未在婚)和受教育程度(未上過學(xué)、小學(xué)、中學(xué)及以上)。選擇這些變量主要是考慮在四項調(diào)查數(shù)據(jù)中的可得性、可比性及其在社會政策制定中的現(xiàn)實意義。
本文中使用的分析方法主要包括三類,服務(wù)于不同的研究目的:
首先,Katz量表的信度和效度評估。本文采取Cronbach’s α評估量表的信度、驗證性和探索性因子評估量表的構(gòu)造效度。當Cronbach’s α>0.70時,認為Katz量表具有可以接受的信度[24]。Katz量表中六項活動處理后變?yōu)槎诸愖兞?,無法直接運用因子分析。因此,本文計算了各變量的四分相關(guān)系數(shù)(Tetrachoric correlation coefficient)矩陣,并基于該矩陣進行后續(xù)的因子分析[25]。在驗證性因子分析中,設(shè)定公因子數(shù)量為1。如果模型擬合狀況能夠滿足以下四項標準,則認為Katz量表具有良好的構(gòu)造效度:卡方值和自由度的比值(χ2/df)<3.0、比較擬合指數(shù)(CFI)≥0.95、Tucker-Lewis系數(shù)(TLI)≥0.95以及近似誤差均方根(RMSEA)≤0.05[23]。如果無法滿足以上條件,則需要進一步利用探索性因子分析來評估。Kaiser-Meyer-Olkin(KMO)≥0.80和Barlett球形檢驗顯著(P<0.05)是運行探索性因子分析的前提條件。在通過檢驗后,本文以主成分法分析數(shù)據(jù)。如果特征值大于1的成分個數(shù)為1,并且對組合方差的解釋比例較高,則說明Katz量表具有構(gòu)造效度。此外,由于SSAPUR 2015數(shù)據(jù)量大、分析設(shè)備運行能力有限,本文按性別、年齡和城鄉(xiāng)的樣本分布隨機抽取25%的樣本(36350人)后進行因子分析。共進行了6次隨機樣本抽取和因子分析,各次結(jié)果穩(wěn)定。限于篇幅,本文僅展示其中一次的分析結(jié)果。
其次,通過失能現(xiàn)患率和失能人數(shù)評估失能水平。本文計算了粗失能現(xiàn)患率和標準化現(xiàn)患率兩個指標。前者是樣本數(shù)據(jù)經(jīng)加權(quán)后的計算結(jié)果;后者通過結(jié)合2015年全國1%人口抽樣調(diào)查的性別和年齡構(gòu)成和粗失能現(xiàn)患率獲得,有利于減少樣本的性別和年齡結(jié)構(gòu)差異對失能水平的影響[3][8][26-31]。同時,本文提供了失能現(xiàn)患率的置信區(qū)間,用于判斷各調(diào)查之間是否存在顯著差異??紤]到失能人數(shù)對我國制定養(yǎng)老和長期照護政策的現(xiàn)實意義,本文還結(jié)合2015年全國65歲及以上老年人數(shù)和性別-年齡標準化失能率[32],估計了我國的失能老年人數(shù)。
再次,失能水平的影響因素分析。為了進一步探析各調(diào)查間老年人失能現(xiàn)患率差異出現(xiàn)的潛在原因,本文利用二分類Logistic回歸模型分析了因變量“老年人是否失能”與年齡、性別、居住地、受教育程度和婚姻狀況等變量之間的關(guān)系。
此外,SSAPUR 2015數(shù)據(jù)分析需要在指定場所完成,分析時使用了場所提供的PASW 18軟件;其他三項調(diào)查數(shù)據(jù)的分析使用Stata 15.0 MP完成。為了使結(jié)果具有更好的代表性,CHARLS 2015、CLASS 2014和CLHLS 2014數(shù)據(jù)分析中都使用了權(quán)重;SSAPUR 2015調(diào)查結(jié)果是近似自加權(quán),故未再使用權(quán)重[17]。
表2展示了四項社會調(diào)查中65歲及以上樣本的年齡、性別、居住地、受教育程度和婚姻狀況等基本特征的分布情況。CLHLS 2014樣本的老齡化程度最高,例如,CLHLS 2014中80歲及以上老年人比例為23.18%,高于其他調(diào)查中的相應(yīng)比例(18.83%至21.05%)。各調(diào)查中男性占比普遍低于女性。SSAPUR 2015和CLASS 2014中均有超過一半的樣本居住在城鎮(zhèn),而CHARLS 2015中城鎮(zhèn)樣本比例僅為31.05%、CLHLS 2014中為44.03%。SSAPUR 2015和CLASS 2014樣本受教育水平整體上高于其他調(diào)查樣本,表現(xiàn)為未上過學(xué)的比例更低、接受過中學(xué)及以上教育的比例更高。此外,四項調(diào)查中在婚者比例均在2/3左右。
表2 樣本分布特征及失能現(xiàn)患率(%)
四項調(diào)查中Katz量表的Cronbach’s α均大于0.80,說明具有較好的內(nèi)部一致性(表3)。驗證性因子分析中的CFI、TLI和RMSEA均滿足要求(表4)。χ2/df普遍高于6,這種情況在利用四分相關(guān)系數(shù)和最大似然估計進行驗證性因子的結(jié)果中比較常見[33]。盡管如此,為了確定構(gòu)造效度,本文進一步運行了探索性因子分析。結(jié)果顯示,各項調(diào)查數(shù)據(jù)的主成分分析結(jié)果均只有一個成分的特征值大于1,并且該成分對組合方差的解釋比例均高于87%。據(jù)此可以判定各調(diào)查數(shù)據(jù)中Katz量表
表3 Katz量表的信度檢驗
表4 Katz量表驗證性因子分析的模型擬合結(jié)果
的信度和構(gòu)造效度較好,可以使用計數(shù)法來估計失能現(xiàn)患率。
粗失能現(xiàn)患率在各調(diào)查數(shù)據(jù)之間存在顯著差異(表5)。其中,CLHLS 2014的值最低,為11.06%(95% CI:10.29%-11.83%),SSAPUR 2015(寬口徑)的值最高,為18.85%(95% CI:18.65%-19.05%)。經(jīng)性別-年齡標準化后,各調(diào)查的失能現(xiàn)患率均略有下降,但差異并未明顯減弱。標準化失能現(xiàn)患率最低為CLHLS 2014的10.21%(95% CI:9.47%-10.95%),最高為SSAPUR 2015(寬口徑)的18.07%(95% CI:17.88%-18.27%)。這表明樣本性別和年齡結(jié)構(gòu)不是差異的主要源頭。
表5 65歲及以上老年人的失能現(xiàn)患率(%)
不同失能等級的老年人數(shù)見表6。基于各調(diào)查數(shù)據(jù)的失能老年人數(shù)差異較大。其中,基于CLHLS 2014的失能老年人規(guī)模最?。?468萬),僅約為SSAPUR 2015(寬口徑)估計值的56.51%。失能老年人主要表現(xiàn)為輕度失能,占所有老年人的6.10%至11.66%。我國長期護理保險重點關(guān)注的重度失能老年人占所有老年人的1.46%至3.55%。如果以Katz量表結(jié)果推算,全國有資格享受長期護理保險待遇的重度失能老年人規(guī)模最低為SSAPUR 2015(窄口徑)中的209.43萬、最高為SSAPUR 2015(寬口徑)中的509.68萬。
表6 65歲及以上老年人分等級失能人數(shù)(萬)和標準化失能現(xiàn)患率(%)
表2顯示了年齡組、性別、居住地、受教育程度和婚姻狀況與老年人失能的雙變量分析結(jié)果。年齡大、女性、農(nóng)村、受教育程度低、未在婚的老年人具有更高的失能現(xiàn)患率。其中,CLHLS 2014城鎮(zhèn)老年人失能現(xiàn)患率高于農(nóng)村老年人屬于例外。
表7顯示了二分類Logistic回歸模型結(jié)果。在各模型中,年齡大、受教育程度低的老年人更有可能失能。在性別方面,CHARLS 2015和CLHLS 2014顯示,在控制其它變量的情況下,女性老年人失能的發(fā)生比顯著低于男性老年人,SSAPUR 2015得到了相反的結(jié)論,另外兩個模型中則不顯著。在居住地和婚姻狀態(tài)方面,情況也類似,即各模型中自變量與失能的關(guān)系在方向、大小和顯著性方面都存在差異。
表7 老年人失能的二分類Logistic回歸結(jié)果
本文利用CHARLS 2015、CLASS 2014、CLHLS 2014和SSAPUR 2015四項包含Katz量表的全國性社會調(diào)查數(shù)據(jù),比較分析了我國老年人的失能水平。研究通過Katz量表統(tǒng)一化和性別-年齡標準化等途徑增強了數(shù)據(jù)可比性。結(jié)果顯示,各調(diào)查數(shù)據(jù)中得出的失能水平存在顯著差異。
這種差異與以往研究結(jié)果一致[8-12,21]。它可能來自于多個方面。首先,各調(diào)查的抽樣方法和樣本代表性不盡相同。例如,CLHLS 2014采用了多階段不等比例目標隨機抽樣[11],CHARLS 2015采用了多階段、分層、PPS抽樣。理論上,CHALRS 2015樣本對全國老年人具有更好的代表性。其次,樣本構(gòu)成不同。各調(diào)查樣本的年齡組、性別、居住地、教育和婚姻狀況分布不同(表2),而這些變量又與失能水平密切相關(guān)(表7)。盡管本文通過估計標準化失能現(xiàn)患率抵消了性別和年齡的影響,但是教育和居住地等的影響仍然存在,部分群體樣本數(shù)量少對結(jié)果穩(wěn)定性的影響也難以消除。再次,調(diào)查中Katz量表呈現(xiàn)方式的差異,這一點在文獻綜述部分做了詳細分析。本文通過Katz量表統(tǒng)一化增強了可比性,但是,問題表述方式和測量時間范圍等差異在此階段已經(jīng)無法改變。第四,調(diào)查實施過程中諸如訪員培訓(xùn)、拒訪對象處理、訪問員提問方式等都可能造成差異。它們的程度和影響難以衡量。最后,現(xiàn)有文獻間的差異還可能是由研究者采用不同的分析策略造成的。本文由所有作者共同商定分析方案后,由第一和第二作者共同分析,并且互查分析命令,可以確保無此方面造成的差異。在以上各因素中,部分已在本文中得到解決,部分在調(diào)查完成后已經(jīng)無法再改變。
基于以往研究,各項調(diào)查整體上都具有或具有較好的全國代表性和數(shù)據(jù)質(zhì)量[16-19]。本文進一步顯示,各項調(diào)查中的Katz量表在Cronbach’s α和因子分析結(jié)果中都表現(xiàn)了良好的信度和效度。然而,每項調(diào)查都存在某些負面因素影響了通過Katz量表測量失能水平的有效性。這包括但不限于:CHARLS 2015的高齡和城鎮(zhèn)老年人的樣本量相對較?。籆LHLS 2014由于抽樣設(shè)計在理論上對全國老年人的代表性略有劣勢[11];除CHALRS 2015外,其他調(diào)查沒有為Katz量表設(shè)置失能測量時間;SSAPUR 2015將大小便控制拆分為兩個問題測量,備選項“有些困難”沒有明確指明是否需要幫助才能完成活動??紤]到以上因素,本文難以確定哪項調(diào)查是分析我國老年人失能水平的最優(yōu)數(shù)據(jù)。建議研究者根據(jù)研究目的選擇適合的數(shù)據(jù),例如,如果致力于分析高齡老年人,則CLHLS數(shù)據(jù)在樣本量上更具有優(yōu)勢。如果致力于通過分析整體失能水平為政策提供依據(jù),則建議同時使用多種數(shù)據(jù)來源,避免單一數(shù)據(jù)分析造成的偏倚。
無論是基于單數(shù)據(jù)來源的研究之間[17][19][21-22],還是基于多數(shù)據(jù)來源的研究之中[20],CHARLS 2015、CLASS 2014、CLHLS 2014和SSAPUR 2015四項調(diào)查數(shù)據(jù)得到的失能率都存在明顯差異。本文顯示,這種差異的范圍從CLHLS 2015的10.21%到SSAPUR(寬口徑)的18.07%。本文得到的失能率與其他利用相同數(shù)據(jù)來源的結(jié)果略有不同[17][19][21-22][28],這主要由分析策略不同造成的。一方面,本文為了使調(diào)查間結(jié)果具有可比性,選擇65歲及以上老年人為研究對象,其他研究則主要選擇60歲及以上老年人為研究對象。另一方面,各研究選擇的Katz量表測量題目、處理備選項和缺失值的方式不同。本文中SSAPUR 2015(寬口徑)和SSAPUR 2015(窄口徑)中失能現(xiàn)患率的差異也顯示了不同分析策略對估計失能現(xiàn)患率的重要性。正如上文所述,由于難以評判哪項調(diào)查數(shù)據(jù)是估計我國老年人失能現(xiàn)患率的最優(yōu)數(shù)據(jù),我們傾向于利用各調(diào)查結(jié)果的平均值來評估失能水平。那么,在我國65歲及以上老年人中,失能現(xiàn)患率在14.34%上下波動,失能人數(shù)在2061.54萬人上下波動。其中,國內(nèi)長期護理保險試點比較關(guān)注的重度失能現(xiàn)患率在2.48%上下波動,重度失能人數(shù)在356.88萬人上下波動[34-35]。
本文有如下不足之處。首先,各項調(diào)查數(shù)據(jù)的收集工作已經(jīng)完成,一些Katz量表測量的差異(例如,關(guān)于移動的提問方式)在此階段已經(jīng)無法再消除。因此,即便統(tǒng)一化處理后,各調(diào)查數(shù)據(jù)中的失能測量仍然不是完全可比的。其次,失能水平的準確測量涉及到從量表設(shè)計到調(diào)查實施的多個環(huán)節(jié)。由于缺少對調(diào)查實施細節(jié)等情況的了解,以及各項調(diào)查在失能測量中各有優(yōu)劣等情況,本文無法得出哪個數(shù)據(jù)庫最優(yōu)的結(jié)論。
總之,本文顯示2015年中國健康與養(yǎng)老追蹤調(diào)查(CHARLS 2015)、2014年中國老年社會追蹤調(diào)查(CLASS 2014)、2014年中國老年健康影響因素跟蹤調(diào)查(CLHLS 2014)和2015年中國城鄉(xiāng)老年人生活狀況抽樣調(diào)查(SSAPUR 2015)中基于Katz量表得到的失能水平存在顯著差異。這些差異是由各調(diào)查的抽樣方法、樣本構(gòu)成、Katz量表呈現(xiàn)方式、調(diào)查實施等因素造成的。由于各項調(diào)查均有優(yōu)劣之處,難以判定哪項調(diào)查數(shù)據(jù)是估計我國老年人失能水平的最優(yōu)數(shù)據(jù)。因此,建議研究者根據(jù)研究目的和各數(shù)據(jù)特色,選擇適合的數(shù)據(jù)來源。尤其是,在為長期照護保障制度和養(yǎng)老政策提供失能水平基礎(chǔ)數(shù)據(jù)時,盡量同時使用多種數(shù)據(jù)來源。