• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      護理研究中量表的研制過程與方法

      2024-05-30 10:19:14田建麗
      關(guān)鍵詞:樣本量效度信度

      李 青,田建麗

      (承德醫(yī)學(xué)院護理學(xué)院,河北承德 067000)

      護理領(lǐng)域中,量性研究者主要以量表或問卷作為研究工具,針對某感興趣的現(xiàn)象,對研究對象進行觀察性、描述性或干預(yù)性研究,以達到其研究目的。量表的選擇,是研究的關(guān)鍵或靈魂。然而,當(dāng)現(xiàn)有量表無法適用于新的概念或問題時,則有必要開發(fā)一套可靠的、有效的量表來測量所研究的現(xiàn)象[1,2]?;仡櫹嚓P(guān)文獻,盡管大部分護理研究者在量表研制過程中都能遵循社會學(xué)、心理學(xué)的量表研制一般準(zhǔn)則與方法,但不同學(xué)者在量表研制的具體過程中經(jīng)常采用不同的量表構(gòu)建和檢驗方法。相比調(diào)查問卷,量表需要經(jīng)過嚴(yán)謹(jǐn)?shù)男睦頊y量學(xué)檢驗才可用于實際研究。因此,本文對護理研究中量表的研制過程及主要方法進行梳理,為護理研究者進行量表研制或跨文化調(diào)適提供方法指導(dǎo)及參考。

      1 護理研究中量表的分類

      量性研究中概念的測量通常為多條目(或項目)的測量結(jié)構(gòu),依據(jù)概念與概念測量之間關(guān)系的性質(zhì),多條目測量量表通常分為反映性量表和形成性量表。反映性量表中,條目被視為是概念的反射或反映,條目之間相互關(guān)聯(lián),共同反映了概念本身或由概念引起。形成性量表中,條目可以構(gòu)建或定義概念的屬性,但條目不是概念的結(jié)果或由概念引起,因此條目之間不一定相互關(guān)聯(lián)。護理研究領(lǐng)域,大多數(shù)健康相關(guān)量表均為反映性量表。多條目反映性量表的研制過程通常包括量表的形成和量表的評價兩個階段[3-5]。

      2 量表的形成

      2.1 概念化

      量表研制應(yīng)該從對欲測內(nèi)容進行合理的概念化開始,以便量表中的各個條目可以完整地捕捉到概念內(nèi)容或其包含的維度。理論在對測量內(nèi)容的概念化方面發(fā)揮著重要的指導(dǎo)作用[6]。概念化也可通過相關(guān)文獻綜述或?qū)δ繕?biāo)人群進行訪談以及專家咨詢等建立概念框架[1,2]。對概念的解析還可以通過概念分析、概念綜合和概念衍生等方法來實現(xiàn)[7]。

      2.2 決定量表類型

      量表一般分為傳統(tǒng)匯總評分量表(或Likert型量表)和潛在特征量表[1]。量表研制所依據(jù)的測量理論主要有經(jīng)典測試?yán)碚摚╟lassical test theory, CTT)和項目反應(yīng)理論(item response theory, IRT)[4]。傳統(tǒng)匯總評分量表基于CTT,其條目被認(rèn)為是潛在測量概念的粗略可比性指標(biāo),條目的集合增強了量表獲得接近真實分?jǐn)?shù)的程度,量表測量所觀察到的分?jǐn)?shù)(X)是真實分?jǐn)?shù)(T)加誤差(e)的和[6]。潛在特征量表是基于IRT的,假設(shè)每個單獨的條目對潛在變量或欲測概念都有自己的特征敏感性,強調(diào)量表中條目的反應(yīng)水平,常用項目特征曲線表示,該曲線揭示了條目的難度和區(qū)分度。量表測量過程的設(shè)計和結(jié)果解釋需要基于相應(yīng)的測量框架,如常模參考測試或標(biāo)準(zhǔn)參照測試[8]。

      2.3 條目生成

      量表的各個條目應(yīng)具有單維性,即每個條目僅屬于一個分量表或維度,并且這些條目內(nèi)在同質(zhì),它們共同構(gòu)成對欲測概念操作性定義的測量[1]。一組好的條目應(yīng)該從與感興趣的概念相關(guān)的廣泛的條目領(lǐng)域中隨機選擇[6]。參考現(xiàn)有的相關(guān)量表和文獻、進行概念分析、實施質(zhì)性研究及臨床觀察等都可作為條目生成的來源[1,9]。

      2.4 決定條目特征

      條目一般包括題干和反應(yīng)選項兩部分。通常,Likert評分量表易于被受訪者者理解,尤其適用于對觀點、信念和態(tài)度等概念的測量,表現(xiàn)為一致性(非常不同意/同意)、頻率(從不/總是)、重要性(非常重要/不重要)、或可能性(極有可能/不可能)等的連續(xù)反應(yīng)選項[1,2],一般為5~7級評分。另外,Guttman評分量表常涉及一系列對所測概念屬性等級遞增水平的條目,它對條目進行排序,使同意某個條目的被試者也會同意其之前(或之后)的條目,例如兒童道德發(fā)展水平的測量等[6]。語義差異量表的選項主要由一系列相反的形容詞詞對組成(如好的與壞的、積極的與消極的),并被劃分為5~9個(一般為7個)等值的評定等級,用于測量概念的語義內(nèi)涵[8]。研究者應(yīng)根據(jù)所測概念的性質(zhì)選擇不同的反應(yīng)選項。

      一般在量表開發(fā)初期建立一個足夠大的條目池,美國學(xué)者DeVellis推薦條目池中的條目數(shù)量應(yīng)該是最終量表中條目數(shù)量的3~4倍,或至少比最終量表的條目數(shù)大50%[5,6]。量表中條目最好隨機排序,避免鄰近效應(yīng)(即對條目選項的反應(yīng)會受到其前一個條目選項反應(yīng)影響的趨勢)導(dǎo)致人為地夸大估計量表的內(nèi)部一致性[1]。條目編制時應(yīng)選擇與目標(biāo)人群的受教育程度和閱讀水平相符的詞語,避免模棱兩可的措辭、避免多重否定、避免過長的句子或短語、避免使用行業(yè)術(shù)語、避免雙重條目(即一個條目中表達了兩個或多個想法)等[1]。一般而言,針對大多數(shù)普通人群的量表在五至七年級的閱讀水平較為合適[6]。量表中反向條目的納入可以減少默認(rèn)反應(yīng)定勢(即受訪者傾向于同意所有的問題或者表示肯定的意思)的可能性[1]。然而,美國學(xué)者DeVellis認(rèn)為,量表中設(shè)置反向條目的利大于弊,因為對條目陳述極性的顛倒可能會讓受訪者感到困惑,且有許多反向條目的例子在實際應(yīng)用中表現(xiàn)并不好[6]。

      2.5 專家評價

      專家評價是量表開發(fā)的必要階段,它有助于最大限度地提高量表的內(nèi)容效度[1,6]。專家小組成員需選擇與所測概念和目標(biāo)人群研究領(lǐng)域相關(guān)的資深專家,并至少納入一名有量表研制經(jīng)驗的專家。專家組人數(shù)一般為3~5人[10],國內(nèi)文獻較多采用德爾菲專家函詢法納入10~20名咨詢專家對條目池內(nèi)容進行篩選[11-13]。通常,每位專家應(yīng)對每個條目的措辭是否清晰簡潔,條目與每個維度的相關(guān)性,各維度與概念的相關(guān)性,以及條目是否適合目標(biāo)人群等內(nèi)容進行評價[1,6]。

      數(shù)據(jù)收集后,需計算量表內(nèi)容效度指數(shù)(content validity index,CVI) ,包括條目CVI(I-CVI)和量表CVI(S-CVI)。I-CVI的計算方法為對相關(guān)性評分為1~4分的量表條目,評分為3或4分的專家人數(shù)除以專家總?cè)藬?shù),即專家對相關(guān)性達成一致的比例??紤]機會一致性風(fēng)險,當(dāng)有5~8名專家時,I-CVI低于0.78的條目應(yīng)進行修改或舍棄[1]。當(dāng)專家人數(shù)≤4時,I-CVI應(yīng)達到1.00。S-CVI有兩種計算方法,首選平均S-CVI(S-CVI/Ave),即量表中所有條目I-CVI的平均值;另一種是專家普遍一致性S-CVI(universal agreement among experts,S-CVI/UA),它是所有專家評分為3或4分的條目數(shù)量除以總條目數(shù)量的比例[14]。一般S-CVI/Ave≥0.9及S-CVI/UA≥0.8即可[14,15]。另外,Cohen系數(shù)kappa(k)也是量表內(nèi)容效度測量的有效方法,它是對機會一致性進行調(diào)整后的評價者間一致性共識指數(shù),是對CVI的重要補充[14,16]。

      2.6 預(yù)測試

      預(yù)測試(或預(yù)調(diào)查)主要對量表在其實施過程中可能出現(xiàn)的問題進行早期識別和處理,其涉及的樣本量較小,一般為20~150人[1,2],也有學(xué)者納入正式調(diào)查時目標(biāo)人群樣本量的10%作為預(yù)測試的樣本量。量表內(nèi)容的復(fù)雜性越大,樣本量越大;目標(biāo)人群的同質(zhì)性越大,樣本量也越大。數(shù)據(jù)分析時,研究者可進行條目初步分析,對無應(yīng)答率高的條目、變異性差的條目、選中間選項多的條目以及極端選項比例高(地板效應(yīng)或天花板效應(yīng))的條目應(yīng)考慮刪除或修改。

      3 量表的評價

      3.1 現(xiàn)場測試

      現(xiàn)場測試旨在評估量表的心理測量學(xué)特征。其樣本應(yīng)充分代表目標(biāo)人群,并具有一定的異質(zhì)性(如年齡、教育背景、種族等差異),樣本量需足夠大[1,6]。Nunally認(rèn)為[2,6],300例的樣本量足以支持因子分析,而其他學(xué)者則建議受試者與條目的比率應(yīng)在3:1至20:1之間,其中10:1被廣泛采納。在測量量表的重測信度時,其重測樣本可以采用較小的樣本量,如50~200例[17]。調(diào)查內(nèi)容除量表本身外,還應(yīng)對受試者的一般人口學(xué)資料進行調(diào)查,或增加評估量表結(jié)構(gòu)效度時可能需要測量的其他概念或變量的相關(guān)問卷或量表。一些自填式問卷可能受到社會贊許效應(yīng)(即受訪者傾向在調(diào)查中以不實意愿取代其真實意愿,以符合社會期望)的影響,產(chǎn)生不同程度的報告偏倚。通過聲明量表并無正確或錯誤答案之分,可從一定程度上最小化受試者社會贊許效應(yīng)。采用社會贊許效應(yīng)量表,如馬洛-克勞恩社會贊許效應(yīng)量表(the marlowe crowne social desirability scale, MCSDS)可評估該效應(yīng)對量表條目的影響程度[6]。

      3.2 心理測量學(xué)評估

      3.2.1 條目分析 基于CTT,條目之間的相關(guān)性可以反映條目與所測概念真實分?jǐn)?shù)之間的相關(guān)性。通過條目間相關(guān)系數(shù)矩陣可分析條目間相關(guān)程度,條目-量表相關(guān)系數(shù)常采用校正后系數(shù)。通常,相關(guān)系數(shù)為0.30~0.70的條目性能較好,予以保留[1]。此外,計算每個條目的均值和方差,也是一種有用的條目性能檢查方法。若條目得分均值偏于一個或另一個極端值,說明該條目的區(qū)分度較差[1]。若條目具有相對較大的方差,說明其樣本的異質(zhì)性較好[6]。也可采用臨界比值法從條目的區(qū)分度方面篩選條目[18]。

      3.2.2 信度分析 信度是指量表測量結(jié)果的可靠性、穩(wěn)定性和一致性。內(nèi)部一致性信度反映量表條目之間的一致程度,與條目的同質(zhì)性有關(guān),主要采用克朗巴赫α系數(shù)進行評價,條目間相關(guān)性越大,α系數(shù)越高[1,6]。對于二分類式選項的量表,應(yīng)采用Kuder-Richardson公式20(KR-20)計算該信度,它是α系數(shù)的特殊版本[3,6]。通常,量表信度系數(shù)在0.70左右即可接受(尤其對于分量表而言),但系數(shù)為0.80及以上則更好[1];若大于0.90,應(yīng)考慮精簡量表的條目數(shù)量[6]。但對用于醫(yī)療診斷、學(xué)業(yè)成績評定等領(lǐng)域的量表,其信度系數(shù)應(yīng)為0.90及以上[1,6]。增加量表的條目可提高其內(nèi)部一致性信度[6]。也有學(xué)者推薦采用系數(shù)ω(coefficient omega,ω) 評價內(nèi)部一致性信度,因為它使用條目共享的公共因子上的條目載荷矩陣來計算相關(guān)方差,比α系數(shù)的計算方法更準(zhǔn)確[2,6],但其計算過程較為復(fù)雜,目前仍未被廣泛使用。

      重測信度反映量表在一段時間內(nèi)重復(fù)測量時得分的穩(wěn)定性[1,3]。其假說為,對屬性不易改變的概念進行測量,受試者在兩次測試中的得分差異都來自于測量誤差,分?jǐn)?shù)差異越小,信度越高。護理研究者常采用皮爾遜相關(guān)系數(shù)(r)估計重測信度,但心理測量學(xué)家更推薦組內(nèi)相關(guān)系數(shù)(the intraclass correlation coefficient,ICC)作為重測信度的首選指標(biāo)[1]。在實踐中,重測信度并不適用于所有情況,許多概念或特征(如態(tài)度、知識、技能等)的確會隨著時間的推移而改變;如果被測因素確實發(fā)生了變化,重復(fù)測量的結(jié)果其實并不是對信度的測量。另外,記憶干擾也會導(dǎo)致可能虛高的重測信度值。因此,應(yīng)基于被測概念屬性的可變性、測量過程的復(fù)雜性和參與者的特征來確定兩次測量之間的最佳時間間隔,一般為1~2周[3,17]。

      平行測試信度涉及在兩個不同場合,對相同的受試者,使用測量同一概念的兩個平行(或替代)量表進行測試,然后評價兩次測試結(jié)果的一致程度,即組內(nèi)相關(guān)系數(shù)ICC[1]。當(dāng)研究人員希望在短時間內(nèi)完成測量并希望避免受試者對條目的記憶干擾時,可采用此方法。在護理領(lǐng)域,由于量表的平行版本較難獲得,很少有量表研制者進行平行測試信度分析。分半信度(或折半信度)采用與平行測試相同的邏輯,評價單個量表中一半條目與另一半條目之間的關(guān)系,它是確定量表內(nèi)部一致性的原始方法[3]。但分半信度可能存在因分半方法不同產(chǎn)生不同信度系數(shù)的問題。

      3.2.3 效度分析 效度反映量表的準(zhǔn)確度、正確性和有效性,它是指某量表是否有效地測量到了它想要測量的內(nèi)容,即實際測量結(jié)果與預(yù)想結(jié)果的符合程度[1,6]。表面效度是指量表看起來是否是在測量目標(biāo)概念。盡管它常常不被認(rèn)為是量表的關(guān)鍵測量特性,但它可以是內(nèi)容效度的先驅(qū)或一個方面[1,3]。內(nèi)容效度是指量表條目充分捕捉被測概念結(jié)構(gòu)的程度,涉及條目抽樣的充分性,比表面效度具有更結(jié)構(gòu)化和更嚴(yán)格的程序[1,6]。內(nèi)容效度的評價方法已在專家評價部分闡述。

      結(jié)構(gòu)效度,是指量表測量結(jié)果與設(shè)計該量表時所假定的理論(概念和關(guān)系)之間的符合程度。當(dāng)一個概念存在多個子主題時,結(jié)構(gòu)效度可評價量表是否有對應(yīng)的各維度和條目來準(zhǔn)確對應(yīng)各子主題[1,3]。該方法適用于反映較為抽象概念的量表,也被廣泛認(rèn)為是量表研制過程不可或缺的重要環(huán)節(jié)[2]。結(jié)構(gòu)效度的檢驗方法通常有兩種:因子分析和假設(shè)檢驗效度。因子分析包括探索性因子分析(exploratory factor analysis,EFA)和驗證性因子分析(confirmatory factor analysis,CFA)。通常,EFA有助于提出一個概念的基本結(jié)構(gòu)框架,而CFA可對該框架的有效性或模型的擬合度進行評價[6,8]。假設(shè)檢驗效度關(guān)注在多大程度上可以證實關(guān)于量表測量的分?jǐn)?shù)與其他概念(或同一概念)的測量分?jǐn)?shù)相關(guān)的假設(shè),分為聚合效度、區(qū)分效度和已知群體效度[1]。

      準(zhǔn)則效度(或效標(biāo)效度)是指量表得分與某種外部準(zhǔn)則(或效標(biāo))間的關(guān)聯(lián)程度[1]。量表與準(zhǔn)則之間須在實踐經(jīng)驗上有一定聯(lián)系[6]。準(zhǔn)則效度有兩種類型,即同時效度和預(yù)測效度[1]。效度分析依數(shù)據(jù)類型不同而采取不同的統(tǒng)計分析方法,如相關(guān)分析、回歸分析、敏感性、特異性、t檢驗、受試者工作特征曲線(receiver operating characteristic curve,ROC)、ROC產(chǎn)生的曲線下面積指數(shù)等[19]。然而,當(dāng)概念較為抽象時,往往很難找到一個合適的準(zhǔn)則進行比較,該方法在護理領(lǐng)域的應(yīng)用相對缺乏。

      3.3 量表的優(yōu)化與驗證

      對量表進行心理測量學(xué)評估后,還應(yīng)根據(jù)其分析結(jié)果修訂與完善量表條目。若內(nèi)部一致性信度系數(shù)α較低,應(yīng)考慮修改或添加條目,但決定條目的去留還應(yīng)綜合考慮其內(nèi)容本身或CVI值。量表研制的最后環(huán)節(jié)是最終量表的驗證,其方法有CFA、假設(shè)檢驗效度和準(zhǔn)則效度分析。若因條件有限無法開展單獨的驗證研究時,量表開發(fā)者應(yīng)盡量利用現(xiàn)場測試研究的樣本數(shù)據(jù)開展其他恰當(dāng)?shù)男Ф葴y試研究[1]。但當(dāng)量表進行EFA分析時納入的樣本量較少(<150例)時,選擇目標(biāo)人群的其他單獨樣本進行CFA將有助于解釋量表的可推廣性[6]。

      猜你喜歡
      樣本量效度信度
      醫(yī)學(xué)研究中樣本量的選擇
      《廣東地區(qū)兒童中醫(yī)體質(zhì)辨識量表》的信度和效度研究
      慈善募捐規(guī)制中的國家與社會:兼論《慈善法》的效度和限度
      航空裝備測試性試驗樣本量確定方法
      Sample Size Calculations for Comparing Groups with Binary Outcomes
      科技成果評價的信度分析及模型優(yōu)化
      體育社會調(diào)查問卷信度檢驗的方法學(xué)探索——基于中文核心體育期刊163篇文章分析
      被看重感指數(shù)在中國大學(xué)生中的構(gòu)念效度
      外語形成性評估的效度驗證框架
      中文版腦性癱瘓兒童生活質(zhì)量問卷的信度
      南雄市| 饶平县| 车险| 双峰县| 文安县| 通山县| 兴仁县| 新化县| 天津市| 盘山县| 台州市| 青神县| 平南县| 常山县| 江永县| 盈江县| 浪卡子县| 修文县| 灯塔市| 连州市| 清苑县| 鹰潭市| 安多县| 称多县| 宜兰县| 溧阳市| 高密市| 志丹县| 安化县| 太原市| 南岸区| 保定市| 商城县| 宁乡县| 五家渠市| 南乐县| 康马县| 柳林县| 西华县| 无棣县| 察隅县|