楊莉萍 亓立東 張 博
·研究方法(Research Method)·
質(zhì)性研究中的資料飽和及其判定*
楊莉萍 亓立東 張 博
(南京師范大學(xué)心理學(xué)院, 南京 210024)
在質(zhì)性研究中, 資料飽和通常被用以評(píng)估研究資料的充足性。但在研究實(shí)踐中, 資料飽和卻存在概念模糊及操作性問(wèn)題。作為某項(xiàng)質(zhì)性研究所抽取的樣本量已滿足研究需要的標(biāo)志, 按照在研究過(guò)程中判定時(shí)點(diǎn)的先后順序, 資料飽和可劃分為數(shù)據(jù)飽和、編碼或主題飽和、意義飽和及理論飽和4種主要形式。4種形式的資料飽和各有其特定的內(nèi)涵、評(píng)估方式和判定標(biāo)準(zhǔn)。研究認(rèn)為, 達(dá)到資料飽和的樣本量標(biāo)準(zhǔn)不應(yīng)統(tǒng)一設(shè)定, 其檢驗(yàn)需嵌入具體的研究過(guò)程; 資料飽和存在邏輯上的不確定性, 適度追加抽樣有助于進(jìn)一步確認(rèn); 資料飽和作為考察研究質(zhì)量的一項(xiàng)重要指標(biāo), 并不適用于所有質(zhì)性研究。
質(zhì)性研究, 資料飽和, 判別方式, 判定標(biāo)準(zhǔn)
自2018年1月中國(guó)心理學(xué)會(huì)心理學(xué)質(zhì)性研究專(zhuān)業(yè)委員會(huì)正式設(shè)立以來(lái), 采用質(zhì)性研究及混合研究方法的論文大量增加。在質(zhì)性研究中, 與量化研究一樣, 樣本充足是研究效度的基本保證(Curtis et al., 2000)。樣本量不足會(huì)影響研究質(zhì)量, 而樣本量過(guò)大又會(huì)浪費(fèi)研究資源。資料飽和則是質(zhì)性研究中樣本量適當(dāng)?shù)臉?biāo)志。研究過(guò)早終止數(shù)據(jù)搜集, 達(dá)不到資料飽和, 會(huì)導(dǎo)致研究結(jié)果缺乏必要的洞見(jiàn)性, 淪為對(duì)原始數(shù)據(jù)的簡(jiǎn)單呈現(xiàn)(蘇達(dá)比, 2006/2016)。達(dá)到資料飽和意味著在當(dāng)前所搜集和分析的資料基礎(chǔ)上, 進(jìn)一步的數(shù)據(jù)搜集不會(huì)幫助研究者對(duì)故事或理論產(chǎn)生更深入的理解, 因此沒(méi)有必要繼續(xù)搜集和分析數(shù)據(jù)(Corbin & Strauss, 2014)。這里需要特別說(shuō)明的是, 與量化研究不同, 質(zhì)性研究中的資料搜集和資料分析并不是兩個(gè)截然劃分的研究階段, 而是呈現(xiàn)循環(huán)往復(fù)的特點(diǎn)。質(zhì)性研究中的資料飽和往往是在對(duì)前期所搜集的資料進(jìn)行分析的基礎(chǔ)上所做出的判斷。而一旦資料搜集達(dá)到飽和, 就意味著資料分析也同時(shí)告一段落。
以往多以?xún)煞N方式判定質(zhì)性研究的樣本量, 或依據(jù)經(jīng)驗(yàn)法則, 或通過(guò)資料飽和檢驗(yàn)(Marshall et al., 2013)?;诮?jīng)驗(yàn)法則, 已有研究總結(jié)出了不同類(lèi)型質(zhì)性研究適合的樣本量, 但是這類(lèi)文獻(xiàn)大多缺乏對(duì)基本原理的清晰描述, 其所建議的樣本量標(biāo)準(zhǔn)往往差異很大。例如, 在研究者給出的建議中, 扎根理論研究的訪談樣本量范圍在5~35之間, 而案例研究(case study)的樣本量范圍則是在4~30之間(Sim et al., 2018)。更有研究者認(rèn)為, 由于質(zhì)性研究的特征以及不同研究之間的差異性, 為質(zhì)性研究設(shè)置統(tǒng)一的樣本量標(biāo)準(zhǔn)缺乏理論與現(xiàn)實(shí)依據(jù)(Guest et al., 2006; Marshall et al., 2013)。
將資料飽和作為質(zhì)性研究中停止數(shù)據(jù)搜集和分析的方法論原則被廣泛接納與使用(Saunders et al., 2018)。資料飽和甚至被奉為確定質(zhì)性研究樣本量的“黃金準(zhǔn)則”與“行動(dòng)指南” (Guest et al., 2006), 以及質(zhì)性研究質(zhì)量的“保證書(shū)” (Morse, 2015)。如有研究者提出, 在質(zhì)性研究中, 評(píng)估抽樣充分性的最常見(jiàn)標(biāo)準(zhǔn)是資料飽和(Fusch & Ness, 2015; Morse, 2015); 同時(shí), 資料飽和也是評(píng)判質(zhì)性研究學(xué)術(shù)論文質(zhì)量的重要準(zhǔn)則(Hennink et al., 2017); 恰當(dāng)使用資料飽和標(biāo)準(zhǔn)可以提高質(zhì)性研究的質(zhì)量, 如嚴(yán)謹(jǐn)性、信效度等(Hennink et al., 2019; O’reilly & Parker, 2013; Sim et al., 2018)。美國(guó)心理協(xié)會(huì)出版物和通訊委員會(huì)關(guān)于質(zhì)性研究的期刊文章報(bào)告標(biāo)準(zhǔn)工作組在制定心理學(xué)質(zhì)性研究期刊論文報(bào)告標(biāo)準(zhǔn)時(shí)也指出, 研究者應(yīng)該說(shuō)明確定研究樣本量的依據(jù), 并建議對(duì)資料飽和進(jìn)行檢驗(yàn)(Levitt et al., 2018)。
盡管資料飽和的概念與作用受到質(zhì)性研究者的廣泛認(rèn)同并被不斷提及, 但在實(shí)際操作過(guò)程中, 這一概念和判定標(biāo)準(zhǔn)卻始終含糊不清(Hennink et al., 2017), 長(zhǎng)期存在一系列概念性與操作化問(wèn)題(Saunders et al., 2018)。一方面, 資料飽和的概念源于扎根理論, 最初以理論飽和(theoretical saturation)的形式出現(xiàn)(Glaser & Strauss, 1967)。但隨著資料飽和作為質(zhì)性研究樣本量判斷標(biāo)準(zhǔn)的推廣, 又發(fā)展出多種指標(biāo), 例如數(shù)據(jù)飽和(data saturation)、編碼飽和(code saturation)、主題飽和(thematic saturation)、意義飽和(meaning saturation)等。由于飽和的形式和標(biāo)準(zhǔn)多樣, 不同形式和標(biāo)準(zhǔn)之間既有差異又相互聯(lián)系, 關(guān)系錯(cuò)綜復(fù)雜, 以至于很少有研究者能夠系統(tǒng)深入地理解和掌握資料飽和的概念, 在使用過(guò)程中常常出現(xiàn)混亂(O’Reilly & Parker, 2013)。另一方面, 在眾多研究報(bào)告中, 研究者都聲稱(chēng)該研究以資料飽和作為樣本量的判斷標(biāo)準(zhǔn), 且已達(dá)到資料飽和, 但是卻極少說(shuō)明達(dá)到的是哪種資料飽和、其判斷方式及合理性(Constantinou et al., 2017; Morse, 2015)。有研究者因而提出, 應(yīng)增加對(duì)質(zhì)性研究中資料飽和報(bào)告的透明度, 在作者宣稱(chēng)達(dá)到了資料飽和的同時(shí), 需要提供更加細(xì)致的描述, 明確資料飽和的形式、判定方式與依據(jù), 以便于讀者評(píng)估和進(jìn)一步驗(yàn)證, 這也是對(duì)質(zhì)性研究規(guī)范意識(shí)的基本要求(Fusch & Ness, 2015; Henninket al., 2017; Kerr et al., 2010; Malterud et al., 2016)。但由于以往研究尚缺乏對(duì)資料飽和判定及報(bào)告的操作化描述與實(shí)踐性指導(dǎo)(Carlsen & Glenton, 2011; Hennink et al., 2019), 要求研究者做到這些并不現(xiàn)實(shí)??紤]到資料飽和對(duì)于質(zhì)性研究的重要性及操作現(xiàn)狀, 有必要對(duì)各種不同形式的資料飽和的定義、判定標(biāo)準(zhǔn)與報(bào)告方式加以探究與說(shuō)明, 以幫助研究者更好地理解與使用資料飽和的概念, 使對(duì)質(zhì)性研究樣本量的判斷有據(jù)可循, 從而提高心理學(xué)中質(zhì)性研究的規(guī)范性和研究質(zhì)量。
本研究基于對(duì)資料飽和相關(guān)文獻(xiàn)的研究及作者團(tuán)隊(duì)長(zhǎng)期開(kāi)展質(zhì)性研究的實(shí)踐經(jīng)驗(yàn), 試圖明確質(zhì)性研究中資料飽和的概念, 厘清不同形式的資料飽和, 通過(guò)比較、明確不同形式的資料飽和之間的關(guān)系, 探索質(zhì)性研究資料飽和的判定及報(bào)告方式, 以期為質(zhì)性研究中資料飽和的判斷提供參考。
資料飽和是一項(xiàng)質(zhì)性研究所抽取的樣本量已滿足研究需要的標(biāo)志。最早提出資料飽和問(wèn)題的是扎根理論, 所采用的判斷標(biāo)準(zhǔn)是理論飽和(Glaser & Strauss, 1967)。但隨著質(zhì)性研究的發(fā)展, 資料飽和的概念不再局限于扎根理論提出的理論飽和, 而是進(jìn)一步發(fā)展出了包括數(shù)據(jù)飽和、編碼或主題飽和、意義飽和等在內(nèi)的多種形式的資料飽和概念。不同形式的資料飽和其意涵、指向、所使用的分析手段及判定標(biāo)準(zhǔn)各不相同(Saunders et al., 2018)。
在質(zhì)性研究中, 扎根理論最早提出了研究資料的飽和問(wèn)題。扎根理論是在系統(tǒng)搜集資料的基礎(chǔ)上, 尋找反映社會(huì)現(xiàn)象的核心概念, 通過(guò)在這些概念之間建立聯(lián)系而形成理論的一種研究方法(陳向明, 2000)。扎根理論研究的主旨在于建構(gòu)理論, 作為研究結(jié)果, 所建構(gòu)的理論在其內(nèi)部及其與外部相關(guān)理論之間需要獲得一致性和協(xié)調(diào)性?;诖? 扎根理論的創(chuàng)始人Glaser和Strauss (1967)最早提出了理論飽和的概念, 并將其解釋為“如果繼續(xù)追加抽樣, 不會(huì)再有新的類(lèi)屬或相關(guān)主題出現(xiàn)”。
扎根理論中的理論飽和概念是指在數(shù)據(jù)搜集過(guò)程中已發(fā)展不出新的主題(issues)或理解(insights),所有相關(guān)概念類(lèi)屬(conceptual categories)的屬性及其之間的關(guān)系都已被探討、窮盡和確定, 繼續(xù)獲取數(shù)據(jù)資料已不能揭示新屬性, 也不能獲得對(duì)于新生理論(emerging theory)更深入的理解, 新的理論已全面、可信(Hennink et al., 2017; Morse, 2015)。Hennink等(2019)指出, 理論飽和依賴(lài)樣本的充分性, 要求研究者盡可能發(fā)現(xiàn)充足的、豐富的、合乎邏輯的、有意義的數(shù)據(jù), 以此支持新生理論。Saunders等(2018)則認(rèn)為, 當(dāng)所有表征理論的概念都充分反映在了數(shù)據(jù)中時(shí), 便達(dá)到了理論飽和。
扎根理論對(duì)理論飽和的判斷植根于質(zhì)性研究循環(huán)往復(fù)、螺旋式演進(jìn)的過(guò)程, 與扎根理論對(duì)理論抽樣(theoretical sampling)的要求緊密相關(guān)(Saunders et al., 2018)。在扎根理論研究過(guò)程中, 資料搜集到一定程度, 并且經(jīng)歷了編碼、比較、歸類(lèi)、再比較等資料分析過(guò)程之后, 初步勾勒出了新生理論的輪廓, 以此指導(dǎo)研究者進(jìn)一步實(shí)施理論抽樣, 然后基于新搜集的資料, 檢驗(yàn)、改進(jìn)和完善新生理論, 如此循環(huán)演進(jìn), 逐步去除新生理論中的薄弱環(huán)節(jié)。這是一個(gè)將新生理論返回原始資料進(jìn)行比較、驗(yàn)證, 不斷優(yōu)化, 使之完善的持續(xù)性過(guò)程(陳向明, 2000)。直到新生理論基本可以解釋所有的資料, 研究者已不能從資料中繼續(xù)發(fā)掘新的表征理論的相關(guān)概念, 而只是重復(fù)表征已有概念或?qū)傩? 這時(shí)便視為達(dá)到了理論飽和, 可停止抽樣。
有研究者指出, 在扎根理論研究過(guò)程中, 在理論抽樣的驅(qū)動(dòng)下, 概念類(lèi)屬或新生理論循環(huán)演進(jìn), 不斷完善, 當(dāng)概念類(lèi)屬之間的關(guān)系及其含義逐漸清晰時(shí), 就達(dá)到了理論飽和(Morse, 2015)。由此可以看出, 理論飽和是基于理論完整性進(jìn)行的飽和度判斷, 判斷的時(shí)點(diǎn)在資料搜集和分析的后期階段, 具有較高的理論概括性水平(Saunders et al., 2018)。
數(shù)據(jù)飽和是指隨著資料搜集的進(jìn)程, 不再有新的數(shù)據(jù)產(chǎn)生, 逐漸出現(xiàn)了信息冗余。例如, 在訪談中, 研究者不斷重復(fù)聽(tīng)到同樣的敘述, 以此判斷已達(dá)到數(shù)據(jù)飽和, 因而停止數(shù)據(jù)搜集(Grady, 1998; Jackson et al. 2015)。數(shù)據(jù)飽和關(guān)注是否還會(huì)有新的信息出現(xiàn), 是在數(shù)據(jù)搜集階段對(duì)資料飽和的判斷。數(shù)據(jù)搜集處于整個(gè)研究過(guò)程的相對(duì)早期階段, 研究者基于“在隨后的資料分析階段, 某些主題可能會(huì)出現(xiàn)”這一預(yù)設(shè)做出判斷。但這種判斷往往并不準(zhǔn)確, 因?yàn)樵跀?shù)據(jù)分析過(guò)程中, 各種編碼、編碼屬性及編碼之間的關(guān)系還會(huì)不斷變化, 包括資料分析過(guò)程中編碼的合并、意義擴(kuò)充、意義排除等(Saunders et al., 2018)。所以, 僅以數(shù)據(jù)飽和作為資料飽和的判斷標(biāo)準(zhǔn)存在較為明顯的弊端。
編碼或主題飽和有時(shí)也被稱(chēng)為類(lèi)屬飽和(categories saturation), 這一概念表示在數(shù)據(jù)分析過(guò)程中, 編碼或主題范圍已基本確定, 從新搜集的數(shù)據(jù)中只能發(fā)掘出與已有編碼或主題相重復(fù)的內(nèi)容, 不再有新的編碼或主題出現(xiàn), 編碼書(shū)(codebook)已相對(duì)穩(wěn)定(Urquhart, 2012; Hennink et al., 2017)。編碼或主題飽和關(guān)注在數(shù)據(jù)分析階段所產(chǎn)生的編碼或主題在類(lèi)屬上的重復(fù)性, 其判斷標(biāo)準(zhǔn)為在數(shù)據(jù)分析過(guò)程中再無(wú)新的編碼或主題出現(xiàn)。
編碼或主題飽和與數(shù)據(jù)飽和相比可靠性有所進(jìn)步。編碼已經(jīng)進(jìn)入對(duì)數(shù)據(jù)的分析, 而主題則是編碼達(dá)到一定水平之后出現(xiàn)的結(jié)果。相比數(shù)據(jù)飽和僅僅根據(jù)數(shù)據(jù)或資料本身的重復(fù)性做出判斷, 編碼或主題飽和已經(jīng)將一定程度的分析納入其中。但以編碼或主題重復(fù)作為資料飽和的判斷依據(jù)仍然有問(wèn)題, 也容易出現(xiàn)虛假飽和, 導(dǎo)致所獲取的信息或資料不足以建構(gòu)起完善的理論。這是因?yàn)榫幋a或主題飽和僅僅提供了研究問(wèn)題的大致輪廓, 往往通過(guò)較少的訪談就能達(dá)到(Saunders et al., 2018)。因此, 只達(dá)到編碼或主題飽和還不夠, 仍需要增加更多數(shù)據(jù), 以便研究者充分理解問(wèn)題的深度、豐富性和復(fù)雜性(Emmel, 2015; Hennink et al., 2017)。
與數(shù)據(jù)飽和一樣, 編碼或主題飽和僅僅評(píng)估了編碼或主題在類(lèi)屬或出現(xiàn)頻度上的飽和, 即只是基于所搜集材料的廣度和范圍進(jìn)行飽和度判斷, 缺少對(duì)于編碼或主題的意義評(píng)估。當(dāng)某一主題首次從資料中浮現(xiàn), 研究者往往并不一定能達(dá)到對(duì)該主題的深入理解, 還需要進(jìn)一步搜集與分析數(shù)據(jù), 以發(fā)展對(duì)于主題或概念類(lèi)屬更為豐富和深刻的認(rèn)識(shí)(Hennink et al., 2017; Kerr et al., 2010)。
意義飽和是指在數(shù)據(jù)搜集和分析過(guò)程中, 研究者已充分理解了所發(fā)展出的一系列編碼或主題,關(guān)于編碼或主題的含義及其之間的關(guān)系不再出現(xiàn)新的信息(Hennink et al., 2017)。Hennink等(2017)認(rèn)為, 要達(dá)到意義飽和需要一個(gè)循環(huán)演進(jìn)的抽樣、搜集資料、分析資料的過(guò)程, 持續(xù)監(jiān)測(cè)數(shù)據(jù)的多樣性、清晰度和深度, 強(qiáng)調(diào)針對(duì)目前尚缺乏理解的信息、編碼或主題進(jìn)行數(shù)據(jù)搜集。意義飽和是在數(shù)據(jù)搜集和分析過(guò)程中基于編碼或主題意義的完整性進(jìn)行的資料飽和判斷, 著重于對(duì)資料的深度理解。使用這一指標(biāo)判斷飽和度, 有利于發(fā)掘和呈現(xiàn)資料的完整意義。
Hennink等(2017)比較了編碼飽和與意義飽和, 結(jié)果發(fā)現(xiàn), 在總共進(jìn)行的25人次的深度訪談中, 在第9次訪談達(dá)到了編碼飽和, 亦即將所有編碼識(shí)別出來(lái), 確定了主要命題(thematic issues)的范圍。然而, 需要16~24次訪談才能達(dá)到意義飽和, 即研究者真正認(rèn)識(shí)了編碼的含義, 對(duì)研究問(wèn)題有了豐富理解。Hennink等認(rèn)為, 編碼飽和僅代表著“聽(tīng)到過(guò)(heard it all)”, 而達(dá)到意義飽和需要“理解了(understand it all)”。這再次說(shuō)明, 在進(jìn)行飽和度檢驗(yàn)時(shí), 僅僅依靠“有些編碼或主題開(kāi)始重復(fù)出現(xiàn), 不能繼續(xù)發(fā)現(xiàn)其他新的編碼或主題(Kerr et al., 2010)”作為判斷標(biāo)準(zhǔn)是不夠的, 還應(yīng)該繼續(xù)判定每一個(gè)編碼或主題的定義與內(nèi)容是否得到了充足的發(fā)掘與認(rèn)識(shí), 即“對(duì)每一個(gè)編碼或主題的解釋維度或理解開(kāi)始重復(fù)出現(xiàn), 不再發(fā)現(xiàn)對(duì)編碼或主題的其他解釋, 編碼或主題因此達(dá)到了意義飽和”。
以上4種形式的資料飽和, 關(guān)注了質(zhì)性研究資料搜集和分析過(guò)程中的信息冗余或理論內(nèi)涵(Sim et al., 2018), 它們分別出現(xiàn)在研究過(guò)程的不同階段(Saunders et al., 2018)。數(shù)據(jù)飽和直接關(guān)注資料搜集過(guò)程; 編碼或主題飽和則基于對(duì)數(shù)據(jù)的初步分析; 意義飽和在數(shù)據(jù)搜集和分析(質(zhì)性研究數(shù)據(jù)搜集與分析常常同時(shí)或滾動(dòng)進(jìn)行)的基礎(chǔ)上, 進(jìn)一步注重資料分析的深度; 而理論飽和則關(guān)注更高水平的理論建構(gòu), 強(qiáng)調(diào)在理論建構(gòu)過(guò)程中對(duì)概念類(lèi)屬及其屬性(理論含義)發(fā)掘的充分性。
不同形式的資料飽和其判斷的側(cè)重點(diǎn)不同。數(shù)據(jù)飽和、編碼或主題飽和基于數(shù)據(jù)、編碼或主題的重復(fù)或出現(xiàn)頻度進(jìn)行判斷; 意義飽和基于編碼或主題的意義深度進(jìn)行判斷; 理論飽和基于新生理論中各概念屬性的完整性、新生理論的自洽性及新生理論與以往理論的一致性進(jìn)行判斷。總的來(lái)說(shuō), 數(shù)據(jù)飽和、編碼或主題飽和著眼于所搜集資料的廣度, 意義飽和、理論飽和則著眼于研究資料的深度(Saunders et al., 2018)。意義飽和與理論飽和更接近, 但二者又有本質(zhì)區(qū)別。意義飽和關(guān)注的是編碼或主題的意義深度; 而理論飽和則進(jìn)一步關(guān)注由編碼或主題發(fā)展而來(lái)的新生理論的完整性、預(yù)測(cè)性與解釋力。此外, 理論飽和的概念源自并主要適用于扎根理論, 而意義飽和則不限于扎根理論的語(yǔ)境, 適用于對(duì)更多類(lèi)型的質(zhì)性研究資料飽和的判斷(Hennink et al., 2017)。
如前所述, 理論飽和的概念來(lái)源于扎根理論。在扎根理論研究中, 理論的發(fā)展與完善需要建立在系統(tǒng)地搜集和分析資料的基礎(chǔ)上, 是通過(guò)數(shù)據(jù)搜集與數(shù)據(jù)分析的相互作用實(shí)現(xiàn)的。扎根理論主要的分析方式是在資料與資料之間、理論與理論之間重復(fù)進(jìn)行比較, 基于資料和理論的相關(guān)性提煉出概念類(lèi)屬及其屬性, 又被稱(chēng)為“不斷比較的方法” (陳向明, 2000)。不斷比較是扎根理論研究的主要特征, 理論飽和就依賴(lài)于不斷進(jìn)行的比較過(guò)程(Bowen, 2008)。在一系列比較完成之后, 研究者勾勒出新的理論, 并與早期搜集的資料、新搜集的資料進(jìn)行持續(xù)比較, 從而完善理論。當(dāng)研究者發(fā)現(xiàn)理論可以解釋大部分(或所有)原始資料或新資料時(shí), 即可判斷該研究達(dá)到了理論飽和。
Bowen (2008)以一項(xiàng)扎根理論研究為例, 根據(jù)扎根理論研究的要求, 進(jìn)行了數(shù)據(jù)搜集、編碼分析、理論抽樣、持續(xù)比較等操作, 并詳細(xì)說(shuō)明了對(duì)理論飽和的判定標(biāo)準(zhǔn)。他認(rèn)為, 滿足以下4個(gè)條件方可認(rèn)定研究資料達(dá)到理論飽和:1)相關(guān)概念類(lèi)屬反映在70%以上的訪談中; 2)受訪者認(rèn)同研究結(jié)果, 對(duì)研究結(jié)果有較好的反饋; 3)與前人研究結(jié)果相契合; 4)新的受訪者開(kāi)始重復(fù)敘述與之前受訪者相似的內(nèi)容。Bowen還建議, 如果使用諸如70%作為資料飽和的判定標(biāo)準(zhǔn), 最好與其他形式的飽和標(biāo)準(zhǔn)結(jié)合使用。
研究者根據(jù)資料搜集階段訪談對(duì)象所敘述的內(nèi)容以及對(duì)資料分析階段可能出現(xiàn)的主題預(yù)設(shè)進(jìn)行數(shù)據(jù)飽和度預(yù)判。當(dāng)研究者重復(fù)聽(tīng)到同樣的敘述, 便開(kāi)始考慮是否做出研究達(dá)到了數(shù)據(jù)飽和的判斷(Jackson et al. 2015)。如前所述, 在資料分析過(guò)程中, 研究者的早期理解可能發(fā)生巨大變化, 僅僅基于上述特征就判斷研究達(dá)到資料飽和是不可靠的。但將數(shù)據(jù)飽和應(yīng)用于對(duì)單次訪談的資料飽和評(píng)估, 或?qū)€(gè)體生命歷程進(jìn)行分析(如個(gè)體心理傳記等)之類(lèi)的質(zhì)性研究中似乎是可行的。
編碼或主題飽和是質(zhì)性研究使用較多的資料飽和形式, 對(duì)與此相關(guān)的判定標(biāo)準(zhǔn)的研究和討論也最詳實(shí)。
3.3.1 以實(shí)證研究結(jié)果作為判定依據(jù)
有研究采用回顧性實(shí)證分析的方式, 系統(tǒng)呈現(xiàn)了資料飽和度的評(píng)估、報(bào)告和驗(yàn)證過(guò)程, 總結(jié)了研究達(dá)到編碼或主題飽和所需的樣本量。如Guest等(2006)總共進(jìn)行了60次深度訪談, 在訪談結(jié)束后, 以每6次訪談為一組, 依據(jù)主題和重要主題的發(fā)展程度(依據(jù)主題所包含的編碼數(shù)量確定重要主題)判斷飽和度。結(jié)果發(fā)現(xiàn), 采用主題分析, 前6次訪談結(jié)束后, 主題的基本要素就已經(jīng)呈現(xiàn)。在第12次訪談之后確定了88%的主題與97%的重要主題, 編碼書(shū)的結(jié)構(gòu)趨于穩(wěn)定, 很少再需要更改, 研究達(dá)到了主題飽和。Guest等(2017)采用類(lèi)似方法分析了40個(gè)焦點(diǎn)小組訪談獲取的資料, 結(jié)果發(fā)現(xiàn), 經(jīng)過(guò)3個(gè)焦點(diǎn)小組訪談即可確定84%的主題, 6個(gè)焦點(diǎn)團(tuán)體訪談之后確定了90%的主題。
Francis等(2010)探究了在基于理論的訪談研究中概念性類(lèi)屬(conceptual categories)的飽和, 結(jié)果發(fā)現(xiàn)在經(jīng)歷了17人次的深度訪談之后, 研究整體上達(dá)到了類(lèi)屬飽和。Coenen等(2012)在研究中采用了最大變異抽樣, 驗(yàn)證焦點(diǎn)團(tuán)體訪談中達(dá)到飽和所需要的樣本量, 結(jié)果發(fā)現(xiàn)經(jīng)過(guò)5個(gè)焦點(diǎn)小組訪談, 研究達(dá)到了編碼飽和。Hennink等(2017, 2019)分別對(duì)半結(jié)構(gòu)化深度訪談與焦點(diǎn)團(tuán)體研究中所需的樣本量進(jìn)行了回顧性分析, 結(jié)果發(fā)現(xiàn), 在總共進(jìn)行的25次深度訪談中, 第9次訪談達(dá)到了編碼飽和; 而在進(jìn)行的10個(gè)焦點(diǎn)團(tuán)體訪談中, 第4次訪談就已達(dá)到編碼飽和。類(lèi)似的還有, 研究者發(fā)現(xiàn), 在相對(duì)具有同質(zhì)性的群體中, 通過(guò)16個(gè)樣本即可獲得足夠的共同主題, 在跨文化背景下則需要20~40個(gè)樣本(Hagaman & Wutich, 2017);在對(duì)較抽象概念的探索中, 通過(guò)對(duì)12個(gè)樣本的訪談即可提取出92%的編碼(Ando et al., 2014)。
上述研究大多采用后期回顧的分析方式, 以研究獲取的全部編碼或主題為基數(shù), 通過(guò)計(jì)算某次訪談之后所獲取的編碼或主題在總數(shù)中的占比來(lái)判斷資料飽和度, 旨在基于多次實(shí)證研究的結(jié)果及研究者長(zhǎng)期積累的經(jīng)驗(yàn), 為后續(xù)研究提供標(biāo)準(zhǔn)參照。但是, 在實(shí)際操作中, 對(duì)于飽和度的判斷是過(guò)程性的, 即需要在資料搜集與分析的循環(huán)過(guò)程中評(píng)估飽和度, 以便確定在何時(shí)停止抽樣。回顧性分析相當(dāng)于“事后聰明”或“馬后炮”。盡管此類(lèi)研究得出了眾多關(guān)于樣本量的實(shí)證經(jīng)驗(yàn), 但正如很多研究者強(qiáng)調(diào)的, 不能將其研究結(jié)果作為一般化取樣要求直接應(yīng)用于其他質(zhì)性研究。因?yàn)橘Y料飽和受到研究問(wèn)題、研究目的、樣本特征、取樣均質(zhì)性、訪談方式、編碼特征、研究者以及數(shù)據(jù)特征等眾多因素的影響, 應(yīng)根據(jù)研究的方法論特征、認(rèn)識(shí)論立場(chǎng)以及研究資源等因素慎重確定樣本量(Guest et al., 2006, Hennink et al., 2017)。
3.3.2 以是否還有新的編碼或主題出現(xiàn)作為判定依據(jù)
有研究者傾向于追求數(shù)量化的指標(biāo), 通過(guò)對(duì)比新獲得的信息量與已獲得的信息量判斷資料飽和, 即當(dāng)某次訪談中新出現(xiàn)的編碼數(shù)占已確定的編碼總數(shù)的比例達(dá)到一定標(biāo)準(zhǔn), 即可判斷研究達(dá)到資料飽和。Guest等(2020)發(fā)現(xiàn), 在質(zhì)性研究的數(shù)據(jù)搜集過(guò)程中, 大部分新信息出現(xiàn)在早期, 短期內(nèi)通常遵循漸進(jìn)曲線, 在進(jìn)行了一定量的數(shù)據(jù)搜集或分析之后, 出現(xiàn)的新信息數(shù)量急劇下降, 因此他們選擇前4次(或5次、6次)搜集到的基礎(chǔ)數(shù)據(jù)集作為分母, 以之后的每2次(或3次)訪談所獲得的新信息量為分子, 以5%或0%作為閾限值, 判斷資料飽和, 即當(dāng)新進(jìn)行的2次訪談所獲得的新信息數(shù)量占前4次訪談所獲取的信息總量的比例小于5%, 即可判斷研究達(dá)到了編碼或主題飽和。其中, 對(duì)飽和閾限值(5%或0%)的選擇參照了量化研究的顯著性指標(biāo)值的設(shè)定。Guest等提出, 上述具體標(biāo)準(zhǔn)的選擇是自主的, 質(zhì)性研究者可以根據(jù)研究現(xiàn)實(shí)自行確定。
通過(guò)計(jì)算新出現(xiàn)信息與已獲信息之間的比率來(lái)判斷資料飽和比較容易操作。研究者還可以借助于圖表的輔助, 根據(jù)研究推進(jìn)過(guò)程中新編碼或主題的出現(xiàn)做出符合研究目的的判斷(Guest et al., 2020; Hennink et al., 2017, 2019)。例如Hennink等人使用條形圖表示編碼或主題在廣度上的飽和, 以新出現(xiàn)的編碼數(shù)量為縱坐標(biāo), 以訪談順序?yàn)闄M坐標(biāo), 條形圖的高度表示在歷次訪談中獲得的新的編碼或主題的數(shù)量(Hennink et al., 2017)。圖1展現(xiàn)了該研究隨著訪談的持續(xù), 編碼或主題的發(fā)展過(guò)程。從中可以發(fā)現(xiàn), 首次訪談獲取了大量編碼, 隨后的訪談明顯呈現(xiàn)收益遞減的特征。從第16人次的訪談開(kāi)始, 連續(xù)出現(xiàn)不能提供任何新信息的情況, 這表示編碼或主題的范圍已經(jīng)基本確定, 可以做出研究達(dá)到編碼或主題飽和的判斷。如果繼續(xù)進(jìn)行訪談, 雖然并不完全排除會(huì)有新信息出現(xiàn)的可能性, 但質(zhì)性研究并不追求對(duì)研究資料窮盡式的獲取, 只需獲取相對(duì)足夠的資料達(dá)到對(duì)概念與理論的發(fā)展和驗(yàn)證即可。
Constantinou等(2017)采用了比較方法(Comparative Method for Themes Saturation, CoMeTS)判斷主題飽和。首先, 他們將對(duì)每一輪新的訪談資料的分析結(jié)果與之前的資料分析結(jié)果進(jìn)行比較, 明確最近一次訪談所獲得的新主題及重復(fù)主題數(shù)量, 當(dāng)不再有新的主題出現(xiàn)時(shí)即視為達(dá)到資料飽和。然后, 研究者將訪談資料的順序打亂重新排序, 再次進(jìn)行資料分析, 對(duì)主題飽和進(jìn)行檢驗(yàn)。結(jié)果發(fā)現(xiàn), 在按照訪談的自然順序分析資料時(shí), 第5次訪談達(dá)到了主題飽和, 而對(duì)訪談資料重新進(jìn)行多次隨機(jī)排序后, 分別在第7次或第8次訪談才達(dá)到飽和。研究結(jié)果表明, 訪談資料的分析順序會(huì)影響對(duì)資料飽和的判斷。應(yīng)該指出, 對(duì)訪談資料的收集與分析通常是滾動(dòng)進(jìn)行的, 將訪談資料的順序打亂重新排序并不符合質(zhì)性研究的邏輯, 但在判定過(guò)程中加入比較方法確實(shí)有助于對(duì)資料飽和做進(jìn)一步確認(rèn)。
圖1 編碼或主題發(fā)展過(guò)程圖(Hennink et al., 2017)
3.3.3 以飽和度系數(shù)作為判定依據(jù)
有研究者試圖用更復(fù)雜的計(jì)算公式探究質(zhì)性研究的資料飽和度問(wèn)題。Tran等(2017)在開(kāi)放式調(diào)查中使用蒙特卡羅模擬(Monte Carlo simulation), 又稱(chēng)隨機(jī)模擬法, 預(yù)測(cè)新加入的參與者所能提供的主題數(shù)量。Lowe等(2018)基于數(shù)學(xué)統(tǒng)計(jì)模型測(cè)量質(zhì)性研究的主題飽和, 該模型提供了對(duì)數(shù)據(jù)集之間、數(shù)據(jù)集內(nèi)部以及研究項(xiàng)目過(guò)程中飽和度的測(cè)量方式。Namey等(2016)演示了使用bootstrap模擬從每個(gè)質(zhì)性研究數(shù)據(jù)集中隨機(jī)生成10000個(gè)樣本, 計(jì)算達(dá)到主題飽和所需樣本量的方法。另有研究者基于二項(xiàng)式分布(binomial distribution)提出樣本量評(píng)估方式(Fugard & Potts, 2015; Galvin, 2015)。
以上多種資料飽和度的計(jì)算方式都依賴(lài)于概率理論與隨機(jī)抽樣(Fugard & Potts, 2015; Galvin, 2015; Lowe et al., 2018)。然而, 由于質(zhì)性研究采取非概率抽樣方式(Guest et al., 2020), 并且具有開(kāi)放性等特征, 使得它并不適用于概率論或者統(tǒng)計(jì)推斷(Blaikie, 2018; Sim et al., 2018)。另外, 受研究傳統(tǒng)和知識(shí)范圍的限制, 復(fù)雜的數(shù)學(xué)統(tǒng)計(jì)分析模型既不方便人文社會(huì)科學(xué)研究者的操作和使用, 也不利于相應(yīng)的讀者群接受和理解。
有研究者嘗試引進(jìn)Jaccard系數(shù)作為資料飽和度的判斷指標(biāo)(劉甜芳, 楊莉萍, 2018)。Jaccard系數(shù)原本是指在給定的兩個(gè)數(shù)據(jù)集A和B中, 二者的交集與并集的比值, 比值越大代表兩個(gè)集合的相似度越高(張猛, 李玲娟, 2018)。Jaccard系數(shù)的計(jì)算公式如下:
在資料分析過(guò)程中, 使用Jaccard系數(shù)可以計(jì)算不同輪次訪談所獲取資料的編碼相似性, 新獲取的數(shù)據(jù)集與之前已搜集的數(shù)據(jù)集相似度越大, Jaccard系數(shù)越高, 則表示資料編碼的飽和度越高。這樣的操作方式符合編碼飽和的概念。在對(duì)英文資料的分析中, 主要以英文單詞作為分析單元計(jì)算Jaccard系數(shù), 而中文則以單個(gè)的漢字或編碼作為識(shí)別單元。目前在操作過(guò)程中, Jaccard系數(shù)大多只為一個(gè)報(bào)告值, 至于其指標(biāo)達(dá)到多少可以認(rèn)定為編碼飽和, 并無(wú)統(tǒng)一標(biāo)準(zhǔn), 還有待進(jìn)一步探索。此外, 以Jaccard系數(shù)作為判斷標(biāo)準(zhǔn)還存在其他問(wèn)題。鑒于質(zhì)性研究過(guò)程的持續(xù)性和探索性, 以新獲取的數(shù)據(jù)集B與此前已獲取的所有數(shù)據(jù)的集合A合并作為分母, 會(huì)使得分母偏大, 造成Jaccard系數(shù)過(guò)小, 從而對(duì)研究過(guò)程中資料飽和度的變化失去敏感性。
為了彌補(bǔ)Jaccard系數(shù)的不足, 研究者構(gòu)造出另一種操作簡(jiǎn)單、對(duì)資料飽和變化更為敏感的飽和度指標(biāo), 稱(chēng)為S (Saturation)系數(shù), 用以判斷質(zhì)性研究的編碼飽和度。在給定的兩個(gè)集合A和B中, B代表新獲得的數(shù)據(jù)集, A代表在B之前已獲取的所有數(shù)據(jù)的集合, 兩組數(shù)據(jù)編碼的交集與數(shù)據(jù)集B的比值即為S系數(shù)。比值越大代表數(shù)據(jù)集B中的編碼與之前集合的重復(fù)性越高。S系數(shù)的計(jì)算公式如下:
資料飽和度作為一種過(guò)程性評(píng)價(jià)指標(biāo), 會(huì)隨著研究過(guò)程的進(jìn)展不斷增加或累積。S系數(shù)能很好地體現(xiàn)隨著樣本量增加, 資料飽和度逐漸上升的趨勢(shì)。在研究過(guò)程中每增加一次抽樣, 都可以重新計(jì)算資料飽和度, 從而監(jiān)測(cè)新增樣本對(duì)于編碼或主題發(fā)展的貢獻(xiàn)程度。在對(duì)同質(zhì)性樣本的訪談中, 深度訪談連續(xù)3次(焦點(diǎn)團(tuán)體連續(xù)2次) S系數(shù)達(dá)到95%及以上可認(rèn)定為達(dá)到編碼飽和。這里95%參照了量化研究的顯著性指標(biāo)值的設(shè)定, 而要求“連續(xù)3次”或“連續(xù)2次”, 則是遵循了“適當(dāng)追加抽樣”的原則。但目前這依然只是經(jīng)驗(yàn)性判斷, 有待獲得更多研究的驗(yàn)證與支持。
Hennink等(2017, 2019)采用回顧性實(shí)證分析的方式探究了深度訪談與焦點(diǎn)團(tuán)體研究中達(dá)到意義飽和所需樣本量, 并與編碼飽和做了對(duì)比。結(jié)果發(fā)現(xiàn), 需要16~24次個(gè)體訪談才能達(dá)到意義飽和, 在第10次焦點(diǎn)團(tuán)體訪談后勉強(qiáng)達(dá)到了意義飽和。通常情況下, 達(dá)到意義飽和所需要的樣本量遠(yuǎn)高于編碼飽和。
研究者在資料搜集與分析的循環(huán)過(guò)程中借助于表格記錄意義單元(二級(jí)編碼)含義的發(fā)展變化, 稱(chēng)為意義飽和網(wǎng)格(Brod et al., 2009; Hennink et al., 2017, 2019)。如在表1中, 第一列為發(fā)展出的意義單元, 之后各列分別為第1~6次、7~9次、10~12次及第12次之后各階段資料搜集為意義單元(或不同類(lèi)屬)所增加的新的內(nèi)涵。
表1 意義飽和網(wǎng)格(Hennink et al., 2017)
圖2 意義飽和坐標(biāo)圖(Hennink et al., 2017)
意義飽和網(wǎng)格可以在資料搜集與分析的循環(huán)過(guò)程中建立。將發(fā)展出的意義單元逐一填入第一列, 將新發(fā)現(xiàn)的意義單元的下級(jí)編碼或自由節(jié)點(diǎn)按照各自出現(xiàn)的順序分別填寫(xiě)在網(wǎng)格中的相應(yīng)位置。如果在訪談中沒(méi)有新的編碼出現(xiàn), 則空出相應(yīng)單元格。單個(gè)意義單元達(dá)到飽和的標(biāo)志是, 在后續(xù)進(jìn)行的訪談中不再出現(xiàn)該意義單元新的下級(jí)編碼或自由節(jié)點(diǎn)。當(dāng)所有(或達(dá)到一定比例)的單元格都呈現(xiàn)為空白, 代表隨著訪談繼續(xù)下去不會(huì)再有新的信息增加, 即可判斷研究資料達(dá)到了意義飽和。在表1中, 第2個(gè)意義單元“時(shí)間”的屬性到第9次訪談已基本確定, 之后沒(méi)有繼續(xù)增加, 說(shuō)明該意義單元已達(dá)到飽和。需要提醒的是, 在質(zhì)性研究過(guò)程中, 編碼始終處于不斷調(diào)整狀態(tài), 這一點(diǎn)在意義飽和網(wǎng)格中能夠體現(xiàn)出來(lái)。
意義飽和網(wǎng)格記錄了意義單元及其含義的發(fā)展過(guò)程, 可以幫助研究者判斷特定的意義單元是否已經(jīng)達(dá)到飽和。但這類(lèi)網(wǎng)格大多只能保存在研究者的研究備忘中, 由于內(nèi)容太多, 過(guò)于龐雜, 在期刊論文中很難完整呈現(xiàn)。Hennink等(2017)因此創(chuàng)造了另一種更具參考價(jià)值的意義飽和呈現(xiàn)方式, 見(jiàn)圖2。其中, 橫坐標(biāo)為訪談順序, 縱坐標(biāo)分別呈現(xiàn)不同的意義單元, 空心圓表示某個(gè)意義單元被正式創(chuàng)建的位置, 實(shí)心圓表示某意義單元達(dá)到意義飽和的位置, 即在后續(xù)訪談中有關(guān)該意義單元的新信息不再出現(xiàn), 這時(shí)可認(rèn)定該意義單元的相關(guān)信息已達(dá)到飽和。
在質(zhì)性研究中強(qiáng)調(diào)資料飽和具有三方面意義。其一, 評(píng)估研究資料的充足性, 以指導(dǎo)抽樣過(guò)程。其二, 幫助研究者判斷對(duì)研究問(wèn)題及相關(guān)概念的認(rèn)識(shí)是否深入, 是研究質(zhì)量的體現(xiàn)。其三, 幫助研究者在論文中報(bào)告研究取樣的充分性, 接受讀者的審查, 也便于后續(xù)研究者進(jìn)一步跟進(jìn)研究。但在實(shí)際操作過(guò)程中, 不同形式的資料飽和常常被混淆, 不恰當(dāng)?shù)脑u(píng)估方式或模糊操作等問(wèn)題普遍存在。
對(duì)于資料飽和的判定, 某些實(shí)證研究的結(jié)果或統(tǒng)計(jì)學(xué)方法試圖在研究之前就給出達(dá)到資料飽和的樣本量標(biāo)準(zhǔn)。但是, 如前所述, 質(zhì)性研究的資料飽和受諸多因素的影響, 其中每項(xiàng)研究都有其個(gè)性或特殊性。例如, 在訪談研究中, 主題與受訪者緊密相連, 受訪者的身份和所處的語(yǔ)境幫助賦予主題意義和重要性, 主題是受訪者的“屬性”, 二者相互對(duì)應(yīng)(Byrne, 2015; Hammersley, 2015; Sim et al., 2018)。而在資料分析過(guò)程中, 主題也不是一成不變的, 主題的命名、內(nèi)涵、外延及其對(duì)研究問(wèn)題的理論貢獻(xiàn)都在不斷發(fā)展, 特定主題的重要性及其與研究問(wèn)題的相關(guān)度也隨之改變(Hammersley, 2015)。因此, 對(duì)研究問(wèn)題探索的深度與樣本量之間并非服從簡(jiǎn)單的線性關(guān)系, 受訪者人數(shù)不能單獨(dú)作為判斷資料飽和的依據(jù)(Sim et al., 2018), 達(dá)到研究資料飽和的樣本量因此不能在研究開(kāi)始之前確定(Braun & Clarke, 2021)。
在具體研究過(guò)程中, 研究者應(yīng)基于本研究的特點(diǎn), 綜合考慮多種資料飽和形式。如使用編碼或主題飽和評(píng)估研究資料的廣度和范圍, 使用意義飽和評(píng)估編碼或主題被探索的深度。如果該研究以建構(gòu)理論為目的, 還應(yīng)該通過(guò)持續(xù)性比較對(duì)理論飽和加以檢驗(yàn)。將檢驗(yàn)嵌入研究過(guò)程, 綜合使用多種形式的資料飽和, 在國(guó)外也有一些研究案例, 如數(shù)據(jù)飽和與理論飽和結(jié)合使用(Goulding, 2005; Morse, 2015)。
資料飽和是基于已獲取的數(shù)據(jù)對(duì)未來(lái)訪談數(shù)據(jù)獲取情況所做出的預(yù)測(cè)。這里“邏輯上的不確定性”是指, 根據(jù)當(dāng)前資料搜集和分析的情況預(yù)測(cè)繼續(xù)進(jìn)行數(shù)據(jù)搜集和分析的必要性, 這種預(yù)測(cè)在一定程度上依賴(lài)于研究者的主觀判斷, 其準(zhǔn)確性并未得到進(jìn)一步的證明(Saunders et al., 2018)。盡管研究者可以清晰地記錄和呈現(xiàn)資料搜集與分析過(guò)程, 為研究的資料飽和提供證據(jù), 但質(zhì)性研究的資料飽和很難說(shuō)是一個(gè)絕對(duì)準(zhǔn)確的判斷。
正因?yàn)橘Y料飽和在邏輯上存在不確定性, 有研究者認(rèn)為, 應(yīng)該在資料達(dá)到或基本達(dá)到飽和之后再適當(dāng)追加抽樣, 以對(duì)資料飽和加以驗(yàn)證。例如, Jassim和Whitford (2014)在進(jìn)行了10次訪談之后, 發(fā)現(xiàn)研究資料已經(jīng)達(dá)到了主題飽和, 但仍繼續(xù)追加了2次訪談, 以對(duì)資料飽和進(jìn)行確認(rèn)。類(lèi)似的方式也被其他研究者所采用(Bragaru et al. 2013; Jackson et al., 2000; Vandecasteele et al., 2015)。但Saunders等(2018)指出, 過(guò)度抽樣的做法在一定程度上也存在問(wèn)題, 可能會(huì)造成資料飽和概念的模糊性。盡管如此, 適當(dāng)追加抽樣仍不失為應(yīng)對(duì)資料飽和邏輯不確定性的有效策略。通常在做出研究資料飽和或基本飽和的判斷之后, 研究者可以根據(jù)需要再繼續(xù)針對(duì)同質(zhì)性樣本追加2~3次個(gè)體訪談或1~2次焦點(diǎn)小組訪談, 對(duì)資料飽和做進(jìn)一步的確認(rèn)。
質(zhì)性研究是一個(gè)“傘概念(umbrella concept)”, 包含各種不同的研究方法, 如扎根理論、現(xiàn)象學(xué)研究、話語(yǔ)分析、主題分析、民族志、敘事研究、焦點(diǎn)團(tuán)體、生命史與心理傳記等(何吳明, 鄭劍虹, 2019)。有研究者認(rèn)為, 資料飽和的概念并不適用于敘事分析、解釋現(xiàn)象學(xué)分析等(Marshall & Long, 2010; O’Reilly & Parker, 2013; van Manen et al. 2016)。主題分析、扎根理論、焦點(diǎn)團(tuán)體等采用歸納思維, 從眾多受訪者那里搜集信息, 關(guān)注理論發(fā)展的充分性, 因此比較符合資料飽和的操作性定義; 而心理傳記、敘事分析等則聚焦于個(gè)體, 更加關(guān)注個(gè)體故事的完整性, 現(xiàn)有的資料飽和概念似乎并不包含此類(lèi)含義(Saunders et al., 2018)。至于解釋現(xiàn)象學(xué)分析, 雖然也會(huì)采用提煉主題、明確主題間關(guān)系等方式進(jìn)行資料分析, 但更重視獲取完整、豐富的個(gè)體關(guān)于生活經(jīng)驗(yàn)的理解, 具有特則取向, 強(qiáng)調(diào)對(duì)每個(gè)案例進(jìn)行詳細(xì)的審視(侯力琪等, 2019), 這類(lèi)研究是否適用于資料飽和的概念, 還需要進(jìn)一步探索和商榷。因此, 有研究者擔(dān)心, 如果將資料飽和這一概念無(wú)差別地應(yīng)用到所有質(zhì)性研究中, 可能導(dǎo)致失去其一致性效用(Saunders et al., 2018)。未來(lái)需要進(jìn)一步關(guān)注對(duì)不同類(lèi)型質(zhì)性研究的資料充足性的考察、判斷與檢驗(yàn)。
質(zhì)性研究并非是在傳統(tǒng)實(shí)證研究的框架內(nèi)新增的一種研究方法, 而是代表了心理學(xué)中的一種全新方法論。它在研究選題、文獻(xiàn)綜述、研究關(guān)系的建立、資料搜集、資料分析、結(jié)果與討論、效度檢驗(yàn)、研究報(bào)告等各個(gè)環(huán)節(jié), 都表現(xiàn)出與實(shí)證研究不同的特點(diǎn)。資料飽和及其檢驗(yàn)只是其中一個(gè)研究環(huán)節(jié)。只有針對(duì)質(zhì)性研究過(guò)程中的每一環(huán)節(jié)開(kāi)展深入細(xì)致的研究, 才能提高質(zhì)性研究操作的規(guī)范性, 從而提高研究質(zhì)量。
陳向明. (2000).北京: 教育科學(xué)出版社.
何吳明, 鄭劍虹. (2019). 心理學(xué)質(zhì)性研究:歷史、現(xiàn)狀和展望.,(4), 1017–1023.
侯力琪, 唐信峰, 何麗, 賈曉明. (2019). 解釋現(xiàn)象學(xué)分析在中國(guó)的運(yùn)用:系統(tǒng)評(píng)價(jià)及指南.(11), 1826–1841.
劉甜芳, 楊莉萍. (2018). 基于年齡建構(gòu)的老化心理——一項(xiàng)深度訪談研究報(bào)告.(5), 1207–1213.
蘇達(dá)比, R. (2006). 扎根理論之所非 (曾憲聚, 韓巍譯). 見(jiàn)徐淑英, 任兵, 呂力 (編). (2016).. (pp. 145–162). 北京: 北京大學(xué)出版社.
張猛, 李玲娟. (2018). 基于改進(jìn)的Jaccard相似系數(shù)矩陣的社團(tuán)劃分算法.(6), 96–102.
Ando, H., Cousins, R., & Young, C. (2014). Achieving saturation in thematic analysis: Development and refinement of a codebook., 1–7.
Blaikie, N. (2018). Confounding issues related to determining sample size in qualitative research.(5), 635–641.
Bowen, G. A. (2008). Naturalistic inquiry and the saturation concept: A research note.(1), 137– 152.
Bragaru, M., van Wilgen, C. P., Geertzen, J. H., Ruijs, S. G., Dijkstra, P. U., & Dekker, R. (2013). Barriers and facilitators of participation in sports: A qualitative study on Dutch individuals with lower limb amputation.(3), e59881.
Braun, V., & Clarke, V. (2021). To saturate or not to saturate? Questioning data saturation as a useful concept for thematic analysis and sample-size rationales.(2), 201–216.
Brod, M., Tesler, L. E., & Christensen, T. L. (2009). Qualitative research and content validity: Developing best practices based on science and experience.(9), 1263–1278.
Byrne, D. (2015). Response to Fugard and Potts: Supporting thinking on sample sizes for thematic analyses: A quantitative tool.(6)689–691.
Carlsen, B., & Glenton, C. (2011). What about N? A methodological study of sample-size reporting in focus group studies.(1), 26.
Coenen, M., Stamm, T. A., Stucki, G., & Cieza, A. (2012). Individual interviews and focus groups in patients with rheumatoid arthritis: A comparison of two qualitative methods.(2)359–370.
Constantinou, C. S., Georgiou, M., & Perdikogianni, M. (2017). A comparative method for themes saturation (CoMeTS) in qualitative interviews.(5), 571–588.
Corbin, J., & Strauss, A. (2014).. Thousand Oaks, CA: Sage Publications, Inc.
Curtis, S., Gesler, W., Smith, G., & Washburn, S. (2000). Approaches to sampling and case selection in qualitative research: Examples in the geography of health.(7-8), 1001–1014.
Emmel, N. (2015). Themes, variables, and the limits to calculating sample size in qualitative research: A response to Fugard and Potts.(6), 685–686.
Francis, J., Johnston, M., Robertson, C., Glidewell, L., Entwistle, V., Eccles, M., & Grimshaw, J. (2010). What is an adequate sample size? Operationalising data saturation for theory-based interview studies.(10)1229–1245.
Fugard, A. J., & Potts, H. W. (2015). Supporting thinking on sample sizes for thematic analyses: A quantitative tool.(6), 669–684.
Fusch, P. I., & Ness, L. R. (2015). Are we there yet? Data saturation in qualitative research.(9)1408–1416.
Galvin, R. (2015). How many interviews are enough? Do qualitative interviews in building energy consumption research produce reliable knowledge?(1), 2–12.
Glaser, B. G., & Strauss, A. L. (1967).. Chicago, IL: Aldine Transaction.
Goulding, C. (2005). Grounded theory, ethnography and phenomenology: A comparative analysis of three qualitative strategies for marketing research.(3/4), 294–308.
Grady, M. P. (1998).Bloomington, IN: Phi Delta Kappa Educational Foundation.
Guest, G., Bunce, A., & Johnson, L. (2006). How many interviews are enough? An experiment with data saturation and variability.(1), 59–82.
Guest, G., Namey, E., & Chen, M. (2020). A simple method to assess and report thematic saturation in qualitative research.(5). e0232076.
Guest, G., Namey, E., & McKenna, K. (2017). How many focus groups are enough? Building an evidence base for nonprobability sample sizes.(1), 3–22.
Hagaman, A. K., & Wutich, A. (2017). How many interviews are enough to identify metathemes in multisited and cross- cultural research? Another perspective on Guest, Bunce, and Johnson’s (2006) Landmark Study.(1), 23–41.
Hammersley, M. (2015). Sampling and thematic analysis: A response to Fugard and Potts.(6), 687–688.
Hennink, M. M., Kaiser, B. N., & Marconi, V. C. (2017). Code saturation versus meaning saturation: How many interviews are enough?(4), 591–608.
Hennink, M. M., Kaiser, B. N., & Weber, M. B. (2019). What influences saturation? Estimating sample sizes in focus group research.(10), 1483–1496.
Jackson, D., Daly, J., Davidson, P., Elliott, D., Cameron- Traub, E., Wade, V., … Salamonson, Y. (2000). Women recovering from first-time myocardial infarction (MI): A feminist qualitative study.(6), 1403–1411.
Jackson, M., Harrison, P., Swinburn, B., & Lawrence, M. (2015). Using a qualitative vignette to explore a complex public health issue.(10), 1395–1409.
Jassim, G. A., & Whitford, D. L. (2014). Understanding the experiences and quality of life issues of Bahraini women with breast cancer.189–195.
Kerr, C., Nixon, A., & Wild, D. (2010). Assessing and demonstrating data saturation in qualitative inquiry supporting patient-reported outcomes research.(3), 269–281.
Levitt, H. M., Bamberg, M., Creswell, J. W., Frost, D. M., Josselson, R., & Suárez-Orozco, C. (2018). Journal article reporting standards for qualitative primary, qualitative meta-analytic, and mixed methods research in psychology: The APA Publications and Communications Board task force report.(1), 26–46.
Lowe, A., Norris, A. C., Farris, A. J., & Babbage, D. R. (2018). Quantifying thematic saturation in qualitative data analysis.(3), 191–207.
Malterud, K., Siersma, V. D., & Guassora, A. D. (2016). Sample size in qualitative interview studies: Guided by information power.(13), 1753–1760.
Marshall, B., Cardon, P., Poddar, A., & Fontenot, R. (2013). Does sample size matter in qualitative research? A review of qualitative interviews in IS research.(1)11–22.
Marshall, V., & Long, B. C. (2010). Coping processes as revealed in the stories of mothers of children with autism.(1), 105–116.
Morse, J. M. (2015). "Data were saturated... ".(5), 587–588.
Namey, E., Guest, G., McKenna, K., & Chen, M. (2016). Evaluating bang for the buck: A cost-effectiveness comparison between individual interviews and focus groups based on thematic saturation levels.(3)425–440.
O'Reilly, M., & Parker, N. (2013). ‘Unsatisfactory Saturation’: A critical exploration of the notion of saturated sample sizes in qualitative research.(2), 190–197.
Saunders, B., Sim, J., Kingstone, T., Baker, S., Waterfield, J., Bartlam, B., … Jinks, C. (2018). Saturation in qualitative research: Exploring its conceptualization and operationalization.(4), 1893–1907.
Sim, J., Saunders, B., Waterfield, J. & Kingstone, T. (2018). Can sample size in qualitative research be determined a priori?(5), 619–634.
Tran, V.-T., Porcher, R., Tran, V.-C., & Ravaud, P. (2017). Predicting data saturation in qualitative surveys with mathematical models from ecological research.71–78.
Urquhart, C. (2012).. Thousand Oaks, CA: Sage Publications, Inc.
Vandecasteele, T., Debyser, B., van Hecke, A., de Backer, T., Beeckman, D., & Verhaeghe, S. (2015). Nurses' perceptions of transgressive behaviour in care relationships: A qualitative study.(12), 2786–2798.
van Manen, M., Higgins, I., & van der Riet, P. (2016). A conversation with Max van Manen on phenomenology in its original sense.(1), 4–7.
[1]
Concepts and evaluation of saturation in qualitative research
YANG Liping, QI Lidong, ZHANG Bo
(School of Psychology, Nanjing Normal University, Nanjing 210024, China)
In qualitative research, saturation is usually used to assess the adequacy of research data. However, in research practice, there are various forms of saturation, and the relationships among them are complicated and ambiguous. Previous studies lack operational description and practical guidance for the evaluation of saturation and its reports. Considering its importance to qualitative research, this study clarifies the concepts of saturation. As a sign that the sample size of a qualitative study has met the research needs, based on the time sequence of their occurrence during the research process, saturation can be distinguished into four types: data saturation, code or thematic saturation, meaning saturation, and theoretical saturation. Each of them has its specific connotations, evaluation methods and judgment criteria. Some problems are discussed in this study. 1) The sample size to reach saturation should not be set uniformly, and it must be embedded in the specific research process; 2) Due to the logical uncertainty of saturation, a little oversampling would be helpful; 3) As an important index to evaluate the quality of a qualitative research, saturation test cannot be applicable to all forms of qualitative research.
qualitative research, saturation, evaluation methods, judgment criteria
2021-07-01
* 江蘇省社會(huì)科學(xué)基金項(xiàng)目(19SHB007)。
楊莉萍, E-mail: lpy2908@163.com
B841