葉成城
在社會科學中,方法論的爭論是如此普遍而紛雜,尤其是政治學界普遍認為存在兩種完全不同的范式,即定性方法論范式和定量方法論范式,二者之間存在激烈的爭論。這類方法論的爭論很大程度上來自于加里·金(Gary King)、羅伯特·基歐漢(Robert Keohane)和悉尼·維巴(Sidney Verba)所合著的《社會科學中的研究設(shè)計:定性研究中的科學推論》(Designing Social Inquiry: Scientific Inference in Qualitative Research)。1為了便于敘述,將作者簡稱為KKV,將該書簡稱為DSI。參見Gary King, Robert Keohane and Sidney Verba,Designing Social Inquiry: Scientific Inference in Qualitative Research, Princeton: Princeton University Press, 1994。對于KKV的DSI一書的討論及批判,事實上存在兩種類型的錯誤,這兩種錯誤貫穿了許多方法論的討論,并一定程度地導致了方法論研究的困惑甚至混亂,因此有必要予以指出和澄清。
第一種誤區(qū)認為,定性研究和定量研究是同一種研究方法,兩者之間的差異僅僅在于樣本數(shù)量。這種錯誤是DSI導致的最大誤解,該書一直暗示定量研究是比定性研究更為“先進”的方法,而定性研究的學者需要通過各種方法來增加樣本數(shù)量以保證結(jié)論的有效性。KKV的這種偏見很大程度上是定量研究學者對于定性研究的誤解,即認為跨案例比較是檢驗理論有效性的唯一方法。KKV的這類錯誤實質(zhì)上是由于將定量方法作為主要標準,并試圖將這類標準推廣到定性研究的領(lǐng)域。第二種誤區(qū)則處于另外一個極端,它認為定量研究和定性研究是兩種截然不同的研究方法。定量研究和定性研究是兩種不同的范式,前者通過案例間比較來進行因果推斷,討論原因的影響(effect of cause),主要實現(xiàn)外部有效性;而后者則通過案例內(nèi)研究來實現(xiàn)因果,著重于討論結(jié)果的原因(cause of effect),主要實現(xiàn)內(nèi)部有效性。KKV第一種誤區(qū)中的許多問題,已經(jīng)在所謂的“后KKV時代”得到一定的解決,有大量的著作對于KKV的這類問題進行批評和糾正。2Henry E. Brady and David Collier (eds.), Rethinking Social Inquiry: Diverse Tools, Shared Standards, Lanham:Rowman & Littlefield Publishers, 2010; James Mahoney, After KKV: The New Methodology of Qualitative Research, World Politics, vol. 62, no. 1, 2010, pp. 120-147.但KKV寫作DSI一書的主要目的在于試圖統(tǒng)一定性和定量兩種方法的準則與邏輯,盡管KKV所采取的方法存在諸多錯誤,但是這種嘗試本身是正確的。KKV的絕大多數(shù)批評者們忽略或者放棄了對于統(tǒng)一原則的追尋,過于強調(diào)兩者之間的差異反而導致了方法論之間的對立與隔閡,而較少地討論這些方法背后邏輯本身的相通之處。本文的目的在于通過探究各類方法理論背后的邏輯,討論各類研究方法的優(yōu)勢和劣勢的邏輯根源,借此重新審視KKV和后KKV時代對于方法論的誤區(qū)和偏見,從而打破定量和定性研究之間的隔閡。
理論是科學方法的起點和終點。理論的基本邏輯是案例比較,社會科學之所以成為科學的原因在于它遵循控制與比較。布爾代數(shù)就是將人類的思維方式數(shù)學化的結(jié)果,在具體的方法層面表現(xiàn)為基本的邏輯思維方式,我們稱之為密爾方法。密爾方法作為因果思考的基本工具,研究者因為不同的樣本而選擇不同的研究方法。這些研究方法主要通過對兩類因果觀測值的歸納來解釋事物,通過控制變化來探求樣本的外部和內(nèi)部有效性,從而檢驗從原因到結(jié)果之間的因果過程。
早在上世紀70年代,阿倫·利帕特(Arend Lijphart)就已經(jīng)提出了比較方法是建立通用的實證命題的基本方法之一(其他方法則包括實驗、數(shù)據(jù)和案例分析)。1Arend Lijphart, Comparative Politics and the Comparative Method, American Political Science Review, vol. 65, no. 3,1971, p. 682.此前國內(nèi)的文獻往往過度注重對方法的討論,而關(guān)于研究設(shè)計背后邏輯及其關(guān)系的討論則存在不足,因此本文試圖以科學的研究設(shè)計為出發(fā)點,探討理論構(gòu)建過程中的案例、方法與研究設(shè)計。
具體而言,本文的框架如下:第一,討論了研究設(shè)計的基本路徑和步驟;第二,分析密爾方法在案例比較研究中的基本邏輯、特征和局限;第三,總結(jié)了單案例、小樣本、中等樣本和大樣本研究這4種類型的研究方法,及其對應(yīng)的形式邏輯和研究方法;第四,文章闡述了單一研究方法的缺陷,以及如何通過案例內(nèi)比較與混合的方法來進一步提升結(jié)論的可靠性。最后給出結(jié)論,認為社會科學研究并不僅僅依靠科學方法和對操作流程的熟悉,經(jīng)驗判斷和寫作技巧也同樣重要。
自然科學的結(jié)論通常被認為比社會科學的研究具有更少的爭議和更高的可信度,其原因在于自然科學可以更好地借助于實驗方法,通過控制變量來不斷重復結(jié)果。而社會科學由于條件的限制或者具體歷史的研究,多數(shù)情況下無法進行大規(guī)模的重復實驗,因此社會科學的核心思想是通過控制變量來達到準實驗狀態(tài)。這些都要通過案例比較來實現(xiàn)。比較是控制變量和建立變量間普遍性關(guān)系的方法,它是一種歸納推理。約翰·斯圖亞特·密爾(John Stuart Mill)最早在他的《邏輯體系》一書中提到了5種歸納推理的基本方法,被稱之為“密爾五法”:求異法、求同法、求同求異法、共變法和求余法。2John Mill, System of Logic: Ratiocinative and Inductive, Being a Connected View of the Principles of Evidence and the Methods of Scientific Investigation, New York: Harper & Brothers Publishers, 1898, pp. 478-537.
(一)求異法,即通過最小化差異來求異,在密爾的體系中,所有方法都歸于求異法。3[瑞士]丹尼爾·卡拉曼尼:《基于布爾代數(shù)的比較法導論》,蔣勤譯,格致出版社,2012年,第13頁。由于社會科學經(jīng)常無法人為地控制變量之間的差異,因此就只能夠通過相似案例的比較來接近實驗狀態(tài)。求異法的核心邏輯就是,在其他條件一致時,導致結(jié)果不同的差異即為原因。求異法成立的前提是嚴格的準實驗狀態(tài),否則就可能因為無法消除競爭性解釋而降低理論的可信度。4Alexander George and Andrew Bennett, Case Studies and Theory Development in the Social Sciences, Massachusetts:MIT Press, 2005, p. 165.
案例1:A+B+C+D+E→Y
案例2:~A+B+C+D+E→~Y
在上述兩個案例中,如果因素A的差異導致了結(jié)果Y的差異,就可以認為A是Y的原因。求異法的優(yōu)勢在于它可以依賴較少的案例,理論上來說只需要2n個案例就可以通過n個變量來解釋不同的結(jié)果。求異法同樣存在邏輯和實際操作的問題。首先,求異法對于準實驗狀態(tài)存在高度的依賴,由于社會科學中幾乎不可能找到兩個只有條件A不同而其他因素都一樣的案例或樣本,通常只能夠?qū)τ谧兞窟M行近似的控制,因此求異法往往會存在較多的競爭性解釋,即被作者所忽視的差異會削弱解釋變量的因果解釋。因此,研究者在最大程度地控制差異之后,往往還需要解釋為什么其他的差異(競爭性解釋)并不重要。除此之外,僅僅停留在聯(lián)列表的求異法,在邏輯上仍然是一種相關(guān)性的推斷,還需要通過案例研究來增強其因果解釋。
(二)求同法,即通過最大化差異來求同,其核心邏輯是在其他條件都具有極大差異的情況下,如果仍然能夠達到相同的結(jié)果,事物間的共性即為其原因。
案例1:A+B+C+D+E→Y
案例2:A+F+G+H+I→Y
在以上的兩個案例中,在其他原因不同而導致相同的結(jié)果時,可以認為原因A導致了結(jié)果Y。求同法的優(yōu)勢在于其能夠在存在較大差異的時候仍然維持較少的變量,但求同法是密爾方法中邏輯較弱的一種方法,其缺陷在于,如果無法說明其他因素不重要,由于無法解決變量和結(jié)果之間存在的“多重因果性”,即各類變量/原因相加導致的相同結(jié)果,就會降低理論的解釋力。1Alexander George and Andrew Bennett, Case Studies and Theory Development in the Social Sciences, pp. 156-157;Charles Ragin, Fuzzy-Set Social Science, Chicago: University of Chicago Press, 2000; Charles Ragin, Redesigning Social Inquiry: Fuzzy Sets and Beyond, Chicago: University of Chicago Press, 2008.比如畢業(yè)生的薪水是由專業(yè)、能力和學歷等因素綜合決定的,顯然如果依據(jù)單一要素進行求同往往得出的結(jié)論可能是錯誤的。事實上很多傳統(tǒng)的諺語都表達了上述觀點,即不同因素的組合可以達到相同,例如“八仙過海,各顯神通”“條條道路通羅馬”,等等。因此通常情況下,在定性的研究中,如果僅僅停留在對于少量因素的求同,就無法得出正確的結(jié)論。
(三)由于求同法的邏輯較弱,密爾提出了求同法和求異法的共同使用(Joint Method of Agreement and Difference),或者稱之為間接求異法(Indirect Method of Difference)。2John Mill, System of Logic: Ratiocinative and Inductive, Being a Connected View of the Principles of Evidence and the Methods of Scientific Investigation, New York: Harper & Brothers Publishers, 1898, pp. 488-489.即在單一小組內(nèi)部求同,而在小組之間求差異。假設(shè)案例用一個變量的差異分為兩個小組:在其中一組中,因素A出現(xiàn)(記作A),而在另一組中,因素A不出現(xiàn)(記作~A)。從而能夠在這兩個小組之間使用求異法,即只有A的差異而其他因素相同,最終導致了不同的結(jié)果;與此同時,小組內(nèi)部雖然其他因素存在較大的差異,但是因為共同原因A又達成了相同的結(jié)果(即A→Y且~A→~Y),這就具有較強的說服力可以認為A是結(jié)果Y的原因。
(四)共變法是通過控制其他條件不變,觀察A和Y的共同變化,可以認為兩者之間存在因果性或者由于共同原因?qū)е铝俗兓囊恢滦?。共變法在大樣本的研究中具有較強的可信度,但是它的缺陷是僅僅表達了一種統(tǒng)計上的相關(guān)性。在自然科學中,研究者可以通過控制和重復試驗,明確觀察到A和Y之間的因果性。但是在社會科學中,研究者往往只能事后通過既有數(shù)據(jù)進行判斷,因此只能觀測到相關(guān)性。共變法往往無法直接區(qū)分因果倒置和內(nèi)生性問題,即無法判斷自變量和因變量究竟哪個是原因,哪個是結(jié)果,或者互為因果,往往社會科學中存在較多的互為因果的案例,例如政治與經(jīng)濟。同時,共變法也無法區(qū)分偽相關(guān),因為自變量和因變量之間的相關(guān)性可能是由于共同原因?qū)е碌?,而兩者之間不存在因果關(guān)系。1Daniel Steel, Across the Boundaries: Extrapolation in Biology and Social Science, Oxford: Oxford University Press,2008, p. 177.例如游泳的人數(shù)和買雪糕的人數(shù)之間存在相關(guān)性,但是兩者是因為天氣炎熱導致的,沒有因果聯(lián)系。
(五)求余法,即認為存在原因A+B+C導致了結(jié)果a+b+c,如果可以確信A是a的原因,而B是b的原因,則可以推斷C是c的原因。上述4種方法屬于歸納法,而求余法則會存在演繹邏輯,需要通過推理得出結(jié)論。求余法在個案的研究中存在較大的優(yōu)勢,可以通過排除法迅速找到現(xiàn)象的原因,正如福爾摩斯所說的那樣:“排除一切不可能的原因,剩下的再令人難以置信,那也是真相。”求余法同樣存在一定的局限,它需要基于原因之間互相獨立的假設(shè),即原因A、B、C之間不存在互相干擾,否則就無法通過排除法進行推理。
密爾五法在本質(zhì)上都屬于排除法,屬于一種形式邏輯,即通過排除其他干擾因素之后,最終推導出自變量和因變量之間的關(guān)系。而形式邏輯的數(shù)學基礎(chǔ)是布爾代數(shù),在數(shù)學化之后,就是通過“或”(符號表示為+)、“且”(符號表示為*)、“非”(符號表示為~)的運算來尋求因果解釋。
前文闡述了案例研究的基本邏輯,在此基礎(chǔ)上文章進一步討論案例比較的方法。對于案例選取的規(guī)則恰恰是基于對第二部分所述的各類研究方法的優(yōu)勢和缺陷。在討論案例之間的差異時,需要明確案例選取的時空邊界。一方面,這是由求異法的邏輯特征所決定的,求異法是基于最小化差異來進行因果推斷,故而會面臨諸多的競爭性解釋。因此在案例的時空背景差異過大時,時空差異本身就會構(gòu)成對理論解釋的威脅,像加州學派對大分流的討論,事實上就忽略了中國和歐洲(或者英國)截然不同的背景,這些差異才可能是導致結(jié)果不同的原因。1參見趙鼎新:《加州學派與工業(yè)資本主義的興起》,《學術(shù)月刊》2014年第7期。另一方面,即便是同一概念,在不同的時空情境中也可能賦予其不同的涵義,例如大航海時代的海權(quán)和當代的海權(quán)。2這部分具體的討論參見Tulia G. Falleti and Julia F. Lynch, Context and Causal Mechanisms in Political Analysis,Comparative Political Studies, vol. 42, no. 9, 2009, pp. 1145-1151;葉成城、黃振乾、唐世平:《社會科學中的時空和案例選擇》,《經(jīng)濟社會體制比較》2018年第3期。時空情境的限制往往也縮小了案例選擇的范圍,比如在某一個時間段的特定地區(qū)內(nèi)選取案例進行比較。
因此,在案例選擇中需要避免幾方面的錯誤。第一,避免簡單的舉例法,比如許多中學里的語文議論文往往就是從歷史長河中選取幾個例子來驗證觀點。事實上,多數(shù)情況下我們總能夠找到符合理論的例子,當然這種“理論”也往往會存在諸多反例。第二,避免基于“情懷”或者便利的案例選擇,例如,根據(jù)作者自身的語言基礎(chǔ)而非方法論的需要來進行案例選擇。當然,文章選題本身基于情懷或者便利,這并沒有問題,但是案例選擇不能因為對特定國家特別感興趣或者熟悉來進行,而是要在對總體的樣本和理論把握的前提下,依據(jù)最小化差異的原則進行篩選。否則,極有可能會出現(xiàn)無法滿足最大相似性的情況,從而損害了案例比較的因果解釋力。第三,避免只關(guān)注重大事件,沒有發(fā)生的事件——往往是反面案例——同樣重要。例如在研究革命時,西達·斯考切波(Theda Skocpol)就并不僅僅關(guān)注法國大革命這樣的重大事件,同樣關(guān)心普魯士為什么沒有發(fā)生革命。3[美]西達·斯考切波:《國家與社會革命》,何俊志等譯,上海人民出版社,2013年。
在確立了研究的基本問題之后,恰當?shù)陌咐x取是實證研究的核心環(huán)節(jié),而案例的選擇本身也決定了采取何種研究方法,需要以問題而非研究方法為導向。問題性質(zhì)和時空范圍的限制往往已經(jīng)決定了可以選擇的樣本數(shù)量,而樣本數(shù)量又進一步限制了研究方法的選取。詹姆斯·馬奧尼(James Mahoney)和加里·葛爾茲(Gary Goertz)提出了案例選擇的兩個條件范圍(Scope Condition)和可能性原則(Possibility Principle)。4James Mahoney and Gary Goertz, The Possibility Principle: Choosing Negative Cases in Comparative Research,American Political Science Review, vol. 98, no. 4, 2004, pp. 653-669.條件范圍的假設(shè)是求異法邏輯成立的關(guān)鍵,即案例之間要具備較高的相似度,即符合“同質(zhì)性假設(shè)”。案例選擇的“可能性原則”講述的是要選取有可能成功的案例作為負面案例,避免將完全不可能發(fā)生的案例誤認為負面案例,例如在討論貿(mào)易是否有助于促進和平時,顯然用兩個完全不可能發(fā)生戰(zhàn)爭的國家(例如秘魯和蒙古)作為負面案例。假設(shè)某個理論要用變量A和變量B來解釋結(jié)果Y,那么A和B都出現(xiàn)(A=1且B=1)就是結(jié)果Y出現(xiàn)(Y=1)的充分必要條件,那么在現(xiàn)實情況下,作為觀測值的樣本存在一共8種情況,即變量和結(jié)果分別為0或1的情況。
表1. 雙變量情況下的案例類型
如上表所示,觀測值根據(jù)對理論的支持情況分為4種類型,正面案例和負面案例支持文章的理論,兩種共同描述了自變量組合對于結(jié)果的充分必要條件,即只有A和B共同出現(xiàn)時結(jié)果才會出現(xiàn),兩者缺一不可。兩者都缺失的案例為無關(guān)案例,它既不能證偽理論,對于理論的支持也非常微弱。而出現(xiàn)與上述4種類型不同的理論預期時,例如當A=0且B=0時,如果結(jié)果Y出現(xiàn)了,就會形成對理論的重要威脅,往往意味著有可能遺漏了重要的變量。
在確定了樣本類型與結(jié)果的關(guān)系之后,根據(jù)樣本數(shù)量的多少,研究類型分為單案例研究、小樣本研究、中等樣本研究和大樣本研究。首先,單案例研究往往因為案例的特殊性較強,缺乏相似的案例進行比較,因此只能對個案研究進行深度挖掘,通常采用過程追蹤的方法。案例研究的作用是發(fā)現(xiàn)理論,其優(yōu)勢是可以具備更加細致的過程追蹤,但是單案例研究所發(fā)掘的理論的推廣性經(jīng)常是有限的。這類研究通常做得更為精細,但也更加具有不可證偽性,容易提供一種全要素的解釋,但隨著樣本量尤其是反例的增加,就越發(fā)容易出現(xiàn)概率性的解釋。1John Gerring, Case Study Research: Principles and Practices, Cambridge: Cambridge University Press, 2007, pp. 193-195.其次,小樣本研究是定性研究中最常見的情況,例如在限定時空范圍后,可能會出現(xiàn)小樣本,但卻是“全樣本”,即符合條件的樣本只有2~12個左右。小樣本研究更加注重案例本身的細節(jié),以“深度”見長。小樣本研究通常采用定性分析的方法,它更容易發(fā)現(xiàn)和提出理論假說,也可以借助控制變量法來檢驗理論。小樣本的案例中如果出現(xiàn)“準實驗狀態(tài)”,那么定性分析就非常有效。2John Gerring, Case Study Research: Principles and Practices, Cambridge: Cambridge University Press, 2007, p. 57.第三,中等樣本的研究是查爾斯·拉金(Charles Ragin)所提出的,他認為用定性比較分析的方法可以解決案例研究和回歸分析無法解決的中等樣本,即樣本數(shù)量在12~30之間的情況。3Charles Ragin, Fuzzy-set Social Science, Chicago: University of Chicago Press, 2000; Charles Ragin, Redesigning Social inquiry: Fuzzy Sets and Beyond, Chicago: University of Chicago Press, 2008.在樣本數(shù)量多到無法使用小樣本的比較分析,樣本數(shù)量又不足以進行回歸分析時(例如樣本數(shù)量少于30個),采用定性比較分析(Qualitative Comparative Analysis,QCA)就更為有效。中等樣本研究更加接近于定量方法而非定性,因為它更加重視樣本的同質(zhì)性和外部有效性,往往只能夠檢驗假設(shè),通常也很難產(chǎn)生機制性的解釋。第四,大樣本研究通常需要樣本數(shù)量大于30以上,以回歸分析為主要研究方法。大樣本研究更加具備廣度,通常只能對設(shè)定好的有限假設(shè)進行檢驗,但是具備較高的置信度。1John Gerring, Case Study Research: Principles and Practices, Cambridge: Cambridge University Press, 2007, p. 41.大樣本研究建立在同質(zhì)性假設(shè)的基礎(chǔ)上,它更加重視樣本的外部效度和平均效應(yīng),它更多地考察樣本之間的共變,因此它只能夠進行因果推斷而非因果解釋,它的因果效應(yīng)僅僅是建立在相關(guān)性的統(tǒng)計描述之上的,因而其因果性更弱。
表2. 案例數(shù)量和研究特性
如表2所示,不同的樣本量會涉及不同的研究方法,單案例、小樣本、中等樣本和大樣本研究分別對應(yīng)了過程追蹤、質(zhì)性比較、QCA和定量分析4種方法。
(一)單案例與過程追蹤
過程追蹤是對案例本身進行討論和研究,加里金認為這是在增加案例內(nèi)部的觀測值。馬奧尼提出了過程追蹤中的幾個基本步驟:包括了三種檢驗方式,分別是尋找線索、進行必要性檢驗和進行充分性檢驗。上述三種檢驗方式屬于因果性檢驗,馬奧尼認為過程追蹤中還需要進行(關(guān)于事件的)存在性檢驗。2James Mahoney, The Logic of Process Tracing Tests in the Social Sciences, Sociological Methods & Research, vol.41,no.4, 2012, pp.574-583.因果性檢驗即是常見的因果分析,更多地是社會科學家的任務(wù);而存在性檢驗則是對特定爭議事件的甄別,經(jīng)常是歷史學家的任務(wù)。相比起歷史學,政治學和經(jīng)濟學的研究會更多地使用二手資料,更加關(guān)注不同因素的組合如何導致了某種行為或結(jié)果。方法論的研究者往往用偵探小說中的破案過程來類比案例研究中的過程追蹤,即研究者如同偵探破案一般地闡釋自變量通過何種機制來導致因變量。大衛(wèi)·科利爾(David Collier)用了柯南道爾的《福爾摩斯探案集》的《回憶錄》中的《銀色馬》來講述如何進行過程追蹤。1David Collier, Understanding Process Tracing, PS: Political Science & Politics, vol. 44, no. 4, 2011, pp. 823-830.他總結(jié)了過程追蹤的4個基本步驟:首先,通過可疑線索提供研究基礎(chǔ);其次,通過必要性檢驗來排除不可能的原因;再次,尋找充分條件確定假設(shè);最后,綜合此前的線索推理得出充分必要條件。
(二)質(zhì)性比較往往用于小樣本研究
小樣本的定性分析的步驟大致如下:1. 聲明案例選擇的理由(排除無關(guān)案例);2. 列出變量的類型交叉表格,在定性研究中,受到樣本的限制,核心變量數(shù)目往往不能過多;3. 區(qū)分案例的作用,對正面案例和負面案例進行對比,檢驗結(jié)果是否在正面案例中出現(xiàn),而在負面案例中不出現(xiàn);4. 解釋與理論預期不相符合的反例;5. 通過過程追蹤來明晰從自變量到因變量的因果機制。假設(shè)在雙變量的情況下,研究者往往就用兩個自變量A和B形成一個2×2的表格來研究自變量與因變量的關(guān)系。例如丹尼爾·茲伯拉(Daniel Ziblatt)的《構(gòu)建國家》一書中,用地區(qū)性制度效率(自變量A)和聯(lián)邦主義效率(自變量B)兩個因素去構(gòu)建其理論模型,探討能否形成,他發(fā)現(xiàn)只有具備較高地區(qū)制度效率(A=1)和聯(lián)邦主義的國家(B=1),才能夠構(gòu)建聯(lián)邦主義國家(Y=1)。2Daniel Ziblatt, Structuring the State: The Formation of Italy and Germany and the Puzzle of Federalism, Princeton:Princeton University Press, 2006.這種情況下,通??梢哉J為A=1且B=1是Y=1的充分必要條件。
A=0 A=1 B=0 Y=0 Y=0 B=1 Y=0 Y=1
由于觀測值較少,忽略案例內(nèi)部特性的討論往往缺乏足夠證據(jù),它需要以案例內(nèi)部的深度挖掘為主,通過過程追蹤和質(zhì)性比較可以得出較強的因果解釋。例如X→Y只有1~3個樣本,可信度不高;但是如果在這幾個案例中,都驗證了特定機制,比如在X1→X2→X3→Y形成證據(jù)鏈,并在因果鏈上都能找到證據(jù),解釋的有效性就大大增強了。
(三)定性比較分析
拉金早在1987年將布爾代數(shù)和集合理論結(jié)合起來,發(fā)展出二分變量的QCA技術(shù)。1Charles Ragin, The Comparative Method. Moving Beyond Qualitative and Quantitative Methods, Berkeley: University of California, 1987; Charles Ragin, The Logic of the Comparative Method and the Algebra of Logic, Journal of Quantitative Anthropology, vol. 1, no. 4, 1989, pp. 373-398.定性比較分析結(jié)合定性和定量分析兩種方法的長處,將研究的各個案例都視作整體,并分析案例中的解釋條件及其組合,從而有效處理蘊涵在案例中的復雜因果關(guān)系。2遲永:《美國介入領(lǐng)土爭端的行為——基于模糊集定性比較分析的解釋》,《世界經(jīng)濟與政治》2014年第10期。QCA在政治學和歷史社會學領(lǐng)域使用得更為廣泛,因為這些領(lǐng)域的樣本數(shù)量通常較少,而在經(jīng)濟學領(lǐng)域通常樣本較多,因此QCA的應(yīng)用相對較少。定性比較分析的主要方法有清晰集分析、模糊集分析和多值分析,主要處理自變量和因變量全部都是虛擬變量的數(shù)據(jù),而模糊集理論的運用則一定程度使其可以處理連續(xù)變量。3劉豐:《定性比較分析與國際關(guān)系研究》,《世界經(jīng)濟與政治》2015年第1期。
定性比較分析更重視案例間的平均效應(yīng),探討的是概率而非覆蓋率的問題。在中等樣本并且存在較多解釋變量時,定性比較分析能夠提供有效的分析。以多值分析為例,唐睿和唐世平討論了冷戰(zhàn)后東歐國家民主轉(zhuǎn)型的例子,自變量為是否為伊斯蘭國家、是否為前蘇聯(lián)加盟共和國、是否有民主經(jīng)歷、是否有獨立國家經(jīng)歷、經(jīng)濟發(fā)展水平是否較高、資源配置扭曲程度是否較高。4唐睿、唐世平:《歷史遺產(chǎn)與原蘇東國家的民主轉(zhuǎn)型——基于26個國家的模糊集與多值QCA的雙重檢測》,《世界經(jīng)濟與政治》2013年第2期。QCA的步驟也是一個尋找近似充要條件的過程,但它更加側(cè)重于平均效應(yīng)。首先,QCA需要對單個變量進行必要性檢驗,如果非A是非Y的充分條件(吻合度大于0.9),即假如A=0,結(jié)果必然基本上不出現(xiàn);其次,剔除作為必要條件的變量和必要條件等于0的樣本重新檢驗,即剔除伊斯蘭國家和二戰(zhàn)前的蘇聯(lián)加盟國再度進行檢驗,察看結(jié)果出現(xiàn)(Y=1)可能性最高的組合,尋找此前提下的充分條件;最后,結(jié)合充分和必要條件,通過布爾代數(shù)合并充分條件,計算出最后的充分必要條件。
(四)定量分析
定量分析是經(jīng)濟學和社會學中最為常用的方法,它的基本邏輯是基于共變法和對頻數(shù)的統(tǒng)計。在實證研究中,定量分析通常是基于推斷性統(tǒng)計,回歸分析則是最為常見的定量方法,定量方法大致分為如下幾個步驟。首先,確定研究問題的自變量和因變量,形成待檢驗的假設(shè)。定量研究對于數(shù)據(jù)和問題的清晰程度要求比上述其他三種研究更為嚴格,而且對于因果關(guān)系的清晰程度的要求也更高,除了難以解決范式類的研究之外,通常也很難解決特別復雜的因果關(guān)系。5龐珣:《國際關(guān)系研究的定量方法:定義、規(guī)則與操作》,《世界經(jīng)濟與政治》2014年第1期。其次,測量變量和生成數(shù)據(jù)之后,對數(shù)據(jù)進行處理和描述性統(tǒng)計,例如給出變量之間的相關(guān)系數(shù)、方差、極值等數(shù)據(jù)。如果文章的理論正確,并且具有較高質(zhì)量的數(shù)據(jù),通過描述性統(tǒng)計,例如趨勢圖可以在一定程度上作出初步的判斷。再次,建立統(tǒng)計模型進行參數(shù)估計和假設(shè)檢驗。以t檢驗為例,在控制了基本變量后,如果自變量的系數(shù)為0的概率低于一定程度(如0.05或者0.01),則可以認為能夠拒絕原假設(shè),從而證實其結(jié)論。詹姆斯·雷(James Ray)提出回歸分析的5個基本注意事項,包括不能控制中介變量,區(qū)分補充性解釋和競爭性解釋,不能過度增加控制變量,不要控制和解釋變量在定義上非常接近的因素,控制可能的時間和空間差異。1James Lee Ray, Explaining Interstate conflict and War: What Should Be Controlled For? Conflict Management and Peace Science, vol. 20, no. 2, 2003, pp. 1-31.又次,對檢查模型結(jié)果進行穩(wěn)健性檢驗,通過變換測量方式和控制變量察看模型是否穩(wěn)健。最后,對統(tǒng)計結(jié)果進行分析,通常情況下,由于定量分析往往只能解釋原因和結(jié)果之間的相關(guān)性,對于結(jié)果的分析往往依賴于理論和專業(yè)知識,而對過程的推測本身仍然存在不確定性。
需要看到的是,上述4種研究方法的邏輯是不一致的。個案追蹤和小樣本比較都可以視作是定性研究,而QCA和回歸分析則更接近于定量研究。兩種最核心的差異在于尋找因果解釋到底是試圖尋找“結(jié)果的原因”(Causes of Effects),還是僅僅是試圖甄別“原因的影響”(Effect of Causes)。2Gary Goertz and James Mahoney, A Tale of Two Cultures: Qualitative and Quantitative Research in the Social Sciences,Princeton: Princeton University Press, 2012, p. 43;唐世平:《超越定性與定量之爭》,《公共行政評論》2015年第4期。定量研究依賴于數(shù)據(jù)集的觀測值(Data-Set Observation,DSOs),而定性研究則更加依賴于因果過程的觀測值(Causal-Process Observation,CPOs)。3James Mahoney, After KKV: The New Methodology of Qualitative Research, World Politics, vol. 62, no. 1, 2010, pp.120-147.假設(shè)理論預期出現(xiàn)10個CPOs,在實證研究中出現(xiàn)5~8個線索,就基本可以判斷這種理論的可信度較高。事實上,5~8個線索已經(jīng)足夠讓假說成立,在CPOs的研究中,80%的置信區(qū)間已經(jīng)很高,追加額外的證據(jù)邊際貢獻已經(jīng)很少,無需像經(jīng)濟學家一樣追求95%或者99%。這種邏輯的差異也導致了定性研究和定量研究在樣本選擇上的差異。后者通過隨機性使定量分析的殘差符合正態(tài)分布,因此強調(diào)選擇的隨機性和無偏性,例如不能夠根據(jù)因變量來進行樣本選擇。4Barbara Geddes, How the Cases You Choose Affect the Answers You Get: Selection Bias in Comparative Politics,Political Analysis, vol. 2, 1990, pp. 131-150.而前者則是基于對因果機制的探索,事實上很多基于對“半負面案例”的選擇不可避免地會帶來樣本選擇偏差。5這部分的具體討論參見周亦奇、唐世平:《“半負面案例比較”:北約與華約的命運為何不同?》,《世界經(jīng)濟與政治》2018年第12期;葉成城、唐世平:《基于因果機制的案例選擇》,《世界經(jīng)濟與政治》2019年第10期。在這些方法中,過程追蹤和質(zhì)性分析更加偏向于案例內(nèi)的效度,而它們的差異則在于,質(zhì)性分析一定程度依賴案例間的比較通過求同/求異法來得出因果推斷,但是離開了對案例的深入研究來談平均效應(yīng),質(zhì)性分析會出現(xiàn)“小樣本謬誤”。而QCA和定量分析,則更加重視案例間的平均效應(yīng),即通過統(tǒng)計自變量的頻數(shù)來討論它們對于因變量的平均影響,單個案例起到的作用微乎其微。而QCA和定量分析的差異在于對頻數(shù)的統(tǒng)計,QCA重在尋找類型組合導致結(jié)果出現(xiàn)的概率;而定量方法如回歸分析則建立在高斯分布的基礎(chǔ)上,通過拒絕自變量或變量組合系數(shù)為0的原假設(shè)來確立自變量對因變量的影響。
上述的4種樣本類型對應(yīng)了4種基本方法,但是這種對應(yīng)和界線并不是絕對的。而這4種方法各自都存在一定的缺陷,這種缺陷源自于它們對應(yīng)的密爾方法,采用混合方法可以在一定程度上彌補各自的缺陷并增強解釋力。
混合方法則是通過結(jié)合或者部分結(jié)合定量和定性方法來避免單一方法的缺陷。1Evan S. Lieberman, Nested Analysis as a Mixed-Method Strategy for Comparative Research, American Political Science Review, vol. 99, no. 3, 2005, pp. 435-452.其主要目的包括尋求不同方法的研究結(jié)果的聚合、擴大特定項目的廣度和范圍、互相補充或者發(fā)現(xiàn)悖論、通過不同方法推進研究,等等。2[美]阿巴斯·塔沙克里、查爾斯·特德萊:《混合方法論:定性方法和定量方法的結(jié)合》,唐海華譯,重慶大學出版社,2010年,第41頁。約翰·克雷斯威爾(John Creswell)基于不同的研究特征總結(jié)了6種基本混合方法的策略方法,通過不同方法之間的互相印證提高理論的可信度。3[美]約翰·克雷斯威爾:《研究設(shè)計與寫作指導:定性、定量與混合研究的路徑》,崔延強譯,重慶大學出版社,2007年,第168~173頁。需要看到的是,對于不同混合策略的選擇,往往也受到樣本特性的影響,例如在樣本較大時,定量研究的優(yōu)勢會更加明顯,反之亦然。假設(shè)研究的自變量X通過中介變量M導致結(jié)果Y,即X→M→Y。定量為主的研究往往通過大樣本數(shù)據(jù)證明X和Y之間的共變關(guān)系,由于數(shù)據(jù)分析無法闡述案例的因果機制,因此需要用定性方法去補充,展示X→M和M→Y的具體過程。同理,在定性為主的樣本研究中,由于數(shù)量過少,就無法成立案例之間的有效性,但是仍然有可能通過案例內(nèi)比較來證明X→M,假如能夠有足夠多的定量數(shù)據(jù)來證明,X和M之間的相關(guān)性,那么就會成為整個定性研究中非常重要的證據(jù)。通常情況下,只有在樣本具備一定規(guī)模但仍然不是很多的情況下(例如數(shù)百個),且擁有足夠的資源可以對每一個樣本進行案例研究,否則很難嚴格實行兩種方法的混合應(yīng)用。
前面介紹了社會科學中的研究設(shè)計和案例比較的基本邏輯和方法,無論是定量還是定性方法,它們都有著各自的優(yōu)點和局限,在使用任何一種方法或者混合方法時,研究者都要明白它們的適用范圍,而樣本數(shù)量和樣本特性則是對適用范圍最基本的限制。社會科學中的研究設(shè)計,既是一門科學,也是一種藝術(shù)。一方面,社會科學不是詮釋,不論是定性還是定量,都要有嚴格的內(nèi)部邏輯過程,具有一定的操作程序和流程,通過數(shù)據(jù)集和因果過程的觀測值作為實證證據(jù)來增加因果分析的可信度,即盡可能地提高X是Y的原因的可能性。社會科學作為一門科學,具有一定的可重復性,即如果采用特定的測量、比較和因果分析的流程,無論是基于DSOs還是基于CPOs的研究,只要研究的史料和數(shù)據(jù)沒有發(fā)生根本性的變化(如特定事件被證明被嚴重誤解或測量方法存在偏差),不同人進行定量或者定性研究得出的結(jié)論是相似的。當然,往往對基于DSOs的研究進行重復時,結(jié)果會更加相近,因為不同的研究者對于特定的CPOs的理解更有可能產(chǎn)生分歧。
另一方面,社會科學又是一門藝術(shù),科學方法也僅僅是諸多研究方法中的一種。研究者對于研究問題和解釋變量的選擇,往往受到自身的經(jīng)歷、價值觀念或者語言文化背景的深刻影響。同時,樣本數(shù)量并不完全局限于方法的選擇,即便是單一案例,也可能在微觀層面(例如次國家層面)存在大樣本分析的必要;而隨著QCA軟件的不斷改善,同樣可以處理諸如100~200個樣本的研究,此時就需要權(quán)衡采用QCA還是定量分析,或者兩者兼用。除此之外,研究論文本身也有篇幅的限制,在有限篇幅內(nèi)往往無法窮盡方法和案例,因此如何進行謀篇布局也需要經(jīng)驗和藝術(shù)。