池志培 侯娜
【內(nèi)容提要】 大數(shù)據(jù)事件庫的出現(xiàn)給量化國家間關(guān)系提供了一種新的可能路徑。本文利用目前全球最大的事件數(shù)據(jù)庫GDELT來測量1993—2016年的中美關(guān)系,并探討五種不同的計(jì)算方法及其問題。本文討論了如何判斷測量的準(zhǔn)確性問題,并將結(jié)果與清華大學(xué)的“中國與大國關(guān)系數(shù)據(jù)庫”中同時(shí)段的中美關(guān)系測量值進(jìn)行比較,證明基于大數(shù)據(jù)的測量具有一定的價(jià)值。本文同時(shí)分析了大數(shù)據(jù)測量方法存在的問題,并探討了其解決方法。
【關(guān)鍵詞】 GDELT 大數(shù)據(jù) 事件 雙邊關(guān)系測量 中美關(guān)系
【作者簡介】 池志培,中央財(cái)經(jīng)大學(xué)國防經(jīng)濟(jì)與管理研究院助理研究員,中央財(cái)經(jīng)大學(xué)全球經(jīng)濟(jì)與可持續(xù)發(fā)展研究中心兼職研究員。
國際關(guān)系的研究對(duì)象是國與國之間的關(guān)系,但由于國與國之間的關(guān)系往往是多維和復(fù)雜的,因而對(duì)關(guān)系的判斷通常只能依賴于研究者的經(jīng)驗(yàn)、直覺和理論偏好,這也就意味著不同的研究者對(duì)于國與國之間關(guān)系的判斷差異很大。要解決這個(gè)問題,一個(gè)方法是對(duì)于國家間的關(guān)系進(jìn)行量化研究。量化是當(dāng)代社會(huì)科學(xué)研究的趨勢,通過準(zhǔn)確的數(shù)據(jù),我們才能進(jìn)行跨時(shí)段、跨國的比較,從而發(fā)現(xiàn)趨勢與規(guī)律,甚至提供某種預(yù)測。但是要將國家間關(guān)系轉(zhuǎn)化成單一維度的數(shù)字來測量還面臨著方法論和實(shí)際操作中的巨大困難。
目前衡量國家間關(guān)系的主要方法是分析事件數(shù)據(jù)。從理論上來說,如果能對(duì)國家之間發(fā)生的所有事件進(jìn)行統(tǒng)一的分析,那么應(yīng)該就能很好地把握它們之間的關(guān)系,因?yàn)殛P(guān)系必然要通過事件來體現(xiàn)。如果所有的事件都能通過一個(gè)統(tǒng)一的測量標(biāo)準(zhǔn)進(jìn)行衡量,再將這些測量的結(jié)果進(jìn)行匯總,那么就能對(duì)關(guān)系進(jìn)行量化。由于雙邊關(guān)系是所有關(guān)系的基礎(chǔ),多邊關(guān)系可以還原成多組雙邊關(guān)系,所以本文的研究將聚焦于雙邊關(guān)系的測量。
近年來,隨著計(jì)算機(jī)技術(shù)和智能硬件技術(shù)的飛速發(fā)展和普及以及網(wǎng)絡(luò)社會(huì)的形成和算法的進(jìn)步,人類得以累積了海量數(shù)據(jù),即所謂的大數(shù)據(jù)。雖然不同的學(xué)者或者機(jī)構(gòu)對(duì)于大數(shù)據(jù)的定義有所區(qū)別,但是對(duì)于大數(shù)據(jù)的一些共性特征,各方還是有一些共識(shí)——大數(shù)據(jù)包含了3個(gè)V關(guān)于大數(shù)據(jù)的不同定義,可以參見:Jonathan Stuart Ward and Adam Barker, “Undefined By Data:A Survey of Big Data Definitions,” arxiv.org/abs/1309.5821.關(guān)于大數(shù)據(jù)的簡要?dú)v史,可參見:Gil Press,”A Very Short History Of Big Data,” Forbes, May 9, 2013, https://www.forbes.com/sites/gilpress/2013/05/09/a-very-short-history-of-big-data/#5db944eb65a1.此外,亦有觀點(diǎn)認(rèn)為大數(shù)據(jù)還需要第四個(gè)V,即veracity,指數(shù)據(jù)的真實(shí)性。:量(volume),數(shù)據(jù)量非常巨大;種類(variety),即數(shù)據(jù)類型多樣,從文本到圖像、視頻,等等;速度(velocity),即數(shù)據(jù)產(chǎn)生和處理的速度非???。本文討論所涉及的目前全球最大的社會(huì)科學(xué)數(shù)據(jù)庫GDELT(Global Database of Events, Language, and Tone)就是其中一個(gè),它從全世界超過100種語言的媒體中收集信息,并通過特定的編碼體系由計(jì)算機(jī)自動(dòng)將其編碼成一個(gè)個(gè)事件,時(shí)間跨度從1979年到今天,并持續(xù)每天更新。目前已經(jīng)收集了超過2.5億個(gè)事件的信息,包括事件的發(fā)起者、對(duì)象、地理位置、事件類型、信息來源等32個(gè)變量。就傳統(tǒng)國際關(guān)系關(guān)注的國家之間的關(guān)系而言,這個(gè)數(shù)據(jù)庫幾乎涵蓋了所有已經(jīng)公開的事件。正如維克多·麥爾-荀伯格(Viktor Mayer-Schnberger)所提及的,抽樣數(shù)據(jù)會(huì)變得過時(shí),因?yàn)槲覀兛梢垣@得全部的數(shù)據(jù)Kenneth Cukier and Viktor Mayer-Schoenberger, “The Rise Of Big Data:How It's Changing the Way We Think about The World,” Foreign Affairs, Vol.92, No.3, 2013, pp.28-40.。如果能充分利用這些巨量的事件大數(shù)據(jù),那么就應(yīng)該可以相當(dāng)準(zhǔn)確地對(duì)雙邊關(guān)系的現(xiàn)狀和趨勢作出判斷。那么,使用這些海量數(shù)據(jù)能否得到可靠的結(jié)論,與現(xiàn)有的方法相比如何呢?同時(shí),使用這些大數(shù)據(jù)可能遇到的問題和可能的解決方式又有什么呢?本文將以中美關(guān)系為例,通過對(duì)GDELT事件數(shù)據(jù)的使用來探討這些問題。
一、 事件數(shù)據(jù)與雙邊關(guān)系:歷史與文獻(xiàn)回顧
雖然大數(shù)據(jù)事件庫是近些年才出現(xiàn)的,但是人類通過記錄事件數(shù)據(jù)來發(fā)現(xiàn)和研究社會(huì)已經(jīng)有很長的歷史了,一個(gè)例子就是對(duì)犯罪事件的記錄。當(dāng)代學(xué)術(shù)意義上的通過事件數(shù)據(jù)來考察兩國之間的關(guān)系開始于1960年代,隨著社會(huì)科學(xué)中的行為主義革命而產(chǎn)生。行為主義革命者希望采用能觀察到的變量和計(jì)量方法來研究社會(huì)現(xiàn)象。對(duì)于國際關(guān)系、外交政策的分析而言,這個(gè)能被測量的對(duì)象就是事件(event)。關(guān)于事件數(shù)據(jù)庫的起源與行為主義革命的關(guān)系以及早期發(fā)展,可以參見:Stephen J.Andriole and Gerald W.Hopple, “The Rise and Fall of Event Data:From Basic Research to Applied Use in the US Department of Defense,” International Interactions, Vol.10, No.3-4, 1984, pp.293-309; John Lewis Gaddis, “Expanding the Data Base:Historians, Political Scientists, and the Enrichment of Security Studies,” International Security, Vol.12, No.1, 1987, pp.5-7; Philip A.Schrodt, “The Statistical Characteristics of Event Data,” International Interactions, Vol.20, No.1-2, 1994:35-53.關(guān)于政治學(xué)中的行為主義革命的特征及其簡要?dú)v史,可以參見:Robert Dahl, ?“The Behavioral Approach in Political Science:Epitaph for a Monument to A Successful Protest,” American Political Science Review, Vol.55, No.4, 1961, pp.763-772; David Easton, “Introduction:The Current Meaning of ‘Behavioralism’ in Political Science,”in J.S.Charlesworth, ed., The Limits of Behavioralism in Political Science (Philadelphia:American Academy of Political and Social Science,1962), pp.1-25; David Easton, “Political Science in the United States:Past and Present,” International Political Science Review, Vol.6, No.1, 1985, pp.133-152.查爾斯·麥克萊蘭(Charles McClelland)最早從他對(duì)外交史的研究開始了這種嘗試。最初的事件數(shù)據(jù)的生成采用的是人工手動(dòng)編碼的方式。由于人工編碼需要大量的人力,研究者不得不在分析的廣度和成本之間作取舍Richard L.Merritt, “Measuring Events for International Political Analysis,” International Interactions, Vol.20, No.1-2, 1994, p.6.。覆蓋的來源越多、廣度越大,就意味著研究成本的急劇上升,因此研究者不得不選擇很有限的幾個(gè)事件的數(shù)據(jù)來源。同時(shí),人工編碼也容易受個(gè)人身體狀態(tài)(比如疲勞等)和主觀判斷的影響在關(guān)于事件數(shù)據(jù)庫的研究開始以后,研究者對(duì)于人工編碼存在的各種可能的問題也進(jìn)行了研究,包括利用同一數(shù)據(jù)來源來比較不同編碼者之間的差異,不同的編碼者和數(shù)據(jù)庫的表現(xiàn)差異很大,有從40%到90%不等的可靠性。參見:Philip A.Schrodt and Christopher Donald, “Machine Coding of Events Data,” paper presented at the International Studies Association meetings, Washington DC, April 1990, p.6.,因此,事件分析方法的局限比較明顯。早年的代表性數(shù)據(jù)庫有魯?shù)婪颉斆罓枺≧udolph J.Rummel)的“國家的維度”(Dimensionality of Nations,DON; Rummel, 1972),查爾斯·赫爾曼(Charles Hermann)等的“國家事件比較研究”(Comparative Research on the Events of Nations,CREON; Hermann et al., 1977),愛德華·阿薩爾(Edward Azar)的 “沖突與和平數(shù)據(jù)集”(Conflict and Peace Data Bank,COPDAB; Azar, 1980, 1982; Azar and Sloan, 1975),查爾斯·麥克萊蘭(Charles McClelland)的“世界事件互動(dòng)測量” (World Event/Interaction Survey,WEIS; Charles McClelland,1976)等。這些數(shù)據(jù)庫被廣泛應(yīng)用于國際關(guān)系研究,尤其是關(guān)于沖突、動(dòng)亂和戰(zhàn)爭的研究。Philip A.Schrodt, “The Statistical Characteristics of Event Data,” International Interactions, Vol.20, No.1-2, 1994, pp.35-6.其中COPDAB和WEIS的數(shù)據(jù)在經(jīng)濟(jì)相互依賴與沖突的研究中時(shí)常被使用。Solomon W.Polachek, “Conflict and Trade,” Journal of Conflict Resolution, Vol.24, No.1, 1980, pp.55-78; Mark Gasiorowski and Solomon W.Polachek, “Conflict and Interdependence:East-West Trade and Linkages in the Era of Détente,” Journal of Conflict Resolution, Vol.26, No.4, 1982, pp.709-729; Jon C.Pevehouse, “Interdependence Theory and the Measurement of International Conflict,” The Journal of Politics, Vol.66, No.1, 2004, pp.247-266.在1970年代末和1980年代初,美國的政府機(jī)構(gòu)如國務(wù)院和國防部也組織了類似的項(xiàng)目,主要用于沖突預(yù)警。
在計(jì)算機(jī)廣泛應(yīng)用于社會(huì)科學(xué)研究之后,有學(xué)者將計(jì)算機(jī)程序自動(dòng)編碼引入事件分析之中,以解決廣度和成本的矛盾。從1980年代末和1990年代初開始,美國國家科學(xué)基金會(huì)(National Science Foundation, NSF)支持了“國際關(guān)系中的數(shù)據(jù)發(fā)展”項(xiàng)目(Data Development in International Relations, DDIR),利用計(jì)算機(jī)來自動(dòng)編碼新聞事件。在這項(xiàng)資金的支持下,堪薩斯大學(xué)的美國政治學(xué)家德波拉·耶納(Deborah J.Gerner)和菲利普·斯洛德特(Philip Shrodt)等人利用WEIS的事件編碼系統(tǒng),實(shí)現(xiàn)了自動(dòng)事件編碼處理,形成堪薩斯事件數(shù)據(jù)系統(tǒng)(Kansas Event Data System,KEDS),成為當(dāng)時(shí)最大的事件數(shù)據(jù)庫。耶納和斯洛德特等后來開發(fā)了新的編碼系統(tǒng)——沖突和調(diào)停事件觀察(Conflict and Mediation Event Observations, CAMEO),并為后來的大型事件數(shù)據(jù)庫所廣泛使用。另一個(gè)不太常用的自動(dòng)編碼系統(tǒng)是the Integrated Data for Event Analysis (IDEA),為另一個(gè)自動(dòng)事件數(shù)據(jù)項(xiàng)目the Protocol for the Assessment of Nonviolent Direct Action (PANDA)所使用。斯洛德特還開發(fā)了使用這個(gè)編碼系統(tǒng)的程序——以強(qiáng)化替換說明進(jìn)行的文本分析(Textual Analysis by Augmented Replacement Instructions, TABARI)。
2008年,美國國防部下的國防高級(jí)研究計(jì)劃局(Defense Advanced Research Projects Agency,DARPA)資助了一個(gè)事件數(shù)據(jù)庫項(xiàng)目“綜合沖突早期預(yù)警系統(tǒng)”(the Integrated Conflict Early Warning System,ICEWS),通過收集事件數(shù)據(jù)來進(jìn)行風(fēng)險(xiǎn)預(yù)警,主要是針對(duì)亞太地區(qū)。該項(xiàng)目資助開發(fā)了新的自動(dòng)編碼程序BBN ACCENT,達(dá)到了相當(dāng)高的準(zhǔn)確率,與人工編碼比照,大概在80%左右。Elizabeth Boschee, et al., “ICEWS Coded Event Data,” Harvard Dataverse, V22, 2015, https://doi.org/10.7910/DVN/28075; BBN ACCENT Event Coding Evaluation.updated v01.pdf這個(gè)數(shù)據(jù)庫在3年的試驗(yàn)期后轉(zhuǎn)交給了美國海軍。其數(shù)據(jù)涵蓋了1995年到當(dāng)下,并且大量數(shù)據(jù)已經(jīng)放置于哈佛的開源數(shù)據(jù)庫(Harvard Dataverse)中,不過開源部分的數(shù)據(jù)只能到當(dāng)前年份的前一年。美國國家科學(xué)基金會(huì)在2013年也再次資助了事件庫的開發(fā)和研究,目前有一個(gè)歷史數(shù)據(jù)庫(Cline Center Historical Phoenix Event Data)和一個(gè)實(shí)時(shí)數(shù)據(jù)庫(Phoenix Near-Real-Time Data),可以回溯到1945年,但是新聞來源相對(duì)有限。
the New York Times (1945—2005), the BBC Monitoring's Summary of World Broadcasts (1979—2015) and the CIA's Foreign Broadcast Information Service (1995—2004).目前最新的仍在進(jìn)行的工作是重新開發(fā)新的編碼系統(tǒng)——可驗(yàn)證事件數(shù)據(jù)的政治語言本體(Political Language Ontology for Verifiable Event Records, PLOVER)和編碼軟件——文本解析與相關(guān)編碼體系的派森引擎(Python Engine for Text Resolution and Related Coding Hierarchy,PETRARCH-2),而這將是事件數(shù)據(jù)庫發(fā)展的一個(gè)新階段,將取代目前主要數(shù)據(jù)庫所采用的CAMEO編碼系統(tǒng)。同時(shí)這些最新的開發(fā)工作都是開源的,源代碼都放在了開源社區(qū)Github中。
與前面述及的這些數(shù)據(jù)庫相比,GDELT要更為龐大。它是由卡勒夫·李塔魯(Kalev Hannes Leetaru)和斯洛德特在2012年啟動(dòng)的一個(gè)項(xiàng)目。它也是使用計(jì)算機(jī)自動(dòng)編碼的方式,從全球超過100種語言的媒體中自動(dòng)挖掘信息,將新聞信息編碼成一個(gè)個(gè)事件的輸入。其中,最重要的3個(gè)信息來源是法新社、美聯(lián)社和新華社。時(shí)間范圍是從1979年到現(xiàn)在,并將擴(kuò)展到1800年。同時(shí),計(jì)算機(jī)每天都會(huì)從世界各地的媒體中持續(xù)收集信息,日增約10萬個(gè)事件。編碼體系采用的是CAMEO系統(tǒng)。在CAMEO系統(tǒng)中總共有20個(gè)大類超過300種不同的事件類型。而GDELT又將300多類的事件最終分成4個(gè)大類,即言語合作(verbal cooperation)、現(xiàn)實(shí)合作(material cooperation)、言語對(duì)抗(verbal conflict)和現(xiàn)實(shí)對(duì)抗(material conflict)。GDELT項(xiàng)目的每一個(gè)輸入包含了許多不同的信息項(xiàng)目,從1979年到2013年3月31日止的輸入包含57個(gè)信息,而2013年4月1日開始則增加到58個(gè)信息,增加了信息的來源以便核對(duì)。這些信息包括每個(gè)事件的時(shí)間,行為主體和行為對(duì)象的國家、名字、組織、類別,事件本身的性質(zhì)、影響程度、在所有來源中被提及的次數(shù),描述的語氣,事件的地理信息(包括經(jīng)緯度等)以及錄入日期、信息來源,等等。目前的數(shù)據(jù)已達(dá)數(shù)以億計(jì),并可以免費(fèi)獲得。
數(shù)據(jù)規(guī)模的龐大以及容易獲得使得GDELT一經(jīng)推出就引起了廣泛關(guān)注和討論,雖然事件數(shù)據(jù)庫主要用于沖突研究,但也已經(jīng)有一些研究嘗試?yán)肎DELT來測量雙邊關(guān)系。如帕斯卡·阿卜(Pascal Abb)和蓋爾·斯特伍(Georg Strüver)的文章利用GDELT來衡量中國與東盟各國的關(guān)系,即利用GDELT事件數(shù)據(jù)中每個(gè)事件的Goldstein分值來衡量雙邊關(guān)系。Goldstein分值衡量了沖突或者合作事件的強(qiáng)度。他們將中國與東盟各個(gè)國家每年所有相關(guān)事件的Goldstein分值的平均值作為測量方式。Pascal Abb and Georg Strüver, “Regional Linkages and Global Policy Alignment:The Case of China-Southeast Asia Relations”, SSRN, March 15, 2015, https://ssrn.com/abstract=2600419 or http://sci-hub.tw/10.2139/ssrn.2600419.
國內(nèi)利用事件數(shù)據(jù)庫來測量雙邊關(guān)系開始得相對(duì)較晚。最早的研究來自李少軍,他2002年的一篇文章從《人民日?qǐng)?bào)》中選取了克林頓政府期間中美關(guān)系的642個(gè)事件,并通過給每個(gè)事件賦值然后再求和計(jì)算的方式來判斷中美關(guān)系的沖突與合作水平。李少軍:《“沖突—合作模型”與中美關(guān)系的量化分析》,《世界經(jīng)濟(jì)與政治》2002年第4期,第43—49頁。而最有影響力的研究是來自清華大學(xué)閻學(xué)通團(tuán)隊(duì)的系統(tǒng)工作。他們建立了一套自己的編碼體系,然后采用了人工編碼的方式見“事件分值基準(zhǔn)表”,閻學(xué)通、周方銀:《 國家雙邊關(guān)系的定量衡量》,《中國社會(huì)科學(xué)》2004年第6期,第101—103頁。,主要基于《人民日?qǐng)?bào)》和外交部的數(shù)據(jù),系統(tǒng)地梳理了從1953年開始的最為重要的中國雙邊關(guān)系的月度變化數(shù)據(jù),包括中國與美、日、俄、英、法、澳、越、印尼、巴基斯坦的關(guān)系。通過對(duì)每個(gè)月發(fā)生的雙邊關(guān)系事件的賦值打分和加總計(jì)算,展示了中國這些重要雙邊關(guān)系的演變,為實(shí)證研究雙邊關(guān)系的變化及其影響提供了非常重要的數(shù)據(jù)支持,產(chǎn)生了一系列重要的學(xué)術(shù)成果。但是,由于基于人工編碼的方式,所涉及的工作量極大,也因而難以擴(kuò)展到更多的信息來源,而這也是許多評(píng)論者認(rèn)為還需要改進(jìn)的方面。陳定定:《定量衡量的得與失——簡評(píng)〈中外關(guān)系鑒覽1950—2005:中國與大國關(guān)系定量衡量〉》,《國際政治研究》2010年第4期,第163頁;董青嶺:《從事件賦值走向關(guān)系賦值:雙邊關(guān)系的定量衡量——評(píng)〈中外關(guān)系鑒覽1950— 2005:中國與大國關(guān)系定量衡量〉》,《外交評(píng)論》2011年第2期,第155頁。
事件大數(shù)據(jù)的出現(xiàn)提供了一個(gè)新的機(jī)會(huì)來重新思考雙邊關(guān)系的度量,在這種全覆蓋的方式下我們是否可以獲得更為準(zhǔn)確的數(shù)值呢?接下來本文將以中美關(guān)系的測量為例,探討如何利用事件大數(shù)據(jù)來度量雙邊關(guān)系,并討論其準(zhǔn)確性以及潛在的問題和應(yīng)對(duì)。
二、 GDELT與中美關(guān)系(1993—2016)的測量
(一) 計(jì)算方法
雖然GDELT包含了海量數(shù)據(jù)可供進(jìn)一步分析,但是我們?nèi)孕枰獙⑦@些事件通過一定的算法進(jìn)行處理來變成一個(gè)關(guān)系的量值?;贕DELT中能夠獲取的信息,有五種方式可以構(gòu)建出關(guān)系量值。
第一,由于GDELT中每一個(gè)事件最終都可以歸結(jié)成沖突事件或合作事件,所以計(jì)算每年合作數(shù)量與沖突數(shù)量的比值就可以衡量出雙邊關(guān)系的好壞。如果合作事件與沖突事件的比值很高,那么說明合作事件的數(shù)量要遠(yuǎn)多于沖突事件,那么就可以認(rèn)為雙邊關(guān)系處于較為良好的狀態(tài)。通過觀察年度數(shù)據(jù)的變化,自然也就可以衡量出雙邊關(guān)系的變化。這種方式的問題在于沒有將事件的強(qiáng)度考慮進(jìn)去,有些事件可能比另外一些事件對(duì)雙邊關(guān)系的影響更大。
第二,也可以將合作事件數(shù)量減去沖突事件數(shù)量的差值作為雙邊關(guān)系的一個(gè)衡量。但是這個(gè)方法在當(dāng)下使用會(huì)遇到嚴(yán)重的問題,即事件數(shù)量的逐年增加。由于過去幾十年中技術(shù)的飛速進(jìn)步、網(wǎng)絡(luò)對(duì)社會(huì)生活滲透程度的巨大變化以及跨國交往的急劇增加,數(shù)據(jù)庫收錄的事件數(shù)量越往后越多,直接的差值也會(huì)隨著年份往后而急劇變大,因而很難用來測量雙邊關(guān)系的變化。當(dāng)然,如果將來技術(shù)和社會(huì)變革到了平臺(tái)期,這種方式可能也可以較好地反映雙邊關(guān)系的變化。此外,這種方法也沒有考慮到事件之間強(qiáng)度的差異。
第三種方法略有不同。由于GDELT也給出了每個(gè)事件的Goldstein分值,這個(gè)值衡量了事件的強(qiáng)度,因此也可以用這個(gè)值來構(gòu)建雙邊關(guān)系的值??梢詫⑺惺录腉oldstein分值相加,最后的結(jié)果即雙邊關(guān)系的賦值。這種測量方式的問題是事件的影響并不能相互抵消,即即便一個(gè)合作事件與一個(gè)沖突事件的影響的Goldstein值相同,在計(jì)算中會(huì)相互抵消,但是現(xiàn)實(shí)中對(duì)關(guān)系的影響也可能依然存在,尤其是在雙邊的復(fù)雜關(guān)系中。同時(shí),一個(gè)Goldstein值為-10的事件對(duì)關(guān)系的影響也很難同10個(gè)Goldstein值為-1的事件的影響等同。此外,這種計(jì)算方式也無法反映出事件數(shù)量。而在雙邊關(guān)系的大部分事件為低烈度事件的時(shí)候,事件數(shù)量可能比強(qiáng)度能更好地把握雙邊關(guān)系。同時(shí),這個(gè)方法也會(huì)受到事件數(shù)據(jù)的自然膨脹的影響,遇到與第二種方法類似的問題,所以如果要使用大數(shù)據(jù)事件庫來測量計(jì)算的話,這個(gè)方法會(huì)有內(nèi)在缺陷,導(dǎo)致它也不是很適合使用。李少軍利用事件數(shù)據(jù)來衡量中美關(guān)系的論文實(shí)際上就是采用了這個(gè)計(jì)算方法,當(dāng)然,他的數(shù)據(jù)來源是單一的,不存在逐年自然擴(kuò)張的問題,因此準(zhǔn)確度要更高一些。
第四種方法基于Goldstein分值的計(jì)算,是在將所有事件的Goldstein分值加總以后,再除以事件數(shù),得出所有事件的平均Goldstein值作為雙邊關(guān)系的一個(gè)度量。阿卜和斯特伍的文章對(duì)于中國與東南亞國家關(guān)系的度量即采用了這種方法。這種方法解決了事件數(shù)量隨年份增加的問題,但是也沒有解決事件之間相互抵消的問題。當(dāng)然,這也是所有通過事件來衡量關(guān)系的方法都會(huì)遇到的問題,即一個(gè)正值事件與一個(gè)負(fù)值事件或者一個(gè)高值事件與多個(gè)低值事件之間的權(quán)衡問題。
第五種方法也是基于Goldstein分值,即分別計(jì)算沖突事件和合作事件的Goldstein分值的平均值,然后以兩者比值的絕對(duì)值作為雙邊關(guān)系的衡量。由于沖突數(shù)據(jù)的Goldstein分值為負(fù)數(shù),所以最后比值也為負(fù)數(shù),故取絕對(duì)值。取平均值是為了避免事件數(shù)量在不同年份的巨大差異。這種方式測量的雙邊關(guān)系值是合作事件和沖突事件的平均強(qiáng)度的比值。這里也會(huì)遇到與第三種方法相同的問題,即無法反映出事件的數(shù)量。同時(shí)也會(huì)遇到事件之間的折算問題,比如,一個(gè)Goldstein值為5的事件是否對(duì)雙邊關(guān)系的影響等于5個(gè)Goldstein值為1的事件。同時(shí),在對(duì)計(jì)算值的解釋上也會(huì)有一定的困難。雙邊關(guān)系中合作事件和沖突事件的平均強(qiáng)度的比值作為雙邊關(guān)系的衡量不夠直觀,在具體進(jìn)行研究的時(shí)候會(huì)遇到對(duì)結(jié)果的闡釋問題。
除計(jì)算方法外,這里還會(huì)涉及時(shí)間段的選擇問題。用事件數(shù)據(jù)庫的方法來進(jìn)行測量,我們必須選擇特定的時(shí)間段即一個(gè)時(shí)期內(nèi)發(fā)生的事件,這個(gè)時(shí)期可以是一周、一個(gè)月、一年或者任意長度的時(shí)間段。閻學(xué)通和周方銀對(duì)李少軍以及一般的用事件數(shù)據(jù)來衡量關(guān)系的一個(gè)批評(píng),是事件分析法沒有將歷史考慮進(jìn)去,基于事件的分析總是從零開始計(jì)算關(guān)系。某個(gè)月沒有發(fā)生沖突或者合作的事件,雙邊關(guān)系也并不會(huì)是零。如果某個(gè)月都是負(fù)值事件,也不表示兩國關(guān)系就是以沖突為主。閻學(xué)通、周方銀:《 國家雙邊關(guān)系的定量衡量》,《中國社會(huì)科學(xué)》2004年第6期,第92頁。這一批評(píng)有一定的合理性,但是并不完全準(zhǔn)確。這個(gè)問題的實(shí)質(zhì)是時(shí)間段選擇的問題。一個(gè)月內(nèi)發(fā)生的事件可能具有一定的偶然性,一個(gè)月內(nèi)可能確實(shí)不會(huì)發(fā)生大的事情或者都是同一方向的,但是如果選取的時(shí)間段足夠長,那么對(duì)該時(shí)間段內(nèi)所有雙邊事件的考察應(yīng)該足以反映出雙邊關(guān)系。在較長的一個(gè)時(shí)間段內(nèi),兩國關(guān)系的種種不同方面應(yīng)該都會(huì)通過事件反映出來,畢竟歷史本身也就只是一個(gè)時(shí)間段。筆者認(rèn)為,在用事件衡量雙邊關(guān)系時(shí),一年是一個(gè)比較合適的時(shí)間區(qū)間。一年內(nèi)發(fā)生的事件應(yīng)該足以體現(xiàn)雙邊關(guān)系的歷史性基礎(chǔ),因?yàn)槿祟惿鐣?huì)的計(jì)劃周期也一般以一年為基礎(chǔ),比如年齡計(jì)算、預(yù)算周期、工作報(bào)告,等等。而在政治世界中,年度周期也是比較明顯的,比如年度峰會(huì)、年度會(huì)晤、年度報(bào)告,等等??紤]到當(dāng)今世界雙邊關(guān)系的互動(dòng)程度,在一年之內(nèi)沒有發(fā)生合作或者沖突事件或者只發(fā)生一種類型事件的可能性是可以忽略的。還有一個(gè)考量是基于與現(xiàn)實(shí)的其他數(shù)據(jù)庫的匹配,政治類的數(shù)據(jù)庫多以年度更新為主,故以年度事件數(shù)據(jù)為依據(jù)計(jì)算也便于結(jié)合其他的數(shù)據(jù)進(jìn)行分析。因此,在以事件數(shù)據(jù)來計(jì)算雙邊關(guān)系時(shí),采用年度變化值是比較合適的,基本能夠避免測量非歷史性的批評(píng)。
(二)測量的準(zhǔn)確性
討論完測量方法之后的另一個(gè)問題,就是如何知道我們的測量是否可靠地、比較真實(shí)地反映了雙邊關(guān)系的事實(shí),而這也是測量最為重要的一個(gè)方面。
最為直接和常見的方法當(dāng)然是與我們的常識(shí)相比較,如果度量的結(jié)果過于反常識(shí),可能就意味著測量或者計(jì)算的方法有一定的問題。比如,如果兩國之間發(fā)生戰(zhàn)爭,雙邊關(guān)系的值反而顯示出雙邊關(guān)系更為友好,那么對(duì)雙邊關(guān)系的測量顯然是有嚴(yán)重的偏誤。比常識(shí)更為嚴(yán)格的檢驗(yàn)是專業(yè)人士的共識(shí),畢竟專家們能夠掌握更多更全面的信息,對(duì)雙邊關(guān)系這種復(fù)雜事實(shí)的把握要比常識(shí)更為可靠,所以我們的測量值也可以同專家們比較一致的意見相比較來考察其準(zhǔn)確度。但是這兩種方法都是定性的考察,而我們的測量則是定量的。要想較為準(zhǔn)確地比較定性和定量的分析存在方法論上的困難,畢竟定性語言的含混性與定量語言的準(zhǔn)確性之間有難以彌合的鴻溝。定性語言的區(qū)分度要更低一些,從數(shù)值3到3.5或者4的變化在定性研究者看來也許都屬于友好關(guān)系,難以再進(jìn)行進(jìn)一步的區(qū)分。
如果我們使用定量的方法來檢驗(yàn),那么我們可以使用的方法包括與現(xiàn)成的數(shù)據(jù)庫相比較,又或者通過替換數(shù)據(jù)源的方式。具體到用GDELT的數(shù)據(jù)來衡量中美關(guān)系,我們可以與清華大學(xué)中國與大國關(guān)系數(shù)據(jù)庫中的中美關(guān)系值相比較。由于后者已經(jīng)給出了中美關(guān)系的月度變化值,所以將計(jì)算結(jié)果與之比較就能考察利用事件大數(shù)據(jù)進(jìn)行雙邊關(guān)系測量的準(zhǔn)確性,并且由于清華大學(xué)的數(shù)據(jù)來自于人工篩選和計(jì)算,這種比較就顯得更有價(jià)值。需要說明的是,由于基本方法論和計(jì)算方式上的差別,直接的數(shù)值比較并沒有意義,能夠進(jìn)行比較的應(yīng)該是對(duì)趨勢的把握,即雙邊關(guān)系的變化趨勢在兩種測量方式下的比較。
當(dāng)然,定性和定量的方法在思考測量的準(zhǔn)確性時(shí)可以同時(shí)使用,并非相互排斥。
(三) 中美關(guān)系(1993—2016)
基于前面的論述,這一部分將具體討論用GDELT來測量雙邊關(guān)系。由于中美關(guān)系的重要性,現(xiàn)有的通過事件數(shù)據(jù)來測量雙邊關(guān)系的研究都特別關(guān)注中美關(guān)系,也選取中美關(guān)系進(jìn)行測量,而這也有利于將本文的研究置于對(duì)中美關(guān)系的普遍關(guān)注和討論中。另一方面,GDELT中,時(shí)間越往后,數(shù)據(jù)的數(shù)量越多,所以本文選擇的時(shí)間范圍是冷戰(zhàn)結(jié)束以后,即克林頓執(zhí)政(1993年)以后。由于用于比較的數(shù)據(jù)可獲得性的原因,本文數(shù)據(jù)截止于2016年底。因此,本文研究的時(shí)間范圍是1993年至2016年。在這段時(shí)期內(nèi),中美關(guān)系整體上處于一個(gè)較為穩(wěn)定的狀態(tài)。
筆者首先從GDELT提供的數(shù)據(jù)中選取了從1993年到2016年中美政府間的事件,將其按照4個(gè)大類計(jì)算;同時(shí)由于區(qū)分了施動(dòng)者,所以又可以分為中國對(duì)美國的事件和美國對(duì)中國的事件,簡單的總和計(jì)數(shù)如表1所示??梢园l(fā)現(xiàn),合作事件要遠(yuǎn)遠(yuǎn)多于沖突事件,而言語合作事件又要多于言語沖突事件。并且中美各自發(fā)起的沖突和合作的事件數(shù)量也大體相同,體現(xiàn)了兩個(gè)大國之間較為對(duì)等的關(guān)系。合作事件要遠(yuǎn)遠(yuǎn)多于沖突事件,這應(yīng)該也是符合常識(shí)和多數(shù)專家意見的,即中美兩國雖然時(shí)有沖突,但是還是合作更多。
清華大學(xué)的中國與大國關(guān)系數(shù)據(jù)庫顯示,中美關(guān)系在這個(gè)區(qū)間內(nèi)也是正值要遠(yuǎn)多于負(fù)值(按該數(shù)據(jù)庫的定義說明,關(guān)系在普通區(qū)間以上,即合作多于沖突)。學(xué)術(shù)界的普遍看法是,冷戰(zhàn)后從克林頓政府開始,美國對(duì)華采取了接觸政策(engagement)為主的戰(zhàn)略,強(qiáng)調(diào)以合作塑造中國的行為,對(duì)這一政策的反思近年來在美國學(xué)界和政界頗多,可參見:Kurt Campbell and Ely Ratner, “The China Reckoning:How Beijing Defied American Expectations,” Foreign Affairs, Vol.97, March/April Issue, 2018, pp.60-70.這篇Foreign Affairs上的文章引發(fā)了一些最為知名的中美關(guān)系學(xué)者對(duì)美國對(duì)華政策以及中美關(guān)系的討論,參見:Wang Jisi et al., “Did America Get China Wrong?:The Engagement Debate,” Foreign Affairs, July/August Issue 2018, https://www.foreignaffairs.com/articles/china/2018-06-14/did-america-get-china-wrong.對(duì)美國政府對(duì)華政策的內(nèi)部考量,還可參見:Michael Green, By More Than Providence:Grand Strategy and American Power in the Asia Pacific since 1783 (New York:Columbia University Press, 2017).另一方面,雖然承認(rèn)中美之間在利益上有差異和沖突,但國內(nèi)學(xué)者也認(rèn)為合作是冷戰(zhàn)后的中美關(guān)系的基本基調(diào),參見:王緝思:《淺論中美關(guān)系的大環(huán)境和發(fā)展趨勢》,《美國研究》2006年第1期,第89—96頁;金燦榮、段皓文:《當(dāng)前中美關(guān)系的問題與出路》,《國際觀察》2014年第1期,第71—83頁。 當(dāng)然,主流的說法是“中美關(guān)系好不到哪里去,也壞不到哪里去”,強(qiáng)調(diào)對(duì)分歧的管控。
前文已經(jīng)討論了5種將事件轉(zhuǎn)化為關(guān)系的算法,在現(xiàn)有的GDELT中,不同年度收錄的事件數(shù)據(jù)有著比較大的差異,并且越往后的年度數(shù)據(jù)越多,因此基于差值計(jì)算的方法將會(huì)面臨年度數(shù)據(jù)越往后越大的問題,很難反映出是關(guān)系的變化還是數(shù)據(jù)收集技術(shù)的變化帶來的差別。本文采用合作與沖突事件次數(shù)的比值和年度平均Goldstein分值的方法進(jìn)行計(jì)算。
首先是用合作和沖突事件次數(shù)比值的方法。這種計(jì)算方法暗含的假定是所有事件的權(quán)重相同。閻學(xué)通和周方銀的文章已經(jīng)證明,即便只計(jì)算事件的個(gè)數(shù)(假定權(quán)重賦值都相同),得出的結(jié)果依然是相當(dāng)準(zhǔn)確的。閻學(xué)通、周方銀:《 國家雙邊關(guān)系的定量衡量》,《中國社會(huì)科學(xué)》2004年第6期,第96頁。筆者隨后計(jì)算了中美從1993年到2016年每年的合作和沖突事件的比值(圖1)??梢钥吹?,合作事件遠(yuǎn)多于沖突事件,兩者的比值較大。但是隨著時(shí)間的推移,雖然具體年份值的高低并不是一個(gè)線性的變化過程,但是這個(gè)值有減少的趨勢,也就是說沖突事件的比例在上升,這意味著雙邊關(guān)系有逐漸緊張的趨勢。需要說明的是,雖然有這種趨勢變化,但中美之間仍是合作遠(yuǎn)多于沖突。這符合我們一般的對(duì)中美關(guān)系的認(rèn)知,即中美關(guān)系總體是和平合作的,而隨著中國國力的逐漸增強(qiáng),中美之間競爭的一面會(huì)越來越強(qiáng)。閻學(xué)通將中美關(guān)系總結(jié)為“假朋友關(guān)系”,兩者之間關(guān)系不穩(wěn)定,時(shí)有沖突,長期來看對(duì)抗的趨勢不可避免。另外一個(gè)有意思的現(xiàn)象是,在GDELT測量值中,一般在總統(tǒng)選舉年中美關(guān)系的值都處于低值(除了1996年),這大概與選舉年美國的政客需要表現(xiàn)強(qiáng)硬有關(guān)系,雙方的言語沖突會(huì)更多一些。
如前所說,GDELT的所有事件都區(qū)分了施動(dòng)者和受動(dòng)者,所以我們也可以將中美對(duì)對(duì)方的政策給出類似的測量,用來衡量政策的合作和沖突的程度(圖2)。與雙邊關(guān)系的總體情況類似,兩國的政策也是合作為主,但是競爭的一面隨著時(shí)間的推移在緩慢地增加。并且相對(duì)而言,中國的政策穩(wěn)定性可能要更強(qiáng)一些(趨勢線的斜率要略小于美國),但是近年來兩國的政策越來越趨近。但是這個(gè)結(jié)果受到1998年的異常值影響較大。如果在數(shù)據(jù)中刪除1998年的值,則中美兩國的趨勢線則幾乎是平行的。這種測量是相對(duì)于清華大學(xué)中國與大國關(guān)系數(shù)據(jù)庫的一個(gè)優(yōu)勢,在清華數(shù)據(jù)庫中并不能區(qū)分出行為方向,而是從一個(gè)第三者的角度去觀察。在某些研究中,這種對(duì)雙方政策的描述會(huì)有重要的用途,比如考察中美兩國對(duì)對(duì)方的政策如何影響其他國家的相關(guān)政策。
從常識(shí)和專家意見來看,通過GDELT大數(shù)據(jù)的直接測量可以抓住雙邊關(guān)系的一些基本事實(shí)。為了進(jìn)一步考察其準(zhǔn)確性,筆者將其與清華大學(xué)中國與大國關(guān)系數(shù)據(jù)庫中的中美關(guān)系值作了比較。由于計(jì)算方法不同,所以兩者的分值不能直接比較,這里比較的是趨勢變化。由于GDELT中計(jì)算出來的值較大,為了便于觀察,從GDELT中計(jì)算的值都除以10。同時(shí),對(duì)清華大學(xué)的月度數(shù)據(jù)分別采用取年平均值和年末月度值的方式來轉(zhuǎn)化成年度值。由于年末的數(shù)據(jù)反映了當(dāng)年前11個(gè)月的雙邊關(guān)系運(yùn)行的結(jié)果,所以第12個(gè)月也可以作為當(dāng)年的關(guān)系值。圖3和圖4即結(jié)果。
簡單來看,兩種方式計(jì)算的值的變化比較相似,比如,不管哪種測量,都認(rèn)為冷戰(zhàn)后中美關(guān)系的峰值在1998年,但是谷值卻有所不同。其中的差異在于,如果某年發(fā)生了極為負(fù)面的事件,在清華大學(xué)的數(shù)據(jù)里面影響要更大一些,而由于只是事件計(jì)數(shù),如果當(dāng)年也發(fā)生了很多合作性的事件,那么從GDELT中計(jì)算出來的數(shù)值就不會(huì)是極低值。比如在1996年,雖然臺(tái)海危機(jī)導(dǎo)致兩國關(guān)系非常緊張,但是在當(dāng)年3月危機(jī)之后,兩國關(guān)系即過了最低點(diǎn),緊接著1997年和1998年雙方元首互訪,并將關(guān)系定位于“戰(zhàn)略伙伴關(guān)系”,因此1996年在GDELT的測量值中不會(huì)出現(xiàn)極低值。類似的是2001年,雖然發(fā)生了南海撞機(jī)事件,但是“9·11”事件之后兩國關(guān)系的迅速改善也使得當(dāng)年的值不會(huì)是極低值。這種差別也貫穿在其他年份中,比如1997年和2004年。也需要看到,清華大學(xué)數(shù)據(jù)本身的年平均值與年末值也有差異。GDELT計(jì)算的數(shù)據(jù)與清華大學(xué)的數(shù)據(jù)在2005年之后的變化曲線要更為相似一些,這可能與GDELT的數(shù)據(jù)來源有關(guān),事件越早,GDELT中的數(shù)據(jù)越少,所以偏誤的可能性也更大,這在后文討論大數(shù)據(jù)的缺陷和問題時(shí)再進(jìn)一步討論。
當(dāng)然,最根本的區(qū)別在于趨勢線,不管是用年平均值還是用年末值來計(jì)算,清華大學(xué)中國與大國關(guān)系數(shù)據(jù)庫的年度數(shù)據(jù)都有上升的趨勢,即雙邊關(guān)系有逐步改善的傾向,只是在2016年奧巴馬執(zhí)政的最后一年有一個(gè)急劇的下滑。具體來看,清華大學(xué)數(shù)據(jù)顯示,奧巴馬時(shí)期的中美關(guān)系總體要好于小布什時(shí)期,除了最后兩年的急劇下滑。但是GDELT數(shù)據(jù)顯示,奧巴馬時(shí)期總體不如小布什時(shí)期,最后兩年的下滑也沒有那么戲劇化。這種差別很可能源于GDELT對(duì)于南海中美沖突事件的抓取要多于清華大學(xué),畢竟清華大學(xué)的主要源數(shù)據(jù)來自于外交部和《人民日?qǐng)?bào)》,相關(guān)內(nèi)容的報(bào)道比GDELT數(shù)據(jù)源要少??傮w來看,通過計(jì)算GDELT中合作和沖突事件的比值來度量中美雙邊關(guān)系具有一定的學(xué)術(shù)價(jià)值,值得進(jìn)一步考察。
另一種測量方法是計(jì)算Goldstein年平均值(圖5、圖6)。這個(gè)值波動(dòng)幅度很小,在整個(gè)時(shí)間段內(nèi)都在2~3之間浮動(dòng),整體趨勢略微向下。如果我們關(guān)注其折線變化的話,可以發(fā)現(xiàn)其波動(dòng)變化趨勢與合作沖突比計(jì)算結(jié)果的變化幾乎是一致的,只是幅度要小得多,而與清華數(shù)據(jù)也有一定程度的相似性。最為明顯的差別是在2015年、2016年,Goldstein分值的平均值計(jì)算顯示雙邊關(guān)系有好轉(zhuǎn),與其他測量都是相反的結(jié)果。此外,與其他測量值相比,Goldstein平均值這種計(jì)算方法似乎沒有很好地反映出雙邊關(guān)系的波動(dòng)性,其年度之間的變化強(qiáng)度比其他度量要更小。可能的原因是在當(dāng)前中美關(guān)系的情勢下,事件數(shù)量比權(quán)重的考慮更為重要。在低烈度競爭狀態(tài)下,將所有事件的權(quán)重近似為相同得出的結(jié)果可能更能把握雙邊關(guān)系的實(shí)質(zhì),與前文所引的閻學(xué)通和周方銀的結(jié)論類似。而這可能也是用GDELT事件數(shù)量比值的測量更能把握雙邊關(guān)系趨勢的一個(gè)原因。
三、 大數(shù)據(jù)測量雙邊關(guān)系的問題與解決方法
雖然基于如GDELT這種大數(shù)據(jù)事件庫的測量為雙邊關(guān)系度量帶來一種新的覆蓋面更廣也更為簡便的實(shí)現(xiàn)方法,但是它也存在著很多問題需要解決。需要說明的是,這些問題很多也存在于人工編碼的事件數(shù)據(jù)庫中,并且人工編碼還涉及不同的編碼者之間不一致的問題,所以并非人工編碼就一定優(yōu)于機(jī)器編碼。接下來這一部分將側(cè)重探討機(jī)器編碼事件大數(shù)據(jù)庫可能遇到的問題及其可能的解決途徑。
(一) 數(shù)據(jù)來源的質(zhì)量問題
對(duì)于所有的大數(shù)據(jù)研究來說,數(shù)據(jù)來源的可靠性問題都是最為重要的。如果數(shù)據(jù)的源頭被污染,那么所有結(jié)論都會(huì)被質(zhì)疑。具體對(duì)于如GDELT這種事件數(shù)據(jù)庫而言,其數(shù)據(jù)質(zhì)量問題也一直是有爭議的,很多學(xué)者也主張數(shù)據(jù)在使用之前需要進(jìn)行“數(shù)據(jù)清洗”董青嶺:《反思國際關(guān)系研究中的大數(shù)據(jù)應(yīng)用》,《探索與爭鳴》2016年第7期,第91—94頁。。數(shù)據(jù)質(zhì)量問題的原因有很多種,比較嚴(yán)重的包括報(bào)道視角、重復(fù)和新聞質(zhì)量。
在所有的新聞報(bào)道中,報(bào)道者都有其視角,因此必然會(huì)包含其對(duì)問題有意識(shí)或者無意識(shí)的特定看法,這無疑會(huì)導(dǎo)致由此生成的事件數(shù)據(jù)也帶有同樣的偏見,進(jìn)而難以用來客觀地測量雙邊關(guān)系。當(dāng)然,這不僅僅限于大數(shù)據(jù)事件庫,在人工數(shù)據(jù)庫中,由于涉及大量的勞動(dòng)力和高強(qiáng)度的重復(fù)工作,往往只能有選擇性地偏重于特定數(shù)據(jù)來源。比明顯的偏見更為嚴(yán)重的問題則涉及更為根本的哲學(xué)爭論,即對(duì)事件的報(bào)道并不是一個(gè)完全客觀的問題,報(bào)道者及闡釋者都參與建構(gòu)了事實(shí)。事件數(shù)據(jù)庫往往只選擇了特定解釋、“唯一的”解釋、假想的“上帝視角”客觀無偏差地看待一件事的發(fā)生。Gavan Duffy, “Events and Versions:Reconstructing Event Data Analysis,” International Interactions, Vol.20, No.1-2, 1994, pp.147-167.現(xiàn)實(shí)情況是同一個(gè)事件存在著多個(gè)不同版本的敘事,而對(duì)于計(jì)算機(jī)編碼而言,被編碼成不同事件的可能性很大。這就涉及收錄新聞事件重復(fù)的問題。如果是對(duì)同一事實(shí)不同角度的表述,那么是否屬于重復(fù)就需要進(jìn)一步探討。
除了新聞事件中的多重視角和建構(gòu)問題,重復(fù)錯(cuò)誤也是大數(shù)據(jù)事件庫中普遍存在的一個(gè)問題。在今天媒體活躍的時(shí)代,同一個(gè)事件在一定時(shí)間內(nèi)會(huì)被反復(fù)地、類似地描述和報(bào)道,并被大量的媒體轉(zhuǎn)載報(bào)道。在這種情況下,計(jì)算機(jī)可能會(huì)自動(dòng)抓取這些重復(fù)數(shù)據(jù),使得數(shù)據(jù)庫中收錄的事件數(shù)據(jù)要(大大)多于實(shí)際所發(fā)生的數(shù)據(jù)。沃德(Ward)等人則將GDELT與另一個(gè)機(jī)器自動(dòng)編碼的事件數(shù)據(jù)庫ICEWS相比較,他們發(fā)現(xiàn)GDELT編碼的事件與ICEWS編碼有相當(dāng)?shù)某鋈?,前者要比后者?shù)量龐大得多。他們認(rèn)為GEDLT編碼的事件比實(shí)際要多Michael D.Ward et al., “Comparing GDELT and ICEWS Event Data,” Analysis, ?Vol.21, No.1, 2013, pp.267-297.,而ICEWS則比實(shí)際少。在某些受事件數(shù)量影響的特定算法下,這可能會(huì)嚴(yán)重干擾雙邊關(guān)系測量的準(zhǔn)確性。
事件數(shù)據(jù)庫還存在著源新聞質(zhì)量的問題,即新聞錯(cuò)誤甚至是假新聞,尤其是在媒體和自媒體更為發(fā)達(dá)的今天,在這個(gè)極為強(qiáng)調(diào)媒體時(shí)效性的時(shí)代,新聞出現(xiàn)錯(cuò)誤甚至是故意制造假新聞的情況都不罕見。2016年的美國總統(tǒng)大選就飽受假新聞困擾,假新聞甚至被認(rèn)為對(duì)最后結(jié)果產(chǎn)生了巨大影響。如果沒有甄別出來這種新聞錯(cuò)誤或者假新聞,事件數(shù)據(jù)庫的客觀性必然會(huì)受到影響,進(jìn)而影響到對(duì)雙邊關(guān)系的客觀測量。
針對(duì)這些問題,也有特定的途徑來解決或者減少它們對(duì)于最終數(shù)據(jù)和結(jié)果的影響。首先,擴(kuò)大數(shù)據(jù)源和增加更多數(shù)據(jù)。更多數(shù)據(jù)和更廣覆蓋范圍可以使得偏見問題得到部分解決,如果我們認(rèn)為人的偏見是內(nèi)在的、難以避免的,那么包含了所有偏見的數(shù)據(jù)比只包含特定偏見的數(shù)據(jù)就要更為準(zhǔn)確和客觀。同時(shí),如果我們能夠增加更多可靠的數(shù)據(jù)源,那么假新聞和新聞錯(cuò)誤的影響也會(huì)被相應(yīng)地縮小。當(dāng)數(shù)據(jù)量極大的時(shí)候,即便存在一部分錯(cuò)誤和重復(fù),其對(duì)最終結(jié)果也不會(huì)有影響。其次,利用人工智能識(shí)別假新聞和新聞錯(cuò)誤。深度學(xué)習(xí)很適合用于發(fā)現(xiàn)數(shù)據(jù)中的特定模式,因此,通過訓(xùn)練能讓機(jī)器自動(dòng)過濾很多假新聞和新聞錯(cuò)誤。目前,很多大科技公司已經(jīng)在利用類似的算法來識(shí)別和過濾假新聞Josh Constine, “Facebook Chose To Fight Fake News With AI, Not Just User Reports,”Tech Crunch, Nov 15, 2016, ?https://techcrunch.com/2016/11/14/facebook-fake-news/.。最后,適時(shí)的人工干預(yù)。對(duì)最終數(shù)據(jù)進(jìn)行人工篩查依然是最為可靠的解決方式之一。當(dāng)然,這種方法隨著數(shù)據(jù)量的增加會(huì)越來越不現(xiàn)實(shí)和低效,但是這種工作可以依靠計(jì)算機(jī)輔助,有選擇性地對(duì)特定數(shù)據(jù)進(jìn)行篩查以提高效率。
(二) 編碼系統(tǒng)與編碼程序
事件數(shù)據(jù)庫面臨的第二個(gè)挑戰(zhàn)來自自動(dòng)編碼系統(tǒng)和編碼程序。目前自動(dòng)編碼系統(tǒng)生成的事件數(shù)據(jù)庫使用的基本都是CAMEO,而編碼程序則有斯洛德特的TABARI和ICEWS自己開發(fā)的BBK-ACCENT。根據(jù)與人工編碼的數(shù)據(jù)比較,目前BBK-ACCENT編碼程序的準(zhǔn)確率可以達(dá)到80%左右,但這也意味著仍然有數(shù)量相當(dāng)巨大的錯(cuò)誤編碼事件存在。錯(cuò)誤編碼事件自然會(huì)影響事件數(shù)據(jù)庫的準(zhǔn)確性以及最終測量的雙邊關(guān)系的準(zhǔn)確性。目前的編碼程序采用的是基于字典的稀疏句法分析(dictionary driven sparse parsing) Philip Schrodt and Jay Yonamine, ?“A Guide To Event Data:Past, Present, And Future,” All Azimuth:A Journal of Foreign Policy and Peace, Vol.2, No.2, ?2013, ?pp.12-13.,即基于新聞中的有效信息與字典的匹配進(jìn)行事件分類。這種方法導(dǎo)致計(jì)算機(jī)對(duì)于復(fù)雜語言的分析能力并不強(qiáng),分析語境或者分析使用修辭語的復(fù)雜語言的能力很有限。比如,很可能分不清一場拳擊賽與一場沖突之間的區(qū)別,又或者大量使用比喻等。當(dāng)然,在主要的媒體新聞?dòng)绕涫菄H新聞中,句法一般不會(huì)太復(fù)雜。
但進(jìn)一步而言,這個(gè)問題還需要區(qū)分隨機(jī)錯(cuò)誤與系統(tǒng)錯(cuò)誤。隨機(jī)錯(cuò)誤即錯(cuò)誤的出現(xiàn)是無規(guī)律的。就GDELT中的測量而言,錯(cuò)誤出現(xiàn)在合作和沖突事件庫中的可能性是一樣的,這種情況對(duì)于最終結(jié)果的影響相對(duì)要小,尤其是當(dāng)數(shù)據(jù)量極大的時(shí)候,這種影響甚至可以忽略。而如果是系統(tǒng)性的錯(cuò)誤,那么對(duì)結(jié)果的影響就將是顯著的。比如,如果編碼程序的錯(cuò)誤導(dǎo)致其偏好合作事件,那么最后測量的關(guān)系值必然也會(huì)偏向合作。系統(tǒng)性的錯(cuò)誤無法通過增加數(shù)據(jù)量來解決。
對(duì)于編碼程序的質(zhì)量和錯(cuò)誤問題,一方面是要增加數(shù)據(jù)量,解決大數(shù)據(jù)問題的一個(gè)重要方法永遠(yuǎn)是更多更大的數(shù)據(jù),以此來使得其中的錯(cuò)誤微不足道,不會(huì)影響到對(duì)關(guān)系的測量。另一個(gè)途徑則是增加方法和數(shù)據(jù)的透明度,以便學(xué)界能夠清楚地知道數(shù)據(jù)的產(chǎn)生過程,并能共同改進(jìn)。在2013年4月1日以后的事件中,GDELT都提供了信息來源,以方便研究者進(jìn)行進(jìn)一步的數(shù)據(jù)篩查,而這將有助于事件數(shù)據(jù)準(zhǔn)確性的提高。最后一個(gè)也是最基本的方法,是改進(jìn)編碼系統(tǒng)和編碼程序的分析能力。目前學(xué)界已經(jīng)在積極地改進(jìn)編碼系統(tǒng)和編碼程序,新一代系統(tǒng)(Patriarch 2)正在開發(fā)之中。這一發(fā)展將進(jìn)一步使得利用大數(shù)據(jù)進(jìn)行雙邊關(guān)系研究更具有可信度。目前,飛速發(fā)展的人工智能深度算法分析語言和句法的能力大大增強(qiáng),在智能手機(jī)上廣泛使用的語音識(shí)別工具(如蘋果的SIRI),其所表現(xiàn)出的語言識(shí)別能力已經(jīng)非常驚人,將它與事件分析相結(jié)合,將能很大程度解決目前編碼程序遇到的問題。John Beieler, “Generating Politically-relevant Event Data,” arXiv, 2016, preprint arXiv:1609.06239.
(三) ?事件的性質(zhì)與數(shù)量的關(guān)系
關(guān)于雙邊關(guān)系的量化度量,一致存在的爭論是關(guān)于事件性質(zhì)與數(shù)量的取舍。對(duì)于雙邊關(guān)系來說,對(duì)單個(gè)事件賦值與只考慮事件的數(shù)量,哪個(gè)能更加有效地測量雙邊關(guān)系值呢?前文對(duì)這些問題已經(jīng)有所討論,很大程度上,對(duì)事件權(quán)重與數(shù)量的取舍取決于研究問題和對(duì)于雙邊關(guān)系的一般判斷。一般而言,當(dāng)事件數(shù)量很少時(shí),就不得不考慮事件的權(quán)重;而當(dāng)事件數(shù)量非常巨大時(shí),單個(gè)事件的權(quán)重就不那么重要了。
另一個(gè)問題是,言語和行為需要區(qū)別對(duì)待嗎?在政府與政府的交往中,言語行為與實(shí)際行為往往一樣重要,它們都對(duì)雙邊關(guān)系有著巨大影響。比如,雙方領(lǐng)導(dǎo)人關(guān)于雙邊關(guān)系定位的言論對(duì)雙邊關(guān)系起指導(dǎo)作用。因此,言語本身是測量雙邊關(guān)系的一個(gè)重要指標(biāo),不需要將它與實(shí)際行為分離考慮。
當(dāng)然,在實(shí)際進(jìn)行測量的時(shí)候,依然需要針對(duì)具體研究問題來設(shè)計(jì),設(shè)計(jì)取決于我們更關(guān)注重大事件還是整體圖景對(duì)雙邊關(guān)系的影響。在設(shè)計(jì)時(shí),要根據(jù)研究問題來選擇變量的測量。
(四) ?數(shù)據(jù)來源的轉(zhuǎn)換翻譯問題
目前的事件數(shù)據(jù)庫都基于英語,而自動(dòng)編碼程序使用的字典也是英文的,所以其他語言的新聞是通過谷歌翻譯然后再用程序進(jìn)行抓取。這會(huì)直接導(dǎo)致一個(gè)問題,即翻譯過程中的意義損失。沒有任何翻譯是完美的,尤其是機(jī)器翻譯。雖然隨著人工智能的發(fā)展,機(jī)器翻譯的質(zhì)量有了飛速提高,但是由于語言對(duì)于社會(huì)背景與傳統(tǒng)的依賴,不同語言之間的翻譯依然意味著很多意義可能流失,進(jìn)而影響對(duì)事件的理解。
這個(gè)問題的解決方法是給不同語言的新聞編輯以同種語言的字典。關(guān)于中文句法分析,在Stanford Universal Dependencies項(xiàng)目下已經(jīng)有了中文字典,但是事件數(shù)據(jù)自動(dòng)處理中的中文字典還沒有。如果將來中國要建立類似GDELT的事件數(shù)據(jù)庫,那么編撰自動(dòng)編碼系統(tǒng)的中文字典是首先需要完成的工作之一。
四、 結(jié) 論
大數(shù)據(jù)事件庫的出現(xiàn)為國際關(guān)系研究提供了新的數(shù)據(jù)來源,也為量化研究和實(shí)證檢驗(yàn)國際關(guān)系理論提供了計(jì)算基礎(chǔ)。通過對(duì)從GDELT中數(shù)據(jù)生成的中美關(guān)系值與清華大學(xué)中國與大國關(guān)系數(shù)據(jù)庫中的中美關(guān)系值以及相關(guān)的定性研究對(duì)比,本文證明利用大數(shù)據(jù)度量雙邊關(guān)系具有一定的學(xué)術(shù)價(jià)值與進(jìn)一步發(fā)展的潛力。而雙邊關(guān)系作為更為復(fù)雜的多邊關(guān)系的基礎(chǔ),應(yīng)用在雙邊關(guān)系上的方法也可以很容易地?cái)U(kuò)展到多邊關(guān)系的研究上。因此,大數(shù)據(jù)對(duì)整個(gè)國際關(guān)系的量化具有潛在的重大貢獻(xiàn)。本文是這種努力的一個(gè)初步嘗試。
當(dāng)然,沒有數(shù)據(jù)和方法是完美的,大數(shù)據(jù)的事件依然存在種種問題,但是這些問題大都能在某種程度上得到緩解。隨著新一代自動(dòng)編碼系統(tǒng)、編碼程序以及人工智能的發(fā)展,事件數(shù)據(jù)庫的質(zhì)量也將進(jìn)一步提升,而利用事件數(shù)據(jù)庫的大數(shù)據(jù)來進(jìn)行國際關(guān)系研究的前景將更為廣闊。研究者在利用這些新工具時(shí),也需要時(shí)刻意識(shí)到它可能存在的缺陷并通過研究設(shè)計(jì)來盡量避免這些不足。在大數(shù)據(jù)時(shí)代,最終決定研究質(zhì)量的仍將是研究者的研究設(shè)計(jì)和分析方法。Gary King:《大數(shù)據(jù)與數(shù)據(jù)無關(guān)》,鐘楊主編:《實(shí)證社會(huì)科學(xué)》(第三卷),上海交通大學(xué)出版社,2017年,第10—16頁。