李文中
(北京外國語大學,北京,100089)
在美國法庭對法案的解讀中,針對法案中未做確切定義的概念或術(shù)語,一般采用“平義規(guī)則”(plain meaning rule),又稱“字面規(guī)則”(literal rule),即詞語的平常意義和用法。在英國,確立“平義”并不考慮立法者的意圖。而在美國,法庭一般采用“軟平義規(guī)則”(soft plain meaning rule),即通過確立“平義”推定立法者的意圖(參見 Wikipedia)。傳統(tǒng)上,法官確定“平義”的途徑有兩種,一是憑直覺,二是查詞典。近年來,隨著語料庫應用的普及,律師或法官開始使用語料庫尋求證據(jù)。語料庫作為一種新的文本資源和語言分析方法,對觀察和發(fā)現(xiàn)語言運用中典型的型式和意義,尤其是基于概率判斷確立詞語及搭配的常用結(jié)構(gòu)和意義,具有極強的可靠性和說服力。在法律語言學中,利用大規(guī)模語料庫,分析和研究法庭話語,或為法庭提供語言證據(jù),逐步成為常見的實踐活動。但是,如何有效使用語料庫,其分析程序和步驟是否合乎語料庫語言學原則,以及如何對待語料庫數(shù)據(jù),仍然是一個值得探討的問題。本文就美國法庭應用語料庫的一個典型案例,以語料庫語言學視角,重新審視該案例中對語料庫證據(jù)的運用。
美國電信公司AT&T參加了美國聯(lián)邦通訊委員會(Federal Communications Commission,簡 稱FCC)的E利率計劃(E-Rate Program),即由公司以折扣價為學校提供電子通訊系統(tǒng)設(shè)備和服務,其折扣差額可從FCC報銷。2004年,AT&T公司告知FCC,其違規(guī)超收了費用,后者所屬的執(zhí)行局介入調(diào)查,要求AT&T準備相關(guān)資料。AT&T公司聽從要求,并同意向FCC支付50萬美元,執(zhí)行局終止了調(diào)查。之后的2005年,代表AT&T競爭對手公司的Comptel商會依據(jù)美國聯(lián)邦政府1966年頒布的《信息自由法案》(簡稱FOIA),向賓夕法尼亞的美國第三巡回起訴法庭提出起訴,要求FCC公開其對AT&T公司賬目的所有調(diào)查文件,AT&T公司到庭并依據(jù)該法案(FOIA)第七項豁免條款第三條規(guī)定——當合理預期會構(gòu)成對個人隱私的不當侵犯時,可免于公開相關(guān)信息——認為公開調(diào)查文件構(gòu)成侵犯其公司的“個人隱私”(personal privacy),要求不予公布。AT&T的主要論點是,由于在FOIA法案中,公司(corporate)也被定義為“人”(person),而單詞personal是名詞person的形容詞形,在語義上與名詞同義,所以,personal privacy既指自然人的個人隱私,也指公司隱私。2009年,第三巡回上訴法庭認可了這種說法,認為FOIA法案界定的“人”既然包括了公司,則該詞的形容詞詞義如不與其名詞同義就很怪異,法案界定了名詞,也就界定了其形容詞①,并依此判定AT&T公司勝訴。
此后,美國總檢察長艾里娜·卡根(Elena Kagan)把此案上訴到美國最高法院,認為FOIA從未被解讀為保護公司的個人隱私,此案隨后于2011年3月開庭重審。美國最高法院最高法官羅伯茨根據(jù)法庭意見,認為FOIA中的personal privacy并不包含公司隱私,因此推翻了上訴法院的判決②。此案審理前,尼爾·歌德法波等律師(Goldfarb et al.2010)代表“政府監(jiān)督計劃”(Project on Government Oversight)提交了一份“法庭之友意見書”(以下簡稱“意見書”),并利用語料庫檢索,分別論證了personal和privacy的含義,提出personal作為形容詞具有自己獨立的語義,在語義關(guān)系上并不直接繼承名詞person的語義。該“意見書”首次使用了大量的語料庫文本證據(jù),試圖證明自己的結(jié)論,并成功影響法庭的判決,引起了較大反響。對此,詞典學家澤墨(Zimmer 2011:1)宣稱,“跟詞典定義說再見,長期依賴變化莫測的語言的法庭,如今可以使用新的定量工具,以確定詞語的確切含義”。
語料庫語言學對語言研究的基本原則包括:(1)語言研究應基于實際發(fā)生的語言實例,而不是孤立的或生造的句子;(2)語言學研究意義,而意義與形式不可分割;(3)應通過比較研究文本類型(Stubbs 1993:2)。應用上述原則,我們重新審視該案例中對短語personal privacy意義的確立和討論,并探討該案例的語言學意義。
FCC首先提出,personal的平常意義就在詞典中,美國韋氏詞典對personal定義只包括“人”,而不包括公司。按照語料庫語言學的觀點,詞語平常意義既不取決于詞典,也不取決于詞源。意義產(chǎn)生于交際,而交際依賴語境。詞源意義僅僅反映了詞語出現(xiàn)時最初始的運用,經(jīng)過長時間在不同語境中的使用,詞語意義得到反復解讀和創(chuàng)造,其變化難以預測,所以理解詞語的當前意義,不需要追溯其歷史意義。在“意見書”中,歌德法波首先論證,從詞源上,形容詞personal的意義與名詞person同源不同流,在意義上互不相關(guān)。他論證,英語中的personal一詞于十三世紀借自法語personnel,而該法語詞借自拉丁語personalis,是拉丁詞persona的形容詞形式。他辯駁說,一個詞語的意義并不取決于其詞源義,詞義在使用中不斷變化。如person來源于拉丁詞persona,從詞源上講,該詞在拉丁語中最早指舞臺演員所戴的面具,后指演員所扮演的角色。此外,他還舉出其他實例,說明詞源意義與當前意義的聯(lián)系非常脆弱(Goldfarb et al.2010),根據(jù)詞源確定詞語當前意義的做法并不可靠。莫里森(Mouritsen 2011:1939)引用斯威特(Henry Sweet)的觀點,“某語言中一個詞語在某一特定時期的意義,或者其在更早時間的意義,或者在其他同源語言中的意義,都不一定能確定其當前的意義”。這個觀點的正確性是顯而易見的。莫里森(Mouritsen 2011)指出,純粹依據(jù)詞源確定詞義會導致荒謬的結(jié)果,如December的詞源義是“十月”,而anthology(選集)的詞源義是“花束”。
與之相關(guān)的是,詞典定義作為詞語意義的依據(jù)也不可靠,尤其不能根據(jù)詞典去確定某個詞語的主要意義或次要意義。莫里森(Mouritsen 2011)認為,人們對詞典存在兩大謬見,一是認為詞典中的意義排序具有主次含義,二是認為詞源對詞義有決定性。詞典中詞條的意義排序依據(jù)一是詞語或意義的歷時產(chǎn)生順序,再就是詞語或意義的共時使用頻率,而二者都不能確定詞語的“主要意義”。他認為,詞語不存在“主要意義”或“次要意義”。此外,詞典中這種詞語意義呈現(xiàn)型式也存在很大問題。語料庫語言學家辛克萊(Sinclair 1991:7)對此提出批評,“傳統(tǒng)詞典樂觀地把詞語呈現(xiàn)為具有多個孤立的義項,卻從不提示語言使用者在實際中如何區(qū)分這些意義”。
從語料庫語言學的觀點看,詞語的當前意義只有在其使用語境中才能確立。換言之,理解某一詞語的意義,只需分析其所在語境,而不需要追溯其歷史。辛克萊指出,“每一意義都與一種獨特的型式相關(guān)聯(lián)”,“形式與意義絕無分割”(同上:6-7)。按照托伯特(Teubert 2003)的觀點,詞語意義是人們對該詞語的疊加解釋(interpretation),其結(jié)果是文本(李文中2010),所以文本是語言使用的可靠證據(jù)源。但這也為詞語意義確立帶來了很大的不確定性。因為如此一來,需要大量的實例,尤其是同一詞語在相似語境中的使用實例,來歸納和確立某個詞語的常用意義。
針對AT&T公司關(guān)于personal只是名詞person的“形容詞形式”,其意義必定與該名詞定義保持一致的觀點,歌德法波也進行了反駁。他認為personal一詞在長期的運用中已獲得了自己獨立的含義,其意義與名詞大不相同。歌德法波試圖論證,盡管在FOIA中,名詞person(個人)也可以指corporate(公司),但該義項并不能影響到形容詞personal的意義。歌德法波考察了personal運用的多個搭配語境,從而證明該詞主要指具有生物屬性的“人”,而不是公司。這項論證所隱含的語料庫語言學觀點是,傳統(tǒng)上對詞語屈折變化的劃分,似乎假定詞語的形式變化并不影響詞義的穩(wěn)定,在語言實際運用中不能得到驗證。辛克萊指出,語料庫證據(jù)對傳統(tǒng)語言學中許多想當然的觀點提出了挑戰(zhàn),其中之一就是形態(tài)學及詞語形態(tài)還原(lemmatization),“任何一個單獨的詞形都是一個潛在的獨立詞語單位,而這些詞形只有在運用中具有極相似語境時,才能合并還原”(Sinclair 1991:7-8)。
歌德法波還提出了一系列證據(jù),證明形容詞意義并不依賴與其相關(guān)聯(lián)的名詞意義,如:actual—act、crucial—crux、local—locus、partial—part、special—species、usual—use、verbal—verb、virtual—virtue(Goldfarb et al.2010:8)等。這些詞語與其對應的名詞意義各不相同。值得注意的是,歌德法波所舉出的與名詞相對的形容詞實例并非名詞的屈折變化形式,而是派生詞,與案例中所討論的問題并不相同。一個原形詞的各種屈折形式在用法和意義上可能相互區(qū)分,也可能意義相同,這要取決于運用型式和語境。
詞形和意義的型式關(guān)系是語料庫語言學的一個重要發(fā)現(xiàn),而這一發(fā)現(xiàn)對英語語言研究及學習具有深刻的意義。在英語教學中,我們習慣把詞性作為主要依據(jù),注重學生對詞語原形及所派生的各種屈折形式的背記和學習,而不去區(qū)分那些不同的詞性在用法和意義上的差異。在語料庫研究中,辛克萊(1987,1991,2004)發(fā)現(xiàn),一個原形詞不同的屈折形式在語料庫中不但分布極不均勻,其用法和意義由于語境的變化而存在極大差異。這就意味著,在外語學習中,真正把握一個詞語的意義,需要在其具體的運用語境和搭配中觀察和分析,孤立地背記單詞及其“對應的”的詞意甚至翻譯,是非常不可靠的。然而,辛克萊并不完全否認詞語形態(tài)還原的價值,但強調(diào)形態(tài)還原的前提條件是“大量相似的語境”,相似的語境使不同可還原的詞形在語義上也具有相似性。所以,在當前討論的案例中,歌德法波等所提出的形容詞personal與名詞person意義完全無關(guān)的看法,其論據(jù)并不充分。盡管他援引了大量同類證據(jù),卻未能就FOIA這一關(guān)鍵文本以及其他法律文本進行分析。
歌德法波等的“意見書”接著使用語料庫驗證自己的觀點。他們使用的語料庫有三個:《時代》雜志語料庫(自1923年至2009年,1億詞)、當代美國英語語料庫(以下簡稱COCA,4.5億詞)、歷史美國英語語料庫(以下簡稱COHA,自1810年至2000年,4億詞)。其方法是,首先查找語料庫,觀察personal作為修飾詞所修飾限定的名詞,以名詞為線索分析personal的語義,以驗證其主要語義屬性是“人”而不是“公司”,其語料檢索范圍分別為COHA、COCA,以及《時代》雜志語料庫中,十九世紀50年代至90年代與二十世紀初至二十世紀90年代以personal為關(guān)鍵詞的短語搭配。結(jié)果發(fā)現(xiàn),personal右面最常見的搭配詞為life、computer、experience、relationship、responsibility、information、trainer、communication、use、finance、history、income、interest、level、problem等(COCA語料庫),通過這些短語,“意見書”論證了該詞在不同的搭配中意義都指向“人”,而不是“公司”。第二步,“意見書”還檢索了三個語料庫中privacy的指稱搭配詞,如his、their、your、her、our、my、its,認為除了最后一個詞its,其他的詞都是指人。
作為“意見書”的核心部分,其對語料庫的使用值得我們進一步的討論。其一,由于“意見書”是根據(jù)詞語的常用意義來推斷美國國會的立法意圖,其對語料時間的框定是值得商榷的。詞語意義是不斷變化的。如果“意見書”否定詞源對詞義的先決價值,某一詞語在給定時期的意義也同樣不能作為該詞當前含義的依據(jù);對該詞的運用意圖也不能以某一個時間點為依據(jù),而忽略之后立法者在各種修正案和法案中對同一詞語的運用。從語料庫語言學視角看,某一詞語在1970年代的意義并不能反映該詞在當前的含義。詞義在變化,美國立法者的意圖也在變化,各種修正案就是明證,所以不能以最早的法案為原點,觀察和推測當年立法者的意圖,還要參照該法案頒布以來,該法案的各種修正案以及其他法案中該短語的運用證據(jù)。通過某一詞語以前的意義,來確立該詞語當前的含義,無異于刻舟求劍。為說明問題,我們以personal privacy為關(guān)鍵詞,分別檢索COHA和COCA兩個語料庫,可統(tǒng)計出該短語在各個時間段上的分布(見圖1、2),下圖中第一行為年代,每10年為一個統(tǒng)計段,第二行為該短語的生頻數(shù),第三行為標準頻數(shù),及每百萬詞出現(xiàn)的詞次。從圖中可以看出,該短語在1960年前,其使用標準頻數(shù)都低于0.1/百萬詞,從2000年開始,該短語使用頻率增長,并在二十一世紀初達到最高值,說明該短語到了二十一世紀后才得到更普遍的應用,如果確定其“平義”,應參照最近的語料,并通過對比才能得出較為可靠的結(jié)論。
圖1 personal privacy短語在COHA中的歷時分布(http:∥corpus.byu.edu/coha/)
圖2 personal privacy短語在COCA中的歷時分布(http:∥corpus.byu.edu/coca)
其二,詞語搭配具有很強的語境依賴性,且對文類高度敏感。通過對COCA檢索發(fā)現(xiàn),personal privacy在5種文類中分布很不均勻,主要集中在報紙、學術(shù)和口語等3種文類,虛構(gòu)文類中使用最少(圖3)。由于本案例屬于法律文本,其他文類中該短語的意義只能作為參照,而不能作為直接證據(jù)。辛克萊(Sinclair 1987,1991)指出,語料庫的重要用途之一,就是跨庫對比,尤其是不同文類之間的對比,通過對比,才能識別語言中那些核心的、典型的特征。由此可見,所謂“平義”原則在實踐中存在極大的解釋空間,即應該選擇哪一種文類或語言使用群體的平常意義?把不同類型的文本放在一起,抽取某一個短語搭配,并以此確立其意義,無論其意圖如何,結(jié)論很難令人信服。所以,拋開美國的法律慣例不談,純粹從語言分析角度看,確立personal privacy平常意義的最直接證據(jù),不是那些離法律文本甚遠的普通文本,而是同質(zhì)的法案文本。
圖3 COCA中personal privacy在文類中的分布
其三,語料庫語言學的一個重要觀點是,短語搭配的意義是獨立的,與短語中個別詞語意義關(guān)聯(lián)不大?!耙庖姇痹噲D通過觀察personal及privacy分別與其他詞的搭配,來證明這兩個詞在personal privacy短語中也具有相同的含義,這顯然與短語分析的意旨相去甚遠。比如辛克萊意義單位分析的兩個經(jīng)典案例“naked eye”和“a free hand”(參見Sinclair 2003,2004),如果把這兩個短語拆開,其中任何一個詞在其他短語中的意義,并不能證明其在當前短語中的意義。此外,“意見書”從語料庫中抽取的搭配短語都是脫離語境的兩詞搭配,不經(jīng)過索引行分析,不借助短語所在的語境,僅看孤立的短語搭配很難確定該短語的意義及型式。以“意見書”中對privacy的搭配詞統(tǒng)計為例,如果不深入索引行進行觀察和分析,如何確定所列舉的那些指稱詞語都是指“人”的呢?
其四,我們在“意見書”的語言驗證和分析整個過程中沒有看到反證?!耙庖姇钡淖髡呦群笸ㄟ^詞源分析、詞性分析、詞典征引(此三種方法對于確定詞語意義中的價值作者同時也予以了否定)、語料庫證據(jù)檢索以及案例引用,其方法無論是否有效,都無一例外地指向?qū)ψ髡哂^點有利的論證,有個別的相反證據(jù),也是一筆帶過,從不提供數(shù)據(jù)說明。比如,針對“意見書”中通過privacy的搭配而得出的結(jié)論,即擁有“隱私”的只有“人”而不是公司,我們通過Antoinette Renouf教授的網(wǎng)絡語料庫(WebCorp)檢索“corporate privacy”,共檢索了43,5000個網(wǎng)頁,并從中抽取64個網(wǎng)頁,WebCorp成功訪問了其中49個網(wǎng)頁,并生成123個索引行③。其出現(xiàn)時間為:2000年(1次)、2004年(1次)、2005年(4次)、2008年(1次)、2009年(7次)、2010年(12次)、2011年(7次)、2012年(20次)、2013年(58次)、日期未知(12次)。下表為部分索引行④:
61:Sign up for our publications and other resources Corporate Privacy Rules:Moving Toward A Global Solution Miriam 62:use of global or enterprise-wide privacy rules(“Corporate Privacy Rules”)as a way to correct the problems faced 63:international privacy regime.The concept of Corporate Privacy Rules is based on the notion of accountability—64:assumes responsibility for protecting the data.Corporate Privacy Rules are not a new concept;rather,they are an 65:that will enable organizations to implement Corporate Privacy Rules as a global,rather than a national or 66:taking the necessary internal steps to develop Corporate Privacy Rules so that when there are a sufficient number 67:a U.S.consumer.The Emerging Global Solution:Corporate Privacy Rules Given the problems inherent in the 68:in the existing approaches,the concept of Corporate Privacy Rules is emerging as a new and better approach 69:are bound to protect the data according to the Corporate Privacy Rules adopted by the organization.Data may then 70:the information(violating the organization’s Corporate Privacy Rules).Rather than force the individual to 71:the authorities in the jurisdiction in which its Corporate Privacy Rules were approved or certified.As discussed 72:of activity or in which it is headquartered).Corporate Privacy Rules offer significant benefits to individuals.73:of multiple contracts.For the company,use of Corporate Privacy Rules would reduce the compliance,training,and
(續(xù)表)
這個結(jié)果至少表明,在語言運用中,corporate(公司)也是privacy的一個較常見的搭配詞,并不像其作者所說的,“這種用法非常罕見”。不過,在4.5億詞COCA中檢索這個短語,只獲得2例,而且其中一例還是對本文所討論的案例報道;而在4億詞的COHA和1億詞的《時代》語料庫中則一例也沒有??赡艿脑蛴袃蓚€,一是語料庫還不夠大,再就是語料庫的結(jié)構(gòu)或許不利于所檢索的短語。此案例也反映出語料庫研究的一個重要問題,那就是“說有易,說無難”。美國前國防部長拉姆斯菲爾德曾經(jīng)說過,“那些總是說有些事沒有發(fā)生的報告總讓我感興趣,因為我們知道,有已知之知;即有些事我們知道我們已經(jīng)知道了。我們也知道還有已知之未知,即我們知道有些事我們還不知道。但還有未知之未知,即那些我們不知道自己不知道的事”。語料庫中沒有的東西不代表語料庫外就沒有。這也是語料庫研究者需要時刻警醒自己的。
本文并不試圖否定或者驗證該案例中通過語料庫證據(jù)應用得出的結(jié)論,而是通過語料庫驅(qū)動視角重新審視其對語料庫的使用方法,尤其是分析程序和步驟。實際上,該案例在2010年前后在美國引起了廣泛的討論,對“個人隱私”與“公司隱私”的區(qū)分和主張,既是一個法律問題,又是一個社會政治問題。本文的視角僅限于該案例中的語言意義以及語料庫應用。使用語料庫的態(tài)度大致可分為兩種:一是把證據(jù)當作數(shù)據(jù),即觀點和理論是先存的,通過語料庫檢索和分析獲得證據(jù),以支持和驗證已有的觀點,證據(jù)成為數(shù)據(jù);再就是把數(shù)據(jù)當作證據(jù),即針對某一問題直接觀察語料庫文本,通過文本分析獲得觀點或理論,數(shù)據(jù)成為證據(jù)。前者在語料庫應用實踐中具有很強的預設(shè)性和目的性,其目標是尋找證據(jù),語料庫的作用在于是否能提供充分證據(jù);后者在分析前并不預設(shè)任何觀點和理論,而是通過語料庫分析歸納出觀點或理論。盡管語料庫作為一個功能強大的方法和工具,在語言相關(guān)的理論和實踐領(lǐng)域得到愈來愈廣泛的應用,但并不是僅僅因為使用了語料庫,就能保證結(jié)論的可靠性。關(guān)鍵的問題是,語料庫是怎么被使用的。
附注
① 參 見 Opinion of the Court [OL].http:∥caselaw.findlaw.com/us-3rd-circuit/1194481.html。
② 參見FCC v.AT&T INC.(No.09-1279,2011)[OL].http:∥supreme.justia.com/cases/federal/us/562/09-1279。
③ 感謝賈云龍就此例對WebCorp進行了重復檢索,并從技術(shù)角度解釋了檢索結(jié)果:“因為GoogleAPI僅僅返回極小一部分Google的檢索結(jié)果,此例約64:432000,所以如果是在整個Google中檢索,返回的結(jié)果要遠遠多于WebCorp中的數(shù)據(jù)”。本人通過Google檢索“corporate privacy”這個短語,獲得1030000個結(jié)果,是 WebCorp索引行的8373倍,從而驗證了賈云龍的解釋。
④ 此為2013年3月17日22:07檢索http:∥www.webcorp.org.uk/live/search.jsp所得。
Goldfarb,N.,M.S.Zaid,S.Amey,S.Chance & C.Hitchcock.2010.Brief for the Project on Government Oversight,the Brechner Center for Freedom of Information,and Tax Analysts as Amici Curiae in Support of Petitioners [R/OL].[2013-03-17].http:∥www.americanbar.org/content/dam/aba/publishing/preview/publiced_preview_briefs_pdfs_09_10_09_1279_PetitionerAmCuPOGO_BrechnerCtr_andTaxAnalystsnew.authcheckdam.pdf.
Mouritsen,S.C.2011.The dictionary is not a fortress:Definitional fallacies and a corpus-based approach to plain meaning [OL].[2013-03-18].http:∥papers.ssrn.com/sol3/papers.cfm?abstract_id=1753333.
Sinclair,J.McH.1987.Looking Up [M].London:Collins.Sinclair,J.McH.1991.Corpus,Concordance,Collocation[M].Oxford:Oxford University Press.
Sinclair,J.McH.2003.Reading Concordances:An Introduction[M].London:Pearson Education.
Sinclair,J.McH.2004.Trust the Text [M].London:Routledge.
Stubbs,M.1993.British traditions in text analysis:From Firth to Sinclair[A].In M.Baker,G.Francis & E.Tognini-Bonelli(eds.).Text and Technology:In Honour of John Sinclair [C].Amsterdam:John Benjamins.23-24.
Teubert,W.2003.Writing,hermeneutics,and corpus linguistics[J].Logos and Language 4(2):1-17.In W.Teubert & R.Krishnamurthy.2007.(eds.).Corpus Linguistics:Critical Concepts in Linguistics [C].London & New York:Routledge.134-59.
Zimmer,B.2011.The Corpus in the Court:“Like Lexis on Steroids”[OL].The Atlantic[2012-11-28].http:∥www.theatlantic.com/national/[03/4/2011]archive/2011/03/the-corpus-in-the-court-like-lexis-on-steroids/72054/.
李文中.2010.語料庫語言學的研究視野[J].解放軍外國語學院學報(2):37-40.