張麗明
(人民教育電子音像出版社 北京 100081)
語料庫源于拉丁語“軀體/身體”,18世紀(jì),出現(xiàn)文本集和作品匯總,20世紀(jì)60年代第一個機(jī)讀語料庫(Brown Corpus)的建立標(biāo)志現(xiàn)代計算語料庫的誕生。語料庫是根據(jù)明確的語言學(xué)標(biāo)準(zhǔn)進(jìn)行選擇和排序的語言數(shù)據(jù)匯集,旨在作為語言的樣本進(jìn)行使用(Sinclair,1986;Crystal,1991)。語料庫的主要特征包括電子化、真實(shí)語言、嚴(yán)格取樣和代表性。語料庫自動抓取、自定檢索、自動分析的智能化特征,海量語料庫、云計算和大數(shù)據(jù)分析技術(shù),以及行業(yè)專用、一站式服務(wù)、集成化管理的專門化特征,使其在搜索引擎、智慧教育、語音處理、智能寫作、機(jī)器翻譯、學(xué)術(shù)研究等領(lǐng)域廣泛應(yīng)用。
LOB語料庫(Lancaster-Oslo-Bergen:蘭卡斯特-奧斯陸-卑爾根)是Brown Corpus的英國對等語料庫,由英式英語書面語構(gòu)成,其規(guī)模為1,000,000字,出版于1961年。LOB語料庫樣本為2,000字的文本片段,如新聞、學(xué)術(shù)和科學(xué)寫作、小說等。
FLOB和FROWN語料庫,是LOB語料庫和BROWN語料庫的弗萊堡(Freiburg)版本,在LOB語料庫和BROWN語料庫建成30年后的1991年建成。
London-Lund語料庫由倫敦大學(xué)和隆德大學(xué)合作建設(shè),包含435,000字英式英語口語。語料庫樣本為5,000字,是成年的、受過教育的、專業(yè)人士的口語語料,包括電話交談、講座、討論和無線電評論。
Longman-Lancaster語料庫由朗文出版商和蘭卡斯特大學(xué)合作建設(shè),語料庫規(guī)模為30,000,000字,包括小說和非小說體裁。小說體裁包括文學(xué)作品和印刷書籍中的隨機(jī)作品,非小說體裁包括自然科學(xué)和社會科學(xué)、世界事件、商業(yè)金融、藝術(shù)、休閑,等等。
The Bank of English語料庫由伯明翰大學(xué)的COBUILD(Collins Birmingham University International Language Database科林斯伯明翰大學(xué)國際語言數(shù)據(jù)庫)創(chuàng)建。The Bank of English語料庫用于詞典和語法編纂,目前大約455,000,000字,包括小說和非小說書籍、報紙、口語樣本。網(wǎng)絡(luò)應(yīng)用版為50,000,000字 “CobuildDirect”。The Bank of English語料庫(BoE)在線版為Word Banks Online,是個監(jiān)控語料庫。
BoE為付費(fèi)語料庫,每年需支付1,150美元。然而,BoE偏向報紙體裁,大約占到50%,這可能是因?yàn)閳蠹埼恼卤阌谠诰€獲得。BoE語料庫中不包含學(xué)術(shù)期刊,其口語語料源自于朗讀轉(zhuǎn)寫文本。BoE中非正式數(shù)據(jù)較少,只轉(zhuǎn)寫了美國之音,幾乎沒有包含自然的口語。由于其構(gòu)成體裁分布不均衡,BoE語料庫難以完全讓人信賴。例如,在BoE和COCA中檢索“引證詞like”,發(fā)現(xiàn)其使用頻率在COCA中是在BoE中的3.1倍(2000—2004年)、66倍(1995—1999年),BoE這個檢索結(jié)果顯然不符合常識。
英語國家語料庫(The British National Corpus)為100,000,000字英式英語語料庫,由10,000,000字口語和90,000,000字書面語構(gòu)成。英語國家語料庫用于大型辭書設(shè)計,例如《牛津高階英語詞典OxfordAdvancedLearner’sDictionary(OALD)》和《朗文當(dāng)代英語詞典LongmanDictionaryofContemporaryEnglish(LDOCE)》。
作為監(jiān)控語料庫,在跟蹤語言變化方面,美國當(dāng)代英語語料庫(COCA:The Corpus of Contemporary American English)作用明顯。BoE和COCA這兩個語料庫都十分龐大。COCA大約520,000,000字,BoE大約455,000,000字。兩個語料庫都比100,000,000字BNC(British National Corpus)語料庫大得多。COCA和BoE的重要差別,就是COCA持續(xù)被更新,是名副其實(shí)的監(jiān)控語料庫。每年大約有20,000,000字被添加到COCA語料庫。而BoE語料庫已停止更新,最后添加文本是2005年文本。
COCA在口語、小說、流行雜志、報紙和學(xué)術(shù)期刊這五種體裁之間均衡分布,每種體裁各占20%,甚至是報紙-體育,或者學(xué)術(shù)期刊-醫(yī)藥這樣的亞體裁分布比例也比較均衡。免費(fèi)的COCA語料庫是精心設(shè)計的監(jiān)測語料庫,可用于準(zhǔn)確測量當(dāng)代語言變遷。
語料庫短語學(xué)基于局部語境,將傳統(tǒng)的詞匯和句法統(tǒng)一起來,以全新視角探究語言特征(李響,2016:114-119)?;镜囊饬x單位,除了單詞外,還包括較長的短語和搭配—— “擴(kuò)展詞匯單元(extended lexical units)”。通常情況下,引申義不僅僅與個體單詞相關(guān),而是分布到短語和搭配(Stubbs,2011)。搭配是擴(kuò)展意義單位存在的最有力證據(jù),絕大多數(shù)意義單位是由兩個及以上的詞語所組成的復(fù)合詞項(濮建忠,2020:1)。
整體文本(whole text)不同于長文本(long text)。例如,公共場所的公示語Fire assembly point(火警集合點(diǎn))、Private(私人:住宅、車道等禁止入內(nèi))、Wet paint(油漆未干)、Closed for lunch(午餐時間,暫停服務(wù))等,這些公示語都是整體文本。甚至一個單詞或短語足以判斷文本類型,例如單詞furlong(長度單位弗隆,相當(dāng)于201米或1/8英里)用于賽馬評論;短語warm front(暖鋒)可能與天氣預(yù)報有關(guān)。
搭配是語言使用中最基本的組織原則,學(xué)習(xí)者需要熟知搭配。例如,“round table”的意義就是round和table相加表達(dá)的意義。但是,在round table talks(圓桌會談)、Knights of the Round Table(圓桌騎士)、drink someone under the table(酒量勝人一籌)、payment made under the table(私底下支付)、a round number(尾數(shù)是零或五的整數(shù))、a table wine(佐餐葡萄酒)、a timetable(時刻表、課程表)、come round to my house(來我家坐坐)、come round to my way of thinking(改變主意)、a round dozen(整整一打)、a round of applause(一陣掌聲)、a round of golf(一場高爾夫)、a round of drinks(一輪酒)、the doctor is on her round(醫(yī)生查房)這些短語中,round和table表達(dá)了不同的意義,短語意義并不一定是單詞意義的疊加,學(xué)習(xí)者需要了解單詞的搭配和搭配所蘊(yùn)含的文化知識和語義變化(Hamilton et al.,2016)。
2.2.1 單詞Gossip的搭配
Gossip經(jīng)常出現(xiàn)在負(fù)面含義短語中,例如baseless gossip(毫無根據(jù)的流言蜚語)、gossip-mongering(愛說閑話的人)、idle gossip(閑話)、juicy gossip(刺激的小道消息)、name-calling and malicious gossip(辱罵和惡意的流言蜚語)、scandal and gossip(丑聞和流言蜚語)、sleazy gossip(烏煙瘴氣的流言蜚語)、titillating gossip(煽情的流言蜚語)、her affairs became common gossip(她的風(fēng)流韻事成了常見的流言蜚語)等。而動詞gossip的社會作用者,常常由女性來承擔(dān)。女性說閑話、傳播流言蜚語成為一個社會刻板印象(stereotype),說閑話的女性一般為mother、women,或者old woman等。例如,the mothers stood gossiping in the alleys、the women gossiped and the men smoked、a gossiping old woman等。在英語國家語料庫(BNC)中檢索gossip搭配,發(fā)現(xiàn)其搭配詞為columnist、innuendo、malicious、fodder、rumour、chatter、idle、Hollywood、speculation、scandal、latest、village、exchange、piece、listen、magazine、picked、spread、women等。
其實(shí),男性也會說閑話,但是被贊賞性地稱為“male bonding(男性情誼)”。女權(quán)主義研究者Cameron(1997:45)指出,男性和女性都會參與“流言蜚語”,但是不可否認(rèn),流言蜚語的意義“具有女性屬性”。
日常英語中,不同的術(shù)語用來表達(dá)不同的語言行為。研究這些術(shù)語的用法,有助于了解這些術(shù)語之間的邏輯關(guān)系和他們具備的正面或負(fù)面引申義。例如,talk是一般詞匯,chat是位于talk之下的范疇,而gossip屬于不同的亞范疇(Stubbs, 2001: 7-8)。
表1 Talk下義詞gossip及其語義韻
表2 Talk下義詞chat、chatter、prattle、babble及其語義韻
再如,下列幾組詞匯:
Break、burst、chip、crack、shatter、smash、snap
Shake、quake、quiver、shudder、tremble
Show、display、exhibit、expose、flaunt
Work、drudgery、labour、toil
Dirty、filthy、grimy、grubby、soiled、unclean
上述talk、break、shake、show、work、dirty這樣的核心詞匯(core vocabulary),是語言中最基本的詞匯。
2.2.2 單詞bank的搭配
Bank一般出現(xiàn)在指代“金錢”或“堤岸”的短語中。例如,bank account(賬戶)、bank balance(銀行結(jié)存)、bank robbery(銀行搶劫)、piggy bank(存錢罐)、canal bank(運(yùn)河堤岸)、river bank(河岸)、the South Bank(倫敦泰晤士河南岸)、the Left Bank(法國左岸)、Dogger Bank(多格灘:蘇格蘭北部和丹麥之間的北海淺灘)、Rockall Bank(北大西洋羅科爾島)、Icelandic Banks(大西洋漁區(qū))。
與bank一起共現(xiàn)的詞,一般來自金錢語義場和堤岸語義場,例如cashier、deposit、financial、money、overdraft、pay、steal;cave、cod、fish、float、headland、sailing、sea、water等。然而,也存在一些含混不清的短語,例如the Worthing bank murder case。Worthing是英格蘭南部小鎮(zhèn),這個短語是說銀行搶劫還是發(fā)生在堤案邊的謀殺?意義一般由多種因素決定,意義既產(chǎn)生于特定短語中,又受到周圍詞匯串的制約。意義是思維的表征,通過語料庫,可以觀察證據(jù),推測意義。詞匯意義的主要證據(jù),就是這個單詞周圍的其他單詞,尤其是與這個詞匯一起共現(xiàn)的重復(fù)模式。意義不能獨(dú)立于環(huán)境,不能獨(dú)立于上下文。詞匯可以預(yù)測與其共現(xiàn)的相關(guān)詞匯,同時,詞匯上下文也可以預(yù)測詞匯。語義學(xué)研究典型情況,而不是特殊案例。意義模式,可以從小型語料庫中預(yù)測,這些被預(yù)測的意義模式可以在別的語料庫或大型語料庫中再次檢驗(yàn)。
2.2.3 報紙征婚廣告(lonely hearts ads)中的搭配
報紙征婚廣告(lonely hearts ads)受到版面限制,命題內(nèi)容幾乎千篇一律為“X is looking for Y”,然后是請求“Please get in touch”,句法結(jié)構(gòu)十分簡單。最常用的詞為seek和caring。seek的搭配詞為female、black、male、attractive、similar、guy、lady、man、caring、professional。caring的搭配詞為seek、loving、honest、sincere、make、very、more、people、children、kind。
Seeks a sincere, caring single lady
Caring, Christian-minded, romantic, seeks attractive, reliable female
Black male, 31, seeks caring lady
Various interests, own flat and car, seeks caring, ambitious lady
Kind, honest, reliable, boyish, 35, seeks caring, genuine female, for lasting relationship
個體單詞不一定是意義的組成單元。有些動詞幾乎不攜帶意義,這種現(xiàn)象被稱作詞匯虛化或非詞匯化(Quirk et al.,1991;胡開寶 等,2016:109-114)。例如:
Take a decision; take a look; take a shower; take a sip
Have a chat; have a drink; have a look; have a shower; have a swim; have a try
Give a scream; give a shout; give a speech
Make a mistake; make a note; make a suggestion
在上述例子中,意義幾乎都由名詞來實(shí)現(xiàn),而動詞的語義已經(jīng)被虛化——語義虛化(desemanticized)。語義虛化現(xiàn)象在現(xiàn)代英語中十分普遍,最頻繁使用的語義虛化動詞有take、make等,例如,take place、take part、take care、make sure、make sense、make clear。
形容詞通常會讓名詞的語義變窄。例如,red house比a house更加具體,dangerous dogs比dogs范圍更小。Sinclair(1992)把形容詞的這種用法稱作“選擇性用法”,即從大的集合中選擇較小的集合。他認(rèn)為,“共現(xiàn)詞匯的意義,不同于詞匯獨(dú)立使用時的意義。共現(xiàn)詞匯的語義,至少被部分地虛化了?,F(xiàn)代英語標(biāo)準(zhǔn)短語,具有很強(qiáng)的語義虛化趨勢?!毙稳菰~修飾名詞的短語搭配中,形容詞被共同選擇,分享名詞的部分語義。如果名詞獨(dú)立出現(xiàn),意義一點(diǎn)兒也不會喪失。例如:
Physical attack, physical damage, physical proximity
Scientific analysis, scientific experiment, scientific study
General drift, general opinion, general public, general trend
Sinclair(1994)區(qū)別了形容詞的選擇性用法和聚焦性用法:
表3 形容詞的選擇性用法和聚焦性用法
例如,短語physical assault就是形容詞physical的聚焦性用法。形容詞physical 幾乎不對名詞assault添加任何意義,只是起到強(qiáng)調(diào)的作用,因?yàn)槊~assault本身就具有physical的特點(diǎn)。不過,在短語intellectual assault中,形容詞intellectual擁有本身獨(dú)立的意義,屬于增加不同意義、讓名詞語義變窄的選擇性用法。
Lorenz(1999)討論了短語中的聚焦性副詞。例如:diametrically opposed、 firmly entrenched、heavily loaded、 instantly recognized、 irretrievably lost、 readily available、 ruthlessly exploited等。在這些例子中,副詞語義虛化,僅僅用于強(qiáng)調(diào),對命題意義幾乎沒什么貢獻(xiàn)。
再如,副詞distinctly在下列短語中,語義虛化,不增加命題意義,用于強(qiáng)調(diào)說者/作者對某事的不贊成,帶有 明 顯的 負(fù) 面 語義 韻。例 如,distinctly different、 distinctly audible、distinctly visible、distinctly alarming、 distinctly dated、 distinctly inferior、 distinctly nervous、distinctly odd、distinctly peculiar、 distinctly queasy、distinctly uncomfortable、distinctly uneasy、distinctly unimpressed。
語義韻分析旨在分析意義單位中傳遞的態(tài)度和感情,代表語言使用的功能和目的(李文中 等,2020:72-83)。詞匯本義在風(fēng)格上來說是中性的,表達(dá)詞匯和世界之間客觀的關(guān)系。本義是詞匯意義最重要的組成部分,是最基本、最核心的意義。詞匯引申義(connotation)是主觀的、第二層級的、外圍的意義;詞匯引申義依賴詞匯和說者/作者之間的關(guān)系。不過,詞匯的主要意義和次要意義取決于個體觀念,其最重要的功能是表達(dá)個體態(tài)度。例如,die(死亡)是中性詞;pass away(逝世)試圖表達(dá)說話者的同情;snuff it(斷氣)根本不表達(dá)絲毫的同情;其他表示死亡的詞匯或短語包括expire、give up the ghost、perish、shuffle off this mortal coil等。這些替代性表達(dá)常常替代死亡禁忌語。再如,coffin(棺材)是中性詞,casket(棺槨)則帶有尊貴含義。
語料庫檢索結(jié)果表明,cause帶有明顯的負(fù)面語義韻。與動詞cause搭配的主語或賓語為:abandonment、accident、alarm、anger、annoyance、antagonism、anxiety、apathy、apprehension、breakage、burning、catastrophe、chaos、clash、commotion、complaint、concern、confusion、consternation、corrosion、crisis、crowding、damage、danger、death、deficiency、delay、despondency、destruction、deterioration、difficulty、disaster、disease、disorganization、disruption、disturbance、disunity、doubt、errors、frustration、harm、hostility、hurt、inconvenience、interference、injury、interruption、mistake、nuisance、pain、pandemonium、quarrel、rejection、ruckus、sorrows、split、suffering、suspicion、trouble、uneasiness、upset等。
Klotz(1997)證實(shí)了動詞cause的負(fù)面語義韻,同時指出了cause使用方面的限制?!皠釉~+單賓語”結(jié)構(gòu)中,作賓語的名詞可以是疾病,如Smoke causes cancer,但是在“動詞+雙賓語”結(jié)構(gòu)中,作賓語的名詞不可以是疾病,不可以說*cause him cancer,雙賓語結(jié)構(gòu)中的名詞只能是表示個體感覺的名詞,例如cause you agony、cause them inconvenience。cause還有可能與amusement(消遣)搭配為cause somebody amusement,似乎不帶有負(fù)面的語義韻。但是,語料庫檢索結(jié)果表明消遣接收者的負(fù)面態(tài)度。消遣接受者展示出屈尊降貴,自認(rèn)為高人一等的態(tài)度,對消遣提供者表現(xiàn)出不同程度的幸災(zāi)樂禍。例如,she was listening with more amusement than respect、are also cause for sardonic amusement。
動詞commit常常與adultery、atrocities、hara-kiri、offence、sin、suicide等搭配,動詞subject常與scrutiny、abuse、harassment、pressure、torture、attacks、criticism、barrage搭配,動詞hurl常與abuse、insults搭配,動詞endure常與forced、pain搭配,具有負(fù)面語義韻。形容詞soaring常與price(s)、cost(s)、unemployment、inflation、crime、deficit搭配,形容詞impending常與doom、disaster、war、crisis、death、attack、warning、rumour搭配,具有負(fù)面語義韻。介詞amid常與fears、speculation、allegations、concern、controversy、rumours搭配,具有負(fù)面語義韻。副詞potentially常與dangerous、explosive、lethal、fatal、damaging、serious、disastrous、harmful搭配,具有負(fù)面語義韻。名詞credibility常與lost、restore、gap、lack、problem、damaged、lose、undermine搭配,具有負(fù)面語義韻。
動詞provide常常與information、service(s)、support、help、money、protection、food、care等搭配,動詞derive常與benefits、pleasure、satisfaction、comfort搭配,具有正面語義韻。名詞discoveries常與new、important、great、exciting搭配,名詞expression常與freedom、artistic、creative搭配,具有正面語義韻。形容詞mutual常與respect、support、understanding、trust、agreement、benefit、interest搭配,形容詞roaring常與trade、fire、success、laughter搭配,具有正面語義韻(Stubbs, 2001:107-108)。
與句法結(jié)構(gòu)“BE+被動式”相比,“GET+被動式”表明不愉快的事正在發(fā)生,“GET+被動式”常常與addicted、caught up in、criticized、distorted、frightened、injured、kicked out、mixed up in、picked on、turned down、hurt、embarrassed搭配,帶有明顯的負(fù)面語義韻。
比較little和small,我們發(fā)現(xiàn),little帶有兒童用語的含義,例如,pretty little girl、little tiny、beautiful little等;與little相比,small比較正式,例如,comparatively small quantity、exceedingly small等。
搭配是個體詞匯的獨(dú)特屬性,一般難以概括。有些動詞的搭配范圍比較狹窄,尤其在“動詞-名詞短語”結(jié)構(gòu)搭配中,例如:curry favour(拍馬屁)、foot the bill(結(jié)賬)、quash an appeal(撤銷上訴)、shrug one’s shoulders(聳肩)、strike a balance(達(dá)成平衡)。Rancid、rotten、sour本義相同,但是出現(xiàn)在不同搭配中:rancid butter(哈喇了的黃油)、rotten eggs(臭雞蛋)、sour milk(變質(zhì)的牛奶)。Grill和toast意義相同,但是卻搭配迥異,grill meat(烤肉)、toast bread(烤面包)。搭配中,有時需要一般動詞(例如,make headway),有時不能使用一般動詞(make、do)而必須使用具體動詞(tell a story、tell/crack a joke),有時不同動詞可能表達(dá)相似意義(do/take/sit an exam、perform a dance)。這種限制和偏好,不勝枚舉。搭配的獨(dú)特性,因語言的不同而不同,例如漢語中的刷牙,英語也使用動詞“刷”(brush one’s teeth),法語中使用動詞“洗”(se laver les dents),德語使用動詞“清潔”(die Zahne putzen)。
英語從其他語言中借詞,反映了不同民族間的歷史文化接觸、科技交流和重要政治事件。例如,cold war(冷戰(zhàn))、Sputnik(蘇聯(lián)人造地球衛(wèi)星)、Watergate(水門事件)、 gate(—門)、perestroika(20世紀(jì)80年代末蘇聯(lián)政治即社會結(jié)構(gòu)的改革重建)、intifada(巴勒斯坦人起義)、taikonaut(中國宇航員)等。
英語中德語外來語一般來自政治、軍事、醫(yī)藥、工程等領(lǐng)域。 例如,dollar、Christmas tree、folk-song、Nazi(納粹)、Third Reich(第三帝國)、Gestapo(蓋世太保:國家秘密警察)、Blitzkrieg、flak(高射炮、抨擊)、angst(對形勢、事態(tài)、生活的憂慮和焦慮)、biology、chromosome(染色體)、Alzheimer’s(阿爾茲海默癥)、gauss(高斯)、Yiddish(猶太意弟緒語)。
公元九世紀(jì)到14世紀(jì),法語是英國宮廷的官方語言。在此期間,平民說古英語(middle English),而英國王室成員講法語。英語中的法語外來語一般來自烹飪、時尚、藝術(shù)領(lǐng)域,如buffet(自助餐)、croissant(羊角面包)、filet(肉片)、chalet(小木屋)、ballet(芭蕾)、bikini(比基尼)、Dada(達(dá)達(dá)主義)、lingerie(女士內(nèi)衣)、renaissance(文藝復(fù)興)等。借詞與文化緊密關(guān)聯(lián),例如漢語借詞Chow mein、Kung fu、mah jong、pinyin,日語借詞bonsai、karate、Honda、Sony等等。
語言中詞匯的內(nèi)在結(jié)構(gòu),為個體單詞連接成串的詞組。詞組中單詞之間的邏輯關(guān)系,或相同、相異或蘊(yùn)含。有時,單詞處于某個主題領(lǐng)域或語義場,單詞之間的關(guān)系比較模糊。例如,英語中關(guān)于horse語義場的詞匯搭配為:
表4 英語中的horse語義場
5.3.1 近義詞
單詞的本義和引申義,很少完全相同。近義詞彼此共享大多數(shù)語義特征,例如:
anarchy/chaos
anxiety/depression/fear/stress/tension
chapel/church
migraine/headache
towns/cities
utterly/completely
近義詞“couch、settee、sofa”本義相近,但搭配完全不同。例如,casting couch(娛樂圈中“潛規(guī)則”)、couch-potato(成天窩在沙發(fā)上看電視的人)、psychiatrist couch(心理醫(yī)生的診察臺)、sofa-bed(沙發(fā)床)。
禁忌語mad,可以用意義和用法都比較相近的近義詞代替,例如bananas、barmy、bonkers、crackers、crazy、cuckoo、dotty、loony、loopy、nuts、potty、unhinged等。
1066年諾曼入侵后,法語和拉丁語對英語詞匯的擴(kuò)展做出了重要貢獻(xiàn)。在法律、醫(yī)藥及其相關(guān)知識領(lǐng)域和文本類型的社會機(jī)構(gòu)中,產(chǎn)生了相應(yīng)的詞匯語義場。核心詞匯包括日耳曼語系的body,還包括羅曼語系的corpse(法語corps、拉丁語corpus)、cadaver(法語cadavre、拉丁語cadaver)和deceased(法語deces、拉丁語decessus)。一般日耳曼語系詞匯為單音節(jié)、不太正式;而羅曼語系詞匯為多音節(jié),比較正式。日耳曼語系單詞可以銜接兩個不同的語法結(jié)構(gòu)(I gave the book to Susan./ I gave Susan the book.),而羅曼語系單詞只能銜接一個語法結(jié)構(gòu)(I presented the book to Susan.* I presented Susan the book.)
表示尸體的一系列近義詞中,日耳曼語系的body是中性詞;羅曼語系的the deceased指某人剛剛離世,蘊(yùn)含對逝者的尊敬,常用于法律語境;羅曼語系的corpse帶有令人不愉快的含義,常常出現(xiàn)在犯罪報道中;stiff是俚語,帶有不尊敬的含義,風(fēng)格上有一點(diǎn)舊式,一般僅限用于美式偵探小說;cadaver為醫(yī)學(xué)術(shù)語。例如:
Lenin’s body lay in state
the family of the deceased
the corpse was barely recognizable
they found a stiff in the river
anatomical investigations of a human cadaver
carcass指大型動物尸體、供使用的畜體;如果carcass用于指人,顯得特別粗魯;carrion指代死亡動物的腐肉,是覓食動物和鳥類的食物:
the carcass of a dead buffalo
move your carcass over here (rude)
vultures and crows picking at a lion’s carcass
英文詞匯中,有表示死亡人、死亡動物(可以作為食物來源)的系列詞匯,還有表示死亡植物的詞匯(例如log、lumber、timber)。但是,英文詞匯中沒有代表死亡昆蟲、較小的死亡植物的詞匯。上述各組詞匯體現(xiàn)了對人類、動物、植物關(guān)注程度不斷減弱的層級關(guān)系。
5.3.2 反義詞
反義詞dry/wet、up/down、hot/cold并不是嚴(yán)格的二元對立關(guān)系。例如:
dry sock(干襪子)wet sock
dry season(干季)wet or rainy season
dry wine(不含糖的干型葡萄酒)sweet wine
dry skin(干燥的皮膚)moist skin
dry humour(一本正經(jīng)的幽默)unsubtle humour
a dry area(禁酒區(qū))an area which has pubs
a dry run(排練演習(xí))the real thing
dry land(陸地)sea
不同的短語中,dry意義不同。例如,high and dry(陷入困境)、there were few dry eyes in the house(屋里幾乎沒有人不掉眼淚。)
類似地,在下列短語中,wet也找不到明顯的反義詞。Wet blanket(令人掃興的人/物)、wet nurse(乳母)、feel like a wet rag(感到身心疲憊)、a Tory wet(瑪格麗特·撒切爾政府中觀點(diǎn)溫和的保守黨人)。
white的原型反義詞為black,但是在下列短語中,black顯然沒有立足之地:
white winered wine
white collarblue collar
white coffee(加了牛奶的咖啡,不是白色,是淺棕色)black coffee(不加牛奶的清咖)
傳統(tǒng)意義上的反義詞,是語言縱聚合關(guān)系中意義對立的詞匯。然而,從橫組合關(guān)系角度,可以更好地理解反義詞。例如,bride最常見的搭配是其反義詞groom,構(gòu)成bride and groom,這兩個單詞不可以相互替換。在脫離語境的情況下,conventional的反義詞為modern,但是在武器文本中,conventional weapon 的反義詞為chemical/nuclear weapon。
5.3.3 下義詞
上下義關(guān)系(hyponymy)表明詞類包含的邏輯關(guān)系。Buttercup(毛茛)是一種flower,flower是一種plant;spaniel(短腿獵犬)是一種dog,dog是一種animal。
Chomsky(1986)以內(nèi)部語言(I-language)和外部語言(E-language)術(shù)語,重構(gòu)了語言能力和語言運(yùn)用,這種區(qū)分對語料庫語言學(xué)具有啟示意義。內(nèi)部語言涉及語言能力,即有可能的、在心理語言學(xué)方面是可行的;內(nèi)部語言是第一人稱、參與者視角,內(nèi)部語言是知識系統(tǒng),是個體心理。外部語言涉及實(shí)際的語言運(yùn)用,因此是社會交往互動中系統(tǒng)的實(shí)現(xiàn);外部語言是第三人稱、觀察者視角,外部語言是行為,是社會活動和社會事件。語料庫收集的個體語言行為,可以被看作話語共同體中語言行為的樣本。單獨(dú)聚焦語料庫中的頻率會誤導(dǎo)研究者,只有當(dāng)頻率成為典型特征時,頻率才具有意義。交際能力還包括心照不宣的行為準(zhǔn)則知識(Hymes,1992)。
Partingtong(1998:18)認(rèn)為,“形式上可能”維度指代語言的脫離語境方面,而其他三個維度——“心理語言學(xué)方面可實(shí)現(xiàn)的和可行的”“社會語言學(xué)方面合適的”“實(shí)際上被說被寫被頻繁運(yùn)用的”——都與語境密切相關(guān),受到其他知識系統(tǒng)的限制。在詞語義項、近義詞、近義構(gòu)式、語法標(biāo)記、語序選擇等方面,廣泛運(yùn)用多因素語境共享分析(許家金,2020:10)。
Salt常常出現(xiàn)在菜譜中,常見的形式為season with salt and pepper、a good sprinkling of salt and pepper、salt、pepper and mustard。在烹飪語境中,salt的反義詞為salt/sugar或者salt/sweet。但是短語salt water的反義為fresh water。復(fù)數(shù)形式的salts出現(xiàn)在不同的搭配中,不再具有氯化鈉的意義,例如,copper salts、iron salts、mineral salts、vegetable salts。Salt在諺語中的意義更是遠(yuǎn)離現(xiàn)代人的常規(guī)認(rèn)知,例如rub salt into the wounds(在傷口上擦鹽,使痛上加痛)、have to be taken with a pinch of salt(不全信,有保留地)、the salt of the earth(非常正派的人)、if he is worth his salt(稱職)。Salt氯化鈉本義可以解釋其歷史淵源,鹽曾經(jīng)是歷史上比較有價值的商品,可以用于貯存食物。但是,這個意義逐步在不斷延伸的隱喻意義中喪失,salt的延伸意義與互文性地引用《圣經(jīng)》典故相關(guān)。我們雖然不能直接觀察salt的意義,但是語料庫數(shù)據(jù)可以提供這些意義的證據(jù)。這些意義依賴上下文中詞匯與其他詞匯的關(guān)系,或者依賴詞匯與其他文本中其他詞匯的關(guān)系(Stubbs,2001:45)。
語料庫索引行讓我們在橫軸維度(橫組合關(guān)系軸)和縱軸維度(尤其是索引行向左/向右按照字母順序重新配列后)觀察文本,尋找重復(fù)出現(xiàn)的文本證據(jù)(Tognini-Bonelli,1996)。索引行分析方法對詞語的典型搭配、類聯(lián)接、語義傾向和語義韻進(jìn)行描寫和歸納,為搭配研究、短語學(xué)、局部語法等領(lǐng)域的研究指明方向(梁茂成,2021:13-14)。
學(xué)術(shù)話語和職業(yè)話語語料庫研究已經(jīng)揭示,語言中存在高度慣例性的短語(phraseology)(Biber et al.,2004;Groom,2005;Charles,2006)。這些特定的、重復(fù)出現(xiàn)的詞匯短語模式,比起某個人的語言直覺來,無疑為研究者提供有效的線索去尋求語言的本質(zhì)(顧曰國,1998:2-4)。從語料庫證據(jù),歸納最頻繁使用的類聯(lián)接型式、詞語搭配、意義和功能,可以幫助語言教師發(fā)現(xiàn)新的語言事實(shí)、新的意義和用法模式,提高語言教師和學(xué)習(xí)者的語言意識和語料庫技能。在學(xué)科教學(xué)理論指導(dǎo)下,集成語料庫檢索技術(shù)、 網(wǎng)絡(luò)音視頻流媒體技術(shù)及人機(jī)交互界面,為語言教學(xué)提供底層數(shù)據(jù)支持(桂詩春 等,2010:419-426)。大型英語語料庫的真實(shí)語言給養(yǎng),可以構(gòu)成數(shù)字化教學(xué)資源建設(shè)的有機(jī)成分,確保英語學(xué)習(xí)者接觸更加地道的語言資源,促進(jìn)數(shù)據(jù)驅(qū)動的英語語言的教與學(xué)。