王子炫
(廣西大學(xué),廣西南寧 530004)
《追風(fēng)箏的人》[1]是美籍阿富汗作家卡勒德·胡賽尼的第一部長篇小說,一經(jīng)出版便廣受好評。該書是獲得法國《ELLE》讀者票選的年度最佳小說,卡勒德·胡塞尼也憑借這部作品獲得了2006年的聯(lián)合國人道主義獎。整本書以其深刻的主題思想和細(xì)膩的寫作手法吸引著不同民族、國家的讀者,令人印象深刻?!罢Z料庫現(xiàn)在一般是指存放在計算機里的大量語言材料和定位檢索管理軟件的組合?!闭Z料庫語言學(xué)自20 世紀(jì)60年代開始發(fā)展,迄今已有近60年的歷史?!拔捏w是個人或集體在談話或?qū)懽髦羞\用語言的方式?!盵2]“文體學(xué)源自古代亞里士多德的修辭論,是一門結(jié)合文學(xué)和語言學(xué)的交叉學(xué)科,是運用語言學(xué)的理論去闡釋文學(xué)內(nèi)容和寫作風(fēng)格的一門學(xué)科。”[3]文體學(xué)這一古老的學(xué)科同語料庫語言學(xué)相結(jié)合產(chǎn)生的語料庫文體學(xué),“是近年來隨著語料庫語言學(xué)的發(fā)展新生的一個研究途徑,旨在借助語料庫工具,以實證的手段對各類文本的文體特征進(jìn)行定量描寫和定性分析”[4]?;谡Z料庫的分析方法在文學(xué)文體學(xué)中的應(yīng)用,為研究文學(xué)文本提供了一種新的視角和理論依據(jù),有利于提高解讀文學(xué)作品的客觀性與準(zhǔn)確度。該文將運用語料庫的研究方法,結(jié)合語言學(xué)理論和文學(xué)理論,對《追風(fēng)箏的人》進(jìn)行定量、定性分析,探討該小說在詞匯層面的文體特征。筆者將從數(shù)據(jù)統(tǒng)計與詞匯分布層面展開具體分析,并試圖解釋這些文體特征背后產(chǎn)生的原因。
該文將《追風(fēng)箏的人》 英文原版作為自建語料庫,簡稱為“風(fēng)箏語料庫”,其文本為純文本。該自建語料庫共有9 028 個類符和107 850 個形符。美國當(dāng)代英語語料庫 (Corpus of Contemporary American English, COCA)是美國最新當(dāng)代英語語料庫,也是當(dāng)今世界上最大的英語平衡語料庫。該文將從COCA 小說語料庫中隨機抽取2001—2008年等量的純文學(xué)小說作為參照語料庫,其中文本均為純文本。該參照語料庫有11 583 個類符和123 206 個形符。以COCA 小說語料庫作為參照語料庫的合理性在于:該語料庫在文本類型、時間范圍和文本詞匯總數(shù)方面與風(fēng)箏語料庫有著極大的相似性。
該文主要運用AntConc3.4.3 和WordSmith6 作為語料庫檢索工具,運用卡方檢驗作為檢驗工具,以協(xié)助探究《追風(fēng)箏的人》在詞匯層面的文體特征。其中卡方檢驗是用途非常廣的一種假設(shè)檢驗方法,在該文中將用于檢測詞項在兩個語料庫中出現(xiàn)頻數(shù)的差異。顯著性水平(significance level)大于5%則說明無明顯差異,顯著性水平小于5%則說明有明顯差異。
該文將在數(shù)據(jù)統(tǒng)計方面比較兩個語料庫在詞匯密度、平均詞長和動詞名物化現(xiàn)象上的異同,在詞匯分布層面比較二者最高頻率詞和關(guān)鍵詞的差異。
首先,在數(shù)據(jù)統(tǒng)計方面,該文將運用Word-Smith6 軟件得出類符/形符比和標(biāo)準(zhǔn)化類符/形符比值,用以解說兩個語料庫中的詞匯密度與詞匯使用情況。WordSmith6 軟件還將用于分析平均詞長。此外該文將運用AntConc3.4.3 軟件分析兩個語料庫中的動詞名物化現(xiàn)象,分析-ment、-ness、-tion/-sion(包括其復(fù)數(shù)形式)3 種最常用的名詞后綴,并使用卡方檢驗檢測兩個語料庫中的動詞名物化現(xiàn)象是否具有顯著性差異。
其次,在詞匯分布層面,該文將運用AntConc 3.4.3 軟件中Word List 功能和Keyword List 功能,分析兩個語料庫前100 位最高頻率詞的異同以及《追風(fēng)箏的人》中關(guān)鍵詞的特性。
2.1.1 詞匯密度
對詞匯的研究有助于我們了解文本的特定風(fēng)格。在對詞匯密度展開分析前,有必要闡明形符和類符兩個概念。形符(token)是一個語言單位,它在文本中指詞元化之前的單詞總數(shù)。類符(type)指不重復(fù)計算的形符數(shù)。類符/形符比(type-token ration,TTR,即形次比)是衡量文本中詞匯密度的常用方法,它能反映出文本中詞匯的豐富程度。但貝克指出,“當(dāng)所比較的文本長度不同時,類符/形符比值可能因為類符聚集的均勻程度不同而受到影響,所以在相關(guān)研究中一般使用更為可靠的標(biāo)準(zhǔn)化類符/形符比(standardized TTR)衡量語料庫文本的詞匯變化?!边\用WordSmith6 軟件中的Word List 功能即可得出兩個語料庫的標(biāo)準(zhǔn)化類符/形符比,其結(jié)果如下。
就類符/形符比而言,風(fēng)箏語料庫(8.37) 小于COCA 語料庫(9.40),在標(biāo)準(zhǔn)化類符/形符比中,風(fēng)箏語料庫(44.93)大于COCA 語料庫(43.06)。由于兩個語料庫在文本長度上并非完全一致,因此該文采取標(biāo)準(zhǔn)化類符/形符比作為衡量標(biāo)準(zhǔn)。貝克指出,“類符/形符比值的高低與寫作者詞匯使用的豐富程度和多樣性成正比”[5]。因此,風(fēng)箏語料庫的標(biāo)準(zhǔn)化類符/形符比高于COCA 語料庫,顯示出在相同文字?jǐn)?shù)量的情況下,風(fēng)箏語料庫的詞匯使用相對更加豐富多樣,詞匯密度相對較高。這一結(jié)果其實在預(yù)料之中?!蹲凤L(fēng)箏的人》講述的是阿富汗兩個小男孩關(guān)于背叛與救贖的故事。小說故事情節(jié),以及深受作者卡勒德·胡塞尼阿富汗文化背景影響的寫作風(fēng)格,使這一部小說在語言使用上呈現(xiàn)出獨特的異域風(fēng)情,故而在用詞方面也顯示出豐富多樣的特性。
2.1.2 平均詞長
詞長是詞匯分析的一個重要手段,也是影響文本可讀性的一個重要因素。平均詞長也是最為實用的一種衡量參數(shù),它是類符的平均長度。WordSmith6中的Word List 功能將用于分析平均詞長,其結(jié)果顯示風(fēng)箏語料庫中的平均詞長(4.16)只略短于COCA語料庫的平均詞長(4.17),兩個語料庫的平均詞長都在4~5 詞之間,二者沒有明顯差異?!蹲凤L(fēng)箏的人》中平均詞長,一方面是受作者希望提高故事易讀性的影響[6]?!蹲凤L(fēng)箏的人》是一部以背叛與救贖為主題的成長類型小說,小說側(cè)重對故事的敘述、情節(jié)的推動,為讀者清晰地呈現(xiàn)主人公的內(nèi)心成長過程與救贖之旅中的探險,因此可讀性對《追風(fēng)箏的人》這部小說而言十分重要。文本中使用的單詞越短越簡單,語言就越簡單易懂。因此適中的平均詞長是作者期望達(dá)到的閱讀效果所致。另一方面《追風(fēng)箏的人》中平均詞長是受作者經(jīng)歷的影響。作者卡勒德·胡塞尼是美籍阿富汗作家,青年時期便移民美國,在美國的長期居住使卡勒德的英語水平越來越美國本土化,因而《追風(fēng)箏的人》在平均詞長方面與同時期的美國小說并沒有顯著差異。
2.1.3 動詞名物化現(xiàn)象
動詞名物化是指與動詞相關(guān)的名詞,即從動詞形態(tài)上派生出來的名詞。該部分將用AntConc3.4.3軟件研究以-ment、-ness、-tion/-sion(包括其復(fù)數(shù)形式)3 種最常用的后綴結(jié)尾的動詞名物化情況。操作步驟如下。
第一步,使用表達(dá)式“w+ments?”,即可把所有以“-ment”和“-ments”結(jié)尾的詞檢索出來。第二步,將所檢索的索引行導(dǎo)出并進(jìn)行檢驗,去除其中并非由動詞加后綴變來的名詞和以“-ment”結(jié)尾的非名詞,提高研究準(zhǔn)確性。第三步,再次運行AntConc3.4.3 軟件,重復(fù)第一步操作,最終得出所需數(shù)據(jù)。其他后綴在兩個語料庫中的情況以上述相同的方法檢索。
提取最終數(shù)據(jù)后,該文將運用卡方檢驗檢測兩個語料庫的動詞名物化現(xiàn)象是否存在顯著性差異,顯著性水平以5%為標(biāo)準(zhǔn)。檢驗結(jié)果如下,其中數(shù)據(jù)欄中“Corpus 1”代表風(fēng)箏語料庫,“Corpus 2”代表COCA 語料庫。P 值中出現(xiàn)的星號(*)代表顯著性水平,星號越多表示顯著性水平越高(見圖1)。
圖1 動詞名物化卡方檢驗
首先需要明確的是,大多數(shù)名物化是用來反映概括的狀態(tài)、過程,或個人品質(zhì)與情感,其中大多數(shù)是不可數(shù)名詞。就讀者而言,一般小說讀者注重故事情節(jié),因此小說也會注重對狀態(tài)和過程的描述。兩個語料庫中動詞名物化出現(xiàn)的不低的頻數(shù),就說明了文本作者對描述概括的狀態(tài)、過程的重視,以迎合讀者需要?!蹲凤L(fēng)箏的人》中運用大量抽象名詞來描繪人物性格與狀態(tài),成功地把讀者對人物外在特征的關(guān)注轉(zhuǎn)移到其言行舉止上,從而實現(xiàn)了解人物內(nèi)心世界的目的,使讀者感同身受。
其次,從上圖提供的數(shù)據(jù)可知,雖然兩個語料庫中都存在著不少的動詞名物化,但由于名物化總數(shù)的P 值小于5%,因此兩個語料庫在名物化使用上存在顯著差異,風(fēng)箏語料庫的動詞名物化頻數(shù)總數(shù)(328)小于COCA 語料庫(563),風(fēng)箏語料庫在動詞名物化使用上存在使用不足的情況。就具體數(shù)據(jù)而言,除-ness(es)以外,風(fēng)箏語料庫各后綴的動詞名物化頻數(shù)都小于COCA 語料庫,-ness(es)在風(fēng)箏語料庫中出現(xiàn)過多使用的情況,而-ment(s)和-tion(s)sion(s)則使用不足。
為了更深入地研究小說《追風(fēng)箏的人》在詞匯層面所具有的特征,有必要對文本中的最高頻率詞與關(guān)鍵詞進(jìn)行分析。該部分將用AntConc3.4.3 軟件中的Word List 功能截取風(fēng)箏語料庫與COCA 語料庫中前30 位的最高頻率詞,并用Keyword List 功能抽取風(fēng)箏語料庫中排名前30 的位關(guān)鍵詞,用以分析兩個語料庫在詞匯分布層面的異同,探究《追風(fēng)箏的人》所獨具的特征(見圖2)。
圖2 各語料庫中前30 位高頻詞
通過觀察兩個語料庫中前30 位的最高頻率詞,可以發(fā)現(xiàn)在兩個語料庫中排在前面的高頻詞大多數(shù)都是功能詞,或者說是表達(dá)語法意義的虛詞。比如,限定詞(“the”“a”)、介詞(“to”“of”,“in”“on”)、代詞(“he”“you”“that”“it”)、連詞(“and”“or”)與一些基礎(chǔ)動詞(“be”“have”)。這一現(xiàn)象傳達(dá)的是一個基本的語言事實,即語言最基本的功能在于傳達(dá)信息。這是兩個語料庫在高頻詞使用上的相似之處。
而兩個語料庫之間的差異,首先,體現(xiàn)在人稱代詞的使用情況上。結(jié)合圖2 與表1 可知,在風(fēng)箏語料庫中,“I”排在第二位(4 178 次),相對于COCA 語料庫(2 525 次)而言有過多使用的情況,說明采用第一人稱視角的寫作手法是《追風(fēng)箏的人》的一大語言特色。這樣的敘事手法增加了小說的真實性,提高讀者的代入感,從而引起讀者共鳴,為小說增添了無限的感染力。其次,在風(fēng)箏語料庫中,與男性有關(guān)的代詞出現(xiàn)頻率較高,如 “he”(1 781 次)、“his”(1 492次)、“him”(679 次),這三個代詞也是排在前30 位的關(guān)鍵詞。而與女性有關(guān)的代詞均未在風(fēng)箏語料庫前30 位的最高頻率詞與前30 位關(guān)鍵詞之列。相比之下,在COCA 語料庫中,男性與女性的相關(guān)代詞在頻率上相對均衡。出現(xiàn)這樣的數(shù)據(jù),是受《追風(fēng)箏的人》故事主題影響所致,故事講述的是關(guān)于兩個男孩之間的故事,因此男性的相關(guān)代詞占了很大比例。
表1 風(fēng)箏語料庫前30 位關(guān)鍵詞
結(jié)合表1 可知,兩個語料庫之間的差異,還體現(xiàn)在風(fēng)箏語料庫所具有的阿富汗地域文化詞匯上。《追風(fēng)箏的人》中人物取名頗具阿富汗民族特色,如“Hassan” “Sohrab” “Soraya” “Khan” “Amir” “Farid”“Assef”“Rahim”。前30 位關(guān)鍵詞中,地點名詞如“Kabul”“Afghanistan”“Afghan” 都與阿富 汗 相 關(guān)?!癹an”“agha”作為阿富汗特色的稱謂也在文中反復(fù)出現(xiàn)。這些都表達(dá)了作者濃厚的民族情結(jié),是小說作者的阿富汗文化背景的影響所致。
該文在數(shù)據(jù)統(tǒng)計方面比較風(fēng)箏語料庫和COCA語料庫在詞匯密度、 平均詞長和動詞名物化現(xiàn)象上的異同,在詞匯分布層面比較二者最高頻率詞和關(guān)鍵詞的差異。研究結(jié)果如下。
在數(shù)據(jù)統(tǒng)計方面,《追風(fēng)箏的人》 的詞匯使用相對更加豐富多樣,詞匯密度相對較高。在平均詞長層面,《追風(fēng)箏的人》 與同時期美國其他小說沒有明顯區(qū)別。在動詞名物化層面,雖然兩個語料庫中都存在大量動詞名物化,但在具體使用上《追風(fēng)箏的人》與同時期美國其他小說存在顯著差異。在詞匯分布層面,兩個語料庫前30 位高頻詞中都存在大量功能詞,這是二者的共性?!蹲凤L(fēng)箏的人》的特性一方面體現(xiàn)在第一人稱與男性的相關(guān)代詞的使用情況上,另一方面體現(xiàn)在阿富汗地域文化詞匯的使用上。研究發(fā)現(xiàn),這些特性與小說作者卡勒德·胡塞尼的美籍阿富汗身份有關(guān),受他的生活經(jīng)歷與阿富汗文化背景影響,由作者寫作風(fēng)格、小說故事情節(jié)與作者期望達(dá)到的閱讀效果決定。這些特性使讀者在領(lǐng)會阿富汗異國風(fēng)情的同時,又不至于過于“陌生化”,因此提升并保留了小說的趣味性與可讀性。基于語料庫的研究方法為研究《追風(fēng)箏的人》增添了多樣性,通過該文研究,筆者希望為研究文學(xué)作品提供新的視角和研究方法。