卞慧君
(黑龍江大學(xué),黑龍江哈爾濱150080)
契訶夫作為世界知名的三大短篇小說家之一,國內(nèi)現(xiàn)有關(guān)于契訶夫創(chuàng)作的研究數(shù)量龐雜,研究對象多集中于其短篇小說及戲劇創(chuàng)作。關(guān)于契訶夫的短篇小說研究可以分為以下三類:一是關(guān)于人物形象的研究,以社會變革背景下人的異化為切入,集中對其作品中的“小人物”、知識分子及女性形象開展研究,一方面通過分析作品人物的心理、語言以及生活處境從而深刻揭露俄羅斯民族性格,分析對造成“小人物”悲慘生活處境的社會原因以及契訶夫?qū)ι鐣讓尤嗣瘛鞍洳恍?、怒其不爭、恨其不為”的態(tài)度和立場;另一方面重點關(guān)注其筆下的女性人物形象,通過分析契訶夫作品對女性人物性格及行為的塑造,結(jié)合女性主義理論分析男權(quán)話語模式對于女性形象的建構(gòu),探析契訶夫?qū)τ谛屡f世界之交女性出路的思考,如基于《跳來跳去的女人》《掛在脖子上的安娜》進行的人物形象分析等;二是從比較文學(xué)的角度入手,一方面通過契訶夫與世界另兩位知名短篇小說家莫泊桑、歐·亨利進行對比,從而分析三者在語言風(fēng)格、創(chuàng)作個性及風(fēng)格等方面的特征,通過對比發(fā)現(xiàn)契訶夫是以現(xiàn)實主義創(chuàng)作為基礎(chǔ)敘寫“小人物”的悲慘生活,著眼于日常生活以樸實平淡的筆調(diào)實現(xiàn)對深刻意涵的揭示;另一方面是將契訶夫與我國著名作家魯迅及劇作家曹禺進行對比,如通過對社會變革時期知識分子形象的塑造,展現(xiàn)出對不同歷史背景下作家對社會問題的分析,以及研究契訶夫?qū)Σ茇趹騽?chuàng)作方面的影響及差異性分析,如對話、敘事者選取以及女性形象塑造等方面;三是重點針對小說文本藝術(shù)特色展開研究,如分析作品的修辭特色、敘事特征等。但目前基于數(shù)字手段對契訶夫作品乃至于俄羅斯文學(xué)創(chuàng)作進行的研究都為數(shù)不多,現(xiàn)有通過語料庫對契訶夫作品的研究尚局限于針對其作品譯本的對比分析,或基于其作品原文及譯文進行的俄漢文學(xué)語料庫設(shè)計創(chuàng)建。
正如并非所有簡潔的作品都能夠成為精品,也并非所有文學(xué)創(chuàng)作都能給讀者以戲劇舞臺效果。本文以AntConc檢索工具作為輔助,以契訶夫的經(jīng)典短篇小說《變色龍》《小公務(wù)員之死》《套中人》為基本語料,對作品的語言詞匯展開數(shù)據(jù)分析統(tǒng)計,基于理性實證研究分析契訶夫短篇小說所呈現(xiàn)出的藝術(shù)特色,以及其作品何以能夠展現(xiàn)出獨特的戲劇舞臺效果,并基于數(shù)據(jù)統(tǒng)計歸納總結(jié)契訶夫短篇小說創(chuàng)作的語言詞匯、句型句式特征。
“數(shù)字人文,也稱人文計算(Humanities Computing 或Computing in the Humanities),它是一個將現(xiàn)代計算機和網(wǎng)絡(luò)技術(shù)深入應(yīng)用于傳統(tǒng)的人文研究與教學(xué)的新型跨學(xué)科研究領(lǐng)域,它的產(chǎn)生與發(fā)展得益于數(shù)字技術(shù)的進步及其在科學(xué)領(lǐng)域的普及應(yīng)用?!逼毡檎J為數(shù)字人文廣義上是指將人文研究與信息技術(shù)相融合,基于大量的數(shù)字化、電子化文本文獻,以各類信息技術(shù)軟件,如SPSS、AntConc 等為輔助實現(xiàn)對人文學(xué)科的理性研究分析,以及信息的視覺化、圖像化效果直觀呈現(xiàn)。“20 世紀90 年代初期,人文計算作為一個獨立的交叉學(xué)科逐漸成形。1999 年,Willard McCarty 討論了人文計算作為一個獨立的學(xué)科與其它學(xué)科的關(guān)系,以及如何在制度和學(xué)術(shù)層面來為人文計算活動提供切實的保障和支撐,90 年代后期,人文學(xué)者開始越來越頻繁和深入地使用各種新型的數(shù)字技術(shù)處理人文資料。”
通過數(shù)字手段開展文學(xué)研究主要包括以下四個方面,一是通過文獻數(shù)據(jù)庫,結(jié)合特定的社會背景、歷史環(huán)境特征開展關(guān)于作家生平或作品創(chuàng)作背景考證的研究;二是通過數(shù)據(jù)庫對文獻開展定性及定量的雙重研究,從而深化對文學(xué)思潮、流派或文學(xué)思想史的譜系研究;三是開展文學(xué)文體學(xué)、修辭學(xué)、語言學(xué)等研究,基于數(shù)字化文獻的可統(tǒng)計、可測量等特性,通過軟件輔助對文學(xué)文本語言、詞匯、句篇等方面進行統(tǒng)計分析,實現(xiàn)對作品創(chuàng)作的敘事特點、創(chuàng)作風(fēng)格、人物情節(jié)功能等方面的研究;四是基于數(shù)據(jù)庫、語料庫開展比較文學(xué)或文學(xué)翻譯研究,針對同一作品的歷時歷代或不同語種的譯本進行比較分析,揭露在不同歷史時期社會背景下同一作品文學(xué)譯作在詞匯使用等方面的變化,以及文學(xué)接受審美批評的變化等。
《變色龍》《小公務(wù)員之死》《套中人》作為契訶夫家喻戶曉的三個經(jīng)典短篇,具有研究的代表性,本文通過AntConc 檢索工具對小說文本進行分析研究,重點使用concordance、concordance plot、file view 以及word list 等功能實現(xiàn)對文本的統(tǒng)計分析。其中,word list 功能可實現(xiàn)對文本中詞匯的使用頻率進行統(tǒng)計并排行,在文學(xué)文本研究中,通過詞匯使用頻率排序可通過出現(xiàn)的高頻詞初步判斷作品的主人公、重點相關(guān)對象等,從而判斷文本主體及主要人物形象。在性別研究方面,可以根據(jù)男女主人公及人稱代詞的出現(xiàn)頻率等客觀數(shù)據(jù)分析作者對人物形象的塑造,以基于理性主義的數(shù)據(jù)為實證深入分析作品內(nèi)涵等。結(jié)合concordance 功能鎖定所需查詢的高頻詞在文本中出現(xiàn)的具體位置,根據(jù)高頻詞的詞語搭配或句式使用,判斷作者的創(chuàng)作風(fēng)格等。并通過concordance plot 以直觀的方式展示所需查詢詞語在文本中出現(xiàn)的大致位置及密度分布,可據(jù)此初步判斷文本中各人物形象集中出現(xiàn)的大致位置以及情節(jié)變化,判斷不同敘事階段主人公或敘事角度的轉(zhuǎn)換,從而推測文本的敘事特征等,如敘述主體、敘事角度、敘事順序等。
AntConc 具有統(tǒng)計研究文本的形符(token)與類符(type)的功能,形符指文本中的詞匯總數(shù),類符則指不重復(fù)計算的的形符數(shù),即文本中重復(fù)出現(xiàn)的形符僅算作一個類符。通過類符/形符比可計算得出形次比(Type token ratio, TTR),形次比是衡量文本詞匯密度的常用方法,可輔助說明文本的詞匯難度及詞匯多樣性程度。
通過數(shù)據(jù)統(tǒng)計得知,契訶夫的三個短篇小說形符數(shù)均值為1900,其中《變色龍》《小公務(wù)員之死》詞匯數(shù)均小于1000,《套中人》為4000 多詞,從總詞數(shù)量上看,篇幅較短。通過計算,在未進行詞形歸化條件下,得出三篇作品的形次比都位于0.5 左右。由此可推斷得出,一是契訶夫短篇小說的創(chuàng)作在詞匯多樣性方面屬于中等偏下水平,即并不追求用詞的復(fù)雜性、獨特性,從而印證了先有研究中關(guān)于契訶夫創(chuàng)作語言以平實樸素為主的結(jié)論,亦如高爾基對契訶夫語言的評論:他的語言是以一種非常漂亮但卻非常簡單的形式表現(xiàn)出來,而這種簡單的形式更加深了其話語的意義。二是形次比低,即說明詞匯類符占比低、詞匯重復(fù)度高;三是契訶夫三個短篇小說創(chuàng)作的平均詞長為6.8,根據(jù)齊普夫定律可推斷詞長越短,用頻越高;反之,詞長越長,用頻越低。
因此,從詞匯多樣性的角度可以分析得出契訶夫的短篇小說創(chuàng)作詞匯多樣性較低、用詞重復(fù)度高、語言平實樸素的特征,據(jù)此推測得出作品可讀性強,受眾群體廣泛。
通過AntConc 檢索工具的word list 功能對三篇作品詞匯用頻進行統(tǒng)計,使用排名前十的單詞按照使用頻率排列如下:
通過上表進行分析發(fā)現(xiàn),三篇作品中排名前十的詞匯具有一定共性,一是都含有前置詞、簡單句連詞、人稱代詞和否定詞,且以上四類詞語在三個作品排名前十單詞中的占比為《變色龍》——90%,《小公務(wù)員之死》——70%,《套中人》——80%;二是排名位居首位的都是連詞и,該特征與俄語國家語料庫中公布的俄語高頻詞列表一致。
通過詞頻排序高的實詞判斷,可以確定作品中的主要角色、人物形象或敘述對象。如通過三篇作品中位于前十的專有名詞(人名)可以判斷出作品的主人公,如《變色龍》的主人公是奧楚美洛夫,即作品名稱“變色龍”的代表,《小公務(wù)員之死》的主人公是小公務(wù)員切爾維亞科夫和上校,《套中人》在排名前十的單詞中未出現(xiàn)人名,但綜合看詞頻排序列表中排名第二、三、四的實詞分別是“別里科夫”和“瓦蓮卡”“柯瓦連科”,分別位于25、38、39 位,第一個實詞是動詞быть,此前的23 個單詞均為前置詞、代詞以及連詞等。根據(jù)詞頻排序《變色龍》中排名位于第三、第四的實詞分別是手指和狗,因此可以推斷故事情節(jié)將主要圍繞這三者展開,其中排名第二的是благородие,根據(jù)concordance可知文中搭配均為ваше благородие 是指舊俄時期對十四至十九級文武官員及其夫人等的尊稱?!缎」珓?wù)員之死》中除了切爾維亞科夫和上校,出現(xiàn)最多的是動詞думать 的多種變位形式,可以推斷作品中關(guān)于心理活動的書寫內(nèi)容較多。結(jié)合concordance plot 可以直觀看到在《變色龍》及《小公務(wù)員之死》中主人公奧楚美洛夫以及切爾維亞科夫和上校在文本中的分布位置及密度,如圖所示以上兩部作品中的主人公都是貫穿作品始終的人物。由此可以判斷,契訶夫短篇小說作品中人物數(shù)量較少且故事情節(jié)集中。
通過詞頻統(tǒng)計還可以分析出作品的句型特征。首先,通過word list 觀察到契訶夫作品中大量使用前置詞和簡單句,如《變色龍》中排名前十的詞語中有4 個是前置詞,分別是 в、на、у、с, 如 в новой шинели、в руке、в ситцевой крахмальной рубахе;На площади、на свет、На полупьяном лице 等;《小公務(wù)員之死》中排名前十的單詞中有2 個前置詞,分別是в、на,如В один прекрасный вечер、В животе у Червякова;《套中人》——3 個,分別是в、на、с。如в последние десять лет、в очень хорошую погоду、На самом краю села、на этом свете 等。俄語中的前置詞是虛詞的一種,無形態(tài)變化,用以表示名詞、代詞等與句中其他詞之間的語法聯(lián)系及意義關(guān)系。俄語中的前置詞有時可以代替動詞或從句使用,如с 常表示帶著、拿著,代替動詞взять,或表原因的前置詞可以代替原因從句。契訶夫在作品中大量使用前置詞,同樣具有實現(xiàn)文本簡化的作用,一反陀思妥耶夫斯基和托爾斯泰鴻篇巨著的創(chuàng)作傳統(tǒng),避免使用復(fù)雜句造成作品冗雜,從而實現(xiàn)作品創(chuàng)作語言上的簡潔性特征。
其次,再通過對三篇作品中的并列連接詞和主從連接詞進行統(tǒng)計,直接判斷契訶夫短篇小說創(chuàng)作中復(fù)雜句及簡單句的使用情況。根據(jù)word list 可知三篇作品中詞頻排在首位的都是聯(lián)合連接詞и,通過concordance 進行文本判斷,發(fā)現(xiàn)и 在作品中主要發(fā)揮句間并列及句中并列的作用且句中并列居多,多用于表示句中動詞或名詞的并列。word list 中作為主從連接詞的單詞排名均較為靠后、使用數(shù)量較少,且三篇作品的敘事具有對話的共性特征?!蹲兩垺贰缎」珓?wù)員之死》幾乎以對話貫穿全文,亞里士多德在《詩學(xué)》中提到:“埃斯庫羅斯最早把演員由一名增至兩名,并削減了歌隊的合唱,從而使話語成為戲劇的骨干成分。”可見,戲劇得以發(fā)展的基礎(chǔ)正是對話,正是由此使得契訶夫的短篇小說創(chuàng)作具有一種獨特的戲劇舞臺效果。
《變色龍》詞頻排序前十的單詞中不含有主從連接詞,且鑒于《變色龍》文本中多為對話體,日常對話語言中多使用具有口語特征的短句、簡單句,從句及復(fù)合句使用較少;《小公務(wù)員之死》排名前十的單詞中有一個說明連接詞即что,結(jié)合文本分析發(fā)現(xiàn)主要是由что 引導(dǎo)的說明從屬句,說明主句中表示言語、思維的詞語,如увидеть、узнать、подумать、объяснять 等;《套中人》排名前十的單詞中含有連接詞что,共計出現(xiàn)70 余次,但其中由統(tǒng)計顯示主從連接詞что 引導(dǎo)并非全部為從句,其中還包括部分感嘆句及一般疑問句等,因此實際復(fù)合從句數(shù)量遠低于70 句。
綜合詞頻統(tǒng)計、分布及文體研究得知,契訶夫在短篇創(chuàng)作具有以下特點,一是大量使用前置詞實現(xiàn)文本的簡化;二是多使用具有日??谡Z性質(zhì)的短句、簡單句,復(fù)合句使用較少;三是作品多以對話形式展開,并由此創(chuàng)造一種獨特的戲劇舞臺效果。
基于數(shù)據(jù)統(tǒng)計方法進行文學(xué)文本研究是一種把定量統(tǒng)計與定性分析相結(jié)合的方法,旨在對文學(xué)文本的語言特征進行定量的統(tǒng)計,以統(tǒng)計數(shù)據(jù)為輔助,在文學(xué)和文化層面進行定性的分析和歸納?;跀?shù)據(jù)統(tǒng)計的方法研究有助于克服傳統(tǒng)印象式點評方法的主觀臆斷,彌補由于通過純粹主觀敘述以及哲學(xué)思辨方法不足導(dǎo)致的客觀性不強的問題。通過對契訶夫經(jīng)典短篇小說《變色龍》《小公務(wù)員之死》《套中人》的詞匯進行初步數(shù)據(jù)統(tǒng)計分析,總結(jié)發(fā)現(xiàn)契訶夫短篇小說創(chuàng)作在詞匯及句型使用方面具有以下特征:一是其作品創(chuàng)作的詞匯多樣性較低、重復(fù)度高、語言平實樸素,易于理解、受眾廣泛;二是作品通過對話、簡單句及廣泛使用前置詞實現(xiàn)作品的簡化,并營造一種獨特的戲劇舞臺效果;三是作品的人物數(shù)量少、情節(jié)集中。
充分結(jié)合各類信息技術(shù),對于文學(xué)研究在詞匯數(shù)據(jù)分析統(tǒng)計方面具有重要意義,有助于實現(xiàn)文學(xué)的跨學(xué)科創(chuàng)新,通過當(dāng)代信息技術(shù)能夠突破原有的文學(xué)研究范式,不斷利用數(shù)據(jù)化文獻統(tǒng)計補充、完善、發(fā)展文學(xué)研究的方法,從而實現(xiàn)文學(xué)研究范式的革新與突破。