楊晨
摘? ? 要: 本文以張愛玲和王安憶的各三部小說作為語料,選用段落、句子和分句的長度,疊詞、顏色詞和包含上海元素詞語作為特征,使用SPSS相關(guān)分析和聚類分析判斷兩位作者的作品的異同。該文發(fā)現(xiàn)張愛玲和王安憶都善于使用疊詞和顏色詞,都通過細膩的女性筆觸,描寫上海的傳奇故事。
關(guān)鍵詞: 計量風格? ? 張愛玲? ? 王安憶? ? 層次聚類
1.引言
張愛玲,1920年生于上海,先后創(chuàng)作了《傾城之戀》《金鎖記》《紅玫瑰與白玫瑰》等小說和大量散文、電影劇本、學(xué)術(shù)論著和翻譯作品。王安憶,1953年生于江蘇南京,一歲時隨父母遷居上海,先后創(chuàng)作了《長恨歌》《黃河故道人》等長篇小說和大量小說集、散文和文論集。盡管兩人相隔近半個世紀,卻都有著久居上海的生活經(jīng)歷,成長背景相似,創(chuàng)作主題以都市小說為主,都以描摹女性人物見長。
已經(jīng)有很多學(xué)者對二人進行對比研究,但大多集中在都市小說創(chuàng)作的比較研究,尤其是上海都市書寫的比較研究,以及作品中的女性人物形象研究。同時,這些研究都采用了傳統(tǒng)的內(nèi)省式方法,對二者語言風格的客觀對比目前還是一片空白。因此,作者希望從計量風格學(xué)的角度對兩人的文學(xué)語言進行研究。
計量風格學(xué)區(qū)別于傳統(tǒng)風格學(xué),不以個人閱讀體驗為依據(jù),而轉(zhuǎn)向客觀方法來分析寫作風格。在中文文本領(lǐng)域,通常會提取文本層面的詞長、句長、段長,詞匯層面的詞類、詞匯豐富度、高頻詞等。再通過統(tǒng)計學(xué)方法來判斷不同作者之間是否存在差異,最后分析這些數(shù)據(jù)體現(xiàn)了文本什么樣的風格差異。
2.語料庫和預(yù)處理
本文選擇張愛玲及王安憶的三部小說為研究語料,并為了在圖表中方便表示進行編號。首先對文本進行預(yù)處理:刪去章節(jié)號、標題、前言與后記。再使用NLPIR漢語分詞系統(tǒng)對文本進行分詞,并據(jù)此統(tǒng)計語料庫中字、詞、標點的數(shù)量和句子、段落的長度,見表1,表2。
表1? ? 語料庫字、詞情況
表2? ? 語料庫段落、句子及分句情況
3.段落、句子和分句
在語料預(yù)處理時已經(jīng)統(tǒng)計了六部小說的段落、句子和分句的數(shù)量、均值和。通過數(shù)據(jù)能夠發(fā)現(xiàn),張愛玲小說的平均段落長度明顯大于王安憶小說,二者在段落平均句數(shù)和平均分句句長差別不大。張愛玲小說平均段落長度大于王安憶的原因是張愛玲小說段落中有更多的句子。張愛玲小說這種更長的段落降低了文本的易讀性,需要讀者花費更多的精力在文本閱讀上。
另一方面,作者利用SPSS對表2的語言特征進行相關(guān)分析,相關(guān)系數(shù)的大小表示相關(guān)程度。相關(guān)系數(shù)最早是由統(tǒng)計學(xué)家Pearson提出的,目前最常用的相關(guān)系數(shù)就是皮爾遜(Pearson)相關(guān)系數(shù),在使用SPSS進行簡單相關(guān)分析時所計算出來的相關(guān)系數(shù)就是皮爾遜(Pearson)相關(guān)系數(shù)。相關(guān)系數(shù)一般用r表示,r值有正負之分,正值表示正相關(guān),負值表示負相關(guān)。判斷相關(guān)性強弱時我們考慮的是r的絕對值,絕對值越大,相關(guān)性越強;絕對值越小,相關(guān)性越弱。其相關(guān)性的強弱判斷如下所示:
取絕對值后,若相關(guān)系數(shù)r<0.09,則認為變量之間沒有相關(guān)性;若相關(guān)系數(shù)在0.1-0.3之間,則認為變量之間的相關(guān)性弱,幾乎可以認定為沒有相關(guān)性;若相關(guān)系數(shù)在0.3-0.5之間,則認為變量之間具有中等相關(guān)性;若相關(guān)系數(shù)在0.5-0.8之間,則認為變量之間具有較強的相關(guān)性;若相關(guān)系數(shù)r>0.8,則認為變量之間具有很強的相關(guān)性。
輸出結(jié)果如下圖所示:
觀察數(shù)據(jù)可以發(fā)現(xiàn),平均段落長度的r值為0.236,即張愛玲和王安憶在段長上存在顯著差異。
4.詞匯的定量分析
4.1詞匯豐富度
詞匯豐富度是描繪文本中作者用詞的重要維度,主要用類符形符比(Type-Token Ratio, TTR)來表示。所謂類符(type)是文本中所有出現(xiàn)的詞匯的類數(shù),相同的詞記為1個;形符(token)是文本總詞數(shù)。但是,通常一個作者在寫作時使用的不同詞匯數(shù)量是一定的,而隨著文本的增長,總詞數(shù)在不斷增加,所以文本越長,對TTR的結(jié)果影響越大。因此,本文采用Guitaud提出的修正公式,取形符的平方根作為分布計算詞匯豐富度,公式如下:
具體統(tǒng)計情況如下表所示:
為了便于觀察,將由此得到的張愛玲、王安憶修正類符、形符比繪成折線圖,可以看到除了Z1的詞匯豐富度大于W1,王安憶小說的詞匯豐富度略大于張愛玲。因此,在下文,我們挑選幾個有代表性的用詞習(xí)慣進行對比分析。
4.2重疊式
音樂性是張愛玲和王安憶語言藝術(shù)特色之一,反映在語言文字字上就是重疊形式的使用。重疊形式的巧妙運用可以增強語言的韻律感、節(jié)奏美。檢索六部作品的重疊形式,統(tǒng)計結(jié)果如下:
觀察數(shù)據(jù),可以看出張愛玲的疊詞使用頻率明顯高于王安憶,利用索引工具,我們發(fā)現(xiàn),二人使用了大量的重疊且形式豐富多樣。從表達效果上看,重疊形式可以使文章形式整齊,寫景狀物時增強語言的表達能力,渲染氣氛時營造出綿遠悠長的藝術(shù)效果,讀起來朗朗上口。
天就快亮了。那扁扁的下弦月,低一點,低一點,大一點,像赤金的臉盆,沉了下去。天是森冷的蟹殼青,天底下黑魆魆的只有些矮樓房,因此,一望望得很遠。地平線上的曉色,一層綠,一層黃,又一層紅,如同切開的西瓜,是太陽要上來了。漸漸馬路上有了小車與塌車轆轆推動馬車蹄聲得得。賣豆腐花的挑著擔子悠悠吆喝著,只聽見那漫長的尾聲:“花……嘔!花……嘔!”再去遠些,就只聽見:“哦……嘔!哦……嘔!”(《金鎖記》)
這一段描寫用了“扁扁”“黑魆魆”“轆轆”“悠悠”等重疊形式,生動地勾勒出黎明破曉前街道的景象,“轆轆”“得得”的疊音詞使用更是增強了畫面感,形象地描繪出街道由平靜轉(zhuǎn)向喧鬧的場景,具有動態(tài)感,使人聲臨其境。