吳燕俠 韋艷英
摘 要:在口語文本中,詞長、詞頻分布、詞匯豐富度和高頻詞搭配強度的量化特征反映詞匯復(fù)雜度;平均句長、句型分布情況用于探究語句復(fù)雜度?;跀⑹乱暯?,在詞匯和句法兩個維度上分析泰國留學生口語語段文本的復(fù)雜度特點。具體表現(xiàn)為:單音節(jié)詞在總詞量中占比例高,高頻詞搭配強度大,同義詞缺乏,詞匯豐富度低,反映出泰國留學生口語詞匯組合形式單調(diào);敘事性口語,以五字句為主,“是”字句和“有”字句使用頻次高;在語段銜接視角上,泰國留學生口語則傾向于使用無定名結(jié)構(gòu)引出話題,話題引入手段缺乏豐富性。
關(guān)鍵詞:口語表達;復(fù)雜度;計算特征;詞匯維度;語句維度
中圖分類號:H195.3 文獻標識碼:A 文章編號:1009 — 2234(2020)10 — 0155 — 03
口語表達是衡量語言運用能力的標準之一,而研究如何提高第二語言學習者口語表達能力成為學界關(guān)注的熱點。Skehan〔1〕(2009)基于復(fù)雜理論視角,分析和探究靜態(tài)語言環(huán)境中第二語言習得和發(fā)展水平的有效方法,認為復(fù)雜度(complexity)、準確度(accuracy)和流利度(fluency)(簡稱“CAF”)是衡量語言學習者口語表達能力的重要維度。“復(fù)雜度指二語結(jié)構(gòu)和詞匯的多樣及復(fù)雜程度”,從詞匯和語法結(jié)構(gòu)運用兩個方面體現(xiàn);通過測量詞長和句長,以及詞類使用頻率來精確表達〔2〕(李茶、隋銘才,2017)。口語語段復(fù)雜度測量框架包括詞匯測量維度和語句測量維度兩方面。其中,詞匯測量維度分為詞長、詞頻分布、詞匯使用豐富度和高頻詞搭配強度等四個觀察點;語句測量維度則從平均句長和句型分布和兩個方面衡量。
1.研究設(shè)計
1.1研究對象
以北部灣大學完成中級語言班學習的40名泰國留學生為測試對象,學習漢語的時間平均超過三年,來自泰國不同地區(qū),年齡相仿(在19至21歲之間),男女各20名。
1.2研究步驟
目前常用對話、轉(zhuǎn)述、演講等形式,反饋語言學習者的口語表達能力。徐子亮〔3〕(2005)認為,復(fù)述式與交際式是培養(yǎng)學習者漢語語段表達能力的好方法。本文選取復(fù)述式考察方式,具體實施步驟如下:
讓泰國留學生觀看完無聲無字幕動畫短片《鷸》①。要求每一位測試者即時用漢語敘述影片中鷸寶寶的活動過程,每位測試者限時5分鐘。忽略測試對象在語音上受母語負遷移的影響,通過Audacity 1.3錄音,轉(zhuǎn)寫采用寬式轉(zhuǎn)寫規(guī)則,轉(zhuǎn)寫成word文本。得到共計8292個漢字,總詞數(shù)6146個,不同類型漢字297個的封閉型語料庫;單音節(jié)詞類符138個,單音節(jié)詞形符為4955個;雙音節(jié)詞類符133個,雙音節(jié)詞形符是1151個,沒有出現(xiàn)兩個音節(jié)以上的詞語。單音節(jié)詞占80.6%,雙音節(jié)詞僅占19.4%。
2.詞匯測量維度
2.1平均詞長分析
在書面語中,文本可讀性與平均詞長、平均句長成反比〔4〕(劉穎,2014)。平均詞長越小,文本中長詞越少,可讀性越強,反之亦然。在口語文本中,平均詞長等于所有音節(jié)數(shù)與總詞數(shù)之商。敘事性口語表達中,泰國留學生口語的平均詞長約為1.181,較書面語文本的平均詞長值小。但是,在敘事角度下,留學生口語文本可讀性并不高。例如:
(1)小小孩出去!
(2)那只鳥就向那只螺避難。
(3)它就..打出能仔細蓋。
(4)它看見了螺是挖地下挖沙漠。
2.2詞頻分布
“概率是一種概括,一個概率命題是另外一些命題的一種摘要”〔5〕。高頻詞是文本中使用最多的詞語,受表達內(nèi)容和說話者表達方式影響。因而,對高頻詞的考察,可以發(fā)現(xiàn)測試對象口語關(guān)注點和表達特點。8個高頻詞在文本中分布率為23.69%,其中,單音節(jié)詞頻次超過100的有:它、找、螺、吃、在、了、是;雙音節(jié)詞頻次過百的僅“媽媽”一詞。
在現(xiàn)代漢語詞類中,實詞包括名詞、動詞、形容詞、代詞、副詞等五種,虛詞有數(shù)詞、量詞、介詞、助詞、連詞、擬聲詞、嘆詞等七種。而泰國留學生口語表達中,除了沒有擬聲詞外,其他詞類頻次分布差異較大。頻次最高的是動詞,1547次,占25.19%,其次是名詞、代詞,形容詞在實詞中頻次最小,僅81次,僅占1.31%。而虛詞中,副詞的頻次最高,共903次,其次是助詞、介詞、連詞和語氣詞。
動詞使用頻次較高的除了“找”和“吃”外,還有“是”、“怕”、“有”、“去”、“看到”、“找到”、“知道”、“過來”等使用頻次接近100。在名詞中,頻次最多的十個詞例是:媽媽、螺、海浪、小鳥、現(xiàn)在、鳥、東西、浪、食物、孩子。時間名詞和方位名詞在泰國留學生口語中使用差異較大。時間名詞出現(xiàn)47次,但類型單一,僅“現(xiàn)在”一詞頻次就40次。僅出現(xiàn)一次的時間名詞有“以前”、“以后”。例如:
(1)因為以前.那個水弄到它
(2)跑了以后,跑到媽媽身邊
方位名詞在口語中只出現(xiàn)29次,常用“上”、“下”、“邊”、“ 這里”、“哪里”等詞,例如:海邊、水下等。
副詞主要有程度副詞、范圍副詞、時間副詞和否定副詞,沒有使用語氣副詞。且每一種類型副詞的表達形式有限,例如程度副詞“很”頻次為98次,范圍副詞“就”64次,時間副詞“就”80次,否定副詞“不”97次,其他如“常常、更、從來、馬上、忽然”等副詞使用頻次不超過10次。
在虛詞中,連詞、助詞使用頻次高于其他虛詞。頻率最高的連詞有:然后、但是、可是、跟。
2.3高頻詞搭配強度
平均句長影響詞語搭配的強度,即詞語互信息值。一個詞與另一個詞共現(xiàn)頻率越大,其互信息越大,說明這兩個詞的搭配越緊密。高頻詞之間的互信息值越小,說明詞語搭配的形式越不固定,在相距5個詞的位置共現(xiàn)的概率越低,而出口語語段復(fù)雜度越高。留學生口語中高頻詞共現(xiàn)集中在“它”與“媽媽”、“找”與“吃”兩組詞,搭配強度分別為0.8093和1.3376。反映留學生口語中詞語組合形式單一,同義表達形式缺乏,語言單位組合與聚合關(guān)系不豐富。
2.4詞匯豐富度
G.Yule認為不同文本中的高頻詞和低頻詞的分布反映出文本的風格特征,提出Yule graph用于描述文本中的詞匯豐富度〔4〕(劉穎,2014)。通過高頻詞與低頻詞的分布情況,可以探究留學生口語語段中詞匯的豐富度的大小。
在敘事視角下,泰國留學生口語中僅出現(xiàn)的1次的詞共有115個,其中單音節(jié)詞有:蝦、喂、追、藏、喝、誰、推、床、飽、敲等,共計29個;雙音節(jié)詞有發(fā)現(xiàn)、避難、出生、快樂、跑步、生蠔、聰明、幸福、明白、可愛、泡泡、浪漫、可能、家人,共計86個。形容詞在最低頻次詞中出現(xiàn)最多。(詞匯豐富度=最低頻次詞總數(shù)/總詞數(shù)=0.018)
3.語句測量維度
姚艷梅〔6〕(2012)指出,口語復(fù)雜度與語句的結(jié)構(gòu)有密切的關(guān)系。在運用口語表達時,語句長度和語句類型反映各種語法單位的組合特征,以及話題引入的方式。
3.1平均句長
黃自然〔7〕(2017)基于漢語“小句”理論視角,明確漢語句長切分以書面標點符號為標準。通過統(tǒng)計,泰國留學生口語文本共計720句分句。平均句長是口語文本中所有句子長度之和與句子數(shù)的商,約等于8.54。平均句長值越小,文本復(fù)雜度越低。留學生口語中1-5字句占主要形式占60%,6-10字句占35.6%,11-15字句很少出現(xiàn),沒有15字以上的句子。當句長數(shù)值較大時,留學生口語句子語言成分組合關(guān)系單一,且多夾雜著話語標記成分,如“我覺得”、“就是”、“然后”等。例如:
(2)然后它也不知道要怎么走怎么樣。那個海那個水是嗎。然后它也怕那個海,就是說是水很危險。
(3)就是這個說這樣一種鳥啊...就是怎么樣怎么樣它的生活噢!就是在哪里吃,吃什么咯,是嗎?
3.2句型分布
田園詩〔8〕(2017)認為,對于中級漢語口語水平的學生,在詞匯教學中應(yīng)教授口語化的慣用表達式和詞語,在語法教學上突出訓(xùn)練連句成篇的語用能力。由于口語內(nèi)容的限制,在口語表達中重點觀察“把”字句、“被”動句、“是”字句、“有”字句、連動句的使用情況。泰國留學生口語較多使用“是”字句和“有”字句,占總句數(shù)35%。其次是使用連動句,然而,留學生口語中的連動形式幾乎是動詞“找”與“吃”共現(xiàn)??谡Z中,“是”字句和“有”字句的賓語用于指語境中的實體,如鷸、海浪、沙灘等,常用專有名詞、代詞、“(一)量名”詞組表示?!坝小弊志涞馁e語主要起領(lǐng)有、存在和列舉的作用,具有典型的指稱功能。例如:
(4)現(xiàn)在我看到的是一個又一個的浪頭。
(5)它們都是媽媽和兒子。
(6)有那個水沖來。
4.討論
第一,留學生口語平均詞長和平均句長值較低,文本可讀性不高。
口語中,留學生的口語平均詞長為1.2519,平均句長數(shù)值為8.5361。在口語敘事文本中,平均詞長越小,表明使用的長詞越少;然而,平均句長越小,表明使用的長句越少,文本的復(fù)雜度越低,但文本可讀性并不一定變得越強。例如:
(7)然后,它也看.....那個在那個土,然后它也...看它怎么樣,它也弄。
文本可讀性與信息傳遞的準確性、完整性緊密相關(guān),可讀性越高,信息傳遞的準確性與完整性越高。通過上兩例口語語段對比,發(fā)現(xiàn)在口語中,平均句長數(shù)值越小,文本可讀性越低??谡Z文本的可讀性性高低,受口語表達中停頓、重復(fù)、自我修正等非流利產(chǎn)出因素的影響。
第二,留學生口語中冗余成分多,語用類型和功能單一。
施光亨、劉偉〔10〕(1996)指出,口語表達存在大量的冗余成分、解釋性成分、估測性成分、提示性成分,并在動態(tài)表述過程中出現(xiàn)自我更正和重復(fù)等現(xiàn)象。留學口語中,“是嗎”使用頻率非常突出,多用于表達估計、猜測語氣,起到自我更正的作用。例如:
(8)媽媽給它自己找,是嗎?
(9)它也是找那個東西,螺是嗎?
如“我覺得”、“就是”、“然后”等。例如:
(10)就是這個說這樣一種鳥啊...就是怎么樣怎么樣它的生活噢!就是在哪里吃,吃什么咯,是嗎?
上兩例中,“然后”、“就是”僅作為話語標記,用于銜接和組織話題。作為話語標記“然后”在留學生口語出現(xiàn)了71次。
第三,留學生敘事性口語主要用無定名形式作為話題引入手段。
在敘事語段中,話題指談?wù)摰膶嶓w,通常由名詞短語和表存現(xiàn)義動詞結(jié)構(gòu)引入〔11〕(許余龍,2007)。在口語語段中,留學生主要使用“是”字句和“有”字句中無定名賓語結(jié)構(gòu),引出談?wù)摰膶嶓w,推動事件的敘述。但是,口語文本中無定名形式引出話題的例句高達214例,而以“行為動詞+著”形式借表示存現(xiàn)語義引出話題的例證僅有兩例。例如:
(11)鳥媽媽飛過去,找吃的東西給小鳥吃,小鳥就在這里等著。
(12)然后它就跟著,它就看到了那個螺啊。
5.結(jié)語
在對外漢語教學中,口語教學即是研究的熱點,同時也是研究的難點。本文在研究范圍和數(shù)據(jù)采集上有一定的局限性,比如語料庫容量不夠大,又如分析對象僅限于泰國留學生。但是,作為留學生的漢語口語復(fù)雜度計算特征具有一定代表性。說明留學生口語呈現(xiàn)出詞匯豐富度低,高頻詞搭配強度高;語句長度較為集中,句型單一,且傾向于指稱義句式,多用無定指名結(jié)構(gòu)引出話題。留學生口語表達具有復(fù)雜性、動態(tài)性、多維性等特征,口語表達能力的提升是一個復(fù)雜的過程。
〔參 考 文 獻〕
〔1〕Skehan,P.2009.Modelling second language performance :Integrating complexity, accuracy, fluency, and lexis〔J〕.Applied Linguistics 30:510-532.
〔2〕李茶,隋銘才.基于復(fù)雜理論的英語學習者口語復(fù)雜度、準確度、流利度發(fā)展研究〔J〕.外語教學與研究,2017,(03):392-404.
〔3〕徐子亮.漢語作為外語教學的認知理論研究〔M〕.北京:華語教學出版社,2000:368-370.
〔4〕劉穎.統(tǒng)計語言學〔M〕.北京:清華大學出版社,2014:219,230.
〔5〕〔奧〕維特根斯坦(著),賀紹甲(譯).邏輯哲學論〔M〕.北京:商務(wù)印書館,2017:67.
〔6〕姚艷梅.任務(wù)復(fù)雜度、任務(wù)難度對口語表達的影響〔J〕.渭南師范學院學報,2012,(08):96-100.
〔7〕黃自然.以“字”為單位的漢語平均句長與句長分布研究〔J〕.齊齊哈爾大學學報:哲學社會科學版,2018,(01):133-138.
〔8〕田園詩.認知語言學在對外漢語詞匯教學中的應(yīng)用〔J〕.現(xiàn)代語文:語言研究版,2017,(12):84-86.
〔9〕王紅旗.“是”字句的話語功能〔J〕.語文研究,2010,(03):11-17.
〔10〕施光亨,劉偉.口語表述的即時性及與此相關(guān)的口語特點——對一篇講詞的分析〔J〕.世界漢語教學,1996,(04):24-32.
〔11〕許余龍.話題引入與語篇回指——一項基于民間故事語料的英漢對比研究〔J〕.外語教學,2007,(06):1-5.〔責任編輯:楊 赫〕