賓語>主語;代詞的排序為:主語>賓語>介詞賓語;2)在充當主語時,代詞數(shù)量大于名詞,名詞內(nèi)部的普通名詞和專有名詞充當主語的數(shù)量基本持平;3)在"/>
摘 要:本文選用《紐約時報》的一篇英文報道為語料,運用語料庫對名詞和代詞及特定成分(主語、賓語、介詞賓語)進行考察和分析。分析發(fā)現(xiàn):1)名詞在充當上述三種成分時的排序為:介詞賓語>賓語>主語;代詞的排序為:主語>賓語>介詞賓語;2)在充當主語時,代詞數(shù)量大于名詞,名詞內(nèi)部的普通名詞和專有名詞充當主語的數(shù)量基本持平;3)在充當賓語時,名詞的數(shù)量明顯大于代詞,且普通名詞的數(shù)量遠多于專有名詞;4)在充當介詞賓語時,名詞占絕大部分,其中普通名詞的數(shù)量大于專有名詞。
關(guān)鍵詞:語料庫;依存語法;名詞;代詞;主語;賓語;介詞賓語;成分分析
作者簡介:王瑩(1987-),女,滿,寧夏銀川人,北方民族大學漢外對比語言學專業(yè)研究生在讀。
[中圖分類號]:H314 [文獻標識碼]:A
[文章編號]:1002-2139(2018)-26--02
1、引言
名詞是實詞的重要組成部分,在句子中可以充當很多主要的成分。代詞作為名詞或形容詞的代替詞,也頻繁地出現(xiàn)在句子中。
本文以《紐約時報》的一篇英文報道為語料,依據(jù)依存語法為理論基礎(chǔ),對語料進行詞性及依存關(guān)系的標注并建立語料庫,考察名詞和代詞在充當特定成分(主語、賓語、介詞賓語)時的概率情況,借此可以給相關(guān)研究者提供直觀的數(shù)據(jù)理論參考。
2、文獻回顧
依存語法也被稱為從屬關(guān)系語法,是由法國著名語言學家泰尼埃提出的“結(jié)構(gòu)句法”一般理論發(fā)展而來。他的語法巨著《結(jié)構(gòu)句法基礎(chǔ)》為后人提供了一種普適的語法理論,他也因此被認為是現(xiàn)代“依存語法”和“配價理論”的創(chuàng)始人。劉海濤(2009)在他的《依存語法的理論與實踐》一書中,對依存語法的歷史及形成作了詳細的介紹,在充分了解前人有關(guān)依存關(guān)系、配價理論、依存形式化和依存句法分析方法的基礎(chǔ)上,歸納出依存語法和配價理論的一般原理和方法,提出一套較完整的基于配價模式的依存語法分析框架,并用實驗來證明這一框架的可行性。在句法分析的研究中,依存語法以其形式簡潔、易于標注、便于應用等優(yōu)點,逐漸受到研究人員的重視。目前,已經(jīng)被自然語言處理領(lǐng)域的許多專家和學者所采用,應用于多種語言之中。用依存語法來進行自動分析是很好的,因為分析得到的依存樹層次不多,結(jié)點數(shù)目少,清晰地表示了句子中各個單詞之間的依存關(guān)系。(馮志偉,2004)
語料庫語言學是以語料庫為基礎(chǔ)對語言進行客觀描述的新的研究方法(顧曰國,1998),是近幾十年來發(fā)展起來的分支學科,其主要任務和目標是,以電腦儲存足量的真實語料,根據(jù)不同的研究目標,對語料做相應的標注,使用相應的檢索軟件對已完成標注的語料進行搜索和分析,目標是發(fā)現(xiàn)以往因條件限制而未能發(fā)現(xiàn)或沒有注意的語言特征和結(jié)構(gòu)規(guī)律(李雯雯,2014)。建立語料庫的目的是為更精準更可靠的語言描述提供基礎(chǔ)。
基于語料庫的方法已成熟且被廣泛使用及認可,本文也采用語料庫的方法進行考察和分析。
3、研究方法和研究對象
本文隨機選用《紐約時報》英文版的一篇報道為語料,總字數(shù)約1020字。對語料的詞性和依存關(guān)系進行了手工的標注,利用Excel辦公軟件進行統(tǒng)計。主要從充當主語、賓語、介詞賓語三種句子成分方面對名詞和代詞進行分析。著重分析以下問題:1)名詞和代詞充當特定成分的比例分析2)構(gòu)成特定成分(主語、賓語、介詞賓語)的主要詞類分析;3)充當相同句子成分時,普通名詞與專有名詞的比例差異。
4、研究結(jié)果
4.1從詞類角度分析
整篇語料共有名詞226個,代詞107個,現(xiàn)逐類進行說明及分析:
首先,226個名詞中做主語的有29個,占名詞總數(shù)的12.83%,做賓語的有35個,占總數(shù)的15.49%,做介詞賓語的有91個,占總數(shù)的40.27%,做其他成分的總共有25個,占31.42%。從數(shù)據(jù)可以看出,名詞在充當主語、賓語和介詞賓語之間的數(shù)量排序是:介詞賓語>賓語>主語。
再者,代詞共有107個,其中做主語的有72個,所占比例為67.29%,做賓語的有15個,所占比例為14.02%,做介詞賓語的有3個,所占比例為2.80%,做其他成分的有17個,所占比例為15.89%。代詞在充當主語、賓語和介詞賓語之間的數(shù)量排序是:主語>賓語>介詞賓語。
當代的語法書對于名詞和代詞可充當?shù)某煞只径紵o異議,名詞可以做主語、賓語、定語等成分,代詞也可以做主語、賓語、定語等成分,但是卻沒有具體的數(shù)據(jù)說明某一詞類充當這些成分的概率。通過以上數(shù)據(jù)的對比可以看出這兩種詞類在充當句子成分時的特征:名詞更多的做介詞賓語,而代詞則更多的充當主語成分。
4.2從句子成分角度分析
4.2.1構(gòu)成主語成分的詞類分析
主語,是執(zhí)行句子的行為或動作的主體,可以作主語的詞有:名詞,代詞,名詞化了的動詞,形容詞,副詞或數(shù)詞等。本文選用的語料庫,經(jīng)過標注后共有主語104個,其中名詞有29個,代詞72個,形容詞、副詞、動名詞等其他詞類共有3個??梢钥闯?,充當主語的詞類中代詞占了絕大部分,其次是名詞,最后是其他詞類。
其中代詞在所有做主語的詞類中比例最高,占明顯優(yōu)勢,進一步統(tǒng)計發(fā)現(xiàn),代詞做主語的句子在本語料庫中多為以下形式:
“In high School, it was Yao Ming.”
“At least, I am a guard now.”
This was the landscape of Linsanity. (選自本文語料庫)
多數(shù)做主語的代詞為人稱代詞和指示代詞,筆者認為這與所選取的語料庫有關(guān),語料庫為新聞,內(nèi)容多為采訪和口述。
名詞進一步劃分為普通名詞和專有名詞后,各占比例為12.50%和15.38%,相差不大,可見,普通名詞和專有名詞在做主語的概率上基本持平。
4.2.2構(gòu)成賓語成分的詞類分析
賓語往往表示動作支配的對象,且總是處在動詞的后面,可由名詞、代詞、數(shù)詞、名詞化的形容詞、不定式、動名詞、賓語從句等來擔任。本語料庫內(nèi)共有賓語60個,其中名詞35個,代詞15個,其他詞類共計10個。名詞是代詞的二倍多,說明充當賓語時,名詞居多。其中普通名詞所占比例為46.67%,專有名詞所占比例為11.67%,兩者比例相差很大,說明充當賓語成分的名詞多為普通名詞,少有專有名詞做賓語的情況。本文語料庫中僅有7個專有名詞做賓語,同為以下形式:
“I do not want nobody calling me Jeremy because it reminds me of being called Long Duk Dong or reminds me of being called things like Jackie when I was a kid”, Huang said. (選自本文語料庫)
4.2.3構(gòu)成介詞賓語成分的詞類分析
介詞,在通常情況下,必須有自己的賓語,能充當介詞賓語的成分很多,這里僅對名次和代詞進行統(tǒng)計說明。介詞賓語在本語料庫中共有103個,其中由名詞充當?shù)墓?1個,代詞充當?shù)膬H3個,其他詞類充當?shù)挠?個??梢钥闯觯诔洚斀樵~賓語的比例中,名詞以絕對優(yōu)勢大于代詞。而在名詞自身內(nèi)部,普通名詞占了65.05%,專有名詞則占了23.30%,說明名詞在做介詞賓語時更多的是普通名詞。
5、總結(jié)
本文以英語新聞為語料,通過詞性和依存關(guān)系標注建立語料庫,對名詞和代詞及這兩類詞在構(gòu)成主語、賓語和介詞賓語時的比例進行考察和分析。分析結(jié)果表明:1)名詞在充當上述三種成分時的排序為:介詞賓語>賓語>主語;代詞的排序為:主語>賓語>介詞賓語;2)在充當主語時,代詞數(shù)量大于名詞,名詞內(nèi)部的普通名詞和專有名詞充當主語的數(shù)量基本持平;3)在充當賓語時,名詞的數(shù)量明顯大于代詞,且普通名詞的數(shù)量遠多于專有名詞;4)在充當介詞賓語時,名詞占絕大部分,其中普通名詞的數(shù)量大于專有名詞。
由于本文的語料庫容量偏小,所統(tǒng)計分析的數(shù)據(jù)欠缺代表性和說服力,手工標注也會存在一定的誤差,以后筆者將擴大語料庫內(nèi)容,擴展語料體裁,從更多的角度對詞類及句子成分進行分析,以給他人提供可靠的數(shù)據(jù)參考。
參考文獻:
[1]劉海濤. 依存語法的理論與實踐[M].科學出版社,2009.
[2]馮志偉. 機器翻譯研究[M].中國對外翻譯出版公司,2004.
[3]顧曰國. 語料庫與語言研究[J].現(xiàn)代語言學,1998.
[4]李雯雯. 基于雙語平行語料庫的英漢翻譯語言分析[J].才智,2014年第26期.