于 樂(lè)
基于語(yǔ)料庫(kù)的肯定與否定公理驗(yàn)證
于 樂(lè)
肯定結(jié)構(gòu)與否定結(jié)構(gòu)是一種普遍存在的語(yǔ)言現(xiàn)象。在漢語(yǔ)中,語(yǔ)義程度較高的詞語(yǔ)主要使用于肯定結(jié)構(gòu),反之,語(yǔ)義程度較低的詞語(yǔ)主要使用于否定結(jié)構(gòu)之中。本文以石毓智的肯定與否定公理為基礎(chǔ),基于語(yǔ)料庫(kù)對(duì)該公理進(jìn)行驗(yàn)證,試圖從一個(gè)新的角度論證該公理的合理性與適用性。
肯定與否定公理 語(yǔ)料庫(kù) 驗(yàn)證
在漢語(yǔ)中,我們都經(jīng)常碰到以下這類句子:
(1)王十二聽了沒吭聲。
(2)他有一口雪白的牙齒。
“吭聲”在漢語(yǔ)表達(dá)中常常與“不”、“沒”等帶有否定意義的詞語(yǔ)搭配,但“雪白”卻無(wú)“不/非雪白”等表達(dá),為何會(huì)出現(xiàn)這種現(xiàn)象?
石毓智在《肯定和否定的對(duì)稱與不對(duì)稱》一書提出“肯定與否定公理”:語(yǔ)義程度極小的詞語(yǔ),只能用于否定結(jié)構(gòu);語(yǔ)義程度極大的詞語(yǔ),只能用于肯定結(jié)構(gòu);語(yǔ)義程度居中的詞語(yǔ),可以自由地用于肯定和否定結(jié)構(gòu)之中。
如果將一組概念意義相同的詞,將詞語(yǔ)的語(yǔ)義程度按遞增的方式從左到右進(jìn)行排列,位于最左端的詞只能用于或者多用于否定結(jié)構(gòu),位于中間的詞可以自由地用于兩種結(jié)構(gòu),位于最右端的詞多用于或者只用于肯定結(jié)構(gòu)。
如“敘說(shuō)、提起、掛齒、說(shuō)起、傾訴、訴說(shuō)、談?wù)摗睂⑺鼈兊恼Z(yǔ)義程度由低到高的順序排列起來(lái):
掛齒 提起 說(shuō)起 談?wù)?敘說(shuō) 訴說(shuō) 傾訴
掛齒的語(yǔ)義程度最低,只適用于否定結(jié)構(gòu),前面要加否定詞“不”或“沒”等否定詞,而傾訴語(yǔ)義程度最高,則只能用于肯定結(jié)構(gòu),不能加否定詞。
石毓智依據(jù)《動(dòng)詞逆序詞典》中對(duì)否定詞進(jìn)行歸納統(tǒng)計(jì),但是該詞典數(shù)據(jù)相對(duì)較少,證明力度有限?!爱?dāng)然,只根據(jù)4個(gè)用例歸納出的結(jié)論在一定程度上還是一種假設(shè),要得到確證還需要更多用例的支持(石毓智,1989)?!?/p>
語(yǔ)料庫(kù)為我們提供了一種新的視角,“語(yǔ)料庫(kù)有例句多,材料廣等特點(diǎn),它已經(jīng)成為語(yǔ)言研究的一種視角和方法,能夠彌補(bǔ)傳統(tǒng)研究方法的不足,也是傳統(tǒng)研究方法的補(bǔ)充和驗(yàn)證(鄒申 楊任明,2008)?!北疚闹荚谕ㄟ^(guò)統(tǒng)計(jì)語(yǔ)料庫(kù)的數(shù)據(jù),驗(yàn)證石毓智提出的肯定和否定公理。
(一)研究目的
借助CCL語(yǔ)料庫(kù),對(duì)石毓智提出的具有同一概念的否定性詞語(yǔ)進(jìn)行分析和統(tǒng)計(jì),考察這一組同一概念的句子是否存在否定式與肯定式之比的量級(jí)序列。
(二)研究方法
本文主要對(duì)CCL網(wǎng)絡(luò)語(yǔ)料庫(kù)的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)和分析,數(shù)據(jù)龐大,資料具有參考價(jià)值。
貨位分配優(yōu)化前后,各算法求得的目標(biāo)函數(shù)值對(duì)比如表4所示,其中“優(yōu)化前”指本次測(cè)試中各算法的初代種群信息。
(三)研究判斷標(biāo)準(zhǔn)
在實(shí)際統(tǒng)計(jì)操作中,我們將根據(jù)陶鏡玉在《英漢否定表達(dá)比較及在對(duì)外漢語(yǔ)教學(xué)中的應(yīng)用》提到的漢語(yǔ)否定標(biāo)記與手段對(duì)語(yǔ)料庫(kù)的語(yǔ)料進(jìn)行分析和判斷。
但在實(shí)際操作中,本文采用了粗略統(tǒng)計(jì)法,將詞語(yǔ)和常用否定詞搭配作為篩查對(duì)象,例如“介意”一般與“不”進(jìn)行搭配,計(jì)算方法雖然粗略,也出現(xiàn)句子重復(fù)和錯(cuò)誤的現(xiàn)象,但這些差錯(cuò)幾率相對(duì)于整個(gè)數(shù)據(jù)而言非常小,不會(huì)影響到最后結(jié)果。
(四)研究客體
本文主要研究的客體均來(lái)自石毓智在《肯定和否定的對(duì)稱與不對(duì)稱》和《現(xiàn)代漢語(yǔ)的否定性成分中》提出的相同概念、存在量級(jí)序列的幾組漢語(yǔ)詞語(yǔ),將從幾組詞語(yǔ)中隨機(jī)挑出。
漢語(yǔ):
介意 記得 牢記 銘記
打岔 妨礙 阻礙 阻撓
好氣兒 和氣 和藹 和悅
抵事 頂事 頂用
勉強(qiáng) 強(qiáng)制 勒令
(五)研究問(wèn)題
本文擬定主要解決的問(wèn)題是:石毓智所提出的具有相同概念的詞語(yǔ)是否真的存在量級(jí)序列?這樣的量級(jí)序列是否能在語(yǔ)料庫(kù)的統(tǒng)計(jì)數(shù)據(jù)中體現(xiàn)出來(lái)?
(一)根據(jù)CCL語(yǔ)料庫(kù)(網(wǎng)絡(luò)版)所統(tǒng)計(jì)出,文章頻率根據(jù)否定/肯定所得:___________________________
_介意_ ___________不/未_否定/肯定___打__岔_ __不/別/___沒_否定/肯定_1367 ___11___ ___37____________ _____0.83_____________225_ ____________ ______79_________________________0.31 _記得_不/哪/沒__________ __ 妨__礙_不/別/沒/未___________ 16395 ___17___ __23____________ ___0.105___________4500_ _____________ ___1559________________________0.34 _牢記_ __不/___沒_ _________ _阻礙_不/別/沒/未___________ _2687_ _________ ___12_____________ ____0.004___________5990_ ____________ ____414_________________________0.07 _銘記_ __不/___無(wú)_ __________ __阻__撓_不/別/沒/未___________ _1112 ________ ____________________ _0_0____________2407_ ____________ ____139_______________________0.058 _抵事_ ________ __________不_好氣兒 ___沒________ ___________好氣兒__1__9_ _________ ____13_____________ _______0.68__________ _____________ _____12______________________________12_1 _有效_不/沒/哪__________ __ 和__氣_ __不/沒______ ___________/別64584 ___19___ ___60____________ ____0.03_________3406_ ____________ ______76_______________________0.023 _靈驗(yàn)_不/哪/沒__________ __ 和__藹_ ______________ ____________不和藹_391_ _________ ___62_____________ ____0.159___________1698_ _____________ _______2_________________________0.001 _萬(wàn)能_不/沒/非_________ _ _________________________和悅_ _____________ ____________不和悅_1205_ ___2____ ___76_____________ ______0.23_____________134_ _____________ _______2_________________________0.015 _抵事_ _________ __________ ____不___________________________________勉強(qiáng)_不/沒/未/別___________ __1__9_ _______ ___13_____________ _____0.68_________5605_ 324 ___0.0_____57 _頂事 __不/? __________ __強(qiáng)制 ______________ ___________不/非/沒/無(wú)/未_148_ _______ ___60_____________ _______0.4____________7592_ ____________ ____609________________________0.08 _頂用_ __不/___沒_ __________ __勒__令_ ______________ ________________不_209_ ________ _____89_____________ ______0.42_____________741_ _____________ _______4_________________________0.005
根據(jù)以上表格可以得出:
“介意”這一組的頻率數(shù)據(jù)為0.83> 0.105>0.004>0,頻率越大語(yǔ)義程度越小,因此這組的語(yǔ)義大小排序?yàn)椋航橐猓加浀?< 牢記< 銘記
“打岔”這一組的頻率數(shù)據(jù)為0.34>0.31>0.07>0.058,頻率越大語(yǔ)義程度越小,因此這組的語(yǔ)義大小排序?yàn)椋悍恋K<打岔 <阻礙 <阻撓
“抵事”這一組的頻率數(shù)據(jù)為0.68>0.23>0.159>0.03,頻率越大語(yǔ)義程度越小,因此這組的語(yǔ)義大小排序?yàn)椋旱质拢检`驗(yàn)<萬(wàn)能<有效
“好氣兒”這一組的頻率數(shù)據(jù)為1>0.023>0.015>0.001,頻率越大語(yǔ)義程度越小,因此這組的語(yǔ)義大小排序?yàn)椋汉脷鈨海己蜌猓己蛺偅己吞@
“勉強(qiáng)”這一組的頻率數(shù)據(jù)為0.08>0.057>0.005,頻率越大語(yǔ)義程度越小因此這組的語(yǔ)義大小排序?yàn)椋簭?qiáng)制<勉強(qiáng)<勒令
從數(shù)據(jù)可以看出,在本文選出著六組同一概念的詞語(yǔ)中確實(shí)有語(yǔ)義程度的差別,詞語(yǔ)之間的否定與肯定之比差異非常明顯,語(yǔ)義程度低與語(yǔ)義程度高的詞語(yǔ)在頻率上計(jì)算所得的數(shù)據(jù)差距十分大。雖然詞語(yǔ)的語(yǔ)義排序與石毓智提出的序列有出入,但是大致是符合的,因此可以證明詞語(yǔ)存在量級(jí)序列,并且能在語(yǔ)料庫(kù)的統(tǒng)計(jì)數(shù)據(jù)中體現(xiàn)出來(lái),石毓智提出的否定與肯定公理是適用的。
但是本研究方法依舊存在漏洞。首先,數(shù)據(jù)中有出現(xiàn)重復(fù)與語(yǔ)法錯(cuò)誤的語(yǔ)句,本研究是基于該錯(cuò)誤數(shù)據(jù)數(shù)量可以忽略不計(jì)的基礎(chǔ)上進(jìn)行的,但是實(shí)際應(yīng)該會(huì)有一定偏差,這是不可避免的。再次,該研究方法選取了一小部分的詞語(yǔ)進(jìn)行論證,是否能在更大的范圍里應(yīng)用,還是有待進(jìn)一步驗(yàn)證。
[1]沈家煊.不對(duì)稱和標(biāo)記論[M].南昌:江西教育出版社,1999.
[2]石毓智.肯定和否定的對(duì)稱與不對(duì)稱(增訂本)[M].北京:北京語(yǔ)言文化大學(xué)出版社,2001.
[3]石毓智.現(xiàn)代漢語(yǔ)的否定性成分[J].北京:語(yǔ)言研究,1989(13).
[4]陶鏡玉.英漢否定表達(dá)比較及在對(duì)外漢語(yǔ)教學(xué)中的應(yīng)用[D].南昌:南昌大學(xué),2010:4~19.
[5]王力.中國(guó)現(xiàn)代語(yǔ)法[M].北京:商務(wù)印書館,2011.
[6]鄒申,楊任明.語(yǔ)料庫(kù)在試題設(shè)計(jì)和驗(yàn)證中的應(yīng)用研究[J].外語(yǔ)電化教學(xué),2008(10).
(作者單位:華南理工大學(xué)外國(guó)語(yǔ)學(xué)院)