徐赳赳
(中國社會科學(xué)院語言研究所,北京 100732)
提 要 本文考察作為新媒體的網(wǎng)絡(luò)聊天中出現(xiàn)的錯誤及修補問題,通過對144萬字、3.5萬個話輪網(wǎng)聊語料的量化分析,試圖發(fā)現(xiàn)網(wǎng)聊錯誤的程度和進行修補的手段,重點探討造成網(wǎng)聊錯誤的原因,分析作者對錯誤的修補策略,旨在揭示新媒體話語的語言特征。研究發(fā)現(xiàn):從錯字錯詞來看,我們的語料中有0.84%的話輪出現(xiàn)錯誤,遠遠超出國家新聞出版廣電總局對于錯誤率不超過萬分之一的界定。進一步分析后發(fā)現(xiàn),錯誤的情況雖然有各種類型,有少字、多字、錯字等,但主要的錯誤是由同音造成,占80%,很明顯這跟拼音輸入法密切相關(guān)。從修補來看,一共發(fā)現(xiàn)三種情況:作者自覺修補,讀者指出后修補,不修補。這三種情況中,錯誤只有0.07%得到修補,而絕大部分錯誤不予修補,這是因為大多錯誤并不影響網(wǎng)聊者對整個句子的理解,這是網(wǎng)聊話語中一個非常特殊的現(xiàn)象。本文的研究對揭示網(wǎng)聊這種新語體的語言特征提供了有益的借鑒。
媒體指的是傳播信息的媒介,對于新媒體,現(xiàn)在還沒有確切的定義。本文暫且把近十幾年出現(xiàn)的、用網(wǎng)絡(luò)技術(shù)等渠道,采用電腦、手機等終端,提供語言、聲音、圖像等信息的傳播和交流形態(tài),稱為新媒體。學(xué)界對新媒體中的語言現(xiàn)象和語言特征已有所關(guān)注,如李戰(zhàn)子(2016)、楊鵬、唐三勇(2012)、趙雪、曹彥男(2012)等。本文把QQ網(wǎng)絡(luò)聊天(網(wǎng)聊)看作是新媒體的一種,跟傳統(tǒng)的媒體相比,網(wǎng)聊是既有書面語特征,也有口語特征的一種新的語體。
網(wǎng)聊中的一個特點就是經(jīng)常出現(xiàn)錯字錯詞(簡稱“錯詞”),這也是語言規(guī)范者經(jīng)常批評網(wǎng)絡(luò)語言的一點。從上傳方(發(fā)話方)來說,網(wǎng)絡(luò)聊天是打字上傳,由于時間的關(guān)系,通常不會逐詞逐句“?!焙笤偕蟼?,所以經(jīng)常出現(xiàn)錯詞,并且上傳后就無法改動(現(xiàn)在的微信可以在短時間內(nèi)撤回)。從接收方來說,有的錯詞一看就知道是上傳方打錯字了,如果讀者能推斷出上傳者想表達的內(nèi)容,一般也不會指出上傳者的錯誤。對有些引起誤解的錯誤,讀者有可能會問一下上傳者是什么意思。
先看下圖兩個網(wǎng)上流傳打錯字的例子:
(1)
圖1a (選自百度貼吧)
圖1b (選自百度貼吧)
本項研究所用的研究語料,是自己收集的QQ聊天會話,共144萬字,話輪共35,892個。
下面是語料中出現(xiàn)錯詞的例句(劃線的詞可能是錯誤的詞,括號內(nèi)的詞是筆者加的,推測是正確的詞):
(2) a.為什么沒有收獲地址?。?收貨)
b. 上部了官網(wǎng)了,愛投資跑了(上不了)
c. 倫敦市長做一號線怎么沒把他擠死的。(坐)
d. 本來今天想買點愛投資的,看到這句話,該主意了(改)
e. 西長安街88號位置及佳啊(極佳)
f. 這是要漁工移山啊(愚公移山)
g.乃們要把這里變婚介所么?(你們)
根據(jù)《中華人民共和國新聞出版總署令》(簡稱“總署令”)第26號(2004年)第五條規(guī)定,“差錯率不超過1/10 000的圖書,其編校質(zhì)量屬合格”,“差錯率超過1/10 000的圖書,其編校質(zhì)量屬不合格”。那么網(wǎng)聊話語中差錯率具體情況如何呢?(下表中顯示的錯誤,是指在一個話輪中,有錯誤的情況),見下表:
話輪(個)差錯(個)比例%358923000. 84
表1 錯誤率
表1顯示,在35 892個話輪中,有300個話輪中有錯字。從比例看,100個話輪中,有0.84個話輪中有錯誤。按照上面介紹的《總署令》的標準,網(wǎng)聊中的差錯率已經(jīng)“超標”了。
我們再來考察網(wǎng)聊話語的錯誤類型。
我們的語料顯示,錯詞中同音字錯誤占多數(shù)。在面對面的語音對話中,完全同音就是正確的,近音字的錯誤對方可能聽出來。而電腦打字就很明顯看出錯誤(有時是根據(jù)上下文推測出是錯誤),如下所列都是同音詞錯誤:
(3) a. 3個月,估計又是夏門的機場……(廈門機場)
b. 我們公司網(wǎng)絡(luò)不行,我沖了幾下搞不來,干脆不沖了(充)
c. @Shirley 各自在演講,OY,咋們繼續(xù)吃飯(咱們)
d. 網(wǎng)袋有風(fēng)險,入市須謹慎(網(wǎng)貸)
e. 今天提現(xiàn),明天周六可以到張嗎?(到賬)
f. 我綱要說(剛)
我們收集到的300個有錯誤的話輪中,由同音詞(近音詞)所造成的錯誤的比例如下:
差錯(個)同音(個)比例%30024380%
表2 同音詞錯誤率
表2顯示,由同音詞所造成的錯誤占了整個錯誤率的80%。這么多同音詞錯誤明顯是由漢字的拼音輸入法造成的:打進某個詞的拼音,同音詞一起出現(xiàn),然后選一個,選錯了,就造成同音詞的錯誤。這跟用筆寫字不同,用筆寫字,通常不會有這么高的同音詞錯誤??赡艿那闆r是這個字少一點、那個字少一筆這類錯誤會增多。電腦輸入不會有某個字寫錯,因為所有的字都由字庫決定。
我們再深入一步考察,又可發(fā)現(xiàn)同音字錯誤中“語氣詞”和“嘆詞”錯誤占了多數(shù)。
胡裕樹(1995:298)認為:“語氣詞的作用是附著在整個句子的末了,表示語氣?!彼e例的語氣詞是“的、了、嗎、呢、吧、啊”。“嘆詞包括表示感嘆和應(yīng)答的詞,如‘唉’‘呀’‘喲’‘哎喲’‘喂’‘嗯’‘唔’等?!庇捎谶@兩種詞的功能比較接近,都有表示“情感”的功能,我們就把兩類詞放到一起分析。
同音錯(個)其中嘆詞語氣詞(個)比例%2438133%
表3 同音詞中嘆詞語氣詞所占的錯誤率
表3顯示,嘆詞語氣詞的錯誤率占了同音錯誤率的三分之一。
錯誤的主要表現(xiàn)是少口字旁,如“嗯”寫成“恩”。
(4) a. 那么付息是擔保公司在第二個工作日開始償付。如果不付,是否要給違約金阿?(啊)
b. 如果發(fā)生風(fēng)險,可能會引起延期的。就算是第二個工作日賠付,也是延期了的牙(呀)
c. 可惜政府機構(gòu)職能的腳步總跟不上社會潮流,得問題大范圍爆發(fā)才會觸發(fā)國家設(shè)立這樣的機構(gòu)把(吧)
d. 003,我只是說理論上有這種可能!但你不會轉(zhuǎn)我1 000萬的!是馬?(嗎)
e.恩哪,金館長我最愛(嗯)
f. 他們在討論我的網(wǎng)名拉(啦)
下表是嘆詞語氣詞錯誤統(tǒng)計表:
嘆詞語氣詞錯(個)比例%恩(嗯)4656.7%阿(啊)2125.9%拉(啦)78.6%其他78.6%總計81100%
表4 同音詞錯誤率
表4顯示,“嗯、啊”兩個字的錯誤最多,占了80%,其他都很少。
我們的語料顯示,其他的錯誤由各種情況造成(注意劃線部分)。
(5) a.真相不會是網(wǎng)速過慢吧……
b. 當然,我是相信愛投資的!也相信件003!更相信小言不會辜負神話和千樹
c. 第一提現(xiàn)
d. 錢來的容易被
e. 沒人買我后臺買
f. 不知那個百萬的土豪在不在我們二君
g.加碘言
例(5a-b)中,錯詞的類型是多字。例(5a)中的“真相”是多的,去掉句子就通了,“不會是網(wǎng)速過慢吧……”;例(5b)中的“件”是多的,“當然,我是相信愛投資的!也相信003!更相信小言不會辜負神話和千樹”,這里的“件”可能是打了“信”后,自動跟出來的,一不小心就選上了。
例(5c-d)中, 錯誤的類型是少字。例(5c)中,是少了“次”,“第一次提現(xiàn)”;例(5d)中,知道少了字,但不知少什么字。另一位聊天者,推出少了“什么就”,就替這位少字的聊天者補上可能少的字“都被這些投資者給寵壞了,什么垃圾項目都能在幾天內(nèi)搞定”。
例(5e)中,“后天”打成“后臺”。
例(5f)中, 單字打錯了:“群”打成“君”。
例(5g)中, 看了上下文,推測是“加碘鹽”。
有些情況比較復(fù)雜,看起來是錯的詞,其實可能是“對的”,是發(fā)話者故意“打錯”的。
(6) a.納睡光榮,逃睡可恥!
b. 正規(guī)的通過淫行匯進去,每天2萬,同戶名8萬。或通過兌換店無限制,無手續(xù)費,比淫行好的兌換率。
c.灰主流也可以
d.女豬腳很漂亮
e. 女的建議I瘋
f. 真受不鳥
g.默事的
h. 阿彌托福
我們判別錯誤有多樣標準:有自我改錯的情況,有接受者指出的情況,還有的是違反規(guī)范標準且只出現(xiàn)一次。例(6)的情況是出現(xiàn)兩次以上,有的是多次,有的是多人用,所以有理由懷疑是“故意所為”??赡苁恰扒熬W(wǎng)語”,也可能本身就已經(jīng)是網(wǎng)語了。
上面討論的是網(wǎng)聊話語中的錯誤情況,下面我們討論錯誤修補情況。錯誤修補指的是發(fā)話人知道有字打錯,進行了修補,見下例:
(7) a. 郵箱
油箱
b. 第一提現(xiàn)
第一次
c. 其實呢,也某些了資金的外流
謀殺
d. 第
第三方支付,是需要拍照的,資質(zhì)的。 不是隨便開的。
e. 不知打
道
f. 前幾天我在招嫖
找票
例(7a-f)中,一行是一個話輪,第一個話輪是作者發(fā)現(xiàn)打錯了,第二個話輪馬上就修補,上傳打錯的那個詞,不是把整個正確的句子上傳。
研究發(fā)現(xiàn),修補共有三種情況:作者自我修補、他人指出后修補、不予修補。
(一) 一般自我修補
例(7)中的例子,都是作者一看打錯了,馬上在第二個話輪中補上。就是我們這里講的一般自我改進的情況。
(二) 自己指出自己錯誤,然后修補
下面的例子是先告訴大家自己打錯了,然后說出正確的字詞:
(8) 快慢又不是你我掌控的,急啥
不好意思打錯字了,我是想說滿滿滿,不是慢
(三) 有時作者自我發(fā)現(xiàn)錯誤,但是改正慢了一拍,中間已經(jīng)插進其他人的話輪了,如:
(9) a. 網(wǎng)聊1 祖國尚未統(tǒng)一,無心上邊……
網(wǎng)聊2 也行
網(wǎng)聊1 上班
b. 網(wǎng)聊1 北房,居住證,學(xué)區(qū),找入,高中可以
網(wǎng)聊2 言簡意賅
網(wǎng)聊1 打錯好幾個字
例(9a)“網(wǎng)聊1”發(fā)現(xiàn)“上邊”打錯了,就趕緊打上正確的“上班”,但中間已插進其他話輪(網(wǎng)聊2)中的“也行”。例(9)網(wǎng)聊1上上傳的幾個字,除了“找入”不通,其他幾個詞,不看上下文無法判斷有錯?!熬W(wǎng)聊2”上傳“言簡意賅”其實跟“網(wǎng)聊1”講的內(nèi)容感覺沒什么關(guān)系,不知是對“網(wǎng)聊1”說的,還是對別人說的。接著,“網(wǎng)聊1”說自己“打錯了好幾個字”,但沒講打錯了哪些字。
(四) 下面的例子是作者做了修補,同時又加上新的信息:
(10) 太奶奶給的
她的奶奶給她的
例(10)中,單看第一句“太奶奶給的”,感覺沒錯,按輩分,“太奶奶”指的是“奶奶的媽媽”,但作者表達的不是這個意思,先是改為“她的”,然后“給的”中間加了新信息“她”。
(五) 還有給錯誤找理由的
(11) 算了,不是你的搓
錯
是月亮惹的禍
例(11)的作者先是在下個話輪中把正確的字“錯”打上,在下一個話輪中,還套用張宇唱的“都是月亮惹的禍”給“你的錯”找個錯誤的理由。
下面的例子是讀者發(fā)現(xiàn)提出疑問,或者指出錯誤。
(12) 網(wǎng)聊1 穿瑤更適合你
網(wǎng)聊2 傳謠是啥
網(wǎng)聊1 瓊瑤
網(wǎng)聊1 也是寫小說的
(13) 網(wǎng)聊1 最近 房事狀況如何 妞妞
網(wǎng)聊2 只有2套能辦到房產(chǎn)證,
網(wǎng)聊3 云淡,你的是第幾套?
網(wǎng)聊2 房事?
網(wǎng)聊4 西城的
網(wǎng)聊1 房產(chǎn)形勢
網(wǎng)聊5 買那多干嘛
網(wǎng)聊2 我以為你問她夫妻生活……
網(wǎng)聊1 擦
網(wǎng)聊1 房事 一般指的 房產(chǎn)
網(wǎng)聊3 有的政府限價的房比同小區(qū)二手房都便宜,真是買到就賺啊
網(wǎng)聊1 夫妻生活 跟我什么關(guān)系
網(wǎng)聊2 第一次聽到這樣的簡稱
網(wǎng)聊1 限價房 現(xiàn)在有嗎
網(wǎng)聊2 房市是這樣寫的吧?
例(12)把“瓊瑤”打成“穿瑤”,網(wǎng)聊2以為是“傳謠”。
例(13)中網(wǎng)聊1說“房事”,引起網(wǎng)聊2的疑問;網(wǎng)聊1還不認錯,認為是簡稱;網(wǎng)聊2指出,應(yīng)該是“房市”。
我們的語料顯示,基本情況是對錯誤不予修補,這是因為大多錯誤讀者可以發(fā)現(xiàn),并通過語境找到正確的答案,因此并不影響對整個句子的理解。表5顯示,修補只占了0.07%。
錯誤改錯(例)比例%300210.07
表5 錯誤修補率
徐赳赳(2010:第四章)中也發(fā)現(xiàn)了網(wǎng)聊話語中錯誤-修補的情況,但沒有進行深入量化研究。本項研究顯示,在100個話輪中,有0.8個話輪中有錯詞。造成錯誤的原因很多:如跟拼音輸入法有關(guān)、上傳者沒有校對就上傳;大多錯詞對方都能發(fā)現(xiàn),但不影響理解等等。
對錯詞類型的研究中發(fā)現(xiàn),在錯詞中80%是同音詞錯誤,這跟拼音輸入法也有很大關(guān)系,幾個同音詞一起出現(xiàn),一不小心就可能選錯了。研究顯示的嘆詞語氣詞錯誤比例高,而且有些人知道是錯誤的,也就這樣用了,比如“嗯”是規(guī)范的,網(wǎng)聊者打“恩”不規(guī)范,但通常不影響對方的理解。
姚劍鵬(2008:147)研究的是面對面會話的修補,他認為:“會話自我修補是說話者在監(jiān)測到話語錯誤后所采取的一種自我糾正行為,是會話修補的主要表現(xiàn)形式,也是常見的自然話語間斷語流(disfluency)觀象。”Nooteboom在分析了Meringer的口語語料庫后,發(fā)現(xiàn)說話者75%的語音錯誤和53%的詞匯錯誤均由本人修補(轉(zhuǎn)引自Levelt 1989: 463 )。Levelt在他的顏色命名實驗中發(fā)現(xiàn),實驗被試所犯的472處錯誤中有218處錯誤是由被試本人修補的(Levelt 1989: 463)?!蔽覀兊恼Z料顯示,修補錯誤在錯詞中的比例是很少的,100個錯詞也只有0.07個作了修正,而且是既包括自我修補,也包括他人修補。這跟Levelt (1989)的研究結(jié)果相差很大,這可能就是面對面交談和網(wǎng)絡(luò)交談的不同之處。QQ網(wǎng)聊話語中,作者即使發(fā)現(xiàn)錯了,只要作者認為讀者能理解,通常就不會修補。一般的情況是,如果作者自己修補,通常作者認為對方可能誤解。對方指出錯誤的,通常是讀者感到難以理解的。