• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    統(tǒng)計(jì)語言學(xué)視域下的年度新詞研究

    2023-02-08 02:23:50戴鐘漪
    大眾文藝 2023年1期
    關(guān)鍵詞:新詞音節(jié)現(xiàn)代漢語

    戴鐘漪

    (四川師范大學(xué)文學(xué)院,四川成都 610000)

    一、引言

    2006年國家語言資源監(jiān)測(cè)與研究中心和商務(wù)印刷館聯(lián)合發(fā)起了“漢語盤點(diǎn)”活動(dòng),旨在讓廣大網(wǎng)民通過一個(gè)字、一個(gè)詞,對(duì)過去一年的中國與世界進(jìn)行描述,以展現(xiàn)漢語的魅力,并記錄社會(huì)的變遷。2011年后“漢語盤點(diǎn)”活動(dòng)從“年度字詞”的單體發(fā)布,到與“十大流行語”“十大新詞語”一體發(fā)布。

    統(tǒng)計(jì)語言學(xué)是運(yùn)用統(tǒng)計(jì)數(shù)學(xué)的方法來研究語言現(xiàn)象的學(xué)科,研究領(lǐng)域非常廣泛,可以用來發(fā)現(xiàn)詞頻與詞排序之間的關(guān)系、常用詞和非常用詞、詞語搭配、短語獲取、語言習(xí)得、語域變異及作品風(fēng)格分析等,近些年統(tǒng)計(jì)語言學(xué)廣泛應(yīng)用于計(jì)算機(jī),主要應(yīng)用在頻率詞典的編寫、詞匯增幅率研究、計(jì)算機(jī)詞匯統(tǒng)計(jì)研究、語料庫建設(shè)等方面。[1]

    有不少學(xué)者對(duì)年度新詞和流行詞語進(jìn)行研究,比如丁聰(2014)、張大雁(2017)對(duì)流行詞語“土豪”一詞的詞義演變進(jìn)行了探究;楊昊(2011)對(duì)網(wǎng)絡(luò)熱詞“傷不起”的詞義及其功能進(jìn)行了分析;周思璐(2019)對(duì)2018年度網(wǎng)絡(luò)流行語進(jìn)行了分析。[3]但這些學(xué)者都是對(duì)熱詞進(jìn)行研究,很少有學(xué)者對(duì)這些詞剛產(chǎn)生時(shí)的使用頻率進(jìn)行研究,也沒有學(xué)者將這些年度新詞與統(tǒng)計(jì)語言學(xué)相聯(lián)系。故本文擬用統(tǒng)計(jì)語言學(xué)對(duì)最近六年發(fā)布的十大新詞進(jìn)行數(shù)據(jù)統(tǒng)計(jì)與分析,并依據(jù)統(tǒng)計(jì)分析中遇到的問題,最終為統(tǒng)計(jì)語言學(xué)的應(yīng)用方面提出建議。

    二、年度新詞的統(tǒng)計(jì)與分析

    (一)年度新詞的統(tǒng)計(jì)

    筆者通過統(tǒng)計(jì)研究的方法對(duì)2016—2021年度的十大新詞進(jìn)行研究,選取依據(jù)是該詞在BCC語料庫中的語料條數(shù)。結(jié)果如文末表1所示。

    (二)年度新詞的分析

    1.年度新詞的分類

    從來源上來看,年度新詞可以分為來源于網(wǎng)絡(luò)、來源于政策、來源于新生事物或現(xiàn)象三類。其中來源于網(wǎng)絡(luò)的新詞有5個(gè),分別是表情包、洪荒之力、吃瓜群眾、夸夸群、破防;來源于政策的新詞有兩學(xué)一做、凍產(chǎn)、雄安新區(qū)、共有產(chǎn)權(quán)房、租購?fù)瑱?quán)、通俄門、留置、金磚+、信聯(lián)、站位、貿(mào)易霸凌、極限施壓、止暴制亂、接訴即辦、基層減負(fù)年、鄉(xiāng)字號(hào)/土字號(hào)、復(fù)工復(fù)產(chǎn)、服貿(mào)會(huì)、雙循環(huán)、七一勛章、雙碳、雙減、保障性租賃住房、跨周期調(diào)節(jié)、減污降碳、動(dòng)態(tài)清零,共26個(gè);來源于新生事物或現(xiàn)象的新詞最多,有阿爾法圍棋、網(wǎng)絡(luò)大電影、摩拜單車、山寨社團(tuán)、閨蜜門、共享充電寶、灰犀牛、勒索病毒、地條鋼、進(jìn)博會(huì)、直播答題、限競(jìng)房、消費(fèi)降級(jí)、中國農(nóng)民豐收節(jié)、大數(shù)據(jù)殺熟、冰屏、夜經(jīng)濟(jì)、5G元年、冰墩墩/雪容融、殺豬盤、疫情、感染者、方艙醫(yī)院、健康碼、數(shù)字人民幣、天問一號(hào)、無接觸配送、祝融號(hào)、德爾塔,共29個(gè)。通過對(duì)這三類年度新詞進(jìn)行數(shù)據(jù)上的比較,發(fā)現(xiàn)來源于網(wǎng)絡(luò)的新詞數(shù)量較少,而來源于政策與新生事物現(xiàn)象的新詞數(shù)量較多。

    從音節(jié)結(jié)構(gòu)上來看,在表1中,雙音節(jié)詞有7個(gè),三音節(jié)詞有19個(gè),四音節(jié)詞有22個(gè),五音節(jié)詞有9個(gè),六音節(jié)詞有1個(gè),七音節(jié)詞有2個(gè)。也就是說,年度新詞中沒有單音節(jié)詞,三音節(jié)詞和四音節(jié)詞數(shù)量較多,雙音節(jié)詞和五音節(jié)詞數(shù)量較少,六音節(jié)詞和七音節(jié)詞數(shù)量都很有限。這樣的分布結(jié)果也正好符合了現(xiàn)代漢語的語法習(xí)慣。以四音節(jié)詞為例,四音節(jié)詞在結(jié)構(gòu)上整齊勻稱,在音韻上抑揚(yáng)頓挫,且四音節(jié)結(jié)構(gòu)大都由兩個(gè)雙音節(jié)詞構(gòu)成,符合現(xiàn)代漢語中雙音節(jié)詞占優(yōu)勢(shì)的特點(diǎn)。

    表1 2016—2021年度十大新詞在BCC語料庫中的語料條數(shù)

    2.年度新詞的使用情況

    通過對(duì)BCC語料庫中的語料數(shù)據(jù)進(jìn)行比較,我們發(fā)現(xiàn)有些新詞在語料庫中的語料可以達(dá)到上萬條,比如:“表情包”等。但是有些詞在語料庫中一條語料也沒有,比如“中國農(nóng)民豐收節(jié)”“直播答題”“消費(fèi)降級(jí)”等。由此可以看出有些新詞產(chǎn)生之后由于使用頻率不高已經(jīng)處在逐步消失的階段,有些新詞仍在大量使用。[4]

    值得一提的是,在年度新詞的來源進(jìn)行分析時(shí),我們認(rèn)為來源于網(wǎng)絡(luò)社會(huì)的新詞數(shù)量較少,而來源于政策與新生事物現(xiàn)象的新詞數(shù)量較多。但相當(dāng)一部分政策類新詞的語料和新生事物現(xiàn)象類新詞的語料有著在語料庫中一條語料也沒有的現(xiàn)象。而網(wǎng)絡(luò)類新詞就個(gè)體而言,每個(gè)新詞的語料數(shù)量是較為豐富的。也就是說,來源于網(wǎng)絡(luò)的年度新詞較易被語言使用者接受,使用情況較好。這類新詞雖然最初起源于網(wǎng)絡(luò),但隨著網(wǎng)民的大量使用和網(wǎng)絡(luò)社會(huì)的發(fā)展,在日常生活中,這類新詞也漸漸被接受并廣為使用。這充分體現(xiàn)了新詞的活力與價(jià)值,是值得肯定的。同時(shí),政策類新詞由于其適用范圍的局限性,如“保障性租賃住房”“跨周期調(diào)節(jié)”等詞,使用需求不大,一般出現(xiàn)在報(bào)刊新聞上,而較少出現(xiàn)在日常生活中,故使用頻率較低,語料數(shù)量較少。來源于新生事物現(xiàn)象的新詞也是如此,一部分該類新詞能夠廣為所用,如“摩拜單車”“德爾塔”等,但相當(dāng)一部分新詞使用頻率較低。這也是這類新詞的本身特性導(dǎo)致的,部分新詞如“夜經(jīng)濟(jì)”“冰屏”“地條鋼”等,專業(yè)指向性較強(qiáng),相當(dāng)一部分人甚至都沒有聽過這些新詞,因此其使用頻率低、使用情況較差也是可以理解的。同時(shí),來源于新生事物現(xiàn)象的新詞還會(huì)因?yàn)樾律挛锘颥F(xiàn)象熱度的減退而隨之降低使用頻率,如“冰墩墩/雪容融”。

    三、對(duì)統(tǒng)計(jì)語言學(xué)應(yīng)用方面的建議

    在對(duì)年度新詞進(jìn)行統(tǒng)計(jì)分析的過程中,筆者發(fā)現(xiàn)語料庫中存在語料雜亂重復(fù)、新詞語料數(shù)量過少等問題。針對(duì)這些問題,下文擬從兩方面提出建議,分別是對(duì)頻率詞典編寫的建議和對(duì)語料庫建設(shè)的建議。

    (一)對(duì)頻率詞典編寫的建議

    頻率詞典是按照詞出現(xiàn)頻率的高低而編排的詞典。世界上第一部頻率詞典是1898年德國語言學(xué)家凱定編的《德語頻率詞典》。中國的頻率詞典有1986年北京語言學(xué)院語言研究所出版的《現(xiàn)代漢語頻率詞典》和1990年北京宇航出版社出版的《現(xiàn)代漢語常用詞詞頻詞典》。新詞的產(chǎn)生會(huì)豐富現(xiàn)代漢語的詞匯系統(tǒng),有些新詞產(chǎn)生之后使用頻率特別高,對(duì)于這種使用頻率特別高的新詞,可以收錄到頻率詞典中。

    以2016年—2021年間在BCC語料庫中語料條數(shù)最多的三個(gè)新詞,即“表情包”“金磚+”“信聯(lián)”為例,通過對(duì)語料庫中這三個(gè)詞語的前10000條語料進(jìn)行研究,我們發(fā)現(xiàn)這些新詞產(chǎn)生之后就迅速發(fā)展,廣為使用。

    通過表2我們可以看出這三個(gè)新詞在產(chǎn)生以后使用頻率很高,對(duì)于這類使用頻率很高的新詞,在編寫頻率詞典的時(shí)候應(yīng)該收錄進(jìn)去,并標(biāo)注這些詞產(chǎn)生的年份,這樣就可以清楚地記錄這些新詞的產(chǎn)生和發(fā)展。

    表2 “表情包”“金磚+”“信聯(lián)”前10000條語料年份分布情況

    (二)對(duì)語料庫建設(shè)的建議

    在我國,從20世紀(jì)20年代開始,就有學(xué)者運(yùn)用統(tǒng)計(jì)語言學(xué)來對(duì)漢字的使用頻率進(jìn)行分析研究,建立出可供使用的文本的語料庫,并制定出基礎(chǔ)漢字的字表。到了1979年,我國逐漸開展對(duì)機(jī)器可讀語料庫的建設(shè)。[5]至今,現(xiàn)在常用的語料庫有北京語言大學(xué) BCC 語料庫、北京大學(xué)中國語言學(xué)研究中心CCL語料庫、國家語委現(xiàn)代漢語平衡語料庫等。[2]但是隨著時(shí)代的發(fā)展,新詞的出現(xiàn)會(huì)要求這些語料庫做出進(jìn)一步的改變,根據(jù)前面對(duì)“漢語盤點(diǎn)”活動(dòng)盤點(diǎn)出的新詞研究,對(duì)語料庫建設(shè)的意見主要有以下幾個(gè)方面。

    1.擴(kuò)大語料庫覆蓋面

    根據(jù)“十大新詞”在實(shí)際生活的具體使用和在語料庫中的收錄條數(shù),“十大新詞”具有較高的使用頻率和影響力,因此語料庫建設(shè)者在建設(shè)語料庫的時(shí)候可以擴(kuò)大語料庫覆蓋面。CCL語料庫中有“HSK”“文學(xué)”“篇章檢索”“多領(lǐng)域”“微博”“科技”“古漢語”“報(bào)刊”這八個(gè)板塊,可以適當(dāng)增加“年度新詞”和“年度流行語”板塊。這樣可以清晰記錄代表性新詞的流變,發(fā)現(xiàn)有哪些新詞的產(chǎn)生,又有哪些舊詞隨著時(shí)間流逝而逐漸減少使用。

    2.對(duì)語料進(jìn)行歸納整理

    在統(tǒng)計(jì)整理語料的過程中,筆者發(fā)現(xiàn)語料庫中的語料十分雜亂。以2017年年度新詞中的“金磚+”為例,筆者發(fā)現(xiàn)在語料庫檢索結(jié)果中,“金磚+”的語料與“金磚”的語料相互混雜,這是不應(yīng)當(dāng)?shù)?。如?/p>

    (1)巴育表示,中國為完善“金磚+”模式、促進(jìn)新興市場(chǎng)國家與發(fā)展中國家參與全球經(jīng)濟(jì)治理發(fā)揮了重要作用。(人民日?qǐng)?bào)2017年09月07日)

    (2)茲奇金礦是約翰內(nèi)斯堡高地金礦集團(tuán)五大金礦之一,每周生產(chǎn)這樣的金磚8塊,這實(shí)在是了不起的數(shù)字。(人民日?qǐng)?bào)1995年01月10日)

    可見,語料庫中的語料應(yīng)該進(jìn)行歸納整理,不同的語料應(yīng)當(dāng)歸屬不同的類別。同時(shí),筆者在整理這些語料的時(shí)候發(fā)現(xiàn)有些語料還重復(fù)出現(xiàn),嚴(yán)重影響了統(tǒng)計(jì)結(jié)果。對(duì)于這些重復(fù)語料,語料庫建設(shè)者在建設(shè)整理語料庫的時(shí)候應(yīng)當(dāng)立即刪除。

    3.增強(qiáng)動(dòng)態(tài)語料庫的時(shí)效性

    在表1中,2016年、2017年的年度新詞在語料庫中的收錄總量較多,所有新詞均有可供參考的語料。但從2018年開始,每一年年度新詞在語料庫中的語料條數(shù)總量都較少,且大量存在部分新詞在語料庫中沒有語料的問題,尤其是2019年,僅有兩個(gè)新詞在語料庫中存有語料,且語料條數(shù)極少。為了進(jìn)一步研究語料庫對(duì)近幾年的新詞收錄情況,筆者以最新一年,也就是2021年“漢語盤點(diǎn)”盤點(diǎn)出的年度“十大新詞”進(jìn)行了語料庫檢索。主要在動(dòng)態(tài)語料庫:CCL語料庫主、BCC語料庫、和國家語委現(xiàn)代漢語平衡語料庫中檢索。

    表3 2021年“十大新詞”語料情況

    從2021年的“十大新詞”在語料庫中的語料條數(shù)可以看出,2021年度新詞存在著相當(dāng)一部分新詞在三個(gè)語料庫中都沒有語料的問題。有些新詞即使在BCC語料庫中有少數(shù)語料,但在其他語料庫中依然沒有語料。這說明動(dòng)態(tài)語料庫在更新語料方面不夠及時(shí),而語料的缺失也會(huì)在很大程度上影響相關(guān)研究人員的查找搜集工作。所以語料庫建設(shè)者在搜集語料的時(shí)候應(yīng)該注重時(shí)效性,盡量將每年產(chǎn)生的新詞及時(shí)收錄進(jìn)去,做到及時(shí)更新。

    結(jié)語

    年度十大新詞作為最具代表性的新詞,具有較高的研究價(jià)值。運(yùn)用統(tǒng)計(jì)語言學(xué)對(duì)年度新詞進(jìn)行統(tǒng)計(jì)分析,可以更為清晰直觀地認(rèn)識(shí)年度新詞。這些詞語有的自產(chǎn)生之后就蓬勃發(fā)展,有的產(chǎn)生之后會(huì)隨著時(shí)間的流逝而逐漸減少使用。那些蓬勃發(fā)展的詞語就會(huì)對(duì)統(tǒng)計(jì)語言學(xué)的應(yīng)用產(chǎn)生影響,在編寫頻率詞典的時(shí)候要考慮到這些產(chǎn)生之后就大量使用的新詞。在建設(shè)語料庫的時(shí)候覆蓋面也應(yīng)廣一些,可以適當(dāng)增加“年度新詞”和“年度流行語”板塊,對(duì)包含這些年度新詞的語料進(jìn)行歸納整理,并對(duì)語料庫進(jìn)行實(shí)時(shí)更新,才能為現(xiàn)代漢語的詞匯研究提供更豐富的語言資料,既可以保持漢語詞匯系統(tǒng)的活力又能清楚地看到漢語詞匯系統(tǒng)的發(fā)展過程。

    猜你喜歡
    新詞音節(jié)現(xiàn)代漢語
    “楞”“愣”關(guān)系及“楞”在現(xiàn)代漢語中的地位
    拼拼 讀讀 寫寫
    《微群新詞》選刊之十四
    評(píng)《現(xiàn)代漢語詞典》(第6版)
    藏文音節(jié)字的頻次統(tǒng)計(jì)
    現(xiàn)代漢語中詞匯性的性范疇
    快樂拼音
    木管樂器“音節(jié)練習(xí)法”初探
    小議網(wǎng)絡(luò)新詞“周邊”
    北大版《現(xiàn)代漢語》增訂本)出版
    朝阳县| 楚雄市| 江源县| 长武县| 丽江市| 大石桥市| 许昌县| 余干县| 修文县| 永靖县| 木里| 敖汉旗| 依安县| 和平县| 合川市| 辽宁省| 定安县| 莱西市| 武陟县| 霍邱县| 雷波县| 鱼台县| 基隆市| 会泽县| 福清市| 来宾市| 南乐县| 丹巴县| 古田县| 武乡县| 大理市| 滕州市| 墨脱县| 海晏县| 农安县| 萨迦县| 开化县| 镇坪县| 玉山县| 彝良县| 新乐市|