• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      漢語(yǔ)分級(jí)閱讀的詞匯影響因素研究

      2020-03-17 10:33:56趙鳳嬌
      語(yǔ)文學(xué)刊 2020年1期
      關(guān)鍵詞:常用詞種數(shù)實(shí)詞

      ○ 趙鳳嬌

      (北京語(yǔ)言大學(xué) 漢語(yǔ)國(guó)際教育研究院,北京 100083)

      一、引 言

      分級(jí)閱讀指根據(jù)不同年齡層的生理、心理和認(rèn)知能力的發(fā)展情況,對(duì)閱讀材料進(jìn)行分級(jí),為不同年齡段的閱讀主體提供適合的閱讀材料。美國(guó)分級(jí)閱讀研究最早,也相當(dāng)成熟,應(yīng)用范圍較廣的閱讀分級(jí)方法有藍(lán)思分級(jí)法、A-Z分級(jí)法等。藍(lán)思分級(jí)法是針對(duì)兒童語(yǔ)言能力發(fā)展設(shè)計(jì)的。較之其他分級(jí)方法,該方法更注重對(duì)文本中的語(yǔ)言要素的測(cè)量,操作步驟為首先對(duì)文本中的詞頻、詞長(zhǎng)以及句長(zhǎng)等要素進(jìn)行量化統(tǒng)計(jì),然后將量化數(shù)值帶入公式計(jì)算出藍(lán)思值,再與難度等級(jí)對(duì)應(yīng),就能得知讀物的藍(lán)思等級(jí)。漢語(yǔ)與英語(yǔ)不同,張博教授在“面向可讀性測(cè)評(píng)的漢語(yǔ)文本語(yǔ)言特征分析”項(xiàng)目論證中指出:“英語(yǔ)的詞長(zhǎng)富有彈性,詞長(zhǎng)類(lèi)型多樣,短則一兩個(gè)音節(jié),長(zhǎng)則近二十個(gè)音節(jié),而漢語(yǔ)的詞長(zhǎng)較短且類(lèi)型有限,單音節(jié)詞和雙音節(jié)詞占絕對(duì)優(yōu)勢(shì),詞長(zhǎng)對(duì)詞義的可理解性及文本可讀性的影響不可能像英語(yǔ)那樣明顯。”因此, 漢語(yǔ)分級(jí)閱讀研究不可照搬國(guó)外分級(jí)閱讀的評(píng)測(cè)因素。

      目前,漢語(yǔ)分級(jí)閱讀研究集中在南方分級(jí)閱讀中心以及接力兒童分級(jí)閱讀研究中心,它們分別提出分級(jí)閱讀的標(biāo)準(zhǔn)以及參考書(shū)目[1]。就目前研究而言,分級(jí)標(biāo)準(zhǔn)并未形成完整的科學(xué)的體系,沒(méi)有國(guó)家統(tǒng)一的標(biāo)準(zhǔn),現(xiàn)有的閱讀分級(jí)標(biāo)準(zhǔn)側(cè)重于經(jīng)驗(yàn),從兒童個(gè)體出發(fā),把兒童讀者的年齡、學(xué)習(xí)階段和身心發(fā)展作為分級(jí)的標(biāo)準(zhǔn)[2],而語(yǔ)言要素作為影響文本理解的重要因素,在分級(jí)讀物研究中很少提及。文本在語(yǔ)言要素上所呈現(xiàn)出來(lái)的復(fù)雜程度一般被稱(chēng)為可讀性(Readability)。

      以往漢語(yǔ)可讀性的研究集中在漢語(yǔ)二語(yǔ)分級(jí)閱讀研究中,影響因素可以歸納為漢字、詞匯和句法三大語(yǔ)言要素。與拼音文字相比,漢字是表意文字,具有鮮明的特點(diǎn);句法層面的結(jié)論也比較單一,句長(zhǎng)對(duì)可讀性具有顯著的預(yù)測(cè)作用。相較于漢字和句法,詞匯層面因素較為復(fù)雜,考察維度不盡相同,結(jié)論也不一致。如有的研究著重于詞匯多樣和詞頻維度[3],有的研究?jī)H關(guān)注詞頻維度[4]等;在結(jié)論上,有的學(xué)者認(rèn)為虛詞數(shù)、虛實(shí)比是重要的詞匯影響因素[5],有的則指出詞次比在詞匯層面起決定性作用[3]。臺(tái)灣學(xué)者曾對(duì)臺(tái)灣中小學(xué)語(yǔ)文教材中的文本難度進(jìn)行分析,發(fā)現(xiàn)難詞數(shù)、實(shí)詞頻率對(duì)數(shù)的平均值、人稱(chēng)代名詞數(shù)等因素影響文本可讀性。[6][7][8]那么影響漢語(yǔ)文本可讀性的詞匯因素有哪些?哪些因素起主要作用?還需要進(jìn)一步深入研究。鑒于此,本文從詞匯多樣性、詞頻、詞匯密度和詞長(zhǎng)等四個(gè)維度考察可能影響文本難度分級(jí)的主要詞匯因素,以及這些因素的有效性。

      二、文本來(lái)源和處理

      (一)文本的來(lái)源

      張博教授在項(xiàng)目論證中提出:“由于要在比較不同難度漢語(yǔ)文本語(yǔ)言特征的基礎(chǔ)上分析提煉影響可讀性的主要參數(shù)及其權(quán)重,因此,選取難度梯級(jí)分明的系列漢語(yǔ)文本至關(guān)重要?!睖厝迕糁赋觥安烤幈尽闭Z(yǔ)文教材是由教育部出面聘請(qǐng)主編和編寫(xiě)專(zhuān)家,調(diào)集了全國(guó)最強(qiáng)的編寫(xiě)隊(duì)伍,有條件在總體質(zhì)量和水平上超越現(xiàn)有各種版本的教材。[9]因此,我們選取部編版二年級(jí)、七年級(jí)和十二年級(jí)①《語(yǔ)文》中的課文②建立了低難度、中難度和高難度三個(gè)難度等級(jí)的文本庫(kù),如表1所示。

      表1 部編人教版不同難度等級(jí)課文數(shù)量、總字?jǐn)?shù)、平均課文長(zhǎng)度分布

      (二)切詞結(jié)果處理

      本文使用NLPIR-ICTCLAS漢語(yǔ)分詞系統(tǒng)對(duì)文本進(jìn)行詞語(yǔ)切分。之后對(duì)切詞結(jié)果進(jìn)行逐一校對(duì)和處理。校對(duì)工作以《現(xiàn)代漢語(yǔ)詞典》(第7版)為主,以百度百科搜索引擎(https://baike.baidu.com/)為輔。

      (三)文本的劃分方法和范圍

      與漢語(yǔ)不同,英文文本是由一個(gè)個(gè)單詞“word”所構(gòu)成的,而漢語(yǔ)中的字和詞是不同的概念,二者并不等同。漢語(yǔ)文本長(zhǎng)度多采用字來(lái)統(tǒng)計(jì),因此本文按照字?jǐn)?shù)來(lái)劃分文本長(zhǎng)度,每個(gè)劃分的文本稱(chēng)作一個(gè)文本塊。為了避免文本大小對(duì)統(tǒng)計(jì)結(jié)果的影響,我們分別以500字和1000字的長(zhǎng)度來(lái)劃分③。

      三、不同詞匯因素與文本難度等級(jí)的相關(guān)性

      (一)詞匯多樣性與文本難度等級(jí)相關(guān)性

      詞匯多樣性由樣本中的不同詞的數(shù)量來(lái)表示,在英語(yǔ)中一般通過(guò)比較不同單詞的數(shù)量與總單詞數(shù)來(lái)衡量,即類(lèi)符-形符比(Type-Token Ratio,簡(jiǎn)稱(chēng)TTR)。[10]8TTR是樣本大小的函數(shù),受文本長(zhǎng)度的影響,如較大樣本的TTR值比較低,較小樣本的TTR值比較高,因此TTR公式的信度飽受質(zhì)疑。Johnson提出了改善TTR的方法,即平均節(jié)段類(lèi)符-形符比(Mean Segmental TTR,簡(jiǎn)稱(chēng)MSTTR)。[11]該方法通過(guò)將樣本分成給定長(zhǎng)度的連續(xù)段來(lái)控制文本長(zhǎng)度,然后計(jì)算所有段的平均節(jié)段類(lèi)符-形符比來(lái)得到TTR。Torruella & Capsada基于不同類(lèi)型的文本考察了七種測(cè)量詞匯多樣性的公式對(duì)文本長(zhǎng)度的依賴(lài)性,研究發(fā)現(xiàn)MSTTR對(duì)文本長(zhǎng)度的依賴(lài)不顯著。[12]故本文選用MSTTR的測(cè)量方法,將文本先按500字?jǐn)?shù)分成大致相等的文本塊,根據(jù)每個(gè)文本塊計(jì)算TTR,最后統(tǒng)計(jì)TTR的平均值獲得MSTTR。本文擬采用詞數(shù)、詞種數(shù)和MSTTR值來(lái)衡量詞匯的多樣性。如表2所示。

      表2 不同難度等級(jí)文本的詞匯多樣性的統(tǒng)計(jì)結(jié)果

      由表2可以看出,詞數(shù)隨難度等級(jí)的升高而減少;詞種數(shù)也基本隨難度等級(jí)的升高而增加,不過(guò)高難度文本的詞種數(shù)略微下降。MSTTR隨文本難度等級(jí)的升高而增加。

      通過(guò)使用SPSS21.0計(jì)算詞數(shù)、詞種數(shù)以及MSTTR與文本難度等級(jí)的Spearman相關(guān)系數(shù),結(jié)果如表3所示。

      表3 不同難度等級(jí)文本的詞匯多樣性與文本難度等級(jí)的Spearman相關(guān)系數(shù)

      注:*代表Spearman相關(guān)系數(shù)的顯著程度,*越多,相關(guān)性越顯著,下文同。

      統(tǒng)計(jì)結(jié)果表明,詞數(shù)、詞種數(shù)和MSTTR與文本難度均呈顯著相關(guān),詞數(shù)與文本難度等級(jí)呈顯著負(fù)相關(guān),詞種數(shù)呈顯著正相關(guān),MSTTR呈顯著正相關(guān),相關(guān)性由高到低為:MSTTR(0.487)>詞種數(shù)(0.376)>詞數(shù)(|-0.351|)。

      通過(guò)獨(dú)立樣本T檢驗(yàn)來(lái)驗(yàn)證這三個(gè)因素對(duì)不同難度文本的預(yù)測(cè)效用,我們發(fā)現(xiàn),在詞數(shù)、詞種數(shù)和MSTTR因素上,低難度與中難度、高難度文本均存在顯著差異(p<

      0.05);而中難度和高難度文本均不存在顯著差異(p>0.05)。也就是說(shuō),詞數(shù)、詞種數(shù)和MSTTR能顯著區(qū)分低難度與中、高難度文本,但并不能顯著區(qū)分中難度和高難度文本。

      綜上,通過(guò)Spearman相關(guān)系數(shù)和獨(dú)立樣本T檢驗(yàn)我們發(fā)現(xiàn),詞數(shù)、詞種數(shù)、MSTTR與文本難度等級(jí)呈顯著相關(guān),詞數(shù)隨文本難度等級(jí)的升高而減少,詞種數(shù)和MSTTR隨文本難度等級(jí)的升高而升高,三個(gè)因素均能顯著區(qū)分低難度與中、高難度等級(jí)文本。但是中難度與高難度文本在三個(gè)因素上并不存在顯著差異,即詞數(shù)、詞種數(shù)、MSTTR不能區(qū)分中難度和高難度文本。

      (二)詞頻與文本難度等級(jí)的相關(guān)性

      詞頻(Lexical Frequency)具有兩種含義,一是指在特定文本或語(yǔ)料庫(kù)中詞語(yǔ)重復(fù)的頻率,也就是通常所說(shuō)的詞次數(shù)或頻數(shù);二是指詞頻概貌(Lexical Frequency Profile),指詞語(yǔ)在詞表的不同詞匯頻率等級(jí)上的分布情況。蘇新春和顧江萍全面考察了四套語(yǔ)文教材中的詞語(yǔ)分布情況,對(duì)比了頻率法(詞次數(shù))與分布法(詞頻概貌),發(fā)現(xiàn)分布法更容易體現(xiàn)出語(yǔ)文詞語(yǔ)的穩(wěn)定性與通用性。[13]比如對(duì)于科技文等特定文本,雖然某些詞語(yǔ)在文本中出現(xiàn)次數(shù)較高,但對(duì)于非專(zhuān)業(yè)人士來(lái)說(shuō)卻較難理解,這樣通過(guò)詞次數(shù)來(lái)描述就不準(zhǔn)確。相反,這類(lèi)詞在詞表中可能屬于低分布詞,從而通過(guò)詞表可以較好地反映詞的屬性。因此,我們采用詞頻概貌來(lái)進(jìn)行研究。

      《現(xiàn)代漢語(yǔ)常用詞表》(草案)是基于2.5億字大規(guī)模語(yǔ)料,對(duì)現(xiàn)當(dāng)代社會(huì)生活中使用頻率較高的56008個(gè)漢語(yǔ)普通話(huà)詞語(yǔ)做出詞頻排序,并給出了每個(gè)詞語(yǔ)的詞性,是目前最具權(quán)威性的詞頻統(tǒng)計(jì)數(shù)據(jù)。因此,本文將該詞表作為詞頻概貌的劃分依據(jù)。將該詞表按照使用頻率由高到低的順序劃分為六個(gè)區(qū)間,每個(gè)區(qū)間范圍包含10000個(gè)詞,分別為最常用詞([1,10000])、常用詞([10001,20000])、次常用詞([20001,30000])、較不常用詞([30001,40000])、不常用詞([40001,50000])、罕用詞④([50001,+∞))。詞頻分布如表4所示。

      表4 不同難度等級(jí)文本的詞頻分布情況

      由表4可以看出,不同難度等級(jí)文本的詞數(shù)在最常用詞區(qū)間數(shù)量最多,占比均高于80%;罕用詞區(qū)間占比次高,基本上隨文本難度等級(jí)的升高而升高,這說(shuō)明《語(yǔ)文》教材文本均以前10000常用詞為主,同時(shí)會(huì)設(shè)置一些生詞,這在一定程度上關(guān)照了學(xué)生的認(rèn)知規(guī)律,即既要保障學(xué)生理解文義,也要增加學(xué)生的詞匯量。

      表5 詞頻與不同難度等級(jí)文本之間的Spearman相關(guān)系數(shù)

      由表5可以看出,最常用詞和常用詞區(qū)間與文本難度顯著相關(guān)(p<0.05),其他區(qū)間的相關(guān)性均不顯著(p>0.05)。

      通過(guò)獨(dú)立樣本T檢驗(yàn)我們發(fā)現(xiàn),低難度文本和中難度文本在常用詞區(qū)間、次常用詞區(qū)間上存在顯著差異(p<0.05),低難度文本和高難度文本在最常用詞區(qū)間、常用詞區(qū)間上存在顯著差異(p<0.05)。中難度和高難度文本在各區(qū)間上都不存在顯著差異(p>0.05)。

      綜上所知,常用詞區(qū)間能顯著區(qū)分低難度與中、高難度文本,而中難度和高難度文本在各區(qū)間并無(wú)顯著差異。

      (三)詞匯密度與文本難度等級(jí)的相關(guān)性

      詞匯密度指具有詞匯屬性的詞(即具有實(shí)際意義的詞,包括名詞、動(dòng)詞、形容詞等)的數(shù)量與總詞數(shù)的比率,即實(shí)詞在總詞數(shù)中所占的比重。Vajjala & Meurers認(rèn)為實(shí)詞比是測(cè)量英語(yǔ)文本難度的有效因素。[14]本文借鑒朱德熙的詞語(yǔ)分類(lèi)標(biāo)準(zhǔn),將名詞(包括時(shí)間詞和方位詞、處所詞)、動(dòng)詞(包括助動(dòng)詞和趨向動(dòng)詞)、形容詞(包括屬性詞和狀態(tài)詞、區(qū)別詞)、數(shù)詞、量詞、代詞(包括人稱(chēng)代詞、指示代詞和疑問(wèn)代詞)歸為實(shí)詞,將副詞、介詞、連詞、助詞(包括語(yǔ)氣詞)、嘆詞、擬聲詞等歸為虛詞。[15]46-50本文擬采用實(shí)詞數(shù)、實(shí)詞比來(lái)衡量詞匯密度。實(shí)詞數(shù)、實(shí)詞比在不同難度文本中的分布如表6所示。

      表6 實(shí)詞數(shù)、實(shí)詞比在不同難度文本中的分布

      從表6可以看出,實(shí)詞數(shù)隨文本難度等級(jí)的升高而下降,在詞匯密度中,低難度比重最高,高難度文本次之,中難度文本比重最低。

      表7 實(shí)詞數(shù)、實(shí)詞比與文本難度等級(jí)的Spearman相關(guān)系數(shù)

      由表7可知,實(shí)詞數(shù)和實(shí)詞比均與文本難度等級(jí)呈顯著負(fù)相關(guān)(p<0.05),其中實(shí)詞數(shù)的相關(guān)性最顯著。通過(guò)獨(dú)立樣本T檢驗(yàn)發(fā)現(xiàn),低難度與中、高難度文本在實(shí)詞數(shù)、實(shí)詞數(shù)比上存在顯著差異(p<0.05),而中難度與高難度文本均不存在顯著差異(p>0.05)。

      總之,在詞匯密度中,實(shí)詞數(shù)與實(shí)詞數(shù)比顯著影響低難度與中、高難度文本等級(jí),而中難度與高難度等級(jí)文本之間并無(wú)顯著差異。

      (四)詞匯長(zhǎng)度與文本難度等級(jí)的相關(guān)性

      詞匯長(zhǎng)度(word length)一般用于英語(yǔ)文本的測(cè)量,指一個(gè)詞語(yǔ)所包含的音節(jié)或字母數(shù)。在英語(yǔ)可讀性公式中,詞長(zhǎng)作為文本可讀性測(cè)量的主要因素,漢語(yǔ)與英語(yǔ)不同,漢語(yǔ)的詞長(zhǎng)較短且類(lèi)型有限,單音節(jié)詞和雙音節(jié)詞占絕對(duì)優(yōu)勢(shì)。漢語(yǔ)詞長(zhǎng)對(duì)文本可讀性的影響是否像英語(yǔ)那樣明顯還需進(jìn)一步研究和驗(yàn)證。不同難度等級(jí)的文本的詞長(zhǎng)分布如表8所示。

      表8 不同難度等級(jí)的文本的詞長(zhǎng)統(tǒng)計(jì)

      由表8可以看出,單音節(jié)詞的詞長(zhǎng)及其比重隨文本難度等級(jí)的升高而下降,雙音節(jié)詞長(zhǎng)及其比重隨文本難度等級(jí)的升高而升高,而其他音節(jié)的詞長(zhǎng)并無(wú)明顯規(guī)律。

      表9 詞長(zhǎng)與不同難度等級(jí)文本的Spearman相關(guān)系數(shù)

      通過(guò)表9可知,單音節(jié)詞長(zhǎng)與文本難度均呈顯著負(fù)相關(guān)(p<0.05),雙音節(jié)詞與文本難度均呈顯著正相關(guān)(p<0.05),其他音節(jié)的詞長(zhǎng)與文本難度的相關(guān)性均不顯著(p>0.05)。

      通過(guò)獨(dú)立樣本T檢驗(yàn)我們進(jìn)一步發(fā)現(xiàn),在單音節(jié)詞、雙音節(jié)詞長(zhǎng)上,低難度與中、高難度文本存在顯著差異(p<0.05)。中難度與高難度文本僅在雙音節(jié)詞上存在顯著差異(p<0.05)。

      總之,單音節(jié)和雙音節(jié)詞能顯著區(qū)分低難度與中、高難度文本,中難度與高難度僅在雙音節(jié)詞上存在顯著差異。

      四、結(jié) 語(yǔ)

      本文從詞匯多樣性、詞頻概貌、詞匯密度和詞匯長(zhǎng)度等四個(gè)維度考察影響文本可讀性的詞匯因素,發(fā)現(xiàn)在500字文本塊中,詞數(shù)、詞種數(shù)、MSTTR、常用詞區(qū)間詞頻、實(shí)詞數(shù)、實(shí)詞比以及單音節(jié)和雙音節(jié)詞長(zhǎng)能夠顯著區(qū)分低難度與中、高難度文本,影響力由高到低均為:MSTTR>常用詞區(qū)間詞頻>實(shí)詞數(shù)>詞種數(shù)>單音節(jié)詞長(zhǎng)>詞數(shù)>雙音節(jié)詞長(zhǎng)>實(shí)詞比,但對(duì)中、高難度文本的區(qū)分并不明顯。本文還按照1000字對(duì)文本長(zhǎng)度進(jìn)行劃分,發(fā)現(xiàn)結(jié)果與500字文本塊劃分中對(duì)文本難度等級(jí)的影響基本一致。

      本文的研究結(jié)果契合了目前我國(guó)義務(wù)教育《語(yǔ)文》課程的總教學(xué)目標(biāo),也遵循了兒童的認(rèn)知發(fā)展規(guī)律。義務(wù)教育階段總教學(xué)目標(biāo)規(guī)定初中階段的任務(wù)是全面普及九年義務(wù)教育,語(yǔ)文課程側(cè)重要求學(xué)生識(shí)字與寫(xiě)字、閱讀、寫(xiě)作、口語(yǔ)交際、綜合性學(xué)習(xí);而高中階段的任務(wù)是面向高等教育,為社會(huì)培養(yǎng)及輸送合格人才,語(yǔ)文課程標(biāo)準(zhǔn)的要求是積累·整合、感受·鑒賞、思考·領(lǐng)悟、應(yīng)用·拓展、發(fā)現(xiàn)·創(chuàng)造。因此從這個(gè)意義上來(lái)說(shuō),義務(wù)教育階段的語(yǔ)文學(xué)習(xí)更加重視學(xué)生語(yǔ)言知識(shí)的階段性的掌握與積累,而高中階段的語(yǔ)文學(xué)習(xí)則是重視學(xué)生如何正確地將學(xué)習(xí)到的語(yǔ)文知識(shí)運(yùn)用到具體的實(shí)踐中。根據(jù)皮亞杰的認(rèn)知發(fā)展理論的四個(gè)階段可知,小學(xué)階段為第三階段,即具體運(yùn)算階段(7~11歲),該階段兒童只能利用具體的事物、物體或過(guò)程來(lái)進(jìn)行思維或運(yùn)算,不能利用語(yǔ)言、文字陳述的事物和過(guò)程為基礎(chǔ)來(lái)運(yùn)算,也就是說(shuō)該階段學(xué)生的語(yǔ)言知識(shí)還比較低,處于學(xué)習(xí)階段;初中階段為第四階段,即形式運(yùn)算階段(11~15歲),該階段兒童的思維不必從具體事物和過(guò)程開(kāi)始,可以利用語(yǔ)言文字,在頭腦中想象和思維,重建事物和過(guò)程來(lái)解決問(wèn)題,也就是說(shuō)學(xué)生在該階段的語(yǔ)言知識(shí)水平已經(jīng)初步形成。皮亞杰認(rèn)為15歲之后的人的認(rèn)知水平在形式運(yùn)算階段基礎(chǔ)上更加成熟。所以從語(yǔ)言方面來(lái)看,低難度文本與中、高難度文本等級(jí)區(qū)分比較明顯,而中、高難度文本等級(jí)不太明顯。本研究從詞匯多樣性、詞頻、詞匯密度和詞長(zhǎng)等四個(gè)維度全面考察了影響文本難度分級(jí)的主要詞匯因素及其在文本難度分級(jí)中的有效性,在一定程度上為分級(jí)閱讀文本的選材和編寫(xiě)提供些許參考。

      【 注 釋 】

      ①由于目前“部編本”未涉及高中教材的編寫(xiě),故十二年級(jí)《語(yǔ)文》教材選用正在使用的經(jīng)全國(guó)中小學(xué)教材審定委員會(huì)2004年初審?fù)ㄟ^(guò)的普通高中課程標(biāo)準(zhǔn)實(shí)驗(yàn)教科書(shū)《語(yǔ)文》(必修)5。

      ②課文中排除文言文、詩(shī)歌(古代和現(xiàn)代)、戲劇等,主要選取記敘文、議論文、應(yīng)用文和說(shuō)明文。

      ③通過(guò)SPSS21.0的配對(duì)樣本T檢驗(yàn),檢驗(yàn)同一難度等級(jí)文本的順序和亂序劃分是否存在差異。結(jié)果表明,兩種長(zhǎng)度劃分方式中,三種難度等級(jí)的順序劃分與亂序劃分在詞數(shù)和詞種數(shù)上均不存在顯著差異(p>0.05)。因此,我們選取順序劃分作為文本的分塊方式。

      ④罕用詞不僅包含《現(xiàn)代漢語(yǔ)常用詞表(草案)》中的50000以上的詞語(yǔ),還包括詞表中未收錄的詞語(yǔ),我們將罕用詞視為更為低頻的詞。

      猜你喜歡
      常用詞種數(shù)實(shí)詞
      常用詞“怠”“惰”“懶”的歷時(shí)演變
      文言文實(shí)詞詞義推斷的基本策略
      文言實(shí)詞50例
      請(qǐng)“球”入“盒”問(wèn)題八例
      文言實(shí)詞推斷法
      請(qǐng)“球”入“盒”問(wèn)題八例
      常用詞“開(kāi)、辟”在“開(kāi)闊”義上的演變替換
      例說(shuō)文言實(shí)詞解題誤區(qū)及對(duì)策
      全國(guó)少數(shù)民族文字期刊分類(lèi)種數(shù)、印數(shù)、總印張、總金額
      全國(guó)各地區(qū)少兒期刊、畫(huà)刊出版的種數(shù)、印數(shù)、總印張、總金額
      鹤山市| 霍邱县| 平度市| 汽车| 卓尼县| 上杭县| 广南县| 平山县| 汉川市| 敖汉旗| 珠海市| 南乐县| 罗源县| 安国市| 湟中县| 五河县| 阿坝县| 吉林省| 巨野县| 裕民县| 如皋市| 五家渠市| 义乌市| 宝丰县| 神木县| 石家庄市| 安徽省| 怀远县| 秦安县| 德令哈市| 石屏县| 禄丰县| 辽阳县| 巴马| 安岳县| 上犹县| 南通市| 北流市| 仙桃市| 昌平区| 巴彦淖尔市|