摘 要:本文運(yùn)用統(tǒng)計(jì)和數(shù)學(xué)建模方法,對(duì)1988年以來(lái)收錄在中國(guó)知網(wǎng)(CNKI)中的有關(guān)漢語(yǔ)水平考試(HSK)研究的論文進(jìn)行分析。在論文年度分布、作者分布、機(jī)構(gòu)分布、出版物分布等方面進(jìn)行數(shù)學(xué)建模。應(yīng)用普賴斯公式和布拉德福定律推算出49名核心作者、9個(gè)核心機(jī)構(gòu)、15種核心出版物等。本文論述了HSK研究現(xiàn)狀與發(fā)展趨勢(shì),總結(jié)文獻(xiàn)特征及其分布規(guī)律,為HSK計(jì)量研究提供依據(jù)和參考。
關(guān)鍵詞:漢語(yǔ)水平考試(HSK) 洛特卡定律 布拉德福定律 邏輯斯蒂模型
一、引言
漢語(yǔ)水平考試(HSK)是為母語(yǔ)非漢語(yǔ)考生(如外國(guó)人、華僑及國(guó)內(nèi)少數(shù)民族)設(shè)立的官方標(biāo)準(zhǔn)化漢語(yǔ)能力測(cè)試[1]。漢語(yǔ)水平考試從1984年開始研制,1990年在國(guó)內(nèi)組織實(shí)施,1991年正式推向海外,1992年升為國(guó)家級(jí)考試。1992年《漢語(yǔ)水平詞匯與漢字等級(jí)大綱》[2]、1996年《漢語(yǔ)水平等級(jí)標(biāo)準(zhǔn)與語(yǔ)法等級(jí)大綱》[3]、2007年《國(guó)際漢語(yǔ)能力標(biāo)準(zhǔn)》[4]、2009年《漢語(yǔ)水平考試HSK(基礎(chǔ)、初中等、高等)大綱》[5]、2013年《新漢語(yǔ)水平考大綱(一至六級(jí))》[6]相繼出版,并推出了新HSK[7],在實(shí)現(xiàn)“以考促教、以考促學(xué)”方面,發(fā)揮了積極作用。HSK已成為考核漢語(yǔ)交際能力和掌握語(yǔ)言知識(shí)面的衡量標(biāo)尺,受到了對(duì)外漢語(yǔ)教學(xué)工作者和漢語(yǔ)學(xué)習(xí)者的廣泛關(guān)注。截至2016年底,全球125個(gè)國(guó)家(地區(qū))設(shè)立1066個(gè)考點(diǎn)(中國(guó)大陸371個(gè),海外695個(gè)),全年各類漢語(yǔ)考試考生達(dá)600萬(wàn)人[8],這說(shuō)明HSK需求強(qiáng)勁。同時(shí),關(guān)于漢語(yǔ)水平考試的相關(guān)研究也不斷出現(xiàn),如HSK科學(xué)性質(zhì)和特點(diǎn)[9],漢語(yǔ)水平考試歷史演變[10],HSK詞匯等級(jí)表[11],相關(guān)詞匯教學(xué)研究[12],漢字偏誤分析[13]等等。為了更好地發(fā)揮HSK測(cè)試平臺(tái)的作用,推進(jìn)漢語(yǔ)水平考試發(fā)展,有必要對(duì)過(guò)去的30年間(1988~2017年)HSK研究狀況進(jìn)行分析,挖掘文獻(xiàn)特征及其分布規(guī)律,預(yù)測(cè)HSK今后發(fā)展趨勢(shì),對(duì)HSK的完善具有重要意義。
本文以1988~2017年CNKI收錄的3188篇HSK論文作為研究對(duì)象,對(duì)論文增長(zhǎng)、作者分布、發(fā)文機(jī)構(gòu)和載文出版物等進(jìn)行了統(tǒng)計(jì)。首次將科學(xué)計(jì)量方法應(yīng)用到HSK研究,并闡明HSK發(fā)展現(xiàn)狀、趨勢(shì)和文獻(xiàn)特征及其分布規(guī)律,為HSK的深入研究提供參考。
二、數(shù)據(jù)采集
本文研究數(shù)據(jù)收集于中國(guó)知網(wǎng)CNKI的學(xué)術(shù)文獻(xiàn)總庫(kù)n,其中包括:學(xué)術(shù)期刊、學(xué)術(shù)輯刊全文數(shù)據(jù)庫(kù)、博士學(xué)位論文和優(yōu)秀碩士學(xué)位論文。學(xué)科領(lǐng)域=人文與社會(huì)科學(xué)文獻(xiàn)+信息科技;時(shí)段=1988~2017年,主題=“漢語(yǔ)水平考試”或含“HSK”進(jìn)行精確檢索,共檢索到4252篇。刪除無(wú)作者、無(wú)單位、書訊、會(huì)訊、新聞報(bào)道、簡(jiǎn)介等非規(guī)范文獻(xiàn)后,得到有效論文3188篇。對(duì)這部分?jǐn)?shù)據(jù)先采用Excel進(jìn)行統(tǒng)計(jì),再使用Origin軟件對(duì)這些文獻(xiàn)進(jìn)行數(shù)學(xué)建模分析。
三、結(jié)果與分析
(一)年度分布
自1984年漢語(yǔ)水平考試研制以來(lái),不少學(xué)者對(duì)其進(jìn)行了相關(guān)研究,相關(guān)論文發(fā)表情況見表1。
1988~1996年,年均論文發(fā)表量少于20篇,年均5.2篇;1997~2003年,年均論文發(fā)表量少于30篇,年均22.9篇;2004~2010年,年均論文發(fā)表量68.9篇;2011~2017年,年均論文發(fā)表超過(guò)200篇,年均論文357篇,總體來(lái)說(shuō),漢語(yǔ)水平考試研究量呈增長(zhǎng)態(tài)勢(shì)。
從1984年開始研制,到1996年《漢語(yǔ)水平等級(jí)標(biāo)準(zhǔn)與語(yǔ)法等級(jí)大綱》發(fā)布,相關(guān)研究也處于萌芽階段;從1997年到2003年新HSK大綱發(fā)布之前,相關(guān)研究處于起步階段;自2003年新HSK大綱發(fā)布之后,2004年至2010年,研究處于緩慢發(fā)展階段;2011年至今,論文數(shù)量飛速增長(zhǎng),處于快速增長(zhǎng)階段。
圖1是論文增長(zhǎng)曲線,橫坐標(biāo)為時(shí)間(t=實(shí)際年度-1987),縱坐標(biāo)為論文累計(jì)量。根據(jù)馬春雨(2017)的方法[15],利用Origin軟件分析,采用指數(shù)函數(shù):y=aexp(bt),對(duì)表1數(shù)據(jù)進(jìn)行數(shù)學(xué)建模,得到理論擬合曲線:y=7.825e0.2028t,其擬合度為R2=0.992,擬合效果達(dá)99.2%,數(shù)據(jù)擬合度越高,擬合效果越高,說(shuō)明理論結(jié)果與實(shí)際觀察數(shù)據(jù)越符合,表明HSK研究論文符合指數(shù)增長(zhǎng)規(guī)律。其文獻(xiàn)增長(zhǎng)速度,即文獻(xiàn)翻倍所需要的時(shí)間=ln2÷b=ln2÷0.2028=3.4年??傮w來(lái)說(shuō),從1988年至今,漢語(yǔ)水平考試相關(guān)研究越來(lái)越受關(guān)注。
(二)作者分布與核心作者
1.作者分析
根據(jù)只統(tǒng)計(jì)第一作者的原則,采集數(shù)據(jù),列表2。
利用洛特卡定律(Lotas Law)描述論文與作者之間的數(shù)量關(guān)系,其一般形式[16]:
,C>0,x=1,2,3,…,m(1)
x為每位作者發(fā)文量,其取值從1到最大值(m);n是指數(shù)常量;y為作者人數(shù),為作者總數(shù)(=2853,表2),洛特卡定律常數(shù)是,即發(fā)表1篇論文的作者百分比。在表2中,C=92.114%,即發(fā)表1篇HSK論文的作者占92.114%,高于經(jīng)典洛特卡定律常數(shù)C經(jīng)典=60.79%[17],反映新作者不斷參加HSK研究,漢語(yǔ)水平考試不斷受到關(guān)注,擁有廣泛的研究群體,也代表HSK屬于熱點(diǎn)課題之一。
圖2是論文與作者分布圖,它由表2數(shù)據(jù)繪制而成,從表2可知:發(fā)文1篇的作者占優(yōu)(92.114%),發(fā)文2篇的作者居次(6.169%),發(fā)文≥3篇的作者僅占1.717%。利用公式(1)和Origin軟件,對(duì)表2數(shù)據(jù)進(jìn)行數(shù)學(xué)建模,得到理論擬合曲線是冪函數(shù):,其曲線擬合度R2=0.99999,擬合效果達(dá)99.999%。說(shuō)明HSK作者分布適合負(fù)冪律,即:隨發(fā)文量的增加,作者數(shù)以負(fù)冪函數(shù)減少,說(shuō)明許多學(xué)者已關(guān)注到HSK發(fā)展,并為此做出貢獻(xiàn)。但是,作者數(shù)與論文數(shù)之間存在圖2所示的“長(zhǎng)尾巴”不均衡現(xiàn)象。
2.核心作者
在表2中,核心作者的發(fā)表論文最大值Nmax=13篇。依據(jù)普賴斯公式[17],核心作者發(fā)文閾值=2.7?3(鄰近最大整數(shù))。發(fā)文量≧3篇的49位高產(chǎn)作者,屬于核心作者,他們共發(fā)表208篇論文,分別占作者總數(shù)和論文總數(shù)的6.52%和1.72%。普賴斯定律規(guī)定“核心作者群”條件:核心作者占作者總數(shù)的20%,論文占總數(shù)的50%。理論核心作者數(shù)=642人,與實(shí)際核心作者(49名)相差太大。由此可見,在漢語(yǔ)水平考試領(lǐng)域,還沒有形成核心作者群。表2列出部分核心作者。
(三)機(jī)構(gòu)分布
采用第一作者機(jī)構(gòu)統(tǒng)計(jì)原則,本文研究的3188篇論文來(lái)自297個(gè)機(jī)構(gòu)。按每個(gè)機(jī)構(gòu)發(fā)文量的遞減順序編排制成表3,D是機(jī)構(gòu)數(shù)量,機(jī)構(gòu)累計(jì)量x=∑Di,E是每個(gè)機(jī)構(gòu)發(fā)文量,論文累計(jì)量y=∑(Di×Ei)。
布拉德福定律認(rèn)為,在發(fā)文量基本相同的情況下,表3的論文產(chǎn)出機(jī)構(gòu)可分成:核心區(qū)、相關(guān)區(qū)和離散區(qū),見表4。
在表4中,三個(gè)區(qū)的機(jī)構(gòu)數(shù)存在等比關(guān)系,即9:28:260≈1:5:52≈1:a:a2,布拉德福系數(shù)a=5。表明HSK研究機(jī)構(gòu)分布符合布拉德福定律的集中與離散規(guī)律[18],即核心區(qū)的9個(gè)機(jī)構(gòu),占機(jī)構(gòu)總數(shù)的3.03%,集中發(fā)表論文32.999%;而離散區(qū)的260個(gè)機(jī)構(gòu),占總數(shù)87.54%,離散地發(fā)表論文33.501%。
布拉德福定律認(rèn)為,核心區(qū)的機(jī)構(gòu)就是“核心機(jī)構(gòu)”,即發(fā)文量≧63篇的機(jī)構(gòu)。表3列出了9個(gè)核心機(jī)構(gòu)的名稱,包括:4所綜合大學(xué)、3所師范大學(xué)和1所語(yǔ)言大學(xué)。其中,北京語(yǔ)言大學(xué)居首。
圖3是論文與機(jī)構(gòu)的分布圖。它由表3數(shù)據(jù)繪制而成,從圖3曲線形態(tài)可以看出,HSK機(jī)構(gòu)分布近似“S”型曲線,即:隨發(fā)文機(jī)構(gòu)數(shù)量的增加,論文累計(jì)量呈現(xiàn)“緩慢發(fā)展期—快速遞增期—穩(wěn)定飽和期”的變化過(guò)程。通?!癝型曲線”采用邏輯斯蒂函數(shù)(Logistic function)建模。因此,對(duì)表3數(shù)據(jù)進(jìn)行數(shù)學(xué)建模分析[19],得到邏輯斯蒂增長(zhǎng)函數(shù):,曲線擬合度R2=0.9939,擬合效果達(dá)99.39%,表明HSK論文產(chǎn)出機(jī)構(gòu)分布符合邏輯斯蒂增長(zhǎng)規(guī)律。即HSK產(chǎn)出機(jī)構(gòu)經(jīng)過(guò)不斷的累計(jì),發(fā)文數(shù)量先經(jīng)歷一段緩慢增長(zhǎng)期,之后,才進(jìn)入快速增長(zhǎng)階段;隨后,盡管機(jī)構(gòu)累計(jì)增加,但發(fā)文量變化不大,處于穩(wěn)定的飽和期,其飽和期越長(zhǎng),HSK研究就越接近完備狀態(tài)。
(四)出版物分布與核心出版物
本文統(tǒng)計(jì)的3188篇論文登載于463種出版物(期刊、碩士和博士論文)。表5是按每種出版物發(fā)文量的遞減順序制成,F(xiàn)為出版物數(shù)量,出版物累計(jì)量x=∑Fi,G為每種出版物載文量,論文累計(jì)量y=∑(Fi×Gi)。
按發(fā)文數(shù)量基本相同原則,表5的出版物可分成:核心、相關(guān)和離散三個(gè)區(qū),見表6。
在表6中,三個(gè)區(qū)的出版物數(shù)量構(gòu)成比值為14:39:350≈1:5:52,即布拉德福系數(shù)a=5。說(shuō)明HSK出版物分布也符合布拉德福定律。核心區(qū)的出版物就是HSK研究的“核心出版物”,即載文量≧43篇的出版物。在表5,列出了15種核心出版物,包括12篇高校碩士論文和3種期刊。其中,吉林大學(xué)碩士畢業(yè)論文居首。
圖4是出版物與論文的關(guān)系曲線。HSK出版物分布也呈現(xiàn)“S”型曲線,即:隨載文出版物數(shù)量的增加,論文累計(jì)量呈現(xiàn)“緩慢增長(zhǎng)期—快速遞增期—穩(wěn)定飽和期”的變化過(guò)程。
利用邏輯斯蒂模型(Logistic model),對(duì)表5數(shù)據(jù)進(jìn)行數(shù)學(xué)建模,獲得邏輯斯蒂增長(zhǎng)函數(shù):,其擬合度R2=0.9978,擬合效果達(dá)99.78%。表明邏輯增長(zhǎng)函數(shù)滿足HSK論文出版物分布規(guī)律。說(shuō)明有關(guān)漢語(yǔ)水平考試的出版物不斷發(fā)展,相關(guān)研究日趨完善。
四、結(jié)語(yǔ)
通過(guò)上述統(tǒng)計(jì)和數(shù)學(xué)建模方法,我們可以得出以下結(jié)論:
(一)從論文增長(zhǎng)規(guī)律來(lái)看,符合指數(shù)增長(zhǎng)規(guī)律,HSK研究總體呈上升趨勢(shì)。
(二)從作者來(lái)看,符合洛特卡定律,即隨每人發(fā)文量的增加,作者人數(shù)呈負(fù)冪函數(shù)減少。從作者群體而言,HSK具有廣泛的作者群體。但是,核心作者(49人)較少,沒有形成“核心作者群(642人)”,這是HSK領(lǐng)域的不足,需要增加核心作者數(shù)量。
(三)從發(fā)文機(jī)構(gòu)分布和載文出版物分布來(lái)看,符合集中與離散的布拉德福定律,且可用邏輯斯蒂增長(zhǎng)函數(shù)表征。
總之,本文提出的HSK論文具有增長(zhǎng)性;作者具有廣泛性;發(fā)文機(jī)構(gòu)和載文出版物具有集中性;論文的表述具有規(guī)律性(指數(shù)規(guī)律、洛特卡定律、布拉德福定律);可以采用數(shù)學(xué)建模(指數(shù)函數(shù)、Logistic模型)的方法進(jìn)行分析,為HSK研究提供一種新的研究方法與思路。
參考文獻(xiàn):
[1]袁藝銘.淺析新漢語(yǔ)水平考試——口語(yǔ)測(cè)試[J].現(xiàn)代語(yǔ)文(語(yǔ)言研究版),2017,(10).
[2]國(guó)家漢辦漢語(yǔ)水平考試部.漢語(yǔ)水平詞匯與漢字等級(jí)大綱[Z].北京:北京語(yǔ)言學(xué)院出版社,1992.
[3]國(guó)家漢辦.漢語(yǔ)水平等級(jí)標(biāo)準(zhǔn)與語(yǔ)法等級(jí)大綱[Z].北京:高等教育出版社,1996.
[4]國(guó)家漢辦.國(guó)際漢語(yǔ)能力標(biāo)準(zhǔn)[M].北京:外語(yǔ)教學(xué)與研究出版社,2007.
[5]國(guó)家漢辦/孔子學(xué)院總部.漢語(yǔ)水平考試HSK(基礎(chǔ)、初中等、高等)大綱[Z].北京:商務(wù)印書館,2009.
[6]國(guó)家漢辦/孔子學(xué)院總部.新漢語(yǔ)水平考試大綱(一至六級(jí))[Z].北京:商務(wù)印書館,2013.
[7]張晉軍,解妮妮,王世華,李亞男,張鐵英.新漢語(yǔ)水平考試(HSK)研制報(bào)告[J].中國(guó)考試,2010,(9):38-43.
[8]國(guó)家漢辦.2016孔子學(xué)院年度發(fā)展報(bào)告[EB/OL].
http://www.hanban.edu.cn/report/2016.pdf.(2017-10-20).
[9]劉英林,郭樹軍,王志芳.漢語(yǔ)水平考試(HSK)
的性質(zhì)和特點(diǎn)[J].世界漢語(yǔ)教學(xué),1988,(2):110-120.
[10]楊翼.對(duì)外漢語(yǔ)測(cè)試與評(píng)估的歷史演變與發(fā)展趨勢(shì)[J].中國(guó)考試,2009,(1):35-40.
[11]高松.《新漢語(yǔ)水平考試大綱》詞匯等級(jí)表的名詞考察[J].現(xiàn)代語(yǔ)文(語(yǔ)言研究版),2014,(10).
[12]辛慧.留學(xué)生HSK漢語(yǔ)水平考試詞匯教學(xué)研究——以離合詞類為例[J].現(xiàn)代語(yǔ)文(學(xué)術(shù)綜和版),2017,(2).
[13]劉曉朦,高松.高級(jí)階段日本留學(xué)生漢字偏誤分析[J].現(xiàn)代語(yǔ)文(語(yǔ)言研究版),2013,(3).
[14]清華同方.CNKI數(shù)據(jù)庫(kù)[EB/OL].(2017-10-20),http://epub.cnki.net/grid2008/index/ZKCALD.htm.
[15]馬春雨.基于文獻(xiàn)計(jì)量的孔子學(xué)院研究[J].云南
師范大學(xué)學(xué)報(bào)(對(duì)外漢語(yǔ)教學(xué)與研究版),2017,(2).
[16]Sen BK.Lotka's Law:a viewpoint[J].Ann Lib Inf Stu,2010,(2):166-167.
[17]邱均平.信息計(jì)量學(xué)[M].武漢:武漢大學(xué)出版社,2007.
[18]Goffman W,MorrisTG.Bradford's law and library acquisitions[J].Nature,1970,(5249):922-923.
[19]蘭月新.基于動(dòng)態(tài)logistic模型的文獻(xiàn)增長(zhǎng)規(guī)律研究[J].科學(xué)情報(bào),2014,(3):86-89+97.
Research Status and Literature Characteristics of Chinese Proficiency Test(HSK)
Ma Chunyu
(School of Chinese Studies,Beijing Language University,Beijing 100083,China)
Abstract:By using statistics and mathematical modeling methods,This article analyses the literature on Chinese Proficiency Test(HSK)research that has been included in the CNKI database since 1988.The mathematical modeling is established in the annual distribution of the literature,the distribution of the authors,the distribution of institutions and the distribution of publications.Using Price's law and Bradford's law,49 core authors,9 core institutions and 15 core publications are calculated.This paper expounds thepresent status and development trend of HSK research, and the characteristics and rules of the literature are excavated to provide the basis and reference for the HSK bibliometric research.
Key words:Chinese Proficiency Test(HSK);Lotka's law;Bradford's law;Logistic model