薛云蘭
摘? 要: 隨著計(jì)算機(jī)技術(shù)的發(fā)展,大量的嶺南文化信息被記錄下來。而海量的嶺南文化信息卻難以被有效地利用。文章采用知識(shí)圖譜技術(shù)對(duì)嶺南文化信息進(jìn)行有效的語義抽取和融合,采用Citespace可視化分析軟件完成了對(duì)嶺南文化研究熱詞和趨勢(shì)的研究,為嶺南文化的人文歷史的研究提供了技術(shù)框架和研究方案。
關(guān)鍵詞: 嶺南文化; 知識(shí)圖譜; 熱詞分析; 知識(shí)演化
中圖分類號(hào):G202,G206? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A? ? ?文章編號(hào):1006-8228(2021)02-49-03
Abstract: With the development of computer technology, a large number of Lingnan cultural information has been recorded. However, the vast amount of Lingnan cultural information is difficult to be used effectively. This paper uses knowledge graph technology to carry out effective semantic extraction and fusion of Lingnan culture information, and uses CiteSpace visualized analysis software to complete the research on hot words as well as its trends of Lingnan culture, which provides the research of the humanistic history of Lingnan culture with a technical framework and research scheme.
Key words: Lingnan culture; knowledge graph; hot words analysis; knowledge evolution
0 引言
嶺南傳統(tǒng)文化作為廣東文化的重要名片,是廣東對(duì)外人文交流的重要組成部分。“一帶一路”倡議為廣東和嶺南傳統(tǒng)文化“走出去”提出了新的歷史使命。隨著互聯(lián)網(wǎng)+的飛速發(fā)展,海量數(shù)據(jù)的價(jià)值得以充分發(fā)揮,通過機(jī)器學(xué)習(xí),知識(shí)圖譜等技術(shù)來可視化嶺南文化的演化路徑是嶺南文化研究領(lǐng)域之一。充分挖掘嶺南文化的發(fā)展和演化,可以提高地域的影響力和關(guān)注熱度,充分發(fā)揮地域的人文經(jīng)濟(jì)有重要的價(jià)值和參考意義[1]?;ヂ?lián)網(wǎng)信息化的發(fā)展給文化信息研究提供了豐富多樣的軟件和工具,為了直觀的展示數(shù)據(jù),采用知識(shí)圖譜作為可視化工具來標(biāo)注嶺南文化每年的熱詞、熱詞的演化和熱詞之間的關(guān)聯(lián)關(guān)系。
知識(shí)圖譜,主要是為領(lǐng)域知識(shí)映射地圖,把知識(shí)之間的關(guān)聯(lián)關(guān)系和發(fā)展演化用圖形化的形式呈現(xiàn)出來。海量的信息被挖掘、清洗、抽取、標(biāo)注、融合、加工最后形成一個(gè)具有參考意義的領(lǐng)域知識(shí)圖譜,對(duì)于領(lǐng)域的研究和發(fā)展預(yù)測(cè)有一定的參考價(jià)值[2]。文獻(xiàn)計(jì)量學(xué)是基于數(shù)學(xué)和統(tǒng)計(jì)學(xué)的定量分析方法,以參考文獻(xiàn)為研究對(duì)象,然而知識(shí)圖譜是該領(lǐng)域中新的研究領(lǐng)域,長(zhǎng)期受到學(xué)者的關(guān)注并得到快速的發(fā)展[3-4]。
CiteSpace是目前最為廣泛應(yīng)用的圖譜繪制工具。事件的影響力分析、事件的演化路徑、演化趨勢(shì),熱點(diǎn)研究、行業(yè)領(lǐng)域、知識(shí)關(guān)聯(lián)、本體研究等都可以利用CiteSpace可視化工具有效的解決[5]。對(duì)嶺南文化研究領(lǐng)域的1500篇中文期刊文獻(xiàn)進(jìn)行梳理,繪制出知識(shí)圖譜,進(jìn)而挖掘嶺南文化研究的五大熱點(diǎn)主題:嶺南文化、地域文化、廣東、廣州、嶺南建筑等。通過對(duì)突現(xiàn)詞的檢測(cè)及分析,揭示出嶺南文化演化路徑及熱點(diǎn)主題的變化態(tài)勢(shì)。研究表明未來一段時(shí)期關(guān)于嶺南文化自信建設(shè)及粵港澳大灣區(qū)發(fā)展等主題將成為未來的研究熱點(diǎn)。
1 研究方法
知識(shí)圖譜中,點(diǎn)代表客觀事物,邊代表了事物的屬性或關(guān)系。CiteSpace就是基于共現(xiàn)聚類的思想,首先選取文獻(xiàn)中的信息,接下來憑借信息與信息之間的聯(lián)系類型和強(qiáng)度進(jìn)行網(wǎng)絡(luò)結(jié)構(gòu)重構(gòu),然后多角度進(jìn)行計(jì)算與統(tǒng)計(jì)分析,最后將結(jié)論進(jìn)行可視化。
1.1 數(shù)據(jù)清洗
對(duì)嶺南文化研究領(lǐng)域的1500篇核心期刊文獻(xiàn)進(jìn)行梳理,刪除和本研究領(lǐng)域關(guān)聯(lián)關(guān)系較弱的文獻(xiàn),以降低噪聲和冗余。
1.2 可視化分析
采用Citespace可視化軟件從中國知網(wǎng)對(duì)嶺南文化相關(guān)核心期刊文獻(xiàn)進(jìn)行采集和數(shù)據(jù)處理。中國知網(wǎng)對(duì)于摘要和年份等信息有直接導(dǎo)出模式,并且支持批量導(dǎo)出。選取其中一篇導(dǎo)出論文,其中內(nèi)容主要包括出處、作者、來源、題名、分類、年份、關(guān)鍵詞、出版號(hào)、摘要和語言等基本信息。這些規(guī)范、可讀性很高的信息對(duì)于我們進(jìn)行關(guān)鍵詞抽取分析是十分有幫助的[5]。
1.3 建立知識(shí)圖譜
在知識(shí)圖譜具體顯示嶺南文化研究概貌及結(jié)構(gòu)的基礎(chǔ)上,對(duì)每一熱門內(nèi)容進(jìn)行細(xì)化、觀測(cè)分析的解讀,能夠全面掌握研究熱點(diǎn)與動(dòng)態(tài)[6]。本文利用文獻(xiàn)計(jì)量和信息可視化的方法分析了嶺南文化領(lǐng)域的文章發(fā)表趨勢(shì)和主要研究機(jī)構(gòu);通過共詞分析、知識(shí)圖譜和戰(zhàn)略坐標(biāo)分析,探討新時(shí)期互聯(lián)網(wǎng)和大數(shù)據(jù)環(huán)境研究方法下,嶺南文化研究的發(fā)展特點(diǎn)和主題演化,為嶺南文化研究工作的開展提供參考。使用詞頻統(tǒng)計(jì)方法,從文章的多種屬性來量化分析文獻(xiàn)特征,這些屬性有文獻(xiàn)數(shù)量、文獻(xiàn)題目、作者、作者的機(jī)構(gòu)等。通過作者和機(jī)構(gòu)的共現(xiàn)關(guān)系,來構(gòu)建關(guān)于嶺南文化知識(shí)圖譜,采用聚類和分類方法來分析嶺南文化的熱點(diǎn)和趨勢(shì)問題。
⑴ 根據(jù)研究發(fā)文趨勢(shì)和Citespace分析結(jié)果,采用固定時(shí)間窗口的方法,將論文數(shù)據(jù)劃分為連續(xù)子時(shí)期。提取各子時(shí)期關(guān)鍵詞,并對(duì)同義詞進(jìn)行合并處理。利用共詞分析法,構(gòu)造各子時(shí)期高頻關(guān)鍵詞的共詞矩陣;運(yùn)用SPSS進(jìn)行關(guān)鍵詞系統(tǒng)聚類,識(shí)別各子時(shí)期研究主題[7]。
⑵ 基于各子時(shí)期關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò),計(jì)算各研究主題高頻關(guān)鍵詞的E相似度指數(shù):Sij=Wij/(Wi×Wj),其中,Wij表示關(guān)鍵詞i和關(guān)鍵詞j共同出現(xiàn)的次數(shù),Wi表示關(guān)鍵詞i在所有文獻(xiàn)中出現(xiàn)的次數(shù),Wj表示關(guān)鍵詞j在所有文獻(xiàn)中出現(xiàn)的次數(shù)。
⑶ 知識(shí)圖譜以X軸和Y軸二維圖展示,用圓形表示熱詞,圓形的面積大小和熱詞的文章數(shù)量成正相關(guān),我們通過圓形的大小量化嶺南文化每個(gè)熱度的影響力,通過各個(gè)圓點(diǎn)之間的聯(lián)系邊呈現(xiàn)熱詞的演化路徑,對(duì)于嶺南文化的演化有非常大的參考價(jià)值和指導(dǎo)意義。
2 研究熱點(diǎn)與趨勢(shì)分析
2.1 關(guān)鍵詞共現(xiàn)分析
本文檢索了1994年至2019年共計(jì)1500篇關(guān)于嶺南文化的文獻(xiàn)。將這些數(shù)據(jù)導(dǎo)出后保存為純文本,用陳超美教授開發(fā)的CiteSpace軟件對(duì)這些數(shù)據(jù)進(jìn)行圖譜繪制,進(jìn)行進(jìn)一步的分析。
節(jié)點(diǎn)大小代表該節(jié)點(diǎn)詞頻的高低,節(jié)點(diǎn)越大代表詞頻越高,其中的不同顏色分別表示不同的年份,由1994年到2019年,有暖色調(diào)像冷色調(diào)轉(zhuǎn)變。圖譜中的節(jié)點(diǎn)大小代表嶺南文化熱點(diǎn)研究的影響力,連線的粗細(xì)代表其聯(lián)系強(qiáng)度。由圖1可見,廣東節(jié)點(diǎn)最大且居圖譜中心位置,表明其為研究的核心在該領(lǐng)域的影響力最大。廣州、廣府文化、嶺南等節(jié)點(diǎn)較大且位居中心位置,構(gòu)成了該領(lǐng)域的研究熱點(diǎn)。
2.2 文獻(xiàn)主題變遷分析
“圖譜”是指進(jìn)過系統(tǒng)編輯并根據(jù)實(shí)物描述或攝制的圖,是研究某一學(xué)科所用的資料?!皥D譜”中的“圖”指地圖,“譜”指系統(tǒng)。圖與譜合一則是空間與時(shí)間動(dòng)態(tài)變化的統(tǒng)一表述。圖譜主要表現(xiàn)事物和現(xiàn)象的形態(tài)結(jié)構(gòu)、成因機(jī)制、組成物質(zhì)、動(dòng)態(tài)變化等綜合性、復(fù)雜性規(guī)律,往往以系列圖的形式表示時(shí)空動(dòng)態(tài)變化。隨著科學(xué)計(jì)量學(xué)從數(shù)學(xué)表達(dá)方式揭示科學(xué)知識(shí)及其活動(dòng)規(guī)律,轉(zhuǎn)向圖形表達(dá)方式,形成了最初的知識(shí)圖譜。
從圖2可以看出從二十一世紀(jì)九十年代開始到2019年,嶺南文化研究熱點(diǎn)的變化趨勢(shì),從廣東、嶺南學(xué)、廣東人逐步發(fā)展到文化自信和粵港澳大灣區(qū)。這些研究的關(guān)鍵詞之間的關(guān)聯(lián)關(guān)系可以給將來的進(jìn)一步研究提供很好的參考價(jià)值和預(yù)測(cè)估計(jì)。
2.3 關(guān)鍵詞突現(xiàn)分析
從圖3可以看出從二十一世紀(jì)九十年代開始到2019年,在2007年到2010年間嶺南文化關(guān)于嶺南學(xué)的研究熱度最高,熱度其次的是1994-1999的嶺南文化關(guān)于嶺南地區(qū)研究,1994-2000的嶺南文化關(guān)于廣東的研究,2001-2002的嶺南文化研究以及2008-2010關(guān)于嶺南文化的構(gòu)建研究。逐漸發(fā)展到近期的研究熱度新高的2014-2017的新嶺南文化的研究、文化自信的研究。根據(jù)圖3,我們不僅能看到嶺南文化研究的趨勢(shì),還能統(tǒng)計(jì)出熱點(diǎn)研究維持的熱度及其影響力。
3 結(jié)束語
嶺南文化研究自1994年起步以來,受關(guān)注度不斷增強(qiáng),發(fā)文整體呈增長(zhǎng)趨勢(shì),2010年后發(fā)文基本穩(wěn)定,領(lǐng)域發(fā)展趨于成熟。知識(shí)管理是嶺南文化研究領(lǐng)域基礎(chǔ)的、具有發(fā)展?jié)摿Φ难芯糠较颉,F(xiàn)代信息環(huán)境下衍生出與知識(shí)服務(wù)相結(jié)合的知識(shí)圖譜、關(guān)聯(lián)數(shù)據(jù)、可視化及前沿?zé)狳c(diǎn)研究等處于成長(zhǎng)狀態(tài)的熱點(diǎn)主題。新技術(shù)環(huán)境下,實(shí)現(xiàn)知識(shí)管理模式的轉(zhuǎn)型與優(yōu)化,將成為嶺南文化研究知識(shí)服務(wù)研究的一個(gè)重要主題。
參考文獻(xiàn)(References):
[1] 段園園,林樹文,黃金澤,曾玉榮.知識(shí)圖譜視角下我國農(nóng)業(yè)政策研究的演化發(fā)展及熱點(diǎn)分析[J].南方農(nóng)業(yè)學(xué)報(bào),2018.49(1).
[2] 張曉林.走向知識(shí)服務(wù):尋找新世紀(jì)圖書情報(bào)工作的生長(zhǎng)點(diǎn)[J].中國圖書館學(xué)報(bào),2000.5:30-35
[3] 邱均平,王曰芬.文獻(xiàn)計(jì)量?jī)?nèi)容分析法[M].國家圖書館出版社,2008.
[4] 陳悅,陳超美等.CiteSpace知識(shí)圖譜的方法論功能[J].科學(xué)學(xué)研究,2015.2:242-253
[5] 陳悅,陳超美等.引文空間分析原理與應(yīng)用[M].科學(xué)出版社,2014.
[6] 吳賓,唐薇.基于知識(shí)圖譜的國內(nèi)養(yǎng)老政策研究熱點(diǎn)主題與演化路徑(2005-2016)人口與發(fā)展[J].人口與發(fā)展,2018.24(2).
[7] 詹婧,張仁瓊.基于文獻(xiàn)計(jì)量的圖書館MOOC研究[J].圖書館學(xué)刊,2017.39(8):106-113