郭棟,童元元,黃生權(quán),邢鵬,趙英凱.無(wú)限極(中國(guó))有限公司,廣東 廣州 5067;.中國(guó)中醫(yī)科學(xué)院中醫(yī)藥信息研究所,北京 00700
基于數(shù)據(jù)挖掘的枸杞研究熱點(diǎn)分析
郭棟1,童元元2,黃生權(quán)1,邢鵬2,趙英凱2
1.無(wú)限極(中國(guó))有限公司,廣東 廣州 510627;2.中國(guó)中醫(yī)科學(xué)院中醫(yī)藥信息研究所,北京 100700
目的 揭示我國(guó)枸杞育種、種植、采收、加工、儲(chǔ)存5個(gè)領(lǐng)域的研究現(xiàn)狀及熱點(diǎn)。方法 計(jì)算機(jī)檢索中國(guó)知識(shí)資源總庫(kù)(CNKI)2004年1月—2013年12月枸杞育種、種植、采收、加工、儲(chǔ)存等領(lǐng)域相關(guān)文獻(xiàn),采用可視化統(tǒng)計(jì)軟件 CiteSpaceⅡ進(jìn)行關(guān)鍵詞分析,獲取高頻關(guān)鍵詞、高頻關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)和高頻詞聚類(lèi)圖。結(jié)果 共納入文獻(xiàn)759篇。枸杞育種方面高頻關(guān)鍵詞有“遺傳多樣性”“雄性不育”“its序列”“愈傷組織”“花藥培養(yǎng)”等,種植方面高頻關(guān)鍵詞有“產(chǎn)量”“品質(zhì)”“硬枝扦插”“灌水量”等,采收和加工方面高頻關(guān)鍵詞有“枸杞采摘機(jī)”“枸杞烘干窯”“熱風(fēng)干燥”“組合干燥”等,儲(chǔ)存方面高頻關(guān)鍵詞有“農(nóng)藥殘留”“重金屬”“殘留量”“有機(jī)磷農(nóng)藥”等。枸杞儲(chǔ)存高頻關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)表明研究熱點(diǎn)為農(nóng)藥殘留、重金屬的檢測(cè)以及鮮果的儲(chǔ)存方面,而枸杞儲(chǔ)存高頻詞共現(xiàn)聚類(lèi)圖則提示聚類(lèi)規(guī)模依次為“包裝”“保鮮”“枸杞多糖”等。結(jié)論 枸杞種植的研究熱點(diǎn)主要側(cè)重于影響枸杞產(chǎn)量和品質(zhì)的栽種技術(shù);在采收和加工領(lǐng)域,代替?zhèn)鹘y(tǒng)手工采摘的采摘機(jī)設(shè)計(jì)、研發(fā)已成為關(guān)注熱點(diǎn),現(xiàn)代熱風(fēng)干燥已基本取代傳統(tǒng)的曬干或烘干手段;在儲(chǔ)存方面,有關(guān)保鮮技術(shù)的研究已引起關(guān)注。
枸杞;高頻關(guān)鍵詞;可視化;CiteSpace
DOl:10.3969/j.issn.1005-5304.2016.09.012
枸杞營(yíng)養(yǎng)豐富而獨(dú)特,隨著其保健功效在西方國(guó)家得到認(rèn)可,枸杞開(kāi)始逐漸由傳統(tǒng)的亞洲市場(chǎng)進(jìn)入歐美等國(guó)家[1],相關(guān)引種栽培技術(shù)研究也日益受到關(guān)注[2-6]。為了更加準(zhǔn)確地了解枸杞在育種、種植、采收、加工、儲(chǔ)存等領(lǐng)域的研究現(xiàn)狀,把握動(dòng)態(tài)和關(guān)注熱點(diǎn),本研究采用可視化軟件CiteSpaceⅡ?qū)?0年發(fā)表于國(guó)內(nèi)科技期刊的相關(guān)文獻(xiàn)進(jìn)行分析,以期為枸杞的研究、生產(chǎn)和利用提供參考。
1.1數(shù)據(jù)來(lái)源
計(jì)算機(jī)檢索中國(guó)知識(shí)資源總庫(kù)(CNKI),以“枸杞”為主題詞,同時(shí)分別限定主題詞為“育種”“種植”“采收”“加工”“儲(chǔ)存”,檢索范圍為 2004年1月-2013年12月。
1.2納入及排除標(biāo)準(zhǔn)
納入與枸杞育種、種植、采收、加工、儲(chǔ)存等研究相關(guān)的期刊論文。排除會(huì)議通知、機(jī)構(gòu)介紹、人物訪談、稿件征訂等無(wú)關(guān)的內(nèi)容。
1.3數(shù)據(jù)分析
采用CiteSpaceⅡ?qū){入的文獻(xiàn)進(jìn)行關(guān)鍵詞分析,分別獲取有關(guān)枸杞育種、種植、采收、加工、儲(chǔ)存等5個(gè)方面的高頻關(guān)鍵詞,計(jì)算每個(gè)高頻詞間關(guān)聯(lián)強(qiáng)度大小,根據(jù)聚類(lèi)算法設(shè)定類(lèi)別,以不同顏色的蹼表示不同類(lèi)別,并且顯示類(lèi)別的中心,以及類(lèi)別中自然高頻詞匯。形成高頻關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)和高頻詞聚類(lèi)圖。CiteSpace是美國(guó)德雷塞爾大學(xué)陳超美博士及其團(tuán)隊(duì)開(kāi)發(fā)的信息可視統(tǒng)計(jì)化軟件,屬于多元、分時(shí)、動(dòng)態(tài)的第二代信息可視化技術(shù)[7],可用于分析和顯示一個(gè)學(xué)科或知識(shí)域在一定時(shí)期發(fā)展的趨勢(shì)與動(dòng)態(tài),形成若干研究前沿領(lǐng)域的演進(jìn)歷程。
關(guān)鍵詞是一種未經(jīng)規(guī)范的自然語(yǔ)言,關(guān)鍵詞的高頻出現(xiàn),代表著相關(guān)學(xué)科或?qū)W術(shù)領(lǐng)域?qū)υ搯?wèn)題的高度關(guān)注。高頻關(guān)鍵詞共現(xiàn)分析可發(fā)現(xiàn)某一學(xué)科或領(lǐng)域的研究熱點(diǎn),高頻關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)可間接反映文獻(xiàn)中所分布的熱點(diǎn)研究詞匯[8]。
標(biāo)簽Log-likelihood ratio(LLR)根據(jù)概率密度函數(shù)決定最大可能詞,強(qiáng)調(diào)研究特點(diǎn);標(biāo)簽 Mutual information(MI)可根據(jù)對(duì)兩個(gè)隨機(jī)事件相關(guān)性的度量來(lái)找出明確合適的詞。
共納入相關(guān)研究文獻(xiàn)759篇,其中主要涉及育種74篇、種植500篇、采收58篇、加工炮制32篇、儲(chǔ)存95篇。
2.1枸杞研究文獻(xiàn)的時(shí)間分布
相關(guān)文獻(xiàn)量的時(shí)間變化可反映或顯示一個(gè)學(xué)科或領(lǐng)域在一定時(shí)期發(fā)展的趨勢(shì)與動(dòng)向。圖1表明,有關(guān)枸杞種植方面研究文獻(xiàn)10年期間保持了較高的發(fā)文量,年平均發(fā)文50篇,特別是2008年之后,發(fā)文量持續(xù)增長(zhǎng),顯示枸杞的種植技術(shù)日益受到關(guān)注;而10年來(lái)關(guān)于枸杞加工的年平均發(fā)文量?jī)H為3.2篇,表明枸杞的加工技術(shù)與方法已相對(duì)穩(wěn)定。
圖1 2004-2013年枸杞各領(lǐng)域研究文獻(xiàn)發(fā)文量分布情況
2.2枸杞研究文獻(xiàn)的熱點(diǎn)詞匯分析
分析結(jié)果顯示,枸杞育種領(lǐng)域的高頻關(guān)鍵詞主要涉及“遺傳多樣性”“雄性不育”“its序列”“愈傷組織”“花藥培養(yǎng)”等,見(jiàn)表1。反映了近10年在枸杞育種研究中受關(guān)注度較高的研究?jī)?nèi)容主要涉及枸杞的自然變異選優(yōu)、雜交育種和生物技術(shù)培育等方面。
枸杞種植領(lǐng)域的高頻關(guān)鍵詞主要涉及“產(chǎn)量”“品質(zhì)”“硬枝扦插”“灌水量”等相關(guān)技術(shù),見(jiàn)表2。其中硬枝扦插是近10年來(lái)持續(xù)關(guān)注的一種育苗新技術(shù),其最大優(yōu)點(diǎn)是繁殖率高,節(jié)省種條和土地,扦插成活率一般可達(dá)到90%以上。
表1 近10年枸杞育種領(lǐng)域前10位高頻關(guān)鍵詞
表2 近10年枸杞種植領(lǐng)域前10位高頻關(guān)鍵詞
枸杞采收和加工領(lǐng)域的高頻關(guān)鍵詞見(jiàn)表3、表4,相關(guān)研究熱點(diǎn)主要集中于“枸杞采摘機(jī)”的研制與試驗(yàn),以及“枸杞烘干窯”“熱風(fēng)干燥”“組合干燥”等加工技術(shù),其中熱風(fēng)干燥是目前應(yīng)用較為普遍的干燥技術(shù)。
表3 近10年枸杞采收領(lǐng)域前10位高頻關(guān)鍵詞
表4 近10年枸杞加工領(lǐng)域前10位高頻關(guān)鍵詞
枸杞鮮果易腐爛,傳統(tǒng)上主要通過(guò)各種干燥方法將枸杞果實(shí)中的水分含量降至 7%以下,以延長(zhǎng)枸杞的保存時(shí)間。表5表明,有關(guān)枸杞儲(chǔ)存的前10個(gè)關(guān)鍵詞頻次均高于4次,略高于枸杞育種、種植、采收和加工領(lǐng)域,頻次較高的關(guān)鍵詞分別為“農(nóng)藥殘留”“重金屬”“殘留量”“有機(jī)磷農(nóng)藥”等。而相對(duì)于傳統(tǒng)的枸杞干燥入藥和相關(guān)儲(chǔ)存方式,“枸杞鮮果”是一個(gè)相當(dāng)獨(dú)特的存在,顯示枸杞鮮果儲(chǔ)存的相關(guān)技術(shù)研究和應(yīng)用已逐漸引起關(guān)注。
表5 近10年枸杞儲(chǔ)存領(lǐng)域前10位高頻關(guān)鍵詞
枸杞儲(chǔ)存領(lǐng)域的高頻關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)見(jiàn)圖2。同樣表明研究熱點(diǎn)主要集中在枸杞農(nóng)藥殘留、重金屬的檢測(cè)以及枸杞鮮果的儲(chǔ)存方面。而枸杞儲(chǔ)存高頻詞共現(xiàn)聚類(lèi)圖則提示聚類(lèi)規(guī)模依次為“包裝”“保鮮”“枸杞多糖”等,見(jiàn)圖3。其中最大的聚類(lèi)“包裝”(#0)的形成年份是2008年,輪廓值為0.91,類(lèi)成員23個(gè),LLR涉及“貯藏”“氧濃度”“薄膜”等,MI涉及“原汁”“殺菌”“生物活性成分”等。第二大聚類(lèi)“保鮮”(#1)的形成年份是2009年,輪廓值為0.81,類(lèi)成員22個(gè),LLR涉及“仿生膠”“物理防治”“保鮮液”等,MI同樣為“原汁”“殺菌”“生物活性成分”等。
圖2 枸杞儲(chǔ)存領(lǐng)域高頻關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖
圖3 枸杞儲(chǔ)存領(lǐng)域高頻詞共現(xiàn)聚類(lèi)圖
依據(jù)齊普夫定律,關(guān)鍵詞或主題詞在某一研究領(lǐng)域文獻(xiàn)中出現(xiàn)的頻次可反映該領(lǐng)域研究熱點(diǎn)和發(fā)展動(dòng)向。關(guān)鍵詞共現(xiàn)分析方法則建立在下述假設(shè)的基礎(chǔ)之上,即作者都很認(rèn)真地選擇所使用的詞語(yǔ),作者認(rèn)可在同一篇文章中不同的詞語(yǔ)之間存在某種聯(lián)系,并且如果這種聯(lián)系被足夠多的作者認(rèn)可,則可以認(rèn)為它在某個(gè)學(xué)科領(lǐng)域具有一定的意義[9]。
本研究利用 CiteSpaceⅡ?qū)?2004-2013年發(fā)表的 759篇枸杞相關(guān)研究文獻(xiàn)中的關(guān)鍵詞頻次和關(guān)鍵詞共現(xiàn)進(jìn)行了熱點(diǎn)詞語(yǔ)分析,探討了近10年來(lái)枸杞在育種、種植、采收、加工、儲(chǔ)存等領(lǐng)域的常用技術(shù)和關(guān)注熱點(diǎn)。結(jié)果表明,枸杞育種長(zhǎng)期以來(lái)采用自然變異選優(yōu)、雜交育種方式較多,生物育種尚處于起步階段[10-11]。枸杞種植的研究熱點(diǎn)主要側(cè)重于影響枸杞產(chǎn)量和品質(zhì)的栽種技術(shù),生態(tài)調(diào)控下的病蟲(chóng)害綜合防治技術(shù)與水肥調(diào)控技術(shù)依舊是目前的研究重點(diǎn)。在枸杞采收和加工領(lǐng)域,代替?zhèn)鹘y(tǒng)手工采摘的采摘機(jī)設(shè)計(jì)、研發(fā)已成為關(guān)注熱點(diǎn)[12-13],現(xiàn)代熱風(fēng)干燥已基本取代傳統(tǒng)的曬干或烘干手段。在枸杞儲(chǔ)存方面,因其主要以制干入藥為主,枸杞鮮果市場(chǎng)一直未能開(kāi)拓,有關(guān)枸杞保鮮技術(shù)的研究已引起關(guān)注[14]。
枸杞是一種具有較大經(jīng)濟(jì)價(jià)值的特種經(jīng)濟(jì)作物,隨著枸杞醫(yī)藥、保健和營(yíng)養(yǎng)功能的進(jìn)一步明確和需求的不斷增加,人們對(duì)枸杞的研究范圍日益擴(kuò)大,對(duì)枸杞育種、種植、采收、加工、儲(chǔ)存等相關(guān)基本要素的研究也進(jìn)一步深入,技術(shù)操作日趨規(guī)范、成熟。
[1]利河伯,姜麗.枸杞出口趨勢(shì)分析[J].中國(guó)現(xiàn)代中藥,2014,16(3):244-246.
[2]潘艷麗,唐明敏,劉洋,等.枸杞子質(zhì)量控制成分遴選研究[J].國(guó)際中醫(yī)中藥雜志,2014,36(8):726-730.
[3]李小亭,李瑞盈,相海恩,等.基于 HPLC指紋圖譜及聚類(lèi)分析對(duì)不同產(chǎn)地枸杞質(zhì)量評(píng)價(jià)研究[J].現(xiàn)代食品科技,2012,28(9):1251-1253,1261.
[4]南亞昀,雍學(xué)芳,王禮星,等.枸杞多糖藥理學(xué)研究進(jìn)展[J].天津中醫(yī)藥,2014,31(12):763-765.
[5]徐艷,原振江.球面對(duì)稱(chēng)設(shè)計(jì)法研究纖維素酶對(duì)枸杞子中枸杞總糖提取率的影響[J].中國(guó)中醫(yī)藥信息雜志,2006,13(8):46-47.
[6]趙世印,雷飛飛,譚華炳.枸杞多糖對(duì)非酒精性脂肪性肝病模型大鼠血脂代謝的影響[J].國(guó)際中醫(yī)中藥雜志,2015,37(4):331-334.
[7]陳超美.CiteSpace Ⅱ:科學(xué)文獻(xiàn)中新趨勢(shì)與新動(dòng)態(tài)的識(shí)別與可視化[J].陳悅,侯劍華,梁永霞,譯.情報(bào)學(xué)報(bào),2009,28(3):401-421.
[8]楊?lèi)?ài)青.我國(guó)圖書(shū)情報(bào)學(xué)科研究態(tài)勢(shì)的可視化研究[D].曲阜:曲阜師范大學(xué),2012.
[9]QING H. Knowledge discovery through co-word analysis[J]. Library Trends,1999,48(1):133-159.
[10]樊云芳,陳曉軍,李彥龍,等.寧夏枸杞DFR基因的克隆與序列分析[J].西北植物學(xué)報(bào),2011,31(12):2373-2379.
[11]馮遠(yuǎn)航,王罡,季靜,等.枸杞LmP5CS基因的克隆及表達(dá)分析[J].中國(guó)生物工程雜志,2013,33(1):33-40.
[12]何軍,李曉鶯,曹有龍,等.便攜式枸杞采摘機(jī)對(duì)枸杞樹(shù)的要求[J].北方園藝,2012(1):161-162.
[13]武兵強(qiáng),周鳳廷,陳慶峰,等.枸杞采摘器的設(shè)計(jì)[J].新疆農(nóng)業(yè)科技,2013(5):46-47.
[14]李樹(shù)萍.寧夏枸杞鮮果保鮮技術(shù)的研究[D].銀川:寧夏大學(xué),2011.
Analysis on the Research Hotspots of Lycium L. Based on Data Mining
GUO Dong1,TONG Yuan-yuan2, HUANG Sheng-quan1, XING Peng2, ZHAO Ying-kai2(1. Infinitus (China) Company Limited,Guangzhou 510627, China; 2. Institute of Information on TCM, China Academy of Chinese Medical Sciences, Beijing 100700, China)
Objective To discuss the research status and hotspots related to breeding, planting, harvest,processing and storage of Lycium L. in China. Methods Relevant literature about breeding, planting, harvest,processing and storage of Lycium L. in CNKI from January 2004 to December 2013 was retrieved by computers. CiteSpaceⅡwas introd uced to carry out key word analysis, high-frequency key word obtaining, co-occurrence network of high-frequency key words, and dendrogram of high-frequency words. Results Totally 759 articles were included. Key words about breeding were “genetic diversity”, “male sterile”, “its sequence”, “callus issue”, and “anther culture”. Key words about planting were “output”, “quality”, “hard twig cuttage”, “irrigation amount”. Key words about harvesting and processing were “picking machine of Lycium L.”, “drying kiln of Lycium L.”, “hot air drying”, and “combined drying”. Key words about storage were “pesticide residue”, “heavy metal”, and “organophosphorus pesticide”. Co-occurrence network of high-frequency key words showed that the research hotspots were pesticide residue, test of heavy metal and the storage of fresh fruits. Dendrogram of high-frequency key words showed that the high-frequency key words were “package”, “refreshment”, and “l(fā)ycium barbarum polysaccharide”. Conclusion The research hotspots of planting of Lycium L. are planting skills effecting the output and quality of Lycium L.; In the field of harvesting and processing of Lycium L., design and research of picking machine has replaced traditional manual picking. Modern hot air drying has already replaced traditional drying in the sun or drying skills; In the aspect of storage of Lycium L., the study on the refreshment of Lycium L. has attached attention.
Lycium L.; high-frequency key words; visualization; CiteSpace
R2-05
A
1005-5304(2016)09-0048-04
趙英凱,E-mail:g3651@hotmail.com
2015-11-16;編輯:向宇雁)