劉亞文,張紅燕,陽(yáng)靈燕
(湖南農(nóng)業(yè)大學(xué) 信息與智能科學(xué)技術(shù)學(xué)院,長(zhǎng)沙 410128)
生物信息學(xué)(Bioinformatics)是一門由生命科學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)、物理學(xué)和化學(xué)等學(xué)科交叉而形成的前沿學(xué)科,其研究?jī)?nèi)容涵蓋了大規(guī)模的基因組、轉(zhuǎn)錄組、蛋白質(zhì)組等多個(gè)組學(xué)層次的各自及整合性研究,應(yīng)用領(lǐng)域也覆蓋了生物、醫(yī)學(xué)、藥學(xué)、農(nóng)學(xué)、環(huán)境監(jiān)測(cè)等多個(gè)領(lǐng)域[1]。生物信息學(xué)發(fā)展史可分為3個(gè)主要階段[2]:(1)前基因組時(shí)代(50~80年代)是基本生物信息學(xué)理論、方法、模型和軟件體系形成階段;(2)基因組時(shí)代(80年代末~2003年),人類基因組計(jì)劃的實(shí)施進(jìn)一步推動(dòng)生物信息學(xué)的發(fā)展;(3)后基因組時(shí)代(2003年-至今)的核心內(nèi)容之一是充分利用大量生物數(shù)據(jù)挖掘其生物信息和規(guī)律。作為一門新興學(xué)科,生物信息學(xué)領(lǐng)域的研究文獻(xiàn)逐年增加,這些文獻(xiàn)客觀記錄了該領(lǐng)域的發(fā)展概貌,開展相關(guān)文獻(xiàn)分析以了解生物信息學(xué)領(lǐng)域的研究現(xiàn)狀和研究熱點(diǎn),對(duì)把握其未來的發(fā)展趨勢(shì)意義重大。目前,已有不少學(xué)者開展了文獻(xiàn)分析在生物信息學(xué)領(lǐng)域中的應(yīng)用研究,如宋茂海等基于CNKI、中華醫(yī)學(xué)會(huì)數(shù)據(jù)庫(kù)采用共詞分析和可視化方法探討了生物信息學(xué)領(lǐng)域的學(xué)科分類和熱點(diǎn)內(nèi)容[3];王俊等基于大數(shù)據(jù)背景,從迅速發(fā)展、主要研究模塊、基礎(chǔ)背景等方面分析了生物信息學(xué)的研究現(xiàn)狀[4];王蕊等基于Web of science數(shù)據(jù)庫(kù)分析了生物信息學(xué)數(shù)據(jù)庫(kù)研究的發(fā)展趨勢(shì)[5]。但利用文獻(xiàn)計(jì)量分析和關(guān)鍵詞共詞分析,同時(shí)基于CNKI中文數(shù)據(jù)庫(kù)和Web of science外文數(shù)據(jù)庫(kù)來對(duì)比分析國(guó)內(nèi)外生物信息學(xué)領(lǐng)域研究的相關(guān)報(bào)道卻極其鮮見。
當(dāng)兩個(gè)或兩個(gè)以上的關(guān)鍵詞同時(shí)出現(xiàn)在同一篇文獻(xiàn)中時(shí),則稱之存在共現(xiàn)關(guān)系[6]。這種共現(xiàn)關(guān)系的緊密程度體現(xiàn)在關(guān)鍵詞共現(xiàn)的頻次上。關(guān)鍵詞共詞分析通過捕捉關(guān)鍵詞關(guān)系,分析它們所代表的學(xué)科和主題的結(jié)構(gòu)變化,來跟蹤該研究領(lǐng)域的研究熱點(diǎn),揭示其研究主題的演變過程[7]。本文以國(guó)內(nèi)外生物信息學(xué)領(lǐng)域相關(guān)論文為研究對(duì)象,利用R語(yǔ)言編程工具,對(duì)文獻(xiàn)進(jìn)行計(jì)量分析、關(guān)鍵詞共詞聚類分析,并以圖文展示了國(guó)內(nèi)和國(guó)際生物信息領(lǐng)域的研究熱點(diǎn)與發(fā)展趨勢(shì),以期為我國(guó)生物信息學(xué)領(lǐng)域科研人員的后續(xù)研究提供參考。
采用的國(guó)內(nèi)文獻(xiàn)來源于CNKI數(shù)據(jù)庫(kù),以“生物信息學(xué)”為主題詞進(jìn)行檢索,選擇全部期刊文獻(xiàn),共檢索到1996~2018年共23年相關(guān)期刊論文6 893篇;國(guó)際文獻(xiàn)來源于Web of science數(shù)據(jù)庫(kù),以“bioinformatics”為主題詞進(jìn)行檢索,選擇核心合集論文,共檢索到2007~2018年共12年相關(guān)SCI收錄論文32 406篇。數(shù)據(jù)均于2019年1月采集。
1.2.1 數(shù)據(jù)預(yù)處理
數(shù)據(jù)預(yù)處理主要通過利用R語(yǔ)言編程環(huán)境(RStudio Version 3.5.1)編寫R程序?qū)υ紨?shù)據(jù)進(jìn)行數(shù)據(jù)清洗,數(shù)據(jù)清洗包括刪除作者為空的文獻(xiàn)記錄、刪除關(guān)鍵字為空的文獻(xiàn)記錄等操作,清洗處理后最終得到中文文獻(xiàn)6 717條記錄,外文文獻(xiàn)30 160條記錄。
1.2.2 高頻關(guān)鍵詞提取
預(yù)處理后的數(shù)據(jù)包含多個(gè)字段,CNKI文獻(xiàn)數(shù)據(jù)中包含的字段有Title(標(biāo)題)、Author(作者)、Keyword(關(guān)鍵詞)、Summary(摘要)、Year(年份)等,Web of science文獻(xiàn)數(shù)據(jù)中包含的字段有AU(作者)、TI(標(biāo)題)、PY(出版年)、AB(摘要)、DE(作者添加的關(guān)鍵詞)、ID(Web of science根據(jù)文章內(nèi)容增加的關(guān)鍵詞)等。無論是中文文獻(xiàn)還是外文文獻(xiàn),本文用于處理分析的主要是年份字段和關(guān)鍵詞字段。其中,國(guó)際文獻(xiàn)的關(guān)鍵詞字段有作者關(guān)鍵詞“DE”和WOS增加的關(guān)鍵詞“ID”,考慮到“ID”更具客觀性,故選用“ID”關(guān)鍵詞字段為后續(xù)分析所用。
年份字段主要應(yīng)用于文獻(xiàn)的計(jì)量分析和熱點(diǎn)變遷的分段研究,關(guān)鍵詞字段則主要用于研究熱點(diǎn)和研究主題的提取。通常一個(gè)關(guān)鍵詞字段會(huì)包含多個(gè)以“,”或“;”分隔開的關(guān)鍵詞,我們先采用R語(yǔ)言擴(kuò)展包tidytext中的unnest_tokens函數(shù)來提取關(guān)鍵詞;接著將其中的同義關(guān)鍵詞合并,如:關(guān)鍵詞“mirna”和“microrna”合并為“mirna”;最后,統(tǒng)計(jì)關(guān)鍵詞詞頻,并按頻次由高到低排序,得到關(guān)鍵詞詞頻表,并從中選取頻次較高的前n個(gè)關(guān)鍵詞作為高頻關(guān)鍵詞。
1.2.3 共詞分析
將高頻關(guān)鍵詞兩兩配對(duì),構(gòu)造高頻關(guān)鍵詞共現(xiàn)矩陣,矩陣中的元素為兩兩關(guān)鍵詞的共現(xiàn)次數(shù)。進(jìn)一步,以共現(xiàn)矩陣為基礎(chǔ),構(gòu)建關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)。具體而言,共現(xiàn)網(wǎng)絡(luò)以n個(gè)高頻關(guān)鍵詞為網(wǎng)絡(luò)節(jié)點(diǎn),當(dāng)兩個(gè)關(guān)鍵詞之間的共現(xiàn)次數(shù)大于等于k次時(shí),兩個(gè)關(guān)鍵詞節(jié)點(diǎn)間存在連線。
在共詞分析中,n和k的設(shè)置并無統(tǒng)一標(biāo)準(zhǔn)。高頻關(guān)鍵詞選取過多或是共現(xiàn)次數(shù)設(shè)置過小將導(dǎo)致所得研究熱點(diǎn)過于寬泛,而高頻關(guān)鍵詞選取過少或是共現(xiàn)次數(shù)設(shè)置過大將導(dǎo)致所得研究熱點(diǎn)缺乏代表性。綜合考慮文獻(xiàn)數(shù)量和關(guān)鍵詞詞頻情況,最終設(shè)置n=40、k=3,即選取前40個(gè)高頻關(guān)鍵詞用于構(gòu)建共現(xiàn)矩陣,共現(xiàn)次數(shù)大于等于3次設(shè)置網(wǎng)絡(luò)連線。
1.2.4 聚類分析
基于關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)利用R中的cluster_louvain函數(shù)創(chuàng)建可視化聚類圖,并對(duì)其展開聚類分析。cluster_louvain函數(shù)采用的是Louvain聚類算法,即通過計(jì)算相鄰節(jié)點(diǎn)間的模塊度增量,實(shí)現(xiàn)節(jié)點(diǎn)間的動(dòng)態(tài)聚合[8]。Louvain算法快速、準(zhǔn)確,被公認(rèn)為性能最好的社區(qū)發(fā)現(xiàn)算法之一。節(jié)點(diǎn)中心度是社會(huì)網(wǎng)絡(luò)分析的量化指標(biāo)之一,中心度高的節(jié)點(diǎn)通常是較為關(guān)鍵的研究熱點(diǎn)[9]。特征向量中心度更是把相鄰節(jié)點(diǎn)的中心度也考慮在內(nèi)[10]。通過分析聚類網(wǎng)絡(luò)圖和特征向量中心度,找出每類的核心關(guān)鍵詞及主要特征,進(jìn)而挖掘出生物信息學(xué)領(lǐng)域的研究熱點(diǎn)及發(fā)展趨勢(shì)。
對(duì)1996~2018年CNKI數(shù)據(jù)庫(kù)中生物信息學(xué)相關(guān)的期刊論文量進(jìn)行統(tǒng)計(jì),利用R軟件中的plot函數(shù)繪制文獻(xiàn)量年變化趨勢(shì)圖,如圖1所示。從圖中可以看出相近年份間文獻(xiàn)量略微有些波動(dòng),但總體上文獻(xiàn)量呈增長(zhǎng)趨勢(shì)。這也從一定程度上反映了我國(guó)生物信息學(xué)的發(fā)展處于持續(xù)上升的成長(zhǎng)期。
圖1 1996~2018國(guó)內(nèi)生物信息學(xué)文獻(xiàn)量變化趨勢(shì)圖Fig.1 Trend of domestic bioinformatics literature quantity between 1996 and 2018
關(guān)鍵詞是某一研究主題的提煉和對(duì)文章核心思想的高度概括[11]。通過對(duì)關(guān)鍵詞頻次和中心度的統(tǒng)計(jì)分析,得到40個(gè)高頻關(guān)鍵詞的相關(guān)結(jié)果(見表1)。其中,頻次排名靠前的關(guān)鍵詞有“克隆”、“基因克隆”、“序列分析”、“基因”、“數(shù)據(jù)庫(kù)”、“電子克隆”等,各關(guān)鍵詞前后的頻次差距不大,體現(xiàn)了生物信息學(xué)領(lǐng)域研究熱點(diǎn)的多方向發(fā)展。
進(jìn)一步共詞分析和聚類分析,得到國(guó)內(nèi)生物信息學(xué)文獻(xiàn)關(guān)鍵詞聚類圖(見圖2),圖中關(guān)鍵詞節(jié)點(diǎn)的顏色不同表示所屬類別不同,40個(gè)關(guān)鍵詞被聚成了4類。整體分析時(shí)所得表1中中心度較高的關(guān)鍵詞有克隆、基因表達(dá)、基因克隆、序列分析等也基本上是各類別中的核心關(guān)鍵詞。
依據(jù)聚類結(jié)果及中心度情況,結(jié)合具體文獻(xiàn)和專業(yè)知識(shí),可將國(guó)內(nèi)生物信息學(xué)領(lǐng)域研究熱點(diǎn)歸納如下:
(1)基因克隆及生物信息學(xué)分析研究 這一類的高頻詞有克隆、序列分析、基因克隆、表達(dá)分析、race、原核表達(dá)、rt-pcr等。傳統(tǒng)的基因克隆方法利用限制性內(nèi)切酶和連接酶在體外連接的方法構(gòu)建重組載體,步驟繁瑣且受限于酶切位點(diǎn),隨著測(cè)序技術(shù)的發(fā)展,一些簡(jiǎn)化組裝流程的DNA克隆及組裝新技術(shù)競(jìng)相發(fā)展[12]。生物信息學(xué)分析包括了序列分析、基因分析和蛋白分析等多種方法。利用基因克隆技術(shù)結(jié)合生物信息學(xué)分析研究以達(dá)到對(duì)基因功能、結(jié)構(gòu)預(yù)測(cè)的目的是國(guó)內(nèi)生物信息學(xué)領(lǐng)域的研究熱點(diǎn)之一。
(2)生物信息學(xué)數(shù)據(jù)庫(kù)與基因挖掘研究分析 這一類中包含的高頻關(guān)鍵詞有數(shù)據(jù)庫(kù)、基因表達(dá)、人類基因組計(jì)劃、數(shù)據(jù)挖掘、計(jì)算生物學(xué)、序列比對(duì)等。生物信息學(xué)的數(shù)據(jù)主要貯藏在數(shù)據(jù)庫(kù)中,而數(shù)據(jù)挖掘則從生物信息學(xué)數(shù)據(jù)庫(kù)中調(diào)用、提取數(shù)據(jù)[13]。生物信息學(xué)數(shù)據(jù)庫(kù)的主要特點(diǎn)有:數(shù)據(jù)庫(kù)種類的多樣性、數(shù)據(jù)庫(kù)數(shù)據(jù)量增長(zhǎng)驚人、逐漸形成綜合性生物信息學(xué)數(shù)據(jù)庫(kù)平臺(tái)、數(shù)據(jù)庫(kù)高度網(wǎng)絡(luò)化等[14]。如何利用生物信息學(xué)數(shù)據(jù)庫(kù)并采用合適的數(shù)據(jù)挖掘算法進(jìn)行有效的基因挖掘研究分析是國(guó)內(nèi)生物信息學(xué)領(lǐng)域的研究熱點(diǎn)之一。
(3)miRNA研究分析 這一類中包含的高頻關(guān)鍵詞有生物信息學(xué)、mirna、啟動(dòng)子、靶基因、轉(zhuǎn)錄因子、基因芯片等。miRNA也就是MicroRNA,是基因表達(dá)的負(fù)調(diào)控因子,主要通過RNA干擾(RNAi)途徑進(jìn)行調(diào)控[15]。隨著生物信息學(xué)技術(shù)的發(fā)展,新miRNA的發(fā)現(xiàn)及其相關(guān)調(diào)控機(jī)制的研究分析已成為國(guó)內(nèi)生物信息學(xué)領(lǐng)域的研究熱點(diǎn)之一。
(4)電子克隆分析 這一類的高頻詞有基因家族、水稻、擬南芥、玉米、電子克隆、表達(dá)序列標(biāo)簽。電子克隆技術(shù)是近年來發(fā)展起來的基因克隆新方法,其應(yīng)用是基于數(shù)據(jù)庫(kù)、計(jì)算機(jī)網(wǎng)絡(luò)和應(yīng)用軟件這三部分生物信息學(xué)資源而展開的[16]。電子克隆技術(shù)是發(fā)現(xiàn)新基因和確定基因功能的重要手段,也是國(guó)內(nèi)生物信息學(xué)領(lǐng)域的研究熱點(diǎn)之一。
表1 1996~2018生物信息學(xué)中文文獻(xiàn)高頻關(guān)鍵詞表Table 1 High frequency keywords in Chinese literature of bioinformatics between 1996 and 2018
圖2 1996~2018國(guó)內(nèi)生物信息學(xué)文獻(xiàn)關(guān)鍵詞聚類圖Fig.2 Keywords cluster of domestic bioinformatics literature between 1996 and 2018
前文對(duì)國(guó)內(nèi)生物信息學(xué)領(lǐng)域研究熱點(diǎn)做了整體分析,此處對(duì)國(guó)內(nèi)研究熱點(diǎn)隨時(shí)間變遷作進(jìn)一步分析。以40個(gè)高頻關(guān)鍵詞為行,年份為列,分年度統(tǒng)計(jì)每個(gè)關(guān)鍵詞出現(xiàn)的頻次,構(gòu)建國(guó)內(nèi)文獻(xiàn)年份-關(guān)鍵詞統(tǒng)計(jì)表(見表2)。
為了便于國(guó)內(nèi)外的對(duì)比分析,將1996~2006年的國(guó)內(nèi)文獻(xiàn)高頻關(guān)鍵詞作為整體分析,結(jié)果表明國(guó)內(nèi)早期生物信息學(xué)的研究熱點(diǎn)主要集中在基因數(shù)據(jù)庫(kù)研究,其代表高頻關(guān)鍵詞有“數(shù)據(jù)庫(kù)”、“人類基因組計(jì)劃”等;對(duì)2007~2018年的文獻(xiàn),通過分析各高頻關(guān)鍵詞的頻數(shù)相對(duì)密集年份等特征可知:2007~2010年更側(cè)重于蛋白質(zhì)數(shù)據(jù)庫(kù)研究以及本體和結(jié)構(gòu)域研究,代表關(guān)鍵詞有“蛋白質(zhì)組學(xué)”、“數(shù)據(jù)挖掘”、“結(jié)構(gòu)”等;2011~2013年主要是電子克隆研究,代表關(guān)鍵詞有“電子克隆”、“水稻”、“序列分析”等;2014~2018年該領(lǐng)域研究熱點(diǎn)更加多樣,主要在miRNA分析、基因和蛋白質(zhì)結(jié)構(gòu)和功能預(yù)測(cè)分析等,代表關(guān)鍵詞有“亞細(xì)胞定位”、“基因芯片”、“miRNA”、“功能”、“計(jì)算生物學(xué)”等。
表2 國(guó)內(nèi)文獻(xiàn)年份-關(guān)鍵詞統(tǒng)計(jì)表(部分)Table 2 Year-keyword statistics of domestic literature (partial)
2007~2018年SCI數(shù)據(jù)庫(kù)中生物信息學(xué)相關(guān)文獻(xiàn)量的年份變化趨勢(shì)(見圖3)。從圖中可以看出文獻(xiàn)量逐年增長(zhǎng),速度較快??偟膩碚f,國(guó)際文獻(xiàn)的年份統(tǒng)計(jì)結(jié)果顯示了生物信息學(xué)領(lǐng)域的研究正處于發(fā)展中。
圖3 2007~2018國(guó)際生物信息學(xué)文獻(xiàn)量變化趨勢(shì)圖Fig.3 Trend of international bioinformatics literature quantity between 2007 and 2018
通過對(duì)國(guó)際文獻(xiàn)關(guān)鍵詞頻次的統(tǒng)計(jì)分析,得到40個(gè)高頻關(guān)鍵詞(見表3)。從表3中不難發(fā)現(xiàn),關(guān)鍵詞expression、identification、protein、gene、gene-expression的頻次較高。而主題檢索詞“bioinformatics”并不是頻次最高的關(guān)鍵詞,這一現(xiàn)象也從側(cè)面說明了選取WOS的關(guān)鍵詞字段“ID”進(jìn)行共詞分析是合理的。
表3 2007-2018生物信息學(xué)國(guó)際文獻(xiàn)高頻關(guān)鍵詞表Table 3 High frequency keywords in international literature of bioinformatics between 2007 and 2018
同上,通過共詞分析和聚類分析,得到的國(guó)際生物信息學(xué)文獻(xiàn)關(guān)鍵詞聚類圖,40個(gè)關(guān)鍵詞被聚成了2類(見圖4)。
同上,依據(jù)聚類結(jié)果及中心度情況,并結(jié)合具體文獻(xiàn)和專業(yè)知識(shí),可將國(guó)際生物信息學(xué)領(lǐng)域研究熱點(diǎn)歸納如下:
(1)miRNA及與之相關(guān)的分子間相互作用研究 這一類包含的高頻關(guān)鍵詞有cells(細(xì)胞)、proliferation(增殖)、apoptosis(細(xì)胞凋亡)、micrornas、pathway(神經(jīng)通路)等。miRNA及其產(chǎn)物mRNAs形成復(fù)雜的調(diào)控網(wǎng)絡(luò),參與細(xì)胞的生長(zhǎng)、分化、增殖、死亡等一系列重要的生命過程,基因表達(dá)譜微陣列的生物信息學(xué)分析已被廣泛用于識(shí)別各種疾病中的重要分子機(jī)制和生物標(biāo)志物[17]。利用生物信息學(xué)分析方法挖掘miRNA功能并得到與之相關(guān)的分子間相互作用成為了國(guó)際生物信息學(xué)領(lǐng)域的研究熱點(diǎn)之一。
(2)基因、蛋白質(zhì)等功能預(yù)測(cè)與應(yīng)用研究 這一類包含的高頻關(guān)鍵詞有identification(識(shí)別)、expression(表達(dá))、protein(蛋白質(zhì))、database(數(shù)據(jù)庫(kù))、prediction(預(yù)測(cè))、sequence(序列)。眾所周知,生物實(shí)驗(yàn)的實(shí)施大都費(fèi)用昂貴且費(fèi)時(shí),而生物信息學(xué)的產(chǎn)生就是為了攻破這些傳統(tǒng)的生物學(xué)難題。例如,蛋白質(zhì)組學(xué)領(lǐng)域的一個(gè)重要研究方向就是利用有效的算法對(duì)DNA結(jié)合蛋白進(jìn)行鑒定與預(yù)測(cè)[18]。因此,利用數(shù)據(jù)庫(kù)和有效的計(jì)算預(yù)測(cè)方法在基因、蛋白質(zhì)等功能預(yù)測(cè)與應(yīng)用方面的研究是國(guó)際生物信息學(xué)領(lǐng)域的研究熱點(diǎn)之一。
分年度統(tǒng)計(jì)40個(gè)國(guó)際文獻(xiàn)高頻關(guān)鍵詞出現(xiàn)的頻次,構(gòu)建國(guó)際文獻(xiàn)年份-關(guān)鍵詞統(tǒng)計(jì)表(見表4)。 并參照國(guó)內(nèi)文獻(xiàn)劃分時(shí)間段來進(jìn)行研究趨勢(shì)分析,即分為2007~2010年、2011~2013年、2014~2018年三個(gè)時(shí)間段。結(jié)果表明,2007~2010年該領(lǐng)域在國(guó)際的研究熱點(diǎn)側(cè)重于數(shù)據(jù)庫(kù)分析以及實(shí)驗(yàn)工具、算法的改進(jìn);2011~2013年的研究熱點(diǎn)集中在蛋白質(zhì)分析及應(yīng)用;2014~2018年的研究熱點(diǎn)較為偏向于miRNA分析及應(yīng)用。
圖4 2007~2018國(guó)際生物信息學(xué)文獻(xiàn)關(guān)鍵詞聚類圖Fig.4 Keywords cluster of international bioinformatics literature between 2007 and 2018
表4 國(guó)際文獻(xiàn)年份-關(guān)鍵詞統(tǒng)計(jì)表(部分)Table 4 Year-keyword statistics of international literature (partial)
以國(guó)內(nèi)外生物信息學(xué)領(lǐng)域期刊論文為研究對(duì)象,從年文獻(xiàn)量變化趨勢(shì)、研究熱點(diǎn)、分階段研究趨勢(shì)三個(gè)方面進(jìn)行分析,得出結(jié)論如下:
1)國(guó)內(nèi)外年文獻(xiàn)量變化趨勢(shì)分析 國(guó)內(nèi)外生物信息學(xué)研究均處于高速發(fā)展期,文獻(xiàn)量均呈逐年增長(zhǎng)趨勢(shì),不過國(guó)內(nèi)文獻(xiàn)的增長(zhǎng)速度小于國(guó)際文獻(xiàn)的增長(zhǎng)速度。
2)研究熱點(diǎn)分析 國(guó)內(nèi)的研究熱點(diǎn)有基因克隆及生物信息學(xué)分析研究、生物信息學(xué)數(shù)據(jù)庫(kù)與基因挖掘研究分析、miRNA研究分析、電子克隆分析等;國(guó)際的研究熱點(diǎn)有基因、蛋白質(zhì)等功能預(yù)測(cè)與應(yīng)用研究和miRNA及與之相關(guān)的分子間相互作用研究等。國(guó)內(nèi)外研究熱點(diǎn)均聚焦在基因挖掘、蛋白質(zhì)結(jié)構(gòu)與功能預(yù)測(cè)、miRNA分析等,但國(guó)內(nèi)的生物信息學(xué)領(lǐng)域研究更側(cè)重于理論研究,而國(guó)際生物信息學(xué)領(lǐng)域研究則更加注重其在疾病(癌癥)治療、藥物設(shè)計(jì)等方面的實(shí)際應(yīng)用。
3)分階段研究趨勢(shì)分析 國(guó)內(nèi)生物信息學(xué)領(lǐng)域研究熱點(diǎn)在不同階段內(nèi)略有波動(dòng),呈現(xiàn)了較為明顯的熱點(diǎn)變遷狀況;而國(guó)際生物信息學(xué)領(lǐng)域研究熱點(diǎn)在不同階段內(nèi)的變化很小,高頻關(guān)鍵詞的頻次幾乎都是逐年增加,而且關(guān)鍵詞之間的聯(lián)系較強(qiáng),是較為均衡的發(fā)展。整體來看,國(guó)內(nèi)外生物信息學(xué)的研究范圍均在不斷拓寬。