陳 舉,蘇姍姍,南星梅,蘆殿香,李占強*
[1.青海大學高原醫(yī)學研究中心,高原醫(yī)學教育部重點實驗室,青海省高原醫(yī)學應用基礎重點實驗室(青海-猶他高原醫(yī)學聯(lián)合重點實驗室),青海 西寧 810001;2.青海大學生態(tài)環(huán)境工程學院,青海 西寧 810016;3.西寧海關技術中心,青海省食品安全研究重點實驗室,青海 西寧 810003;4.青海大學醫(yī)學院,青海 西寧 810001]
自1992年Semenza等發(fā)現(xiàn)低氧誘導因子(Hypoxia-Inducible Factors,HIF)以來,對HIF的相關研究與報道出現(xiàn)“井噴”式增長,導致HIF研究出現(xiàn)邏輯混亂問題。本課題選用VOS viewer、CiteSpace科學圖譜可視化分析軟件,對1991年1月至2020年12月有關HIF的文獻進行統(tǒng)計與可視化分析,進行發(fā)文趨勢分析、文獻聚類分析、文獻來源聚類分析、期刊被引用突現(xiàn)分析、作者國家聚類分析、研究國家突現(xiàn)分析、研究人員合作聚類分析、作者機構聚類分析、關鍵詞聚類分析、文獻時序圖譜分析,解決HIF研究的混亂問題。
本文所使用的全部數(shù)據(jù)來源于Web of Science(WOS)核心數(shù)據(jù)庫。采集時間為1991年1月至2020年12月。在WOS數(shù)據(jù)庫中,以“Hypoxia-inducible factors”or“HIF-1”or“HIF-2”為檢索詞進行主題檢索,精煉后共檢索出12 152條文獻,其中包含期刊論文8 351篇、會議摘要2 880篇。
使用VOS viewer、CiteSpace軟件對WOS核心數(shù)據(jù)庫中有關HIF的文獻做可視化知識圖譜分析。在VOS Viewer圖譜構建過程中,以“CSV”文件標頭;文獻計算方法選擇“binary counting”[1,2];作者發(fā)文量參數(shù)設置為45,共被引次數(shù)參數(shù)設置為100,共引源參數(shù)設置為500,國家聚類參數(shù)設置為5,作者合作網(wǎng)絡分析參數(shù)設置為10,機構間耦合參數(shù)為10,之后針對所分析的類型選擇作者、作者機構或關鍵詞等來逐步實現(xiàn)網(wǎng)絡共現(xiàn),以“l(fā)ayout”和“clustering”為功能菜單進行調整,最后以GML文件形式保存[3,4]。
CiteSpace采用lsi聚類算法,利用“Control panel”欄,將“Layout”任務鍵選在“Visualizations”視圖框中點擊“Timeline view”后即可得到關鍵詞共現(xiàn)時間線圖譜[3,5]。利用Microsoft Excel 2019軟件分析文獻排行前三的國家自1991年1月起到2020年12月的發(fā)文趨勢和發(fā)文總量隨年份變化的趨勢。
根據(jù)設置參數(shù),對保存的文獻信息進行發(fā)文趨勢分析、文獻聚類分析、文獻來源聚類分析、期刊被引用突現(xiàn)分析、作者國家聚類分析、研究國家突現(xiàn)分析、研究人員合作聚類分析、作者機構聚類分析、關鍵詞聚類分析、文獻時序圖譜分析,繪制有關HIF研究進展的知識圖譜,并基于軟件分析數(shù)據(jù)、結合人工對信息歸納和整合。
對從WOS核心數(shù)據(jù)庫篩選獲得的8 897篇文獻(研究性論文和綜述性文章)做分析,結果如圖1。發(fā)文量隨年份的增加而增加,尤其是自1999年以后發(fā)文增長迅速,其中1991年1月至2009年12月內發(fā)文持續(xù)性增長,2010年1月至2013年12月增長速率相對以前有所減緩,2014年1月至2018年12月發(fā)文量保持相對穩(wěn)定,在最近兩年又較快上升并且在2020年達到了最高值(715篇)。分析表明對HIF的關注度不斷提升。
圖1 1991年1月至2020年12月中、美、日三國及總體發(fā)文趨勢Figure 1 Publishing trend of China,United States and Japan and overall publishing trend of literature from January 1991 to December 2020
將發(fā)文國家按發(fā)文數(shù)量統(tǒng)計排列后,得到了發(fā)文量最多的三個國家按順序依次是中、美、日。如圖1所示,美國和日本發(fā)文變化趨勢基本一致,不同的是美國在HIF領域研究較早,且發(fā)文量一直遠高于日本。美國在1993年1月至1999年12月期間的研究較為緩慢,從2000年開始以較快且穩(wěn)定的速度開始增長,并且2009年達到了發(fā)文量最高值(181篇),之后進入相對穩(wěn)定的階段,直到2021年開始緩慢下降。中國和其他兩國不同的是:起步較晚,1998年有一篇報道,正式開始于2001年,自此發(fā)文量穩(wěn)定增長,于2014年超過美國歷史年度最高發(fā)文量,尤其是近三年,增長更為迅速達到了目前最大值(431篇)。對以上三國對比分析可得:中國和美國研究積極性較高,尤其進入21世紀以來中國更勝一籌。
文獻共被引通過對共被引網(wǎng)絡中的聚類及關鍵節(jié)點分析,可以揭示該研究領域的知識結構與知識基礎[6]?;赩OS viewer軟件分析文獻聚類時,參數(shù)設置最小引文數(shù)量為100,在176 986條信息中271條符合篩選要求。圖2里的不同顏色代表不同的研究主題,其中藍色節(jié)點代表與HIF和癌癥相關的文章,綠色節(jié)點代表單純闡明HIF功能結構性的文章,黃色節(jié)點代表關于HIF和基因層面的研究性文章,紅色代表HIF與細胞層面的研究性文章。圖中四種顏色聚類中較大的節(jié)點:Semenza.gl、Zhang、Wang、Jaakkola、Kealin等人的文章形成共引和被引關系,成為后來研究HIF的主要參考文獻,影響力頗高。從圖2中的時間進度看,1995年左右文章主題集中在HIF的結構功能性方面,其要早于其他三類文章;2002年左右癌癥和相關基因的主題成為熱點,其兩者基本發(fā)生于同一時間段內;細胞研究領域時間跨度較大,2001年后出現(xiàn)相關主題的文章,并且一直延續(xù)到現(xiàn)在,然而量遠不及其他三個領域,關聯(lián)程度也較弱,表明其二者關系較為模糊,且該領域發(fā)展速度較緩慢。
圖2 共引文獻聚類圖譜Figure 2 Clustering map of co-cited literature
文獻來源分析能反映出研究HIF期刊的主要陣營,采用文獻耦合網(wǎng)絡方法追溯文獻來源,以顯示HIF研究領域高影響力研究機構[7]。最小被引用文章次數(shù)設置為500篩選到10 573條條目,符合篩選目標的有136條。據(jù)圖3分析,可以看出來主要的文章來源于《J BIOL CHEM》《P NATL ACNC SCI USA》《Cancer EAS》《Nature》等核心文獻庫期刊,這些期刊之間存在相互交叉引用情況,構成了共引和被共引的網(wǎng)絡關系,影響力頗高。表1顯示,影響力高且發(fā)文排名靠前的期刊主要有《JOURNAL OF BIOLOGICAL CHEMISTRY》《PLOS ONE》《BIOCHEMICAL AND BIOPHYSICAL RESEARCH COMMUNICATIONS》《CANCER RESEARCH》等。
表1 TOP 10期刊發(fā)文數(shù)量Table 1 Number of articles published in top 10 journals
突現(xiàn)是指一個變量的值在短期內出現(xiàn)較大變化,通過分析高突現(xiàn)趨勢的關鍵詞,可以了解學科中的前沿問題[8]。利用CiteSpace做Burst分析圖譜,紅線表示關鍵詞突現(xiàn)的開始與結束,“Strength”表示關鍵詞突變強度,強度越高表示影響力越大。圖4顯示,《SCIENCE》《MOL CELL BIOL》《P NATL ACAD SCI USA》是較早報道HIF的期刊,在1993年至2007年期間《NATUREA》《EMBO J》《GENE DEV》等其他頂級期刊也開始刊發(fā)HIF文章,且影響力頗高。近些年來,HIF領域影響力較高的期刊有《SCI REP-UK》《PLOS ONE》《NAT COMMUN》《INT J MOL SCI》等。
圖4 數(shù)據(jù)庫中HIF相關期刊被引用的突現(xiàn)分析圖Figure 4 Emergent analysis of HIF related journals cited in the database
通過作者國家聚類分析可以了解主要從事研究HIF的研究人員分布情況,從而了解該領域受不同國家科研人員的重視程度[9]。利用Vos檢索分析時將國家文章最小參數(shù)和國家之間最小引用次數(shù)均設置為5,得到90條結果,其中52條符合檢索條件。圖1、5顯示,中國和美國是HIF研究的主要國家,其次是日本、韓國、德國、英格蘭等國家。從圖5可以看出中國和美國起著主干作用,很大程度上影響著其他國家的研究,同時反映出中國和美國學者之間的相互合作關系密切。
圖5 共引作者國家分析圖Figure 5 Analysis of co-citation nationality
為了明晰國家之間對HIF研究在固定時間段內的持續(xù)熱度情況,對排行前十的國家進行突現(xiàn)分析。圖6顯示中國突現(xiàn)值最大,緊接著是美國、英國等。突現(xiàn)分析顯示美國從1991年開始關注HIF,一直持續(xù)到了2004年。中國與美國不同的是,2018年至2020年這三年時間里,HIF研究突現(xiàn)值達到了歷史最高,表明我國對HIF的研究熱度非常高。
圖6 國家突現(xiàn)分析圖Figure 6 Emergence analysis of countries
通過構建合作網(wǎng)絡的方法能揭示從事相關研究的科研人員的分布和與其的合作模式[10]。最小檢索研究人員發(fā)文數(shù)量設置為10篇,得到42 458條結果,其中符合參數(shù)要求的為253條。圖7中以棕色標注的研究團體為中心團體,最具有代表性的是以Semenza.GL為中心的研究團隊。Semenza.GL研究團隊于2003年在《Nat Rev Cancer》上發(fā)表了針對HIF-1進行癌癥治療的文章,被引用次數(shù)多達2 045次,成為HIF在癌癥治療方面最具影響力的文章[11]。圖7顯示,Glikes.Daniele m等人及其他非癌癥層面的研究人員,構成了聚類合作關系??梢钥闯雠c棕色癌癥節(jié)點關系較直接的是湛藍色節(jié)點,Harada.Hiroshi為研究HIF功能的人員。紅色節(jié)點以細胞層面的研究為主,圖7中可以看出中國科學研究者從事HIF細胞層面研究的科研人員明顯為多,從各個聚類的連線可以看出,其他領域的研究對于細胞層面的研究有著較大的幫助,各個方面都有涉及,如:粉色節(jié)點代表癌細胞的相關研究,黃色節(jié)點代表HIF基因和酶層面的研究,橙色節(jié)點代表蛋白層面的研究。
圖7 科研人員合作聚類網(wǎng)絡圖Figure 7 Cooperative clustering networks of scientific researchers
通過統(tǒng)計分析研究機構合作網(wǎng)絡和突現(xiàn)分析圖譜,可以知道從事該領域研究的單位和單位的分布情況[7]。用VOS進行構建合作網(wǎng)絡圖譜時,引文數(shù)量最小值設置為10,分析得到5 101條信息,其中有378條符合篩選條件。圖8顯示,藍色表示以美國約翰霍普金斯大學為中心開展密切合作??梢钥闯雒绹s翰霍普金斯大學頗具影響力,與密歇根大學、華盛頓大學、猶他大學、托馬斯杰斐遜大學、哈佛大學為HIF研究的主要研究機構(橙色節(jié)點)。這些節(jié)點處于圖譜的中心位置,節(jié)點間關聯(lián)度較高。
中國從事HIF研究的機構有上海交通大學、南京醫(yī)科大學、華中科技大學、四川大學、中國醫(yī)科大學、南方醫(yī)科大學、臺北醫(yī)科大學、第四軍醫(yī)大學等。圖8顯示,中國在HIF領域的研究機構多于其他國家,圖9突現(xiàn)分析顯示,近些年來我國研究機構的發(fā)展速度已超過美國。
圖8 作者機構聚類網(wǎng)絡圖Figure 8 Clustering network of author’s institution
圖9 文章的機構突現(xiàn)圖Figure 9 Emergence of article’s institutions
其他國家從事HIF研究的機構單位:日本有京都大學、東京大學等;韓國有首爾國立大學、釜山大學、忠南大學等;英國有牛津大學、紐倫堡大學、約翰·拉德克利夫醫(yī)院、倫敦王國學院;瑞士有蘇黎世聯(lián)邦理工學院。
關鍵詞在文章中具有概括主旨的意義,可以反映文章研究或綜述的核心內容,通過“共詞分析”,科學地統(tǒng)計分析出WOS核心文獻庫中關于HIF的研究熱點領域[3]。檢索時間設置為1991年1月至2020年12月,節(jié)點大小反映對該研究領域的影響強弱。圖10顯示,2010至2012年影響力較高的關鍵詞為gene-express、growth-factor、factor-i、factor-1-alpha、hif-alpha等,關鍵詞分析反映出該時間段內,從事HIF基因表達水平方面的研究和相關因子以及HIF-α方面的研究內容較多,且以這些方面為主體展開其他研究領域的擴展,例如tumor-suppressor protein、transcription factor、tumor angiogenesis。2014至2015年高影響力的關鍵詞有angiogenesis、hif-alpha、hypoxia、activation、cancer、hif-1、hif-1-alpha、cells、apoptosis等,高影響關鍵詞節(jié)點數(shù)量較之前有所增加,可見研究領域持續(xù)加速拓展[12,13,14]。圖10顯示,血管生成和表達層面的研究依舊是熱點,其次較之前發(fā)生顯著變化的是在缺氧和細胞凋亡及癌癥等領域的突現(xiàn),這些領域交叉研究關系較為密切,而且以之前的研究為支撐成為該時間段內新的熱點。2016年至今研究內容更加廣泛,但是總體上呈現(xiàn)出分散發(fā)展趨勢,或許是由于內容較新所以才導致相關性較弱。metastasis和inflammation是目前影響力較強的領域,推測關于腫瘤細胞轉移和炎癥免疫領域或許是下一步的研究突現(xiàn)內容。
圖10 關鍵詞聚類圖Figure 10 Clustering networks of keywords
通過CiteSpace軟件生成HIF關鍵詞聚類Timeline視圖,這種分析的好處是可以展示研究領域研究結構隨時間變化的發(fā)展軌跡,更好地揭示該領域結構的演 化過程[15]。
圖11顯示,不同聚類隨時間呈不同分布,其中在該研究領域共形成了14個聚集體,每個聚集體對應一個相應的研究聚類。從圖中可以看出聚類#0中癌癥相關治療是最早出現(xiàn)的熱點,從事該領域科學研究的是GL SEMENZA。聚類#0與其他的聚類間有較多的連線表明:聚類#0被其他聚類積極引用,直接影響到后來許多聚類的出現(xiàn),在該領域有著非常重要的影響;同時該節(jié)點從圓心到外側顏色越來越暖,表明了關于HIF與癌癥相關的研究隨時間也一直在繼續(xù)推進中,且不斷地影響其他聚類,推動其他相關研究領域的進行,較為突出的是聚類#9有關腫瘤微環(huán)境的研究。除此之外,可以看出,在1996至2001年期間,聚類#1和#2也較為突出。
圖11 文獻共引用Timeline視圖Figure 11 Timeline view of literature co citation
另外,聚類#12和聚類#21顏色最暖,說明他們是近些年來受到關注度較大的研究領域,其具代表性的研究方向有細胞層面的細胞周期循環(huán)、基因層面的條件性基因敲除,從圖2分析結果可以知道以上研究領域的研究主要是中國的學者和機構。在早期,對HIF的研究主要集中在癌癥的影響和治療上,隨著研究的深入,發(fā)現(xiàn)其不止與癌癥有著緊密的聯(lián)系,在“腫瘤的誘導”“信號轉錄調控”“酶結構”“影響細胞周期變化”等方面同樣有重要作用。
本研究利用CiteSpace、VOS viewer軟件對WOS數(shù)據(jù)庫中相關HIF文獻繪制可視化圖譜,采用文獻調查與圖形描述及比較的分析方法開展研究,從時間維度上客觀展示了HIF相關研究的興起與發(fā)展,共現(xiàn)了每一階段研究的熱點,直觀展示了目前相關研究現(xiàn)狀與趨勢,為HIF的研究提供了詳細背景依據(jù),填補了其可視化圖譜的空缺。本研究僅供宏觀掌握HIF發(fā)展的基本情況,實際結果仍然需要緊密結合實驗驗證。