鄭津津,張惠榮,黃育北
(天津醫(yī)科大學腫瘤醫(yī)院圖書情報研究室/國家腫瘤臨床醫(yī)學研究中心,天津 300060)
在國際精準醫(yī)學發(fā)展計劃的背景下,我國于2015 年2 月初始首次提出“精準醫(yī)學”概念,3 月11日建立了精準醫(yī)學的研究專家組,開展該計劃,通過不斷的努力,促進了精準醫(yī)學計劃的發(fā)展[1]。2016 年初,在“十三五”發(fā)展規(guī)劃中,正式啟動了對精準醫(yī)學的研究,制定了相應的政策和發(fā)展規(guī)劃,同時將它列為我國重點發(fā)展計劃之一,隨之全國范圍內的不同機構,迅速開展了針對不同疾病的“精準醫(yī)學”研究,極大的促進了其發(fā)展[2]。精準醫(yī)學(precision medicine)是以個體化醫(yī)療為基礎,隨著分子生物學和高通量基因測序技術的飛速發(fā)展以及生物信息與大數(shù)據(jù)科學的交叉應用而發(fā)展起來的醫(yī)療模式[3,4]。關于精準醫(yī)學的文章數(shù)量迅速增長,表明精準醫(yī)學的探究正在迅速發(fā)展。本文基于文獻與引文分析概述了精準醫(yī)學發(fā)展的演化軌跡,并強調該學科發(fā)展的歷程?;贑iteSpace 選擇的網(wǎng)絡結構和計算屬性分析發(fā)現(xiàn)學科發(fā)展趨勢和模式,旨在促進該領域文獻的科學前沿與發(fā)展動態(tài)[5]。視覺分析工具對于發(fā)現(xiàn)大量新發(fā)表研究中的關鍵發(fā)展節(jié)點具有較高研究價值,通過跟蹤引文鏈接和引用矩陣間的相互關系,科學計量學的視覺分析技術能夠引導學者關注到振動和迅速發(fā)展的研究前沿與熱點。本研究基于Web of Science 核心合集數(shù)據(jù)庫,以高被引SCI 論文數(shù)、影響因子、作者/機構合作關系、高頻關鍵詞為定量評價指標,運用CiteSpace、文獻計量在線分析平臺從文獻計量學角度對2015-2020 年精準醫(yī)學高被引論文進行研究,旨在評價精準醫(yī)學的發(fā)展態(tài)勢,為我國制定精準醫(yī)學學科發(fā)展規(guī)劃提供參考依據(jù)。
1.1 資料來源 基于Web of Science 核心合集(Science Citation IndexExpanded)和2019 版Journal Citation Report(JCR),以“Precision medicine”作為檢索主題詞,數(shù)據(jù)采集時間為2015 年1 月1 日-2020 年12 月31 日,數(shù)據(jù)更新時間為2021 年3 月31 日,得到14 237篇基礎數(shù)據(jù),依據(jù)領域中的高被引論文過濾結果,最終獲得有效數(shù)據(jù)為350 篇,納入本研究。
1.2 納入與排除標準 納入標準:①檢索地址中包含精準醫(yī)學相關研究文獻;②滿足符合文獻計量學所需的相關高被引文獻。排除標準:①涵蓋信息不全的文獻;②重復或撤稿的文獻;③會議論文、社論、書籍章節(jié)。由兩位作者獨立對符合條件的文獻進行凝練、提取及開展數(shù)據(jù)分析。
1.3 方法 采用軟件BibExcel 制作發(fā)文量曲線。采用文獻計量分析平臺研究國家與機構合作關系及期刊影響力分析,采用CiteSpace 5.7.3 軟件進行關鍵詞聚類分析、被引文獻聚類、bursts(突發(fā)詞)檢測等知識圖譜的繪制。
2.1 文獻總發(fā)文量分析 高被引論文數(shù)量與精準醫(yī)學的發(fā)展有著直接且必然的聯(lián)系,精準醫(yī)學領域高被引論文于2015 年發(fā)文量為36 篇,2016 年發(fā)文量為47 篇,2017 年發(fā)文量為56 篇,2018 年發(fā)文量為73 篇,2019 年發(fā)文量為86 篇,但需要注意的是,由于數(shù)據(jù)截至2020 年底,導致2020 年的數(shù)據(jù)情況未能全部體現(xiàn),僅為52 篇,見圖1。
圖1 歷年發(fā)文量之國家發(fā)文量
2.2 合作關系分析
2.2.1 國家間合作關系分析 當前,美國通常從探究腫瘤靶向治療的創(chuàng)新方法并在臨床水平上展開實踐、采取綜合療法、克服腫瘤的耐藥性等方面進行腫瘤的診斷和治療。弗吉尼亞大學采用基因組信息創(chuàng)建電子健康病歷,進行風險評估,對提供者和患者給予決策支持;杜克大學開發(fā)評估肺癌和乳腺癌藥物基因組學編織物的支持證據(jù)生成和臨床療效評價研究;H Lee Moffit 癌癥中心建設CER 信息基礎數(shù)據(jù)集;Fred Hutchinson 癌癥中心開展決策建模、倫理以及開展臨床試驗涉及等研究。美國國立衛(wèi)生院前院長認為應該將基礎研究與臨床實踐緊密聯(lián)系,這一觀點對于醫(yī)學的發(fā)展具有里程碑意義[6]。各國家間合作關系見圖2。
圖2 國家間合作關系
2.2.2 機構間合作關系分析 精準醫(yī)學的發(fā)展和科研產(chǎn)出機構有著緊密的關聯(lián)性。在對產(chǎn)出機構(機構包括大學,各研究院,以及國家研究機關)的學術位置進行評價時,將中心性以及所在節(jié)點相結合,可將研究的學術狀況以及影響力較好地展現(xiàn)出來。各機構間合作關系見圖3。
圖3 機構間合作關系
2.3 期刊影響力分析 結合文獻計量分析平臺,匯總2015-2020 年精準醫(yī)學高被引論文最具影響力期刊,見表1。
表1 2015-2020 年精準醫(yī)學高被引論文最具影響力期刊Top10
2.4 關鍵詞聚類分析 我國關于“精準醫(yī)學”的研究快速增長,從2015 年至今,5 年內精準醫(yī)學相關文獻的發(fā)表量超過了最初發(fā)表量的5 倍。從WOS 數(shù)據(jù)庫年度發(fā)文的數(shù)量來看,因數(shù)據(jù)庫存在局限性,國際精準醫(yī)學的研究先于我國在1998-2015 年開始,但發(fā)文量很少。自2016 年起,國際上此方面的研究持續(xù)增多,且趨向于快速增長,在發(fā)展速度上遠勝于我國。對WOS 數(shù)據(jù)庫下載的數(shù)據(jù)進行聚類分析,主要包括作者、題目、摘要和文獻的引文等字段,即研究所要抽取的文本數(shù)據(jù)項。輸入至系統(tǒng)后,設置參數(shù),如確定要分析領域的總時間段范圍、分割后每一個時間片段的長度,本文的時間段范圍是2015-2020 年,時間片段的長度是每1 年一個,術語來源選擇Title(標題)、Abstract(摘要)、Author Keywords DE(作者關鍵詞)、Keywords Plus Identifiers(關鍵詞標識項),閾值選擇Top50,節(jié)點類型確定為Keyword,然后根據(jù)不同的研究目的(研究領域探析、研究前沿探析)的需要選取不同的選擇項:名詞短語(Noun phase)和突變詞(Burstterm)首次運行取消術語類型的選擇,再根據(jù)需要設定一定的閾值以及路徑選擇算法(Pathfinder),其他選項保持默認狀態(tài)。與學科研究進展相關的關鍵詞見表2。國際精準醫(yī)學前沿的高Burst 值關鍵字排名前10 位見圖4。
圖4 排名前10 位的國際精準醫(yī)學前沿的高Burst 值關鍵字
表2 學科研究進展關鍵詞
文獻的關鍵詞共現(xiàn)分析通常多用以對某個研究領域的熱點與前沿問題進行清晰明確研究,一般會將突現(xiàn)率較高的關鍵詞視為精準醫(yī)學前沿領域的表征[7]。為進一步研究精準醫(yī)學領域的研究熱點,采用CiteSpace 構建了主題詞加關鍵詞構成的共現(xiàn)網(wǎng)絡,用以微觀層面揭示學科內的實體關系特征,構建知識單元之間直接的語義關聯(lián),并從施引文獻的標題中提取聚類命名術語,經(jīng)整理生成關鍵詞被引頻次≥20 的關鍵詞列表,關鍵詞聚類分析見圖5。
圖5 關鍵詞聚類分析
中國有無可比擬的病患樣本資源優(yōu)勢,本文通過對近5 年精準醫(yī)學領域高被引論文的期刊影響力分析、作者/機構間生產(chǎn)力與合作關系、領域內的關鍵詞及研究熱點聚類分析,開展文獻的梳理與歸納總結,結合定性的文獻回顧和定量的文獻計量學分析方法,得出主要研究結論如下。
3.1 引文總量情況 作為“文獻計量”數(shù)據(jù)來源的學術論文是科學研究的主要對象之一,論文被引頻次的高低,在一定程度上可以揭示論文的影響程度和情報價值[8,9]。高被引論文是指被引用頻次相對較高,被引用周期相對穩(wěn)定的研究論文[10]。從2015 年至2019 年,各國精準醫(yī)學高被引論文整體呈上升趨勢,尤其在2019 年達到高峰,占總發(fā)文量的25%。我國繼美國、英國、德國、意大利、法國等歐美國家后排名第六位,占比14%,呈較快的發(fā)展態(tài)勢。
3.2 研究機構情況 科研知識產(chǎn)出能力、學術影響力可分別借助其合作網(wǎng)絡分析進行展現(xiàn)[11]。在國家間合作關系中,2015-2020 年,中國和58 個國家與地區(qū)進行國際合作發(fā)表精準醫(yī)學高被引SCI 論文,其中美國是合作發(fā)文排名第一的國家與地區(qū)共計236篇,占總文章量67.429%;英國是合作發(fā)文排名第二的國家與地區(qū)共計70 篇,占總文章量20%,德國是合作發(fā)文排名第三的國家與地區(qū)共計59 篇,占總文章量16.857%。劇統(tǒng)計,美國則擁有最高的相對合作強度,其次是英國、德國。中國精準醫(yī)學研究領域處于快速發(fā)展階段,我國學者應加大與國際他國之間的高水平合作,進一步推動我國精準醫(yī)學國際化的戰(zhàn)略合作關系。
借助對精準醫(yī)學高被引論文學術影響力較大的產(chǎn)出機構的追蹤,得出HARVARD UNIVERSITY 所發(fā)表的文章位列首位,共計71 篇,占比20.286%,其次是UNIVERSITY OF CALIFORNIA SYSTEM,共計46 篇,占比13.143%,再次是UNIVERSITY OF TEXAS SYSTEM,共計35 篇,占比10%,文章中涉及到精準醫(yī)學基于多組學獲取的臨床試驗數(shù)據(jù)及生物信息學技術用于臨床診斷及精準醫(yī)學所面臨的主要挑戰(zhàn)和基于數(shù)據(jù)集成方法的最新進展,以揭示各種組學研究產(chǎn)生的大數(shù)據(jù)中的個性化信息等,上述機構匯聚了此研究領域內的核心及重點內容,其所得出之結論、所用之方法或許會對后期的研究產(chǎn)生一定的影響。同時,從研究視角發(fā)現(xiàn)應加大數(shù)據(jù)資源管理與控制能力,包括對大數(shù)據(jù)資源的質量監(jiān)管,提升數(shù)據(jù)處理的準確性、實時性、有效性,加強數(shù)據(jù)資源的利用和隱私保護,積極開展基礎隊列研究、疾病基因檢測技術、精準醫(yī)學知識庫建設及多方大數(shù)據(jù)平臺共享機制的建設[12],提升挖掘技術的開發(fā)能力,整合全生命周期電子檔案系統(tǒng),建立符合中國模式的精準醫(yī)學大數(shù)據(jù)研究平臺和保障體系,培養(yǎng)具有精準醫(yī)學發(fā)展需求的高能人才梯隊建設,培養(yǎng)醫(yī)學信息學專家、科學項目管理人才及醫(yī)學倫理學人才作為支撐,制定屬于中國精準醫(yī)學的疾病診斷治療標準、疾病預防標準,進一步提升醫(yī)療的社會普惠性,使重大病癥的發(fā)病率、死亡率、臨床治療費用大大降低,促進我國醫(yī)療事業(yè)的快速發(fā)展。
3.3 最具影響力期刊情況 學術期刊的學術輻射力和市場占有率是學術期刊影響力的本質特征[13]。近5 年間精準醫(yī)學高被引論文最具影響力Top10 期刊,依據(jù)2019 版JCR 影響因子排在前3 位的期刊依次為《NATURE REVIEWS DRUG DISCOVERY》,IF=67.797;《LANCET》,IF=60.39;《NATURE REVIEWS CLINICAL ONCOLOGY》,IF=53.276??傆绊懸蜃又蜑?26.392,平均影響因子為42.6392,涉及主要學科領域分別為腫瘤學(ONCOLOGY)和生物化學與分子生物學(BIOCHEMISTRY &MOLECULAR BIOLOGY),這也可以從一個側面反映出精準醫(yī)學在該學科的發(fā)展態(tài)勢以及研究的重點方向。收錄高被引文章總數(shù)高達11 篇,總被引用次數(shù)高達17 次,為精準醫(yī)學在腫瘤學領域的傳播和發(fā)展起到了重要的引領作用。
3.4 研究熱點情況 關鍵詞是作者對論文核心研究內容的精煉[13],聚類分析則是一種多元統(tǒng)計法,主要是完成對涵蓋有諸多指標數(shù)據(jù)的有效分類,即基于層級聚類的原則,對于事物彼此間的親密及疏離程度的判定借助相似性尺度來完成,以清晰展現(xiàn)出文獻彼此間的親疏關聯(lián)性[14,15]?;贑iteSpace 軟件分析得出,Precision medicine 頻次最高,其次是Cancer、personalized medicine、Breast cancer、Medicine、Biomarker、Drug therapy、Clincal trail、Cell lungcancer和Gene 等高頻關鍵詞。以CiteSpace 對Web Of Scinence 核心合集的數(shù)據(jù)展開Keyword 值的Burst分析,所得出的Burst 值超過3.53 的關鍵詞共有21個,其中中介中心度>0.1 的數(shù)值最具參考價值。
我國精準醫(yī)學的發(fā)展呈快速發(fā)展階段,還需結合近幾年的科研成果及臨床經(jīng)驗,以基因組研究為代表的各種分子水平的資源與信息技術,通過挖掘與整理,整合出能夠和疾病相關的且能夠作為疾病表征的標本組織庫[17,18]??蒲袥Q策機構應加強政策引導,在制定年度計劃和戰(zhàn)略目標時,從學科建設入手,聯(lián)合生產(chǎn)基因檢測產(chǎn)品的醫(yī)療器械公司及藥物公司,在市場前景和優(yōu)惠政策的激勵下,增加相關企業(yè)數(shù)量,借助先進的計算機技術和AI 技術,提升非結構化數(shù)據(jù)的處理效率,增強數(shù)據(jù)的準確性、可靠性,促進精準醫(yī)學行業(yè)的飛速進步。充分發(fā)揮所在單位研究院所、臨床醫(yī)學研究中心在基礎與臨床研究相結合的核心作用,促進科研工作者的積極研究,形成一套具有我國自主專利、獲得全球認可的治療指南和臨床經(jīng)驗路徑,極大的提升治療重大疾病的醫(yī)療水平。
基于以上研究,本文認為中國與國際前沿技術和理念接軌的同時,仍然需建立國際一流的精準醫(yī)學研究平臺、保障體系、自主研發(fā)的核心關鍵技術、適合亞洲種群的防疫藥物、疫苗、器械和設備等,建立與制定人類指南、臨床路徑和干預措施,應用于疾病的預防、分析、診斷、治療、預后的各個階段,尤其在治療腫瘤、糖尿病等惡性疾病中,研制多種靶向藥物設計方案[19],在全國范圍內進行推廣,極大提升治療效果,為廣大患者帶來福音,同時還將更加具有可塑性和可信性,從而爆發(fā)出巨大的醫(yī)療經(jīng)濟潛能,推動我國總體醫(yī)療的快速發(fā)展。