王東軍,朱青青,余靜寅,鐘慧慧,孫 璇,關媛媛,王泓午**
(1. 天津中醫(yī)藥大學健康科學與工程學院 天津 301617;2. 北京中醫(yī)藥大學東方學院 廊坊 065000)
舌診是中醫(yī)學中具有特色診斷的方法,舌診在中醫(yī)辨證診療中具有重要的作用。舌診是通過觀察人體舌象變化診察疾病的傳統(tǒng)診療手段。隨著互聯(lián)網(wǎng)、計算機等技術的發(fā)展,中醫(yī)舌診的客觀化研究取得了較大成績。舌象客觀化是在傳統(tǒng)中醫(yī)舌診理論的指導下,通過圖像識別技術開展研究。舌診客觀化研究主要依賴圖像識別技術,將標準化收集的舌象經過圖像校正、圖像去噪、舌象分割等預處理,通過對舌質、舌苔顏色和形態(tài)特征分析總結[1]。在研究大量舌診數(shù)據(jù)的基礎上,模擬臨床診療過程[2],利用“舌診”客觀輔助診療技術采集客觀數(shù)據(jù),為疾病診療提供客觀基礎[3]。將信息、知識等抽象數(shù)據(jù)以直觀可視的形式呈現(xiàn)出來有利于數(shù)據(jù)分析、知識發(fā)現(xiàn)、規(guī)律探索[4]。近年來科學知識圖譜——科學計量學的新方法在我國發(fā)展迅速??茖W知識圖譜以知識域為對象,顯示科學知識的發(fā)展進程與結構關系的一種圖像,呈現(xiàn)知識單元或知識群之間網(wǎng)絡、結構、演化或衍生等隱含的復雜關系[5]。CiteSpaceⅡ軟件是新一代信息可視化工具,通過繪制相關研究領域的知識圖譜,展示發(fā)展動向與趨勢,呈現(xiàn)研究前沿領域的熱點和發(fā)展歷程[6]。應用科學計量可視化方法進行舌診客觀化研究的文獻尚不多見,因此應用CiteSpace 歸納中醫(yī)舌診客觀化研究熱點和前沿十分必要。本文通過檢索中國知網(wǎng)(CNKI)近20年中醫(yī)舌診客觀化研究領域相關文獻,應用CiteSpace 軟件V5.7R1版本的共現(xiàn)分析功能,對中醫(yī)舌診客觀化研究領域的有關文獻的作者、研究機構、關鍵詞進行合作網(wǎng)絡共現(xiàn)分析,總結該研究領域近20年的現(xiàn)狀、趨勢、熱點前沿。本研究內容依托國家科技部“十三五”國家重點研發(fā)計劃中醫(yī)藥現(xiàn)代化研究重點專項(2017YFC1703305):中醫(yī)舌象診斷規(guī)范與標準研究及應用,通過應用CiteSpace 軟件分析中醫(yī)舌診客觀化研究現(xiàn)狀及發(fā)展規(guī)律,為中醫(yī)舌象診斷規(guī)范與標準研究奠定基礎。
圖1 舌客觀化研究發(fā)表文獻時間分布
檢索條件:發(fā)表時間between(2001-01-01,2019-12-31)并且(((主題= 舌診或者題名= 舌診或者v_subject=中英文擴展(舌診)或者title=中英文擴展(舌診))或者(主題= 舌象或者題名= 舌象或者v_subject=中英文擴展(舌象)或者title=中英文擴展(舌象)))并且(主題=客觀化或者題名=客觀化或者v_subject=中英文擴展(客觀化)或者title=中英文擴展(客觀化)))(模糊匹配)。文獻類型為期刊、學位論文、會議論文。檢索到文獻總數(shù):457 篇。人工檢索去重后,得到有效文獻407篇。
統(tǒng)計發(fā)表文獻數(shù)量、作者、研究機構等,應用CiteSpace 軟件5.7 對發(fā)文作者、研究機構、關鍵詞進行可視化分析。將上述文獻以refworks 格式導出,規(guī)范為CiteSpace 軟件可以識別的“download_”格式,導入CiteSpace5.7軟件中,將文獻進行研究機構、作者、關鍵詞共現(xiàn)及聚類分析。軟件參數(shù)設置:Time Slicing 模塊下,設置時間跨度為2001年-2019年,時間分區(qū)以1年為1 個單位;設置“Title”“Abstract”“Author Keywords”。將節(jié)點類型(Node Type)設置為“Keywords”;對象間的連接強度(Link Strength)選擇“Cosine”,范圍(Scope)選擇“With Slices”;數(shù)據(jù)刪選標準(Selection Criteria)設置“TopN”分別為50,篩選出每1年中出現(xiàn)頻率最高的前50 名關鍵詞;g-index(k= 25,LRF = 3.0,LBY = 8,e=2.0)。修剪選項(Pruning):關鍵路徑(Pathfinder)。選擇對數(shù)似然比(Log-likelihood ratio,LLR)算法、淺語義索引(Latent Semantic Idexing,LSI)算法對關鍵詞進行聚類分析并標記聚類標簽。
以每1年為1 個時間區(qū)間,分析2001年-2019年的相關文獻發(fā)表情況,近20年中國知網(wǎng)關于舌診客觀化研究領域刊載相關文獻407 篇,整體上呈波浪式上升趨勢,2003-2006年、2008年-2010年發(fā)文數(shù)量快速增長,特別是2009年載文數(shù)量最多(圖1)。主要研究主題包括中醫(yī)舌診、舌診客觀化、中醫(yī)舌象、中醫(yī)診斷、圖像分割、圖像處理、特征提取、冠心病、顏色特征、中醫(yī)證型、慢性乙型肝炎等熱點內容(圖2)。
分析納入文獻可知,近20年發(fā)表過該研究領域相關文獻的作者共437 人,發(fā)文量前20 的作者中,發(fā)文30篇的王憶勤是發(fā)文量最高的作者(表1)。由此可計算該研究領域的核心作者人數(shù)。核心作者最低發(fā)文量N= 0.749 ×ηmax1/2(ηmax 即最高產作者的發(fā)文量)[7],ηmax=30,可得N≈4。核心作者共39人,占所有發(fā)文人數(shù)的8.92%。根據(jù)賴普斯定律,核心作者的發(fā)文量應占文獻總數(shù)的一半,故該研究領域尚未形成核心作者團隊。高產作者合作網(wǎng)絡形成以許家佗、陸小左、沈蘭蓀、吳勁松為代表的4個較大的研究團隊(圖3)。
應用CiteSpace 軟件繪制“中醫(yī)舌診客觀化”研究機構合作圖譜(圖4),圖中每個同心圓環(huán)的大小代表機構的發(fā)文量,圓環(huán)越大說明發(fā)文數(shù)量越多。節(jié)點之間的連線粗細代表不同機構之間的合作強度。其網(wǎng)絡密度為0.0072,包含208個節(jié)點,155條連線,呈現(xiàn)該研究領域的機構合作態(tài)勢。高產機構發(fā)文量前20 中上海中醫(yī)藥大學發(fā)文數(shù)量最多,發(fā)文62 篇,為最高產的研究機構(表2)。由高產機構發(fā)文量前10空間分布可知,該領域研究機構主要分布在上海、天津、北京、廣東等東部沿海地區(qū);中、西部地區(qū)研究機構分布不足。中心性是測度節(jié)點在網(wǎng)絡中的重要性的一個指標,用來發(fā)現(xiàn)和衡量文獻的重要性,并用紫色圈進行標注[8]。上海中醫(yī)藥大學對該領域研究開展較早,且長期處于學術領先地位。上海中醫(yī)藥大學、天津中醫(yī)藥大學、上海中醫(yī)藥大學附屬曙光醫(yī)院、北京工業(yè)大學等研究機構發(fā)文數(shù)量較多。高產機構中心性偏低,在學術領域內還缺乏較強的影響力。圖4可見該領域研究機構整體上分布較分散,主要形成了以上海中醫(yī)藥大學、天津中醫(yī)藥大學為中心的2 個較大的合作網(wǎng)絡,在研究機構網(wǎng)絡中發(fā)揮重要的“橋梁”作用,是連接華東、華北、華南地區(qū)研究“陣地”的關鍵節(jié)點。
圖2 中國知網(wǎng)所載文獻主題(前20)分布
表1 發(fā)文量前20作者情況表
圖3 高產作者共現(xiàn)網(wǎng)絡分析
納入的文獻中有234 篇為期刊論文,其中發(fā)表在核心期刊中的論文有184篇(78.6%),發(fā)表在非核心期刊的論文有50 篇(21.4%)。其中載文量最多的期刊為《中華中醫(yī)藥雜志》,累計發(fā)文14 篇,占納入期刊文獻總數(shù)的5.98%。根據(jù)普賴斯定律,本文核心期刊最低文獻量m== 2.802,取整數(shù)為3,載文量3篇以上的期刊共計28 本,2001年-2019年累計刊載中醫(yī)舌診客觀化研究領域文獻147 篇,占期刊文獻總量的62.8%>50%,符合普賴斯定律的要求。表明該研究領域核心期刊已經形成。中醫(yī)舌診客觀化研究領域刊文量在前20期刊情況(表3)。
圖4 研究機構合作網(wǎng)絡共現(xiàn)圖譜
表2 研究機構前10分布情況表
表3 中醫(yī)舌診客觀化研究文獻刊載期刊前20統(tǒng)計表
關鍵詞反映該文獻的主要研究內容和熱點,通過對科學文獻中的關鍵詞進行聚類分析,總結近20年來該研究領域的發(fā)展歷程、研究方向、研究熱點。應用CiteSpace 軟件對文獻中的關鍵詞進行提取,并繪制關鍵詞共現(xiàn)網(wǎng)絡。共現(xiàn)次數(shù)為關鍵詞出現(xiàn)的次數(shù),通過高頻關鍵詞呈現(xiàn)該領域的研究熱點[9]。中介中心性高的節(jié)點往往位于連接2 個不同聚類的路徑上,用來確定群體的算法就是利用這個特點來區(qū)分網(wǎng)絡中的聚類[10]。該領域研究文獻的關鍵詞共現(xiàn)知識圖譜(圖5),圖譜包含451 個節(jié)點,1019 條連線,其網(wǎng)絡密度為0.01。共計451 個關鍵詞,統(tǒng)計頻次前20 關鍵詞和中心性(表4)。由表4可見舌診、舌象、舌診客觀化、客觀化研究、圖像分割等為出現(xiàn)頻率較高的關鍵詞。中心性強的關鍵詞,出現(xiàn)的頻率多較高。由圖5 可見該研究領域起到“橋梁”作用的關鍵詞(中心性>0.1)有5個,如“舌診”節(jié)點出現(xiàn)頻次最高(130 次),中心性最高(0.71);“舌象”節(jié)點出現(xiàn)64次,其中心性為0.35;“客觀化”頻次為62,其中心性為0.25;“舌診客觀化”頻次為54,其中心性為0.36;“客觀化研究”頻次為16,其中心性為0.17。在關鍵詞共現(xiàn)網(wǎng)絡視圖(圖5)的基礎上,進行關鍵詞聚類分析,采用對數(shù)似然比(LLR)算法對聚類進行標記,可以更清晰地展示該研究領域的載文熱點(圖6、表5)。聚類模塊值(Modularity)Q值=0.6939,Q≥0.5 聚類結構顯著;聚類平均輪廓值(Silhouette)S值= 0.5748,S值>0.5,聚類結果合理;表明該圖譜能較好地反映文獻的研究熱點。該研究領域關鍵詞聚類分析形成14 個較為合理的聚類(S值均>0.7):#0 舌診、#1 舌診客觀化、#2 客觀化、#3 舌象、#4 流行病學、#5 客觀化研究、#6 中醫(yī)、#7 慢性乙型肝炎、#8 齒痕、#9小波變換、#10 體質、#11 顯色性、#13 圖象分割、#14 信息分析系統(tǒng)。應用淺語義索引(LSI 算法)對關鍵詞聚類進行標注(圖7),并總結其主要研究方向:#0基于近紅外光譜的舌診疾病識別的研究、#1 中醫(yī)舌象分析儀的實用化研究、#2 慢性乙型重型肝炎陽毒內盛證色診客觀化研究、#3 冠心病患者中醫(yī)證型、舌象與冠脈造影結果相關性的研究、#4 原發(fā)性高血壓病中醫(yī)舌象與證候的相關性研究、#5 中醫(yī)病證智能化診斷與分類研究進展、#6 人體舌苔的反射光譜特征分析、#7 慢性乙型肝炎舌診客觀化臨床觀察、#8 舌診中若干圖像分析關鍵技術的研究、#9 舌象信息的采集處理及模式識別、#10 子宮肌瘤患者舌苔脫落細胞成熟度與體質的相關性研究、#11 舌象信息客觀化研究中光源選擇初探、#13 彩色圖象分割及其在中醫(yī)舌圖象處理中的應用、#14 應用舌診綜合信息分析系統(tǒng)對原發(fā)性肝癌舌質顏色的定量分析。將關鍵詞聚類共現(xiàn)知識圖譜轉換為Time Line 聚類時間線圖(圖8)和Time Zone 時區(qū)演化圖(圖9),并檢測突現(xiàn)詞(Citation Burst)(圖10),可清晰地發(fā)現(xiàn)近年來該領域的研究熱點、前沿內容。
圖5 中醫(yī)舌診客觀化研究領域關鍵詞共現(xiàn)網(wǎng)絡視圖
圖6 中醫(yī)舌診客觀化研究文獻關鍵詞聚類(LLR算法)視圖
表4 舌診客觀化研究文獻關鍵詞前20分布情況表
表5 舌診客觀化研究文獻關鍵詞聚類分析
圖7 中醫(yī)舌診客觀化研究文獻關鍵詞聚類(LSI算法)視圖
圖8 中醫(yī)舌診客觀化研究文獻關鍵詞聚類(#0-8)Time Line時間線圖
圖9 中醫(yī)舌診客觀化研究文獻關鍵詞聚類Time Zone時區(qū)演化圖
圖10 中醫(yī)舌診客觀化研究關鍵詞(TOP20)突現(xiàn)圖
近年來中國知網(wǎng)刊載中醫(yī)舌診客觀化研究領域文獻呈上升趨勢,2003年-2006年、2008年-2010年發(fā)文數(shù)量快速增長,特別是2009年載文數(shù)量最多。該領域研究主題主要包括中醫(yī)舌診、舌診客觀化、中醫(yī)舌象、中醫(yī)診斷、圖像分割、圖像處理、顏色空間、特征提取、冠心病、顏色特征、中醫(yī)證型、慢性乙型肝炎等熱點內容。該研究領域核心期刊已經形成。相關文獻的作者共437人,核心作者的整體發(fā)文數(shù)量不足,該研究領域尚未形成核心作者團隊。高產作者其網(wǎng)絡密度較低,作者分布較分散,初步形成了形成以許家佗、陸小左、沈蘭蓀、吳勁松為代表的四個較大的研究團隊。上海中醫(yī)藥大學在該研究領域長期保持領先地位。研究機構主要分布在東部沿海地區(qū);中、西部地區(qū)研究機構分布不足,這可能與地區(qū)間科技發(fā)展水平不均衡有關。
通過對關鍵詞進行突變分析,突變強度最高的關鍵詞為舌診客觀化(3.7655),其他突變強度較高的關鍵詞有顏色分析、中軸變換、模式識別、圖像分割、圖像分析技術、慢性乙型肝炎、中醫(yī)現(xiàn)代化、原發(fā)性肝癌、定量分析、舌診專家系統(tǒng)等。2003年-2005年數(shù)字舌圖、彩色校正、彩色紋理分割、圖像分割技術、中軸變換、原發(fā)性肝癌等內容研究熱度較高;2006年-2007年層次分析法、舌象采集、舌診專家系統(tǒng)、心腦血管病、定量分析、紋理分析、顏色分析、中醫(yī)藥現(xiàn)代化、神經網(wǎng)絡等為研究熱點;2008年-2010年研究熱點有模式識別、原發(fā)性腎小球疾病、舌象儀等;2011年-2012年研究熱點內容為數(shù)字圖像處理、醫(yī)學攝影、數(shù)字化舌象分析儀、近紅外光譜、最小二乘法、臨床應用等;2015年-2019年研究的熱點和前沿有2 型糖尿病、bp 神經網(wǎng)絡、數(shù)據(jù)挖掘、舌脈象參數(shù)、中醫(yī)四診客觀化、三維重建、舌象特征提取、Snakes 算法、舌象分割、三維舌象儀、支持向量機等內容。通過關鍵詞聚類分析與突變分析,總結其主要研究的熱點內容包括3部分:
3.2.1 中醫(yī)病證智能化診斷與分類研究
具體包括慢性乙型肝炎色診客觀化研究、冠心病患者中醫(yī)證型、舌象與冠脈造影結果相關性的研究、原發(fā)性高血壓病中醫(yī)舌象與證候的相關性研究、慢性乙型肝炎舌診客觀化臨床觀察、原發(fā)性肝癌舌質顏色的定量分析等熱點內容。筆者認為應用中醫(yī)舌象智能輔助診斷系統(tǒng)、計算機與圖像處理技術對相關疾病患者舌象和舌象參數(shù)、中醫(yī)證候指標進行觀察和定量分析,是中醫(yī)舌診客觀化研究的重要途徑,具有重要的意義。
3.2.2 舌診圖像識別、圖像分割、圖像處理、圖像分析關鍵技術
筆者認為在中醫(yī)舌診客觀化研究過程中,舌象識別與圖像分割、圖像分析技術是關鍵技術。在研究過程中通過數(shù)字圖像處理的方法對舌象進行分析、識別、診斷;基于彩色信息區(qū)分度和小波變換的彩色邊緣檢測方法提取舌象。在顏色、紋理、邊緣檢測分割法的基礎上,應用改進的Snake 算法對進行舌象分割。采用聚類鄰算法等獲得舌象的顏色分布,還原立體舌象,重建三維舌象的光度立體法[11]。
3.2.3 中醫(yī)舌象分析儀、圖像采集設備的實用化研究
具體包括數(shù)字化中醫(yī)舌象分析儀、舌診綜合信息分析系統(tǒng)、舌診專家系統(tǒng)、圖像采集設備的研發(fā)等。筆者認為舌象分析儀研發(fā)和使用有利于突破傳統(tǒng)舌診方法的局限性,對中醫(yī)的臨床診斷、教學、科研具有重要的意義。通過舌象儀、中醫(yī)舌診綜合信息分析系統(tǒng)等的推廣和應用,有利于規(guī)范地、標準地采集患者舌診信息,形成定量化、客觀化的舌診宏觀參數(shù)和微觀參數(shù),為后續(xù)中醫(yī)舌象量化診斷、標準和規(guī)范的制訂奠定基礎。
①該領域的核心研究力量不足,整體分布較分散。②研究機構跨區(qū)域合作不足,存在一定的學術壁壘。③研究機構中心性偏低,在學術領域內還缺乏較強的影響力;研究機構整體以中醫(yī)藥大學及附屬醫(yī)院為主,其他科研院所對該領域研究不足。④該領域研究區(qū)域發(fā)展不均衡,主要的研究陣地集中在經濟發(fā)達的東部沿海地區(qū)。因此筆者認為在中醫(yī)理論的指導下,通過運用圖像處理技術、計算機技術,結合中醫(yī)專家的臨床經驗,進行舌象分析,實現(xiàn)舌診定量化、客觀化的研究是必然趨勢,需要多學科交流、協(xié)同創(chuàng)新、深度合作才能完成。