吳雅琴,王曉東
(內蒙古醫(yī)科大學計算機信息學院,內蒙古 呼和浩特 010110)
《醫(yī)學信息學雜志》是國內醫(yī)學信息方面的專業(yè)指導性刊物,也是醫(yī)學信息領域具有權威性與專業(yè)指導性的學術刊物。近年來未有研究者基于關鍵詞探討《醫(yī)學信息學雜志》發(fā)表論文的研究熱點。關鍵詞是對文獻研究內容的高度凝練,通過高頻關鍵詞共現(xiàn)分析計算研究熱點的分析指標[1]。本文對2010-2019 年《醫(yī)學信息學雜志》刊載論文進行高頻關鍵詞聚類分析,通過定量研究,了解醫(yī)學信息研究領域的熱點內容和核心命題。
1.1 數(shù)據(jù)來源 以中國知網(wǎng)(CNKI)期刊數(shù)據(jù)庫為數(shù)據(jù)源,檢索策略設定為:文獻來源=“醫(yī)學信息學雜志”,發(fā)表時間為2010 年1 月1 日-2019 年12 月31 日,檢索時間為2020 年10 月16 日,共獲得文獻3256 篇。
1.2 方法 將所獲得文獻導入NoteExpress,剔除文獻中通訊消息、會議通知、新聞報道,無作者或作者為本刊編輯部等非學術論文及重復文獻。對有效文獻中的同義或近義關鍵詞進行合并,將“互聯(lián)網(wǎng)+醫(yī)療”并入“互聯(lián)網(wǎng)+”醫(yī)療,“軍衛(wèi)1 號”工程并入“軍衛(wèi)1 號”,將“醫(yī)院圖書館”“高校圖書館”“醫(yī)學圖書館”“醫(yī)學院校圖書館”并入“圖書館”等。將清洗后的文獻數(shù)據(jù)源調整成統(tǒng)一的SATI 格式進行研究[2],統(tǒng)計關鍵詞數(shù)量及頻次,根據(jù)Donohue 于1973 年提出的高頻詞低頻詞分界公式:
計算醫(yī)學信息學期刊高頻詞閾值,構建共詞矩陣,將結果導入SPSS 23.0 進行關鍵詞聚類,對《醫(yī)學信息學雜志》刊載文獻研究熱點進行分析。
2.1 基本情況 最終得到有效文獻2599 篇,作者7850 名,每篇文獻平均3.02 名作者,總機構數(shù)3240個,每篇文獻平均1.32 個機構,總關鍵詞數(shù)9263個,每篇文獻平均3.56 個關鍵詞。
2.2 高頻關鍵詞 根據(jù)Donohue 高頻詞低頻詞分界公式,高頻關鍵詞閾值T 為95.23,期刊文獻研究領域僅有3 個高頻詞,不能完全代表研究熱點。根據(jù)經(jīng)驗法則,為更好的研究描述領域內的研究熱點,本研究選取20 作為高頻詞閾值對文獻研究熱點進行統(tǒng)計分析,共得到32 個關鍵詞,占總關鍵詞的0.70%,總頻次1561,見表1。《醫(yī)學信息學雜志》刊載文獻的高頻關鍵詞頻次時間序列見圖1,結果顯示,隨著計算機科學和信息技術的快速發(fā)展及其在醫(yī)療健康領域的廣泛應用,更多的研究開始關注新技術在健康醫(yī)療領域的應用實踐。
圖1 高頻關鍵詞頻次時間序列
表1 2010-2019《醫(yī)學信息學雜志》刊載文獻的高頻關鍵詞(n,%)
2.3 高頻關鍵詞共現(xiàn)矩陣 將所獲得的高頻關鍵詞作為詞共現(xiàn)分析基本單元,使用SATI 軟件生成高頻關鍵詞頻次矩陣,部分結果見表2。
表2 2010-2019《醫(yī)學信息學雜志》刊載文獻高頻關鍵詞頻次矩陣(部分)
2.4 高頻關鍵詞因子分析 因子分析結果顯示,特征值大于1 的有11 個因子,可以解釋高頻關鍵詞92.0890%的信息,將特征根與累積貢獻率結合進行判斷,11 個因子基本可以說明近10 年《醫(yī)學信息學雜志》的研究熱點與領域,見圖2。
圖2 碎石圖
2.5 高頻關鍵詞聚類分析 將高頻關鍵詞導入SPSS 23.0 進行多維尺度分析,“根據(jù)數(shù)據(jù)創(chuàng)建距離”為“歐氏距離”時,Stress=0.06540,RSQ=0.99497,擬合效果比較理想,可反映《醫(yī)學信息學雜志》近10 年文獻高頻關鍵詞間的聯(lián)系。將高頻關鍵詞在SPSS 23.0 中進行層次聚類分析,聚類譜系圖見圖3。
圖3 聚類譜系圖
因子分析是將具有錯綜復雜關系的變量(或案例)綜合為少數(shù)幾個因子,以再現(xiàn)原始變量與因子之間的相互關系,探討多個能直接測量且具有一定相關性的實測指標是如何受少數(shù)幾個內在的獨立因子支配的,并在條件許可時借此嘗試對變量進行分類[3]。結合因子分析,從聚類譜系圖確定聚為5 類較為合適,這些類別基本反映了《醫(yī)學信息學雜志》2010-2019 年間的熱點領域,現(xiàn)分析如下。
3.1 文獻計量知識圖譜 科學知識圖譜的繪制和分析,是從以往發(fā)表的大量科學研究文獻中,提取并重新組織可視化知識,進行知識發(fā)現(xiàn)[4]??茖W知識圖譜涉及的相關理論及實踐是2010-2019 年醫(yī)學信息學領域的研究熱點。各位學者通過文獻計量法,利用知識圖譜工具展現(xiàn)醫(yī)學信息學不同實踐應用領域的演進路徑、研究熱點、前沿領域、發(fā)展趨勢等,梳理出醫(yī)學信息技術在醫(yī)學科技創(chuàng)新、臨床診療與護理、疾病預防控制、藥物研發(fā)、醫(yī)療保險、醫(yī)學教育等方面的具體應用情況。
3.2 圖書館知識服務 知識管理與知識服務是我國知識研究領域學者近年來關注的熱點,其主要研究內容涉及醫(yī)學圖書館信息服務,知識服務的精細化管理,醫(yī)學圖書館服務水平提升,醫(yī)學圖書館信息資源利用和開發(fā),醫(yī)學信息服務模式的轉變,學科館員人才隊伍建設,以及新技術在醫(yī)學圖書館建設中應用等內容。
3.3 信息技術在健康醫(yī)療領域的深入應用 在推動大數(shù)據(jù)與云計算、物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)等新一代信息技術融合發(fā)展的過程中,隨著新一代信息技術在醫(yī)療場景應用的不斷深入,相關的實踐應用研究近些年成為越來越多的學者所關注的熱點。研究內容涵蓋健康醫(yī)療的各個應用場景,包括健康大數(shù)據(jù)平臺研發(fā)與應用,基于大數(shù)據(jù)的醫(yī)療文本挖掘,遠程醫(yī)療服務模式研究,遠程醫(yī)療會診平臺應用研究,基于物聯(lián)網(wǎng)技術的健康醫(yī)療系統(tǒng)開發(fā)與應用,基于大數(shù)據(jù)的移動醫(yī)療、移動護理實踐應用,電子病歷自然語言處理,基于電子病歷的臨床數(shù)據(jù)中心建設,基于移動技術的新一代醫(yī)院信息系統(tǒng)的設計與開發(fā),醫(yī)療數(shù)據(jù)挖掘等。大量學者從各自的醫(yī)療實踐出發(fā),展示了近十年來信息技術在醫(yī)療領域的實踐應用成果。
3.4 信息素養(yǎng)培養(yǎng)研究 信息素養(yǎng)由美國信息產(chǎn)業(yè)協(xié)會主席保羅于1974 年提出的,將其定義為“利用大量的信息工具及主要信息源使問題得到解答的技術和技能”[5]。學者主要研究內容包括信息素養(yǎng)內涵,信息素養(yǎng)評價模型,信息素養(yǎng)培養(yǎng)途徑,醫(yī)學院校學生信息素養(yǎng)現(xiàn)狀調查,醫(yī)務人員、醫(yī)學生信息素養(yǎng)培養(yǎng),信息素養(yǎng)培養(yǎng)與學科課程整合研究等。
3.5 文獻檢索與科技查新 科技查新是文獻檢索和情報調研相結合的研究工作,主要研究科技查新服務、方法,文獻檢索課程現(xiàn)狀、改革等。
綜上所述,本研究對刊載文獻關鍵詞進行了一定的規(guī)范化處理,通過對關鍵詞的共現(xiàn)分析、因子分析和聚類分析,發(fā)現(xiàn)《醫(yī)學信息學雜志》近十年刊載文獻的熱點研究領域主要包括文獻計量知識圖譜,圖書館知識服務,信息技術在健康醫(yī)療領域的深入應用,信息素養(yǎng)培養(yǎng)研究及文獻檢索與科技查新等方面。