苑秋辰,楊浩杰,麻盛淼,沈晨,梁濤
(中國醫(yī)學(xué)科學(xué)院 北京協(xié)和醫(yī)學(xué)院 護(hù)理學(xué)院,北京 100144)
2021年我國工業(yè)和信息化部提出要加強(qiáng)基礎(chǔ)學(xué)科和前沿學(xué)科建設(shè),促進(jìn)新興交叉學(xué)科發(fā)展以提高社會建設(shè)水平[1],因此“醫(yī)工交叉”已成為推進(jìn)護(hù)理學(xué)科發(fā)展的新思路和必然趨勢[2]。美國早在1988年和2008年分別開展護(hù)理信息學(xué)和護(hù)理工程學(xué)培養(yǎng)計(jì)劃[3],是第一個落實(shí)護(hù)理交叉學(xué)科培養(yǎng)的國家。美國國家科學(xué)基金會(National Science Foundation,NSF)的資助領(lǐng)域覆蓋廣,在推動美國科學(xué)發(fā)展中扮演關(guān)鍵角色[4],因此其資助項(xiàng)目能反映美國科學(xué)研究的政策引領(lǐng)和發(fā)展方向,同時,促進(jìn)跨學(xué)科研究也是NSF的重要優(yōu)先事項(xiàng)[5]。近年來Python已成為最受歡迎的編程語言之一,其代表性的網(wǎng)絡(luò)爬蟲、機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘等技術(shù)已初步應(yīng)用到醫(yī)療衛(wèi)生領(lǐng)域中[6-7]。本研究旨在以創(chuàng)新的研究方法借助Python的網(wǎng)絡(luò)爬蟲和自然語言處理技術(shù)對NSF中護(hù)理-信息-工程學(xué)科相關(guān)資助項(xiàng)目進(jìn)行分析,探索護(hù)理-信息-工程學(xué)未來的發(fā)展趨勢,為后續(xù)研究提供參考。
1.1 數(shù)據(jù)來源 計(jì)算機(jī)檢索NSF官網(wǎng)(https://nsf.gov/awardsearch/advancedSearch.jsp),選擇高級檢索,在補(bǔ)充信息中按關(guān)鍵詞分別檢索“nursing”“nurse”“care”“caring”,選擇活躍資助和到期資助,不設(shè)時間范圍。納入標(biāo)準(zhǔn):(1)項(xiàng)目主題與護(hù)理領(lǐng)域相關(guān);(2)項(xiàng)目使用了信息學(xué)或工程學(xué)相關(guān)的技術(shù)。排除標(biāo)準(zhǔn):(1)項(xiàng)目主題為動物或植物;(2)所得數(shù)據(jù)的關(guān)鍵字段(項(xiàng)目編號、項(xiàng)目標(biāo)題、摘要等)有缺失值。
1.2 研究工具 Python是一種易于學(xué)習(xí),功能強(qiáng)大,免費(fèi)、開源、靈活的解釋型編程語言[8]。網(wǎng)絡(luò)爬蟲是指通過編程實(shí)現(xiàn)程序模擬人操作瀏覽器上網(wǎng),并在網(wǎng)站中批量獲取數(shù)據(jù)信息的過程[9]。隱含狄利克雷分布(latent Dirichlet allocation,LDA)是一類貝葉斯層次主題模型,屬于無監(jiān)督機(jī)器學(xué)習(xí)算法中的一種[10],作為高效的自然語言處理模型之一,在醫(yī)療衛(wèi)生領(lǐng)域已被應(yīng)用于社交媒體平臺中相關(guān)主題的文本分析[11-12]。
1.3 研究方法
1.3.1 數(shù)據(jù)采集與存儲及篩選 使用Python的requests模塊對上述網(wǎng)站的公開數(shù)據(jù)進(jìn)行采集,包括每個項(xiàng)目的編號、標(biāo)題、NSF資助機(jī)構(gòu)、摘要、開始日期、項(xiàng)目負(fù)責(zé)人、資助金額等;使用csv模塊將爬取的數(shù)據(jù)保存至本地。根據(jù)納入和排除標(biāo)準(zhǔn)對數(shù)據(jù)進(jìn)行篩選。
1.3.2 數(shù)據(jù)清洗及格式規(guī)范 使用Python的pandas模塊讀取csv文件,將每個項(xiàng)目的標(biāo)題和摘要拼接,用re模塊中的正則表達(dá)式去掉數(shù)據(jù)中的網(wǎng)頁標(biāo)簽,將字符串類型的數(shù)據(jù)全部轉(zhuǎn)換為小寫,將復(fù)數(shù)詞和動詞轉(zhuǎn)化為原形。使用python的jieba模塊對拼接后的數(shù)據(jù)進(jìn)行分詞,并去除停用詞。
1.3.3 詞袋模型建立及主題數(shù)量確定 使用Python中g(shù)ensim模塊的corpora和doc2bow方法將每個項(xiàng)目數(shù)據(jù)的分詞列表轉(zhuǎn)化為詞袋模型[13]。使用gensim、math和matplotlib模塊根據(jù)傳入的詞袋模型繪制困惑度(perplexity,P)-主題數(shù)量(number of topic,NT)關(guān)系圖以確定主題數(shù)量,當(dāng)主題數(shù)量為某一值時P出現(xiàn)極大值拐點(diǎn),且此后P-NT曲線逐步趨于平緩,則認(rèn)為此時的這個值為該詞袋模型的最佳主題數(shù)量[13]。
1.3.4 LDA模型建立及可視化分析 使用Python中g(shù)ensim模塊的LDAmodel方法對上述詞袋模型進(jìn)行主題聚類分析,并使用LDAvis模塊繪制主題間距離圖進(jìn)行可視化效果評估,圖中灰色氣泡表示該主題的詞袋,氣泡越大則詞袋中單詞數(shù)量越多,當(dāng)各氣泡間均無重疊區(qū)域時,認(rèn)為此LDA模型達(dá)最優(yōu)效,主題的相關(guān)性(relevance,r)最好。
1.3.5 各主題代表詞數(shù)量確定 借助文獻(xiàn)計(jì)量學(xué)方法中的齊夫定律[14]選定詞袋中高頻詞的數(shù)量。
2.1 NSF資助項(xiàng)目概況 經(jīng)檢索和篩選,共資助護(hù)理-信息-工程學(xué)項(xiàng)目265項(xiàng),時間跨度為1988年至2023年,累計(jì)資助金額約合6.87億元人民幣。每年立項(xiàng)數(shù)量及資助金額整體呈上升趨勢,詳見圖1。統(tǒng)計(jì)NSF資助金額最高的前10個項(xiàng)目,涵蓋護(hù)理管理、老年護(hù)理、社區(qū)護(hù)理、孕產(chǎn)婦護(hù)理等,技術(shù)層面包括增強(qiáng)現(xiàn)實(shí)、自動化分析、智能互聯(lián)、活動感知分析、可穿戴設(shè)備、新型引流裝置等,詳見表1。NSF資助學(xué)部方面,分別有科技創(chuàng)新與合作學(xué)部(91項(xiàng),34.3%),計(jì)算機(jī)信息科學(xué)與工程學(xué)部(81項(xiàng),30.5%),社會行為與經(jīng)濟(jì)學(xué)部(54項(xiàng),20.3%),工程學(xué)部(27項(xiàng),10.1%),科學(xué)、技術(shù)、工程和醫(yī)藥(science, technology, engineering and medicine,STEM)教育學(xué)部(3項(xiàng),1.1%),教育與人力資源學(xué)部(3項(xiàng),1.1%),主任辦公室(3項(xiàng),1.1%),生物科學(xué)學(xué)部(2項(xiàng),0.7%),數(shù)學(xué)與物理科學(xué)學(xué)部(1項(xiàng),0.3%)。
表1 NSF資助護(hù)理-信息-工程項(xiàng)目金額前10個項(xiàng)目
圖1 NSF每年資助項(xiàng)目數(shù)量和資助金額
2.2 主題數(shù)量確定 使用Python建立詞袋模型并繪制P-NT關(guān)系圖。當(dāng)NT為6時P出現(xiàn)明顯的極大值拐點(diǎn),且此后P-NT曲線變化逐漸減小且逐步趨于平緩;使用Python繪制主題間距離圖如圖2所示,發(fā)現(xiàn)當(dāng)NT為6時,各灰色氣泡間均無重疊區(qū)域。因此本研究將模型擬抽取的最終主題數(shù)量定為6個。
Topic 1:智能技術(shù)在患者安全管理中的研究;Topic 2:面向患者的護(hù)理大數(shù)據(jù)系統(tǒng)的研發(fā);Topic 3:護(hù)士健康及輔助決策工具的研發(fā);Topic 4:虛擬現(xiàn)實(shí)技術(shù)在護(hù)理教育中的應(yīng)用;Topic 5:傳感器和無線輔助設(shè)備的研發(fā);Topic 6:機(jī)器人在醫(yī)院工作流程中的應(yīng)用
2.3 各主題命名及所含高頻詞 使用Python對本研究詞袋中出現(xiàn)的詞進(jìn)行統(tǒng)計(jì),共涌現(xiàn)2153個詞,依據(jù)上述齊夫定律公式計(jì)算得出,前65個出現(xiàn)頻次最多的詞為高頻詞,由于本研究已確定分6個主題,因此平均每個主題納入出現(xiàn)頻次最多的前11個詞,詳見表2。
表2 各主題名稱及所含高頻詞
3.1 NSF資助護(hù)理-信息-工程學(xué)項(xiàng)目力度整體上升 本研究顯示,NSF資助護(hù)理-信息-工程學(xué)項(xiàng)目數(shù)量和資助金額整體呈上升趨勢。美國馬里蘭大學(xué)最早于1988年成立護(hù)理信息學(xué)碩士培養(yǎng)類型[3],自此護(hù)理-信息交叉項(xiàng)目資助開始起步,而2008年麻省大學(xué)阿默斯特分校創(chuàng)立護(hù)理工程學(xué)博士培養(yǎng)類型后[3],護(hù)理-工程學(xué)交叉項(xiàng)目融入NSF資助計(jì)劃中。2019年至今,隨著范德堡大學(xué)、約翰霍普金斯大學(xué)等先后開展護(hù)理工程學(xué)博士或碩士培養(yǎng)類型后[3],NSF對于護(hù)理-信息-工程學(xué)項(xiàng)目資助力度也隨之達(dá)到高峰,4年間資助項(xiàng)目93項(xiàng)(35%),資助金額3600余萬美金(36%)。在NSF資助學(xué)部方面,科技創(chuàng)新與合作學(xué)部和計(jì)算機(jī)信息科學(xué)與工程學(xué)部共涵蓋172項(xiàng),占比達(dá)65%,同時工程學(xué)部單獨(dú)立27項(xiàng),反映出計(jì)算機(jī)信息技術(shù)為工程學(xué)技術(shù)在護(hù)理領(lǐng)域中的初步發(fā)展提供了基礎(chǔ)。建議我國護(hù)理領(lǐng)域保持信息化技術(shù)發(fā)展的同時,不斷拓寬視野,與工程學(xué)專業(yè)人員合作,借助現(xiàn)有信息化技術(shù)和平臺搭載相關(guān)工程技術(shù),為護(hù)理專業(yè)的高水平快速發(fā)展提供幫助。
3.2 NSF資助護(hù)理-信息-工程學(xué)項(xiàng)目對我國的啟示
3.2.1 護(hù)理信息化改善護(hù)理服務(wù)質(zhì)量 護(hù)理信息平臺和健康干預(yù)App已然改善了護(hù)理服務(wù)質(zhì)量[15-16]。如遠(yuǎn)程會診平臺能帶給患者長期信任并為護(hù)理干預(yù)提供支持[17],健康干預(yù)App能促進(jìn)患者的健康行為,同時減輕護(hù)士工作壓力,改善護(hù)理服務(wù)質(zhì)量[15]。但與此同時,護(hù)理信息平臺不可避免地為患者信息安全帶來挑戰(zhàn)[17],健康干預(yù)App的設(shè)計(jì)缺少臨床專家的直接參與也是一大問題[18]。Jaensson等[19]基于“信息技術(shù)-電子健康-護(hù)理專家”的跨學(xué)科團(tuán)隊(duì)開發(fā)了一種用于患者術(shù)后恢復(fù)監(jiān)測和評估的網(wǎng)絡(luò)應(yīng)用程序,為患者的使用提供了便利,提高了護(hù)士評估患者術(shù)后恢復(fù)水平的效率和質(zhì)量。此外,Sara的項(xiàng)目(#2026577)提出了一個獲取患者護(hù)理相關(guān)數(shù)據(jù)的新機(jī)制以保護(hù)患者隱私,并提出一種異步通信工具將家庭健康助理與護(hù)理團(tuán)隊(duì)的成員直接關(guān)聯(lián),通過多時空維度的數(shù)據(jù)收集和反饋機(jī)制實(shí)現(xiàn)協(xié)同護(hù)理工作。Ephraim和Sylvia的項(xiàng)目(#0428420、#0703692、#1035565)也加入了隱私保護(hù)程序,維持了患者基本隱私問題和健康需求的相互平衡。建議今后加大護(hù)理學(xué)與信息科學(xué)的合作力度,從患者隱私安全等實(shí)際問題入手,鼓勵臨床護(hù)理專家直接參與平臺設(shè)計(jì)以促進(jìn)護(hù)理信息平臺的建設(shè),改善護(hù)理服務(wù)質(zhì)量。
3.2.2 計(jì)算機(jī)圖形優(yōu)化虛擬現(xiàn)實(shí)場景革新護(hù)理教育范式 虛擬現(xiàn)實(shí)(virtual reality,VR)至今已發(fā)展至沉浸交互的仿真技術(shù),VR的出現(xiàn)讓一種跨時空的網(wǎng)絡(luò)虛擬學(xué)習(xí)空間正初步形成[20],推動了醫(yī)學(xué)教育事業(yè)的發(fā)展[21]。研究[22-23]證實(shí),VR在護(hù)理教育中是可行的,并且能顯著提升護(hù)生和護(hù)士的學(xué)習(xí)、認(rèn)知和精神活動水平以及護(hù)理技能熟練度、應(yīng)對事件時的自信心和同理心。但在虛擬場景中,學(xué)生缺少了對現(xiàn)實(shí)患者真實(shí)痛苦感受的人文關(guān)懷[21]。Ephraim的項(xiàng)目(#1564065)開發(fā)了一種物理虛擬病床,使用動態(tài)計(jì)算機(jī)圖形及各種傳感器將出汗、呼吸、脈搏跳動、身體各部分溫暖或寒冷的感覺表現(xiàn)出來,將虛擬患者的靈活性與人體模型的物理性相結(jié)合,使人類特征充分融入到VR模型中,讓護(hù)生更好地感受患者所感。Ephraim的項(xiàng)目(#0803652)提出了混合現(xiàn)實(shí)人類,集成觸覺、物理對象和生理監(jiān)控以形成虛擬患者,提高護(hù)生對于患者隱私部位(乳房、骨盆、前列腺)的護(hù)理評估和人際溝通技巧。建議今后學(xué)院教師-臨床護(hù)理人員-VR技術(shù)廠家三方通力合作,針對不同疾病特點(diǎn),結(jié)合臨床經(jīng)驗(yàn)總結(jié)不同疾病患者的臨床真實(shí)感受,構(gòu)建更加真實(shí)和個性化的虛擬患者模型,讓護(hù)生更加全面、真實(shí)地學(xué)習(xí)不同場景下的操作和溝通技巧。
3.2.3 智能輔助設(shè)備優(yōu)化護(hù)理資源配置與護(hù)理決策效率 在護(hù)士短缺的背景下,智能輔助設(shè)備協(xié)助護(hù)士解決臨床問題的發(fā)展思路愈發(fā)受到重視[24]。智能輔助機(jī)器人多存在于醫(yī)院和老年護(hù)理機(jī)構(gòu)中,能幫助患者進(jìn)行轉(zhuǎn)移、行走、力量練習(xí)等,高效減輕護(hù)士的工作負(fù)擔(dān),降低護(hù)士職業(yè)相關(guān)疾病發(fā)生風(fēng)險,逐步發(fā)展為護(hù)士的潛在合作伙伴[25-26]。護(hù)理決策需要護(hù)士收集患者信息,綜合分析后做出判斷,而護(hù)理團(tuán)隊(duì)的年輕化和臨床繁重的工作加重了護(hù)理決策的困難[27]。這樣的背景下,以輔助機(jī)器人為代表的智能輔助設(shè)備可以監(jiān)測患者實(shí)時行為,一定程度上降低了護(hù)士的工作量和職業(yè)相關(guān)疾病的患病風(fēng)險,但其無法監(jiān)測患者所處環(huán)境的狀態(tài),由此非接觸式環(huán)境智能傳感技術(shù)應(yīng)運(yùn)而生,更加全面地協(xié)助護(hù)士滿足患者需求[28],達(dá)到不良事件預(yù)警的作用。Sara的項(xiàng)目(#2026498)開發(fā)了一款環(huán)境智能監(jiān)控設(shè)備,包括開發(fā)硬件(相機(jī)、深度傳感器和麥克風(fēng))捕獲患者受隱私保護(hù)的數(shù)據(jù)、開發(fā)算法識別患者臨床活動行為的程度、醫(yī)護(hù)人員輸入互動信息、臨床實(shí)驗(yàn)探究設(shè)備可用性。建議護(hù)理專業(yè)人員聯(lián)合科技部門人員協(xié)同研究,以更優(yōu)的算法處理從環(huán)境中監(jiān)測到的冗雜臨床數(shù)據(jù),為優(yōu)質(zhì)護(hù)理決策提供保障,實(shí)現(xiàn)患者-環(huán)境-護(hù)士一體化的智能護(hù)理路徑,通過智能技術(shù)賦能提升護(hù)理資源配置與決策效率。
3.3 本研究的局限性 本研究基于Python語言實(shí)現(xiàn)了對NSF中護(hù)理-信息-工程學(xué)科相關(guān)立項(xiàng)的數(shù)據(jù)采集和分析,同時存在一定的局限性:(1)NSF中每個檢索詞最多只開放3000條檢索結(jié)果,這可能導(dǎo)致數(shù)據(jù)采集不完整。(2)截至目前,尚未有護(hù)理學(xué)專用的中英文停用詞表和分詞庫,英文文本的分詞多數(shù)是以空格和連接符為區(qū)分,可能會導(dǎo)致分詞結(jié)果存在部分偏倚。(3)LDA模型多用于對文本的情感得分進(jìn)行分析,但對于政策類文本數(shù)據(jù)的分類效果有待納入更大樣本的數(shù)據(jù)進(jìn)一步驗(yàn)證。
本研究使用Python語言的網(wǎng)絡(luò)爬蟲和機(jī)器學(xué)習(xí)技術(shù)對NSF資助的護(hù)理-信息-工程學(xué)項(xiàng)目進(jìn)行分析,從資助項(xiàng)目概況和項(xiàng)目主題兩方面進(jìn)行論述,為促進(jìn)我國護(hù)理-信息-工程學(xué)科發(fā)展提供參考。在后續(xù)研究中,護(hù)理學(xué)者可根據(jù)國家最新政策,結(jié)合國情不斷拓寬護(hù)理-信息-工程學(xué)交叉發(fā)展的深度和廣度,推動我國護(hù)理事業(yè)的發(fā)展。