謝夢(mèng)怡
(泉州信息工程學(xué)院 軟件學(xué)院,福建 泉州 362000)
醫(yī)院每天接受大量的病患,從患者進(jìn)入醫(yī)療醫(yī)院診治到診治結(jié)束,所經(jīng)歷的一切事宜都會(huì)記錄成文字、報(bào)告、影像,將這些信息綜合到一起形成檔案,由于在短時(shí)間內(nèi)很難建立出最完善的醫(yī)療檔案,由此嚴(yán)重影響了當(dāng)代醫(yī)療事業(yè)的發(fā)展[1]。近年來(lái),醫(yī)療檔案信息共享、數(shù)字化醫(yī)院、醫(yī)院數(shù)字化建設(shè)等概念不斷出現(xiàn),也使得“醫(yī)院檔案信息搜索”這一概念成為人們熱門(mén)研究的問(wèn)題[2]。
文獻(xiàn)[3]提出了基于信息網(wǎng)模型的Web實(shí)體語(yǔ)義信息搜索方法,使用信息網(wǎng)模型對(duì)Web數(shù)據(jù)進(jìn)行語(yǔ)義表示和建模,將實(shí)體的所有語(yǔ)義信息組織在一個(gè)對(duì)象中,快速獲取實(shí)體完整的語(yǔ)義信息,基于信息網(wǎng)模型構(gòu)建復(fù)雜語(yǔ)義數(shù)據(jù)庫(kù),設(shè)計(jì)可對(duì)教育領(lǐng)域相關(guān)實(shí)體信息進(jìn)行精確搜索的TLDW系統(tǒng)。但該方法花費(fèi)的搜索時(shí)間較長(zhǎng)。文獻(xiàn)[4]提出一種基于模糊集的海量圖書(shū)館檔案信息快速檢索方法,利用多個(gè)向量代表檔案信息的對(duì)象,建立特征向量模型對(duì)圖書(shū)館檔案信息進(jìn)行處理,需要在數(shù)據(jù)庫(kù)中對(duì)檔案信息的語(yǔ)義索引和語(yǔ)義特征向量進(jìn)行處理。在對(duì)圖書(shū)館檔案信息處理完成的基礎(chǔ)上,計(jì)算索引項(xiàng)在檔案信息中的頻率,對(duì)圖書(shū)館檔案信息檢索式進(jìn)行量化和劃分,獲得檔案信息向量,利用檔案信息向量計(jì)算相似度函數(shù),實(shí)現(xiàn)模糊集的圖書(shū)館檔案信息快速檢索方法。但該方法搜索結(jié)果的相關(guān)性較差。
針對(duì)以上問(wèn)題,提出基于機(jī)器視覺(jué)的醫(yī)院檔案信息智能搜索方法。作為人工智能領(lǐng)域的一個(gè)分支,機(jī)器視覺(jué)具有成本低、效果好、操作簡(jiǎn)單等優(yōu)點(diǎn)。將其應(yīng)用到醫(yī)院檔案信息智能搜索中,可以有效提高搜索效率,確保搜索的精準(zhǔn)率。
醫(yī)院檔案信息主要包括患者從進(jìn)入醫(yī)院診治到診治結(jié)束過(guò)程中的檢驗(yàn)報(bào)告、影像以及病況記錄等。基于機(jī)器視覺(jué)智能搜索醫(yī)院檔案信息,需要確定信息的目標(biāo)區(qū)域,對(duì)醫(yī)院檔案信息的目標(biāo)區(qū)域選取可以縮小醫(yī)院海量檔案信息的搜索范圍。采用機(jī)器視覺(jué)多視角注意的方法選取目標(biāo)區(qū)域。機(jī)器視覺(jué)多視角注意指的是在眾多物體中從多個(gè)角度選擇性地進(jìn)行注意,這種方式可以確保機(jī)器在復(fù)雜的日常環(huán)境中高效完成活動(dòng)[5-7]。如圖1所示為多視角下機(jī)器視覺(jué)注意模型。
圖1 機(jī)器視覺(jué)注意模型Fig.1 Machine vision attention model
機(jī)器視覺(jué)注意檔案信息主要有2種,分別是自下而上注意機(jī)制和自上而下注意機(jī)制,這2種注意機(jī)制會(huì)共同發(fā)揮作用,二者不可分開(kāi),但是在不同情況下,兩種機(jī)制發(fā)揮的作用權(quán)重是不同的[8-9]。
機(jī)器視覺(jué)注意的方式可減少云機(jī)器在執(zhí)行任務(wù)時(shí)的計(jì)算量,會(huì)根據(jù)目前的任務(wù)進(jìn)行一系列的動(dòng)作,降低智能搜索過(guò)程的復(fù)雜性。機(jī)器在注意到目標(biāo)后,會(huì)自動(dòng)對(duì)醫(yī)院檔案信息目標(biāo)進(jìn)行采樣,提取相應(yīng)的特征,搜索焦點(diǎn),確定目標(biāo)為感興趣目標(biāo)后,對(duì)目標(biāo)區(qū)域投入注意力。具體的目標(biāo)區(qū)域選取過(guò)程如圖2所示。
圖2 目標(biāo)區(qū)域選取流程Fig.2 Target area selection process
根據(jù)圖2中的選取流程,將目標(biāo)區(qū)域選擇設(shè)置為三個(gè)階段:預(yù)注意階段、顯著信息生成階段、注意力轉(zhuǎn)移階段。
(1) 預(yù)注意階段。通過(guò)計(jì)算得到醫(yī)院檔案早期視覺(jué)特征,針對(duì)所有的醫(yī)院檔案信息進(jìn)行計(jì)算,一般檔案中的顯著性越強(qiáng),特征越明顯,通過(guò)競(jìng)爭(zhēng)的方式表現(xiàn)[9]。
(2) 顯著信息生成階段。當(dāng)預(yù)處理階段得到計(jì)算結(jié)果之后,將待搜索的醫(yī)院檔案中的顯著信息提取,這些顯著信息對(duì)于評(píng)價(jià)模型優(yōu)劣有著關(guān)鍵意義。
(3) 注意力轉(zhuǎn)移階段。當(dāng)確定顯著信息后,機(jī)器視覺(jué)會(huì)自動(dòng)對(duì)顯著度最大的點(diǎn)進(jìn)行關(guān)注,這些點(diǎn)被稱(chēng)為首次注意點(diǎn),再通過(guò)返回抑制機(jī)制轉(zhuǎn)移注意力。被注視過(guò)的信息顯著性會(huì)得到抑制,由此來(lái)確保該檔案信息不會(huì)被重復(fù)注意,有些位置一旦被注視過(guò),顯著度就會(huì)降為零,接著注視顯著度相對(duì)小的目標(biāo),依次類(lèi)推直到機(jī)器視覺(jué)找到想要搜索的目標(biāo)為止[10]。
機(jī)器視覺(jué)能很好地檢測(cè)醫(yī)院檔案信息潛在的顯著區(qū)域,是一個(gè)很強(qiáng)的視覺(jué)注意力裝置,能快速在醫(yī)院檔案信息中找到目標(biāo)區(qū)域,并對(duì)目標(biāo)區(qū)域進(jìn)行識(shí)別,提高識(shí)別效率,即使面對(duì)很復(fù)雜的物體,也能快速完成搜索識(shí)別工作[11]。
在以上分析研究的基礎(chǔ)上,利用機(jī)器視覺(jué)對(duì)目標(biāo)區(qū)域醫(yī)院檔案信息進(jìn)行搜索,整體的醫(yī)院檔案信息目標(biāo)搜索流程圖如圖3所示。
圖3 醫(yī)院檔案信息目標(biāo)搜索流程圖Fig.3 Flow chart of target search for hospital file information
其中,目標(biāo)信息區(qū)域的信息特征計(jì)算方法為
(1)
式中:P代表目標(biāo)信息區(qū)域的信息特征;N代表目標(biāo)區(qū)域的大小;Q表示檔案信息的存儲(chǔ)大小;C代表每種檔案信息出現(xiàn)的次數(shù)。
為了確保醫(yī)院全部檔案信息搜索結(jié)果的充分性,機(jī)器視覺(jué)要對(duì)所有的醫(yī)院檔案信息都進(jìn)行搜索[12],但是由于醫(yī)院中記錄的檔案信息非常多,所以要對(duì)這些信息進(jìn)行模式匹配,在目標(biāo)區(qū)域內(nèi)對(duì)信息進(jìn)行搜索[13]。在搜索醫(yī)院檔案信息時(shí),主要的智能搜索方式有語(yǔ)義搜索、群體搜索、內(nèi)容特征搜索、整合搜索、垂直搜索、個(gè)性化搜索和社會(huì)搜索等[14-15]。語(yǔ)義搜索主要是通過(guò)理解醫(yī)院檔案信息的類(lèi)別來(lái)完成搜索的,通過(guò)分析輸入到搜索框內(nèi)中的內(nèi)容,給出能夠滿(mǎn)足目標(biāo)檔案的相關(guān)結(jié)果,這種檢索方式加強(qiáng)了智能性,提高了機(jī)器搜索醫(yī)院海量檔案信息的準(zhǔn)確率[16-17];群體搜索依據(jù)醫(yī)院檔案信息的關(guān)鍵詞和表達(dá)方式進(jìn)行搜索,通過(guò)多重搜索得到一個(gè)相對(duì)準(zhǔn)確的結(jié)果,并能夠深入分析目標(biāo)搜索的要求,根據(jù)不同的要求給出針對(duì)性的搜索結(jié)果;內(nèi)容搜索不僅僅是對(duì)醫(yī)院檔案的就醫(yī)人員本身信息進(jìn)行搜索,也能夠就醫(yī)人員診斷治療過(guò)程中的檢查結(jié)果進(jìn)行搜索,如CT圖像、化驗(yàn)結(jié)果等,這種方式得到的結(jié)果能夠很大程度地避免主觀(guān)性;羅盤(pán)搜索注重搜索結(jié)果的精準(zhǔn)性,根據(jù)給出的關(guān)鍵詞進(jìn)行智能分類(lèi),并在每個(gè)大類(lèi)中歸納出多個(gè)子類(lèi),相關(guān)人員可以根據(jù)提示的信息一步步進(jìn)行選擇,這樣得到的檔案信息結(jié)果就更加精準(zhǔn);整合搜索會(huì)將所有功能和終端通用連接,提高搜索的靈活性和適應(yīng)性,整合搜索可以為醫(yī)院提供更加合適的操作方式,降低操作過(guò)程的復(fù)雜度;垂直搜索會(huì)將所有醫(yī)療信息檔案規(guī)劃成一個(gè)垂直的矩陣,以模型化的方式向用戶(hù)展示,垂直搜索具有“專(zhuān)、精、深”的特點(diǎn),能夠滿(mǎn)足醫(yī)院檔案信息的特定需求,提高搜索結(jié)果的信息質(zhì)量,將很多不易被發(fā)現(xiàn)的檔案信息明確地展現(xiàn)在醫(yī)護(hù)人員面前;個(gè)性化搜索更加強(qiáng)調(diào)檔案的個(gè)性化特征,個(gè)性化搜索所設(shè)置的分類(lèi)導(dǎo)航欄是完全滿(mǎn)足搜索需求的,能夠確保得到合理搜索結(jié)果的基礎(chǔ)上,實(shí)現(xiàn)最大程度的智能化;社會(huì)化搜索會(huì)將所有相同的搜索方式歸類(lèi)到一起,讓相關(guān)醫(yī)護(hù)人員或就醫(yī)人員可以共同探討搜索結(jié)果,確保搜索方法不斷提高[18-19]。
為此,在利用機(jī)器視覺(jué)鎖定目標(biāo)搜索區(qū)域并計(jì)算醫(yī)院檔案信息特征的基礎(chǔ)上,依據(jù)不同需求智能選擇不同且合適的檔案信息搜索方式,進(jìn)行搜索模式匹配,最終輸出顯示搜索結(jié)果,以實(shí)現(xiàn)最終的醫(yī)院檔案信息智能化搜索。
在分析醫(yī)院檔案信息的模式后,要對(duì)待搜索信息進(jìn)行模式匹配,模式匹配是醫(yī)院檔案信息搜索重要的一步,利用計(jì)算機(jī)代替人腦解決復(fù)雜的信息問(wèn)題,并將醫(yī)院信息進(jìn)行分類(lèi)[20]。醫(yī)院檔案信息模式匹配可對(duì)不同時(shí)間和不同條件下的檔案信息進(jìn)行校準(zhǔn),使信息的特征更加明顯[21]。
若想在海量醫(yī)院檔案信息中完成精確的提取、識(shí)別、匹配工作,就必須對(duì)目標(biāo)信息進(jìn)行完整處理,一般處理思路是:首先將所有信息的特征集合到一起,然后通過(guò)機(jī)器學(xué)習(xí)的方法在所有的特征集合中找到最能反映醫(yī)院檔案信息的特征,對(duì)這些特征進(jìn)行匹配和識(shí)別,為最后的工作搜索工作打下基礎(chǔ)[22]。待搜索信息的模式匹配識(shí)別過(guò)程如圖4所示。
圖4 待搜索信息的模式匹配識(shí)別過(guò)程Fig.4 Model matching identification process for information to be searched
在統(tǒng)計(jì)模式下匹配檔案信息,每一個(gè)醫(yī)院檔案信息所屬的模式都會(huì)被事先定義,統(tǒng)計(jì)模式下檔案信息匹配的計(jì)算過(guò)程如下:設(shè)定共有n個(gè)信息,M個(gè)搜索模式類(lèi),
代表搜索模式矢量。對(duì)這些模式下的信息進(jìn)行分類(lèi),找到每個(gè)信息所對(duì)應(yīng)的模式類(lèi),模式分類(lèi)基于統(tǒng)計(jì)決策理論建立,可將信息模式匹配看成信息分類(lèi)問(wèn)題[23]:
A=P[A1,A2,…,An]
(2)
式中:A代表醫(yī)院檔案信息的描述符;A1,A2,…,An代表醫(yī)院檔案信息矢量。
利用機(jī)器視覺(jué)中相似性度量方法進(jìn)行模式匹配,具體相似性度量公式為
(3)
式中:d(·)代表的是醫(yī)院檔案信息矢量與搜索模式矢量之間的歐式距離。
根據(jù)式(3)實(shí)現(xiàn)醫(yī)院檔案信息與搜索模式的匹配,選取相應(yīng)的搜索模式對(duì)醫(yī)院檔案信息進(jìn)行智能搜索,從而實(shí)現(xiàn)醫(yī)院檔案信息的準(zhǔn)確搜索。
為了檢測(cè)本文基于機(jī)器視覺(jué)的醫(yī)院檔案信息智能搜索方法的有效性,與基于模糊集的檢索方法(文獻(xiàn)[4]方法)進(jìn)行比較,設(shè)計(jì)對(duì)比實(shí)驗(yàn)。實(shí)驗(yàn)選取飛思卡爾單片機(jī)、紅外傳感器、電機(jī)驅(qū)動(dòng)器、光電編碼器、PC核心處理器以串口通信的方式進(jìn)行醫(yī)院檔案信息智能搜索。
根據(jù)上述實(shí)驗(yàn)參數(shù),同時(shí)選取本文設(shè)定的醫(yī)院檔案信息智能搜索方法和文獻(xiàn)[4]方法,搜索相同醫(yī)院檔案信息,記錄搜索時(shí)間以及搜索結(jié)果的相關(guān)性,對(duì)比結(jié)果如圖5所示。
圖5 信息搜索時(shí)間結(jié)果Fig.5 Results of information search time
隨著搜索信息量的增加,智能搜索時(shí)間也在不斷增加,從圖5可知,當(dāng)搜索信息量為30 GB時(shí),本文方法花費(fèi)的搜索時(shí)間為5.6 min,文獻(xiàn)[4]中檢索方法花費(fèi)的搜索時(shí)間為11.8 min,本文方法花費(fèi)的搜索時(shí)間比文獻(xiàn)[4]花費(fèi)的搜索時(shí)間少6.2 min,這是因?yàn)楸疚氖褂玫乃阉魉惴ň哂泻軓?qiáng)的針對(duì)性,能夠?qū)⑿畔⒎峙涞讲煌J街?在搜索時(shí)僅針對(duì)每種模式進(jìn)行搜索即可,而文獻(xiàn)[4]搜索方法為籠統(tǒng)搜索,需要在海量信息中進(jìn)行搜索,搜索過(guò)程復(fù)雜,難度大,需要花費(fèi)的時(shí)間很長(zhǎng)。
為了進(jìn)一步驗(yàn)證本文方法的有效性,對(duì)本文方法和文獻(xiàn)[4]方法的相關(guān)性進(jìn)行對(duì)比分析,對(duì)比結(jié)果如表1所示。
表1 相關(guān)性測(cè)試結(jié)果Table 1 Correlation test results
從表1可知,在5次測(cè)試中,文獻(xiàn)[4]得到的結(jié)果相關(guān)性有3次差,2次普通,這證明文獻(xiàn)[4]搜索的結(jié)果與用戶(hù)實(shí)際需求僅有少量相關(guān),即使相關(guān)性較高,顯示方式也很負(fù)責(zé),用戶(hù)需要在眾多信息中逐一篩選,找到合適的信息。
本文研究的方法在5次測(cè)試中,相關(guān)性都很強(qiáng),搜索結(jié)果與實(shí)際需求信息匹配度很高,顯示的搜索結(jié)果都是用戶(hù)需要的內(nèi)容,使用者不需要再次篩選,直接就可以使用。
根據(jù)上述實(shí)驗(yàn)結(jié)果,得到如下的實(shí)驗(yàn)結(jié)論:在搜索同一類(lèi)醫(yī)院檔案信息時(shí),研究的智能搜索方法花費(fèi)的時(shí)間更小,相關(guān)性更高,能夠滿(mǎn)足用戶(hù)的需求,更加適合醫(yī)療系統(tǒng)。
由于機(jī)器視覺(jué)技術(shù)具有很強(qiáng)的自主性、交互性和自適應(yīng)性,所以十分適合搜索醫(yī)院檔案信息。利用機(jī)器視覺(jué)研究了一種醫(yī)院檔案信息智能搜索方法,利用機(jī)器視覺(jué)的多視角采集醫(yī)院檔案信息,并選取目標(biāo)區(qū)域,在智能搜索前進(jìn)行模式匹配,該方法能夠在海量醫(yī)院檔案信息中精確地識(shí)別出有效信息。
本文的研究具有一定的搜索效果,但是由于研究時(shí)間有限,所以對(duì)視覺(jué)注意里選擇機(jī)制的研究較少,僅針對(duì)一種匹配識(shí)別方式進(jìn)行探討,未來(lái)需要進(jìn)一步完善。