向明華,向國華
1.泰興市人民醫(yī)院,江蘇 泰興 225400;2.中國電信股份有限公司泰興分公司,江蘇 泰興 225400
基于OCR技術的醫(yī)療檔案管理系統(tǒng)研究與構建
向明華1,向國華2
1.泰興市人民醫(yī)院,江蘇 泰興 225400;2.中國電信股份有限公司泰興分公司,江蘇 泰興 225400
基于醫(yī)院信息系統(tǒng),利用OCR技術開發(fā)了醫(yī)療檔案管理系統(tǒng)。系統(tǒng)主要由管理模塊、OCR處理模塊、檔案管理模塊、郵件管理模塊組成。本文詳細介紹了系統(tǒng)的開發(fā)過程和使用情況。
醫(yī)院信息系統(tǒng);醫(yī)療檔案管理系統(tǒng);光學字符識別;便攜式文檔格式
隨著計算機技術和網(wǎng)絡技術的快速發(fā)展,使得醫(yī)療檔案管理數(shù)字化、信息化已成必然趨勢[1-2]。病歷資料是在診療過程中形成的客觀病歷材料和主觀病歷材料,對將來醫(yī)療機構舉證也起到舉足輕重的作用。電子醫(yī)療檔案是由病歷資料轉(zhuǎn)化而來,電子醫(yī)療檔案采用的便攜式文檔格式(PDF)不但能夠真實、準確和客觀地反映原始病歷材料,而且PDF醫(yī)療檔案只可查閱,不可涂改,保證了病歷資料的客觀性和科學性[3-4]。筆者利用醫(yī)院現(xiàn)有的醫(yī)院信息系統(tǒng)(HIS)、影像歸檔和通信系統(tǒng)(PACS),構建了基于光學字符識別(OCR)技術的PDF醫(yī)療檔案管理系統(tǒng),實現(xiàn)了信息共享和全文檢索,提高了醫(yī)療檔案文件管理的效率。
1.1 結構設計
醫(yī)療檔案管理系統(tǒng)結構設計主要包括系統(tǒng)管理模塊、OCR處理模塊、檔案管理模塊、郵件管理模塊等,見圖1。
1.2 功能設計
(1)系統(tǒng)管理模塊。該模塊負責系統(tǒng)的部門信息維護、人員信息維護、角色維護和模塊維護,工作流程,見圖2。
(2)OCR處理模塊。經(jīng)OCR處理的PDF醫(yī)療文件不依靠第三方數(shù)據(jù)庫技術,直接進行內(nèi)容抽取和索引,對被索引的文件內(nèi)容可以進行高效全文檢索。該模塊具有圖像輸入、預處理(包括二值化、圖像去噪、傾斜矯正)、版面分析、字符切割、字符識別和版面恢復等功能,用于對掃描儀或相關軟件生成的PDF醫(yī)療檔案文件進行處理,以便在Web系統(tǒng)中檢索[5-7]。字符識別的關鍵是OCR分辨率的設置,一般來說,文稿字體大,則OCR分辨率設置小些,如2、3號字的文章段,推薦使用200 dpi;反之則大些,如7、8號字的文章段,推薦使用600 dpi。掃描時適當?shù)卣{(diào)整好亮度和對比度值,使掃描文件黑白分明;在醫(yī)療檔案管理系統(tǒng)中不得存儲可編輯數(shù)據(jù),如txt、doc及xls等格式文件。
(3)使用權限設置。為保證系統(tǒng)安全,本系統(tǒng)共分兩種用戶:一種為系統(tǒng)管理員,主要負責人員信息維護、角色維護、模塊管理;另一種為部門人員(部門人員分多種用戶),部門人員登錄系統(tǒng)后,可以修改登錄密碼、查詢其他人員的基礎信息,收發(fā)郵件等。系統(tǒng)可以根據(jù)不同權限的用戶顯示不同的功能模塊,系統(tǒng)管理員才具有創(chuàng)建醫(yī)療檔案、借閱醫(yī)療檔案等管理權利[8]。
2.1 數(shù)據(jù)庫的創(chuàng)建
系統(tǒng)使用SQL Server2000數(shù)據(jù)庫管理系統(tǒng),數(shù)據(jù)表在創(chuàng)建完成之后生成SQL腳本文件,在查詢分析器中直接運行來創(chuàng)建表結構、數(shù)據(jù)表的SQL腳本語句[9]。
2.1.1 目錄結構
此系統(tǒng)實現(xiàn)的目錄結構比較清晰,src目錄下存放項目中所用到的java源文件,test目錄下存放java測試類源文件,即本系統(tǒng)所采用的Junit測試文件,doc目錄下存放項目開發(fā)所用到的說明文檔[10-11]。
2.1.2 數(shù)據(jù)表的創(chuàng)建
(1)用戶信息表SM_USER。此表包括了所有登錄系統(tǒng)用戶的信息。
(2)模塊信息表SM_MODEL。此表中記錄了系統(tǒng)模塊信息,可以根據(jù)用戶的權限動態(tài)顯示相應的模塊,本表采用表字段自關聯(lián)實現(xiàn)菜單的顯示功能,即子菜單通過父ID查找實現(xiàn)菜單的關聯(lián)功能。
(3)部門信息表SM_DEPARTMENT。部門信息表用以記錄部門信息相關的內(nèi)容,從而實現(xiàn)對部門的檢索及分類,通過部門名稱就可以對部門相關信息進行查詢。
2.2 界面設計及實現(xiàn)代碼
2.2.1 界面設計
在本地瀏覽器中輸入http://r-co,即可進入PDF醫(yī)療檔案信息管理的登錄界面。在此界面單擊導航欄中的“系統(tǒng)模塊管理”鏈接,打開模塊管理查詢界面,就可以實現(xiàn)修改、添加等維護系統(tǒng)操作[12-13]。
2.2.2 代碼實現(xiàn)
由于每個模塊的代碼具有相似性,且代碼量較大,這里簡要介紹人員維護頁面流程。
(1)Spring配置文件。action-servlet.xm l主要用來通過Spring配置Jsp頁面與action的映射信息。
(2)控制層action。該層為Java源代碼,主要負責收集從JSP傳來的數(shù)據(jù)并調(diào)用Spring業(yè)務代碼,本例中負責控制層的java源代碼為SmUserController.java。
(3)業(yè)務層service。Service層主要負責業(yè)務的處理并調(diào)用Dao層的數(shù)據(jù),并將從Dao層獲取的數(shù)據(jù)回傳給action層,service層分為service層接口的定義和接口的實現(xiàn)類。
(4)Dao層。Dao層主要用來與底層的數(shù)據(jù)庫交互,Dao層分為Dao層接口的定義和接口的實現(xiàn)。
(5)JSP顯示層smUsersFrame.jsp。smUserFrame.jsp頁面采用框架結構設計。
基于OCR技術的PDF醫(yī)療檔案管理系統(tǒng)的研究和構建,使得檔案管理系統(tǒng)可對全文進行檢索,大大提高了醫(yī)療檔案管理效率和檢索率。另外,該系統(tǒng)可預留與辦公自動化系統(tǒng)交換數(shù)據(jù)的接口,以實現(xiàn)與辦公自動化系統(tǒng)的無縫連接。
[1]戴晟暉,常春英.Dreamweaver8實例與操作[M].北京:航空工業(yè)出版社,2010.
[2]李興華.JavaW eb開發(fā)實戰(zhàn)經(jīng)典基礎篇[M].北京:清華大學出版社,2010.
[3](美)Brian P.Hogan.HTM L5和CSS3實例教程[M].北京:人民郵電出版社,2012.
[4](美)N icholas C.Zakas.JavaScript高級程序設計[M].3版.北京:人民郵電出版社,2012.
[5]岳峰,李鵬,張玉祥.跟ORACLE工程師學JAVA軟件項目開發(fā)[M].北京:科學出版社,2010.
[6]Christian Bauer,Gavin King.Java Persistence w ith H ibernate[M].USA:Manning Publications Co.,2009.
[7](美)斯格科.Jakarta Struts Cookbook[M].北京:清華大學出版社,2007.
[8]李興華,王月清.Java W eb開發(fā)實戰(zhàn)經(jīng)典[M].北京:清華大學出版社,2010.
[9]陳亞輝,繆勇.Struts2+Spring+Hibernate框架技術與項目實戰(zhàn)[M].北京:清華大學出版社,2012.
[10]孫曉非,馮冠,張銀鶴,等.XM L基礎教程與實驗指導[M].北京:清華電腦學堂,2008.
[11](美)Adobe公司.Adobe Acrobat X中文版經(jīng)典教程[M].北京:人民郵電出版社,2012.
[12]陳金雄,劉寶妹,鐘俊華.基于云計算的軍人電子健康檔案平臺架構的設計與實現(xiàn)[J].中國醫(yī)療設備,2014,29(2):53-55.
[13]黃吳健,帥仁俊.電子健康檔案的加密研究[J].計算機工程與設計,12(10):3833-3837.
Study and Construction of an OCR-Based M edical Record Adm inistration System
XIANG Ming-hua1, XIANG Guo-hua2
1.The People’s Hospital of Taixing, Taixing Jiangsu 225400, China;2. China Telecom Beijing Branch, Taixing Jiangsu 225400, China
Based on the hospital information system, the medical record administration system was developed by using OCR technology. The system mainly consisted of the management module, OCR processing module, fi le management module and e-mail management module. This paper introduced the development process and the use of the system in detail.
hospital information system;medical record adm inistration system;optical character recognition;portable document format
TP311.52
A
10.3969/j.issn.1674-1633.2015.10.031
1674-1633(2015)10-0106-02
2015-04-01
2015-08-10
本文作者:向明華,高級工程師。
作者郵箱:225400@126.com