田悍
摘 要隨著醫(yī)療技術(shù)的不斷發(fā)展和更新,新的技術(shù)和成果不斷涌現(xiàn),醫(yī)護(hù)工作者發(fā)表和參閱醫(yī)學(xué)論文已然成為展示科研成果和獲取最新技術(shù)的重要途徑。對(duì)于醫(yī)院,論文可以從一個(gè)側(cè)面反映出醫(yī)院的綜合實(shí)力,同時(shí)也是評(píng)價(jià)醫(yī)院科研能力和學(xué)術(shù)水平的重要指標(biāo)。作為醫(yī)院科教管理部門,科教科在職工考核、職稱晉升等工作中都需要考察論文的發(fā)表情況,并且還需要時(shí)刻掌握全院發(fā)表論文的數(shù)據(jù),并以此作出統(tǒng)計(jì)和分析,把結(jié)果作為證明醫(yī)院科研能力和發(fā)展現(xiàn)狀的依據(jù)。
【關(guān)鍵詞】網(wǎng)絡(luò)數(shù)據(jù) 系統(tǒng)
1 醫(yī)院學(xué)術(shù)論文管理情況現(xiàn)狀
隨著計(jì)算機(jī)的廣泛應(yīng)用,絕大多數(shù)醫(yī)院管理論文的方法已經(jīng)從手工登記轉(zhuǎn)變?yōu)槭褂糜?jì)算機(jī)軟件管理,其中最為普及的是使用Excel軟件制作電子表格登記論文資料。這種方法可以較好地幫助工作人員解決查找和數(shù)據(jù)統(tǒng)計(jì)的問題。但是,數(shù)據(jù)的收集需要做大量的前期工作,由論文作者上報(bào)至科教科,再由科教科工作人員進(jìn)行手工錄入制成Excel表格,需要生成報(bào)表和統(tǒng)計(jì)數(shù)據(jù)的時(shí)候也必須手動(dòng)操作。
大量繁瑣枯燥的手工錄入工作制成的Excel的本地文件,卻并不能較好的實(shí)現(xiàn)數(shù)據(jù)共享。因此,隨著網(wǎng)絡(luò)的普及,部分醫(yī)院建立了基于Web的論文管理系統(tǒng)。依靠B/S架構(gòu)的Web論文管理系統(tǒng),可以很好的解決數(shù)據(jù)共享的問題。相比于使用Excel文件記錄論文數(shù)據(jù),網(wǎng)絡(luò)論文管理系統(tǒng)的優(yōu)點(diǎn)在于只要有可用的網(wǎng)絡(luò),無論何時(shí)何地都可以通過手機(jī)或個(gè)人計(jì)算機(jī)進(jìn)入系統(tǒng),進(jìn)行論文上報(bào)、登記、查詢操作,使論文管理工作不僅限于辦公室。并且依靠計(jì)算機(jī)技術(shù)也可以一定程度的簡(jiǎn)化手工工作,以鼠標(biāo)點(diǎn)選、自動(dòng)生成等方式優(yōu)化錄入、統(tǒng)計(jì)分析的過程。
2 基于網(wǎng)絡(luò)數(shù)據(jù)抓取的醫(yī)院論文管理系統(tǒng)
基于網(wǎng)絡(luò)數(shù)據(jù)抓取的醫(yī)院論文管理系統(tǒng)保留了普通網(wǎng)絡(luò)論文管理系統(tǒng)的優(yōu)點(diǎn),著力優(yōu)化和完善最為繁瑣的數(shù)據(jù)錄入過程,從國(guó)內(nèi)權(quán)威的論文數(shù)據(jù)庫(kù)中直接抓取需要的數(shù)據(jù)存入自己的數(shù)據(jù)庫(kù)。
據(jù)了解,國(guó)內(nèi)絕大部分正規(guī)期刊上發(fā)表的文獻(xiàn)在見刊1-2個(gè)月后就會(huì)被知網(wǎng)、萬方、維普等專業(yè)的文獻(xiàn)數(shù)據(jù)庫(kù)收錄。普通用戶通過檢索,可以獲取到論文的題目、發(fā)表刊物、見刊時(shí)間、作者姓名、單位、關(guān)鍵詞、摘要等數(shù)據(jù),足以滿足醫(yī)院論文管理系統(tǒng)的需求。只要實(shí)現(xiàn)并使用抓取功能獲得需要的數(shù)據(jù),就能大大簡(jiǎn)化手工錄入的工作,同時(shí)能有效的避免論文漏報(bào)、錯(cuò)報(bào)。
2.1 系統(tǒng)的體系結(jié)構(gòu)
目前基于網(wǎng)絡(luò)的系統(tǒng)體系結(jié)構(gòu)主要是C/S(客戶端/服務(wù)器)架構(gòu)與B/S(瀏覽器/服務(wù)器)架構(gòu)。C/S架構(gòu)將大部分的運(yùn)算放在客戶端處理,要求進(jìn)入系統(tǒng)的計(jì)算機(jī)安裝相應(yīng)的客戶端程序,對(duì)計(jì)算機(jī)操作系統(tǒng)等條件有特定的要求,限制了用戶群,具有較高的安全性,但是靈活性不強(qiáng),不便于后期維護(hù)和系統(tǒng)升級(jí)。B/S架構(gòu)基于HTTP和TCP/IP協(xié)議,運(yùn)用服務(wù)器完成大量的運(yùn)算,將運(yùn)算結(jié)果傳輸給瀏覽器顯示,用戶只需要使用瀏覽器就可以在個(gè)人計(jì)算機(jī)或智能手機(jī)上進(jìn)行操作,不受局域網(wǎng)、軟件和運(yùn)行平臺(tái)的限制,可以實(shí)現(xiàn)跨平臺(tái)的使用,并且后期維護(hù)成本低,更新方便。
為了系統(tǒng)后期的維護(hù)及功能完善,本系統(tǒng)采用B/S架構(gòu),也更能適應(yīng)目前信息系統(tǒng)的發(fā)展趨勢(shì)。
2.2 系統(tǒng)的功能模塊
如圖1所示,本系統(tǒng)分為五個(gè)功能模塊,分別為:部門管理模塊、職工管理模塊、論文抓取模塊、論文錄入模塊、查詢統(tǒng)計(jì)模塊。
2.2.1 部門管理模塊
部門管理模塊的主要功能是通過添加、修改、刪除操作設(shè)置醫(yī)院部門信息,構(gòu)建一個(gè)完整的部門樹形結(jié)構(gòu),以便在查詢統(tǒng)計(jì)時(shí)可以實(shí)現(xiàn)按照部門查詢統(tǒng)計(jì),有助于分析和比較各科室部門論文發(fā)表的情況。
2.2.2 職工管理模塊
職工管理模塊同樣通過數(shù)據(jù)庫(kù)的操作建立職工的花名冊(cè),并且將每個(gè)職工按照實(shí)際情況分配到科室和部門,如此便建立了論文、作者、部門的關(guān)系。
2.2.3 論文數(shù)據(jù)抓取模塊
論文數(shù)據(jù)抓取模塊使用網(wǎng)絡(luò)數(shù)據(jù)抓取的方法,通過請(qǐng)求URL、對(duì)返回?cái)?shù)據(jù)進(jìn)行分析、提取論文相關(guān)數(shù)據(jù),將其存入論文信息表,并與醫(yī)院職工進(jìn)行關(guān)聯(lián)。
2.2.4 論文數(shù)據(jù)錄入模塊
本模塊的主要功能是手工維護(hù)論文數(shù)據(jù),以對(duì)論文數(shù)據(jù)的添加、修改、刪除操作,提供是一個(gè)查缺補(bǔ)漏渠道,對(duì)數(shù)據(jù)抓取過程中出現(xiàn)的不完善數(shù)據(jù)進(jìn)行人工修改。
2.2.5 統(tǒng)計(jì)查詢模塊
模塊提供作者姓名查詢、關(guān)鍵詞查詢、期刊查詢、發(fā)表時(shí)間查詢、科室查詢等豐富的查詢方法。統(tǒng)計(jì)各科室發(fā)表論文數(shù)量、各種期刊上發(fā)表論文的數(shù)量、關(guān)鍵詞相關(guān)論文數(shù)量、任意時(shí)間段發(fā)表論文數(shù)量等以供比較分析。
2.3 網(wǎng)絡(luò)數(shù)據(jù)抓取模塊設(shè)計(jì)
數(shù)據(jù)抓取功能是本系統(tǒng)的特色和亮點(diǎn),其設(shè)計(jì)原理類似于簡(jiǎn)化的網(wǎng)絡(luò)爬蟲,抓取數(shù)據(jù)更具針對(duì)性,抓取范圍僅限于較權(quán)威的論文期刊數(shù)據(jù)庫(kù)。以下介紹設(shè)計(jì)思路。
2.3.1 抓取模塊涉及的數(shù)據(jù)庫(kù)設(shè)計(jì)
為了能在網(wǎng)絡(luò)上抓取數(shù)據(jù),需要一個(gè)表存放URL信息,其中包括的主要字段有URL、URL的MD5編碼、訪問狀態(tài)、請(qǐng)求的頁(yè)面類型等。
另外需要一個(gè)存放論文信息的表存放抓取到的數(shù)據(jù),包含題目、刊名、發(fā)表時(shí)間、作者、關(guān)鍵詞、摘要等字段。
2.3.2 抓取數(shù)據(jù)的主要步驟
首先程序從URL表中取出一條訪問狀態(tài)為未訪問的數(shù)據(jù),請(qǐng)求此URL并接收返回?cái)?shù)據(jù),根據(jù)URL請(qǐng)求的頁(yè)面類型做提取論數(shù)據(jù)或者提取URL數(shù)據(jù)的操作。
對(duì)于返回的是論文頁(yè)面,需要提取論文詳細(xì)信息,然后到論文信息表中查找,判斷是否為已經(jīng)抓取過的論文數(shù)據(jù),若已抓取,則標(biāo)記請(qǐng)求的URL為已訪問,然后進(jìn)行下一個(gè)URL的請(qǐng)求。否則將論文數(shù)據(jù)整理并入庫(kù),將作者與職工關(guān)聯(lián),之后請(qǐng)求下一個(gè)URL。
若非論文詳情頁(yè)面,則需分離提取頁(yè)面中的URL,將提取到的URL逐個(gè)進(jìn)行MD5編碼后到URL表中查重,將非重?cái)?shù)據(jù)標(biāo)記為未訪問然后入庫(kù)。
3 實(shí)現(xiàn)本系統(tǒng)的意義
基于網(wǎng)絡(luò)數(shù)據(jù)抓取的醫(yī)院論文管理系統(tǒng)可以有效地減少論文管理過程中的繁瑣工作,簡(jiǎn)化管理流程,為管理人員減負(fù)。同時(shí),得益于系統(tǒng)采用B/S架構(gòu),可以實(shí)現(xiàn)跨平臺(tái)、跨區(qū)域的管理。抓取來自論文數(shù)據(jù)庫(kù)的數(shù)據(jù)相對(duì)全面,以此數(shù)據(jù)做出的分析統(tǒng)計(jì)能夠更加有效的指導(dǎo)醫(yī)院科研的發(fā)展方向和重心。設(shè)計(jì)并實(shí)現(xiàn)本系統(tǒng),有效地提高了科教管理工作效率。
作者單位
貴州省骨科醫(yī)院 貴州省貴陽市 550007