王向真+甘群文
[摘要]以建設中藥平性藥數(shù)據(jù)庫為例,探討在學科服務環(huán)境和信息挖掘技術的支撐下,高校特色資源庫的建設思路、建設內容和建庫體會,以期待為高校圖書館建設特色資源庫提供參考借鑒。
[關鍵詞]特色資源庫;學科服務;信息挖掘
[中圖分類號]G258.6[文獻標志碼]B[文章編號]1005-6041(2016)04-0031-04
高等院校是重要的學術交流陣地和科研場所,有著強大的學科特色與優(yōu)勢,學科建設水平成為一所高校辦學質量、教學水平和綜合競爭力的顯著標志。在高校大力發(fā)展學科建設的背景下,圖書館作為高校文獻資源保障基地,也必須進行相應的改革,由傳統(tǒng)單一的資源服務逐步轉變?yōu)樯顚哟蔚膶W科服務,積極探索建立學科數(shù)據(jù)庫的知識環(huán)境?;诖耍咝D書館應充分利用圖書館特有的豐富文獻資源,以學科建設為導向,將各種信息資源充分運用和加工,對知識進行深入地挖掘和重組,致力于建設具有鮮明學科特色的數(shù)字資源保障系統(tǒng),促進知識共享,充分體現(xiàn)圖書館學科服務的功能。本文以廣西中醫(yī)藥大學圖書館中藥平性藥數(shù)據(jù)庫建設為例,重點介紹在學科服務環(huán)境下特色資源庫設計的思路及建設的主要內容。
1立足于學科專業(yè)發(fā)展需求的建庫方案
中醫(yī)藥專業(yè)是廣西中醫(yī)藥大學特色重點學科專業(yè),而平性藥則是中醫(yī)藥資源中極其重要的部分?!爸兴幤叫运帞?shù)據(jù)庫”就是在充分利用本校學科優(yōu)勢的基礎上,依托圖書館豐富的中醫(yī)藥文獻資源,對“平性藥”各方面的信息資料進行專業(yè)地采集、分析、加工和存儲,實現(xiàn)資源的數(shù)字化,并充分利用學科館員的知識優(yōu)勢,對數(shù)據(jù)庫蘊含的、對用戶價值最大的隱性信息[1]進行深度提煉,打造具有顯著中醫(yī)藥學科特色的數(shù)字資源保障體系,為中藥學、中醫(yī)藥臨床提供必要的知識服務。圖1為數(shù)據(jù)庫建設思路圖。
2基于學科服務的特色數(shù)據(jù)庫建庫內容
2.1 數(shù)據(jù)庫建設的軟硬件配置
選擇合適的軟硬件配置能為后期的信息加工與服務打下堅實的基礎,是建設特色數(shù)據(jù)庫首要解決的問題。為了保證數(shù)據(jù)庫平臺穩(wěn)定運行,配置了一臺64位4核CUP高性能Web服務器;安裝Windows Server 2008操作系統(tǒng),采用SQL Server 2005作為數(shù)據(jù)庫軟件集成開發(fā)系統(tǒng),以C#編程語言為前臺設計數(shù)據(jù)采集頁面,采用國際標準的元數(shù)據(jù)規(guī)范進行數(shù)據(jù)的加工與整合,規(guī)范后的數(shù)據(jù)格式統(tǒng)一,便于統(tǒng)一顯示和提高檢索效率;在網(wǎng)頁設計方面,安裝支撐ASP.NET 4.0運行的.NET Framework 4.0組件。
2.2 以學科服務為導向進行數(shù)據(jù)的采集和加工
專業(yè)數(shù)據(jù)是特色資源庫的核心,數(shù)據(jù)的采集是建設資源庫一個非常重要的環(huán)節(jié),基于學科服務的數(shù)據(jù)采集更應重視數(shù)據(jù)源的專業(yè)性、層次化與知識的抽取[2]。中藥平性藥數(shù)據(jù)庫的數(shù)據(jù)來源于《中華本草》[3],該著作系統(tǒng)總結了歷代中藥學的發(fā)展成果,又充分反映了現(xiàn)代中藥學的研究水平,里面所收載的藥物之多及分類之細均超過了以往的本草著作。我們選擇其為數(shù)據(jù)源能最大限度地保證數(shù)據(jù)的權威性與完整性。
《中華本草》所記載的中藥平性藥包括平性藥的功效、主治、藥理作用、化學成分等方面資料,因此,我們對應設計了平性藥的功效表、主治表、藥理作用表、化學成分表等數(shù)據(jù)表,并詳細描述各個表中數(shù)據(jù)項的編碼方式、屬性和數(shù)據(jù)類型等,全面反映每個表描述所要記錄的數(shù)據(jù)信息。例如:在平性藥功效表中,一共設計了26個字段,分別為解表、祛風、清熱、瀉下等,每個字段下有多個選項,如祛風包括祛風除濕、祛風燥濕、祛風通絡、祛風止痛、祛風止癢、祛風解痙、祛風明目等選項。在數(shù)據(jù)錄入界面的設計中,遵循友好性、便捷性、正確性和一致性的基本原則,利用C#語言設計,完成數(shù)據(jù)采集工作,例如功效表的數(shù)據(jù)采集頁面見圖2。為了提高用戶的檢索效率,規(guī)定以藥名索引號作為各個表之間的關聯(lián)字段,建立一個平性藥索引表,其中藥名索引號字段根據(jù)藥物來源順序編排,分為動物藥、礦物藥、植物藥,分別以D、K、Z字母開頭,后面各自再加上“所屬科目序號(3位數(shù))+排列序號(3位數(shù))”。其中動物藥、植物藥按自然屬性分類,由低等到高等排列;礦物藥按陽離子分類排列。平性藥索引表數(shù)據(jù)格式見表1。
2.3 網(wǎng)站設計及信息發(fā)布
網(wǎng)站發(fā)布平臺的定位是:提供中藥平性藥的檢索、利用、共享與傳播。在網(wǎng)頁色彩搭配上,選擇明亮活潑色調,給瀏覽者耳目一新的感覺;在網(wǎng)頁框架設計上力求用戶簡單方便操作,采用的是傳統(tǒng)大眾化的頁面框架布局結構。設計的頁面框架左邊窗口是分類導航欄,以平性藥藥名作為關鍵檢索點,分為動物藥、礦物藥、植物藥三大類,每一大類下以樹型結構方式呈現(xiàn)出該大類所包含的全部平性藥物名稱,方便用戶快速瀏覽和選擇;右邊窗口是中藥平性藥物信息資源顯示區(qū),根據(jù)用戶選擇的平性藥物名稱,動態(tài)顯示該平性藥物所對應的如功效、主治、藥理、化學成分等詳細信息,并配上相應的原色圖片,做到圖文并茂,加深用戶的印象。查詢系統(tǒng)網(wǎng)頁界面見圖3。
2.4 信息挖掘與特色學科服務
特色數(shù)據(jù)庫不僅應實現(xiàn)學術知識的整理和利用,更應注重提煉和深度揭示各類信息中所蘊含的知識,將隱性的知識顯性化,增加數(shù)據(jù)庫的附加值[4]。在中醫(yī)藥領域,有不少研究人員在方劑數(shù)據(jù)庫和醫(yī)案數(shù)據(jù)庫中應用數(shù)據(jù)挖掘的關聯(lián)分析方法,例如成都中醫(yī)藥大學與四川大學合作的對脾胃方的挖掘,西南交通大學對乙肝醫(yī)案數(shù)據(jù)進行挖掘[5],等等。本課題組成員在百度搜索網(wǎng)、中國知網(wǎng)、重慶維普資訊網(wǎng)進行搜索,沒有發(fā)現(xiàn)對中藥平性藥主治病癥進行數(shù)據(jù)挖掘的相關報道,因此在中藥平性藥數(shù)據(jù)庫中特別設計了“中藥平性藥主治病癥數(shù)據(jù)研究”這一模塊。首先,將中藥平性藥8 355條主治病癥條目分類整理錄入到SQL數(shù)據(jù)庫中;然后根據(jù)關聯(lián)規(guī)則Apriori算法[6],設定最小支持度的數(shù)值,可以找出一條主治病癥條目(如跌打損傷)、兩條主治病癥條目(如痹證+跌打損傷)、三條主治病癥條目(如痹證+瘡瘍+跌打損傷)各自對應的平性藥名、出現(xiàn)的頻次,頻次從高到低進行排序,部分頻次表見表2、表3、表4,并提供網(wǎng)上查詢,從而找出藥名與病癥之間存在的治療關系。
從表2、表3、表4中可以發(fā)現(xiàn),在中醫(yī)臨床實踐中,中藥平性藥主要針對治療跌打損傷、痹證、瘡瘍、咳嗽等癥狀,主治一種或兩種以上疾病涉及的平性藥種類較多,這對我們進一步研究平性中藥的治病機制及組方配伍規(guī)律指明了研究方向,為中藥臨床提供必要的用藥依據(jù),對于豐富、發(fā)展中藥藥性理論具有重要的啟發(fā)意義。
3建設體會
3.1 用戶定位及需求分析
準確地定位和把握用戶需求,是促進資源建設和服務開展的前提條件[7]。建設什么樣的特色資源、如何建設、建成的特色資源給誰用,這是建設特色資源庫首先要思考的三個問題,而準確的用戶定位和分析可以很好回答以上問題,因為用戶定位不僅決定了資源的選擇標準,而且也界定了服務的內容。中藥平性藥數(shù)據(jù)庫的用戶主要是中醫(yī)藥專業(yè)的師生以及廣大的中醫(yī)藥科研工作者,為其提供中藥平性藥的檢索、利用、傳播與共享,服務中醫(yī)藥學科建設,為中藥學、中醫(yī)臨床提供文獻知識保障,以促進中醫(yī)藥文化精髓的傳承和發(fā)揚。用戶群及服務內容的界定,為下一步數(shù)據(jù)庫建設指明大致的目標方向。
3.2 建庫內容重在知識提煉與知識整合
數(shù)據(jù)庫建設包括資源的收集、整理加工、標準化處理、平臺搭建以及信息發(fā)布等內容,是一項非常復雜的系統(tǒng)工程[8]?!爸兴幤叫运帞?shù)據(jù)庫”建設注重提煉資源中的有效知識,從眾多獨具特色的中藥著作中選取了能全面反映20世紀中藥學科發(fā)展水平與成就的綜合類本草著作《中華本草》收載的平性藥作為數(shù)據(jù)來源,并從中提煉有效信息,收集整理與平性藥相關方面的資料。在知識整合方面,該數(shù)據(jù)庫根據(jù)平性藥的相關資料設計了對應的多個數(shù)據(jù)表,并經過深入的研究分析,確定每個表描述所要記錄的數(shù)據(jù)編碼、屬性、類型等詳細信息,規(guī)定以藥名為索引號,使多個數(shù)據(jù)表關聯(lián)起來,將各種平性藥的功效、主治、藥理作用等研究對象整合在一起,確保數(shù)據(jù)的完整性與一致性,提高用戶的檢索效率。
3.3 提高挖掘隱性知識的能力,拓展圖書館的學科服務功能
如何建設特色數(shù)據(jù)庫并使其充分體現(xiàn)廣泛的學術與實踐價值,這是建庫過程中值得探討的關鍵問題。以往的建設理念多局限于對文獻資源的收集管理,重在館藏建設。這導致了有些數(shù)據(jù)庫的信息量與大型商業(yè)數(shù)據(jù)庫資源大量重復,且信息量又遠不足于大型數(shù)據(jù)庫,大大降低了這些數(shù)據(jù)庫的使用價值[9]。面向學科服務的特色數(shù)據(jù)庫建設不僅要注重文獻資源的收集整理,更應注重從數(shù)據(jù)中挖掘隱性知識,提升圖書館對教學科研的服務能力?;诖?,“中藥平性藥數(shù)據(jù)庫”功能的設計理念為:第一,滿足用戶方便檢索平性藥的功效、主治、化學成分等多種信息;第二,利用數(shù)據(jù)挖掘技術,從平性藥海量的主治病癥中科學地提煉有價值的信息,分析挖掘其主治病癥的一些規(guī)律,用戶可以通過網(wǎng)上查詢,檢索出平性藥主治病癥條目所對應的平性藥名以及出現(xiàn)頻次,從而找出藥名與病癥之間存在的治療關系,為中醫(yī)臨床用藥提供理論依據(jù)。
3.4 依托重大科研項目,大力推進特色資源庫建設
國家重大科研項目著眼于國家發(fā)展戰(zhàn)略目標,瞄準科學前沿的重大科技問題,具有投資大、多學科交叉、研究目標宏大等特點。“中藥平性藥數(shù)據(jù)庫”是依托我校主持國家“973”計劃項目“平性藥藥性本質及其調節(jié)機體平衡科學內涵研究”而建立的。重大科研項目的推進,為特色資源建設帶來了良好的發(fā)展契機:首先,得到了大量的科研經費投入,極大改善了現(xiàn)有科研條件。由于歷史等各方面原因,多數(shù)高校圖書館經費非常緊張,如果創(chuàng)建并維持一個特色資源數(shù)據(jù)庫,僅僅依靠有限的圖書經費是很困難的,因此需要通過多方面籌集專項經費,創(chuàng)建特色資源庫建設的長效機制,為教學科研提供文獻知識保障;其次,促進人才培養(yǎng)和團隊建設。優(yōu)秀團隊是建設高質量特色數(shù)據(jù)庫的保證,它最大限度地體現(xiàn)了圖書館服務的智力內涵。本課題組成員由本科以上學歷具有中醫(yī)藥專業(yè)、計算機專業(yè)、圖書情報專業(yè)背景的人員構成,各種專業(yè)人才各盡其職:樣本的抽取與分類整理由中醫(yī)藥專業(yè)人員負責;計算機專業(yè)人員主要任務為數(shù)據(jù)庫模型的建立、數(shù)據(jù)挖掘、網(wǎng)頁設計與發(fā)布、系統(tǒng)維護等技術工作[10];而圖書情報專業(yè)館員則負責數(shù)據(jù)的標引及文獻信息的檢索途徑等等。以學科建設為基礎,以重大科研項目為紐帶,凝聚學術隊伍的組織模式[11],為數(shù)據(jù)庫建設提供了技術支撐和開發(fā)動力。
[參考文獻]
[1]田青.基于知識服務構建圖書館核心業(yè)務的戰(zhàn)略思考[J].圖書館學研究,2013,(14):16—18.
[2]王知津,徐芳.論信息服務十大走向[J].中國圖書館學報,2009(1):52—58.
[3]國家中醫(yī)藥管理局《中華本草》編委會.中華本草(第10卷)[M].上海:上海科學技術出版社,1999.
[4]曾娜,陳巍,李文蘭.面向學科服務的高校圖書館重點學科特色資源數(shù)據(jù)庫建設探析[J].現(xiàn)代情報,2012(6):75—76.
[5]李園白.中醫(yī)婦科常見病醫(yī)案數(shù)據(jù)挖掘方法研究[D].北京:中國中醫(yī)科學院,2006.
[6]王麗珍.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘原理及應用[M].北京:科學出版社,2009.
[7]程紅梅.高校圖書館特色資源建設的案例分析[J].圖書館建設,2013(6):26—29.
[8]程桂練,仲超生.知識服務環(huán)境下圖書館特色數(shù)據(jù)庫建設——以“凹土資源特色數(shù)據(jù)庫”建設為例[J].陜西學前師范學院學報,2015(4):8—10.
[9]謝春汛,鄭萍.地方院校圖書館特色數(shù)據(jù)庫建設策略研究[J].圖書館學研究,2012(19):27—30.
[10]裴麗,李鐵男,徐小濱,等.特色數(shù)據(jù)庫建設的實踐與啟示[J].圖書館學研究,2014(1):54—56.
[11]陳浩.高校國家重大科研項目中申報策略與管理研究[J].科技生活,2010(7):196.