趙伶 郭曉?!」?/p>
[摘要]以“非金屬材料與化工專業(yè)特色數(shù)據(jù)庫”為例,從數(shù)據(jù)組織、數(shù)據(jù)采集和數(shù)據(jù)標引幾個方面對數(shù)據(jù)庫建設中的數(shù)據(jù)質(zhì)量控制方法進行了探討。
[關鍵詞]特色數(shù)據(jù)庫;數(shù)據(jù)組織;質(zhì)量控制
1數(shù)據(jù)源采集過程的質(zhì)量控制
為保障數(shù)據(jù)庫中數(shù)據(jù)的質(zhì)量,在確定數(shù)據(jù)庫建設之前,首先需要對數(shù)據(jù)庫建設進行市場調(diào)查和分析,以保證該數(shù)據(jù)庫立項的合理性和實用性,避免造成資源與人力的浪費;而在數(shù)據(jù)采集時,則必須遵循準確清晰的指導思想和采集原則,以形成能夠滿足數(shù)據(jù)庫用戶需求的數(shù)據(jù)資源。
1.1 數(shù)據(jù)庫建設需求分析
特色數(shù)據(jù)庫的數(shù)據(jù)資源需要體現(xiàn)特色,即專業(yè)特色、館藏特色或行業(yè)特色。作為高職院校圖書館,專業(yè)特色要體現(xiàn)本校的專業(yè)特長,有重點地選擇自己辦學歷史中專業(yè)特色突出、發(fā)展良好的建庫課題。在申請本課題前,我們通過對教育部相關信息網(wǎng)站[2]調(diào)查得知,目前開辦材料工程專業(yè)的本科院校有148所、開辦無機非金屬專業(yè)的本科院校有91所,高職院校開辦材料專業(yè)的院校有15所,中專、職高學校開辦硅酸鹽專業(yè)的有27所。各學校辦學層次和宗旨不同,擔負的教學任務不同,培養(yǎng)社會需要的人才不同,本科院校培養(yǎng)的是學術研究型、工程技術人才,高職院校培養(yǎng)的是高端技能型、應用型人才,中職教育培養(yǎng)操作技能型人才,因此各學校對信息需要的層次、類型、專業(yè)側(cè)重點也有所不同。
高職院校的行業(yè)和職業(yè)特征非常明顯,在辦學水平不斷提高和發(fā)展的同時,逐漸形成了各個學校的特色資源。高職院校圖書館如果能對這些極具針對性、專業(yè)性的特色信息資源進行開發(fā),為用戶提供精、準、新、快的信息服務,滿足用戶的個性化需求,提供專業(yè)化的信息服務,對學校的發(fā)展有很好的促進作用。同時,能提供專業(yè)化的特色服務,也是衡量圖書館服務能力和服務水平的重要標準。
我院材料工程技術專業(yè)是學院特色專業(yè),也是四川省精品專業(yè)、國家示范高職院校重點建設專業(yè),多年來,對國家材料類專業(yè)技能型人才培養(yǎng)、行業(yè)企業(yè)技術服務、同類專業(yè)教學改革等多方面做出了積極貢獻。本課題的研究,將通過及時、準確的信息提供,促進專業(yè)建設和發(fā)展。因此圖書館有必要建立這一特色數(shù)據(jù)庫。
1.2 數(shù)據(jù)庫建設市場調(diào)查
從2008年以來,我館一直關注CALIS中心特色資源的建設情況[3],并對材料類專業(yè)數(shù)據(jù)庫的建設情況進行調(diào)查[4],發(fā)現(xiàn)目前全國高校建立的特色數(shù)據(jù)庫基本是由高校圖書館開發(fā)建設的,主要有武漢理工大學“復合材料專題特色數(shù)據(jù)庫”、上海大學“納米材料數(shù)據(jù)庫”、西南科技大學“無機非金屬材料特色庫”,而化工建材研究院所和企業(yè)的網(wǎng)站平臺以服務企業(yè)為宗旨,主要提供高新技術項目信息和產(chǎn)品信息,沒有相關的專業(yè)數(shù)據(jù)庫。
在對化工行業(yè)和高職院校相關專業(yè)的數(shù)據(jù)庫開發(fā)進行調(diào)查時發(fā)現(xiàn),中小企業(yè)中幾乎沒有自己開發(fā)資源的,高職院校自建數(shù)據(jù)庫的,目前有124個,所涉及專業(yè)只有23個,其余大多是隨書光盤數(shù)據(jù)庫、教師自編教材庫等,而化工建材方面的專業(yè)資源庫一個也沒有。
從上述調(diào)查結果來看,目前已有數(shù)據(jù)庫的數(shù)據(jù)形式多以文本格式為主,內(nèi)容以研究型和高新技術研究成果的學術論文為主。結合我院的辦學發(fā)展過程進行分析,發(fā)現(xiàn)目前已有數(shù)據(jù)庫針對中、高職教育教學科研和企業(yè)人才培養(yǎng)方面的實用信息資源缺乏,與目前中高職職業(yè)教育人才培養(yǎng)的信息需求不適合,不利于中高職院校的專業(yè)建設與校企結合的發(fā)展建設。因此,我館于2012年向四川省教育廳申請了“非金屬材料與化工專業(yè)特色數(shù)據(jù)庫”的科研課題,并獲批準。
2數(shù)據(jù)組織階段的質(zhì)量控制
2.1 數(shù)據(jù)組織的原則
良好的數(shù)據(jù)資源基礎是數(shù)據(jù)庫建設成敗的關鍵。設計開發(fā)再好的數(shù)據(jù)庫,如果沒有符合用戶需求的數(shù)據(jù),也無意義。數(shù)據(jù)采集作為數(shù)據(jù)庫建設的重中之重,需要準確的指導思想和采集原則。非金屬材料與化工專業(yè)作為我院的國家示范職業(yè)教育專業(yè),圖書館在長期的資源組織上一直是重點保障專業(yè),我們確定的采集原則[5]主要是:1)完整性。盡可能全面、準確、完整地搜集與我院非金屬材料專業(yè)相關的各類型學術進展和研究成果的文獻資源。2)實用性。根據(jù)本館的館藏特色和本校的特色專業(yè)及重點專業(yè),重點收錄與高職辦學相關的人才培養(yǎng)方案、課程標準、教學成果、精品課程、試題庫等資源;根據(jù)高職教師與學生的實際需求,收錄了實用的相關專業(yè)文獻、自編教材、講義及相關專業(yè)的技術標準、規(guī)范和專利文獻等。3)特色性。專業(yè)特色突出,在數(shù)據(jù)庫建設中選擇非金屬材料專業(yè)中對人才培養(yǎng)有益的資源和代表性的重要文章,掃描錄入全文數(shù)據(jù)庫。
2.2 數(shù)據(jù)組織中的質(zhì)量控制
數(shù)據(jù)搜集是數(shù)據(jù)庫建設的重要前提[6]。在明確了數(shù)據(jù)采集原則后,首先,就要嚴格控制數(shù)據(jù)組織中的數(shù)據(jù)質(zhì)量。對于本數(shù)據(jù)庫專業(yè)資源并不十分豐富的資源市場,盡可能搜集不同類型文獻。為此,我館在整理本館紙質(zhì)文獻的基礎上,加強了電子型、視聽型文獻資源搜集;同時,不局限于本館資源,也搜集其他合作單位的一些專業(yè)資源,以補充我們專業(yè)資源的不足。
其次,在數(shù)據(jù)組織時積極配合學院重點專業(yè)教學、培訓的需要,除購置教學科研所需的相關資源外,還深入到院系搜集重要的教學成果、教師的專業(yè)著述、人才培養(yǎng)方案等特色資源。
再次,考慮到高職人才培養(yǎng)注重應用技能的培養(yǎng)的特點,專利、標準、技能考核訓練也是高職人才培養(yǎng)的重要教學參考資源,是我館搜集的重點。本著實用性原則,盡量搜集專業(yè)技術較新的、專業(yè)特色與本數(shù)據(jù)庫建庫宗旨一致的資源,如專利、標準電子資源的選取,以有效專利和現(xiàn)行標準為主要原則,圍繞本數(shù)據(jù)庫建設宗旨,在資料的選取上盡量保證專業(yè)特色顯著。
最后,在特色數(shù)據(jù)庫的框架范圍內(nèi),對搜集的資源按類型所屬模塊和子類目進行分類,形成具有本館特色的資源體系。
2.3 形成特色子庫
2.3.1 館藏圖書書目數(shù)據(jù)庫。建筑材料專業(yè)一直是我院創(chuàng)建以來圖書館資源收藏的重點專業(yè),該類文獻出版量不大、品種少,但我們在采購時仍然盡量將其收錄館藏。該庫共收錄此類文獻3 000多種,以及本院教師歷年來自編的教材、講義等,所占比率雖然不大,但已形成我館本專業(yè)收藏特色較為顯著的文獻體系。
2.3.2 電子資源庫。電子資源已成為當今獲得文獻信息最主要的途徑,為滿足師生們在教學中對現(xiàn)代信息資源的需要,圖書館用于購置電子資源的經(jīng)費也在逐年增加,目前我館的電子資源除購買了CNKI、維普、超星等數(shù)字資源,還圍繞材料專業(yè)的學科建設購買了相應領域(水泥、玻璃、陶瓷等)的專利光盤數(shù)據(jù)庫、中國標準數(shù)據(jù)庫等。
2.3.3 精品課程庫。本數(shù)據(jù)庫收錄了學院在重點專業(yè)建設時學院老教師開發(fā)的、高職教育所需的化工類非金屬材料國家精品課程、四川省精品課程、校精品課程等。
2.3.4 校內(nèi)資源庫。本數(shù)據(jù)庫搜集了學院教學形成的人才培養(yǎng)方案、課程標準、教學成果、試題庫等內(nèi)部資源。
3數(shù)據(jù)標引的質(zhì)量控制
在數(shù)據(jù)庫建設中,信息描述是信息組織的重要環(huán)節(jié),好用的數(shù)據(jù)庫依賴于數(shù)據(jù)的準確描述,提供給讀者較為準確的檢索信息,使讀者通過檢索能準確判斷信息是否為自己所需。因此,最艱難的是對已搜集的大量信息進行數(shù)據(jù)的分析加工描述,通過合理分配人員對數(shù)據(jù)加工過程進行質(zhì)量控制。
3.1 規(guī)范數(shù)據(jù)著錄標引
在組織數(shù)據(jù)庫建設之初,我們將人員分為數(shù)據(jù)庫開發(fā)人員和數(shù)據(jù)整理標引人員兩組,在數(shù)據(jù)標引方面,我們按照中文文獻著錄規(guī)則、專利文獻分類法、標準文獻分類法,對不同類型的文獻資源制訂了嚴格的著錄標引細則。
首先,由課題主研人員對已采集的數(shù)據(jù)進行篩選,按照不同類型的數(shù)據(jù)制訂詳細的著錄標引細則。由于我們搜集的數(shù)據(jù)資源類型多樣化,分類標引的字段、分類標準等都有所不同,因此對標引的深度、分類的集中與分散、主題詞和關鍵詞的選用、著錄等均制訂了標引細則,以提高標引質(zhì)量,使信息分類更規(guī)范、更科學嚴謹,使數(shù)據(jù)庫信息資源更能滿足各類用戶的需求。同時,為保障任何人都能夠利用終端檢索和利用特色數(shù)據(jù)庫,我們針對不同類型的資源提供盡可能多的檢索入口,比如題名、著者、分類號、專利號、標準號、主題詞、關鍵詞、年代、摘要等。系統(tǒng)的檢索入口越多,用戶選擇的余地越大,就越能滿足用戶多樣化的檢索要求。
其次,對數(shù)據(jù)標引人員進行專業(yè)培訓。通常圖書館專業(yè)人員只熟悉中圖法分類,對數(shù)據(jù)庫收集的專利、標準文獻的分類標引基本不了解。為了對標引詞的準確性進行控制,我們的數(shù)據(jù)標引人員進行了基本的專利、標準文獻分類法的學習,力求分類著錄時能按照要求,對文獻進行標準化、規(guī)范化的分類、著錄和主題標引等工作,這是保證數(shù)據(jù)庫質(zhì)量的關鍵。
再次,由于本數(shù)據(jù)庫信息資源種類繁多,既有普通的電子文本,也有圖像、視頻等各類特藏,為了有效地利用這些信息資源就必須根據(jù)一定的原則和方法對其進行組織,使其成為有序的信息資源。我們的數(shù)據(jù)經(jīng)過相關專業(yè)標引后,再由數(shù)據(jù)庫開發(fā)人員進行結構描述形成專業(yè)數(shù)據(jù)元數(shù)據(jù),然后導入數(shù)據(jù)庫中,這樣就能全面反映數(shù)據(jù)庫數(shù)據(jù)的準確信息,為數(shù)據(jù)庫建設形成良好的數(shù)據(jù)基礎。
3.2 數(shù)據(jù)庫建設與標引模式創(chuàng)新
3.2.1 數(shù)據(jù)庫建設模式。目前專業(yè)特色數(shù)據(jù)庫開發(fā)還沒有統(tǒng)一的共享平臺,我們綜合比較了目前其他數(shù)據(jù)庫選用的開發(fā)軟件[7—9],選用基于微軟Net2.0平臺采用C#語言,利用微軟配套的Visual Studio.NET、.NET Framework專業(yè)的開發(fā)軟件及應用程序組成開發(fā)環(huán)境;在數(shù)據(jù)庫連接上,采用了Visual Studio.NET 中最新的ADO.NET技術連接遠程SQL Server2005 數(shù)據(jù)庫;采用微軟ASP.net的數(shù)據(jù)訪問層、業(yè)務邏輯層、表示層架構設計,擁有良好的數(shù)據(jù)庫平臺框架結構和符合資源共享的公共檢索平臺。
根據(jù)CALIS三期特色庫項目的設計思路[10],數(shù)據(jù)庫平臺采用Web2.0網(wǎng)站標準架構體系,整合了Web2.0技術與應用,網(wǎng)站界面友好、布局合理,資源分類合理,易于檢索與查找操作。數(shù)據(jù)庫平臺訪問采用基于B/S的結構,用戶無須安裝任何軟件,只需使用IE瀏覽器就可進行檢索與瀏覽,并預留了與外部數(shù)據(jù)中心并接的軟件接口。
3.2.2 數(shù)據(jù)標引模式創(chuàng)新。為了方便在將來加入CALIS數(shù)據(jù)中心時數(shù)據(jù)庫平臺整合時能夠保證元數(shù)據(jù)被專題特色庫中心系統(tǒng)收割發(fā)布[11],避免造成元數(shù)據(jù)丟失或錯位,影響數(shù)據(jù)庫共享及升級,我們將數(shù)據(jù)庫源文獻資源存儲在SQL Server2005中。在數(shù)據(jù)錄入上,我們沒有采用傳統(tǒng)的方式在已建好的數(shù)據(jù)庫中直接錄入數(shù)據(jù),而是采取數(shù)據(jù)在庫外進行標引,完成后由數(shù)據(jù)庫開發(fā)人員進行導入并校驗,不僅避免了過去先開發(fā)后標引,在錄入數(shù)據(jù)時間上的浪費,還可以防止在錄入時因數(shù)據(jù)庫的修改調(diào)試造成數(shù)據(jù)丟失;同時,數(shù)據(jù)可以隨時從數(shù)據(jù)庫中調(diào)出,既方便對數(shù)據(jù)庫進行修改,又為今后的數(shù)據(jù)庫升級保存數(shù)據(jù),對數(shù)據(jù)庫建設和數(shù)據(jù)質(zhì)量提升都是一個較為理想的模式。
3.3 數(shù)據(jù)庫建庫后續(xù)工作
此外, 數(shù)據(jù)修正、維護、更新和系統(tǒng)維護等后續(xù)工作也是保證數(shù)據(jù)庫質(zhì)量的必要手段。數(shù)據(jù)庫建成后需要定期對數(shù)據(jù)內(nèi)容進行更新、追加、清理和修正, 并經(jīng)常對系統(tǒng)的運行狀況(如存儲空間狀況)和響應時間進行分析, 結合用戶在使用過程中發(fā)現(xiàn)的問題確定改進措施, 使系統(tǒng)逐步完善。
4結語
在面向數(shù)據(jù)源的數(shù)據(jù)組織中,不僅需要保質(zhì)保量的數(shù)據(jù)采集,建庫前廣泛的調(diào)查分析也是必不可少;而在數(shù)據(jù)標引過程中,通過人員的合理分工合作,采用新的庫外標引與數(shù)據(jù)庫開發(fā)同步進行的模式,使兩部分工作能有序順利的推進,也方便了后續(xù)的維護更新。通過上述具體的方法,將數(shù)據(jù)質(zhì)量控制貫穿到整個數(shù)據(jù)庫建設的過程中。
[參考文獻]
[1] 楊瑩,羅宏.CALIS 高校學位論文數(shù)據(jù)庫數(shù)據(jù)質(zhì)量分析[J].四川圖書館學報,2012(3):36—39.
[2] 高考自愿填報參考系統(tǒng)[EB/OL].[2014-07-05].http://gkcx.eol.cn/soudaxue/querySchoolSpecialty.html?zycengci=.
[3] 中國高等教育文獻保障系統(tǒng)(CALIS)主頁[EB/OL].[2014-07-05].http://project.calis.edu.cn/calisnew/.
[4] 趙伶,郭曉保.高職院校圖書館特色資源開發(fā)現(xiàn)狀調(diào)查分析及對策[J].綿陽職業(yè)技術學院院報,2009(1):54—56.
[5] 邵銳,鐘世明.專題特色數(shù)據(jù)庫系統(tǒng)研究[J].圖書館學研究,2007(6):9—11.
[6] 李玲.高校圖書館專題特色數(shù)據(jù)庫建設的質(zhì)量控制研究[J].圖書館工作與研究,2012(7):119—122.
[7] 孫瑾.軍隊檔案專題數(shù)據(jù)庫建設現(xiàn)狀及存在問題——兼論數(shù)據(jù)組織階段質(zhì)量控制[J].檔案學研究,2013(3):41—45.
[8] Zhou Hui,Zeng Hong,Chen Jianli,Qin Shigang.A Research of Higher Vocational Colleges Teaching Resources Database Construction based on Web[C]. Proceedings of 2011 International Conference on Business Management and Electronic Information(BMEI 2011) VOL.01: 443—446.
[9]Helland Pat. If You Have Too Much Data, then 'Good Enough' Is Good Enough[J].Communications of the ACM, Jun2011, Vol.54 Issue 6: 40—47.
[10] 燕今偉.CALIS專題特色數(shù)據(jù)庫的建設[M/OL].[2014-07-05].http://lib.gznu.edu.cn/tgw/tongzhi/2011/0405/yjw.pdf.
[11] 趙增和.圖書館特色資源元數(shù)據(jù)API實現(xiàn)與比較研究[J].圖書館學刊,2014(8):49—53.
[收稿日期]2014-09-05
[作者簡介]趙伶(1962—),女,副研究館員,綿陽職業(yè)技術學院圖書館,已發(fā)表論文數(shù)篇;
郭曉保(1959—),男,綿陽職業(yè)技術學院副研究館員,已發(fā)表論文數(shù)篇; 郭妍捷(1990—),女,南京理工大學自動化學院在讀研究生。