唐 迪
〔摘 要〕以本單位為例,分析了大型科研院所的信息服務(wù)體系的現(xiàn)狀,并根據(jù)現(xiàn)存體系的不足提出了針對(duì)重點(diǎn)學(xué)科的信息資源建設(shè)。闡述了重點(diǎn)學(xué)科信息服務(wù)研究的目的和必要性,并提出了以資源挖掘?yàn)橹鞯膶?shí)現(xiàn)手段。
〔關(guān)鍵詞〕重點(diǎn)學(xué)科;信息服務(wù);資源挖掘
〔中圖分類號(hào)〕G203 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)〕1008-0821(2009)11-0060-02
Research on Major Subjects Information Service Based
on Resource Mining in Large-scale Research InstitutesTang Di
(Science and Technology Information Center of China Academy of Engineering Phyiscis,Mianyang 621900,China)
〔Abstract〕Taking China academy of engineering phyiscis for example,this paper analysed the information service system conditions,put forward the information resource building method of major subjects according to the defect of existing system.discussed the purpose and necessity of major subjects information service,and put forward the method by resource mining.
〔Keywords〕major subjects;information service;resource mining
目前我國(guó)的大型科研院所都建立了自己的科技信息保障單位和以資源為主體的信息服務(wù)體系。以我單位為例,經(jīng)過(guò)多年的努力,已逐步形成基本滿足我院需求的紙本資源和數(shù)字資源共同發(fā)展的資源體系。在數(shù)字資源的建設(shè)中,由于各種數(shù)據(jù)庫(kù)是由不同數(shù)據(jù)庫(kù)商提供且是整庫(kù)引進(jìn),各庫(kù)資源存在分類方式的差別和內(nèi)容上的少量交叉重復(fù)。另外,館藏紙本中英文期刊與數(shù)據(jù)庫(kù)收錄內(nèi)容也存在少量交叉重復(fù)。鑒于數(shù)據(jù)庫(kù)檢索方便和紙本刊閱讀便利的特點(diǎn),電子資源和紙本資源的少量交叉重復(fù)是符合信息資源建設(shè)規(guī)律的,但如何充分發(fā)揮兩種資源尤其是數(shù)字資源的優(yōu)勢(shì),在滿足科研院所普遍信息需求的基礎(chǔ)上,著重加強(qiáng)重點(diǎn)學(xué)科的信息資源建設(shè),是我們研究的出發(fā)點(diǎn)。
1 研究目的
隨著網(wǎng)絡(luò)技術(shù)、數(shù)據(jù)庫(kù)技術(shù)的不斷發(fā)展,網(wǎng)上免費(fèi)信息已經(jīng)成為人們獲取信息資源的一大途徑,如何系統(tǒng)、有效地發(fā)現(xiàn)、獲取并利用這些無(wú)序的網(wǎng)絡(luò)資源,涉及到網(wǎng)絡(luò)資源發(fā)現(xiàn)與采集的相關(guān)技術(shù)。在科技信息資源方面,各大數(shù)據(jù)庫(kù)提供商、出版社等信息資源提供者為更廣范圍地吸引用戶,普遍開(kāi)展了網(wǎng)絡(luò)數(shù)據(jù)庫(kù)題錄、文摘等信息的免費(fèi)檢索服務(wù),只有在用戶要求獲取全文時(shí)才對(duì)用戶進(jìn)行合法身份的驗(yàn)證;另外,許多高校、科研機(jī)構(gòu)等也在網(wǎng)上免費(fèi)提供自己的研究成果和科技信息,這些都為網(wǎng)絡(luò)資源挖掘的開(kāi)展提供了豐富的數(shù)據(jù)來(lái)源。
我們旨在研究互聯(lián)網(wǎng)公開(kāi)數(shù)據(jù)及可鏈接數(shù)據(jù)庫(kù)的采集技術(shù)和服務(wù)手段,并以我院各學(xué)科的信息需求為實(shí)踐對(duì)象,將網(wǎng)上無(wú)序、易變、但有價(jià)值的資源以學(xué)科庫(kù)、專題庫(kù)的方式挖掘到本地,豐富我院科技信息資源,同時(shí)揭示挖掘資源和引進(jìn)資源間的關(guān)聯(lián)關(guān)系,形成“文摘庫(kù)——全文庫(kù)——紙本刊”三類資源互為補(bǔ)充的資源服務(wù)格局,不但彌補(bǔ)整庫(kù)引進(jìn)所帶來(lái)的庫(kù)與庫(kù)之間、電子資源和紙本資源之間的交叉重復(fù)問(wèn)題,節(jié)約了建設(shè)經(jīng)費(fèi),而且從學(xué)科角度深化了信息資源服務(wù),使得信息資源服務(wù)逐步朝著更專(專業(yè))、精(精細(xì))、新(新穎)的方向發(fā)展。
2 研究的必要性
數(shù)據(jù)庫(kù)整庫(kù)引進(jìn)代價(jià)很大,需要大量的經(jīng)費(fèi)支持,并且非常占用存儲(chǔ)的空間。數(shù)據(jù)庫(kù)收錄了多種期刊,但對(duì)于用戶來(lái)說(shuō),并不是每一種刊都用的上。目前基于關(guān)鍵詞檢索的技術(shù),往往導(dǎo)致用戶從庫(kù)中檢索出成百上千篇的全文,雖然其中不乏有用的,但用戶往往在檢索結(jié)果中還沒(méi)找到有用的資源就已經(jīng)沒(méi)有耐心再找下去。所以數(shù)據(jù)庫(kù)整庫(kù)檢索的服務(wù)方式對(duì)單一用戶來(lái)說(shuō)顯得沒(méi)有針對(duì)性。
用戶對(duì)信息資源的需求具有穩(wěn)定性和持續(xù)性,對(duì)單一用戶或一個(gè)科研方向的用戶團(tuán)體來(lái)講,他們需要的只是涵蓋本專業(yè)方向的學(xué)科庫(kù)、專題庫(kù),而不是包羅萬(wàn)象的綜合數(shù)據(jù)庫(kù)。
我院科技信息資源以引進(jìn)資源為主,目前只有少量自建資源,為形成各種符合我院科研生產(chǎn)實(shí)際需要的專題庫(kù),有必要在學(xué)科分類的基礎(chǔ)上,充分挖掘利用信息港的本地化資源和互聯(lián)網(wǎng)中免費(fèi)的題錄信息資源,形成以用戶需求為中心的更有針對(duì)性的專題庫(kù)。
目前,我院電子資源的服務(wù)方式以數(shù)據(jù)庫(kù)為單元,但尚未從學(xué)科分類角度提供資源的統(tǒng)一訪問(wèn)入口,專題庫(kù)的建立可以使用戶獲得一個(gè)以學(xué)科、專業(yè)為引導(dǎo)的資源檢索方向。
目前我們?cè)谫Y源建設(shè)中尚未建立紙本期刊與電子期刊間的關(guān)聯(lián)。通過(guò)專業(yè)文摘庫(kù)的服務(wù)方式,使用戶在該庫(kù)中檢索出自己想要的資源后再發(fā)出全文請(qǐng)求,可以把紙本期刊、本地化電子期刊和網(wǎng)絡(luò)信息資源中收費(fèi)期刊的使用更好的結(jié)合起來(lái)。
對(duì)于網(wǎng)絡(luò)中的鏈接資源,其題錄信息一般是免費(fèi)的,我們實(shí)現(xiàn)題錄信息的本地化后,可以為用戶提供一個(gè)獲取全文的渠道。用戶提交全文請(qǐng)求后我們?nèi)フ{(diào)用全文,同樣能滿足用戶的需求。
3 實(shí)施步驟
下面以我院為例,談?wù)劥笮涂蒲性核攸c(diǎn)學(xué)科的信息服務(wù)的具體實(shí)施步驟。
3.1 確定用戶對(duì)象
參考中圖法、科圖法、各大數(shù)據(jù)庫(kù)現(xiàn)行分類法,對(duì)我院現(xiàn)有科技信息資源進(jìn)行學(xué)科分類,以某一學(xué)科A為例,結(jié)合我院各科研所的研究方向,對(duì)該學(xué)科的資源以所為單位進(jìn)行重點(diǎn)用戶對(duì)象排序。
3.2 完善學(xué)科資源列表
采用各種形式與重點(diǎn)用戶進(jìn)行充分交流,明確A學(xué)科的資源構(gòu)成。采用比較分析法研究A學(xué)科資源建設(shè)的不足,將A學(xué)科盡可能全的資源(包括我院已有的和與其它機(jī)構(gòu)比較尚欠缺的資源)形成A學(xué)科盡可能完備的資源列表,就資源列表與該學(xué)科重點(diǎn)用戶進(jìn)行溝通,以便對(duì)資源列表進(jìn)行增刪。
3.3 建立文摘題錄數(shù)據(jù)庫(kù)
在確定某學(xué)科的資源列表后,下一步是建立文摘題錄數(shù)據(jù)庫(kù),先查找本地資源中已有的文摘題錄,如果不全,再?gòu)木W(wǎng)上相關(guān)站點(diǎn)挖掘下載,根據(jù)資源列表將重點(diǎn)學(xué)科的文摘題錄數(shù)據(jù)庫(kù)盡量完善。
3.3.1 確定網(wǎng)絡(luò)挖掘范圍
參考國(guó)內(nèi)外大學(xué)和研究機(jī)構(gòu)建立的數(shù)字圖書(shū)館,研究其A學(xué)科中所包括的資源,重點(diǎn)是期刊論文、會(huì)議論文、博碩論文、科技報(bào)告等,與我院現(xiàn)有的A學(xué)科資源進(jìn)行比較,找出我院在A學(xué)科中缺乏的資源,確定網(wǎng)絡(luò)挖掘范圍。
3.3.2 網(wǎng)站分析與內(nèi)容挖掘
對(duì)A學(xué)科中缺乏的資源開(kāi)展網(wǎng)絡(luò)搜索,重點(diǎn)搜索對(duì)象包括數(shù)據(jù)庫(kù)提供商、出版社,以及重點(diǎn)用戶推薦網(wǎng)站,并由人工干預(yù)選擇。在網(wǎng)站搜索的基礎(chǔ)上,對(duì)符合條件的網(wǎng)站做分析,確定內(nèi)容挖掘方式,將文摘題錄信息下載到本地。對(duì)挖掘到的資源進(jìn)行數(shù)據(jù)清理,完善文摘題錄數(shù)據(jù)庫(kù)。
3.4 全文的獲取
3.4.1 挖掘到的全文
根據(jù)挖掘資源的不同類型做不同的使用。當(dāng)挖掘到的資源為文摘題錄時(shí),用于完善文摘題錄數(shù)據(jù)庫(kù);當(dāng)挖掘到的資源是全文時(shí),直接將其分類在A學(xué)科類目的全文庫(kù)中為用戶所使用。
3.4.2 館際全文合作
根據(jù)挖掘到的題錄、文摘類信息,尋求相應(yīng)全文資源豐富的單位,與之開(kāi)展合作,拓展全文資源的獲取途徑。
3.5 服務(wù)形式
將A學(xué)科的文摘題錄數(shù)據(jù)庫(kù)公布到科技信息服務(wù)網(wǎng)站上,并建設(shè)全文調(diào)用系統(tǒng)。當(dāng)科研人員在檢索文摘題錄數(shù)據(jù)庫(kù)后,若需要某篇全文則可在網(wǎng)上發(fā)送全文請(qǐng)求,系統(tǒng)首先自動(dòng)檢索本地?cái)?shù)字全文資源(包括挖掘資源),如果本地資源中有全文就直接呈現(xiàn)全文;如果本地?cái)?shù)字資源中沒(méi)有全文,而只有相應(yīng)的館藏紙本資源,則提示用戶進(jìn)行館藏原文請(qǐng)求;如無(wú)相應(yīng)的館藏紙本資源,則提示用戶進(jìn)行館際原文請(qǐng)求。
3.6 學(xué)科全文庫(kù)的建設(shè)
通過(guò)上述過(guò)程,我們可以實(shí)現(xiàn)A學(xué)科的全文服務(wù)。將調(diào)用頻率高的本地全文、挖掘全文和館際調(diào)用全文建設(shè)成為A學(xué)科的專業(yè)學(xué)科數(shù)據(jù)庫(kù),我們的重點(diǎn)學(xué)科信息服務(wù)將初具雛形。這樣,既避免了盲目引進(jìn)數(shù)據(jù)庫(kù)而導(dǎo)致的本地?cái)?shù)據(jù)量爆炸式增長(zhǎng),又能夠縮小檢索范圍,使科研人員對(duì)資源的檢索更加準(zhǔn)確,還能夠更大程度的滿足用戶對(duì)全文的需求。
4 結(jié) 論
建立一套以用戶需求為導(dǎo)向的數(shù)據(jù)發(fā)現(xiàn)、采集、建庫(kù)的資源挖掘方法,充分挖掘網(wǎng)絡(luò)信息資源,擴(kuò)大科技信息資源獲取途徑,深化學(xué)科化信息資源服務(wù),實(shí)現(xiàn)以需求為導(dǎo)向、以本地資源、挖掘到的網(wǎng)絡(luò)資源和館際合作調(diào)用資源為基礎(chǔ),靈活地為科研人員提供專業(yè)化、精細(xì)化、個(gè)性化的學(xué)科信息服務(wù),將有利于改善資源獲取環(huán)境,提升對(duì)大型科研院所的信息服務(wù)能力。
參考文獻(xiàn)
[1]嚴(yán)浪.從加強(qiáng)學(xué)科建設(shè)談高校圖書(shū)館數(shù)字化信息服務(wù)[J].圖書(shū)館論壇,2008,(3):136-138.
[2]吳新年,陳永平.關(guān)于學(xué)科化信息服務(wù)的思考與建議[J].情報(bào)科學(xué),2007,(12):1833-1837.
[3]王翠萍,張妍妍.學(xué)科信息門(mén)戶的個(gè)性化服務(wù)調(diào)查研究[J].圖書(shū)館學(xué)研究,2008,(7):59-63.
[4]張春輝,李健康.網(wǎng)絡(luò)資源開(kāi)發(fā)的若干關(guān)鍵技術(shù)與途徑研究進(jìn)展[J].圖書(shū)館論壇,2004,(5):167-169.
[5]徐劉靖,劉細(xì)文.國(guó)外網(wǎng)絡(luò)灰色文獻(xiàn)開(kāi)發(fā)利用模式及服務(wù)方式研究[J].圖書(shū)情報(bào)知識(shí),2006,(1):78-80.