孫輝中
摘 要:在現(xiàn)代信息技術(shù)快速發(fā)展的背景下,計(jì)算機(jī)互聯(lián)網(wǎng)技術(shù)逐漸成為國(guó)民生產(chǎn)生活的重要組成部分,能夠深刻地改變國(guó)民的思維方式與行為規(guī)范。而計(jì)算機(jī)檢索主要指應(yīng)用各類數(shù)據(jù)庫(kù)獲取檢索資源的過(guò)程,影響到用戶課題完成的質(zhì)量與效率。通過(guò)制定并調(diào)整計(jì)算機(jī)檢索策略方式,能夠?yàn)槲覈?guó)計(jì)算機(jī)檢索工作的健康發(fā)展與梳理提供抓手。對(duì)此,文章結(jié)合用戶交談、數(shù)據(jù)庫(kù)選取、概念選取及檢索策略的調(diào)整與制定,優(yōu)化并改進(jìn)我國(guó)的計(jì)算機(jī)檢索策略。
關(guān)鍵詞:計(jì)算機(jī);檢索策略;調(diào)整
0 ? 引言
在通信技術(shù)、網(wǎng)絡(luò)技術(shù)及計(jì)算機(jī)技術(shù)快速發(fā)展的過(guò)程中,計(jì)算機(jī)檢索的功能日漸強(qiáng)大,能夠以突破時(shí)空限制、檢索范圍廣、信息更新快、效率高及檢索快等優(yōu)勢(shì)逐漸成為用戶獲取文獻(xiàn)數(shù)據(jù)的重要手段。然而相較于手工檢索,計(jì)算機(jī)檢索能夠把用戶的思維取向反饋到計(jì)算機(jī)檢索策略的調(diào)整與定制中,提升檢索結(jié)果的精準(zhǔn)性。因此檢索策略的質(zhì)量高低,直接影響到檢索結(jié)果的呈現(xiàn)效果。譬如檢索策略的調(diào)整和定制不夠合理,將導(dǎo)致計(jì)算機(jī)檢索的結(jié)果出現(xiàn)誤檢、漏檢等現(xiàn)象。但在檢索策略編制的過(guò)程中,用戶交談、數(shù)據(jù)庫(kù)選取、概念選取及檢索策略的調(diào)整和定制是重點(diǎn),需要我們提高相應(yīng)的重視程度。
1 用戶交談
用戶交談是計(jì)算機(jī)檢索的根基與焦點(diǎn),檢索人員必須提高對(duì)用戶體驗(yàn)、需求及要求的重視程度,傾聽(tīng)用戶的感受,從而明確檢索策略調(diào)整和制定的基本方向。在這個(gè)過(guò)程中,檢索策略制定者需要傾聽(tīng)用戶有關(guān)課題的講解,探究相應(yīng)的專業(yè)背景,譬如發(fā)展方向、研究進(jìn)展、常用方法等。此外還需要通過(guò)交談的方式,確定用戶具體掌握的文獻(xiàn)資源,讓用戶積極提供關(guān)于主題、概念及行業(yè)術(shù)語(yǔ)等信息,以此確定計(jì)算機(jī)檢索的維度,如文獻(xiàn)類型、時(shí)間范圍、文獻(xiàn)類型等。
2 概念選取
概念選取在計(jì)算機(jī)選取中擁有較為突出的地位和作用,直接影響到檢索式的制定質(zhì)量,切實(shí)反映用戶的課題要求。因此我們需要從核心概念、隱含概念、同義詞、規(guī)范用語(yǔ)及不必要概念等角度出發(fā),探究概念選取的手段及方向。首先是選取核心概念。在計(jì)算機(jī)檢索的過(guò)程中,我們需要充分分析課題背景、課題內(nèi)容及課題要素,選取能夠全面而充分反映課題訴求的核心概念。而對(duì)概念較為明確的課題,譬如“故障限流器及高溫超導(dǎo)”,我們能夠提取出故障限流器與高溫超導(dǎo)兩個(gè)概念。而針對(duì)概念不夠明確的課題,則需要從隱含概念的角度對(duì)其進(jìn)行分析和梳理。其次是隱含概念的挖掘。隱含概念主要指用戶課題中并沒(méi)有明確給出的,但卻與用戶課題緊密相關(guān)的概念,具體包括上下位概念與相關(guān)概念等。譬如“并購(gòu)”的隱含概念包括拍賣、剝離等。而針對(duì)處于非專業(yè)和專業(yè)間的課題題目,則需要深入挖掘課題的隱含概念,探究出較為科學(xué)的檢索式。譬如“保護(hù)石質(zhì)文物”,在該題目下,我們需要將保護(hù)、石質(zhì)及文物作為特定的檢索式。再次是同義詞,在計(jì)算機(jī)檢索的過(guò)程中,固定的漢語(yǔ)詞匯所對(duì)應(yīng)的英文通常有多個(gè)。如“保護(hù)”的英文詞匯有“protection”“preservation”“conservation”等,所以需要檢索者對(duì)其進(jìn)行充分的考慮和明確。最后是規(guī)范用語(yǔ),在檢索的過(guò)程中,需要采用較為通用的概念、行業(yè)術(shù)語(yǔ)作為檢索詞,不能將俗語(yǔ)、俚語(yǔ)、方言等不規(guī)范詞匯作為檢索詞。
3 數(shù)據(jù)庫(kù)選取
在計(jì)算機(jī)信息技術(shù)快速發(fā)展的過(guò)程中,數(shù)據(jù)庫(kù)的規(guī)模與數(shù)量較為豐富,能夠?yàn)橛脩籼峁└鼜V闊、更多元的選擇。因此在計(jì)算機(jī)檢索的過(guò)程中,我們根據(jù)數(shù)據(jù)庫(kù)的實(shí)際情況與課題的基本內(nèi)容進(jìn)行選擇。即從主題范疇、年度范圍、數(shù)據(jù)庫(kù)類型等角度選擇文獻(xiàn)數(shù)據(jù)庫(kù)。首先是主題范疇。選擇科學(xué)合理的主題范疇是計(jì)算機(jī)檢索策略制定的基本原則,能夠幫助用戶更快、更好地獲取理想的檢索結(jié)果。通常來(lái)講,檢索者需要從數(shù)據(jù)庫(kù)的名稱上對(duì)其專業(yè)覆蓋面進(jìn)行判斷與分析。其次是數(shù)據(jù)庫(kù)的年度范圍與類型。通常文獻(xiàn)的類型多樣,不同的信息數(shù)據(jù)庫(kù)所包括的資源類型、文獻(xiàn)類型也存在明顯的差異。譬如要檢索專利,則需要選取“專利數(shù)據(jù)庫(kù)”,而要檢索報(bào)告,則應(yīng)以“報(bào)告庫(kù)”為主。因此在數(shù)據(jù)庫(kù)選取與選擇的過(guò)程中,我們可以通過(guò)查看數(shù)據(jù)庫(kù)簡(jiǎn)介或介紹實(shí)現(xiàn)這一點(diǎn)。而在年度范疇的層面上,不同數(shù)據(jù)庫(kù)的檢索年度及時(shí)間范疇也存在明顯的差異。譬如Dialog數(shù)據(jù)庫(kù)在時(shí)間范疇上主要有“399”“314”“313”“312”“311”“310”“309”“308”等8個(gè)文檔,每個(gè)文檔所覆蓋的時(shí)間范疇有所不同,并呈遞增態(tài)勢(shì)。譬如“311”的時(shí)間范疇為“1982—1987”,而“314”的時(shí)間范疇為(1997—present)。在計(jì)算機(jī)檢索的過(guò)程中,我們需要根據(jù)相應(yīng)的檢索要求,確定相應(yīng)的文檔類型。
4 計(jì)算機(jī)檢索策略的調(diào)整與制定
4.1 明確計(jì)算機(jī)檢索的基本構(gòu)成
計(jì)算機(jī)檢索的邏輯主線包括接受課題、數(shù)據(jù)庫(kù)選擇、組檔方式、檢索字段、基本索引、位置算符、邏輯算符、截詞算符、匹配、數(shù)據(jù)庫(kù)、整體檢索結(jié)果、評(píng)價(jià)用戶滿意度。與此同時(shí),檢索人員還需要在數(shù)據(jù)庫(kù)選擇的層面上,開(kāi)展概念分析、檢索詞抽取、檢索策略確定及編制檢索式等工作。并將檢索式與匹配環(huán)節(jié)相聯(lián)系,匯集到整理結(jié)果中,幫助用戶更好地選擇和應(yīng)用檢索結(jié)果,提高檢索效率。因此計(jì)算機(jī)檢索擁有兩條并列的發(fā)展路線,其中編制檢索式與位置算符、邏輯算符、截詞算符共同匯集到匹配環(huán)節(jié)中,并對(duì)檢索結(jié)果進(jìn)行影響。而匹配過(guò)程是將核心概念與隱含概念用位置算符與邏輯算符鏈接或組配起來(lái),并與檢索式相互匹配、相互作用的過(guò)程,可以更好地提高計(jì)算機(jī)的檢索質(zhì)量和效率。然而在用戶滿意度評(píng)價(jià)的過(guò)程中,我們還需要根據(jù)用戶的滿意度對(duì)檢索策略進(jìn)行調(diào)整,即如果用戶對(duì)檢索結(jié)果不夠滿意,則需要補(bǔ)充或制定全新的檢索策略,優(yōu)化檢索式,并將其“作用”在概念分析與檢索式定制的過(guò)程中,使其在重新匹配時(shí),獲得用戶理想的檢索結(jié)果。
4.2 檢索結(jié)果少的成因及調(diào)整
檢索結(jié)果過(guò)少將導(dǎo)致用戶難以獲取較為滿意的“文獻(xiàn)資源”,嚴(yán)重影響到課題開(kāi)展的質(zhì)量和效率。而在具體的調(diào)整與優(yōu)化的過(guò)程中,檢索人員需要從問(wèn)題的成因出發(fā),確定相應(yīng)的調(diào)整方法或策略。首先是檢索詞不恰當(dāng),將導(dǎo)致檢索結(jié)果出現(xiàn)過(guò)少、不夠全面的現(xiàn)象。針對(duì)該問(wèn)題,檢索人員應(yīng)對(duì)檢索詞進(jìn)行仔細(xì)調(diào)整與核對(duì),并明確檢索詞的核心概念、隱含概念是否規(guī)范合理。譬如“部分概念”在某個(gè)國(guó)家的叫法比較科學(xué)合理,然而并非國(guó)際通用,對(duì)此檢索者需要對(duì)其進(jìn)行調(diào)整或修改。如衛(wèi)星云圖在國(guó)際上的寫法為“WEfax”。但在日本,衛(wèi)星運(yùn)通的通用寫法卻是“LR fax”。因此在文獻(xiàn)檢索的過(guò)程中,會(huì)導(dǎo)致檢索者所檢索出的文獻(xiàn)資源相對(duì)有限。其次,不能充分地挖掘隱含概念。譬如在檢索“多媒體現(xiàn)場(chǎng)背景下電話線總線技術(shù)的研究”中,檢索者通常以“多媒體”“現(xiàn)場(chǎng)總線”及“電話線”等檢索詞來(lái)檢索,其檢索的資源及文獻(xiàn)也相對(duì)有限,與用戶所了解的具體情況存在明顯的出入,因此需要通過(guò)深入挖掘隱含概念的方式,來(lái)獲取更多的檢索結(jié)果,譬如將信號(hào)采集、遠(yuǎn)程監(jiān)控看作現(xiàn)場(chǎng)總線的隱含概念,可以提高檢索效度。最后是詞匯關(guān)系的限制較為嚴(yán)格,譬如應(yīng)用基于“算符”的檢索詞,將導(dǎo)致計(jì)算機(jī)檢索的結(jié)果較為有限,因此,檢索人員可以放寬對(duì)位置算符的限制,或者采用邏輯算符的方式,提高計(jì)算機(jī)檢索質(zhì)量。此外是概念的數(shù)量較多,對(duì)此,減少相應(yīng)的概念數(shù)量,可以拓寬檢索維度。
4.3 檢索結(jié)果多的成因及調(diào)整
檢索者也可以結(jié)合用戶的實(shí)際需求、課題背景增加關(guān)聯(lián)度較高的概念。譬如在檢索“特定物質(zhì)”時(shí),可以利用“物質(zhì)的用途、性能、材質(zhì)”對(duì)其進(jìn)行界定。首先是限制或者通過(guò)邏輯算符的方式,排除關(guān)聯(lián)度較低的概念,提高計(jì)算機(jī)檢索的針對(duì)性與有效性。其次是限制較松。針對(duì)該類問(wèn)題,檢索人員需要將邏輯算符轉(zhuǎn)變?yōu)槲恢盟惴?,通過(guò)提高限制的方式,增強(qiáng)檢索結(jié)果的準(zhǔn)確度與精準(zhǔn)性,當(dāng)然也可利用數(shù)據(jù)庫(kù)的年度范疇對(duì)其進(jìn)行限制,使檢索結(jié)果更新、更全、更具時(shí)代特性。最后是截詞在應(yīng)用過(guò)程中,存在不準(zhǔn)確、不恰當(dāng)?shù)膯?wèn)題。譬如在檢索“螞蟻”的過(guò)程中,截詞的基本形式選擇了“anti”,將導(dǎo)致大量毫不相關(guān)的概念或詞匯被包含進(jìn)去,進(jìn)而影響到檢索結(jié)果的精準(zhǔn)性與準(zhǔn)確性。所以在截詞選擇的過(guò)程中,必須充分考慮截詞的科學(xué)性與合理性。此外,在檢索結(jié)果過(guò)多的情況下,檢索人還需要根據(jù)用戶的實(shí)際情況及課題需求,對(duì)所增加的“新概念”“新限制”進(jìn)行斟酌與考慮,確定新檢索式與用戶需求的切合度,如果所增加的“限制”或“概念”與用戶需求相沖突,應(yīng)對(duì)其進(jìn)行及時(shí)的調(diào)整和改進(jìn)。
5 結(jié)語(yǔ)
在現(xiàn)代科技快速發(fā)展的背景下,文獻(xiàn)數(shù)據(jù)庫(kù)的規(guī)模增長(zhǎng)與數(shù)量提升,使數(shù)據(jù)庫(kù)的檢索方法更加完善、更加豐富,并成為文獻(xiàn)數(shù)據(jù)庫(kù)發(fā)展的有機(jī)組成部分。然而在檢索策略制定與調(diào)節(jié)的過(guò)程中,我們需要明確“用戶交流”“概念提取”“數(shù)據(jù)庫(kù)選擇”在檢索策略調(diào)節(jié)與制定中的價(jià)值和地位,通過(guò)了解用戶需求的方式,提高檢索策略的精準(zhǔn)性與針對(duì)性,切實(shí)滿足用戶的基本訴求,推動(dòng)計(jì)算機(jī)檢索事業(yè)的健康發(fā)展。
[參考文獻(xiàn)]
[1]燕慧泉.手工檢索與計(jì)算機(jī)信息檢索在檢索策略之?dāng)M定和優(yōu)化方面的分析比較[J].現(xiàn)代情報(bào),2003(12):74-76.
[2]叢立.計(jì)算機(jī)檢索策略設(shè)計(jì)及技巧運(yùn)用[J].圖書(shū)館學(xué)研究,2001(3):52-55.
[3]劉靜.計(jì)算機(jī)檢索策略與技巧芻議[J].四川圖書(shū)館學(xué)報(bào),2001(3):72-75.
[4]紀(jì)清照.淺談電力科技查新中計(jì)算機(jī)檢索的質(zhì)量控制[J].江西電力職業(yè)技術(shù)學(xué)院學(xué)報(bào),2004(2):59-60.
(編輯 王雪芬)