作者簡介:胡守偉(1991—),男,漢族,安徽省滁州市人,安徽大學管理學院情報學專業(yè)。
摘 要:本文主要簡單介紹影響網絡信息檢索的因素,以及面對現(xiàn)在互聯(lián)網的錯綜復雜的環(huán)境下,對實現(xiàn)高效率的信息檢索提出幾點建議。
關鍵詞:網絡信息檢索;信息檢索;網絡信息
互聯(lián)網上的信息量是非常巨大的,隨著互聯(lián)網的技術和信息技術的不斷發(fā)展,人類接觸到的信息也是不斷變多,但是,由于在互聯(lián)網存在的信息資源的特點,使得人們尋找自己想要的信息變的越來越難,人們更加迫切需要更好的檢索工具來幫助我們獲取自己想要的信息。信息社會離不開信息的作用,信息已經是人類生活不可或缺的一部分。本文將介紹影響檢索信息的幾個因素,在此基礎上并提出幾點建議。
1.網絡信息檢索的現(xiàn)狀
網絡信息檢索最早是由國外學者Alan Emtage在1990年發(fā)明的Archie開始的,不過由于當時網絡技術的應用處于初級階段,應用還是比較狹窄,只能簡單的應用于FTP文件的檢索。但是后來隨著萬維網的出現(xiàn)以及信息技術的不斷飛躍發(fā)展,網絡信息檢索開始了基于網頁的檢索,并且迅速發(fā)展。伴隨而來的問題就是網絡信息檢索的效率問題。隨著信息資源數(shù)字化的發(fā)展,人們越來越依靠檢索來獲取自己想要的信息。但是,從目前的情況看,每天在互聯(lián)網上產生的信息量是相當驚人的。用戶想要短時間獲取自己想要的信息已經變得更加困難。
2.影響網絡信息檢索的因素
2.1 源于ICP的影響因素
ICP(即是Internet Content Provider 的簡稱),它是指網絡信息提供者或者稱網站經營者[1]。某些ICP為了獲得額外的利潤或是某種目的,當用戶點擊某些優(yōu)質的網頁的時候,在打開的同時會出現(xiàn)一些劣質的網站,這些劣質網站不夠規(guī)范而且存在的信息的準確性也是有待商榷,另外這些ICP對采集的信息進行頁面特征提取、主題分析并進行相應歸類,也即是以詞頻和詞出現(xiàn)位置的統(tǒng)計為依據(jù);這樣就為某些ICP 帶來可乘之機,他們故意將一些無關的主題詞放置在重要的標記內,或讓某些關鍵詞重復出現(xiàn)在重要的段落處,以提高其頁面被檢索的機率,然而這卻大大地影響用戶的檢準率[1]。
2.2網絡信息資源質量的因素
由于互聯(lián)網本身的特點,即開放性,自由性和公開性導致了在互聯(lián)網上信息資源紛繁復雜,包括虛假的信息、淫穢的信息、暴力信息等等。同時,在信息的發(fā)布端,如何控制信息源產生的信息準確性。信息資源是不是能夠涵蓋某一方面,這些因素都會影響用戶進行網絡信息檢索。
2.3檢索工具和方式的因素
傳統(tǒng)的信息資源標引方式已經不能適應當前復雜的網絡信息資源的類型,尤其在網絡新詞或是同義詞和近義詞,標引方式就很難適應這些新的變化,這也就導致了檢索工具不能檢索出未被標引出來的信息資源,影響了檢索工具的檢全率。檢索工具的檢索方式也是多種多樣,按照布爾邏輯檢索、作者姓名,關鍵詞等方式進行檢索,但是檢索的要求就會不一樣,使用的語言不具有統(tǒng)一性。這也是制約網絡信息檢索的重要因素。大多數(shù)搜索引擎的檢索方式比較單一,一般只提供分類檢索和關鍵詞檢索,這樣,一方面,檢索時不能從信息資源的多個方面對檢索提問進行限制,只能就某一關鍵詞或概念進行籠統(tǒng)的檢索[2]。
相比較早期的檢索內容來看,隨著人們檢索的需求發(fā)生改變,現(xiàn)在的檢索內容也發(fā)生了變化,從最開始的檢索文本信息到如今要檢索圖片,視頻,音頻等多種形式的內容,而從信息技術的發(fā)展看,國內目前還沒有專業(yè)的檢索工具,影響檢索的全面性。
3.用戶本身的影響
(1)自身語言的障礙。由于用戶本身學歷或是地域的限制,導致了用戶只能掌握自己的母語。想要利用國外的檢索工具進行外文檢索,也是很難完成的。目前最新的科技成果都是用英文表現(xiàn)出來的。由于語言的限制,影響了用戶的檢索。
(2)檢索語言的障礙。隨著現(xiàn)代學科的分類越來越細,新興學科、邊緣學科、交叉學科不斷涌現(xiàn),每門學科應用的術語、符號也隨著專深、復雜,每個學科所使用的檢索語言要求也是更加嚴格[2]。檢索語言和檢索方法和技巧的不能掌握,導致了不能全面利用各種檢索工具和系統(tǒng)。
(3)檢索能力的障礙。由于自身的理解能力、信息把握能力,語言組織能力的缺乏,在輸入檢索詞的時候可能出現(xiàn)表達不清楚,檢索出來不是用戶想要的信息。另外,用戶自身的計算機水平有限制,缺乏必要的計算機基礎知識,隨著現(xiàn)在信息技術更新?lián)Q代過于快速,檢索工具、應用軟件還不能掌握,嚴重影響了用戶利用檢索工具獲取信息資源。
4.提高網絡信息檢索效率的建議
4.1 加強監(jiān)管,提高信息資源的質量
ICP是網絡信息的主要來源,國家或是政府應該制定相應的法律法規(guī),來完善行業(yè)準則,保證信息源頭不會出現(xiàn)虛假、暴力、淫穢等信息資源。加強對各類網站的監(jiān)控管理,對質量差的網站應該加以限制,提高該網站的規(guī)范化,標準化。與此同時,網民也可以發(fā)揮自己的力量,堅決抵制和舉報虛假的信息。最后,積極組織開發(fā)、研制相關軟件及應用網絡新技術,對網絡信息進行技術上的篩選、過濾,建立安全屏障,最大限度防止不良信息的侵入[3]。
4.2對網絡檢索工具的改進
(1)改變傳統(tǒng)的標引隨意性。改變以往只是依靠機器進行標引,把人工標引和機器標引相結合。規(guī)范標引的索引詞,制定統(tǒng)一的標準,加強對檢索詞的語義理解,提高檢索的智能化。對出現(xiàn)在網絡上的信息資源不只是簡單的收集、利用。而是需要將這些信息資源進行分析歸類,深度加工,建立一種具有多種語言標引識別,提高檢索效率。
(2)完善用戶信息搜索界面,方便使用。完善檢索界面,能夠使用戶獲得更好地使用體驗,一個友好的用戶界面要能支持用戶進行多語言、多種邏輯方式和多種角度提問檢索,盡可能做到方便用戶使用[1]。改變檢索方式,使其更加自然、易懂,能適用于多種檢索平臺。
(3)改進信息資源檢索的技術,形成更加專業(yè)的檢索工具。面對多種信息資源的檢索,不能單獨只對文本信息的檢索,對于圖片、音頻、視頻等信息,需要采用更加合理的檢索工具來提高檢索效率,提高檢索的專業(yè)化。
4.3加強用戶檢索能力的培訓[4]
對于用戶本身不具備的能力,需要通過不斷地學習來完善自己,才能掌握更多的語言和計算機的基礎知識。對于語言方面,用戶需要加強對語言的理解,能夠清楚地表達自己的信息需求,檢索的效率才能很好地體現(xiàn)出來。
檢索途徑,用戶需要了解更多檢索的方法,并不僅僅局限于只用關鍵詞進行檢索,用戶為了獲取更多,更準確的信息資源,力求掌握多種檢索途徑,進行高級檢索。同時,用戶可以進行多個檢索平臺的檢索也是提高檢索效率的有效途徑之一,用戶利用多種語言在多個數(shù)據(jù)庫進行檢索,提高用戶獲取信息資源的技能。
總之,面對信息的海洋,提高檢索的效率和檢全率是我們追求的目標。影響網絡信息檢索的因素有許多方面,改進的途徑也是非常多,但是,因特網是一個巨大的展示信息的平臺,目前還是有許多地方存在一個不完善的地方,需要國家、政府以及個人不斷的努力,才能提高網絡信息檢索的效率。
(作者單位:安徽大學管理學院)
參考文獻:
[1] 王淑群.影響網絡信息檢索的因素與對策[J].圖書館論壇;2006,26(2).197-199
[2] 王穎春.影響網絡信息檢索效率的因素與對策[J].現(xiàn)代情報;2007(9).5-7
[3] 趙明臻。網絡信息檢索障礙及排除策略探論[J].圖書與情報;2005(1),42-45
[4] 趙惠芳.網絡信息利用障礙分析[J].圖書館學刊,2003,(2);