孟津
摘 要:為了在擁有海量信息的因特網(wǎng)中充分挖掘信息資源,本文介紹了目前比較常用的信息檢索手段和方法,闡述了有關(guān)隱蔽網(wǎng)絡(luò)數(shù)據(jù)資源檢索策略。對(duì)一些不能被常規(guī)檢索方法獲得的信息進(jìn)行分析,利用隱蔽網(wǎng)絡(luò)搜索引擎和專門的隱蔽網(wǎng)絡(luò)目錄等特殊的檢索手段對(duì)蘊(yùn)藏在網(wǎng)絡(luò)中的信息資源進(jìn)行挖掘,從而達(dá)到充分利用網(wǎng)絡(luò)資源的目的。
關(guān)鍵詞:搜索引擎;隱蔽網(wǎng)絡(luò)目錄;數(shù)據(jù)庫(kù)
作為知識(shí)經(jīng)濟(jì)時(shí)代不可缺少的工具,因特網(wǎng)將全世界的信息資源帶到我們面前,使得人們獲取信息資源的渠道得到極大拓展。如何對(duì)大量的網(wǎng)絡(luò)信息進(jìn)行挖掘、分析、處理,并從中提煉出有價(jià)值的內(nèi)容,成為擺在人們面前亟待解決的問(wèn)題。目前,搜索引擎被公認(rèn)為是最好的,也是我們最常用的信息檢索方法。不過(guò),單純利用常規(guī)搜索引擎進(jìn)行信息檢索,很多信息無(wú)法被命中,資源利用率相對(duì)較低。繁雜冗余的內(nèi)容充斥著網(wǎng)絡(luò),難以甄選;而真正有價(jià)值的信息資源卻蘊(yùn)藏在網(wǎng)絡(luò)深處,與我們擦肩而過(guò),無(wú)人問(wèn)津。
1 常見(jiàn)的網(wǎng)絡(luò)信息檢索手段和途徑
1.1 利用搜索引擎
目前互聯(lián)網(wǎng)上主流的搜索引擎有:百度、360搜索、Google等等,人們幾乎每天都要用到,利用這些搜索引擎,直接輸入檢索內(nèi)容,就可得到與之相關(guān)的網(wǎng)址信息,使用起來(lái)簡(jiǎn)單便捷,上手快,不需要任何檢索知識(shí)也可以輕松找到一些訴求信息。另外,對(duì)于學(xué)術(shù)性較強(qiáng)的檢索,可以利用Google Scholar這樣的綜合性學(xué)術(shù)搜索引擎,適合專業(yè)的研究人員和學(xué)者使用,可以從中挖掘出更權(quán)威、價(jià)值含量更高的信息,但要求使用者具備一定的網(wǎng)絡(luò)知識(shí)和信息檢索水平。
1.2 資源分類主體目錄
一些網(wǎng)站通過(guò)對(duì)網(wǎng)絡(luò)信息進(jìn)行人工評(píng)價(jià)、組織整理,形成網(wǎng)絡(luò)主題指南,實(shí)現(xiàn)了資源分類的目的。像雅虎、360等門戶網(wǎng)站導(dǎo)航以及Open Directory開(kāi)放式目錄等,分類一目了然,組織有序。用戶可以根據(jù)信息需求的類目找到相應(yīng)入口,縮短查找時(shí)間,提高檢索效率。
1.3 專業(yè)性和綜合性數(shù)據(jù)庫(kù)
有的數(shù)據(jù)庫(kù)收錄學(xué)科比較窄,具有很強(qiáng)的專業(yè)性,雖然僅限于某學(xué)科專業(yè)的信息,但收錄該領(lǐng)域的信息比較全面,如美國(guó)《化學(xué)文摘》、Worldcat聯(lián)合目錄等。像工程索引(EI)收錄的學(xué)科就比較廣泛,涉及信息的種類比較多,屬于綜合性文摘數(shù)據(jù)庫(kù)。
2 查詢隱蔽網(wǎng)絡(luò)數(shù)據(jù)庫(kù)的特殊技術(shù)手段
在浩瀚的網(wǎng)絡(luò)資源中,有這樣一類網(wǎng)址,它們蘊(yùn)含著豐富的信息資源,內(nèi)容也十分有價(jià)值,但實(shí)際利用率卻很低。因?yàn)樗鼈儾](méi)有被其他的網(wǎng)頁(yè)鏈接,這些被稱為“未被鏈接”的網(wǎng)址是無(wú)法通過(guò)那些常用的方法檢索命中的,需要借助一些專門的網(wǎng)站,采用特殊的處理方式來(lái)進(jìn)行查找。據(jù)不完全統(tǒng)計(jì),通過(guò)搜索引擎和網(wǎng)絡(luò)目錄搜索到的信息大約只占網(wǎng)絡(luò)信息資源的三成左右,其余的資源對(duì)于這些搜索工具是不可見(jiàn)的,成為隱蔽網(wǎng)絡(luò)。隱蔽網(wǎng)絡(luò)數(shù)據(jù)庫(kù)的查找手段目前主要是利用搜索引擎挖掘和隱蔽網(wǎng)絡(luò)專門目錄。
2.1 利用搜索引擎查詢隱蔽網(wǎng)絡(luò)數(shù)據(jù)庫(kù)
查詢隱蔽網(wǎng)絡(luò)數(shù)據(jù)庫(kù)主要手段是利用網(wǎng)絡(luò)搜索引擎,在檢索主題詞后面加入類似“searchable database”或“interactive tool”等名稱,便可以檢索到符合以上查詢形式的數(shù)據(jù)庫(kù),然后利用數(shù)據(jù)庫(kù)本身的檢索系統(tǒng)查詢具體的內(nèi)容。數(shù)據(jù)庫(kù)經(jīng)常使用的名稱有:database、search engine、searchable database、online collection、catalog、index等。此外,在檢索框中輸入“search form”能更好地限制檢索結(jié)果,如“l(fā)ogistics”+“database”+“search form”可以有效地過(guò)濾掉那些僅僅含有“database”這個(gè)詞,但不是數(shù)據(jù)庫(kù)形式的信息資源,而找到真正與物流相關(guān)的數(shù)據(jù)庫(kù)。
此外,還可以利用專門的學(xué)術(shù)搜索引擎,這些系統(tǒng)都關(guān)注隱蔽網(wǎng)絡(luò)學(xué)術(shù)信息,通過(guò)一般檢索手段很難系統(tǒng)全面地搜索到其中的內(nèi)容。比如:Base是世界級(jí)海量?jī)?nèi)容的搜索引擎之一,專注于學(xué)術(shù)開(kāi)放獲取網(wǎng)絡(luò)資源。Vascoda是一個(gè)交叉學(xué)科門戶網(wǎng)站,它注重特定主題的聚合,集成了圖書(shū)館的收藏、文獻(xiàn)數(shù)據(jù)庫(kù)和附加的學(xué)術(shù)內(nèi)容。
2.2 利用隱蔽網(wǎng)絡(luò)專門目錄
隱蔽網(wǎng)絡(luò)專門目錄是經(jīng)過(guò)人工挑選,學(xué)術(shù)資源質(zhì)量較高,得到學(xué)術(shù)研究團(tuán)體廣泛認(rèn)可的搜索工具。例如隱蔽資源平臺(tái)Complete Planet就是比較大的網(wǎng)絡(luò)目錄之一,它收錄了數(shù)萬(wàn)個(gè)隱蔽數(shù)據(jù)庫(kù),列舉了近百個(gè)主題,在各個(gè)主題下又包括了更細(xì)化的分支領(lǐng)域。此外,還有各個(gè)行業(yè)領(lǐng)域的的專門性目錄,這些目錄全面地、系統(tǒng)地整理了相關(guān)領(lǐng)域的網(wǎng)絡(luò)資源。
3 網(wǎng)絡(luò)信息資源檢索的發(fā)展趨勢(shì)
3.1 智能化。
智能化是網(wǎng)絡(luò)信息檢索未來(lái)主要的發(fā)展方向。智能檢索是基于自然語(yǔ)言的檢索形式,機(jī)器根據(jù)用戶所提供的以自然語(yǔ)言表述的檢索要求進(jìn)行分析,而后形成檢索策略進(jìn)行搜索。近幾年來(lái),智能信息檢索作為人工智能的一個(gè)獨(dú)立研究分支得到了迅速發(fā)展。在Internet技術(shù)迅速普及的今天,面向因特網(wǎng)的信息獲取與精化技術(shù)已成為當(dāng)代計(jì)算機(jī)科學(xué)與技術(shù)領(lǐng)域中迫切需要研究的課題,將人工智能技術(shù)應(yīng)用于這一領(lǐng)域是AI走向應(yīng)用的一種新的契機(jī)與突破口。
3.2 多樣化。
多樣化首先表現(xiàn)在可以檢索的信息形態(tài)多樣化,如文本、聲音、圖像、動(dòng)畫等。目前網(wǎng)絡(luò)信息檢索的主體仍是文本信息,基于內(nèi)容的圖像檢索技術(shù)和語(yǔ)音識(shí)別技術(shù)的發(fā)展,將使多媒體信息的檢索變得逐漸普遍。圖像信息檢索的準(zhǔn)確率、檢全率將進(jìn)一步提高。多樣化的另一個(gè)表現(xiàn)就是檢索工具向多國(guó)化、多語(yǔ)種化方向發(fā)展。網(wǎng)絡(luò)的迅速普及,使得整個(gè)世界變成了地球村,世界各地上網(wǎng)人數(shù)的不斷增多,使得英語(yǔ)已無(wú)法滿足所有用戶的需要,語(yǔ)言障礙越來(lái)越明顯。以后主流數(shù)據(jù)庫(kù)和檢索平臺(tái)必將提供更多語(yǔ)種的版本,或者提供更加智能化的在線翻譯服務(wù)。
3.3 個(gè)性化。
個(gè)性化主要指檢索平臺(tái)內(nèi)容的特色化和服務(wù)的定制化。網(wǎng)絡(luò)資源的指數(shù)級(jí)膨脹,使得用戶在獲得自己需要的信息資源時(shí)要花費(fèi)大量的時(shí)間和精力,每個(gè)人的不同信息需求將凸現(xiàn)于標(biāo)準(zhǔn)化、單一的“大眾需求”之上。未來(lái)檢索平臺(tái)為了吸引用戶眼球,必將著重發(fā)展自己的特色主打產(chǎn)品,做到資源內(nèi)容 “與眾不同”。同時(shí),利用大數(shù)據(jù)分析用戶的檢索內(nèi)容和檢索習(xí)慣,根據(jù)其興趣、愛(ài)好、關(guān)注方向等因素,主動(dòng)為其推送合適的資源內(nèi)容,為其量身打造特色服務(wù),更好地滿足用戶的信息需求。
4 結(jié)語(yǔ)
網(wǎng)絡(luò)信息資源是無(wú)比龐大的,我們只有根據(jù)具體的情況,去確定最合適的檢索策略,才能事半功倍地獲取有價(jià)值的信息。常用的搜索引擎可以讓我們快捷地查詢到工作、學(xué)習(xí)相關(guān)的信息,已經(jīng)成為我們網(wǎng)絡(luò)生活中不可缺少的一部分。而那些隱蔽信息更蘊(yùn)含著檢索人員難以置信的財(cái)富。遨游“看不見(jiàn)的網(wǎng)站”可獲得那些不容易查找的寶貴資源,那種成就就好比在早期地圖上發(fā)現(xiàn)未被標(biāo)識(shí)的新大陸一樣,充滿了驚喜和滿足。隨著互聯(lián)網(wǎng)技術(shù)不斷發(fā)展,網(wǎng)絡(luò)資源檢索的方法和途徑也將與時(shí)俱進(jìn),推陳出新,更加智能、先進(jìn)的檢索手段必將使我們的信息需求得到更好的滿足,幫助我們更好地認(rèn)識(shí)這個(gè)信息世界。
參考文獻(xiàn):
[1]熊瑩.關(guān)于科技文獻(xiàn)信息檢索方法的研究[J].科技傳播,2014,6(21):24-25.
[2]畢歡.網(wǎng)絡(luò)信息檢索及其發(fā)展趨勢(shì)研究[J].電腦知識(shí)與技術(shù),2018(10):8-9.
[3]劉興達(dá).計(jì)算機(jī)信息檢索技術(shù)的發(fā)展及問(wèn)題研究[J].科技與創(chuàng)新,2018(02):121-122.
[4]李丹立,周飛.淺析檢索數(shù)據(jù)庫(kù)的選擇[J].現(xiàn)代經(jīng)濟(jì)信息,2019(14):432.
[5]賴宏慈.圖書(shū)館信息檢索途徑分析[J].科技資訊,2010(19):254.
[6]周思繁.淺談網(wǎng)絡(luò)信息檢索方法及技巧[J].科技文獻(xiàn)信息管理,2015,29(02):17-19.