• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    網(wǎng)絡(luò)信息檢索及其局限性

    2012-06-08 09:12:14王娜
    關(guān)鍵詞:標(biāo)引信息檢索搜索引擎

    王娜

    摘要:目前,隨著信息技術(shù)的迅猛發(fā)展,信息已發(fā)展成整個社會的主要資源,要衡量一個國家或地區(qū)的現(xiàn)代化程度,主要看其信息的占有度和信息處理水平的先進(jìn)程度,豐富的網(wǎng)絡(luò)信息在很大程度上改善了人們的工作及生活方式。Internet是當(dāng)前覆蓋面最廣、規(guī)模最大、信息資源最豐富、發(fā)展最迅速的信息網(wǎng)絡(luò),對Internet網(wǎng)絡(luò)信息檢索的研究,有著很強(qiáng)的現(xiàn)實(shí)性和實(shí)用性。

    關(guān)鍵詞:網(wǎng)絡(luò)信息檢索搜索引擎局限性

    1 網(wǎng)絡(luò)信息檢索簡介

    1.1 信息檢索的概念 信息檢索指的是將信息按照一定的方式組織、存儲起來,根據(jù)信息用戶的需求查找所需信息的過程和技術(shù)。信息檢索主要通過以下幾種途徑來獲取信息:①傳統(tǒng)的信息檢索,即利用人工查詢的方式,查詢圖書館等文獻(xiàn)豐富的機(jī)構(gòu),并獲取文獻(xiàn);②聯(lián)機(jī)信息檢索,它和傳統(tǒng)的信息檢索比起來具有廣泛性、實(shí)時性、完整性和共享性等特點(diǎn);③網(wǎng)絡(luò)信息檢索,即信息用戶利用網(wǎng)絡(luò)信息檢索工具檢索Internet信息空間中的各類網(wǎng)絡(luò)信息資源。

    1.2 網(wǎng)絡(luò)信息檢索的原理 概率模型、布爾邏輯模型、模糊邏輯模型是應(yīng)用比較廣泛的幾種網(wǎng)絡(luò)信息檢索模型主要有:①概率模型。該模型是在貝葉斯概率原理的基礎(chǔ)上提出來的,對詞條和文檔間的內(nèi)在聯(lián)系進(jìn)行研究之后,通過詞條和詞條之間和以及詞條和文檔之間的概率相依性來檢索信息。②布爾邏輯模型。根據(jù)檢索項在文檔中的布爾邏輯關(guān)系提交查詢,搜索工具按照提前組建的倒排文檔結(jié)構(gòu)來確定查詢結(jié)果。③模糊邏輯模型。處理查詢結(jié)果的過程中引入模糊邏輯比較,同時根據(jù)先后次序?qū)⒉樵兘Y(jié)果排列出來。

    2 搜索引擎

    搜索引擎,又稱檢索引擎,指的是在Internet上運(yùn)行,通過對信息資源進(jìn)行檢索來提供所需數(shù)據(jù)的服務(wù)系統(tǒng)。當(dāng)前,大部分人們都利用搜索引擎來檢索網(wǎng)絡(luò)信息。和其他檢索工具比起來,它這種檢索工具的檢準(zhǔn)率、檢全率遠(yuǎn)遠(yuǎn)高于其他檢索工具,具有極強(qiáng)的利用價值,且就目前情況而言,它的市場強(qiáng)勁非常廣闊。

    2.1 搜索引擎的功能 ①模糊檢索。對網(wǎng)絡(luò)資源進(jìn)行檢索時,系統(tǒng)檢索用戶提供的關(guān)鍵詞以及與冠軍按此相似的詞語,同時返回包含關(guān)鍵詞,或這些相似詞的檢索結(jié)果。②布爾邏輯檢索。用戶可通過NOT、AND、OR進(jìn)行關(guān)鍵詞的搭配檢索。③截詞檢索。截取詞條的某一部分來進(jìn)行檢索。在搜索引擎中,用戶提供包含“?”、“*”通配符的檢索項進(jìn)行檢索。④限定詞檢索。它用來規(guī)定檢索項中必須出現(xiàn)或是必須不出現(xiàn)某些關(guān)鍵詞。

    2.2 搜索引擎的工作原理 搜索引擎的檢索機(jī)制一般包括數(shù)據(jù)組織機(jī)制、數(shù)據(jù)采集和標(biāo)引機(jī)制和用戶檢索機(jī)制。

    ①數(shù)據(jù)組織據(jù)組織機(jī)制是對www頁面信息進(jìn)行整合,使其更加簡單、規(guī)范,同時構(gòu)建相應(yīng)的索引數(shù)據(jù)庫。②數(shù)據(jù)采集和標(biāo)引機(jī)制根據(jù)相關(guān)規(guī)律及一定的方法來搜索網(wǎng)絡(luò)上的www站點(diǎn),同時將搜索結(jié)果存入搜索引擎臨時的數(shù)據(jù)庫內(nèi)。③索引數(shù)據(jù)庫是信息檢索的先決條件,檢索結(jié)果是否符合要求在很大程度上去覺與索引數(shù)據(jù)的準(zhǔn)確性,數(shù)據(jù)庫質(zhì)量主要取決于搜索引擎的數(shù)據(jù)采集及標(biāo)引機(jī)制。④用戶檢索機(jī)制通過相應(yīng)的方式對引擎的索引數(shù)據(jù)庫進(jìn)行檢索,從中獲取有價值的網(wǎng)頁或站點(diǎn)。

    2.3 搜索引擎的分類 目前的中文搜索引擎主要有三種類型:目錄式搜索引擎、機(jī)器人搜索引擎和元搜索引擎。

    ①目錄式搜索引擎,是通過半人工、人工的辦法采集信息,組建數(shù)據(jù)庫,編輯對某一web站點(diǎn)進(jìn)行訪問以后由編輯人員在訪問以后描述這個站點(diǎn),同時按照站點(diǎn)的性質(zhì)、內(nèi)容對該站點(diǎn)歸類處理。②機(jī)器人搜索引擎是目前運(yùn)用較廣的搜索引擎。這個搜索引擎采用自動采集軟件Robot,對網(wǎng)頁信息進(jìn)行檢索,同時將其下載并儲存在本地文檔庫中,然后自動分析文檔內(nèi)容,建立索引。根據(jù)用戶的檢索需求,對索引進(jìn)行檢索,分析出相應(yīng)的文檔并反饋給用戶。③元搜索引擎主要通過調(diào)用其他搜索引擎的引擎來完成信息檢索。它在一個統(tǒng)一的用戶界面上,以用戶需求為目的,在多個搜索引擎中尋找合適的引擎來檢索信息資源。

    3 網(wǎng)絡(luò)信息檢索的局限

    用戶都是通過網(wǎng)絡(luò)信息檢索工具在網(wǎng)絡(luò)信息資源進(jìn)行查找自己需要的信息,因此,檢索工具的優(yōu)劣會對檢索效率產(chǎn)生很大的影響。近些年,網(wǎng)絡(luò)信息檢索工具的確有所發(fā)展,但仍然存在著這樣或那樣的局限。

    3.1 文本信息檢索的局限 ①搜索引擎的查全率低。網(wǎng)絡(luò)信息資源庫在持續(xù)擴(kuò)充,信息資源的增長的速度要比搜索引擎采集數(shù)據(jù)的速度快的多,這會大大降低搜索引擎的檢全率。②搜索引擎的查準(zhǔn)率低。一是當(dāng)前的搜索引擎中普遍存在反饋信息;二是信息重復(fù)反饋。同一信息源有時在檢索結(jié)果中產(chǎn)生不同的組成部分,不同的信息源也有相同內(nèi)容信息出現(xiàn)的情況。③網(wǎng)絡(luò)信息標(biāo)引準(zhǔn)確度不達(dá)標(biāo)。大部分檢索工具標(biāo)引的準(zhǔn)確度都無法達(dá)到設(shè)計要求,檢索工具往往在反饋垃圾信息的過程中也會將部分有價值的信息丟掉,某些情況下,垃圾信息會覆蓋所有有價值的信息。④查詢方式較少。當(dāng)前的很多搜索引擎,在查詢方式上都過于單一,而且都需要用戶提供關(guān)鍵詞來查詢或采用分類查詢的方法。這樣,只能就某一關(guān)鍵詞或概念進(jìn)行籠統(tǒng)檢索,因此使查詢結(jié)果相關(guān)性很差。⑤檢索對象的數(shù)據(jù)結(jié)構(gòu)單一。由于現(xiàn)在大多網(wǎng)站使用傳統(tǒng)的關(guān)系數(shù)據(jù)庫對信息進(jìn)行組織和存儲,因此其使用的搜索引擎也是基于關(guān)系數(shù)據(jù)庫的,這種數(shù)據(jù)庫非常擅長處理結(jié)構(gòu)化的數(shù)據(jù),但對非結(jié)構(gòu)化的數(shù)據(jù)的處理能力很弱。⑥交互性不夠。大部分搜索引擎和用戶之間無法建立其很好的交互性,在協(xié)作方面比較欠缺,對用戶信息很陌生,不對用戶查詢的信息進(jìn)行記錄,無法對用戶的反饋信息進(jìn)行處理,也就無法與用戶之間達(dá)成良好的交互來提高檢索效率。

    3.2 多媒體信息檢索的局限 雖然眼下已經(jīng)存在只針對聲音、視頻和圖像等媒體的檢索技術(shù),但仍未研究出能檢索多媒體信息的搜索引擎,具體體現(xiàn)在以下幾點(diǎn):①檢索效果不好。就目前情況而言,大部分多媒體搜索引擎的查準(zhǔn)率都無法滿足用戶的需求,用戶不得不從眾多圖像結(jié)果中自己篩選出所需的信息資源。這很費(fèi)時,而且有時根本檢不出想要的東西。究其原因,一是查詢方式少,二是在于對圖像的標(biāo)引深度不到位,所以,必須進(jìn)一步完善圖像檢索及相關(guān)的索引機(jī)制。②用戶查詢接口單一。科學(xué)的多媒體檢索系統(tǒng),人處于主動地位,用戶的查詢接口直觀易用,可提供足夠的交互能力,用戶能可以對檢索參數(shù)進(jìn)行適當(dāng)?shù)恼{(diào)整之后,將圖像的語義感知準(zhǔn)確的表達(dá)出來,并從中取得較好的結(jié)果。當(dāng)前,多媒體搜索引擎用戶查詢接口呈現(xiàn)單一的發(fā)展趨勢,很多引擎僅能通過關(guān)鍵詞或提問框進(jìn)行查詢。③信息的自動加工與人工標(biāo)引不夠。目前多媒體搜索引擎的研究剛剛起步,尤其是圖像信息的加工,人工干預(yù)雖能提高查準(zhǔn)率,但可被人工標(biāo)引的非常有限,同時,因?yàn)槿斯?biāo)引需要付出很多勞動而使檢索范圍受到限制,因此,當(dāng)前亟待解決的一個問題是快速標(biāo)引圖像信息,并對其進(jìn)行合理的分類。

    當(dāng)前,基于內(nèi)容的檢索技術(shù)多應(yīng)用于對靜態(tài)圖像的檢索,對動態(tài)圖像的檢索還沒有多少行之有效的方法。但隨著寬帶網(wǎng)絡(luò)的逐步實(shí)現(xiàn),動態(tài)多媒體信息在網(wǎng)絡(luò)中將會越來越多。

    參考文獻(xiàn):

    [1]孫建軍,成穎.信息檢索技術(shù)[M].北京:科學(xué)出版社,2004.

    [2]王豐.國內(nèi)中文搜索引擎研究[J].網(wǎng)絡(luò)通訊與安全,2007,(8).

    猜你喜歡
    標(biāo)引信息檢索搜索引擎
    檔案主題標(biāo)引與分類標(biāo)引的比較分析
    本刊對來稿中關(guān)鍵詞標(biāo)引的要求
    醫(yī)學(xué)期刊編輯中文獻(xiàn)信息檢索的應(yīng)用
    新聞傳播(2016年18期)2016-07-19 10:12:06
    本刊對來稿中關(guān)鍵詞標(biāo)引的要求
    基于神經(jīng)網(wǎng)絡(luò)的個性化信息檢索模型研究
    網(wǎng)絡(luò)搜索引擎亟待規(guī)范
    基于Nutch的醫(yī)療搜索引擎的研究與開發(fā)
    廣告主與搜索引擎的雙向博弈分析
    教學(xué)型大學(xué)《信息檢索》公選課的設(shè)計與實(shí)施
    河南科技(2014年11期)2014-02-27 14:10:19
    本刊對來稿中關(guān)鍵詞標(biāo)引的要求
    进贤县| 九龙县| 古丈县| 梅河口市| 长白| 河东区| 怀安县| 抚顺县| 淮北市| 永康市| 南陵县| 颍上县| 依兰县| 兴隆县| 大竹县| 灵川县| 获嘉县| 沛县| 策勒县| 青川县| 平舆县| 枣庄市| 五寨县| 武清区| 中宁县| 毕节市| 上杭县| 大港区| 宁德市| 彝良县| 乐安县| 班玛县| 上蔡县| 板桥市| 怀集县| 馆陶县| 于田县| 鄂托克前旗| 嘉义市| 石渠县| 庐江县|