• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于開放網(wǎng)絡(luò)知識(shí)的信息檢索與數(shù)據(jù)挖掘

      2017-12-25 05:20:10馮少博河北六聯(lián)通信科技有限公司
      新商務(wù)周刊 2017年5期
      關(guān)鍵詞:信息檢索數(shù)據(jù)挖掘檢索

      文/馮少博,河北六聯(lián)通信科技有限公司

      基于開放網(wǎng)絡(luò)知識(shí)的信息檢索與數(shù)據(jù)挖掘

      文/馮少博,河北六聯(lián)通信科技有限公司

      隨著數(shù)據(jù)信息的海量增長(zhǎng),數(shù)據(jù)類型的不斷多樣,人們檢索數(shù)據(jù)信息需求的增加,需要提高信息檢索的精度與效率,因此開放網(wǎng)絡(luò)環(huán)境下的信息檢索與數(shù)據(jù)挖掘日益重要,需要對(duì)其原理方法進(jìn)行深入研究。

      開放網(wǎng)絡(luò);數(shù)據(jù)挖掘;信息檢索

      本文圍繞著數(shù)據(jù)挖掘的基本理論,對(duì)開放網(wǎng)絡(luò)知識(shí)信息檢索和數(shù)據(jù)挖掘的種類特點(diǎn)進(jìn)行分析。

      1 開放網(wǎng)絡(luò)知識(shí)的信息檢索

      1.1 意圖感知

      用戶當(dāng)前面對(duì)的是一個(gè)開放動(dòng)態(tài)的網(wǎng)絡(luò)環(huán)境,在開放的大數(shù)據(jù)庫(kù)時(shí)代,信息使用者必須圍繞主觀需求對(duì)需要搜索的內(nèi)容進(jìn)行總體性的概括,要求在用戶頭腦中形成客觀的搜尋目標(biāo),這樣才能通過一系列的資源整合最終找出搜尋的結(jié)果。關(guān)鍵詞是當(dāng)前描述用戶信息需求的重要方法,利用關(guān)鍵詞在開放的網(wǎng)絡(luò)環(huán)境中進(jìn)行信息搜索可以在整體上對(duì)信息內(nèi)容進(jìn)行高效的批量化處理,從而通過有效的檢索來(lái)查找到有價(jià)值的信息。通過關(guān)鍵詞來(lái)感知用戶的意圖,需要對(duì)用戶的需求進(jìn)行更深層次含義的解析,以及對(duì)用戶信息需求進(jìn)行劃分,這樣才能通總體感知用戶的信息需求,從而為更好的智能化服務(wù)用戶打下堅(jiān)實(shí)的基礎(chǔ)。

      1.2 查詢拓展

      有效的信息檢索必須是圍繞著關(guān)鍵信息點(diǎn)進(jìn)行拓展的信息檢索活動(dòng)。只有圍繞著用戶輸入的關(guān)鍵詞進(jìn)行拓展性的信息提供,才能在不斷的延伸中滿足用戶的信息使用需求,并且為檢索活動(dòng)創(chuàng)造更多的價(jià)值。在當(dāng)前現(xiàn)有的數(shù)據(jù)庫(kù)基礎(chǔ)上對(duì)用戶檢索數(shù)據(jù)信息進(jìn)行拓展意味著將信息復(fù)雜化和形象化,這不僅需要對(duì)數(shù)據(jù)庫(kù)的信息進(jìn)行整合,而且還要研究用戶的個(gè)性化需求,以及用戶信息查詢的狀態(tài),從而使圍繞關(guān)鍵詞的拓展活動(dòng)更有科學(xué)性和完整性,并且可以在修正關(guān)鍵詞的基礎(chǔ)上提高用戶的檢索效率。對(duì)關(guān)鍵詞的拓展質(zhì)量已經(jīng)從某種程度上決定了信息查詢質(zhì)量,只有建立起較為實(shí)用的數(shù)據(jù)化形式,才能更好的拓展符合用戶需求的數(shù)據(jù)信息內(nèi)容,從而全面滿足用戶查詢和使用信息的需求。

      1.3 語(yǔ)義問答

      語(yǔ)義問答是當(dāng)前了解用戶需求的重要形式,只有在用索信息時(shí)進(jìn)行必要的語(yǔ)義問題,對(duì)關(guān)鍵信息的內(nèi)涵和外延進(jìn)行科學(xué)的判斷,才能全面為用戶提供更有價(jià)值的信息服務(wù)內(nèi)容,實(shí)現(xiàn)信息檢索服務(wù)的深層次提供目標(biāo),突破以往信息檢索只提供參考性內(nèi)容,以及關(guān)鍵信息內(nèi)容闡述不準(zhǔn)確和只能提供簡(jiǎn)單相關(guān)性界面服務(wù)的問題。目前進(jìn)行語(yǔ)義問答來(lái)獲得用戶關(guān)于檢索目標(biāo)的描述,主要通過語(yǔ)言及文字的處理發(fā)展而來(lái),檢索系統(tǒng)會(huì)自主圍繞著檢索需求來(lái)提供給用戶進(jìn)行一些有針對(duì)性的問題。系統(tǒng)會(huì)通過與用戶必要的信息交流,判斷用戶對(duì)信息的深層次要求,并且給數(shù)據(jù)庫(kù)提供有效運(yùn)行指令方式,從而實(shí)現(xiàn)數(shù)據(jù)庫(kù)與關(guān)鍵詞的緊密結(jié)合,在全面提高數(shù)據(jù)檢索精準(zhǔn)性的同時(shí),極大提高檢索的效率。

      2 開放網(wǎng)絡(luò)知識(shí)的數(shù)據(jù)挖掘

      2.1 線索挖掘

      網(wǎng)絡(luò)數(shù)據(jù)挖掘是建立在網(wǎng)絡(luò)數(shù)據(jù)抽取規(guī)則之上的活動(dòng)。網(wǎng)絡(luò)數(shù)據(jù)挖掘從本質(zhì)上是對(duì)概念、實(shí)例和屬性的提取,只有建立擁有普遍聯(lián)系的抽取規(guī)則,實(shí)現(xiàn)不同數(shù)據(jù)之間對(duì)無(wú)關(guān)聯(lián)概念的聯(lián)系,才能更好的在開放性的網(wǎng)絡(luò)數(shù)據(jù)環(huán)境中進(jìn)行高效的數(shù)據(jù)挖掘活動(dòng)。線索挖掘是基于數(shù)據(jù)的相關(guān)性進(jìn)行的信息價(jià)值的判斷評(píng)估活動(dòng)。線索挖掘的方式主要圍繞著關(guān)鍵信息進(jìn)行比對(duì)式的連接,從而通過相關(guān)路徑找出更深層次和更有價(jià)值的信息。在大數(shù)據(jù)庫(kù)時(shí)代的結(jié)過挖掘的難度相對(duì)較大,由于大數(shù)據(jù)時(shí)代的關(guān)聯(lián)信息會(huì)無(wú)限制的延伸下去,因此其運(yùn)行的頻率與質(zhì)量直接的影響著數(shù)據(jù)挖掘的效率。

      2.2 數(shù)據(jù)推理

      數(shù)據(jù)推理主要指的是基于數(shù)據(jù)實(shí)體間的關(guān)系而開展的判斷推理活動(dòng),力求找出關(guān)聯(lián)數(shù)據(jù)庫(kù)中潛在的聯(lián)系,這樣可以從中挖掘出有內(nèi)在關(guān)聯(lián)性的知識(shí)。數(shù)據(jù)推理從本質(zhì)上是為了在相關(guān)數(shù)據(jù)中找出隱含的數(shù)據(jù)關(guān)系,Sherlock-Holmes是開放網(wǎng)絡(luò)領(lǐng)域基于文本關(guān)系的推理方法。數(shù)據(jù)推理的方法建立在歸納邏輯編程的基礎(chǔ)上,它具體通過一般規(guī)則的特殊化,從數(shù)據(jù)庫(kù)中找出正例和反例等例句。由于推理活動(dòng)基于的概念不同,因此用戶可以通過自建推理規(guī)則來(lái)輔助完善數(shù)據(jù)挖掘的活動(dòng)。對(duì)知識(shí)庫(kù)中的數(shù)據(jù)進(jìn)行推理是挖掘數(shù)據(jù)價(jià)值的重要方式,但是在當(dāng)前超大規(guī)模的數(shù)據(jù)庫(kù)中使用數(shù)據(jù)推理方式來(lái)進(jìn)行數(shù)據(jù)挖掘,還需要提高推理的精確性。

      3.3 關(guān)系預(yù)測(cè)

      當(dāng)前數(shù)據(jù)庫(kù)的規(guī)模越來(lái)越大,數(shù)據(jù)挖掘便傾向于使用實(shí)體關(guān)系進(jìn)行數(shù)據(jù)預(yù)測(cè)。關(guān)系預(yù)測(cè)通過對(duì)數(shù)據(jù)的量變與質(zhì)變做出有效的分析和預(yù)判,從而達(dá)到對(duì)新產(chǎn)生的邏輯關(guān)系,數(shù)據(jù)類型的變化,數(shù)據(jù)關(guān)系變化的頻率等問題進(jìn)行有效的掌握。目前對(duì)關(guān)系預(yù)測(cè)的方法主要由機(jī)器學(xué)習(xí)法來(lái)實(shí)現(xiàn),機(jī)器學(xué)習(xí)法可以分有監(jiān)督學(xué)習(xí)法和無(wú)監(jiān)督學(xué)習(xí)法兩種,目前有監(jiān)督學(xué)習(xí)算法是比較流行的信息預(yù)測(cè)方式,它主要基于實(shí)驗(yàn)來(lái)收集數(shù)據(jù)的相關(guān)知識(shí),然后在此基礎(chǔ)上對(duì)數(shù)據(jù)的變化進(jìn)行預(yù)測(cè)。非監(jiān)督學(xué)習(xí)法的準(zhǔn)確度相對(duì)較高,但是預(yù)測(cè)算法較為復(fù)雜,預(yù)測(cè)成本相對(duì)較高。預(yù)測(cè)可以從極大的程度上推動(dòng)知識(shí)的更新,可以結(jié)合數(shù)據(jù)庫(kù)的更新來(lái)更好的判斷數(shù)據(jù)信息的變化,關(guān)系預(yù)測(cè)是當(dāng)前數(shù)據(jù)挖掘領(lǐng)域里獲得新知識(shí)的重要途徑。

      3 數(shù)據(jù)挖掘在網(wǎng)絡(luò)信息檢索中的作用

      3.1 提高網(wǎng)絡(luò)信息摘要的準(zhǔn)確率

      數(shù)據(jù)挖掘可以提高網(wǎng)絡(luò)信息摘要的準(zhǔn)確率,可以滿足用戶使用關(guān)鍵詞進(jìn)行信息檢索的需要。通過自動(dòng)數(shù)據(jù)挖掘可以給用戶提供關(guān)于網(wǎng)絡(luò)信息的深入摘要,可以幫助用戶更好的確定信息的價(jià)值,從有助于幫助用戶理解整篇文檔的信息,可以揭示出信息主題與內(nèi)容知識(shí)之間的關(guān)系,更可以實(shí)現(xiàn)對(duì)語(yǔ)義內(nèi)容的標(biāo)注,全面提高了摘要的準(zhǔn)確性和有效性。

      3.2 可以拓展網(wǎng)絡(luò)信息資源量

      通過信息挖掘可以拓展網(wǎng)絡(luò)信息資源量,可以給用戶檢索出需要的文字、表格、圖片、視頻等多種形式的信息,使用數(shù)據(jù)信息挖掘技術(shù)可以為用戶提供更明確有效的索引,可以把潛藏的信息直觀的呈現(xiàn)給用戶,因此有助于拓展用戶的信息量,更好的滿足用戶對(duì)潛在信息的使用需求。

      3.3 可以對(duì)挖掘結(jié)果進(jìn)行分類重組

      通過數(shù)據(jù)挖掘可以對(duì)信息結(jié)果進(jìn)行重組,有助于實(shí)現(xiàn)數(shù)據(jù)信息的分類目標(biāo),從而幫助用戶在千萬(wàn)個(gè)相關(guān)信息中形成網(wǎng)絡(luò)數(shù)據(jù)信息的重點(diǎn),可以結(jié)合用戶的需求實(shí)現(xiàn)不同主題特征的歸類,實(shí)現(xiàn)對(duì)檢索結(jié)果頁(yè)面進(jìn)行等級(jí)分析,幫助用戶得到更適合的結(jié)果,實(shí)現(xiàn)高相似度的分析目標(biāo)。

      4 結(jié)論

      基于開放網(wǎng)絡(luò)知識(shí)的信息檢索與數(shù)據(jù)挖掘,提高了信息的使用效率,實(shí)現(xiàn)對(duì)了數(shù)據(jù)庫(kù)的深層次挖掘,有助于滿足用戶使用信息的實(shí)際需求。

      [1]戴禮燦.大數(shù)據(jù)檢索及其在圖像標(biāo)注與重構(gòu)中的應(yīng)用[D].中國(guó)科學(xué)技術(shù)大學(xué),2013.

      [2]馬仲兵.數(shù)據(jù)挖掘技術(shù)在圖書館采訪中的應(yīng)用[D].重慶師范大學(xué),2012.

      猜你喜歡
      信息檢索數(shù)據(jù)挖掘檢索
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
      2019年第4-6期便捷檢索目錄
      基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      醫(yī)學(xué)期刊編輯中文獻(xiàn)信息檢索的應(yīng)用
      新聞傳播(2016年18期)2016-07-19 10:12:06
      專利檢索中“語(yǔ)義”的表現(xiàn)
      專利代理(2016年1期)2016-05-17 06:14:36
      基于神經(jīng)網(wǎng)絡(luò)的個(gè)性化信息檢索模型研究
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      教學(xué)型大學(xué)《信息檢索》公選課的設(shè)計(jì)與實(shí)施
      河南科技(2014年11期)2014-02-27 14:10:19
      基于GPGPU的離散數(shù)據(jù)挖掘研究
      公共圖書館信息檢索服務(wù)的實(shí)踐探索——以上海浦東圖書館為例
      圖書館界(2013年5期)2013-03-11 18:50:29
      林口县| 沙坪坝区| 德阳市| 镇赉县| 铁力市| 温泉县| 扎赉特旗| 东台市| 嘉兴市| 兴仁县| 大石桥市| 湘潭县| 万山特区| 孝昌县| 垦利县| 台湾省| 合山市| 云阳县| 句容市| 北京市| 神池县| 亚东县| 石渠县| 雷州市| 云梦县| 恩平市| 晋州市| 博湖县| 新疆| 游戏| 读书| 丰原市| 丹巴县| 昌江| 环江| 巧家县| 金沙县| 依安县| 同仁县| 英德市| 清远市|