• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    TRIZ 理論在搜索引擎創(chuàng)新設(shè)計中的應(yīng)用研究

    2012-09-20 08:19:36
    關(guān)鍵詞:查準(zhǔn)率搜索引擎原理

    吳 建

    (重慶郵電大學(xué)數(shù)字圖書館技術(shù)部,重慶 400065)

    0 引言

    傳統(tǒng)搜索引擎,通常指的是收集了因特網(wǎng)上幾千萬到幾十億個網(wǎng)頁并對網(wǎng)頁中的每一個詞(即關(guān)鍵詞)進行索引,建立索引數(shù)據(jù)庫的全文搜索引擎[1]。當(dāng)用戶查找某個關(guān)鍵詞時,所有在頁面內(nèi)容中包含了該關(guān)鍵詞的網(wǎng)頁都將作為搜索結(jié)果返回給用戶。在經(jīng)過復(fù)雜的算法進行排序后,這些結(jié)果將按照與搜索關(guān)鍵詞的相關(guān)度高低,依次排列。隨著互聯(lián)網(wǎng)上數(shù)據(jù)和信息的不斷膨脹,傳統(tǒng)的搜索引擎已逐漸不能滿足用戶搜索信息的需求,主要體現(xiàn)在目前常見的搜索引擎搜索結(jié)果查準(zhǔn)率不高,且不能滿足人們個性化和人性化的要求。比如目前的搜索引擎一般不支持實時信息的搜索、不具有語音交互功能、不支持基于內(nèi)容的多媒體信息搜索等,這直接導(dǎo)致了搜索引擎的用戶體驗不足。

    因此,本文利用萃智(teoriya resheniya izobreatatelskikh zadatch,TRIZ)[2]理論來挖掘系統(tǒng)中存在的矛盾,并對TRIZ理論中的創(chuàng)新原理進行系統(tǒng)演繹與具體化,以確定解決具體實際問題和矛盾的可行方案,使搜索引擎能夠在最大程度上理解用戶的搜索意圖,為用戶提供真正感興趣的數(shù)據(jù)和信息,并從多角度、多層次改善用戶體驗。由于TRIZ理論并非采用折中尋優(yōu)或妥協(xié)的方法,而是基于技術(shù)的發(fā)展演化規(guī)律研究整個設(shè)計與開發(fā)過程,在系統(tǒng)創(chuàng)新設(shè)計中運用TRIZ理論可以在很大程度上加快人們創(chuàng)造發(fā)明的進程,而且能得到高質(zhì)量的創(chuàng)新系統(tǒng)和產(chǎn)品[3]。

    1 問題工況及最終目標(biāo)

    通過對傳統(tǒng)搜索引擎技術(shù)的分析,為進一步解決該問題,首先需要為問題工況和系統(tǒng)的最終目標(biāo)進行描述。

    問題工況:搜索引擎用戶體驗不強。

    最終目標(biāo):本系統(tǒng)以實際需求為研究導(dǎo)向,以蘊含豐富信息的互聯(lián)網(wǎng)為研究背景,以語音交互、實時信息搜索、基于內(nèi)容的多媒體信息搜索為主要創(chuàng)新點,以提高搜索引擎的個性化和人性化為研究目標(biāo),結(jié)合框計算、文本轉(zhuǎn)語音(text to speech,TTS),語音轉(zhuǎn)文本(speech to text,STT)等先進技術(shù),研究利用TRIZ理論改進搜索引擎的用戶體驗,從而為用戶提供最需要的信息。

    2 問題分析

    針對傳統(tǒng)搜索引擎用戶體驗不足的問題,本系統(tǒng)利用TRIZ理論提出問題的解決流程,如圖1所示。

    圖1 問題解決流程圖Fig.1 Problem solving process diagram

    在傳統(tǒng)的搜索引擎中,由于主要利用關(guān)鍵詞進行文本信息的匹配,以及所使用的中文分詞算法不準(zhǔn)確等原因,導(dǎo)致語義分析不準(zhǔn)確,從而影響網(wǎng)頁摘要和搜索結(jié)果的科學(xué)性,在一定程度上降低了系統(tǒng)的可用性和人性化。

    另一方面由于傳統(tǒng)的搜索引擎沒有考慮用戶的搜索歷史,這就會影響系統(tǒng)對用戶的偏好分析,從而導(dǎo)致系統(tǒng)不支持用戶個性化搜索等服務(wù),使系統(tǒng)的個性化功能不足。這兩方面都會導(dǎo)致系統(tǒng)的用戶體驗不足,也是影響搜索引擎用戶體驗的主要因素。

    針對傳統(tǒng)的搜索引擎所存在的諸多缺陷,我們采用三軸分析法來進一步確定系統(tǒng)的技術(shù)矛盾。

    2.1 原因軸分析

    通過上面的分析,我們由問題工況出發(fā),通過原因軸分析,找出造成該問題的根本原因。下面給出原因軸分析的整個過程,如圖2所示。

    圖2 原因軸分析圖Fig.2 Analysis diagram of cause shaft

    2.2 系統(tǒng)和操作軸分析

    圖2中的人性化不足和個性化不足代表問題的切入點,下面我們將主要從系統(tǒng)人性化和個性化不足兩個方面著手解決問題。下面以系統(tǒng)個性化不足為例,給出系統(tǒng)和操作軸的分析結(jié)果,如圖3所示。

    圖3 系統(tǒng)和操作軸Fig.3 System and operating shaft

    根據(jù)三軸分析法確定了造成問題工況的各種原因,下面我們將根據(jù)上面的分析來尋找技術(shù)矛盾。

    3 系統(tǒng)解決方案

    在對問題進行描述和分析之后,就需要進一步確定問題的解決方案,圖4是利用TRIZ理論提出來的確定系統(tǒng)解決方案的思路。

    圖4 系統(tǒng)解決方案Fig.4 System solution diagram

    3.1 利用技術(shù)矛盾尋求解決方案

    解決技術(shù)矛盾,首先需要將一個用通用語言描述的待解決的具體問題,轉(zhuǎn)化為利用39個通用工程參數(shù)描述的技術(shù)矛盾。然后,針對這種類型的問題模型,通過建立矛盾矩陣找到對應(yīng)的解決原理。

    依據(jù)這些創(chuàng)新原理,經(jīng)過演繹與具體化,最終找到解決具體實際問題的一些可行方案。解決技術(shù)矛盾的常用模式如圖5所示。

    圖5 技術(shù)矛盾的解題模式Fig.5 Problem solving model for technical contradiction

    首先,定義技術(shù)矛盾。

    步驟1 提出待解決問題:系統(tǒng)人性化和個性化功能不足;

    步驟3 提出現(xiàn)有解決方法存在的問題:成本提高,數(shù)據(jù)處理更復(fù)雜。

    上述步驟和方法對系統(tǒng)產(chǎn)生如下影響:①改善了系統(tǒng)性能:可以為用戶提供多種類型的信息,并在一定程度上提高搜索效率;②惡化了用戶體驗:不僅沒有從根本上改善用戶體驗,還會影響搜索引擎的查全率和查準(zhǔn)率,增加服務(wù)器的計算量。因此我們提煉出的技術(shù)矛盾是:用戶體驗—保證查全率和查準(zhǔn)率。

    然后,通過查找矛盾矩陣表,可以找到解決這一矛盾的創(chuàng)新原理編號為:1,5,10,23,它們各自對應(yīng)的解決方案如下[4]。

    1)分割原理。把一個物體分成相互間獨立的幾個部分;把一個物體分成容易組裝和拆卸的部分;提高系統(tǒng)的可分性,以實現(xiàn)系統(tǒng)的改造。

    2)組合原理。在空間上,將相同的物體或相關(guān)操作加以組合;在時間上,將相同或相關(guān)的操作進行合并;將新材料、新技術(shù)引入到老系統(tǒng)中,在時間和空間上加以組合,可以提高系統(tǒng)性能。

    3)預(yù)先作用原理。預(yù)先對物體(全部或部分)施加必要的改變;預(yù)先安裝物體,使其在最方便的位置,開始發(fā)揮作用而不浪費運送時間。

    4)反饋原理。在系統(tǒng)中引入反饋;如果已引入反饋,改變其大小或作用;將系統(tǒng)發(fā)生改變所產(chǎn)生的信息,都視作一種反饋信息源,用來執(zhí)行校正系統(tǒng)的作用;若使用反饋,則設(shè)法來改變其反饋幅度。

    中國八個民主黨派中,中國致公黨(以下簡稱“致公黨”)因成立時間最早(1925年),且在海外(美國舊金山)以及與洪門有歷史淵源等特點,向來為學(xué)者所關(guān)注。從縱向看,關(guān)于致公黨歷史的研究開始較早,民國時期便有相關(guān)著作對其早期歷史進行闡述。新中國成立后,致公黨的歷史研究在相當(dāng)長的一段歷史時期不被重視或因諸多限制而長期停步不前。中共十一屆三中全會后,致公黨的歷史研究全面步入正軌。從橫向看,在政黨史的研究范疇中,致公黨的歷史研究相較于清末政團、民國初期政黨、中國國民黨、中國共產(chǎn)黨的歷史研究還較薄弱,存在論述框架較單一、缺乏對事件的細(xì)致考察、囿于政治性而對事件語焉不詳或張冠李戴的現(xiàn)象。

    根據(jù)上面提到的創(chuàng)新原理,我們給出下面幾種解決方案。

    應(yīng)用分割原理得到解決方案一:根據(jù)系統(tǒng)功能模塊的不同,將搜索引擎系統(tǒng)設(shè)計成相對獨立的幾部分,但是這幾部分之間又是協(xié)同工作的。同時,對每一個功能模塊分別進行算法上的改進,以改善用戶體驗。

    1)網(wǎng)絡(luò)爬蟲的設(shè)計與改進。為了提高信息的多樣性,系統(tǒng)需要抓取不同類型的信息。對于這個問題,可以采取多主題分布式網(wǎng)絡(luò)爬蟲,即由一個網(wǎng)絡(luò)爬蟲控制程序通過創(chuàng)建不同類型的爬取進程到不同的網(wǎng)絡(luò)上爬取信息,并將爬取的結(jié)果進行科學(xué)的分類。

    2)索引器的設(shè)計與改進。在對索引器進行改進時,需要對中文分詞、網(wǎng)頁過濾和語義分析等算法進行較深入的研究??梢栽诂F(xiàn)有的中文分詞算法中增加詞性標(biāo)注的功能,以進一步提高語義分析的性能。而且,也可以在索引器的設(shè)計中引入人工智能的技術(shù)來改善語義分析的性能。

    另一方面,還需要在網(wǎng)頁過濾的過程中利用實體信息抽取技術(shù)對其進行改進,這不僅會提高網(wǎng)頁排名的科學(xué)性,而且有利于系統(tǒng)自動生成更加準(zhǔn)確的網(wǎng)頁摘要。

    3)檢索器的設(shè)計與改進。用戶在使用搜索引擎進行信息搜索時,主要面對的是檢索器部分。可以考慮在索引器設(shè)計中增加框計算、語音識別、用戶偏好分析等功能,這樣可以提高系統(tǒng)的智能性,使系統(tǒng)更加人性化和個性化,最終的效果是改善了搜索引擎的用戶體驗。

    應(yīng)用組合原理得到解決方案二:隨著物聯(lián)網(wǎng)技術(shù)的快速發(fā)展,基于Internet和物聯(lián)網(wǎng)相結(jié)合的信息搜索技術(shù)逐漸成為了一個研究的熱點,可以滿足更多用戶對系統(tǒng)的要求。

    應(yīng)用預(yù)先作用原理得到解決方案三:可以將用戶的搜索歷史保存在數(shù)據(jù)服務(wù)器上,這樣就可以保證在用戶進行搜索之前完成用戶的偏好分析(需要對用戶進行認(rèn)證),為用戶提供更多的個性化服務(wù)。

    應(yīng)用反饋原理得到解決方案四:將用戶的搜索操作記錄不斷地添加到用戶搜索歷史數(shù)據(jù)庫中,作為一種反饋信息源來調(diào)整用戶的搜索偏好分析。

    3.2 利用其他創(chuàng)新原理解決方案

    通過上面的分析,我們得出一些解決方案。另外,我們還可以參照其他的一些創(chuàng)新原理來尋求新的解決方案。

    局部質(zhì)量原理:將物體、環(huán)境和外部作用的均勻結(jié)構(gòu),變?yōu)椴痪鶆虻?讓物體的不同部分具有不同功能;讓物體的各部分,均處于完成各自動作的最佳狀態(tài)[5]。

    對應(yīng)解決方案:系統(tǒng)中將數(shù)據(jù)服務(wù)器和Web服務(wù)器進行分離,這樣不僅可以提高系統(tǒng)的性能,還能保證系統(tǒng)的安全性和可靠性。

    另外,根據(jù)分割原理可以采用模型-視圖-控制器(model view controller,MVC)模式[6]來設(shè)計系統(tǒng)。MVC模式是一種在軟件設(shè)計中比較流行的設(shè)計模式,它是將一個開發(fā)應(yīng)用的業(yè)務(wù)邏輯處理和分析模塊、系統(tǒng)表示層以及控制功能在3個不同的層上進行設(shè)計和實現(xiàn),MVC最大的優(yōu)勢就是提高了系統(tǒng)模塊的可重用性,體現(xiàn)了系統(tǒng)的高聚合和低耦合特性,并且具有較高的可讀性和可維護性。由于MVC自身的優(yōu)勢,可以在很大程度上提高項目開發(fā)的效率。而且,隨著基于瀏覽器/服務(wù)器(browser/server,B/S)模式應(yīng)用系統(tǒng)的廣泛應(yīng)用,針對Web網(wǎng)絡(luò)程序快速設(shè)計和開發(fā)的MVC框架也逐漸成為新的研究熱點[7]。

    模型、視圖與控制器的分離,使得一個模型可以具有多個顯示視圖。如果用戶通過某個視圖的控制器改變了模型的數(shù)據(jù),所有其他依賴于這些數(shù)據(jù)的視圖都應(yīng)反映這些變化。因此,無論何時發(fā)生了何種數(shù)據(jù)變化,控制器都會將變化通知所有的視圖,導(dǎo)致顯示的更新。

    3.3 系統(tǒng)設(shè)計方案

    在系統(tǒng)中,利用多主題分布式搜索引擎不斷爬取各種網(wǎng)頁和多媒體信息資源,并對這些信息進行智能分類;然后利用改進的索引器對這些信息建立索引;用戶在使用搜索引擎進行信息搜索時,可以通過文本或者語音的形式來檢索信息,索引器通過語義分析、用戶偏好分析等復(fù)雜的處理過程后,返回給用戶最感興趣的信息,使系統(tǒng)更加人性化和個性化。利用TRIZ理論改進后的系統(tǒng)體系結(jié)構(gòu)圖如圖6所示。

    圖6 系統(tǒng)創(chuàng)新設(shè)計方案Fig.6 System innovation design

    最終的設(shè)計方案不僅可以改善搜索引擎的用戶體驗,同時還保證了搜索引擎的查全率和查準(zhǔn)率。

    為了進一步測試系統(tǒng)的查準(zhǔn)率和有效性,本文進行查準(zhǔn)率實驗。在測試過程中,由人工判斷和分析檢索結(jié)果,從而計算出查準(zhǔn)率。系統(tǒng)測試的數(shù)據(jù)是在局域網(wǎng)上抓取500個左右的網(wǎng)頁,然后建立索引庫。第一次用傳統(tǒng)的檢索算法,并隨機選取了50個關(guān)鍵詞進行檢索,然后統(tǒng)計檢索結(jié)果的前5,10,15,20,25,30 條檢索結(jié)果的平均查準(zhǔn)率;再用改進后的檢索算法對同樣的關(guān)鍵詞進行檢索。2次測試的平均查準(zhǔn)率如圖7所示。

    4 結(jié)論

    本文主要研究TRIZ理論在搜索引擎創(chuàng)新設(shè)計中的應(yīng)用,通過對系統(tǒng)技術(shù)矛盾的分析,提出了系統(tǒng)的創(chuàng)新設(shè)計方案,以幫助對搜索引擎用戶體驗不足缺陷的改進。TRIZ理論的核心是技術(shù)進化原理,利用這一理論可以使技術(shù)系統(tǒng)一直處于進化和推進過程中,解決沖突是其進化的內(nèi)力。

    圖7 傳統(tǒng)算法與改進后算法的查準(zhǔn)率對比Fig.7 Precision comparison between the traditional algorithm and the improved algorithm

    [1]沈賀丹,潘亞楠,邵良杉.關(guān)于搜索引擎的研究綜述[J].計算機技術(shù)與發(fā)展,2006,16(4):147-149.SHEN He-dan,PAN Ya-nan,SHAO Liang-shan.A Study for Search Engine[J].Computer Technology and Development,2006,16(4):147-149.

    [2]LI Te-sheng.Applying TRIZ and AHP to develop innovative design for automated assembly systems[J].Int J Adv Manuf Technol,2009,10:3-10.

    [3]韓兵兵,王君.我國TRIZ研究論文統(tǒng)計及可視化分析[J].圖書情報研究,2011,4(2):54-59.HAN Bing-bing,WANG Jun.Statistic Analysis and Visualization of Triz Research Articles in China[J].Library& Information Studies,2011,4(2):54-59.

    [4]趙敏,史曉凌,段海波.TRIZ入門及實踐[M].北京:科學(xué)出版社,2008:51-56.ZHAO Min,SHI Xiao-ling,DUAN Hai-bo.TRIZ Information and Practice[M].Beijing:Science Press,2008:51-56.

    [5]謝慶生,李亞青,韓濤,等.基于模塊化思想的TRIZ分塊沖突矩陣方法[J].蘭州理工大學(xué)學(xué)報,2009,35(3):36-41.XIE Qing-sheng,LI Ya-qing,HAN Tao,et al.Method of TRIZ blocking conflict matrix based on modularization ideas[J].Journal of Lanzhou University of Technology,2009,35(3):36-41.

    [6]COLLINS E R,HUNG Y.A Programmable Dynamometer for Testing Rotating Machinery Using a Three-phase Induction Machine[J].IEEE Transactions on Energy Conversion,1994,9(3):521-527.

    [7]JOHNSON Rod.J2EE設(shè)計開發(fā)編程指南[M].北京:電子工業(yè)出版,2003:103-108.JOHNSON Rod.J2EE Design and Development[M].Beijing:Electronic Industry Press,2003:103-108.

    [8]陳光宇,祁凌云,萬成龍,等.基于TRIZ方法的改造項目質(zhì)量控制研究[J].電子科技大學(xué)學(xué)報:自然科學(xué)版,2011,13(6):46-52.CHEN Guang-yu,QI Ling-yun,WAN Cheng-long,et al.TRIZ-Based Study on Quality Control for Renovation Projects[J].Journal of University of Electronic Science and Technology of China:Natural Sciences Edition,2011,13(6):46-52.

    [9]劉江南,劉秋平.基于沖突分析的工程車路面除雪裝置創(chuàng)新研究[J].湖南大學(xué)學(xué)報:自然科學(xué)版,2011,38(6):33-36.LIU Jiang-nan,LIU Qiu-ping.Study of the Contradiction and Innovation of the Road Snowplow of Engineering Vehicles[J].Journal of Hunan University:Natural Science Edition,2011,38(6):33-36.

    猜你喜歡
    查準(zhǔn)率搜索引擎原理
    了解咳嗽祛痰原理,有效維護健康
    平均場正倒向隨機控制系統(tǒng)的最大值原理
    基于數(shù)據(jù)挖掘技術(shù)的網(wǎng)絡(luò)信息過濾系統(tǒng)設(shè)計
    大數(shù)據(jù)環(huán)境下的文本信息挖掘方法
    基于深度特征分析的雙線性圖像相似度匹配算法
    化學(xué)反應(yīng)原理全解讀
    通信原理教學(xué)改革探索
    網(wǎng)絡(luò)搜索引擎亟待規(guī)范
    基于Nutch的醫(yī)療搜索引擎的研究與開發(fā)
    廣告主與搜索引擎的雙向博弈分析
    新巴尔虎右旗| 安化县| 通河县| 天祝| 陇西县| 维西| 彭阳县| 临武县| 泗水县| 微山县| 新营市| 铜鼓县| 垣曲县| 长顺县| 万安县| 岳普湖县| 吴旗县| 磐安县| 措勤县| 花莲市| 康乐县| 秦皇岛市| 仁怀市| 临沭县| 明溪县| 土默特左旗| 阳山县| 五大连池市| 沾益县| 雅安市| 耒阳市| 将乐县| 徐州市| 江达县| 资源县| 磐安县| 中方县| 定兴县| 屯昌县| 榆社县| 西平县|