曾偉琪
摘要:該文結合目前互聯(lián)網搜索引擎的應用情況,首先確定了搜索引擎主要的評價指標。并對如何確定各指標權重進行了研究,建立了權重分配子模型,為評分標準制定依據。利用多目標決策理論建立搜索引擎性能的綜合評價數學模型,然后使用建立的模型舉例計算百度、搜狗、搜搜、愛問、谷歌五個常用搜索引擎的的得分。該文的模型主要是基于多目標決策理論以及多元回歸和層次分析。
關鍵詞:搜索引擎;權重;模型
中圖分類號:TP393 文獻標識碼:A 文章編號:1009-3044(2013)14-0014-02
隨著互聯(lián)網的快速發(fā)展,人們已經離不開從互聯(lián)網上獲取信息。但是這些信息浩如煙海,同事又夾雜著大量的有害信息。搜索引擎技術就是完美利用這些資源的有效手段。搜索引擎可以說是一個網站,這些網站通過網絡搜索軟件( 也稱網絡搜索機器人) 或網站登錄等方式,將互聯(lián)網上大量網站收集到本地,經過一定的處理后放入自己的資料庫。用戶對其進行各種查詢,搜索引擎給出響應,提供用戶所需的信息。有調查顯示,搜索是繼電子郵件之后的第二大互聯(lián)網應用。 因此,建立搜索引擎綜合評價體系,完整、客觀地對搜索引擎進行綜合評價,具有較大的社會意義和研究前景。而針對這個問題目前已經有很多學者做出一些卓有成效的研究,統(tǒng)計了大量數據,運用了大量分析研究方法,信息技術的逐漸發(fā)展,客觀有效地評價搜索引擎,得出有意義排名,并且設計個性化搜索引擎,對于提高工作效率,實現(xiàn)時間價值最大化,具有重要意義。
為了確定搜索引擎的性能,我們要根據搜索引擎和用戶之間的相互關系,以第三方身份確定評價搜索引擎性能優(yōu)劣的關鍵因素,通過建立權重子模型,確定每個環(huán)節(jié)的權重大小。再進一步實際試驗,統(tǒng)計數據,采用多目標決策法,統(tǒng)計搜索引擎的最終得分,進行排名。
1 模型假設
1)假設所參與評價的搜索引擎性能穩(wěn)定,服務器無故障,且短時間內不會升級,狀態(tài)保持。
2)假設模型衡量的因素就是參與評價的關鍵因素, 其他變量設為無關變量,它們的變化不影響評價最后評價結果的準確度。
3)假設網絡速度的狀況的變化與不影響結果。
4)假設參與評價的因素之間相互獨立。
2 符號說明
2 模型建立與求解
2.1 對現(xiàn)有的搜索引擎進行分析
在對互聯(lián)網搜索引擎的優(yōu)劣進行評價時,所建立的數學模型中涉及許多決策變量。這些變量有繁多、結構復雜、不確定性等特點。為了解決這一問題,我們有必要對描述目標的相對重要度做出正確的估價。而各因素的重要程度是不一樣的,為了反映因素的重要程度,需要對各因素相對重要性進行估測(即權數),由各因素權數組成的集合就是權重集。權重是指標本身的物理屬性的客觀反映,是主客觀綜合量度的結果。
系統(tǒng)工程理論中的層次分析法(Analytic Hierarchy Process,簡稱AHP)是一種較好的權重確定方法。它是把復雜問題中的各因素劃分成相關聯(lián)的有序層次,使之條理化的多目標、多準則的決策方法,是一種定量分析與定性分析相結合的有效方法。而本模型將使用層次分析法對問題的決策變量確定其權重。給出問題的層次結構模型:
搜索引擎b;準確性b1、安全性b2、完整性b3;非歧義b11、去重復b12、優(yōu)先度b13、無毒b21、社會影響b22、內容原創(chuàng)b31、更新頻率b32。
下面闡述AHP確定權重的基本過程。
根據以上分數可求出前五名的搜索引擎排序為:谷歌、搜狗、搜搜、愛問、百度。
4 結束語
本文使用層次分析法比較全面的研究了關于搜索引擎的評價問題,利用多目標決策理論建立搜索引擎性能的綜合評價數學模型,得出最終評分。但各大搜索引擎都在迅速發(fā)展,各自的搜索引擎的性能也在進一步提升,這些都會影響到本文所確定的評價指標的適用性。并且層次分析法存在其天然的缺點,比如其定量數據較少,定性成分多。所以,如何建立一個合理的評價模型仍需進一步研究。
參考文獻:
[1] 劉正春. 搜索引擎綜合評價模型研究[J]. 數學的實踐與認識, 2004,34(9).
[2] 徐俊, 劉娜. 層次分析法的基本思想與實際應用[J]. 情報探索, 2008(12).
[3] 郭金玉, 張忠彬, 孫慶云. 層次分析法在安全科學研究中的應用[J]. 中國安全生產科學技術, 2008(2).