摘 要:本文將首先從垂直搜索引擎的概念以及垂直搜索引擎與通用搜索引擎的對(duì)比方面進(jìn)行入手分析,其次是針對(duì)垂直搜索引擎的工作原理進(jìn)行分析研究,最后從垂直搜索引擎的發(fā)展前景進(jìn)行闡述。隨著搜索引擎技術(shù)發(fā)展的不斷完善,相信垂直搜索引擎在未來的發(fā)展?jié)摿?huì)越來越大,并對(duì)整個(gè)搜索引擎行業(yè)起到積極的促進(jìn)作用。
關(guān)鍵詞:垂直搜索引擎;通用搜索引擎;網(wǎng)絡(luò)發(fā)展;工作原理
中圖分類號(hào):TP393.09
1 垂直搜索引擎概述
1.1 垂直搜索引擎的概念
垂直搜索引擎是針對(duì)某一個(gè)行業(yè)的專業(yè)搜索引擎,是搜索引擎的細(xì)分和延伸,是對(duì)網(wǎng)頁庫中的某類專門的信息進(jìn)行一次整合,定向分字段抽取出需要的數(shù)據(jù)進(jìn)行處理后再以某種形式返回給用戶。特定行業(yè)的用戶更加青睞垂直搜索引擎,是垂直搜索引擎的長(zhǎng)期、穩(wěn)定的群體。[1]垂直搜索引擎有三個(gè)特點(diǎn),搜索是一個(gè)產(chǎn)業(yè)商業(yè)聯(lián)盟的平臺(tái),一個(gè)集成產(chǎn)業(yè)鏈的上下游公司的搜索門戶。垂直搜索的表現(xiàn)方式和谷歌,百度的表現(xiàn)方式不同,結(jié)構(gòu)化的搜索和非結(jié)構(gòu)化搜索并用。從廣告模式上提供了除谷歌和百度競(jìng)價(jià)排名廣告之外的另一種可能。[2]
1.2 通用搜索引擎與垂直搜索引擎的不同
這兩者之間存在一些不同,最主要的不同點(diǎn)就是搜索信息的范圍不同。通用搜索引擎,我們從字面定義上就能夠看出這個(gè)引擎是通用的,無論是搜索哪類的信息,都可以用這類的引擎。所以通過通用搜索引擎搜索出的信息將是范圍比較大的,還需要用戶在搜索到的廣泛信息中進(jìn)行篩選。而垂直搜索引擎則是屬于對(duì)某一行業(yè)的專業(yè)搜索,搜索出的信息能溝通搜索關(guān)鍵詞進(jìn)行最大程度上的匹配,讓搜索人能夠非常快速的定位到所需求的信息。隨著人們對(duì)于搜索引擎的使用越來越廣泛,要求也越來越高,更多的用戶提出了新的要求,他們希望能夠在使用搜搜引擎的過程中,能夠快速準(zhǔn)確的搜索到信息,這也是垂直搜索引擎能夠已經(jīng)推出,便得到如此多的用戶關(guān)注和喜愛的重要原因之一,垂直搜索引擎相較于通用搜索引擎而言更加具有專業(yè)化的特點(diǎn)。
2 淺談垂直搜索引擎的工作原理
搜索引擎的出現(xiàn),整合了眾多網(wǎng)站信息,恰恰起到了信息導(dǎo)航的作用。垂直搜索引擎在工作原理上是同通用搜索引擎基本相同的,主要的部件包括搜索器,檢索器以及索引器。
搜索器:英文名稱就是spider,直譯過來就是蜘蛛,搜索器是保證搜索引擎能夠正常工作的重要構(gòu)成部件。用于在輸入一定字段的搜索詞之后,搜索器負(fù)責(zé)對(duì)信息進(jìn)行采集,并根據(jù)信息的匹配程度將最能夠滿足用戶需求的信息,其他信息會(huì)依據(jù)信息的匹配程度不同進(jìn)行依次的排列。垂直搜索引擎還會(huì)依據(jù)網(wǎng)頁的更新,及時(shí)的抓取最新的網(wǎng)頁信息,以保證用戶能夠搜索到最新的信息資訊。
索引器:索引器是根據(jù)上述搜索器搜索得到的信息,經(jīng)過一系列的處理得到的關(guān)鍵詞,建立從關(guān)鍵字到網(wǎng)頁URL(統(tǒng)一資源定位器)的關(guān)系索引倒排文檔,即建立索引數(shù)據(jù)庫。索引數(shù)據(jù)庫的建立對(duì)于數(shù)據(jù)信息更好地被搜索是非常有幫助的。
檢索器:檢索器的功能是根據(jù)用戶輸入的查詢?cè)~,在索引數(shù)據(jù)庫中進(jìn)行查詢?cè)~與索引數(shù)據(jù)庫的匹配算法,然后將查詢結(jié)果按相關(guān)程度排序并輸出到瀏覽器上。
垂直搜索引擎提出之后,為搜索引擎領(lǐng)域注入了全新的活力,垂直搜索引擎是專門為特定的領(lǐng)域,特定的一部分人群來提供專業(yè)化服務(wù)的,垂直搜索引擎將搜索領(lǐng)域進(jìn)行了更深程度的細(xì)化,并改變了當(dāng)今互聯(lián)網(wǎng)的格局,行業(yè)性的網(wǎng)站同互聯(lián)網(wǎng)成功的獨(dú)立出來。通用搜索引擎雖然能夠得到大量的信息,但是信息的范圍過于廣泛,并不利于一些有特定需求的用戶來進(jìn)行信息的查找,相反的,垂直搜索引擎彌補(bǔ)了通用搜索領(lǐng)域的這個(gè)不足之處,這是順應(yīng)市場(chǎng)發(fā)展潮流的必然趨勢(shì)。
3 淺談垂直搜索引擎的應(yīng)用
隨著網(wǎng)絡(luò)信息技術(shù)的不斷發(fā)展,越來越多的用戶愿意采用搜索引擎的方式來最快的獲取信息。無論是泊來的GOOGLE,還是出自于本土的“百度”,都是當(dāng)今通用搜索引擎中的佼佼者,尤其是那句“百度一下,你就知道”的廣告語,更是被廣泛傳播開來。只需要一個(gè)簡(jiǎn)單的搜索關(guān)鍵詞,用戶就能得到許許多多的信息。在2014年的百度移動(dòng)云技術(shù)總監(jiān)王京傲百度聯(lián)盟峰會(huì)上透露:百度目前占據(jù)移動(dòng)搜索領(lǐng)域72.1%市場(chǎng)份額,百度移動(dòng)搜索量在過去四年間增長(zhǎng)了30倍,截止到2014年5月,百度每日通過移動(dòng)搜索向第三方導(dǎo)出流量已經(jīng)達(dá)到10億級(jí)規(guī)模??梢哉f,現(xiàn)代人已經(jīng)離不開搜索引擎所能夠達(dá)到的信息獲取便利了。在這樣的發(fā)展態(tài)勢(shì)下,垂直搜索引擎被推出,并且相對(duì)于通用搜索引擎來講,無論是信息的專業(yè)度,還是信息的深度,都是能夠更加滿足用戶的需求的。垂直搜索引擎,將大量的專業(yè)信息進(jìn)行整合,但是這些信息并不是大雜燴,而且在某一專業(yè)領(lǐng)域,某一行業(yè)的整合。
3.1 在購物網(wǎng)站中的應(yīng)用
垂直搜索引擎在上述的功能模塊構(gòu)成下,為許多行業(yè)的用戶搜索提供了更加高效的技術(shù)手段,不管是企業(yè)庫的搜索,還是對(duì)于單純圖片的搜索等,無論是哪個(gè)行業(yè)的信息都可以被細(xì)化成垂直的搜索引擎。舉例來講,在專門的購物搜索引擎下,用戶輸入關(guān)鍵詞,購物搜索引擎的搜索器將所有同關(guān)鍵詞相關(guān)的信息進(jìn)行收集,索引器對(duì)網(wǎng)頁進(jìn)行抓取,檢索器最后對(duì)商品的具體信息進(jìn)行抽取,例如商品的一些介紹,商品的價(jià)格,商品的產(chǎn)地等等信息。最后將信息進(jìn)行明確的分類,這樣用戶就能夠根據(jù)自己的需求將最有價(jià)值的信息搜索出來。
3.2 在影視搜索中的應(yīng)用
原本只能通過電視機(jī)來收看電視節(jié)目的時(shí)代已經(jīng)過去了,通過網(wǎng)絡(luò)看電視劇,電影或者綜藝節(jié)目已經(jīng)成為了新的潮流,網(wǎng)絡(luò)中的節(jié)目播放往往不像電視中那樣有非常多的廣告,而且電視的節(jié)目播放有集數(shù)的限制,而在網(wǎng)絡(luò)中卻可以隨心所欲的想看幾集就能看幾集。垂直搜索引擎在影視搜索中被廣泛的應(yīng)用起來,一些專門的門戶網(wǎng)站將大量地節(jié)目信息進(jìn)行收集,用戶只需要輸入關(guān)鍵詞就能夠找到想要觀看的節(jié)目。
3.3 在其他類型門戶網(wǎng)站中的應(yīng)用
通用搜索引擎與垂直搜索引擎同屬于搜索引擎,并且在當(dāng)今的網(wǎng)絡(luò)技術(shù)發(fā)展越來越發(fā)達(dá)的情況下,搜索引擎幫助人們以最快的速度找到最需要的信息起到了十分重要的作用。如果沒有搜索引擎,那么我們想要在非常多的信息中找到最需要的信息,無疑是相當(dāng)于大海撈針,難以以非常高的效率找到我們所需要的信息?,F(xiàn)在搜索引擎現(xiàn)在許多的門戶網(wǎng)站中得到了應(yīng)用,例如對(duì)于企業(yè)庫的搜索,對(duì)于人才的搜索,對(duì)于房地產(chǎn)信息的搜索,對(duì)于圖片,地圖等的搜索,任何的行業(yè)都可以根據(jù)需求去定制這樣的垂直搜索引擎。[3]
總而言之,垂直搜索引擎作為當(dāng)今搜索領(lǐng)域越來越重要的發(fā)展趨勢(shì),要不斷的完善垂直搜索引擎的應(yīng)用技術(shù),這同時(shí)需要那些想要發(fā)展垂直搜索引擎的門戶管理者不斷的堅(jiān)定信心和意志,不斷加強(qiáng)對(duì)于垂直搜索引擎技術(shù)方面的改進(jìn),從而使垂直搜索引擎不斷得到優(yōu)化發(fā)展。
參考文獻(xiàn):
[1]李占波.基于DotLucene的垂直搜索引擎的研究[J].微計(jì)算機(jī)信息,2007.
[2]周赟.垂直搜索引擎Spider技術(shù)的研究和應(yīng)用[J].中山大學(xué),2007.
[3]王樂.基于本體的垂直搜索引擎研究[J].西北大學(xué),2008.
作者簡(jiǎn)介:徐玲玉(1991.01-),女,碩士在讀,研究方向:圖形圖像、人機(jī)交互、CAD;何利力(1966.03-),男,教授,研究方向:圖形圖像、人機(jī)交互、CAD。
作者單位:浙江理工大學(xué),杭州 310000