【摘 要】如今搜索引擎已經(jīng)成為人們獲取網(wǎng)絡(luò)信息最重要的手段,網(wǎng)絡(luò)用戶普遍通過搜索引擎進(jìn)入網(wǎng)站。本文將介紹搜索引擎的工作原理及系統(tǒng)模型,對搜索引擎的排名技術(shù)及中國搜索引擎現(xiàn)狀進(jìn)行分析。
【關(guān)鍵詞】搜索引擎 SEO
隨著互聯(lián)網(wǎng)技術(shù)的誕生和普及,人們通過網(wǎng)絡(luò)進(jìn)行學(xué)習(xí),交友,游戲,工作,尋求服務(wù)等等。搜索引擎的任務(wù)就是滿足網(wǎng)絡(luò)用戶需求,通過 web 搜索尋找想要的頁面結(jié)果。用戶希望通過搜索引擎,在最短的時間內(nèi)得到答案,那么如何更好的解決用戶的問題是搜索引擎任務(wù)的重中之重。
1.搜索引擎工作原理
搜索引擎的工作原理可以分為:1.從互聯(lián)網(wǎng)上抓取網(wǎng)頁:利用Spider系統(tǒng)程序,它能夠從互聯(lián)網(wǎng)上自動收集網(wǎng)頁,自動訪問互聯(lián)網(wǎng),并沿著任何網(wǎng)頁中的所有URL爬到其它網(wǎng)頁,重復(fù)這個過程,把爬過的所有網(wǎng)頁收集回來;2.建立索引數(shù)據(jù)庫:由分析索引系統(tǒng)程序?qū)κ占貋淼木W(wǎng)頁進(jìn)行分析,提取相關(guān)網(wǎng)頁信息,根據(jù)相關(guān)度算法進(jìn)行計算,得到每個網(wǎng)頁針對頁面內(nèi)容中及超鏈中每個關(guān)鍵詞的相關(guān)度,然后用這些相關(guān)信息建立網(wǎng)頁索引數(shù)據(jù)庫;3.在索引數(shù)據(jù)庫中搜索排序:當(dāng)用戶輸入關(guān)鍵詞搜索后,由搜索系統(tǒng)程序從網(wǎng)頁索引數(shù)據(jù)庫中找到符合該關(guān)鍵詞的相關(guān)網(wǎng)頁。相關(guān)度越高,排名越靠前。
2.搜索引擎系統(tǒng)模型
搜索引擎系統(tǒng)由四個模塊構(gòu)成:信息搜索模塊,信息索引模塊,信息檢索模塊和用戶接口模塊。它們之間的關(guān)系如圖1-1。
各部分功能描述如下:(1)信息搜索模塊利用網(wǎng)絡(luò)爬蟲(Robot,Spider等)爬行整個Internet,按照一定的算法搜集抓取網(wǎng)頁,并定期將抓取到的網(wǎng)頁返回給信息索引模塊。(2)信息索引模塊收集信息搜索模塊傳過來的網(wǎng)頁信息,按照一定方法對網(wǎng)頁建立索引項,形成索引數(shù)據(jù)庫。(3)信息檢索模塊根據(jù)用戶的查詢請求在索引數(shù)據(jù)庫中快速檢索出用戶所需要的文檔,并按照一定相關(guān)度對檢索出的文檔進(jìn)行排序,將排序結(jié)果返給用戶。(4)用戶接口模塊的作用是根據(jù)用戶提出的查詢請求,對用戶查詢進(jìn)行分析,顯示查詢的結(jié)果。
3搜索引擎排名技術(shù)簡析
3.1 SEO簡介
如何才能付出少量金錢讓自己的網(wǎng)站更好的被別人發(fā)現(xiàn),實現(xiàn)網(wǎng)站更高的價值?SEO優(yōu)化就能很好地實現(xiàn)。SEO即搜索引擎優(yōu)化,是近年來較為流行的網(wǎng)絡(luò)營銷方式。SEO的主要工作是通過了解各類搜索引擎如何抓取互聯(lián)網(wǎng)頁面,如何進(jìn)行索引,如何確定其對特定關(guān)鍵詞的搜索結(jié)果排名等技術(shù),來對網(wǎng)頁進(jìn)行相關(guān)優(yōu)化,使其提高搜索引擎排名,從而提高網(wǎng)站訪問量的技術(shù)。
3.2影響排名的有利因素
影響網(wǎng)站排名的因素非常多,基本上分為關(guān)鍵詞、外部鏈接、網(wǎng)站品質(zhì)、頁面質(zhì)量這四個方面。首先是關(guān)鍵詞的使用,關(guān)鍵詞在網(wǎng)站TITLE,網(wǎng)頁內(nèi)容,H1標(biāo)簽,網(wǎng)站域名,頁面URL,等這些設(shè)計在網(wǎng)站建設(shè)上的使用,直接影響網(wǎng)站排名。而在外部鏈接上,外部鏈接的錨文字,鏈接頁面本身的鏈接流行度,外部鏈接頁面的主題性,鏈接的周圍文字,同域名下外部鏈接頁面的鏈接流行度,外部鏈接的創(chuàng)建和更新時間,外部鏈接網(wǎng)站域名的特殊性,外部鏈接網(wǎng)站的PR值這些因素都有影響。網(wǎng)站品質(zhì)直接影響網(wǎng)站訪問量,由以下因素所影響:網(wǎng)站的外部鏈接流行度、廣泛度及頁面內(nèi)容與關(guān)鍵詞的相關(guān)性,網(wǎng)站新外部鏈接產(chǎn)生的速率,網(wǎng)站在主題相關(guān)的網(wǎng)站群中的鏈接流行度,網(wǎng)站收錄數(shù)量、用戶查詢的關(guān)鍵詞與網(wǎng)站主題的相關(guān)性及用戶行為,域名的特殊性,頁面產(chǎn)生的速率,新用戶搜索網(wǎng)站的次數(shù)等。最后是頁面質(zhì)量,頁面質(zhì)量的好與壞可以從網(wǎng)站內(nèi)部鏈接結(jié)構(gòu),導(dǎo)出鏈接的質(zhì)量和相關(guān)性,頁面的年齡,頁面內(nèi)容的質(zhì)量,網(wǎng)站的結(jié)構(gòu)層次等幾個方面分辨出來。如果能夠很好地把握關(guān)鍵詞、外部鏈接等這幾部分,做到完好的SEO優(yōu)化,可以有效率的提升網(wǎng)站在搜索引擎的排名。
3.3影響排名的負(fù)面因素
影響網(wǎng)站排名負(fù)面因素主要有幾點,首先是網(wǎng)站服務(wù)器,服務(wù)器經(jīng)常無法響應(yīng)或服務(wù)器響應(yīng)時間非常慢直接影響排名的前后。其次是網(wǎng)站內(nèi)容,如內(nèi)容與搜索引擎已經(jīng)收錄的內(nèi)容高度重復(fù),網(wǎng)站過分堆砌關(guān)鍵詞,網(wǎng)站沒有實質(zhì)內(nèi)容,導(dǎo)致非常低的流量,用戶行為反映差。最后網(wǎng)站外鏈接做的非常差,如鏈向低質(zhì)量或垃圾站點,參與鏈接工廠或大量出售鏈接,外部鏈接來自垃圾站點等。通過以上因素可以看出,要做好SEO,首先做好服務(wù)器,然后充實網(wǎng)站的內(nèi)容,通過做有效的、用戶友好的外鏈來提升網(wǎng)站排名。
4.中國搜索引擎現(xiàn)狀及未來展望
2011年中國搜索引擎市場整體規(guī)模為187.8億元,中國搜索引擎市場將會繼續(xù)保持40%以上的增長速度。在互聯(lián)網(wǎng)行業(yè)的投資熱潮的背景下,以搜索營銷作為網(wǎng)絡(luò)營銷方式不斷繁榮,中國搜索引擎市場還將以較快速度增長。在市場份額上,百度處于領(lǐng)先地位,2011年達(dá)76.1%,谷歌占據(jù)19.8%的份額。2011年搜狗、搜搜份額有所提升,分別占2.3%、1.4%,其它廠商份額僅占0.4%。搜索市場被主要參與者占據(jù)的集中特征更加明顯。未來的搜索市場,百度將會維持目前的絕對優(yōu)勢地位,而谷歌由于受到既定因素影響,在搜索方面的增長空間受限。其它搜索服務(wù)商將會在搜索引擎市場加大發(fā)展力度。未來的搜索引擎第一大不變趨勢便是智能搜索。智能搜索引擎是結(jié)合了人工智能技術(shù)的新一代搜索引擎。它除了能提供傳統(tǒng)的快速檢索、相關(guān)度排序等功能,還能提供用戶角色登記、用戶興趣自動識別、內(nèi)容的語義理解、智能信息化過濾和推送等功能。
參考文獻(xiàn):
[1]萊特福特. 搜索引擎優(yōu)化寶典[M]. 馬煜,譯. 北京:清華大學(xué)出版社,2010
[2]林元元.搜索引擎優(yōu)化技術(shù)(SEO)的應(yīng)用[J].軟件導(dǎo)刊,2009,(11)