段毅
摘 要 搜索引擎網(wǎng)站是現(xiàn)代民眾在參與開展日?;a(chǎn)生活實(shí)踐活動(dòng)過程中,在收集和獲取類型多樣的網(wǎng)絡(luò)性數(shù)據(jù)信息要素過程中需要運(yùn)用的工具性網(wǎng)站。近年來,大數(shù)據(jù)技術(shù)在搜索引擎網(wǎng)站設(shè)計(jì)和建設(shè)工作實(shí)踐過程中的引入運(yùn)用,在支持和助力現(xiàn)代搜索引擎網(wǎng)站實(shí)際應(yīng)用功能不斷改善優(yōu)化方面做出了積極貢獻(xiàn)。本文圍繞基于大數(shù)據(jù)的搜索引擎設(shè)計(jì)與實(shí)現(xiàn)論題,擇取三個(gè)具體方面展開了簡(jiǎn)要闡釋。
關(guān)鍵詞 大數(shù)據(jù) 搜索引擎 設(shè)計(jì) 實(shí)現(xiàn) 探討分析
中圖分類號(hào):TP311文獻(xiàn)標(biāo)識(shí)碼:A
伴隨著現(xiàn)代科學(xué)技術(shù)的快速穩(wěn)定有序發(fā)展,搜索引擎網(wǎng)站正在逐步成為現(xiàn)階段世界各國(guó)民眾在獲取和處理類型多樣的數(shù)據(jù)信息資源要素過程中,需要依賴和運(yùn)用的不可獲取的工具和渠道。從歷史性發(fā)展演化過程角度展開闡釋,搜索引擎網(wǎng)站從早期1993年的Excite網(wǎng)站,經(jīng)歷中期的Yahoo網(wǎng)站、Altsvista網(wǎng)站、Inktomi網(wǎng)站,以及Google網(wǎng)站,逐步發(fā)展到了現(xiàn)在的智能化搜索技術(shù)應(yīng)用階段,為我國(guó)民眾在參與開展日常生產(chǎn)生活活動(dòng)過程中,收集獲取類型多樣的數(shù)據(jù)信息資源要素,構(gòu)筑和提供了有效且充分的便利性支持條件。最近幾年以來,大數(shù)據(jù)技術(shù)的日漸發(fā)展成熟和廣泛引入運(yùn)用,實(shí)現(xiàn)了對(duì)現(xiàn)實(shí)網(wǎng)絡(luò)技術(shù)環(huán)境之中數(shù)量龐大且類型多樣的數(shù)據(jù)信息資源要素的全面充分的調(diào)動(dòng)、整合,以及具體運(yùn)用,在深刻影響搜索引擎類工具網(wǎng)站的建設(shè)思路和運(yùn)行技術(shù)特征條件下,為我國(guó)現(xiàn)代網(wǎng)絡(luò)技術(shù)體系綜合性建設(shè)發(fā)展效能的持續(xù)提升做出了積極貢獻(xiàn)。有鑒于上述研究背景,本文將會(huì)圍繞基于大數(shù)據(jù)的搜索引擎設(shè)計(jì)與實(shí)現(xiàn)論題,展開簡(jiǎn)要闡釋。
1搜索引擎網(wǎng)站的歷史發(fā)展過程
從歷史性角度展開闡釋分析,搜索引擎工具網(wǎng)站在其發(fā)展過程中,依次經(jīng)歷了三次備受矚目的技術(shù)變革進(jìn)程:
第一代搜索引擎工具網(wǎng)站的建設(shè)過程,是以傳統(tǒng)的人工目錄分類導(dǎo)航技術(shù)作為其基礎(chǔ)支持條件的,這一階段的代表性網(wǎng)站是Yahoo搜索網(wǎng)站,其最為顯著的技術(shù)應(yīng)用弊端,在于其實(shí)際獲取的檢索結(jié)果在相關(guān)性層面較為欠缺,實(shí)際的排列呈現(xiàn)順序嚴(yán)重缺乏合理性,且僅能針對(duì)全部互聯(lián)網(wǎng)數(shù)據(jù)信息要素中的16.00%展開搜索分析,且用戶通常需要在排列狀態(tài)雜亂無章的數(shù)據(jù)信息要素之中找尋自身想要獲取的目標(biāo)信息要素。
第二代搜索引擎工具網(wǎng)站的建設(shè)過程實(shí)現(xiàn)了對(duì)文本處理技術(shù)形態(tài)的有效運(yùn)用,且在檢索結(jié)果呈現(xiàn)方式層面引入了科學(xué)化的排序方法,但在搜索技術(shù)實(shí)現(xiàn)方式層面依然需要依賴關(guān)鍵詞技術(shù)和特殊算法技術(shù)的基礎(chǔ)支持條件,其代表性網(wǎng)站為Google網(wǎng)站,其主要技術(shù)應(yīng)用優(yōu)勢(shì),在與第一代搜索引擎工具網(wǎng)站相對(duì)比條件下,有效改善提升了其檢準(zhǔn)率指標(biāo)、檢全率指標(biāo)和檢索速度指標(biāo),實(shí)現(xiàn)了較好的技術(shù)發(fā)展應(yīng)用收益。
第三代搜索引擎工具網(wǎng)站指的是智能化的搜索引擎,其本身具備技術(shù)智能化特點(diǎn)、功能人性化特點(diǎn)、搜索專業(yè)化特點(diǎn)等多樣化的技術(shù)特點(diǎn)和優(yōu)勢(shì),其建設(shè)發(fā)展過程中綜合性地調(diào)動(dòng)和運(yùn)用了人工智能技術(shù)、數(shù)據(jù)挖掘技術(shù)、模糊匹配技術(shù)、神經(jīng)網(wǎng)絡(luò)技術(shù),以及數(shù)理分析技術(shù)等為代表的多樣化技術(shù)手段,其代表性網(wǎng)站包含百度網(wǎng)站、搜狗網(wǎng)站、WolframAlpha網(wǎng)站、Ask jeeves網(wǎng)站、以及Google網(wǎng)站等。
2大數(shù)據(jù)技術(shù)背景下智能搜索引擎的基本特點(diǎn)
第一,在大數(shù)據(jù)技術(shù)應(yīng)用背景下,智能搜索引擎網(wǎng)站在建設(shè)過程中應(yīng)用的技術(shù)形態(tài)具備先進(jìn)性和復(fù)雜性,實(shí)現(xiàn)了對(duì)類型多樣的現(xiàn)代化網(wǎng)絡(luò)應(yīng)用技術(shù)形態(tài)的綜合性引入運(yùn)用,在搜索引擎網(wǎng)站的整體性使用功能層面,展示出了多樣性和先進(jìn)性特征。
第二,在大數(shù)據(jù)技術(shù)應(yīng)用背景下,智能搜索引擎網(wǎng)站在檢索結(jié)果的總體數(shù)量和排列方式層面能夠更加更充分地滿足目標(biāo)用戶的實(shí)際使用需求,獲取到良好的綜合效益。
3大數(shù)據(jù)技術(shù)背景下搜索引擎網(wǎng)站的設(shè)計(jì)與實(shí)現(xiàn)思路
第一,基于大數(shù)據(jù)技術(shù)應(yīng)用背景之下開展搜索引擎網(wǎng)站的設(shè)計(jì)建造工作,應(yīng)當(dāng)綜合性引入運(yùn)用人工智能技術(shù)、數(shù)據(jù)挖掘技術(shù)、模糊匹配技術(shù)、神經(jīng)網(wǎng)絡(luò)技術(shù),以及數(shù)理分析技術(shù)等現(xiàn)代技術(shù)形態(tài),在持續(xù)豐富網(wǎng)站的技術(shù)功能體系條件下,提升其運(yùn)行穩(wěn)定性。
第二,基于大數(shù)據(jù)技術(shù)應(yīng)用背景之下開展搜索引擎網(wǎng)站的設(shè)計(jì)建造工作,應(yīng)當(dāng)針對(duì)網(wǎng)站搜索界面的結(jié)果排列方式進(jìn)行優(yōu)化選取,確保實(shí)際呈現(xiàn)的搜索結(jié)果,能夠充分滿足目標(biāo)用戶的使用需要。
4結(jié)束語
圍繞基于大數(shù)據(jù)的搜索引擎設(shè)計(jì)與實(shí)現(xiàn)論題,本文擇取搜索引擎網(wǎng)站的歷史發(fā)展過程、大數(shù)據(jù)技術(shù)背景下智能搜索引擎的基本特點(diǎn),以及大數(shù)據(jù)技術(shù)背景下搜索引擎網(wǎng)站的設(shè)計(jì)與實(shí)現(xiàn)思路,三個(gè)具體方面展開了簡(jiǎn)要的闡釋分析,旨在為相關(guān)領(lǐng)域的研究人員,以及一線技術(shù)工作人員,構(gòu)筑和提供有效且充分的經(jīng)驗(yàn)參考支持條件。將大數(shù)據(jù)技術(shù)引入運(yùn)用到搜索引擎網(wǎng)站的設(shè)計(jì)和建造領(lǐng)域,對(duì)于優(yōu)化提升現(xiàn)代搜索引擎網(wǎng)站建設(shè)與運(yùn)用工作的綜合效能具備重要意義。
參考文獻(xiàn)
[1] 韓家寶.圖數(shù)據(jù)搜索引擎Trinity中正則表達(dá)式匹配子系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].哈爾濱:哈爾濱工業(yè)大學(xué),2015.
[2] 陳臣.大數(shù)據(jù)時(shí)代基于個(gè)性化服務(wù)的數(shù)字圖書館數(shù)據(jù)搜索引擎設(shè)計(jì)[J].圖書館理論與實(shí)踐,2015(04):91-94.
[3] 周智清,劉百林,劉勛.基于OAI-PMH的元數(shù)據(jù)搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[J].蘭州大學(xué)學(xué)報(bào)(自然科學(xué)版),2009,45(S1):147-152.
[4] 李勇文.OAI元數(shù)據(jù)搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[J].現(xiàn)代圖書情報(bào)技術(shù),2005(02):37-39+32.