• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    看搜索那些事從發(fā)展到未來

    2013-12-31 00:00:00ASL
    電腦迷 2013年18期

    不論是360推出“雷電手機搜索”對抗百度騰訊,還是之前在微博上熱傳的“必應(Bing) PK谷歌(Google)”的比賽,搜索毫無疑問再一次成為了各大互聯(lián)網(wǎng)公司的必爭之地。搜索一直伴隨著網(wǎng)民們的生活,隨著搜索技術(shù)的發(fā)展,不論是搜索的方式、速度還是準確性都變得越來越好。從最初的關(guān)鍵詞搜索,到圖片搜索、社交圖譜搜索,直到最新的實體搜索,一場關(guān)于未來搜索的巨變正在發(fā)酵。

    1 何為搜索

    搜索引擎(Search Engines)是一個對互聯(lián)網(wǎng)上的信息資源進行搜集整理然后供你查詢的系統(tǒng),它包括信息搜集、信息整理和用戶查詢?nèi)糠?。它使用特定程序把因特網(wǎng)上的所有信息歸類,以幫助人們在茫茫網(wǎng)海中搜尋到所需要的信息。目前常用的網(wǎng)絡搜索引擎有百度、Google、必應、搜狐、雅虎、有道、中搜、搜搜等。

    2 搜索原理

    搜索引擎的工作原理大致可以分為三部分。

    搜集信息

    搜索引擎的信息搜集基本都是自動的。搜索引擎利用稱為網(wǎng)絡蜘蛛(Spider)的自動搜索機器人程序來連上每一個網(wǎng)頁上的超鏈接。機器人程序根據(jù)網(wǎng)頁鏈到其中的超鏈接,就像日常生活中所說的“一傳十,十傳百……”一樣,從少數(shù)幾個網(wǎng)頁開始,連到數(shù)據(jù)庫上所有到其他網(wǎng)頁的鏈接。理論上,若網(wǎng)頁上有適當?shù)某溄?,機器人便可以遍歷絕大部分網(wǎng)頁。

    整理信息

    搜索引擎整理信息的過程稱為“創(chuàng)建索引”。搜索引擎不僅要保存搜集起來的信息,還要將它們按照一定的規(guī)則進行編排。這樣,搜索引擎根本不用重新翻查它所有保存的信息,就能迅速找到所要的資料。想象一下,如果信息是不按任何規(guī)則隨意堆放在搜索引擎的數(shù)據(jù)庫中,那么它每次找資料都得把整個資料庫完全翻查一遍,如此一來再快的計算機系統(tǒng)也沒有用。

    接受查詢

    用戶向搜索引擎發(fā)出查詢,搜索引擎接受查詢并向用戶返回資料。搜索引擎每時每刻都要接到來自大量用戶的幾乎是同時發(fā)出的查詢,它按照每個用戶的要求檢查自己的索引,在極短時間內(nèi)找到用戶需要的資料,并返回給用戶。目前,搜索引擎返回主要是以網(wǎng)頁鏈接的形式提供的,這樣通過這些鏈接,用戶便能到達含有自己所需資料的網(wǎng)頁。通常搜索引擎會在這些鏈接下提供一小段來自這些網(wǎng)頁的摘要信息,以幫助用戶判斷此網(wǎng)頁是否含有自己需要的內(nèi)容(如圖1)。

    對并不算漫長的搜索技術(shù)的發(fā)展來說,搜索歷史的三次突破就是三張圖譜:網(wǎng)頁圖譜、社交圖譜和實體圖譜。

    3 網(wǎng)頁圖譜

    上世紀90年代,信息檢索只有兩個衡量的指標:查準率和查全率,最早的搜索引擎AltaVista只解決了查全率,就成了當時最富盛名的搜索工具。谷歌的兩位創(chuàng)始人拉里·佩奇(Larry Page)和謝爾蓋·布林(Sergey Brin)使用PageRank的全新算法,解決了查準率的問題,令當時所有搜索入局者難以望其項背。

    網(wǎng)頁搜索的發(fā)展時間相對較長,它也擁有很多特色功能來便利大家的查找,比如說網(wǎng)頁快照、相關(guān)搜索、拼音提示、錯別字提示以及一些高級搜索語法。

    比如當你遇到網(wǎng)站服務器暫時故障或網(wǎng)絡傳輸堵塞時,可以通過“快照”快速瀏覽頁面文本內(nèi)容(如圖2)。而如果搜索結(jié)果不佳,有時候則是因為選擇的查詢詞不是很妥當,你可以通過參考別人是如何搜索的,來獲得一些啟發(fā),百度的“相關(guān)搜索”就是和你的搜索很相似的一系列查詢詞(如圖3)。

    然而信息爆炸讓改變悄然發(fā)生,互聯(lián)網(wǎng)產(chǎn)生的數(shù)據(jù)越來越多,沒有被納入搜索引擎的“暗網(wǎng)”以萬億計,人們也往往沒有時間和耐心點擊第五頁以后的搜索結(jié)果。在過去的十幾年里,搜索引擎的研究和創(chuàng)新一直圍繞排序進行,業(yè)內(nèi)參與者競爭的焦點是誰的排序相關(guān)性更好!不過基于傳統(tǒng)網(wǎng)頁搜索的卡位戰(zhàn)已經(jīng)基本結(jié)束,谷歌、百度脫穎而出。

    4 社交圖譜

    Facebook去年高調(diào)推出“社交圖譜搜索(Graph Search)”,你可以通過它搜索好友圈中誰看過災難電影。Facebook搜索依靠的是10億用戶、2400億張照片和1萬億次頁面訪問量帶來的數(shù)據(jù)金礦。社交圖譜是一種表明“我認識你”的網(wǎng)絡圖譜,它反映了用戶通過各種途徑認識的人:家庭成員、工作同事、開會結(jié)識的朋友、高中同學、俱樂部成員、朋友的朋友等等。社交圖譜主要由一些主流的社交網(wǎng)絡產(chǎn)生,用戶們互相向自己認識的人們發(fā)送邀請來構(gòu)建和維持他們的社會關(guān)系(如圖4)。

    Facebook的社交行為數(shù)據(jù)可以滿足相當比例的搜索請求??梢曰谂笥训摹癓ike”搜索加州的特色餐廳,或是通過朋友的照片尋找一起滑雪的玩伴。除相關(guān)的語義研究,社交圖譜搜索背后是把用戶行為產(chǎn)生的數(shù)據(jù),比如點擊習慣、Like等運用到極致,它更傾向于解決與生活相關(guān)的社交信息。

    社交網(wǎng)絡為信息的交流與分享提供了新的途徑。作為社交網(wǎng)絡的網(wǎng)站一般會擁有數(shù)以百萬的登記用戶,使用該服務已成為了用戶們每天的生活。社交網(wǎng)絡服務網(wǎng)站當前在世界上有許多,知名的包括Facebook、Quazza.com、Myspace、Orkut、Twitter等等。在中國大陸地區(qū),以社交網(wǎng)絡服務為主的流行網(wǎng)站有人人網(wǎng)、開心網(wǎng)、微博、QQ空間等(如圖5)。

    5 實體圖譜

    實體搜索對比Facebook的顯著進階是,不僅僅有“人”、“地點”、“照片”等一些最常見的實體,也有如哈利·波特、植物、動物等真實和虛擬世界內(nèi)的所有實體。

    實體搜索的概念產(chǎn)生于2004年,其前身是微軟研究院研發(fā)的學術(shù)搜索,它試圖解決信息檢索的精準化。而實體搜索結(jié)果的理想呈現(xiàn)形式將會類似于維基百科,不過不同的是,維基百科是人們手動整理和撰寫的,而實體搜索則是試圖通過自動算法、機器學習、數(shù)據(jù)挖掘和自然語言理解等技術(shù)自動生成的類似網(wǎng)頁(如圖6)。

    在算法上,實體搜索把傳統(tǒng)基于“文本”的搜索改變?yōu)榛凇皩ο蟆钡乃阉?,搜索引擎更加智能地去理解用戶的真實需求。例如搜索“Apple”,它理解成蘋果公司的機率最高;如果搜索“Big Apple”,最高的可能性則是列出紐約市。短期來看,實體搜索是對現(xiàn)有搜索精準度的一次改進。

    看起來前景無限的社交圖譜搜索和實體搜索吸引了行業(yè)巨頭紛紛涉足??墒菬o論是社交圖譜還是實體搜索,結(jié)構(gòu)化數(shù)據(jù)庫成為一大難點。一個顯而易見的難點是,現(xiàn)在萬億級的網(wǎng)頁以及全人類的知識,都是用非結(jié)構(gòu)化的方法在處理。

    另外手機等移動設備帶來了移動互聯(lián)網(wǎng)的高速發(fā)展期,平臺和工具的變化引起了用戶使用習慣的改變。一個顯而易見的變化是“語音搜索”,隨著三星最新開發(fā)的“眼動追蹤”技術(shù),以及微軟、英特爾在體感計算上的突破,越來越多的電子設備可以感知用戶的手勢和動作。

    從搜索的方式來講,目前的搜索相對被動,而未來的搜索會更加智能,能夠根據(jù)用戶不同的使用場景,用最適合的輸入方式實現(xiàn)“主動搜索”;而從搜索的形式來講,隨著技術(shù)的不斷突破,或許未來的搜索只需要揮一揮手,就可以如《黑鏡》中的主人公一樣隨意切換。然而不論搜索如何變化,我們都能看出,搜索引擎是在不斷揣摩人的心理,為滿足網(wǎng)民的需求而不斷發(fā)展的。正如Google Search產(chǎn)品經(jīng)理Jack Menzel所說,未來的搜索會更自然,就像與朋友聊天一樣。

    若尔盖县| 伊金霍洛旗| 扎赉特旗| 谢通门县| 芦溪县| 资溪县| 曲靖市| 密云县| 拜泉县| 尤溪县| 定南县| 琼结县| 黎平县| 桂平市| 龙游县| 凌云县| 百色市| 铅山县| 永修县| 英超| 马关县| 营山县| 蕉岭县| 丰都县| 禹城市| 当涂县| 巩留县| 商丘市| 临江市| 城口县| 潮安县| 沽源县| 万安县| 富民县| 克什克腾旗| 阳信县| 教育| 明水县| 梁河县| 台北市| 阿鲁科尔沁旗|