• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    Web垂直搜索引擎實(shí)現(xiàn)過(guò)程的研究

    2016-05-14 00:24:05張弘弦田玉玲
    現(xiàn)代電子技術(shù) 2016年8期
    關(guān)鍵詞:爬蟲(chóng)

    張弘弦 田玉玲

    摘 要: Web垂直搜索引擎是一個(gè)復(fù)雜的信息系統(tǒng),目前大多數(shù)研究都集中在解決搜索引擎中出現(xiàn)的某一個(gè)方面的問(wèn)題,仍缺乏對(duì)Web垂直搜索引擎完整實(shí)現(xiàn)過(guò)程的相關(guān)研究。針對(duì)這個(gè)問(wèn)題,提出一種三層架構(gòu)的Web垂直搜索引擎的實(shí)現(xiàn)過(guò)程,整個(gè)過(guò)程包含數(shù)據(jù)準(zhǔn)備、查詢處理和界面交互。使用Java語(yǔ)言和相關(guān)的開(kāi)源工具,對(duì)實(shí)現(xiàn)過(guò)程描述的具體任務(wù)進(jìn)行實(shí)際操作,實(shí)現(xiàn)了一個(gè)查詢手機(jī)信息的Web垂直搜索引擎。該三層架構(gòu)和實(shí)現(xiàn)過(guò)程有效地為構(gòu)建面向主題的完整Web垂直搜索引擎提供了理論依據(jù)和實(shí)踐指導(dǎo)。

    關(guān)鍵詞: Web搜索; 搜索引擎實(shí)現(xiàn); 垂直搜索架構(gòu); 爬蟲(chóng)

    中圖分類號(hào): TN911?34 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2016)08?0055?05

    Research on implementation process of Web vertical search engine

    ZHANG Hongxian, TIAN Yuling

    (School of Computer Science and Technology, Taiyuan University of Technology, Taiyuan 034000, China)

    Abstract: The Web search engine is a complex information system. However, most researches are concentrated on one detailed problem appearing in a aspect of the search engine, but they lack of the correlational research on the complete implementation process of Web vertical search engines. Aiming at this problem, the implementation process of a Web vertical search engine with a three?layer architecture is proposed, in which data preparation, query processing and interface interaction are contained. An actual operation of a certain task describing the implementation process was performed with Java platform and relative open?source tools. And by this operation, the Web vertical search engine that could query mobile information was realized. The three?layer architecture and implementation process provide a theoretical basis and practical guidance for building a complete subject?oriented Web vertical search engine.

    Keywords: Web search; search engine implementation; architecture of vertical search engine; crawler

    0 引 言

    從2000年開(kāi)始,Web垂直搜索引擎開(kāi)始贏得用戶的親睞[1?2]。視頻、音樂(lè)、圖片、軟件、貼吧、地圖分門(mén)別類展開(kāi)搜索,專業(yè)性更強(qiáng),主題相關(guān)性更高。然而Web垂直搜索引擎的應(yīng)用主題并不局限,擁有非常廣闊的發(fā)展空間,例如面對(duì)電子商務(wù)的商品搜索,數(shù)碼產(chǎn)品信息搜索以及近年開(kāi)始出現(xiàn)的微博搜索。垂直搜索的出現(xiàn)主要有兩個(gè)方面的原因:一是通用搜索引擎索引Web的全部?jī)?nèi)容變得越來(lái)越難,而垂直搜索引擎索引數(shù)據(jù)量較小且專業(yè),投入成本也相對(duì)較低;二是垂直搜索引擎提供的搜索質(zhì)量較高,因?yàn)樗梢运阉鞯酵ㄓ盟阉饕娌荒芩褜さ降捻?yè)面,而且在可搜索頁(yè)面上提供更強(qiáng)有力的搜索功能。垂直搜索引擎與通用搜索引擎的最大區(qū)別在于對(duì)網(wǎng)頁(yè)信息進(jìn)行結(jié)構(gòu)化信息抽取,即將網(wǎng)頁(yè)的非結(jié)構(gòu)化數(shù)據(jù)提取成特定的結(jié)構(gòu)化數(shù)據(jù)。構(gòu)建一個(gè)垂直搜索引擎主要有兩種方法:一種方法是通過(guò)爬蟲(chóng)爬取某種主題網(wǎng)頁(yè)而構(gòu)建專業(yè)索引;另一種方法是為用戶提供專業(yè)化搜索的接口。

    Web搜索引擎是種復(fù)雜、多組件信息檢索系統(tǒng)的具體應(yīng)用[3],也因其應(yīng)用在擁有超大規(guī)模數(shù)據(jù)的互聯(lián)網(wǎng)中,使構(gòu)建Web搜索引擎變得比較困難。已有眾多的研究者參與到Web搜索引擎的研究中,Brin和Page發(fā)表論文首次公開(kāi)大規(guī)模Web搜索引擎Google的設(shè)計(jì)原型[4],提出Web搜索引擎的基本組件包括爬蟲(chóng)(Crawler)、索引組件、搜索組件、排序系統(tǒng)以及反饋組件。高效Web垂直搜索的關(guān)鍵之一在于爬蟲(chóng)能否精確爬取主題相關(guān)的Web文檔,Soumen等人提出聚焦爬蟲(chóng)[5](Focused Crawler),利用一種能夠評(píng)估網(wǎng)頁(yè)是否與主題相關(guān)的分類器選擇性地爬取與預(yù)定義主題相關(guān)的頁(yè)面,實(shí)現(xiàn)了以目標(biāo)為導(dǎo)向的爬取。文獻(xiàn)[6]開(kāi)發(fā)了一種潛語(yǔ)義索引分類器,將鏈接分析和文本內(nèi)容結(jié)合起來(lái),目的是抓取指定主題域的Web文檔。文獻(xiàn)[7]設(shè)計(jì)并實(shí)現(xiàn)了一種基于網(wǎng)格架構(gòu)的大型Web搜索引擎,討論實(shí)現(xiàn)流程和細(xì)節(jié),對(duì)Web垂直搜索引擎的研究提供了寶貴的經(jīng)驗(yàn)。信息檢索領(lǐng)域的研究成果對(duì)Web搜索引擎有著較高的參照價(jià)值,特別是檢索模型的研究更加重要,Web搜索引擎的排序組件好壞很大程度上決定了用戶體驗(yàn)。信息檢索模型得到了飛速發(fā)展,傳統(tǒng)的檢索模型包括布爾模型、向量空間模型、概率模型、語(yǔ)言模型?,F(xiàn)代檢索模型的建立大多通過(guò)排序?qū)W習(xí)方法得到,即利用機(jī)器學(xué)習(xí)技術(shù)在數(shù)據(jù)集上自動(dòng)創(chuàng)建排序模型[8]。這些研究成果很多通過(guò)開(kāi)源軟件實(shí)現(xiàn),這些工具不僅為開(kāi)發(fā)軟件提供先進(jìn)的技術(shù)支持,而且大大縮短了開(kāi)發(fā)周期。

    本文提出了一種Web垂直搜索引擎的實(shí)現(xiàn)過(guò)程,以該過(guò)程為基礎(chǔ)開(kāi)發(fā)了一個(gè)查詢與手機(jī)相關(guān)信息的Web垂直搜索引擎,并且對(duì)實(shí)現(xiàn)原理和細(xì)節(jié)進(jìn)行了詳細(xì)的闡述。此垂直搜索引擎可以為搜索手機(jī)相關(guān)信息的用戶提供直觀的、快捷的、有效的手機(jī)信息搜索服務(wù),驗(yàn)證了這種實(shí)現(xiàn)過(guò)程的有效性和完整性。

    1 Web垂直搜索引擎的實(shí)現(xiàn)過(guò)程

    Web垂直搜索引擎與通用搜索引擎原理類似,都需要從互聯(lián)網(wǎng)上下載網(wǎng)頁(yè)、建立索引,響應(yīng)用戶查詢。但是垂直搜索引擎可以返回結(jié)構(gòu)化的數(shù)據(jù),這些數(shù)據(jù)經(jīng)過(guò)人工分析與整理再存入數(shù)據(jù)庫(kù)中。本文將Web垂直搜索引擎的實(shí)現(xiàn)過(guò)程分為3層,分別為:數(shù)據(jù)準(zhǔn)備層、提供查詢服務(wù)層、前臺(tái)交互層。這3層可互相獨(dú)立開(kāi)發(fā),最終整合到一起形成一套完整的Web垂直搜索引擎。圖1為一種Web垂直垂直搜索引擎實(shí)現(xiàn)過(guò)程。

    1.1 數(shù)據(jù)準(zhǔn)備層

    數(shù)據(jù)準(zhǔn)備層的目的是準(zhǔn)備用于檢索的數(shù)據(jù),這些數(shù)據(jù)最終存放在關(guān)系數(shù)據(jù)庫(kù)中并建立倒排索引。Web垂直搜索引擎的目的是為用戶提供更專業(yè)、主題性更強(qiáng)的搜索服務(wù),這種服務(wù)與大量主題相關(guān)的數(shù)據(jù)為基礎(chǔ),數(shù)據(jù)處理分為兩個(gè)階段,第一個(gè)階段為采集原始數(shù)據(jù),原始數(shù)據(jù)來(lái)自互聯(lián)網(wǎng)某些主題性較強(qiáng)的、數(shù)據(jù)來(lái)源可靠的網(wǎng)站。原始數(shù)據(jù)大多是未經(jīng)處理的無(wú)結(jié)構(gòu)網(wǎng)頁(yè),這些原始網(wǎng)頁(yè)無(wú)法支持搜索服務(wù)并返回給用戶查看。第二階段為數(shù)據(jù)分析與處理,將原始無(wú)結(jié)構(gòu)網(wǎng)頁(yè)中的數(shù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù),并將這些結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)在關(guān)系數(shù)據(jù)庫(kù)中,這些存儲(chǔ)在數(shù)據(jù)庫(kù)中數(shù)據(jù)最終以更加直接的形式展示給用戶。然而,關(guān)系數(shù)據(jù)庫(kù)中模糊查詢難以應(yīng)對(duì)海量數(shù)據(jù)查詢,所以需要建立一種面向詞匯的數(shù)據(jù)結(jié)構(gòu),即倒排索引,以實(shí)現(xiàn)毫秒級(jí)的查詢性能。

    數(shù)據(jù)準(zhǔn)備層主要包含以下5個(gè)過(guò)程:

    (1) 選擇主題信息來(lái)源網(wǎng)站和網(wǎng)頁(yè)

    認(rèn)真選擇主題信息來(lái)源網(wǎng)站以確保原始數(shù)據(jù)的可靠性,通常需要遵循以下4個(gè)原則:來(lái)源網(wǎng)站沒(méi)有屏蔽爬蟲(chóng)對(duì)網(wǎng)頁(yè)的爬取;網(wǎng)頁(yè)內(nèi)容不是JavaScript動(dòng)態(tài)生成的。爬蟲(chóng)不需要模擬瀏覽器解釋腳本去生成網(wǎng)頁(yè)內(nèi)容,否則會(huì)嚴(yán)重影響爬蟲(chóng)效率;網(wǎng)站中網(wǎng)頁(yè)URL有統(tǒng)一的風(fēng)格。這樣的URL更容易被爬蟲(chóng)抓取,數(shù)據(jù)更加準(zhǔn)確;選擇訪問(wèn)量比較大的知名網(wǎng)站,保證數(shù)據(jù)源可靠性。

    (2) 網(wǎng)站和網(wǎng)頁(yè)內(nèi)容分析

    分析網(wǎng)頁(yè)的目的是定向抓取網(wǎng)頁(yè),在確定主題信息來(lái)源網(wǎng)站之后,為了能夠準(zhǔn)確獲取主題數(shù)據(jù),需要對(duì)網(wǎng)站的URL結(jié)構(gòu)進(jìn)行分析,找出實(shí)際擁有主題信息的一級(jí)URL頁(yè)面,該頁(yè)面通常擁有該主題下全部子主題的二級(jí)URL鏈接,分析出這些二級(jí)URL鏈接作為種子鏈接交給爬蟲(chóng)。分析方法主要以人工觀測(cè)為主,以程序分析為輔。通過(guò)觀察一級(jí)網(wǎng)頁(yè)URL規(guī)律,查看網(wǎng)頁(yè)源碼,再設(shè)計(jì)抽取二級(jí)URL的計(jì)算機(jī)程序,利用程序自動(dòng)抽取種子鏈接。

    (3) 定向抓取網(wǎng)頁(yè)

    抓取網(wǎng)頁(yè)的目的是把主題相關(guān)的網(wǎng)頁(yè)下載到本地磁盤(pán)。爬蟲(chóng)是一種能夠從互聯(lián)網(wǎng)上自動(dòng)抓取網(wǎng)頁(yè)并下載到本地的程序,這種程序的輸入是一些URL鏈接,這些鏈接也稱之為種子,爬蟲(chóng)抓取種子網(wǎng)頁(yè)的結(jié)果是將所有相關(guān)目標(biāo)網(wǎng)頁(yè)下載到本地磁盤(pán)中。

    (4) 分析并抽取網(wǎng)頁(yè)內(nèi)容到本地

    將網(wǎng)頁(yè)中無(wú)規(guī)則的數(shù)據(jù)規(guī)范地保存到本地文件中,數(shù)據(jù)保存采取統(tǒng)一的格式,使其能夠存入數(shù)據(jù)庫(kù)并建立全文索引。

    (5) 存入數(shù)據(jù)庫(kù)并建立索引

    格式化的數(shù)據(jù)不能僅存儲(chǔ)在文本文件中,否則提取數(shù)據(jù)的開(kāi)銷非常大。將數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)庫(kù)中,使用數(shù)據(jù)庫(kù)統(tǒng)一管理所有數(shù)據(jù),這樣訪問(wèn)速度與安全性也大大增強(qiáng)。搜索引擎中數(shù)據(jù)準(zhǔn)備過(guò)程中最關(guān)鍵的技術(shù)就是建立索引,用戶查詢首先訪問(wèn)的是索引而不是數(shù)據(jù)庫(kù),通過(guò)索引查找關(guān)鍵詞然后返回結(jié)果文檔的數(shù)據(jù)庫(kù)ID,再到數(shù)據(jù)庫(kù)中查找具體記錄。

    數(shù)據(jù)準(zhǔn)備層的任務(wù)集中于數(shù)據(jù)采集、預(yù)處理、數(shù)據(jù)存儲(chǔ)以及索引。這一層的活動(dòng)對(duì)用戶不可見(jiàn),最終的產(chǎn)物是保存主題相關(guān)結(jié)構(gòu)化數(shù)據(jù)的數(shù)據(jù)庫(kù)以及這些數(shù)據(jù)上的倒排索引。

    1.2 提供查詢服務(wù)層

    查詢服務(wù)層首先將用戶的查詢字符串轉(zhuǎn)換為可識(shí)別的對(duì)象,并進(jìn)行預(yù)處理,然后發(fā)送給相應(yīng)的查詢方法處理,最后返回與查詢字符串匹配的數(shù)據(jù)對(duì)象列表。要得到最后的數(shù)據(jù)對(duì)象列表實(shí)際經(jīng)過(guò)2次查詢,第一次查詢倒排索引得到所有相關(guān)文檔ID,這次查詢的時(shí)間復(fù)雜度是O(1),因?yàn)榈古潘饕脑~典結(jié)構(gòu)多為哈希表。第二次查詢將文檔ID發(fā)送至數(shù)據(jù)庫(kù)引擎,根據(jù)文檔ID查詢文檔的全部信息,并且將所有查詢到的文檔以對(duì)象的方式返回。

    1.3 前臺(tái)交互層

    前臺(tái)交互層的重點(diǎn)主要是加強(qiáng)用戶輸入和輸出的體驗(yàn),主要包含兩個(gè)方面:一是隨著用戶按鍵自動(dòng)彈出提示關(guān)鍵字列表;二是直接展示查詢結(jié)果詳細(xì)信息。列表提示功能使用Ajax異步響應(yīng),當(dāng)onkeyup事件發(fā)生后,向數(shù)據(jù)庫(kù)服務(wù)器發(fā)送模糊查詢SQL語(yǔ)句,將查詢結(jié)果列表返回給JavaScript代碼,JavaScript修改dom將提示列表展示在搜索框下面。查詢結(jié)果顯示數(shù)據(jù)要直接,例如查詢數(shù)碼產(chǎn)品的結(jié)果中,產(chǎn)品圖片和參數(shù)直接顯示在頁(yè)面上,技術(shù)上同樣是利用Ajax技術(shù)減少延時(shí)來(lái)增加用戶體驗(yàn)。

    2 Web垂直搜索引擎具體實(shí)現(xiàn)

    下面基于以上實(shí)現(xiàn)過(guò)程在Java平臺(tái)上構(gòu)建查詢手機(jī)相關(guān)信息的Web垂直搜索引擎,構(gòu)建過(guò)程分別按照?qǐng)D1中的3層進(jìn)行實(shí)現(xiàn),并對(duì)關(guān)鍵技術(shù)和實(shí)現(xiàn)原理進(jìn)行總結(jié)和描述。

    2.1 數(shù)據(jù)準(zhǔn)備層實(shí)現(xiàn)

    (1) 選擇主題信息來(lái)源網(wǎng)站和網(wǎng)頁(yè)。根據(jù)選擇主題網(wǎng)站的原則,最終確定選擇太平洋電腦網(wǎng)(http://www.pconline.com.cn/)作為手機(jī)信息數(shù)據(jù)的來(lái)源網(wǎng)站,數(shù)據(jù)源網(wǎng)站可以有多個(gè)。作為一個(gè)綜合性IT網(wǎng)站,手機(jī)頻道的一級(jí)URL頁(yè)面為:

    http://product.pconline.com.cn/mobile/list.shtml

    (2) 網(wǎng)站和網(wǎng)頁(yè)內(nèi)容分析。通過(guò)查看一級(jí)URL頁(yè)面源碼,并且分析網(wǎng)站URL鏈接規(guī)律,得出手機(jī)信息數(shù)據(jù)所在的URL地址規(guī)格,如下所示:

    手機(jī)信息:http://product.pconline.com.cn/mobile/品牌/編號(hào).html。

    手機(jī)圖片:http://img.pconline.com.cn/images/product/編號(hào)

    確定URL規(guī)格的目的是為了確定抓取哪些URL規(guī)格的頁(yè)面。獲取所有手機(jī)品牌的URL鏈接后將這些鏈接作為種子,送給爬蟲(chóng)抓取。

    (3) 定向抓取網(wǎng)頁(yè)。爬蟲(chóng)的輸入是待抓取URL種子鏈接,而爬蟲(chóng)抓取的結(jié)果就是將預(yù)定抓取的HTML和圖片等資源下載到本地磁盤(pán)。本次開(kāi)發(fā)使用開(kāi)源爬蟲(chóng)框架Heritrix[9],它是一個(gè)開(kāi)源的Java爬蟲(chóng)框架,它保留了各種各樣的配置接口用于定制和擴(kuò)展爬蟲(chóng)的功能,為了能夠準(zhǔn)確抓取目標(biāo)資源,從官方文檔中了解Heritrix本身運(yùn)行機(jī)制并進(jìn)行配置和定制。

    (4) 分析并抽取網(wǎng)頁(yè)內(nèi)容到本地抓取到的原始網(wǎng)頁(yè)和圖片不能被直接利用,需要將網(wǎng)頁(yè)中的有用數(shù)據(jù)抽取出來(lái)并以一定的格式保存起來(lái),這個(gè)過(guò)程可以稱之為結(jié)構(gòu)化數(shù)據(jù)提取。每一個(gè)有效的HTML文件都對(duì)應(yīng)一個(gè)txt文件,txt文件的內(nèi)容和文件名稱都有固定的結(jié)構(gòu)。本次開(kāi)發(fā)中將文件名規(guī)范為這樣的格式:“手機(jī)名?型號(hào)?時(shí)間字符串.txt”。txt文件的內(nèi)容格式如下:

    原始網(wǎng)頁(yè)URL

    品牌名(如華為)

    價(jià)格

    屬性名1:值1(如操作系統(tǒng):android2.2)…

    ============================

    產(chǎn)品圖片編碼后的文件名

    結(jié)構(gòu)化提取包含3個(gè)過(guò)程:一個(gè)是文件的I/O操作,此操作可以使用Java.io包實(shí)現(xiàn);另一個(gè)是從HTML網(wǎng)頁(yè)中提取數(shù)據(jù),此操作可以使用開(kāi)源解析軟件實(shí)現(xiàn);第三個(gè)過(guò)程是對(duì)圖片進(jìn)行轉(zhuǎn)存處理,這個(gè)過(guò)程的目的是將手機(jī)信息和圖片名稱進(jìn)行映射,新圖片名將原圖片名經(jīng)過(guò)MD5編碼后得到。HTML元素之間是以分層嵌套的結(jié)構(gòu)組織在一起的,HTML文檔的這種結(jié)構(gòu)稱為HTML文檔樹(shù)。本次開(kāi)發(fā)中使用開(kāi)源HTML解析庫(kù)HtmlParser[10],使用這個(gè)庫(kù)可以方便快速地從HTML網(wǎng)頁(yè)中提取標(biāo)簽節(jié)點(diǎn),文本節(jié)點(diǎn)和和屬性節(jié)點(diǎn)的值。同樣,在開(kāi)發(fā)過(guò)程中使用該解析包需要了解其API和調(diào)用機(jī)制,這些內(nèi)容來(lái)源于官方文檔。

    (5) 存入數(shù)據(jù)庫(kù)并建立索引。磁盤(pán)中的數(shù)據(jù)文件是結(jié)構(gòu)化數(shù)據(jù),但是仍然不能直接作為查詢的直接數(shù)據(jù)源,其原因在于磁盤(pán)I/O速度較慢。故而將這些文件的信息存入關(guān)系數(shù)據(jù)庫(kù)中,數(shù)據(jù)庫(kù)表的字段對(duì)應(yīng)文件內(nèi)容結(jié)構(gòu)的字段,每一個(gè)文件的數(shù)據(jù)都對(duì)應(yīng)表的一條記錄。在查詢數(shù)據(jù)庫(kù)時(shí)按照產(chǎn)品的主關(guān)鍵字(如ID號(hào))查詢,查詢效率較高。但是用戶的查詢是若干關(guān)鍵詞,實(shí)際是字符串格式,如果直接將查詢關(guān)鍵詞放入SQL語(yǔ)句中,向數(shù)據(jù)庫(kù)發(fā)送模糊查詢匹配關(guān)鍵詞,那么對(duì)于成千上萬(wàn)的記錄來(lái)說(shuō)效率非常低。所以,并不能直接對(duì)數(shù)據(jù)庫(kù)進(jìn)行查詢關(guān)鍵詞的模糊查詢,而首先將查詢發(fā)送給倒排索引進(jìn)行查詢。

    倒排索引一種面向詞匯的查找結(jié)構(gòu),通常使用哈希表存儲(chǔ),故查詢效率非常高。倒排索引包括兩個(gè)部分:一個(gè)部分是詞典;另一個(gè)部分是倒排列表。建立索引的過(guò)程中,首先要使用分詞程序?qū)κ謾C(jī)信息文本文件分詞建立詞典,每個(gè)詞典項(xiàng)中包含一個(gè)指向?qū)?yīng)倒排列表的指針,倒排列表由若干倒排項(xiàng)組成,倒排項(xiàng)存儲(chǔ)的是包含該詞匯的文檔屬性(文檔ID,詞頻,單詞在該文檔中出現(xiàn)的位置)。

    用戶的查詢首先由同樣的分詞程序切割為若干詞匯,然后查詢?cè)~典找出對(duì)應(yīng)倒排列表,按照某種規(guī)則對(duì)倒排列表進(jìn)行合并,然后將最后的文檔列表ID發(fā)送給數(shù)據(jù)庫(kù)查詢整個(gè)文檔信息,進(jìn)而將數(shù)據(jù)庫(kù)的返回結(jié)果展示給用戶。綜上,用戶的查詢處理過(guò)程為:“查詢索引”→“獲取每個(gè)相關(guān)文檔的數(shù)據(jù)庫(kù)ID”→“查詢數(shù)據(jù)庫(kù)”→“返回給用戶”。這種查詢機(jī)制決定了必須先將手機(jī)信息存儲(chǔ)在數(shù)據(jù)庫(kù),然后建立索引,構(gòu)建索引和執(zhí)行查詢的機(jī)理如圖2所示。

    本次開(kāi)發(fā)中使用MySQL數(shù)據(jù)庫(kù)存儲(chǔ)數(shù)據(jù),使用開(kāi)源Java全文檢索工具包Lucene建立索引[11],使用基于詞庫(kù)的字符串匹配分詞模式,以正向最大匹配為分詞算法,配合極易中文分詞組件進(jìn)行分詞?;谠~庫(kù)的分詞原理是使用正向最大匹配算法掃描待分詞文本,將掃描出的詞匯與詞庫(kù)中的詞進(jìn)行比對(duì),按照一定的匹配粒度去判別該詞匯是否被切分出來(lái)加入索引中,所以分詞前必須在原有詞庫(kù)基礎(chǔ)上增加主題相關(guān)的詞匯作為詞庫(kù)的一部分,開(kāi)發(fā)中首先解析所有txt文件名,將所有手機(jī)名稱和不同的型號(hào)解析出來(lái)作為詞匯單獨(dú)存儲(chǔ)在一個(gè)文本文件中,通過(guò)簡(jiǎn)單的配置即可將文件的詞匯加入到極易分詞的詞庫(kù)中,選用極易分詞組件的另一個(gè)原因是它實(shí)現(xiàn)了Lucene標(biāo)準(zhǔn)分詞解析器的接口,從而可以直接整合進(jìn)Lucene[12]。對(duì)于查詢字符串必須使用同樣的分詞程序去分詞,以同樣的規(guī)則切分出待查詢?cè)~匯,在索引的詞典中查詢是否存在該詞匯,如果存在則返回該詞匯對(duì)應(yīng)的倒排列表,否則返回空,對(duì)于多詞匯查找的處理是根據(jù)邏輯運(yùn)算對(duì)倒排列表進(jìn)行合并后再返回。倒排列表中的文檔排序模型是經(jīng)典的向量空間模型,該模型以文檔的TF*IDF值為向量的特征,實(shí)際參數(shù)可以在Lucene中按需設(shè)置。

    圖2 索引與查詢機(jī)理圖

    2.2 提供查詢服務(wù)層實(shí)現(xiàn)

    提供查詢服務(wù)作為一個(gè)中間層,在整個(gè)搜索引擎中起著非常重要的連接作用,它接收用戶的查詢字符串并預(yù)處理,然后在索引和數(shù)據(jù)庫(kù)中查詢相關(guān)文檔并返回給用戶。

    通過(guò)圖2可知搜索模塊和分詞模塊一起提供查詢服務(wù),實(shí)驗(yàn)中分詞模塊與建立索引所用分詞的模塊有相同的配置,而搜索模塊承擔(dān)查詢索引和數(shù)據(jù)庫(kù)的任務(wù),由Lucene提供的搜索模塊實(shí)現(xiàn),開(kāi)發(fā)中這2個(gè)任務(wù)分別由2個(gè)方法實(shí)現(xiàn),它們是查詢服務(wù)類中的2個(gè)方法,查詢索引方法的參數(shù)是查詢關(guān)鍵詞對(duì)象,返回的是相關(guān)文檔列表對(duì)象,查詢數(shù)據(jù)庫(kù)方法的參數(shù)是整型的文檔ID,返回文檔對(duì)象,如圖3所示。

    2.3 前臺(tái)交互層實(shí)現(xiàn)

    前臺(tái)交互是直接面向用戶的應(yīng)用層,為了增加用戶在輸入和輸出上的體驗(yàn),分別實(shí)現(xiàn)2種功能:一是用戶每次敲擊按鍵時(shí)都會(huì)提示關(guān)鍵詞列表;二是結(jié)果列表頁(yè)面上直接展示主要結(jié)果,包括圖片和其他重要屬性。開(kāi)發(fā)中,列表提示的數(shù)據(jù)來(lái)源于已經(jīng)抽取得到的手機(jī)相關(guān)詞匯,將這些詞匯存入MySQL數(shù)據(jù)庫(kù)的一張表里,針對(duì)該表設(shè)計(jì)一個(gè)查詢方法,參數(shù)是用戶按鍵后提交的當(dāng)前字符串,實(shí)現(xiàn)機(jī)理是向該表發(fā)送模糊查詢,返回字符串?dāng)?shù)組(一般規(guī)定提示字符串個(gè)數(shù)不超過(guò)10)。

    圖3 前臺(tái)交互層與提供查詢服務(wù)層交互

    該方法的調(diào)用是通過(guò)用戶觸發(fā)onkeyup事件,隨即以Ajax機(jī)制向服務(wù)器發(fā)送字符串并完成調(diào)用,前端通過(guò)Ajax代碼接收返回的字符串?dāng)?shù)組作為顯示數(shù)據(jù),使用JavaScript改變dom的方式將這些字符串以列表的方式顯示在輸入框的下面。當(dāng)點(diǎn)擊搜索按鈕后,開(kāi)始向服務(wù)器發(fā)送查詢,前臺(tái)交互層與中間層的交互如圖3所示,它們的交互通過(guò)Ajax框架DWR來(lái)完成,這樣有效降低延時(shí),能夠明顯提高用戶體驗(yàn)。用戶查詢的關(guān)鍵字(query)以及每頁(yè)的起始索引號(hào)(startindex)封裝在Request對(duì)象中,直接通過(guò)Ajax發(fā)送給查詢服務(wù)層的SearchServiceImpl對(duì)象的getSearchResults方法,該方法返回的SearchResults對(duì)象包含了相關(guān)文檔ID的列表,然后將文檔的ID作為參數(shù)發(fā)送給getSearchResultById方法查詢數(shù)據(jù)庫(kù),返回文檔全部信息并封裝在SearchResult對(duì)象中,最后將SearchResult對(duì)象返回到前臺(tái)展示給用戶。

    3 結(jié) 論

    實(shí)驗(yàn)中多次查詢的平均時(shí)間在毫秒級(jí),完成了整個(gè)Web垂直搜索引擎的設(shè)計(jì)目標(biāo)。驗(yàn)證了這種實(shí)現(xiàn)過(guò)程的完整性和有效性。提出的三層架構(gòu)面向的是構(gòu)建主題相關(guān)的Web垂直搜索引擎,通過(guò)實(shí)現(xiàn)查詢手機(jī)信息的Web垂直搜索引擎來(lái)提供一種可操作的實(shí)施方案,為成功構(gòu)建其他面向其他主題的Web垂直搜索引擎提供理論依據(jù)和技術(shù)參照。整個(gè)實(shí)現(xiàn)過(guò)程利用了Java平臺(tái)下的優(yōu)秀開(kāi)源軟件包,包含了可定制爬蟲(chóng)Heritrix、網(wǎng)頁(yè)解析庫(kù)HTMLParser、索引及查詢工具包Lucene、Ajax框架DWR、Bean容器Spring以及MySQL數(shù)據(jù)庫(kù),這些開(kāi)源軟件為搜索引擎的實(shí)現(xiàn)提供了強(qiáng)大的支持,對(duì)于這些軟件的具體使用方法和過(guò)程本文沒(méi)有詳細(xì)贅述,而重點(diǎn)討論了構(gòu)建搜索引擎的實(shí)現(xiàn)過(guò)程、技術(shù)要點(diǎn)和方法。

    由于垂直搜索引擎索引數(shù)據(jù)本身就是面向主題的,所以檢索結(jié)果的主題相關(guān)度、正確率必然比通用搜索引擎高,而且展示數(shù)據(jù)的能力更強(qiáng)??v觀現(xiàn)有的研究成果,作者認(rèn)為未來(lái)Web垂直搜索引擎主要的研究方向有以下幾個(gè)方面:

    (1) 結(jié)構(gòu)化數(shù)據(jù)提取自動(dòng)化。爬蟲(chóng)應(yīng)該能夠自動(dòng)發(fā)現(xiàn)、發(fā)掘Web上主題相關(guān)的來(lái)源網(wǎng)站,并能夠自動(dòng)對(duì)網(wǎng)站內(nèi)容評(píng)級(jí),能夠?qū)崟r(shí)監(jiān)控Web主題網(wǎng)站的頁(yè)面變化并更新本地的頁(yè)面,通過(guò)自動(dòng)化的爬蟲(chóng)的監(jiān)控、爬取、抽取與更新操作增強(qiáng)搜索引擎的靈活性。

    (2) 用戶個(gè)性化。個(gè)性化搜索引擎盡管理論上已經(jīng)得到發(fā)展,但是從理論到實(shí)際應(yīng)用還需要繼續(xù)研究,搜索引擎應(yīng)該能夠自動(dòng)識(shí)別用戶種類、意圖,對(duì)用戶的需求進(jìn)行精確預(yù)測(cè),并對(duì)歧義進(jìn)行自動(dòng)矯正,重點(diǎn)在推薦系統(tǒng)、相關(guān)反饋方面進(jìn)行完善。

    (3) 數(shù)據(jù)可靠性。由于垂直搜索引擎的返回結(jié)果大多是領(lǐng)域相關(guān)的內(nèi)容,返回給用戶的結(jié)果應(yīng)該對(duì)用戶負(fù)責(zé),在醫(yī)療、問(wèn)答、新聞、學(xué)術(shù)等領(lǐng)域的返回結(jié)果應(yīng)保證數(shù)據(jù)來(lái)源的準(zhǔn)確性,對(duì)排名靠前的結(jié)果應(yīng)特別進(jìn)行自動(dòng)的審核,保證信息的可靠性。

    本文通訊作者為田玉玲。

    參考文獻(xiàn)

    [1] 劉天嬌,周瑛.淺析近年來(lái)網(wǎng)絡(luò)搜索引擎研究現(xiàn)狀:以2001至2010年為例[J].情報(bào)科學(xué),2012(8):1192?1195.

    [2] 王文鈞,李巍.垂直搜索引擎的現(xiàn)狀與發(fā)展探究[J].情報(bào)科學(xué),2010(3):477?480.

    [3] 王斌.從信息檢索到搜索引擎[J].產(chǎn)品安全與召回,2009(4):38?43.

    [4] BRIN S, PAGE L. The anatomy of a large?scale hypertextual Web search engine [J]. Computer networks and isdn systems, 1998, 30: 107?117.

    [5] CHAKRABARTIA Soumen, VAN DEN BERGB Martin, DOMC Byron. Focused crawling: A new approach to topic?specific Web resource discovery [J]. Computer networks, 1999, 31: 1623?1640.

    [6] ALMPANIDIS G, KOTROPOULOS C, PITAS I. Combining text and link analysis for focused crawling: An application for vertical search engines [J]. Information systems, 2007, 32(6): 886?908.

    [7] CAMBAZOGLU Barla, KARACA Evren, KUCUKYILMAZ Tayfun, et al. Architecture of a grid?enabled Web search engine [J]. Information processing & management, 2007, 43(3): 609?623.

    [8] LIU Tie?yan. Learning to rank for information retrieval [J]. Foundations and trends in information retrieval, 2009, 3: 225?331.

    [9] 白萬(wàn)民,蘇希樂(lè).Heritrix在垂直搜索引擎中的應(yīng)用[J].計(jì)算機(jī)時(shí)代,2011(9):7?9.

    [10] 桂林斌.基于HtmlParser抽取動(dòng)態(tài)異構(gòu)Web信息的研究與實(shí)現(xiàn)[J].計(jì)算機(jī)與數(shù)字工程,2009,37(7):161?164.

    [11] 張俊,李魯群,周熔.基于Lucene的搜索引擎的研究與應(yīng)用[J].計(jì)算機(jī)技術(shù)與發(fā)展,2013,23(6):230?232.

    [12] 黃翼彪.實(shí)現(xiàn)Lucene接口的中文分詞器的比較研究[J].科技信息,2012(12):246?247.

    猜你喜歡
    爬蟲(chóng)
    利用網(wǎng)絡(luò)爬蟲(chóng)技術(shù)驗(yàn)證房地產(chǎn)灰犀牛之說(shuō)
    基于Python的網(wǎng)絡(luò)爬蟲(chóng)和反爬蟲(chóng)技術(shù)研究
    善用網(wǎng)絡(luò)爬蟲(chóng)
    基于Django 的分布式爬蟲(chóng)框架設(shè)計(jì)與實(shí)現(xiàn)*
    目前互聯(lián)網(wǎng)中的網(wǎng)絡(luò)爬蟲(chóng)的原理和影響
    網(wǎng)絡(luò)爬蟲(chóng)技術(shù)原理
    誰(shuí)搶走了低價(jià)機(jī)票
    利用爬蟲(chóng)技術(shù)的Geo-Gnutel la VANET流量采集
    大數(shù)據(jù)背景下校園輿情的爬蟲(chóng)應(yīng)用研究
    電子制作(2018年2期)2018-04-18 07:13:42
    大數(shù)據(jù)環(huán)境下基于python的網(wǎng)絡(luò)爬蟲(chóng)技術(shù)
    電子制作(2017年9期)2017-04-17 03:00:46
    成人三级做爰电影| 亚洲av五月六月丁香网| 一级作爱视频免费观看| 黄色片一级片一级黄色片| 亚洲一区高清亚洲精品| 脱女人内裤的视频| 99国产精品一区二区三区| 久久国产精品影院| 亚洲人成网站在线播放欧美日韩| 丝袜美足系列| 国产精品98久久久久久宅男小说| 一边摸一边抽搐一进一出视频| 精品国产亚洲在线| 婷婷精品国产亚洲av在线| 黄色女人牲交| 免费观看人在逋| 又大又爽又粗| 热99re8久久精品国产| 最新在线观看一区二区三区| 手机成人av网站| 亚洲欧美精品综合一区二区三区| 老司机靠b影院| 国产av在哪里看| 999久久久国产精品视频| 最好的美女福利视频网| 欧美一区二区精品小视频在线| 午夜免费激情av| 亚洲专区字幕在线| 久久香蕉激情| 女同久久另类99精品国产91| 久久影院123| 久久99一区二区三区| 欧美黑人精品巨大| 久久精品91蜜桃| 国产成人精品无人区| 咕卡用的链子| av超薄肉色丝袜交足视频| 一区福利在线观看| 人人妻,人人澡人人爽秒播| 中文字幕最新亚洲高清| 日本vs欧美在线观看视频| 丰满人妻熟妇乱又伦精品不卡| 国产精品一区二区免费欧美| 亚洲国产中文字幕在线视频| 大型av网站在线播放| 老司机在亚洲福利影院| bbb黄色大片| 国产国语露脸激情在线看| 精品久久蜜臀av无| 亚洲一区二区三区欧美精品| av网站免费在线观看视频| 亚洲性夜色夜夜综合| 国产高清激情床上av| 国产三级黄色录像| 久久精品91无色码中文字幕| 亚洲国产精品一区二区三区在线| 日本 av在线| 黄色成人免费大全| 免费一级毛片在线播放高清视频 | 精品第一国产精品| 操美女的视频在线观看| 欧美日韩福利视频一区二区| 亚洲七黄色美女视频| 午夜福利免费观看在线| 99在线人妻在线中文字幕| 一级a爱视频在线免费观看| 青草久久国产| 欧美日韩一级在线毛片| 国产区一区二久久| 亚洲男人的天堂狠狠| 日本三级黄在线观看| 可以免费在线观看a视频的电影网站| 一边摸一边抽搐一进一小说| 国产精品偷伦视频观看了| 国产精品 国内视频| 真人一进一出gif抽搐免费| 成年人黄色毛片网站| 国产成人一区二区三区免费视频网站| 久久久久久久久久久久大奶| 欧美精品一区二区免费开放| 亚洲狠狠婷婷综合久久图片| 夜夜爽天天搞| 日本免费a在线| 老司机靠b影院| 日韩国内少妇激情av| 中文字幕精品免费在线观看视频| 欧美精品啪啪一区二区三区| 日日摸夜夜添夜夜添小说| 中文字幕高清在线视频| 一级片'在线观看视频| 久久久久精品国产欧美久久久| 亚洲一码二码三码区别大吗| 精品国产乱子伦一区二区三区| 精品日产1卡2卡| 男人操女人黄网站| 黄色视频,在线免费观看| 日韩成人在线观看一区二区三区| 亚洲精品中文字幕在线视频| 亚洲午夜精品一区,二区,三区| 欧美 亚洲 国产 日韩一| √禁漫天堂资源中文www| 法律面前人人平等表现在哪些方面| 午夜精品久久久久久毛片777| 香蕉国产在线看| 亚洲aⅴ乱码一区二区在线播放 | a级毛片在线看网站| 一级作爱视频免费观看| 我的亚洲天堂| 国产成人欧美| 亚洲少妇的诱惑av| 女生性感内裤真人,穿戴方法视频| 黄色视频不卡| 伊人久久大香线蕉亚洲五| 一进一出好大好爽视频| 亚洲成a人片在线一区二区| 亚洲激情在线av| 成人18禁在线播放| 久久久久久久精品吃奶| 亚洲欧美激情在线| 中文欧美无线码| 免费av毛片视频| 十八禁网站免费在线| 18禁黄网站禁片午夜丰满| 男女之事视频高清在线观看| 在线视频色国产色| 在线观看www视频免费| 热re99久久国产66热| 少妇的丰满在线观看| 欧美另类亚洲清纯唯美| 亚洲精品粉嫩美女一区| 午夜成年电影在线免费观看| 免费看a级黄色片| 女人精品久久久久毛片| 91字幕亚洲| 激情视频va一区二区三区| 久久午夜综合久久蜜桃| 成年女人毛片免费观看观看9| 香蕉丝袜av| 国产在线观看jvid| 日韩国内少妇激情av| 久久 成人 亚洲| av国产精品久久久久影院| 精品第一国产精品| 国产人伦9x9x在线观看| 亚洲一区二区三区欧美精品| 女性生殖器流出的白浆| 久久精品国产清高在天天线| 国产不卡一卡二| 国产av在哪里看| 不卡av一区二区三区| 欧美大码av| 国产亚洲精品久久久久5区| 精品国内亚洲2022精品成人| 操出白浆在线播放| 亚洲欧美精品综合久久99| 国产精品电影一区二区三区| 又黄又粗又硬又大视频| 午夜日韩欧美国产| 九色亚洲精品在线播放| 婷婷精品国产亚洲av在线| 欧美黑人欧美精品刺激| 99在线人妻在线中文字幕| 俄罗斯特黄特色一大片| 免费搜索国产男女视频| 欧美在线一区亚洲| 中亚洲国语对白在线视频| 午夜亚洲福利在线播放| 精品久久久久久久毛片微露脸| 视频区欧美日本亚洲| 日韩欧美三级三区| 女生性感内裤真人,穿戴方法视频| 琪琪午夜伦伦电影理论片6080| 精品久久久久久,| 丰满饥渴人妻一区二区三| 国产亚洲精品久久久久久毛片| 女性被躁到高潮视频| 美女福利国产在线| 老司机午夜十八禁免费视频| 国产黄色免费在线视频| 午夜免费激情av| 夜夜夜夜夜久久久久| 免费久久久久久久精品成人欧美视频| 在线观看免费高清a一片| 亚洲欧美一区二区三区久久| 天堂俺去俺来也www色官网| 一级a爱片免费观看的视频| 成人免费观看视频高清| 一级,二级,三级黄色视频| 国产亚洲欧美在线一区二区| 91字幕亚洲| av天堂在线播放| 一级a爱片免费观看的视频| 免费av毛片视频| 亚洲视频免费观看视频| 最近最新中文字幕大全免费视频| 操出白浆在线播放| 一个人免费在线观看的高清视频| videosex国产| 婷婷六月久久综合丁香| 久久精品影院6| 在线观看免费视频网站a站| 国产xxxxx性猛交| 女性被躁到高潮视频| 日韩国内少妇激情av| 一区二区三区国产精品乱码| 两人在一起打扑克的视频| 亚洲精品中文字幕一二三四区| 久久天躁狠狠躁夜夜2o2o| 99国产综合亚洲精品| 久久性视频一级片| 看黄色毛片网站| 日韩成人在线观看一区二区三区| 国产野战对白在线观看| 99精国产麻豆久久婷婷| 亚洲国产中文字幕在线视频| 中文字幕精品免费在线观看视频| 在线观看舔阴道视频| 亚洲在线自拍视频| 老汉色∧v一级毛片| 满18在线观看网站| 欧美成人免费av一区二区三区| 国内久久婷婷六月综合欲色啪| 50天的宝宝边吃奶边哭怎么回事| 女人高潮潮喷娇喘18禁视频| 中国美女看黄片| 成人影院久久| 无遮挡黄片免费观看| 欧美在线一区亚洲| 最近最新中文字幕大全电影3 | 亚洲成人久久性| 午夜福利在线免费观看网站| 成人亚洲精品av一区二区 | 一二三四社区在线视频社区8| www.www免费av| 久久影院123| 免费在线观看影片大全网站| 精品福利永久在线观看| 脱女人内裤的视频| 国产野战对白在线观看| 日韩有码中文字幕| 精品福利观看| 成人亚洲精品一区在线观看| 久久人妻av系列| 老熟妇仑乱视频hdxx| 天堂√8在线中文| 亚洲国产欧美一区二区综合| 99久久综合精品五月天人人| 少妇粗大呻吟视频| 日本a在线网址| 天堂影院成人在线观看| 亚洲成人久久性| av超薄肉色丝袜交足视频| 免费观看精品视频网站| 日本欧美视频一区| 高清黄色对白视频在线免费看| 亚洲国产中文字幕在线视频| 国产精品影院久久| 香蕉国产在线看| 国产亚洲精品一区二区www| 男女下面进入的视频免费午夜 | av中文乱码字幕在线| а√天堂www在线а√下载| 中文字幕最新亚洲高清| 搡老岳熟女国产| 久久久久国内视频| 精品国产国语对白av| 亚洲久久久国产精品| 日本撒尿小便嘘嘘汇集6| 美女国产高潮福利片在线看| 国产有黄有色有爽视频| 国产在线精品亚洲第一网站| 亚洲少妇的诱惑av| 后天国语完整版免费观看| 午夜91福利影院| 婷婷六月久久综合丁香| 97超级碰碰碰精品色视频在线观看| 精品一区二区三区视频在线观看免费 | 麻豆久久精品国产亚洲av | aaaaa片日本免费| a级毛片黄视频| 88av欧美| www.熟女人妻精品国产| 搡老岳熟女国产| 午夜精品在线福利| www日本在线高清视频| 亚洲中文av在线| 欧美日韩视频精品一区| 国产成人精品久久二区二区免费| 无遮挡黄片免费观看| 大陆偷拍与自拍| 亚洲欧美精品综合久久99| 色哟哟哟哟哟哟| 香蕉丝袜av| 成人18禁高潮啪啪吃奶动态图| 久久久久亚洲av毛片大全| 午夜福利在线观看吧| 色播在线永久视频| 日韩三级视频一区二区三区| 亚洲男人的天堂狠狠| ponron亚洲| 国产精品成人在线| 又黄又粗又硬又大视频| 19禁男女啪啪无遮挡网站| xxx96com| 欧美+亚洲+日韩+国产| 一二三四社区在线视频社区8| 国产精品成人在线| 怎么达到女性高潮| 国产亚洲欧美精品永久| 最近最新中文字幕大全电影3 | 亚洲成人免费av在线播放| av在线天堂中文字幕 | 成人国语在线视频| 国产区一区二久久| 国产1区2区3区精品| 国产99白浆流出| 亚洲av美国av| 国产成人影院久久av| 国产日韩一区二区三区精品不卡| 日本黄色视频三级网站网址| 国产91精品成人一区二区三区| 午夜免费激情av| 50天的宝宝边吃奶边哭怎么回事| 12—13女人毛片做爰片一| 80岁老熟妇乱子伦牲交| 亚洲av熟女| 免费av中文字幕在线| 亚洲人成网站在线播放欧美日韩| 免费在线观看完整版高清| 国产色视频综合| 看片在线看免费视频| 少妇粗大呻吟视频| 亚洲熟妇熟女久久| 99精品久久久久人妻精品| 在线播放国产精品三级| 一边摸一边做爽爽视频免费| 日本欧美视频一区| 18禁美女被吸乳视频| 可以免费在线观看a视频的电影网站| 高清欧美精品videossex| 亚洲自拍偷在线| 欧美激情高清一区二区三区| 国产精品秋霞免费鲁丝片| 亚洲av成人一区二区三| 免费在线观看影片大全网站| 免费高清在线观看日韩| 别揉我奶头~嗯~啊~动态视频| 99精品在免费线老司机午夜| 大型黄色视频在线免费观看| 日韩高清综合在线| 欧美激情久久久久久爽电影 | 中文字幕人妻丝袜一区二区| 99热国产这里只有精品6| 日韩中文字幕欧美一区二区| а√天堂www在线а√下载| 看片在线看免费视频| 一区二区日韩欧美中文字幕| 久久精品国产99精品国产亚洲性色 | 亚洲人成电影观看| 色老头精品视频在线观看| 五月开心婷婷网| 国产高清国产精品国产三级| 国产高清激情床上av| 精品久久久久久电影网| 亚洲成人免费电影在线观看| 亚洲七黄色美女视频| 99精品在免费线老司机午夜| 成人国产一区最新在线观看| 天堂√8在线中文| tocl精华| 黄色毛片三级朝国网站| 久久欧美精品欧美久久欧美| 国产有黄有色有爽视频| 一级片'在线观看视频| 侵犯人妻中文字幕一二三四区| 男女床上黄色一级片免费看| 国产成人av教育| 女人爽到高潮嗷嗷叫在线视频| 国产不卡一卡二| 又大又爽又粗| 日日夜夜操网爽| 国产野战对白在线观看| 人成视频在线观看免费观看| 在线播放国产精品三级| 亚洲成人久久性| cao死你这个sao货| 精品久久久精品久久久| 国产三级黄色录像| xxx96com| 午夜福利一区二区在线看| 国产精品亚洲av一区麻豆| 大型黄色视频在线免费观看| 一区二区三区精品91| 精品福利观看| 国产精品久久久久久人妻精品电影| 水蜜桃什么品种好| 精品福利永久在线观看| 老司机深夜福利视频在线观看| 一个人免费在线观看的高清视频| 一级毛片高清免费大全| 十八禁网站免费在线| 国产高清国产精品国产三级| 国产免费av片在线观看野外av| 一级作爱视频免费观看| 女同久久另类99精品国产91| 亚洲五月天丁香| 一区二区三区国产精品乱码| 纯流量卡能插随身wifi吗| 天堂动漫精品| 久久九九热精品免费| 免费日韩欧美在线观看| 欧美日韩亚洲综合一区二区三区_| 精品国内亚洲2022精品成人| 人人妻,人人澡人人爽秒播| 动漫黄色视频在线观看| 老熟妇仑乱视频hdxx| 国产精品日韩av在线免费观看 | 五月开心婷婷网| 97超级碰碰碰精品色视频在线观看| 国产精品98久久久久久宅男小说| 午夜福利免费观看在线| 伦理电影免费视频| 精品国产亚洲在线| 国产午夜精品久久久久久| 日韩一卡2卡3卡4卡2021年| 欧美精品啪啪一区二区三区| 1024香蕉在线观看| 这个男人来自地球电影免费观看| 搡老乐熟女国产| 午夜精品国产一区二区电影| 在线观看午夜福利视频| xxxhd国产人妻xxx| 每晚都被弄得嗷嗷叫到高潮| 90打野战视频偷拍视频| 一区二区三区国产精品乱码| 美女高潮到喷水免费观看| 大码成人一级视频| 国产精品国产av在线观看| 精品第一国产精品| 91成年电影在线观看| 亚洲自偷自拍图片 自拍| 69av精品久久久久久| 在线观看免费视频日本深夜| 在线观看免费午夜福利视频| 亚洲国产精品sss在线观看 | 自线自在国产av| 日本vs欧美在线观看视频| 在线观看一区二区三区激情| 国产高清videossex| 免费在线观看完整版高清| 精品久久久久久久毛片微露脸| 精品一区二区三卡| 欧美黄色淫秽网站| 久久国产精品男人的天堂亚洲| 精品久久蜜臀av无| 午夜福利欧美成人| 美女 人体艺术 gogo| 涩涩av久久男人的天堂| av片东京热男人的天堂| 波多野结衣高清无吗| 在线观看免费午夜福利视频| 亚洲专区字幕在线| 亚洲中文av在线| 久久 成人 亚洲| av有码第一页| 可以在线观看毛片的网站| 亚洲,欧美精品.| 丰满人妻熟妇乱又伦精品不卡| 天天躁夜夜躁狠狠躁躁| 在线观看日韩欧美| 韩国精品一区二区三区| 婷婷丁香在线五月| 日韩精品免费视频一区二区三区| 在线观看免费午夜福利视频| 亚洲国产毛片av蜜桃av| 成人三级做爰电影| 两个人免费观看高清视频| 欧美中文日本在线观看视频| 亚洲自拍偷在线| 成年女人毛片免费观看观看9| av天堂在线播放| 免费久久久久久久精品成人欧美视频| 黄色女人牲交| 精品第一国产精品| 久久久国产精品麻豆| 亚洲国产欧美网| 99精国产麻豆久久婷婷| 日日摸夜夜添夜夜添小说| 午夜亚洲福利在线播放| 日韩精品中文字幕看吧| 亚洲黑人精品在线| 国产一区二区三区视频了| 久久久国产成人免费| 亚洲全国av大片| 热99re8久久精品国产| 日本黄色视频三级网站网址| 亚洲人成电影观看| 亚洲精品中文字幕在线视频| 日韩有码中文字幕| 女人高潮潮喷娇喘18禁视频| 久久久国产成人精品二区 | 欧美丝袜亚洲另类 | 人妻久久中文字幕网| 国产三级在线视频| 精品久久蜜臀av无| av欧美777| 人妻久久中文字幕网| 男人舔女人下体高潮全视频| www国产在线视频色| 亚洲第一av免费看| 亚洲男人的天堂狠狠| 国产免费av片在线观看野外av| 最新美女视频免费是黄的| 丁香欧美五月| 精品一区二区三区av网在线观看| 亚洲熟妇熟女久久| 丝袜美足系列| 午夜福利在线观看吧| 动漫黄色视频在线观看| 夜夜夜夜夜久久久久| 国产一区在线观看成人免费| 欧洲精品卡2卡3卡4卡5卡区| 日本黄色日本黄色录像| 久久久久久久久中文| 免费人成视频x8x8入口观看| 亚洲成人免费电影在线观看| 中文字幕人妻熟女乱码| 国产又爽黄色视频| 亚洲欧洲精品一区二区精品久久久| 91成年电影在线观看| 无限看片的www在线观看| 国产精华一区二区三区| 久久久国产欧美日韩av| av天堂久久9| 亚洲狠狠婷婷综合久久图片| 国产亚洲av高清不卡| 免费不卡黄色视频| 一进一出好大好爽视频| 精品高清国产在线一区| 久久久久久久久久久久大奶| 国产欧美日韩一区二区三区在线| 狂野欧美激情性xxxx| 亚洲av美国av| 亚洲va日本ⅴa欧美va伊人久久| 成人黄色视频免费在线看| 国产xxxxx性猛交| 免费观看精品视频网站| cao死你这个sao货| 亚洲国产欧美日韩在线播放| 精品久久久久久成人av| 午夜福利免费观看在线| 成人永久免费在线观看视频| 欧美成狂野欧美在线观看| 亚洲一区二区三区色噜噜 | 无人区码免费观看不卡| 一本综合久久免费| 咕卡用的链子| 国产欧美日韩精品亚洲av| 一级片'在线观看视频| 女人高潮潮喷娇喘18禁视频| 久久久国产成人免费| 国产精品免费视频内射| 久久久久国内视频| 9热在线视频观看99| 久久中文字幕人妻熟女| 亚洲中文日韩欧美视频| 在线免费观看的www视频| 午夜久久久在线观看| 亚洲成人免费av在线播放| 精品无人区乱码1区二区| 亚洲三区欧美一区| а√天堂www在线а√下载| 精品卡一卡二卡四卡免费| 久久精品影院6| 精品第一国产精品| 88av欧美| 人人妻人人澡人人看| 成人国产一区最新在线观看| 国产精品美女特级片免费视频播放器 | 99精品欧美一区二区三区四区| 一级片'在线观看视频| 亚洲国产精品999在线| 精品久久久久久电影网| 水蜜桃什么品种好| 麻豆av在线久日| 精品福利观看| 18禁美女被吸乳视频| 在线十欧美十亚洲十日本专区| 久久中文字幕人妻熟女| 欧美日韩国产mv在线观看视频| 中文字幕人妻丝袜一区二区| 三级毛片av免费| 老司机在亚洲福利影院| 日本a在线网址| 国产成人av激情在线播放| 女人高潮潮喷娇喘18禁视频| 国产欧美日韩一区二区精品| 999久久久国产精品视频| 欧美日韩福利视频一区二区| 国产精品免费视频内射| 在线看a的网站| 无限看片的www在线观看| 日本免费a在线| 高清欧美精品videossex| 亚洲精品一二三| 国产高清videossex| 久热爱精品视频在线9| 国产成人精品无人区| 超碰成人久久| 精品国产乱码久久久久久男人| 美女福利国产在线| 国产黄a三级三级三级人| 成人影院久久| 久热这里只有精品99| 欧美成人免费av一区二区三区|