• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于雙層PDF和Lucene技術(shù)的全文檢索研究與實(shí)現(xiàn)

    2014-08-18 12:20:22向禹吳世明
    現(xiàn)代情報(bào) 2014年6期
    關(guān)鍵詞:全文檢索檔案管理

    向禹+吳世明

    〔摘要〕通過建設(shè)雙層PDF全文數(shù)據(jù)庫、創(chuàng)建索引和全文檢索等實(shí)現(xiàn)過程來闡述相關(guān)技術(shù)的研究和運(yùn)用。以建設(shè)全文數(shù)據(jù)庫為基礎(chǔ),研究結(jié)構(gòu)化信息與非結(jié)構(gòu)化數(shù)據(jù)的合并管理,對(duì)目錄數(shù)據(jù)和全文數(shù)據(jù)的同步索引,基于Lucene技術(shù),實(shí)現(xiàn)檔案管理系統(tǒng)的一站式智能化檔案全文檢索,提升檔案查全率。

    〔關(guān)鍵詞〕雙層PDF;全文檢索;檔案管理;Lucene

    〔中圖分類號(hào)〕TP391〔文獻(xiàn)標(biāo)識(shí)碼〕B〔文章編號(hào)〕1008-0821(2014)06-0075-04

    由于檔案的憑證性、惟一性和不可替代性,導(dǎo)致用戶和檔案行業(yè)更注重查全率。傳統(tǒng)的檔案管理手段,由于對(duì)標(biāo)引和著錄標(biāo)準(zhǔn)的理解、執(zhí)行和操作、人員責(zé)任心等方面的差異,導(dǎo)致著錄信息和檢索效果不盡人意?;贚ucene技術(shù),依托雙層PDF文檔,對(duì)結(jié)構(gòu)化和非結(jié)構(gòu)化信息合并管理,在檔案管理系統(tǒng)中實(shí)現(xiàn)一站式全文檢索,具有很重要的現(xiàn)實(shí)意義。

    1檔案檢索研究現(xiàn)狀

    傳統(tǒng)檔案檢索,主要是對(duì)檔案信息著錄和標(biāo)引進(jìn)行研究,編制檢索目錄和目錄檢索系統(tǒng),常見的檢索工具有主題、分類、字序、文號(hào)等多種方式,檢索系統(tǒng)有簡單檢索、復(fù)合邏輯組配表達(dá)式檢索等。著錄和標(biāo)引質(zhì)量提高,檢索工具完備均能提高查全率,但存在缺陷,且效率較低。要實(shí)現(xiàn)高查全率,必須研究在檔案文檔中實(shí)現(xiàn)內(nèi)容檢索。

    Lucene是一個(gè)非常優(yōu)秀的全文本型檢索框架[1],在文本型的全文檢索方面得到廣泛的支持和運(yùn)用;然而,對(duì)紙質(zhì)檔案進(jìn)行數(shù)字化掃描加工,最好的存儲(chǔ)方式仍為圖片格式的非文本型文檔,要實(shí)現(xiàn)全文檢索并非易事;基于圖像的檢索技術(shù)的研究也還不成熟,效果并不理想。

    2全文檢索思想與技術(shù)

    檔案資源數(shù)據(jù)有多種類型:一是結(jié)構(gòu)化數(shù)據(jù),有固定格式和長度,如數(shù)據(jù)庫或者元數(shù)據(jù),數(shù)據(jù)表格等;二是非結(jié)構(gòu)化數(shù)據(jù),特點(diǎn)是不定長和無固定格式,如Word、PDF、JPG等文檔;三是半結(jié)構(gòu)化數(shù)據(jù),如XML、HTML等,這類數(shù)據(jù)比較靈活,可根據(jù)需要按結(jié)構(gòu)化處理,也可按非結(jié)構(gòu)化處理,在使用Web Service方式的系統(tǒng)集成對(duì)接時(shí),協(xié)議中采用的數(shù)據(jù)傳輸格式大多為XML。對(duì)于結(jié)構(gòu)化的語句,采用SQL語句很容易實(shí)現(xiàn)檢索。非結(jié)構(gòu)化的數(shù)據(jù),通常稱作全文數(shù)據(jù),檢索方式有兩種[2]:一種是順序掃描法,對(duì)每一個(gè)文檔都從頭至尾進(jìn)行掃描,搜索出包含檢索詞的文檔,如Windows系統(tǒng)中的查找功能,但這種方式,搜索效率低,速度慢;另一種方式便是我們要重點(diǎn)討論的全文檢索。

    2.1全文檢索思想

    由于結(jié)構(gòu)化的數(shù)據(jù)格式是有規(guī)律的,用算法容易實(shí)現(xiàn)很高的檢索效率。全文檢索的基本思想便是:把全文數(shù)據(jù)中信息提取出來,重新進(jìn)行組織成索引,使其結(jié)構(gòu)化規(guī)律化,再按一定的算法對(duì)其進(jìn)行檢索。從過程上來看,可簡單地分為索引和檢索兩個(gè)過程,但在實(shí)際處理過程中,包含的模塊構(gòu)成有:前端查詢平臺(tái)、中文分詞、解析引擎、后臺(tái)管理等。

    2.2雙層PDF技術(shù)

    非結(jié)構(gòu)化的數(shù)據(jù),又分為文本型和非文本型。對(duì)于文本型或者超文本型的文檔,全文檢索的研究應(yīng)用已經(jīng)比較廣泛和成熟。而非文本型的文檔無法直接實(shí)現(xiàn)全文檢索,雙層PDF文檔技術(shù)便是解決這一問題的最佳方式之一。

    雙層PDF文件是一種包含Text層和Image層的多層結(jié)構(gòu)PDF文件,兩層內(nèi)容位置上相對(duì)應(yīng),Image層是原始圖像,保留了原始檔案的效果;Text層是Image層的OCR識(shí)別結(jié)果,支持選擇、檢索和復(fù)制等功能。通過程序控制可實(shí)現(xiàn)兩個(gè)圖層的任意顯示和切換,可實(shí)現(xiàn)檢索詞的精確定位。雙層PDF文檔可以是圖像型通過檔案數(shù)字加掃描加工而成;也可以是文本型,通過文本文件如WORD轉(zhuǎn)換。

    2.3全文檢索引擎Lucene

    Lucene是目前最為流行的基于Java開源全文檢索工具包[3]。它并不是一個(gè)完整的搜索程序[4],不能直接嵌入系統(tǒng)中使用;而是一個(gè)類庫,一種思想和架構(gòu)。Lucene提供簡單的工具包,方便軟件開發(fā)人員在應(yīng)用系統(tǒng)中實(shí)現(xiàn)全文檢索功能。Lucene具備五大優(yōu)點(diǎn)[5]:索引文件格式獨(dú)立于應(yīng)用平臺(tái);可分塊索引,為增量文件建立小索引,通過與原索引合并,提升效率;面向?qū)ο蟮募軜?gòu),便于擴(kuò)充;獨(dú)立的文本分析接口,與語言和文件格式無關(guān);具備強(qiáng)大的查詢引擎,包括布爾邏輯、分組查詢、模糊查詢等,開發(fā)人員無需再編寫代碼。

    Lucene的源碼由7個(gè)模塊(包)組成:分詞模塊、索引管理、檢索管理、數(shù)據(jù)存儲(chǔ)管理、查詢分析器及公用類庫。為了對(duì)文檔進(jìn)行索引,Lucene提供了5個(gè)基礎(chǔ)的類,Document、Field、IndexWriter、Analyzer、Directory。全文檢索系統(tǒng)功能強(qiáng)大,實(shí)現(xiàn)起來也比較復(fù)雜,但從實(shí)現(xiàn)過程來看,主要分為索引和檢索兩大功能。

    3全文檢索的實(shí)現(xiàn)

    主要運(yùn)用lucene技術(shù),基于PDF文檔,對(duì)中文分詞、解析引擎、索引、過濾、專業(yè)詞庫等方面進(jìn)行了重構(gòu)與優(yōu)化,由前端查詢、索引模塊、分詞、搜索引擎、后臺(tái)管理等模塊構(gòu)成。通過全文檢索的分詞系統(tǒng)、索引系統(tǒng)、引擎系統(tǒng)將海量數(shù)據(jù)快速展現(xiàn)在用戶面前,并支持多關(guān)鍵詞、同義詞、近義詞等檢索。

    3.1創(chuàng)建雙層PDF全文數(shù)據(jù)庫

    建設(shè)雙層PDF全文數(shù)據(jù)庫是實(shí)現(xiàn)全文檢索的基礎(chǔ),減少對(duì)紙質(zhì)檔案的使用,從某種意義上來說,也保護(hù)了紙質(zhì)檔案。市場(chǎng)上已經(jīng)有許多產(chǎn)品或者生產(chǎn)線,可以實(shí)現(xiàn)檔案的雙層PDF數(shù)字化加工。在檔案數(shù)字化加工過程中,將紙質(zhì)檔案掃描加工后的圖片轉(zhuǎn)換處理成雙層PDF文檔,在掛接到檔案管理系統(tǒng)中的相應(yīng)案卷和卷內(nèi)文件目錄之后,原文的存放地址信息自動(dòng)存入數(shù)據(jù)庫的原文關(guān)系表中,通過ID號(hào)(Recid)與案卷和卷內(nèi)文件目錄Recid對(duì)應(yīng),對(duì)檔案文檔的Text層文本內(nèi)容及其元數(shù)據(jù)等相關(guān)信息建立永久聯(lián)系,形成數(shù)據(jù)包。

    基于節(jié)約成本和利于管理考慮,對(duì)雙層PDF文檔進(jìn)行了格式固化,它的Image層是圖片格式,與原文件保持一致,可以閱讀和打?。籘ext層支持內(nèi)容自由復(fù)制。為了使系統(tǒng)處理數(shù)據(jù)方便,我們通過后臺(tái)程序把上傳的其他文本格式的文檔也自動(dòng)轉(zhuǎn)換成雙層PDF文檔。雙層PDF全文數(shù)據(jù)庫不僅為檔案在線編研、數(shù)據(jù)挖掘、開展檔案主動(dòng)服務(wù)等打下了基礎(chǔ),全文數(shù)據(jù)直接利用還使檔案得到保護(hù)和永久性保存。endprint

    3.2創(chuàng)建索引

    數(shù)字化加工后的雙層PDF文件和數(shù)據(jù)包通過調(diào)用全文檢索子系統(tǒng)內(nèi)核函數(shù)建立對(duì)應(yīng)的索引文件,抓取和解析數(shù)據(jù)。本系統(tǒng)中的創(chuàng)建索引的過程,實(shí)際上就是將雙層PDF文檔中的text層、文檔對(duì)應(yīng)的卷內(nèi)目錄和案卷目錄及有關(guān)元數(shù)據(jù)(也可以說是結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù))信息提取并創(chuàng)建索引文件的過程。目前,主要有3種索引技術(shù):簽名、后綴數(shù)組、倒排文檔。Lucene采用的是倒排文檔,倒排文檔的性能和效率都非常高,因而被廣泛采用。

    索引過程可分為4個(gè)階段:準(zhǔn)備待索引文檔和數(shù)據(jù);對(duì)文檔進(jìn)行語法分析和語言處理形成一系列詞(Term);經(jīng)過處理形成詞典和倒排文檔(索引);通過存儲(chǔ)過程將索引寫入索引庫。具體過程分析如下:

    (1)建立索引器indexWriter,生成index對(duì)象,把Document對(duì)象加到索引中來。

    (2)建立信息字段對(duì)象Field,描述文檔的屬性,如文件標(biāo)題和內(nèi)容可以用兩個(gè)Field對(duì)象分別描述。

    (3)建立文檔對(duì)象Document,用來描述文檔,內(nèi)容可以從DOC、EXCEL、TXT、HTML、XML等文檔及關(guān)系型數(shù)據(jù)庫等多種途徑獲得,一個(gè)Document對(duì)象由多個(gè)Field對(duì)象組成的。也可以把一個(gè)Document對(duì)象看作數(shù)據(jù)庫中的一個(gè)記錄,而每個(gè)Field對(duì)象就是記錄的一個(gè)字段。我們通過編寫Object2DocumentUtil.class類來實(shí)現(xiàn)數(shù)據(jù)對(duì)象與Document對(duì)象的轉(zhuǎn)換。

    在文檔被索引之前,首先需要對(duì)文檔內(nèi)容進(jìn)行分詞處理,這部分工作就是由Analyzer類來完成。Analyzer類是一個(gè)抽象類,它有多個(gè)實(shí)現(xiàn),針對(duì)不同的語言和應(yīng)用需要可以選擇適合的Analyzer,本系統(tǒng)中采用的是StandardAnalyzer。Analyzer把分詞后的內(nèi)容交給IndexWriter來建立索引。在分詞時(shí),如果用來進(jìn)行索引的文檔不是純文本,先使用OCR或者其它技術(shù)轉(zhuǎn)換成純文本才能再進(jìn)行操作。值得注意的是,同一索引,用來建立索引與查詢的分詞器必須是同一個(gè),才能保證得到正確的查詢結(jié)果。

    (4)將Field添加到Document里面,再將Document添加到IndexWriter里面。

    (5)優(yōu)化indexWriter對(duì)象,Directory類代表了本系統(tǒng)索引的存儲(chǔ)位置,它是一個(gè)抽象類,有兩個(gè)實(shí)現(xiàn):一個(gè)是FSDirectory,它表示一個(gè)存儲(chǔ)在文件系統(tǒng)中的索引的位置;其次是RAMDirectory,它表示一個(gè)存儲(chǔ)在內(nèi)存當(dāng)中的索引的位置。

    創(chuàng)建索引的方法如下:

    public void createIndexWriter(String sDir){try{

    boolean flag=true;∥標(biāo)記是否重新建立索引,true為重新建立索引,false表示增量索引

    File indexDir=new File(sDir);∥索引文件存放目錄

    Directory dir=SimpleFSDirectory.open(indexDir);∥創(chuàng)建Directory

    Analyzer sAnalyzer=new StandardAnalyzer(Version.LUCENE30);∥分詞器

    indexWriter=new IndexWriter(dir,sAnalyzer,flag,MaxFieldLength.UNLIMITED);∥索引工廠

    }catch(Exception e){logger.error(″indexWriter Exception:″,e);}}

    索引創(chuàng)建成功后便生成索引文件,一個(gè)索引(index)存放在一個(gè)文件夾中,比如文書類的行政檔案卷內(nèi)文件索引為E:/index/T319。基于lucene技術(shù)的全文檢索,根據(jù)不同的配置會(huì)產(chǎn)生不同的文件,本系統(tǒng)中的行政卷內(nèi)文件索引如表1所示。

    0.cfx復(fù)合文件,當(dāng)compound啟用時(shí),被多個(gè)段(Segment)共享的單獨(dú)文件集添加進(jìn)獨(dú)立的compound文件,擴(kuò)展名為cfx;

    2fnm保存域(Field)的元數(shù)據(jù)信息,一個(gè)段包含多個(gè)域,每個(gè)域都有元數(shù)據(jù)信息;

    2frq詞語頻率數(shù)據(jù)文件,記錄了詞語所在文檔的文檔列表(docID)和應(yīng)該詞語出現(xiàn)在文檔中的頻率信息;

    3.3索引管理

    查看索引,讀取指定路徑索引中是否存在;索引中包含的文檔,詞條情況,是否需經(jīng)過優(yōu)化等;最后一次修改的時(shí)間,路徑信息,含有的文檔數(shù)目等;讀取索引詞條相關(guān)基本信息。

    刪除索引,刪除指定序號(hào)的文檔之后,自動(dòng)刪除對(duì)應(yīng)的索引文件,編寫方法delete(IndexData indexData){}來實(shí)現(xiàn);恢復(fù)被刪除的文檔及索引。

    更新索引,更新索引中的某個(gè)文檔;索引同步處理,用戶可根據(jù)需要自己定制創(chuàng)建索引時(shí)間,可定時(shí)或?qū)崟r(shí)更新。增量索引、保存索引、修改索引分別編寫方法incrementIndexWriter(String sDir){}、save(IndexData indexData){}、update(IndexData){}調(diào)用lucene相應(yīng)的類,在更新索引時(shí),采用方法closeIndexWriter()來關(guān)閉IndexWriter。特別是在update方法中采用indexWriter.updateDocument(term,Object2DocumentUtil.object2document(indexData))來實(shí)現(xiàn),當(dāng)數(shù)據(jù)量很大時(shí),采用“刪除再創(chuàng)建”效率更高,updateDocument等價(jià)于delete(indexData)+save(indexData)。

    3.4檢索過程及結(jié)果處理endprint

    全文檢索在程序內(nèi)部實(shí)際上是一個(gè)復(fù)雜的過程,通過分析,可總結(jié)為以下步驟:用戶輸入查詢語句;詞法分析和語言處理;搜索索引,得到符合條件的文檔;對(duì)結(jié)果的相關(guān)性進(jìn)行排序;將查詢結(jié)果返回給用戶界面。

    采用計(jì)分器QueryScorer qs來記錄結(jié)果的相關(guān)性(權(quán)重值),根據(jù)權(quán)重值大小在界面上進(jìn)行排序;采用Lucene處理關(guān)鍵字高亮顯示;Highlighter利用段劃分器Fragmenter將原始文本分割成多個(gè)片段,片段默認(rèn)的大小為100個(gè)字符,將包含檢索詞的片段顯示在檢索結(jié)果中,便于用戶瀏覽查看選擇。系統(tǒng)還需進(jìn)行特殊字符過濾、多重排序、結(jié)果分頁等處理。

    3.5原文瀏覽

    通過檢索過程,在用戶界面得到了查詢結(jié)果。接下來,需要瀏覽PDF原文,并查出檢索詞在原文中的具體位置。我們使用Acrobat Reader,結(jié)合檔案管理系統(tǒng),來實(shí)現(xiàn)檢索詞在原文中的自動(dòng)定位。Reader軟件本身對(duì)雙層PDF文檔的查找、文本復(fù)制、雙層切換等功能都提供了支持,“搜索”窗口允許在多個(gè)PDF查找項(xiàng)目。

    在全文檢索頁面,瀏覽PDF全文是通過在頁面內(nèi)嵌套PDF控件的方式實(shí)現(xiàn)。通過程序傳遞參數(shù)給PDF控件,實(shí)現(xiàn)檢索詞在文檔中的定位。

    而在檔案管理系統(tǒng)內(nèi)部,案卷和卷內(nèi)目錄鏈接的全文,需要點(diǎn)擊鏈接,通過管理系統(tǒng)內(nèi)嵌的閱讀器來打開,與全文檢索頁面的實(shí)現(xiàn)有些區(qū)別。

    4一站式智能檢索設(shè)計(jì)

    檔案管理系統(tǒng)必須具備專業(yè)檢索和一站式智能檢索等檢索途徑,專業(yè)檢索提供更為復(fù)雜的邏輯表達(dá)式組配,適合檔案人員處理復(fù)雜用戶需求時(shí)使用;而一站式檢索帶來的是便捷的用戶體驗(yàn),檔案用戶不必了解具體的檔案分類和細(xì)節(jié),通過一個(gè)檢索入口便可以獲得所需的信息。

    包含全文檢索的一站式檢索具備異構(gòu)檔案資源庫和分布式資源庫處理能力,對(duì)結(jié)構(gòu)化與非結(jié)構(gòu)化信息合并管理,對(duì)目錄數(shù)據(jù)和原文必須進(jìn)行同步索引。首先通過JDBC(Java Data Base Connectivity)連接數(shù)據(jù)庫找到要索引的門類,通過卷內(nèi)文件目錄和案卷目錄的ID號(hào)(Recid),查找原文關(guān)系表中的Recid,原文表中的這條記錄有文件存放路徑(Filepath)等信息,然后根據(jù)信息找到對(duì)應(yīng)的原文(雙層PDF文檔),這樣便可以對(duì)目錄數(shù)據(jù)和原文進(jìn)行同步索引。接下來,指定生成Index目錄。而在檢索時(shí),只需要對(duì)索引進(jìn)行訪問,便可以很快的在各類檔案目錄庫和全文庫檢索到用戶需要的信息。

    5實(shí)現(xiàn)效果

    通過測(cè)試,系統(tǒng)自動(dòng)從索引中檢索出相關(guān)的信息,如果檢索詞包含在文檔中,系統(tǒng)還使檢索詞在文檔中自動(dòng)定位,免去翻頁查找的麻煩。若要縮小檢索范圍,只需要再增加檢索詞,檢索詞之間默認(rèn)為邏輯“AND”的關(guān)系,檢索結(jié)果按相關(guān)度排序,根據(jù)文檔片段值的大小,將包含檢索詞的文檔片段內(nèi)容顯示在檢索結(jié)果界面,供用戶瀏覽。

    運(yùn)行表明,基于雙層PDF文檔技術(shù)的一站式全文檢索,提高了工作效率。通過對(duì)跨數(shù)據(jù)表,跨數(shù)據(jù)類型,案卷、卷內(nèi)目錄數(shù)據(jù)和雙層PDF的Text層同步索引,查詢時(shí)訪問索引而不訪問數(shù)據(jù)庫,有效減輕數(shù)據(jù)庫和系統(tǒng)的壓力。系統(tǒng)可以支持1 000萬級(jí)的數(shù)據(jù),毫秒級(jí)的響應(yīng)時(shí)間,每秒500人的并發(fā)訪問;可以適應(yīng)不同的操作系統(tǒng)平臺(tái),支持多種數(shù)據(jù)庫接口;具備通用搜索引擎的構(gòu)架和功能,用戶可任意輸入檢索信息,可多關(guān)鍵字、關(guān)鍵詞組合搜索。

    全文檢索是檔案管理系統(tǒng)中很重要的檢索途徑,彌補(bǔ)了目錄檢索的不足,也解決了目錄著錄不全、不規(guī)范等問題,大幅度提高了查全率。全文檢索無須編制任何檢索目錄,完全實(shí)現(xiàn)智能化、高效率檢索,極大地提高了工作效率。雖然不同的檔案管理系統(tǒng)可能會(huì)采用不同的編程語言和技術(shù)架構(gòu)來實(shí)現(xiàn),對(duì)Lucene規(guī)范中的技術(shù)取舍、采用和配置各有不同,但遵循Lucence架構(gòu)的雙層PDF全文檢索的總體實(shí)現(xiàn)思想大同小異。雙層PDF全文數(shù)據(jù)庫為檔案編研和數(shù)據(jù)挖掘提供了資源[6];也為檔案信息聚合(RSS)的研究、定向主動(dòng)的檔案信息服務(wù)研究或者更深層次的檔案服務(wù)成為可能。

    參考文獻(xiàn)

    [1]管建和,甘劍峰.基于Lucene 全文檢索引擎的應(yīng)用研究與實(shí)現(xiàn)[J].計(jì)算機(jī)工程與設(shè)計(jì),2007,(2):489-491.

    [2]forfuture1978.Lucene學(xué)習(xí)總結(jié)之一:全文檢索的基本原理[EB/OL].http:∥forfuture1978.iteye.com/.

    [3]胡長春.基于Lucene的中文自然語言搜索引擎[D].上海:上海交通大學(xué),2009:32-35.

    [4]解鵬飛.Lucene搜索引擎技術(shù)在國家海洋數(shù)字檔案館示范系統(tǒng)中的實(shí)現(xiàn)及應(yīng)用[J].海洋環(huán)境科學(xué),2008,(8):117-121.

    [5]yingsuixindong.全文檢索引擎Lucene優(yōu)點(diǎn)[EB/OL].http:∥blog.csdn.net/yingsuixindong/article/details/5580983.

    [6]向禹.基于SOA架構(gòu)的高校檔案資源管理系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D].長沙:中南大學(xué),2013:61-67.

    (本文責(zé)任編輯:馬卓)endprint

    全文檢索在程序內(nèi)部實(shí)際上是一個(gè)復(fù)雜的過程,通過分析,可總結(jié)為以下步驟:用戶輸入查詢語句;詞法分析和語言處理;搜索索引,得到符合條件的文檔;對(duì)結(jié)果的相關(guān)性進(jìn)行排序;將查詢結(jié)果返回給用戶界面。

    采用計(jì)分器QueryScorer qs來記錄結(jié)果的相關(guān)性(權(quán)重值),根據(jù)權(quán)重值大小在界面上進(jìn)行排序;采用Lucene處理關(guān)鍵字高亮顯示;Highlighter利用段劃分器Fragmenter將原始文本分割成多個(gè)片段,片段默認(rèn)的大小為100個(gè)字符,將包含檢索詞的片段顯示在檢索結(jié)果中,便于用戶瀏覽查看選擇。系統(tǒng)還需進(jìn)行特殊字符過濾、多重排序、結(jié)果分頁等處理。

    3.5原文瀏覽

    通過檢索過程,在用戶界面得到了查詢結(jié)果。接下來,需要瀏覽PDF原文,并查出檢索詞在原文中的具體位置。我們使用Acrobat Reader,結(jié)合檔案管理系統(tǒng),來實(shí)現(xiàn)檢索詞在原文中的自動(dòng)定位。Reader軟件本身對(duì)雙層PDF文檔的查找、文本復(fù)制、雙層切換等功能都提供了支持,“搜索”窗口允許在多個(gè)PDF查找項(xiàng)目。

    在全文檢索頁面,瀏覽PDF全文是通過在頁面內(nèi)嵌套PDF控件的方式實(shí)現(xiàn)。通過程序傳遞參數(shù)給PDF控件,實(shí)現(xiàn)檢索詞在文檔中的定位。

    而在檔案管理系統(tǒng)內(nèi)部,案卷和卷內(nèi)目錄鏈接的全文,需要點(diǎn)擊鏈接,通過管理系統(tǒng)內(nèi)嵌的閱讀器來打開,與全文檢索頁面的實(shí)現(xiàn)有些區(qū)別。

    4一站式智能檢索設(shè)計(jì)

    檔案管理系統(tǒng)必須具備專業(yè)檢索和一站式智能檢索等檢索途徑,專業(yè)檢索提供更為復(fù)雜的邏輯表達(dá)式組配,適合檔案人員處理復(fù)雜用戶需求時(shí)使用;而一站式檢索帶來的是便捷的用戶體驗(yàn),檔案用戶不必了解具體的檔案分類和細(xì)節(jié),通過一個(gè)檢索入口便可以獲得所需的信息。

    包含全文檢索的一站式檢索具備異構(gòu)檔案資源庫和分布式資源庫處理能力,對(duì)結(jié)構(gòu)化與非結(jié)構(gòu)化信息合并管理,對(duì)目錄數(shù)據(jù)和原文必須進(jìn)行同步索引。首先通過JDBC(Java Data Base Connectivity)連接數(shù)據(jù)庫找到要索引的門類,通過卷內(nèi)文件目錄和案卷目錄的ID號(hào)(Recid),查找原文關(guān)系表中的Recid,原文表中的這條記錄有文件存放路徑(Filepath)等信息,然后根據(jù)信息找到對(duì)應(yīng)的原文(雙層PDF文檔),這樣便可以對(duì)目錄數(shù)據(jù)和原文進(jìn)行同步索引。接下來,指定生成Index目錄。而在檢索時(shí),只需要對(duì)索引進(jìn)行訪問,便可以很快的在各類檔案目錄庫和全文庫檢索到用戶需要的信息。

    5實(shí)現(xiàn)效果

    通過測(cè)試,系統(tǒng)自動(dòng)從索引中檢索出相關(guān)的信息,如果檢索詞包含在文檔中,系統(tǒng)還使檢索詞在文檔中自動(dòng)定位,免去翻頁查找的麻煩。若要縮小檢索范圍,只需要再增加檢索詞,檢索詞之間默認(rèn)為邏輯“AND”的關(guān)系,檢索結(jié)果按相關(guān)度排序,根據(jù)文檔片段值的大小,將包含檢索詞的文檔片段內(nèi)容顯示在檢索結(jié)果界面,供用戶瀏覽。

    運(yùn)行表明,基于雙層PDF文檔技術(shù)的一站式全文檢索,提高了工作效率。通過對(duì)跨數(shù)據(jù)表,跨數(shù)據(jù)類型,案卷、卷內(nèi)目錄數(shù)據(jù)和雙層PDF的Text層同步索引,查詢時(shí)訪問索引而不訪問數(shù)據(jù)庫,有效減輕數(shù)據(jù)庫和系統(tǒng)的壓力。系統(tǒng)可以支持1 000萬級(jí)的數(shù)據(jù),毫秒級(jí)的響應(yīng)時(shí)間,每秒500人的并發(fā)訪問;可以適應(yīng)不同的操作系統(tǒng)平臺(tái),支持多種數(shù)據(jù)庫接口;具備通用搜索引擎的構(gòu)架和功能,用戶可任意輸入檢索信息,可多關(guān)鍵字、關(guān)鍵詞組合搜索。

    全文檢索是檔案管理系統(tǒng)中很重要的檢索途徑,彌補(bǔ)了目錄檢索的不足,也解決了目錄著錄不全、不規(guī)范等問題,大幅度提高了查全率。全文檢索無須編制任何檢索目錄,完全實(shí)現(xiàn)智能化、高效率檢索,極大地提高了工作效率。雖然不同的檔案管理系統(tǒng)可能會(huì)采用不同的編程語言和技術(shù)架構(gòu)來實(shí)現(xiàn),對(duì)Lucene規(guī)范中的技術(shù)取舍、采用和配置各有不同,但遵循Lucence架構(gòu)的雙層PDF全文檢索的總體實(shí)現(xiàn)思想大同小異。雙層PDF全文數(shù)據(jù)庫為檔案編研和數(shù)據(jù)挖掘提供了資源[6];也為檔案信息聚合(RSS)的研究、定向主動(dòng)的檔案信息服務(wù)研究或者更深層次的檔案服務(wù)成為可能。

    參考文獻(xiàn)

    [1]管建和,甘劍峰.基于Lucene 全文檢索引擎的應(yīng)用研究與實(shí)現(xiàn)[J].計(jì)算機(jī)工程與設(shè)計(jì),2007,(2):489-491.

    [2]forfuture1978.Lucene學(xué)習(xí)總結(jié)之一:全文檢索的基本原理[EB/OL].http:∥forfuture1978.iteye.com/.

    [3]胡長春.基于Lucene的中文自然語言搜索引擎[D].上海:上海交通大學(xué),2009:32-35.

    [4]解鵬飛.Lucene搜索引擎技術(shù)在國家海洋數(shù)字檔案館示范系統(tǒng)中的實(shí)現(xiàn)及應(yīng)用[J].海洋環(huán)境科學(xué),2008,(8):117-121.

    [5]yingsuixindong.全文檢索引擎Lucene優(yōu)點(diǎn)[EB/OL].http:∥blog.csdn.net/yingsuixindong/article/details/5580983.

    [6]向禹.基于SOA架構(gòu)的高校檔案資源管理系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D].長沙:中南大學(xué),2013:61-67.

    (本文責(zé)任編輯:馬卓)endprint

    全文檢索在程序內(nèi)部實(shí)際上是一個(gè)復(fù)雜的過程,通過分析,可總結(jié)為以下步驟:用戶輸入查詢語句;詞法分析和語言處理;搜索索引,得到符合條件的文檔;對(duì)結(jié)果的相關(guān)性進(jìn)行排序;將查詢結(jié)果返回給用戶界面。

    采用計(jì)分器QueryScorer qs來記錄結(jié)果的相關(guān)性(權(quán)重值),根據(jù)權(quán)重值大小在界面上進(jìn)行排序;采用Lucene處理關(guān)鍵字高亮顯示;Highlighter利用段劃分器Fragmenter將原始文本分割成多個(gè)片段,片段默認(rèn)的大小為100個(gè)字符,將包含檢索詞的片段顯示在檢索結(jié)果中,便于用戶瀏覽查看選擇。系統(tǒng)還需進(jìn)行特殊字符過濾、多重排序、結(jié)果分頁等處理。

    3.5原文瀏覽

    通過檢索過程,在用戶界面得到了查詢結(jié)果。接下來,需要瀏覽PDF原文,并查出檢索詞在原文中的具體位置。我們使用Acrobat Reader,結(jié)合檔案管理系統(tǒng),來實(shí)現(xiàn)檢索詞在原文中的自動(dòng)定位。Reader軟件本身對(duì)雙層PDF文檔的查找、文本復(fù)制、雙層切換等功能都提供了支持,“搜索”窗口允許在多個(gè)PDF查找項(xiàng)目。

    在全文檢索頁面,瀏覽PDF全文是通過在頁面內(nèi)嵌套PDF控件的方式實(shí)現(xiàn)。通過程序傳遞參數(shù)給PDF控件,實(shí)現(xiàn)檢索詞在文檔中的定位。

    而在檔案管理系統(tǒng)內(nèi)部,案卷和卷內(nèi)目錄鏈接的全文,需要點(diǎn)擊鏈接,通過管理系統(tǒng)內(nèi)嵌的閱讀器來打開,與全文檢索頁面的實(shí)現(xiàn)有些區(qū)別。

    4一站式智能檢索設(shè)計(jì)

    檔案管理系統(tǒng)必須具備專業(yè)檢索和一站式智能檢索等檢索途徑,專業(yè)檢索提供更為復(fù)雜的邏輯表達(dá)式組配,適合檔案人員處理復(fù)雜用戶需求時(shí)使用;而一站式檢索帶來的是便捷的用戶體驗(yàn),檔案用戶不必了解具體的檔案分類和細(xì)節(jié),通過一個(gè)檢索入口便可以獲得所需的信息。

    包含全文檢索的一站式檢索具備異構(gòu)檔案資源庫和分布式資源庫處理能力,對(duì)結(jié)構(gòu)化與非結(jié)構(gòu)化信息合并管理,對(duì)目錄數(shù)據(jù)和原文必須進(jìn)行同步索引。首先通過JDBC(Java Data Base Connectivity)連接數(shù)據(jù)庫找到要索引的門類,通過卷內(nèi)文件目錄和案卷目錄的ID號(hào)(Recid),查找原文關(guān)系表中的Recid,原文表中的這條記錄有文件存放路徑(Filepath)等信息,然后根據(jù)信息找到對(duì)應(yīng)的原文(雙層PDF文檔),這樣便可以對(duì)目錄數(shù)據(jù)和原文進(jìn)行同步索引。接下來,指定生成Index目錄。而在檢索時(shí),只需要對(duì)索引進(jìn)行訪問,便可以很快的在各類檔案目錄庫和全文庫檢索到用戶需要的信息。

    5實(shí)現(xiàn)效果

    通過測(cè)試,系統(tǒng)自動(dòng)從索引中檢索出相關(guān)的信息,如果檢索詞包含在文檔中,系統(tǒng)還使檢索詞在文檔中自動(dòng)定位,免去翻頁查找的麻煩。若要縮小檢索范圍,只需要再增加檢索詞,檢索詞之間默認(rèn)為邏輯“AND”的關(guān)系,檢索結(jié)果按相關(guān)度排序,根據(jù)文檔片段值的大小,將包含檢索詞的文檔片段內(nèi)容顯示在檢索結(jié)果界面,供用戶瀏覽。

    運(yùn)行表明,基于雙層PDF文檔技術(shù)的一站式全文檢索,提高了工作效率。通過對(duì)跨數(shù)據(jù)表,跨數(shù)據(jù)類型,案卷、卷內(nèi)目錄數(shù)據(jù)和雙層PDF的Text層同步索引,查詢時(shí)訪問索引而不訪問數(shù)據(jù)庫,有效減輕數(shù)據(jù)庫和系統(tǒng)的壓力。系統(tǒng)可以支持1 000萬級(jí)的數(shù)據(jù),毫秒級(jí)的響應(yīng)時(shí)間,每秒500人的并發(fā)訪問;可以適應(yīng)不同的操作系統(tǒng)平臺(tái),支持多種數(shù)據(jù)庫接口;具備通用搜索引擎的構(gòu)架和功能,用戶可任意輸入檢索信息,可多關(guān)鍵字、關(guān)鍵詞組合搜索。

    全文檢索是檔案管理系統(tǒng)中很重要的檢索途徑,彌補(bǔ)了目錄檢索的不足,也解決了目錄著錄不全、不規(guī)范等問題,大幅度提高了查全率。全文檢索無須編制任何檢索目錄,完全實(shí)現(xiàn)智能化、高效率檢索,極大地提高了工作效率。雖然不同的檔案管理系統(tǒng)可能會(huì)采用不同的編程語言和技術(shù)架構(gòu)來實(shí)現(xiàn),對(duì)Lucene規(guī)范中的技術(shù)取舍、采用和配置各有不同,但遵循Lucence架構(gòu)的雙層PDF全文檢索的總體實(shí)現(xiàn)思想大同小異。雙層PDF全文數(shù)據(jù)庫為檔案編研和數(shù)據(jù)挖掘提供了資源[6];也為檔案信息聚合(RSS)的研究、定向主動(dòng)的檔案信息服務(wù)研究或者更深層次的檔案服務(wù)成為可能。

    參考文獻(xiàn)

    [1]管建和,甘劍峰.基于Lucene 全文檢索引擎的應(yīng)用研究與實(shí)現(xiàn)[J].計(jì)算機(jī)工程與設(shè)計(jì),2007,(2):489-491.

    [2]forfuture1978.Lucene學(xué)習(xí)總結(jié)之一:全文檢索的基本原理[EB/OL].http:∥forfuture1978.iteye.com/.

    [3]胡長春.基于Lucene的中文自然語言搜索引擎[D].上海:上海交通大學(xué),2009:32-35.

    [4]解鵬飛.Lucene搜索引擎技術(shù)在國家海洋數(shù)字檔案館示范系統(tǒng)中的實(shí)現(xiàn)及應(yīng)用[J].海洋環(huán)境科學(xué),2008,(8):117-121.

    [5]yingsuixindong.全文檢索引擎Lucene優(yōu)點(diǎn)[EB/OL].http:∥blog.csdn.net/yingsuixindong/article/details/5580983.

    [6]向禹.基于SOA架構(gòu)的高校檔案資源管理系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D].長沙:中南大學(xué),2013:61-67.

    (本文責(zé)任編輯:馬卓)endprint

    猜你喜歡
    全文檢索檔案管理
    如何規(guī)范檔案管理
    檔案管理中的電子檔案管理
    檔案管理與企業(yè)內(nèi)部控制關(guān)系的思考
    基于Lucene全文檢索技術(shù)的優(yōu)化探討
    Oracle數(shù)據(jù)庫全文檢索性能研究
    論科研項(xiàng)目檔案管理
    西藏科技(2015年12期)2015-09-26 12:13:40
    全文檢索引擎技術(shù)在電子病歷中的應(yīng)用
    基于KySou的全文檢索系統(tǒng)的分析與優(yōu)化
    加強(qiáng)工程項(xiàng)目檔案管理的有效途徑
    電子檔案管理的一些認(rèn)識(shí)和思考
    啦啦啦中文免费视频观看日本| 精品久久久精品久久久| 亚洲自偷自拍图片 自拍| 色综合欧美亚洲国产小说| 黑人猛操日本美女一级片| 精品国产乱子伦一区二区三区 | 永久免费av网站大全| 极品人妻少妇av视频| 国产高清videossex| 女人爽到高潮嗷嗷叫在线视频| 在线亚洲精品国产二区图片欧美| 亚洲国产精品999| 亚洲精华国产精华精| 各种免费的搞黄视频| 国产免费一区二区三区四区乱码| 男人舔女人的私密视频| 国产成人精品在线电影| 成人国产av品久久久| 99久久综合免费| 精品福利观看| 性色av一级| 十八禁高潮呻吟视频| 国产主播在线观看一区二区| 午夜福利,免费看| 天天添夜夜摸| 99国产精品一区二区蜜桃av | 九色亚洲精品在线播放| 午夜激情av网站| 老熟妇乱子伦视频在线观看 | 久久中文看片网| 精品少妇黑人巨大在线播放| 亚洲人成77777在线视频| 亚洲七黄色美女视频| 国产精品成人在线| 极品人妻少妇av视频| 亚洲国产中文字幕在线视频| 亚洲精品av麻豆狂野| 国精品久久久久久国模美| 丰满饥渴人妻一区二区三| 热99久久久久精品小说推荐| 亚洲精华国产精华精| 亚洲国产中文字幕在线视频| 麻豆乱淫一区二区| 日本精品一区二区三区蜜桃| 69精品国产乱码久久久| 亚洲色图综合在线观看| 老熟女久久久| 精品免费久久久久久久清纯 | 国产欧美日韩综合在线一区二区| 王馨瑶露胸无遮挡在线观看| www.自偷自拍.com| 黄色视频,在线免费观看| 日本一区二区免费在线视频| 丝袜美足系列| av在线老鸭窝| 伊人亚洲综合成人网| 2018国产大陆天天弄谢| 老熟妇乱子伦视频在线观看 | 久热这里只有精品99| 91麻豆精品激情在线观看国产 | tocl精华| 三级毛片av免费| 老司机福利观看| 青青草视频在线视频观看| 男人舔女人的私密视频| 欧美97在线视频| 日本黄色日本黄色录像| 精品国产一区二区三区久久久樱花| 中亚洲国语对白在线视频| 久久久国产一区二区| 久久久久网色| 久久亚洲精品不卡| 日韩大码丰满熟妇| 国产成人免费无遮挡视频| 伊人久久大香线蕉亚洲五| 美女高潮到喷水免费观看| 国产熟女午夜一区二区三区| 91精品伊人久久大香线蕉| 乱人伦中国视频| 国产精品一区二区在线观看99| 国产国语露脸激情在线看| 真人做人爱边吃奶动态| 国产精品久久久av美女十八| 久久精品国产亚洲av高清一级| 成年女人毛片免费观看观看9 | 久久久久视频综合| 午夜激情av网站| 他把我摸到了高潮在线观看 | 丰满迷人的少妇在线观看| 999久久久精品免费观看国产| 亚洲久久久国产精品| 香蕉国产在线看| av在线播放精品| 亚洲全国av大片| 人人妻人人澡人人爽人人夜夜| 日韩制服骚丝袜av| 欧美国产精品va在线观看不卡| 久久国产精品男人的天堂亚洲| 在线看a的网站| 午夜久久久在线观看| 日韩 亚洲 欧美在线| 欧美午夜高清在线| 亚洲五月婷婷丁香| 国产av国产精品国产| 久久人人97超碰香蕉20202| 一个人免费在线观看的高清视频 | 国产一级毛片在线| 亚洲九九香蕉| 久久久精品94久久精品| 国产精品久久久久久精品古装| 日韩,欧美,国产一区二区三区| 黄色片一级片一级黄色片| 亚洲国产欧美网| av在线老鸭窝| 国产精品成人在线| 亚洲国产欧美网| 一个人免费看片子| 在线观看免费日韩欧美大片| 大片免费播放器 马上看| 国产亚洲精品第一综合不卡| 亚洲av日韩在线播放| 丰满人妻熟妇乱又伦精品不卡| 韩国高清视频一区二区三区| 在线天堂中文资源库| 午夜老司机福利片| 曰老女人黄片| 捣出白浆h1v1| 一级片'在线观看视频| 亚洲五月色婷婷综合| 中文字幕人妻丝袜一区二区| 少妇的丰满在线观看| 老司机在亚洲福利影院| 19禁男女啪啪无遮挡网站| 国产一区二区在线观看av| 国产精品久久久久成人av| 亚洲精品久久成人aⅴ小说| 久久99一区二区三区| 性少妇av在线| 亚洲成av片中文字幕在线观看| 精品少妇黑人巨大在线播放| 视频在线观看一区二区三区| 狂野欧美激情性xxxx| 国产成人精品久久二区二区免费| 国产亚洲一区二区精品| 日韩欧美一区视频在线观看| 99国产综合亚洲精品| 亚洲人成电影观看| 国产成人啪精品午夜网站| 日日摸夜夜添夜夜添小说| 动漫黄色视频在线观看| 在线观看免费视频网站a站| 国产免费现黄频在线看| 亚洲av欧美aⅴ国产| 桃花免费在线播放| 精品国产乱子伦一区二区三区 | 97在线人人人人妻| 搡老岳熟女国产| 中文字幕人妻丝袜制服| 亚洲人成电影观看| 夫妻午夜视频| 久久影院123| 亚洲成人免费电影在线观看| 成年动漫av网址| 国产一区二区激情短视频 | 麻豆乱淫一区二区| 日韩精品免费视频一区二区三区| 久久久久久久久久久久大奶| 成人18禁高潮啪啪吃奶动态图| 国产亚洲一区二区精品| 亚洲久久久国产精品| 久久久国产成人免费| 天堂8中文在线网| 丝袜在线中文字幕| 国产亚洲欧美在线一区二区| 久9热在线精品视频| 久久99热这里只频精品6学生| 亚洲精品国产区一区二| 他把我摸到了高潮在线观看 | 人人妻人人爽人人添夜夜欢视频| 在线看a的网站| 精品国产乱码久久久久久小说| 午夜成年电影在线免费观看| 精品国产乱子伦一区二区三区 | 日韩人妻精品一区2区三区| 18禁裸乳无遮挡动漫免费视频| 男男h啪啪无遮挡| 18禁观看日本| 久久中文看片网| 肉色欧美久久久久久久蜜桃| 69精品国产乱码久久久| 一级毛片女人18水好多| 欧美黑人精品巨大| 老司机午夜十八禁免费视频| 韩国高清视频一区二区三区| 欧美在线一区亚洲| 黑人操中国人逼视频| 久久亚洲精品不卡| 精品一区二区三区四区五区乱码| a 毛片基地| 成年人免费黄色播放视频| 18禁裸乳无遮挡动漫免费视频| 亚洲中文字幕日韩| 久久99一区二区三区| 精品少妇久久久久久888优播| 91成人精品电影| 欧美日韩成人在线一区二区| 男人爽女人下面视频在线观看| 国产一区二区三区综合在线观看| 欧美少妇被猛烈插入视频| 欧美+亚洲+日韩+国产| 久久免费观看电影| 热re99久久国产66热| av欧美777| 一进一出抽搐动态| 在线观看www视频免费| 最近中文字幕2019免费版| 搡老乐熟女国产| 人人妻,人人澡人人爽秒播| 久久天躁狠狠躁夜夜2o2o| 午夜福利视频精品| 在线观看人妻少妇| 中文欧美无线码| 99国产精品99久久久久| 亚洲av美国av| 夫妻午夜视频| 免费少妇av软件| 青草久久国产| 国产在视频线精品| 性高湖久久久久久久久免费观看| 亚洲情色 制服丝袜| 国产精品影院久久| 欧美人与性动交α欧美精品济南到| 久久精品亚洲熟妇少妇任你| 亚洲人成77777在线视频| 国产人伦9x9x在线观看| 免费少妇av软件| 在线观看免费午夜福利视频| 日韩 亚洲 欧美在线| 一个人免费在线观看的高清视频 | av在线老鸭窝| 亚洲色图 男人天堂 中文字幕| 久久国产亚洲av麻豆专区| 久热这里只有精品99| 极品人妻少妇av视频| 一区二区三区激情视频| 亚洲欧美精品自产自拍| 精品国产乱子伦一区二区三区 | 脱女人内裤的视频| 91麻豆精品激情在线观看国产 | 精品人妻在线不人妻| 亚洲欧美成人综合另类久久久| 一二三四在线观看免费中文在| 色94色欧美一区二区| 搡老乐熟女国产| 在线观看人妻少妇| 欧美日韩视频精品一区| 建设人人有责人人尽责人人享有的| 免费女性裸体啪啪无遮挡网站| 精品一区二区三区av网在线观看 | 男女床上黄色一级片免费看| 法律面前人人平等表现在哪些方面 | 久久狼人影院| 日韩中文字幕视频在线看片| 国产精品影院久久| 日本一区二区免费在线视频| 免费在线观看影片大全网站| 汤姆久久久久久久影院中文字幕| 免费在线观看视频国产中文字幕亚洲 | 日本wwww免费看| 超碰成人久久| 国产伦理片在线播放av一区| 99精国产麻豆久久婷婷| 人人妻,人人澡人人爽秒播| 91av网站免费观看| 亚洲精品国产色婷婷电影| 午夜激情av网站| kizo精华| 亚洲av国产av综合av卡| 成人影院久久| 精品少妇一区二区三区视频日本电影| 人人妻,人人澡人人爽秒播| 黄色视频,在线免费观看| bbb黄色大片| 午夜91福利影院| 亚洲国产毛片av蜜桃av| 一级,二级,三级黄色视频| 9色porny在线观看| 久久久久久久国产电影| 午夜福利免费观看在线| 中文字幕色久视频| 国产老妇伦熟女老妇高清| 国产又色又爽无遮挡免| 后天国语完整版免费观看| 啦啦啦视频在线资源免费观看| 涩涩av久久男人的天堂| 国产亚洲欧美在线一区二区| 极品少妇高潮喷水抽搐| 国产一区二区激情短视频 | 99国产精品一区二区三区| 在线观看免费视频网站a站| 免费高清在线观看视频在线观看| 淫妇啪啪啪对白视频 | 精品国产一区二区三区久久久樱花| 婷婷丁香在线五月| 欧美成人午夜精品| 啦啦啦 在线观看视频| 亚洲第一欧美日韩一区二区三区 | 亚洲精品国产色婷婷电影| 三上悠亚av全集在线观看| 国产成人影院久久av| 国产老妇伦熟女老妇高清| 叶爱在线成人免费视频播放| 一区二区三区乱码不卡18| 岛国毛片在线播放| av国产精品久久久久影院| 宅男免费午夜| 国产高清videossex| 日韩电影二区| 国产激情久久老熟女| 91成人精品电影| 国产麻豆69| 亚洲精品国产av蜜桃| 中文欧美无线码| 秋霞在线观看毛片| 免费高清在线观看视频在线观看| 亚洲第一欧美日韩一区二区三区 | 国产成人欧美| tocl精华| 国产成人欧美| 69精品国产乱码久久久| 12—13女人毛片做爰片一| 免费女性裸体啪啪无遮挡网站| 午夜福利视频精品| 热99久久久久精品小说推荐| 久久这里只有精品19| av免费在线观看网站| 90打野战视频偷拍视频| 婷婷丁香在线五月| 一边摸一边做爽爽视频免费| 国产精品九九99| 国产男人的电影天堂91| 啦啦啦啦在线视频资源| 精品国产一区二区三区久久久樱花| 亚洲欧洲日产国产| 建设人人有责人人尽责人人享有的| 91精品三级在线观看| 国产一区二区在线观看av| 亚洲精品第二区| 成人免费观看视频高清| 美女扒开内裤让男人捅视频| 老司机靠b影院| 精品国产乱码久久久久久男人| 国产高清国产精品国产三级| 精品国产一区二区三区四区第35| 中文字幕人妻熟女乱码| 老司机亚洲免费影院| 日韩精品免费视频一区二区三区| 欧美精品一区二区免费开放| 国产成+人综合+亚洲专区| 1024香蕉在线观看| 免费不卡黄色视频| 精品少妇一区二区三区视频日本电影| 黑丝袜美女国产一区| 中文字幕最新亚洲高清| 精品国产超薄肉色丝袜足j| 在线天堂中文资源库| av网站在线播放免费| 少妇粗大呻吟视频| 人成视频在线观看免费观看| 国产av国产精品国产| 亚洲第一av免费看| av福利片在线| 国产精品熟女久久久久浪| 1024香蕉在线观看| 老司机午夜十八禁免费视频| 亚洲五月色婷婷综合| 国产一区二区三区在线臀色熟女 | 国产精品久久久久成人av| 亚洲成人国产一区在线观看| 日本wwww免费看| 五月天丁香电影| 男女床上黄色一级片免费看| 久久久久久亚洲精品国产蜜桃av| 麻豆乱淫一区二区| 欧美日韩亚洲综合一区二区三区_| 男女国产视频网站| 精品人妻一区二区三区麻豆| 日韩大码丰满熟妇| 中文字幕精品免费在线观看视频| 亚洲久久久国产精品| 国产激情久久老熟女| 国产亚洲精品第一综合不卡| 香蕉国产在线看| 岛国在线观看网站| 成人亚洲精品一区在线观看| 91大片在线观看| 国产日韩欧美亚洲二区| 免费人妻精品一区二区三区视频| 一级毛片精品| 欧美老熟妇乱子伦牲交| 18禁裸乳无遮挡动漫免费视频| 超碰97精品在线观看| 满18在线观看网站| 日日摸夜夜添夜夜添小说| 宅男免费午夜| 亚洲avbb在线观看| 人人妻,人人澡人人爽秒播| a在线观看视频网站| 99久久99久久久精品蜜桃| a级片在线免费高清观看视频| 成人国产av品久久久| 欧美激情久久久久久爽电影 | avwww免费| 91麻豆av在线| 亚洲少妇的诱惑av| 日本一区二区免费在线视频| 丝袜脚勾引网站| 亚洲人成77777在线视频| 黄片播放在线免费| 一区福利在线观看| 最新在线观看一区二区三区| 午夜精品国产一区二区电影| 十八禁人妻一区二区| 成年人午夜在线观看视频| 天天添夜夜摸| 在线 av 中文字幕| 十八禁人妻一区二区| 欧美亚洲日本最大视频资源| 一区二区av电影网| 巨乳人妻的诱惑在线观看| 亚洲精品国产一区二区精华液| 少妇被粗大的猛进出69影院| 国产一卡二卡三卡精品| 欧美日韩一级在线毛片| 91成人精品电影| 老司机福利观看| 少妇被粗大的猛进出69影院| 久久久久久久精品精品| 久久精品人人爽人人爽视色| 两性午夜刺激爽爽歪歪视频在线观看 | 亚洲欧洲精品一区二区精品久久久| 一本一本久久a久久精品综合妖精| 一区二区三区四区激情视频| 精品国产乱码久久久久久男人| 亚洲午夜精品一区,二区,三区| 日韩大码丰满熟妇| 亚洲精品国产av蜜桃| 女人精品久久久久毛片| 久久精品aⅴ一区二区三区四区| 91大片在线观看| 啦啦啦 在线观看视频| 精品国产国语对白av| 90打野战视频偷拍视频| 久久国产亚洲av麻豆专区| 亚洲国产日韩一区二区| 国产高清videossex| 亚洲国产看品久久| 在线av久久热| 日本五十路高清| 99精品久久久久人妻精品| 天堂俺去俺来也www色官网| 啪啪无遮挡十八禁网站| 免费日韩欧美在线观看| 一个人免费在线观看的高清视频 | 丝瓜视频免费看黄片| 两性夫妻黄色片| 欧美精品亚洲一区二区| 久久精品国产亚洲av高清一级| 一区二区三区乱码不卡18| 久久精品人人爽人人爽视色| 脱女人内裤的视频| 人人妻人人爽人人添夜夜欢视频| 中国国产av一级| 日韩欧美一区二区三区在线观看 | 大香蕉久久网| 99国产精品一区二区三区| 999精品在线视频| 国产成人一区二区三区免费视频网站| 欧美精品高潮呻吟av久久| 高清在线国产一区| 美女高潮到喷水免费观看| 一本大道久久a久久精品| 最近最新免费中文字幕在线| 婷婷成人精品国产| 一本—道久久a久久精品蜜桃钙片| 啦啦啦免费观看视频1| 久久久久精品国产欧美久久久 | 伦理电影免费视频| 美女高潮到喷水免费观看| 不卡av一区二区三区| 国产黄色免费在线视频| 伊人久久大香线蕉亚洲五| 91麻豆av在线| 99re6热这里在线精品视频| 咕卡用的链子| 这个男人来自地球电影免费观看| 国产欧美日韩一区二区三区在线| 亚洲综合色网址| 免费在线观看完整版高清| 99久久99久久久精品蜜桃| 美女大奶头黄色视频| 亚洲精品第二区| 免费高清在线观看视频在线观看| 久久人人爽人人片av| 桃红色精品国产亚洲av| 韩国高清视频一区二区三区| 精品一区二区三区四区五区乱码| 人妻 亚洲 视频| av在线播放精品| 日本a在线网址| 啦啦啦啦在线视频资源| 成人国语在线视频| 亚洲国产精品999| 丰满少妇做爰视频| 国产成人影院久久av| 99久久人妻综合| 国产精品欧美亚洲77777| 亚洲精品粉嫩美女一区| 色婷婷久久久亚洲欧美| 国产熟女午夜一区二区三区| 久久国产精品男人的天堂亚洲| 久久人人爽av亚洲精品天堂| 日韩欧美免费精品| 亚洲中文字幕日韩| 欧美黄色淫秽网站| 人妻一区二区av| 亚洲精品国产av成人精品| 又大又爽又粗| 99国产极品粉嫩在线观看| 高清在线国产一区| 老司机影院毛片| 日韩 亚洲 欧美在线| 国产国语露脸激情在线看| 久久亚洲精品不卡| 中文字幕高清在线视频| 亚洲一区二区三区欧美精品| 精品亚洲乱码少妇综合久久| av网站在线播放免费| 考比视频在线观看| 丰满迷人的少妇在线观看| 日本精品一区二区三区蜜桃| 黄色a级毛片大全视频| 亚洲精品美女久久久久99蜜臀| 淫妇啪啪啪对白视频 | 三级毛片av免费| 涩涩av久久男人的天堂| 亚洲国产欧美在线一区| 国产淫语在线视频| 多毛熟女@视频| av视频免费观看在线观看| 久久久久精品国产欧美久久久 | 别揉我奶头~嗯~啊~动态视频 | 热99re8久久精品国产| 成年人午夜在线观看视频| 美女福利国产在线| 亚洲人成77777在线视频| a级毛片黄视频| 又大又爽又粗| a级毛片黄视频| 一级,二级,三级黄色视频| 国产日韩欧美视频二区| 久久九九热精品免费| 狠狠精品人妻久久久久久综合| 久久久久视频综合| 国产精品麻豆人妻色哟哟久久| 国产片内射在线| 岛国毛片在线播放| 亚洲专区字幕在线| 久久人妻熟女aⅴ| 国产精品99久久99久久久不卡| 电影成人av| 美女国产高潮福利片在线看| a级毛片在线看网站| 国产一级毛片在线| 视频区图区小说| 天天躁夜夜躁狠狠躁躁| 日韩制服骚丝袜av| 久久国产精品男人的天堂亚洲| 国产精品 欧美亚洲| 欧美激情 高清一区二区三区| 91精品国产国语对白视频| 美女脱内裤让男人舔精品视频| a 毛片基地| 国产色视频综合| 久久久久久久国产电影| 色婷婷av一区二区三区视频| 欧美97在线视频| 搡老乐熟女国产| 日本黄色日本黄色录像| 大片免费播放器 马上看| 满18在线观看网站| 日韩一区二区三区影片| 日本av免费视频播放| 韩国精品一区二区三区| 最新在线观看一区二区三区| avwww免费| 久久99热这里只频精品6学生| 99国产综合亚洲精品| 一二三四在线观看免费中文在| 别揉我奶头~嗯~啊~动态视频 | 黄频高清免费视频| 欧美精品啪啪一区二区三区 | 久久国产精品人妻蜜桃| 国产亚洲欧美在线一区二区| 免费日韩欧美在线观看| 又大又爽又粗| av一本久久久久| 国产淫语在线视频| 国产一区二区 视频在线| 成人免费观看视频高清| 亚洲va日本ⅴa欧美va伊人久久 | 法律面前人人平等表现在哪些方面 | 一级,二级,三级黄色视频| 悠悠久久av| 日韩中文字幕视频在线看片|