• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    工程地質(zhì)資料檢索系統(tǒng)的設(shè)計(jì)和應(yīng)用

    2022-03-16 03:59:14朱泳標(biāo)
    關(guān)鍵詞:工程地質(zhì)里程結(jié)構(gòu)化

    楊 科,朱泳標(biāo),李 娜

    (中鐵二院工程集團(tuán)有限責(zé)任公司,四川 成都 610031)

    0 引 言

    鐵路工程地質(zhì)勘察階段中會(huì)產(chǎn)生大量資料,這些資料在施工建設(shè)期作為線路、路基、橋梁、隧道等專(zhuān)業(yè)設(shè)計(jì)依據(jù)之一,同時(shí)是鐵路工程項(xiàng)目的關(guān)鍵基礎(chǔ)資料。圍繞鐵路工程地質(zhì)資料一體化、標(biāo)準(zhǔn)化建設(shè)已持續(xù)多年,隨著鐵路工程建設(shè)項(xiàng)目穩(wěn)步增長(zhǎng),資料數(shù)量逐年增加,對(duì)資料的查閱暴露出響應(yīng)速度慢、資料類(lèi)型繁多、格式不統(tǒng)一等問(wèn)題,傳統(tǒng)的歸檔查詢(xún)已經(jīng)越來(lái)越難以滿足管理和使用要求,利用信息化前沿技術(shù),對(duì)傳統(tǒng)的查詢(xún)系統(tǒng)進(jìn)行智能化改造已經(jīng)刻不容緩。分布式檢索平臺(tái)是大數(shù)據(jù)生態(tài)圈中重要的組成部分,依托分布式橫向擴(kuò)展和倒排索引技術(shù),不僅支持處理PB級(jí)海量數(shù)據(jù)檢索,還能提高檢索效率,將耗時(shí)控制在毫秒級(jí)。該文借助分布式檢索平臺(tái),對(duì)工程地質(zhì)資料查詢(xún)過(guò)程中的難點(diǎn)、痛點(diǎn)進(jìn)行問(wèn)題分析,并通過(guò)大數(shù)據(jù)優(yōu)化設(shè)計(jì),實(shí)現(xiàn)了一套工程地質(zhì)資料檢索系統(tǒng)。

    1 問(wèn)題描述

    1.1 檢索資料的廣度問(wèn)題

    工程地質(zhì)專(zhuān)業(yè)主要為設(shè)計(jì)專(zhuān)業(yè)提供基礎(chǔ)數(shù)據(jù),傳統(tǒng)上,地質(zhì)人員通過(guò)模板整理資料,并提交給其他專(zhuān)業(yè)設(shè)計(jì)人員。設(shè)計(jì)人員在參考資料的時(shí)候,按照習(xí)慣和模板約束,在眾多資料里逐層手動(dòng)搜索,找到想要的文檔或圖像。在數(shù)據(jù)量大的情況下,這種方式效率較為低下,對(duì)于設(shè)計(jì)人員而言,所有資料應(yīng)該是一種“平面化”的數(shù)據(jù),自己只需要輸入搜索關(guān)鍵字,就能從這些平面化數(shù)據(jù)中得到想要的結(jié)果。

    例如想搜索某條線路里某段范圍內(nèi)的“風(fēng)化帶”資料,那么包括“風(fēng)化帶”的所有資料應(yīng)該以評(píng)分高低返回給用戶,評(píng)分越高的資料代表其更接近用戶的檢索意圖。但現(xiàn)實(shí)是,工程地質(zhì)資料分為地質(zhì)說(shuō)明書(shū)、地質(zhì)平面圖、縱橫斷面圖、試驗(yàn)結(jié)果表等類(lèi)型,包括了Office、AutoCAD、PDF、文本文件、圖像等多種格式,要在此多源異構(gòu)、非結(jié)構(gòu)化的數(shù)據(jù)背景下,完成海量數(shù)據(jù)檢索,且結(jié)果要高度貼合用戶意圖,就需要在“平面化”資料一側(cè)覆蓋所有文件格式,將其轉(zhuǎn)換、加載為文本。在檢索引擎一側(cè)支持服務(wù)的水平擴(kuò)展,為海量數(shù)據(jù)的實(shí)時(shí)檢索提供基礎(chǔ)支撐。

    1.2 檢索資料的深度問(wèn)題

    對(duì)地質(zhì)資料的檢索和應(yīng)用還存在更深層次的挖掘問(wèn)題,即怎么從簡(jiǎn)單的資料里獲取更多的信息,比如加入位置信息能夠方便用戶從地圖上直觀發(fā)現(xiàn)該資料,加入線路和工點(diǎn)信息則幫助用戶縮小檢索范圍,從而提高檢索的效率、精度。從信息論的角度來(lái)看,更多的信息,能使檢索的不確定性減少。增加信息量的方式,就是挖掘隱藏在已有資料之間的上下文信息。資料原作者在編寫(xiě)過(guò)程中,存在沒(méi)有明確寫(xiě)入事件發(fā)生的地點(diǎn)和時(shí)間的情況,究其原因可能是當(dāng)時(shí)編寫(xiě)環(huán)境就暗含了這些信息,也可能是資料存儲(chǔ)的路徑包含了這些信息,但是隨著文件上傳到中心平臺(tái),被分布式系統(tǒng)分塊、冗余到各個(gè)服務(wù)器后,上下文信息在轉(zhuǎn)移過(guò)程丟失。檢索資料的深度問(wèn)題,即如何利用技術(shù)手段和分析算法還原這些信息的問(wèn)題。

    1.3 檢索資料的存儲(chǔ)問(wèn)題

    工程地質(zhì)資料通常存儲(chǔ)在磁盤(pán)陣列(RAID)上,依靠RAID的冗余能力實(shí)現(xiàn)資料的妥善存儲(chǔ)。但是在對(duì)數(shù)據(jù)進(jìn)行挖掘和分析的情況下,磁盤(pán)陣列和分析系統(tǒng)位于不同的I/O會(huì)導(dǎo)致傳輸量大、延遲高等問(wèn)題,海量數(shù)據(jù)則會(huì)將該問(wèn)題更加放大。另一方面,需要基于RAID搭建文件服務(wù),在用戶檢索到某份資料并想下載的時(shí)候,需要從業(yè)務(wù)服務(wù)切換到文件系統(tǒng)服務(wù),進(jìn)一步增加了延遲,影響用戶體驗(yàn)。

    2 設(shè)計(jì)實(shí)現(xiàn)

    為了解決上述問(wèn)題,該文設(shè)計(jì)和實(shí)現(xiàn)了基于分布式檢索引擎的工程地質(zhì)資料檢索系統(tǒng),重點(diǎn)解決了從海量異構(gòu)資料中結(jié)構(gòu)化文檔資料、挖掘隱藏信息,并將原始資料妥善存儲(chǔ)在檢索系統(tǒng)內(nèi)部的問(wèn)題,提供了一個(gè)用戶友好、性能強(qiáng)大的資料檢索解決方案。

    2.1 搜索引擎選型

    Elasticsearch是一個(gè)基于Apache Lucene的分布式搜索引擎,它在Lucene支持的功能之上,提供了在節(jié)點(diǎn)管理、節(jié)點(diǎn)發(fā)現(xiàn)、建索引、查詢(xún)的功能,并提供了對(duì)開(kāi)發(fā)友好的 REST API,能夠較快實(shí)現(xiàn)多源異構(gòu)數(shù)據(jù)的交換。Elasticsearch采用倒排索引技術(shù),詞組全文檢索的準(zhǔn)確度、效率都遠(yuǎn)高于同類(lèi)產(chǎn)品,并且作為分布式原生架構(gòu),其水平擴(kuò)展的配置簡(jiǎn)單,可以做到按需擴(kuò)容,即使作為單點(diǎn)部署,在海量數(shù)據(jù)下仍然保持高響應(yīng)速度和高吞吐率。

    國(guó)內(nèi)已有很多學(xué)者將Elasticsearch用于各個(gè)行業(yè),解決了很多業(yè)務(wù)系統(tǒng)的檢索問(wèn)題。結(jié)合工程地質(zhì)資料特點(diǎn),以及對(duì)廣度、深度和存儲(chǔ)問(wèn)題的綜合分析,選擇以Elasticsearch作為基礎(chǔ)平臺(tái)開(kāi)發(fā)搭建地質(zhì)資料檢索系統(tǒng)。

    2.2 元數(shù)據(jù)設(shè)計(jì)

    元數(shù)據(jù)是描述數(shù)據(jù)的數(shù)據(jù),是數(shù)據(jù)屬性的結(jié)構(gòu)化信息,為數(shù)據(jù)的挖掘提供模板。從系統(tǒng)分析的角度來(lái)看,元數(shù)據(jù)約束了工程地質(zhì)資料應(yīng)具備的信息量,也為檢索系統(tǒng)定義了基本的數(shù)據(jù)結(jié)構(gòu)。良好設(shè)計(jì)的元數(shù)據(jù),能夠幫助檢索縮小范圍、提高命中率。

    按照用戶對(duì)資料檢索的使用習(xí)慣,結(jié)合對(duì)工程地質(zhì)資料的分析,該文將元數(shù)據(jù)分為兩大類(lèi),第一類(lèi)是對(duì)資料分類(lèi)的描述。資料分類(lèi)是本系統(tǒng)最大的變量,不僅新工程的納入會(huì)增加分類(lèi)數(shù)量,舊有的分類(lèi)也會(huì)隨著系統(tǒng)使用而更新關(guān)鍵字,因此,分類(lèi)元數(shù)據(jù)應(yīng)該設(shè)計(jì)為一個(gè)全局的、可維護(hù)的基礎(chǔ)字典,最終形成如表1所示的結(jié)構(gòu)。

    表1 資料分類(lèi)元數(shù)據(jù)設(shè)計(jì)

    資料分類(lèi)在系統(tǒng)上線前,通過(guò)梳理既有資料,統(tǒng)計(jì)得到資料分類(lèi)的關(guān)鍵詞組,再組織地質(zhì)人員和相關(guān)專(zhuān)家對(duì)關(guān)鍵詞組進(jìn)行篩選后,將篩選結(jié)果存入Elasticsearch。

    第二類(lèi)是對(duì)資料數(shù)據(jù)的描述,是資料在系統(tǒng)內(nèi)部的組織方式。用戶的檢索方式不局限于文字信息檢索,還包括地圖選點(diǎn)等方式以位置信息搜索資料。資料數(shù)據(jù)元數(shù)據(jù)設(shè)計(jì)為如表2所示的結(jié)構(gòu)。

    表2 資料數(shù)據(jù)結(jié)構(gòu)元數(shù)據(jù)設(shè)計(jì)

    資料數(shù)據(jù)在系統(tǒng)上線后,通過(guò)資料上傳頁(yè)面,由用戶批量導(dǎo)入資料。系統(tǒng)將對(duì)資料進(jìn)行預(yù)處理、結(jié)構(gòu)化、文本挖掘,得到元數(shù)據(jù)約束的信息,并存入Elasticsearch。

    2.3 資料預(yù)處理

    資料預(yù)處理是對(duì)工程地質(zhì)原始資料進(jìn)行數(shù)據(jù)清洗和轉(zhuǎn)換的過(guò)程,以確保入庫(kù)資料的有效性。通過(guò)對(duì)各類(lèi)資料的分析,發(fā)現(xiàn)大部分資料具備元數(shù)據(jù)要求信息量,以Word格式的“地質(zhì)說(shuō)明書(shū)”為例,其中包括了線路、里程和地質(zhì)信息,而dwg格式的“橫斷面圖”則包括了日期、線路、里程信息,但是不少文檔仍然需要一個(gè)或者多個(gè)信息才能補(bǔ)全元數(shù)據(jù)結(jié)構(gòu)。同時(shí)還存在少數(shù)資料,特別是一些數(shù)據(jù)緩存文件,只是作為數(shù)據(jù)計(jì)算過(guò)程的中間結(jié)果,不具備檢索的意義,應(yīng)通過(guò)數(shù)據(jù)清洗將這類(lèi)資料過(guò)濾掉。清洗的方法包括后綴名過(guò)濾、對(duì)文件名進(jìn)行正則表達(dá)式搜索淘汰。由于地質(zhì)資料這類(lèi)非結(jié)構(gòu)化數(shù)據(jù)需要對(duì)文件內(nèi)容進(jìn)行文本抽取后才能結(jié)構(gòu)化,因此很難在預(yù)處理階段應(yīng)用數(shù)據(jù)合法性檢查、一致性檢查等結(jié)構(gòu)化的清洗方法,對(duì)數(shù)據(jù)進(jìn)行補(bǔ)全和糾正將放在對(duì)文本進(jìn)行抽取、結(jié)構(gòu)化之后。

    數(shù)據(jù)轉(zhuǎn)換主要針對(duì)Office文件,特別是Office 2007之前的格式,這些文件不能被腳本語(yǔ)言直接抽取出文字,需要轉(zhuǎn)換為docx、xlsx等格式才能被后續(xù)流程處理。預(yù)處理流程如圖1所示。

    圖1 數(shù)據(jù)預(yù)處理流程

    2.4 文本抽取與結(jié)構(gòu)化

    文本抽取是整個(gè)系統(tǒng)的核心,設(shè)計(jì)的難點(diǎn)在于需要一套運(yùn)行在Linux服務(wù)器上,自動(dòng)化抽取多種資料格式的集成處理程序。考慮到系統(tǒng)將會(huì)使用到多種前沿技術(shù),以及對(duì)Linux系統(tǒng)的支持,程序由Python語(yǔ)言實(shí)現(xiàn)能夠很好地“粘合”這些不同技術(shù)。

    在數(shù)據(jù)預(yù)處理流程后,地質(zhì)資料可以分為四種類(lèi)型,第一類(lèi)是Office文檔,包括Word、PowerPoint、Excel格式。第二類(lèi)是PDF文檔,主要包括圖像和文字兩大類(lèi)內(nèi)容。第三類(lèi)是CAD文件,通常為dwg格式,主要內(nèi)容包括了平面圖和縱橫斷面圖。最后一類(lèi)是圖像,包括巖芯和踏勘現(xiàn)場(chǎng)圖像,這類(lèi)文件不僅數(shù)據(jù)量特別大,而且對(duì)工程地質(zhì)人員的工作開(kāi)展有極大的幫助,是重要的工程地質(zhì)資料。另外需要考慮后續(xù)應(yīng)用過(guò)程中,更多的資料類(lèi)型加入檢索,在設(shè)計(jì)階段,遵循對(duì)修改封閉,對(duì)擴(kuò)展開(kāi)放的原則,采用工廠方法模式,根據(jù)輸入文檔的格式,設(shè)計(jì)不同的工廠類(lèi)處理不同的地質(zhì)資料。以目前的四類(lèi)資料為主,每個(gè)工廠類(lèi)生成如下產(chǎn)品:

    (1)Office文件的抽取。

    Python中有多個(gè)庫(kù)可以對(duì)Office 2007以后的版本進(jìn)行全文提取,而圖像、樣式等信息將會(huì)被丟棄,只獲取所有文本內(nèi)容、作者和編輯時(shí)間。

    (2)PDF文件的抽取。

    根據(jù)對(duì)地質(zhì)PDF文件的研究,發(fā)現(xiàn)具有文本抽取價(jià)值的文件,大多數(shù)是文本型的,在Linux中有多個(gè)可執(zhí)行程序,可以將其中的文本提取出來(lái),使用Python的subprocess庫(kù),啟動(dòng)子進(jìn)程來(lái)處理PDF文件,提取出的文字存入緩存文件,再由Python腳本獲取。

    (3)CAD文件的抽取。

    目前已經(jīng)有多個(gè)商業(yè)或開(kāi)源的庫(kù)可以處理CAD文件,在Linux上可以選擇的控件比較少,libdxfrw開(kāi)源了對(duì)大多數(shù)版本CAD的解析,并支持Linux上GCC編譯。編寫(xiě)?yīng)毩⒌腖inux可執(zhí)行程序,調(diào)用相關(guān)函數(shù)從dwg文件對(duì)象(AcDbObject)的文本區(qū)域提取出所有文字,存入緩存文件,再由Python腳本訪問(wèn)緩存文件得到文本內(nèi)容。

    (4)圖像的抽取。

    圖像目前是處理最為耗時(shí)的一類(lèi)資料。主要思路是通過(guò)目標(biāo)檢測(cè)算法找到圖像中的實(shí)體,并根據(jù)這些實(shí)體能夠得到語(yǔ)義上的聯(lián)系。該文通過(guò)卷積神經(jīng)網(wǎng)絡(luò)和YOLO V3訓(xùn)練了地質(zhì)資料中常見(jiàn)的一些實(shí)體,例如巖芯中的泥土、巖石、鉆孔巖芯等,生成了一個(gè)可以識(shí)別這些實(shí)體的模型。在對(duì)圖像進(jìn)行處理中,首先讀取該模型對(duì)圖像中的實(shí)體進(jìn)行檢測(cè),再對(duì)檢測(cè)到的所有實(shí)體進(jìn)行去重,最后根據(jù)這些實(shí)體查詢(xún)實(shí)體關(guān)系字典,得到圖像的分類(lèi)。例如,一張圖像通過(guò)實(shí)體檢測(cè),得到了多個(gè)泥土、泥巖、鉆孔巖芯框?qū)嶓w,通過(guò)查詢(xún)實(shí)體關(guān)系字典,這張圖像很可能就是現(xiàn)場(chǎng)的鉆孔巖芯圖。

    文本抽取的類(lèi)設(shè)計(jì)如圖2所示,僅以O(shè)ffice文件和圖像抽取為例。

    圖2 文本抽取工廠方法類(lèi)圖

    原始文件經(jīng)過(guò)文本抽取后,得到原始文本、作者、編輯時(shí)間等元數(shù)據(jù)約束的信息。還需要對(duì)原始文本結(jié)構(gòu)化處理,為后續(xù)的挖掘提供關(guān)鍵字、詞頻等重要信息。但文本結(jié)構(gòu)化本身是一個(gè)復(fù)雜流程,應(yīng)根據(jù)待獲取的信息,將該流程分解為多個(gè)較小的子流程,逐步降低復(fù)雜度,具體流程如下:

    (1)去除停用詞,利用地勘語(yǔ)料庫(kù)進(jìn)行中文分詞,統(tǒng)計(jì)前20個(gè)詞頻較高的詞組并緩存。

    (2)調(diào)用中文文本摘要算法進(jìn)行單文本摘要,對(duì)應(yīng)元數(shù)據(jù)的“摘要”信息。

    (3)對(duì)原始文本進(jìn)行正則表達(dá)式搜索,得到線路里程信息。里程信息通常是以CK、DK、D1K、D2K冠號(hào)開(kāi)始,加上1 000以?xún)?nèi)的數(shù)字組成,由起始里程和終止里程成對(duì)出現(xiàn),如DK11+123~DK15+789。原始文本中可能包括多個(gè)里程信息對(duì),通常出現(xiàn)頻率最高的才是真正里程信息,但是為了防止關(guān)鍵信息丟失,所有里程文字和出現(xiàn)頻率作為鍵值對(duì)一起緩存,便于后續(xù)挖掘處理。

    (4)對(duì)于圖像這類(lèi)特殊資料,不參與分詞或摘要流程,直接將圖像抽取后得到實(shí)體名稱(chēng)作為詞組緩存。

    經(jīng)過(guò)文本抽取和結(jié)構(gòu)化后,元數(shù)據(jù)要求的大多數(shù)信息已經(jīng)具備,剩下較為隱蔽的信息等待挖掘。

    2.5 隱藏信息挖掘

    隱藏信息是指不明確寫(xiě)入資料,或者需要對(duì)資料進(jìn)行多次處理后才能得到的信息。結(jié)構(gòu)化后的原始文本中可能包括了線路、工點(diǎn)、資料類(lèi)型等關(guān)鍵信息,但是存在命名不一致、二義性等問(wèn)題,另外圖像資料則可能不包含上述任何信息。因此,應(yīng)在結(jié)構(gòu)化后應(yīng)用聚類(lèi)、相似度算法盡量挖掘出線路、位置等關(guān)鍵信息。

    (1)時(shí)間聚類(lèi),找到資料的時(shí)間軸。

    在資料中包括了眾多時(shí)間,有踏勘時(shí)間、編寫(xiě)時(shí)間、匯報(bào)時(shí)間,文檔本身還具備最近編輯時(shí)間,在這諸多時(shí)間中,哪一個(gè)時(shí)間更具備參考意義。當(dāng)完成文本結(jié)構(gòu)化后,不妨對(duì)單個(gè)文檔進(jìn)行升維,將其映射到本次上傳的所有文本中的時(shí)間維度中,因?yàn)橛脩舻氖褂昧?xí)慣往往同一批文件屬于同期所做工作的匯編。然后再對(duì)所有時(shí)間進(jìn)行K-means聚類(lèi),最后將單個(gè)文檔里的所有時(shí)間,與聚類(lèi)各個(gè)分簇中心計(jì)算歐氏距離,距離最短的時(shí)間往往更具備代表性,能夠體現(xiàn)該資料在時(shí)間軸上,與同批次文件編寫(xiě)的強(qiáng)關(guān)聯(lián)性,選擇該時(shí)間作為本資料的編輯時(shí)間。圖3表示了只對(duì)時(shí)間信息中的日期進(jìn)行聚類(lèi)后的結(jié)果。圖4為時(shí)間信息挖掘流程。

    圖3 同批次資料內(nèi)含時(shí)間信息聚類(lèi)示意圖

    圖4 時(shí)間信息挖掘流程

    (2)坐標(biāo)反算結(jié)合非極大值抑制,分析資料的位置信息。

    由于工程地質(zhì)資料都采用投影坐標(biāo)作為項(xiàng)目坐標(biāo),每個(gè)項(xiàng)目中央子午線和投影高是不同的,必須通過(guò)坐標(biāo)轉(zhuǎn)換系統(tǒng),對(duì)資料的項(xiàng)目坐標(biāo)進(jìn)行坐標(biāo)反算,得到其GPS坐標(biāo),這個(gè)坐標(biāo)是對(duì)資料最精確的位置描述,可以直接作為位置信息進(jìn)行存儲(chǔ)。但是很多資料并不具備項(xiàng)目坐標(biāo),而是里程信息,并且一個(gè)資料內(nèi)含多個(gè)里程信息,在前一步驟中,已經(jīng)得到了多對(duì)和多個(gè)里程作為候選信息,消除重疊的找到最佳的里程即能完善該資料的位置信息。具體做法是利用坐標(biāo)轉(zhuǎn)換系統(tǒng)將其轉(zhuǎn)換為GPS坐標(biāo),再沿線路方向建立笛卡爾坐標(biāo)系,圍繞GPS坐標(biāo)形成一個(gè)矩形,每個(gè)矩形具備一個(gè)分?jǐn)?shù)值,即該里程對(duì)的詞頻,如圖6所示,沿線路方向,將里程信息對(duì)轉(zhuǎn)換為左右兩個(gè)GPS坐標(biāo)點(diǎn),默認(rèn)500米作為矩形高度,單個(gè)里程則為500米的正方形。圖中深色的矩形為當(dāng)前詞頻最高的里程信息,計(jì)算剩余的矩形和該矩形的重疊區(qū)域(IOU),當(dāng)IOU大于預(yù)設(shè)值,則淘汰該里程信息。再在小于預(yù)設(shè)值的里程信息里選擇詞頻最高的,進(jìn)行下一次循環(huán),如圖中可以得到兩對(duì)里程信息,其對(duì)應(yīng)的GPS坐標(biāo)以空格分隔存儲(chǔ)到“位置信息”中。

    圖5 位置信息挖掘流程

    圖6 非極大值抑制算法獲取最佳里程示意圖

    (3)相似度算法,挖掘資料的分類(lèi)信息。

    在結(jié)構(gòu)化處理后,已經(jīng)具備了單個(gè)資料詞組到詞頻的映射,查詢(xún)Elasticsearch中的文檔分類(lèi)數(shù)據(jù),將分類(lèi)中的詞組詞頻映射取出,兩者計(jì)算余弦相似度,最相似的分類(lèi)即為該資料分類(lèi),最后存儲(chǔ)到“類(lèi)型信息”中。文檔分類(lèi)數(shù)據(jù)也需要定時(shí)更新維護(hù),通過(guò)同類(lèi)文檔的關(guān)鍵字的聚合,在專(zhuān)家的建議確認(rèn)下,逐步提高模型的準(zhǔn)確性。由圖7可見(jiàn),隨著同類(lèi)文檔的數(shù)量增加,單個(gè)文檔與同類(lèi)文檔的相似度越來(lái)越大,雖然數(shù)量達(dá)到一定量后,相似度有所下降,這是由于更多的關(guān)鍵字加入會(huì)降低相似度,但是整體保持了較高的相似度,保證了文檔分類(lèi)的準(zhǔn)確率。

    圖7 單個(gè)資料與相同分類(lèi)資料的余弦相似度折線圖

    在完成所有隱藏信息挖掘后,將原始文件通過(guò)BASE64編碼轉(zhuǎn)換成字符串,對(duì)應(yīng)到元數(shù)據(jù)中的“原始文件”,便于用戶在檢索到該資料后,快速的解碼并下載。該方式也可以最大化利用分布式系統(tǒng)的性能,防止文件下載的單點(diǎn)故障。

    3 結(jié)束語(yǔ)

    該文引入分布式搜索引擎,結(jié)合軟件設(shè)計(jì)模式和數(shù)據(jù)挖掘方法,實(shí)現(xiàn)了工程地質(zhì)資料檢索系統(tǒng),該系統(tǒng)已經(jīng)在中鐵二院地勘巖土工程設(shè)計(jì)研究院的多個(gè)項(xiàng)目組投入使用,并在兄弟設(shè)計(jì)單位中得到應(yīng)用驗(yàn)證。根據(jù)反饋,該系統(tǒng)支持資料格式多、檢索命中率高、檢索速度快、使用簡(jiǎn)單的特點(diǎn)得到了用戶的肯定,從根本上改變了傳統(tǒng)資料檢索的使用方式,提高了地質(zhì)、設(shè)計(jì)人員的工作效率。

    隨著川藏線、成渝中線等重大鐵路工程項(xiàng)目的推進(jìn),該系統(tǒng)將為廣大地質(zhì)人員、工程設(shè)計(jì)人員的工作、科研提供有力幫助。

    猜你喜歡
    工程地質(zhì)里程結(jié)構(gòu)化
    繼往開(kāi)來(lái) 守正創(chuàng)新——河北省水文工程地質(zhì)勘查院
    促進(jìn)知識(shí)結(jié)構(gòu)化的主題式復(fù)習(xí)初探
    結(jié)構(gòu)化面試方法在研究生復(fù)試中的應(yīng)用
    水文地質(zhì)在工程地質(zhì)勘察中的有效應(yīng)用
    騰勢(shì)400 用在上海市區(qū)的來(lái)回穿梭克服里程焦慮
    車(chē)迷(2017年12期)2018-01-18 02:16:12
    幸福合力 開(kāi)啟幸福里程
    幸福合力 開(kāi)啟幸福里程
    ABAQUS軟件在工程地質(zhì)勘察中的應(yīng)用
    算里程
    基于圖模型的通用半結(jié)構(gòu)化數(shù)據(jù)檢索
    高清av免费在线| 色综合欧美亚洲国产小说| 桃花免费在线播放| 黑人猛操日本美女一级片| 国产aⅴ精品一区二区三区波| 久久人妻av系列| 欧美大码av| 国产区一区二久久| 欧美人与性动交α欧美软件| 亚洲一区二区三区欧美精品| 精品一品国产午夜福利视频| 亚洲熟女毛片儿| 淫妇啪啪啪对白视频| 最黄视频免费看| 日韩熟女老妇一区二区性免费视频| 午夜激情av网站| 亚洲国产中文字幕在线视频| 久久久精品免费免费高清| 丝袜喷水一区| 国产精品久久久人人做人人爽| 午夜福利,免费看| 久久精品aⅴ一区二区三区四区| 国产欧美日韩一区二区三| 日韩精品免费视频一区二区三区| 十八禁网站网址无遮挡| 国产有黄有色有爽视频| 国产精品成人在线| 首页视频小说图片口味搜索| 久久人妻av系列| 日日爽夜夜爽网站| 国产精品久久久久久精品电影小说| 妹子高潮喷水视频| 巨乳人妻的诱惑在线观看| 国产日韩欧美在线精品| 亚洲精品国产精品久久久不卡| 日韩视频一区二区在线观看| 丝袜人妻中文字幕| 电影成人av| 青草久久国产| 国产精品秋霞免费鲁丝片| 男女免费视频国产| 久久九九热精品免费| 日韩熟女老妇一区二区性免费视频| 国产91精品成人一区二区三区 | 午夜福利,免费看| 黄网站色视频无遮挡免费观看| 国产免费视频播放在线视频| 50天的宝宝边吃奶边哭怎么回事| 欧美黄色淫秽网站| 青草久久国产| 精品人妻熟女毛片av久久网站| 国产欧美日韩一区二区三区在线| 国产在视频线精品| 在线av久久热| 亚洲性夜色夜夜综合| 91字幕亚洲| 在线十欧美十亚洲十日本专区| 在线观看舔阴道视频| 啦啦啦视频在线资源免费观看| 黑人猛操日本美女一级片| 一级片'在线观看视频| 一本—道久久a久久精品蜜桃钙片| 香蕉国产在线看| 夜夜爽天天搞| 亚洲精品国产精品久久久不卡| 男女床上黄色一级片免费看| 亚洲av欧美aⅴ国产| 麻豆国产av国片精品| 婷婷丁香在线五月| 久久国产亚洲av麻豆专区| 免费观看a级毛片全部| 在线观看人妻少妇| 欧美日韩国产mv在线观看视频| 精品久久久久久电影网| 性高湖久久久久久久久免费观看| 欧美老熟妇乱子伦牲交| 国产福利在线免费观看视频| 波多野结衣av一区二区av| 国产成人免费无遮挡视频| 99在线人妻在线中文字幕 | 精品福利永久在线观看| 免费观看人在逋| 1024香蕉在线观看| 国产一区二区三区综合在线观看| a级片在线免费高清观看视频| 国产精品国产av在线观看| 十八禁网站免费在线| a级片在线免费高清观看视频| 18禁国产床啪视频网站| 精品一品国产午夜福利视频| 亚洲视频免费观看视频| 男女下面插进去视频免费观看| 男人操女人黄网站| 国产精品一区二区在线不卡| 国产精品国产高清国产av | 久久 成人 亚洲| 国产精品久久久久久精品电影小说| 男人舔女人的私密视频| 捣出白浆h1v1| 亚洲精华国产精华精| 精品久久久久久电影网| 热re99久久国产66热| 亚洲欧美日韩另类电影网站| 国产不卡一卡二| 免费高清在线观看日韩| 美女主播在线视频| 国产高清videossex| 欧美日韩国产mv在线观看视频| 久热爱精品视频在线9| 国产日韩欧美亚洲二区| 人妻 亚洲 视频| 国产精品免费视频内射| 老司机影院毛片| 黄色成人免费大全| 夫妻午夜视频| 久久性视频一级片| a级片在线免费高清观看视频| 三上悠亚av全集在线观看| 女性被躁到高潮视频| 亚洲欧洲日产国产| 久久精品亚洲av国产电影网| 飞空精品影院首页| 最黄视频免费看| 欧美日本中文国产一区发布| 国产91精品成人一区二区三区 | 国产精品 国内视频| 午夜福利在线观看吧| 久久久久久久久久久久大奶| 纵有疾风起免费观看全集完整版| 夜夜爽天天搞| 久久久久国内视频| 久久免费观看电影| 免费高清在线观看日韩| 亚洲精品在线观看二区| 美女扒开内裤让男人捅视频| 亚洲熟女精品中文字幕| a级毛片在线看网站| 国产成人精品在线电影| 亚洲人成77777在线视频| 91成年电影在线观看| 国产精品av久久久久免费| 在线天堂中文资源库| 日韩 欧美 亚洲 中文字幕| 91精品国产国语对白视频| 脱女人内裤的视频| 老汉色∧v一级毛片| 久久精品国产亚洲av香蕉五月 | 亚洲性夜色夜夜综合| av福利片在线| 黄色毛片三级朝国网站| 欧美日韩亚洲高清精品| 亚洲,欧美精品.| 人成视频在线观看免费观看| 国产男女内射视频| 国产精品一区二区精品视频观看| 国产高清激情床上av| 99在线人妻在线中文字幕 | 精品人妻熟女毛片av久久网站| 手机成人av网站| 99九九在线精品视频| 亚洲欧洲精品一区二区精品久久久| 亚洲综合色网址| 国产精品久久电影中文字幕 | 少妇猛男粗大的猛烈进出视频| 男女高潮啪啪啪动态图| 纵有疾风起免费观看全集完整版| 欧美精品人与动牲交sv欧美| 男女之事视频高清在线观看| 国产精品av久久久久免费| 国产一区二区三区在线臀色熟女 | 精品少妇一区二区三区视频日本电影| 中文字幕高清在线视频| 看免费av毛片| 精品第一国产精品| 成人黄色视频免费在线看| 国产成人精品在线电影| 两个人免费观看高清视频| 一边摸一边做爽爽视频免费| 国产在线精品亚洲第一网站| 最黄视频免费看| 电影成人av| 欧美日韩中文字幕国产精品一区二区三区 | 99re6热这里在线精品视频| 成人国产一区最新在线观看| 精品久久久精品久久久| av一本久久久久| tocl精华| 欧美日韩亚洲综合一区二区三区_| 他把我摸到了高潮在线观看 | 嫩草影视91久久| 欧美精品啪啪一区二区三区| 黄色丝袜av网址大全| 午夜精品久久久久久毛片777| 国产有黄有色有爽视频| 少妇粗大呻吟视频| 无限看片的www在线观看| 欧美国产精品一级二级三级| 波多野结衣一区麻豆| 99精国产麻豆久久婷婷| 国产精品麻豆人妻色哟哟久久| 亚洲欧美精品综合一区二区三区| 久久热在线av| 18禁裸乳无遮挡动漫免费视频| 日韩人妻精品一区2区三区| 精品少妇黑人巨大在线播放| 日本五十路高清| 又紧又爽又黄一区二区| 国产av国产精品国产| 国产极品粉嫩免费观看在线| 日韩欧美免费精品| 欧美黑人欧美精品刺激| 久久人人97超碰香蕉20202| 亚洲欧美日韩另类电影网站| 国产精品欧美亚洲77777| 精品久久久久久久毛片微露脸| 男女无遮挡免费网站观看| 免费在线观看影片大全网站| 精品少妇内射三级| 在线播放国产精品三级| 丝袜人妻中文字幕| 51午夜福利影视在线观看| av超薄肉色丝袜交足视频| 自线自在国产av| av超薄肉色丝袜交足视频| 久久久久久久久久久久大奶| 亚洲av欧美aⅴ国产| 大型av网站在线播放| 一夜夜www| 18禁美女被吸乳视频| 狠狠婷婷综合久久久久久88av| 亚洲性夜色夜夜综合| 天天添夜夜摸| 国产一区二区三区在线臀色熟女 | 中文字幕人妻丝袜制服| 露出奶头的视频| 国产三级黄色录像| 国产极品粉嫩免费观看在线| 免费观看av网站的网址| 亚洲精品美女久久久久99蜜臀| 国产在线免费精品| 日韩三级视频一区二区三区| 91精品三级在线观看| 国产精品免费一区二区三区在线 | 色婷婷av一区二区三区视频| 国产成人av教育| 欧美日韩福利视频一区二区| 在线观看免费午夜福利视频| 久久这里只有精品19| 精品久久久久久电影网| 最新在线观看一区二区三区| aaaaa片日本免费| 国产精品秋霞免费鲁丝片| 欧美人与性动交α欧美精品济南到| 男人操女人黄网站| 一区二区av电影网| 18禁黄网站禁片午夜丰满| 女人精品久久久久毛片| 成人国语在线视频| av一本久久久久| 成人18禁高潮啪啪吃奶动态图| 中文字幕最新亚洲高清| 少妇的丰满在线观看| 十分钟在线观看高清视频www| 精品久久蜜臀av无| 高清av免费在线| 婷婷丁香在线五月| 国产激情久久老熟女| 在线播放国产精品三级| 免费av中文字幕在线| 中文字幕最新亚洲高清| 国产精品电影一区二区三区 | aaaaa片日本免费| 久久国产亚洲av麻豆专区| 飞空精品影院首页| 18禁国产床啪视频网站| 高清黄色对白视频在线免费看| 热99re8久久精品国产| 精品国内亚洲2022精品成人 | 国产黄频视频在线观看| 久久久精品国产亚洲av高清涩受| 伦理电影免费视频| 真人做人爱边吃奶动态| 在线观看66精品国产| 欧美变态另类bdsm刘玥| 久久久欧美国产精品| 国产在线一区二区三区精| 精品国产国语对白av| 久久精品国产综合久久久| 在线十欧美十亚洲十日本专区| 麻豆乱淫一区二区| 老熟妇仑乱视频hdxx| 天天躁狠狠躁夜夜躁狠狠躁| 国产不卡av网站在线观看| 香蕉丝袜av| 国产精品 国内视频| 国产极品粉嫩免费观看在线| 欧美中文综合在线视频| 免费在线观看日本一区| 一本久久精品| 美女视频免费永久观看网站| 国产又爽黄色视频| 国产在线视频一区二区| 免费观看av网站的网址| 国产av又大| 欧美一级毛片孕妇| 窝窝影院91人妻| 水蜜桃什么品种好| 国产成人欧美| 国产在线观看jvid| 久久亚洲精品不卡| videosex国产| 18在线观看网站| 国产一区二区在线观看av| 搡老乐熟女国产| 成人精品一区二区免费| 国产精品99久久99久久久不卡| 老司机靠b影院| 欧美在线黄色| 在线天堂中文资源库| 久久精品91无色码中文字幕| 中文字幕人妻熟女乱码| √禁漫天堂资源中文www| 王馨瑶露胸无遮挡在线观看| 麻豆乱淫一区二区| 午夜福利欧美成人| 亚洲精品粉嫩美女一区| 欧美精品人与动牲交sv欧美| 国产成人一区二区三区免费视频网站| 欧美另类亚洲清纯唯美| 亚洲成人手机| 国产一区二区三区视频了| 亚洲国产看品久久| 久久精品人人爽人人爽视色| 成年人黄色毛片网站| 大码成人一级视频| 制服人妻中文乱码| 久久久久网色| 久久精品国产a三级三级三级| 国产精品免费一区二区三区在线 | 国产色视频综合| 久久久久久亚洲精品国产蜜桃av| 王馨瑶露胸无遮挡在线观看| 亚洲色图av天堂| 亚洲 国产 在线| 一本一本久久a久久精品综合妖精| 亚洲黑人精品在线| 99热网站在线观看| 一级毛片精品| 在线观看66精品国产| 男女无遮挡免费网站观看| 夜夜爽天天搞| 中文字幕最新亚洲高清| 久久婷婷成人综合色麻豆| 亚洲成av片中文字幕在线观看| 欧美成狂野欧美在线观看| 免费在线观看日本一区| 美女视频免费永久观看网站| 国产三级黄色录像| 国产成人av教育| av国产精品久久久久影院| 免费在线观看视频国产中文字幕亚洲| 老熟妇仑乱视频hdxx| 高清视频免费观看一区二区| 又大又爽又粗| 亚洲中文日韩欧美视频| 在线观看66精品国产| 97在线人人人人妻| 精品少妇黑人巨大在线播放| 欧美精品一区二区免费开放| 婷婷丁香在线五月| 精品卡一卡二卡四卡免费| 久久婷婷成人综合色麻豆| 人妻 亚洲 视频| 男女下面插进去视频免费观看| 视频区图区小说| 黄片播放在线免费| 国产亚洲一区二区精品| 一进一出好大好爽视频| 久久久久久久精品吃奶| 久久久久久亚洲精品国产蜜桃av| 精品卡一卡二卡四卡免费| 国产高清视频在线播放一区| 宅男免费午夜| 色精品久久人妻99蜜桃| 婷婷丁香在线五月| 欧美性长视频在线观看| 国产日韩欧美亚洲二区| 久久人妻福利社区极品人妻图片| 无人区码免费观看不卡 | 97在线人人人人妻| 亚洲熟妇熟女久久| 18在线观看网站| 国产亚洲午夜精品一区二区久久| 老司机深夜福利视频在线观看| 老熟女久久久| 大香蕉久久网| 三级毛片av免费| 一级毛片精品| 少妇粗大呻吟视频| 欧美日本中文国产一区发布| 18在线观看网站| 欧美精品av麻豆av| 国产日韩欧美视频二区| 久久久精品免费免费高清| 亚洲一码二码三码区别大吗| 亚洲国产欧美在线一区| 中文字幕精品免费在线观看视频| 乱人伦中国视频| 免费高清在线观看日韩| 性少妇av在线| 亚洲av片天天在线观看| 大型黄色视频在线免费观看| 在线天堂中文资源库| 香蕉国产在线看| 久久青草综合色| 午夜视频精品福利| 美女高潮到喷水免费观看| 国产欧美日韩综合在线一区二区| 日日摸夜夜添夜夜添小说| 每晚都被弄得嗷嗷叫到高潮| 啦啦啦 在线观看视频| 欧美人与性动交α欧美精品济南到| 青青草视频在线视频观看| 亚洲熟女毛片儿| 国产一卡二卡三卡精品| 又大又爽又粗| 国产aⅴ精品一区二区三区波| 久久国产精品影院| 1024香蕉在线观看| 十八禁人妻一区二区| 成人18禁高潮啪啪吃奶动态图| 精品国产超薄肉色丝袜足j| 99国产精品免费福利视频| 一区二区三区精品91| 丝袜美足系列| 在线观看免费视频网站a站| 日本一区二区免费在线视频| 一边摸一边抽搐一进一出视频| 日本黄色日本黄色录像| 久久久久久亚洲精品国产蜜桃av| 亚洲五月色婷婷综合| 成人免费观看视频高清| 亚洲国产中文字幕在线视频| 飞空精品影院首页| 欧美精品一区二区大全| 热re99久久国产66热| 蜜桃在线观看..| 国产成人一区二区三区免费视频网站| 老司机午夜十八禁免费视频| 丰满人妻熟妇乱又伦精品不卡| 动漫黄色视频在线观看| 一二三四社区在线视频社区8| 99热国产这里只有精品6| av天堂久久9| 亚洲欧美一区二区三区久久| 激情视频va一区二区三区| 丁香欧美五月| 91精品三级在线观看| 97在线人人人人妻| 免费在线观看完整版高清| 亚洲av美国av| 国产一区二区三区在线臀色熟女 | 日韩欧美国产一区二区入口| 在线观看一区二区三区激情| 国产主播在线观看一区二区| 成人免费观看视频高清| 啪啪无遮挡十八禁网站| 亚洲熟女精品中文字幕| av片东京热男人的天堂| svipshipincom国产片| 午夜91福利影院| 天堂俺去俺来也www色官网| 欧美午夜高清在线| 国产熟女午夜一区二区三区| 无限看片的www在线观看| videos熟女内射| 国产免费福利视频在线观看| 中文字幕色久视频| netflix在线观看网站| 色在线成人网| 大香蕉久久网| 免费观看a级毛片全部| 午夜91福利影院| 午夜福利乱码中文字幕| 欧美成狂野欧美在线观看| 天天躁日日躁夜夜躁夜夜| 一个人免费看片子| 又大又爽又粗| 大片免费播放器 马上看| 国产不卡一卡二| 男女边摸边吃奶| 国产成人免费无遮挡视频| 丝瓜视频免费看黄片| 亚洲七黄色美女视频| 精品一区二区三区av网在线观看 | 女人高潮潮喷娇喘18禁视频| 男女免费视频国产| 成人影院久久| 激情在线观看视频在线高清 | 天堂俺去俺来也www色官网| 精品久久久久久久毛片微露脸| 午夜成年电影在线免费观看| 热re99久久精品国产66热6| 高清黄色对白视频在线免费看| 久久国产精品人妻蜜桃| 亚洲精品在线观看二区| 一边摸一边抽搐一进一小说 | 国产单亲对白刺激| 国产精品免费视频内射| 久久久水蜜桃国产精品网| 一级片'在线观看视频| 国产精品久久久久久精品古装| 日韩熟女老妇一区二区性免费视频| 777米奇影视久久| 在线亚洲精品国产二区图片欧美| 男女下面插进去视频免费观看| 国产99久久九九免费精品| 波多野结衣av一区二区av| 青草久久国产| 免费在线观看视频国产中文字幕亚洲| 欧美黑人欧美精品刺激| 欧美成人免费av一区二区三区 | 看免费av毛片| av视频免费观看在线观看| 国产单亲对白刺激| 国产日韩欧美亚洲二区| 无人区码免费观看不卡 | 99riav亚洲国产免费| 国产精品国产高清国产av | 亚洲中文av在线| 人人澡人人妻人| 十八禁网站网址无遮挡| 精品第一国产精品| 考比视频在线观看| 色综合欧美亚洲国产小说| av天堂在线播放| 国产极品粉嫩免费观看在线| 欧美日韩精品网址| 成人免费观看视频高清| 亚洲国产av影院在线观看| 一本久久精品| 久久久国产精品麻豆| 高潮久久久久久久久久久不卡| 考比视频在线观看| 欧美黄色淫秽网站| 老司机靠b影院| 久久久久久久久久久久大奶| 亚洲欧美一区二区三区久久| 久久久水蜜桃国产精品网| 高清av免费在线| av线在线观看网站| 高清毛片免费观看视频网站 | 女人爽到高潮嗷嗷叫在线视频| 黄色视频不卡| 亚洲精品久久午夜乱码| av视频免费观看在线观看| 亚洲综合色网址| 国产一区有黄有色的免费视频| 日韩大片免费观看网站| 亚洲专区中文字幕在线| 后天国语完整版免费观看| 在线观看免费视频日本深夜| 99国产精品一区二区蜜桃av | 午夜精品久久久久久毛片777| 欧美日韩av久久| 成在线人永久免费视频| 精品国内亚洲2022精品成人 | 9色porny在线观看| 国产av一区二区精品久久| 亚洲成a人片在线一区二区| 999久久久精品免费观看国产| 交换朋友夫妻互换小说| 国产在视频线精品| 精品国产一区二区三区久久久樱花| 高潮久久久久久久久久久不卡| 男女午夜视频在线观看| 99香蕉大伊视频| 蜜桃国产av成人99| 中国美女看黄片| 99久久99久久久精品蜜桃| 19禁男女啪啪无遮挡网站| 天堂8中文在线网| 1024香蕉在线观看| 国产成人啪精品午夜网站| 天天躁狠狠躁夜夜躁狠狠躁| 久久天躁狠狠躁夜夜2o2o| av电影中文网址| 久久久国产精品麻豆| 精品少妇内射三级| videosex国产| av国产精品久久久久影院| 19禁男女啪啪无遮挡网站| 黄色a级毛片大全视频| 午夜福利一区二区在线看| 国产欧美日韩综合在线一区二区| 妹子高潮喷水视频| 国产色视频综合| 一边摸一边做爽爽视频免费| 免费女性裸体啪啪无遮挡网站| 99久久99久久久精品蜜桃| 欧美黑人欧美精品刺激| 精品第一国产精品| 久久av网站| 制服人妻中文乱码| 国产一区二区三区综合在线观看| 99国产精品99久久久久| 日韩视频一区二区在线观看| 久久精品亚洲精品国产色婷小说| 中文字幕另类日韩欧美亚洲嫩草| 无限看片的www在线观看| av网站免费在线观看视频| 精品少妇一区二区三区视频日本电影| 一级片免费观看大全| 成年版毛片免费区| 18禁美女被吸乳视频|