• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于大規(guī)模預(yù)訓(xùn)練模型的地質(zhì)礦物屬性識(shí)別方法及應(yīng)用

    2024-04-17 08:40:18王彬彬周可法王金林汪瑋李超程寅益
    新疆地質(zhì) 2024年1期
    關(guān)鍵詞:深度神經(jīng)網(wǎng)絡(luò)

    王彬彬 周可法 王金林 汪瑋 李超 程寅益

    摘? ?要:地球科學(xué)的研究成果通常記錄在技術(shù)報(bào)告、期刊論文、書籍等文獻(xiàn)中,但許多詳細(xì)的地球科學(xué)報(bào)告未被使用,這為信息提取提供了機(jī)遇。為此,我們提出了一種名為GMNER(Geological Minerals named entity recognize,MNER)的深度神經(jīng)網(wǎng)絡(luò)模型,用于識(shí)別和提取礦物類型、地質(zhì)構(gòu)造、巖石與地質(zhì)時(shí)間等關(guān)鍵信息。與傳統(tǒng)方法不同,本次采用了大規(guī)模預(yù)訓(xùn)練模型BERT(Bidirectional Encoder Representations from Transformers,BERT)和深度神經(jīng)網(wǎng)絡(luò)來(lái)捕捉上下文信息,并結(jié)合條件隨機(jī)場(chǎng)(Conditional random field,CRF)以獲得準(zhǔn)確結(jié)果。實(shí)驗(yàn)結(jié)果表明,MNER模型在中文地質(zhì)文獻(xiàn)中表現(xiàn)出色,平均精確度為0.898 4,平均召回率0.922 7,平均F1分?jǐn)?shù)0.910 4。研究不僅為自動(dòng)礦物信息提取提供了新途徑,也有望促進(jìn)礦產(chǎn)資源管理和可持續(xù)利用。

    關(guān)鍵詞:礦物信息提取;深度神經(jīng)網(wǎng)絡(luò);礦物文獻(xiàn);命名實(shí)體識(shí)別

    地球科學(xué)的研究成果通常記錄在技術(shù)報(bào)告、期刊論文、書籍等文獻(xiàn)中。近年來(lái),開放數(shù)據(jù)倡議促使政府機(jī)構(gòu)和科研機(jī)構(gòu)將數(shù)據(jù)在線發(fā)布以供再利用[1-3]。許多國(guó)家地質(zhì)調(diào)查機(jī)構(gòu)(如USGS和CGS)已將地質(zhì)調(diào)查成果在線發(fā)布。地球科學(xué)文獻(xiàn)作為開放數(shù)據(jù)的重要組成部分,為地質(zhì)礦物信息提取研究提供了巨大機(jī)遇。

    從地質(zhì)科學(xué)文本數(shù)據(jù)中提取結(jié)構(gòu)化信息、發(fā)現(xiàn)知識(shí)的研究在數(shù)字地球科學(xué)領(lǐng)域尚未深入探討。特別是在處理中文地質(zhì)科學(xué)文獻(xiàn)時(shí)更為困難,因?yàn)橹形膯卧~之間無(wú)空格,計(jì)算機(jī)難以識(shí)別有意義的詞匯或短語(yǔ)的邊界[4-5]?;谏疃葘W(xué)習(xí)的命名礦產(chǎn)實(shí)體識(shí)別是實(shí)現(xiàn)礦產(chǎn)信息自動(dòng)提取的重要方法,也是構(gòu)建礦產(chǎn)領(lǐng)域知識(shí)圖的前提條件。

    目前,地質(zhì)礦物命名實(shí)體識(shí)別領(lǐng)域的研究相對(duì)較少,在地質(zhì)命名實(shí)體識(shí)別方面,一些學(xué)者已將深度學(xué)習(xí)應(yīng)用于該領(lǐng)域,并取得一定成果。Zhang等 針對(duì)地質(zhì)文獻(xiàn)特點(diǎn)[6],設(shè)計(jì)了一種基于深度信念網(wǎng)絡(luò)的地質(zhì)命名實(shí)體識(shí)別模型。Qiu等提出了一種將雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(Bi-directional Long Short-Term Memory,BiLSTM)與CRF相結(jié)合的模型[7],該模型利用注意機(jī)制捕捉單詞之間的關(guān)聯(lián)信息,并從地質(zhì)報(bào)告中提取地質(zhì)實(shí)體,如地質(zhì)歷史和地質(zhì)結(jié)構(gòu)。Li等構(gòu)建了一種基于地質(zhì)領(lǐng)域本體的中文分詞算法[8],并輔以自循環(huán)方法,以更好地分割地質(zhì)領(lǐng)域文本。礦物信息的提取有以下3個(gè)難點(diǎn):①礦物信息來(lái)源廣泛,包括文獻(xiàn)、專利、報(bào)告、新聞等多種類型的文本[9];②礦物信息的命名規(guī)范不統(tǒng)一,不同地區(qū)、不同領(lǐng)域、不同時(shí)間的命名方式可能存在差異,需進(jìn)行多樣化命名實(shí)體識(shí)別;③礦物信息的語(yǔ)言表達(dá)復(fù)雜,包括詞匯多樣、語(yǔ)法復(fù)雜、語(yǔ)義模糊等問題。

    為解決這些挑戰(zhàn),我們提出了一種基于深度神經(jīng)網(wǎng)絡(luò)的地質(zhì)礦物命名實(shí)體識(shí)別模型,基于5份區(qū)域礦產(chǎn)領(lǐng)域報(bào)告,據(jù)礦產(chǎn)文本的特點(diǎn),提取了礦產(chǎn)類型、地質(zhì)構(gòu)造、巖石和地質(zhì)時(shí)間、成礦區(qū)域等信息。與前人所采用的方法相比,結(jié)合大規(guī)模預(yù)訓(xùn)練模型BERT和深度神經(jīng)網(wǎng)絡(luò)來(lái)學(xué)習(xí)上下文信息,使用條件隨機(jī)場(chǎng)來(lái)獲取最優(yōu)全局標(biāo)簽序列[10],最終實(shí)現(xiàn)地質(zhì)礦物命名實(shí)體識(shí)別。

    1? 方法

    本文采用的大規(guī)模預(yù)訓(xùn)練模型BERT和深度神經(jīng)網(wǎng)絡(luò)的總體結(jié)構(gòu)如圖1。整個(gè)模型分為BERT層、BiLSTM層、全連接層和CRF層。首先,BERT預(yù)訓(xùn)練層在大規(guī)模無(wú)標(biāo)注地質(zhì)礦物數(shù)據(jù)集上進(jìn)行無(wú)監(jiān)督訓(xùn)練,提取豐富的語(yǔ)法和語(yǔ)義特征,得到詞向量表示;然后將訓(xùn)練好的詞向量輸入長(zhǎng)短期記憶網(wǎng)絡(luò)進(jìn)行特征提取,并將兩個(gè)神經(jīng)網(wǎng)絡(luò)的輸出特征進(jìn)行融合;最后,通過一個(gè)全連接層進(jìn)行降維并將輸出的特征輸入到CRF層進(jìn)行校正。

    1.1? BERT

    Devlin等提出了BERT模型[11],與OpenAI GPT中的從左到右Transformer和ELMo中的拼接雙向LSTM不同[12-13],BERT使用雙向Transformer模型架構(gòu)[14](圖2)?!癟rm”代表Transformer塊。該模型使用注意力機(jī)制將任意位置的兩個(gè)單詞之間的距離轉(zhuǎn)換為1,使模型能夠充分考慮更長(zhǎng)距離的上下文語(yǔ)義,有效解決了NLP中單詞和句子的長(zhǎng)期依賴問題,并更全面地捕捉語(yǔ)句中的雙向關(guān)系。[]

    該模型的輸入層是詞嵌入、位置嵌入和分段嵌入的組合。Transformer Block是基于注意力機(jī)制的編碼結(jié)構(gòu)(圖3),是BERT的重要組成部分。在Transformer編碼單元中使用自注意力機(jī)制的工作原理主要是計(jì)算文本序列中單詞之間的相關(guān)性。其主要功能是引導(dǎo)神經(jīng)網(wǎng)絡(luò)將注意力集中在能夠更好地影響輸出的特征上,并區(qū)分輸入對(duì)輸出的不同部分的影響。其中,編碼器由6個(gè)相同模塊堆疊而成。計(jì)算輸出公式(1)和公式(2)所示。

    outputAtt=LayerNorm(x+Attention(x)) (1)

    outputFnn=LayerNorm(outputAtt+FNN(outputAtt))…(2)

    解碼器同樣堆疊有6個(gè)相同模塊。與編碼器模塊不同,在底層注意力層中添加了遮蔽,其目的是防止模型接觸未來(lái)時(shí)刻點(diǎn)上信息而影響訓(xùn)練。單個(gè)頭的縮放點(diǎn)注意力計(jì)算公式如下:

    其中,[xt]為當(dāng)前的輸入,[ht-1]為上一步的隱藏狀態(tài),[ft]為遺忘門,[it]為輸入門,[Ot]為輸出門,b為偏置,[Ct]為神經(jīng)元在時(shí)間t記憶的信息,[Ct]為當(dāng)前神經(jīng)元要存儲(chǔ)的信息,[ht]為最終LSTM單元的輸出。

    在將BiLSTM應(yīng)用于命名實(shí)體識(shí)別時(shí),將BERT獲得的地質(zhì)礦物文本中每個(gè)單詞的向量表示作為輸入。通過使用LSTM,網(wǎng)絡(luò)可自動(dòng)學(xué)習(xí)上下文特征,然后計(jì)算當(dāng)前時(shí)間步的最佳分類結(jié)果。雖然仍為一個(gè)分類模型,但該網(wǎng)絡(luò)能夠獲取更好的上下文特征表示。

    1.3? CRF

    盡管BiLSTM和IDCNN神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)能捕捉上下文信息,但忽略了實(shí)體標(biāo)簽之間的順序和關(guān)聯(lián)。在命名實(shí)體識(shí)別中,根據(jù)標(biāo)注規(guī)則,如果某些標(biāo)簽連續(xù)出現(xiàn),則可能不符合語(yǔ)言邏輯。CRF可考慮標(biāo)簽之間的邏輯關(guān)系,以獲得全局最優(yōu)的標(biāo)簽序列,因此在模型最后一層使用它來(lái)修改識(shí)別結(jié)果。其原理如下:

    定義[Pij]為第i個(gè)符合第j個(gè)標(biāo)簽的概率,輸入的句子序列[x={x1,x2,x3,…,xn}]與其預(yù)測(cè)序列[y=][{y1,y2,y3,…,yn}]得分計(jì)算公式如下:

    公式(15)-(17)中,[y*]表示正確標(biāo)簽的對(duì)數(shù)概率,[y]表示所有可能標(biāo)記的集合,最優(yōu)序列分類通過[K(x,y)]函數(shù)完成。

    2? 實(shí)體識(shí)別實(shí)驗(yàn)

    2.1? 數(shù)據(jù)集

    本研究使用的標(biāo)注語(yǔ)料庫(kù)來(lái)自不同地區(qū)的5份中國(guó)區(qū)域調(diào)查報(bào)告,共計(jì)約50萬(wàn)字。由于原始文本中有諸多干擾信息,如標(biāo)題號(hào)、圖片和表格,這將使文本識(shí)別變得困難,因此首先對(duì)文本進(jìn)行預(yù)處理,主要檢查文本格式和內(nèi)容,去除圖片和表格,將連續(xù)的文本劃分為只包含單詞、標(biāo)點(diǎn)符號(hào)、數(shù)字和空格的標(biāo)記,且無(wú)地質(zhì)礦物實(shí)體信息的句子已被刪除,最終得到了8 000個(gè)有效句子。對(duì)這些有效數(shù)據(jù),本文按隨機(jī)選擇方法,按8∶1∶1的比例劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集。

    2.2? 標(biāo)注策略和評(píng)價(jià)指標(biāo)

    文本標(biāo)注是指對(duì)文本中的實(shí)體和非實(shí)體進(jìn)行標(biāo)記。我們采用了“BIO”(Beginning、Inside、Outside)標(biāo)注策略,其中“B”表示實(shí)體詞匯的第一個(gè)字符,“I”表示實(shí)體詞匯的所有中間字符,“O”表示非實(shí)體詞匯。我們共標(biāo)注18 783個(gè)實(shí)體,包括礦產(chǎn)資源的6個(gè)主要特征:礦產(chǎn)地、巖石、地層、礦物類型、地質(zhì)構(gòu)造、地質(zhì)時(shí)間(表1)。對(duì)于復(fù)雜實(shí)體,我們分別標(biāo)注多個(gè)實(shí)體,例如“巖(B-LOC)金(I-LOC)礦(I-LOC)山(I-LOC)潛(B-ROC)火(I-ROC)山(I-ROC)巖(I-ROC)白(B-SG)山(I-SG)組(I-SG)”,“巖金礦山”、“潛火山巖”和“白山組”分別被標(biāo)記為礦產(chǎn)地、巖石和地層。在實(shí)驗(yàn)中,復(fù)雜實(shí)體也被單獨(dú)匹配。

    命名實(shí)體識(shí)別的評(píng)價(jià)指標(biāo)包括:精確率(P)、召回率(R)和F值。具體的定義如下:Tp表示模型正確識(shí)別的實(shí)體數(shù)量,F(xiàn)p表示模型誤識(shí)別的實(shí)體數(shù)量,F(xiàn)n表示模型漏掉的實(shí)體數(shù)量,即模型未能正確標(biāo)識(shí)的實(shí)際存在的實(shí)體數(shù)量。這3個(gè)指標(biāo)在NER評(píng)價(jià)標(biāo)準(zhǔn)中被廣泛使用[17-18]。

    2.3? 實(shí)驗(yàn)參數(shù)設(shè)置

    實(shí)驗(yàn)環(huán)境和參數(shù)設(shè)置模型在Python 3.7.3和TensorFlow 1.14.1中進(jìn)行訓(xùn)練和測(cè)試。實(shí)驗(yàn)使用BERT-Base模型進(jìn)行,該模型包含12個(gè)轉(zhuǎn)換層、768個(gè)維隱藏層和12頭注意機(jī)制。BiLSTM網(wǎng)絡(luò)有一個(gè)128維的隱藏層。注意機(jī)制層被設(shè)置為50維,且最大序列長(zhǎng)度被設(shè)置為256,所有模型均在4×RTX 2080 Ti GPU上進(jìn)行訓(xùn)練(表2)。

    2.4? 實(shí)驗(yàn)和分析

    在進(jìn)行深度學(xué)習(xí)模型訓(xùn)練前,合理設(shè)置超參數(shù)至關(guān)重要。學(xué)習(xí)率作為深度學(xué)習(xí)模型中的一個(gè)關(guān)鍵參數(shù),對(duì)于目標(biāo)函數(shù)的收斂速度及是否能夠收斂到局部最小值均有顯著影響。針對(duì)BERT-LSTM-CRF模型進(jìn)行了學(xué)習(xí)率調(diào)整實(shí)驗(yàn)。從實(shí)驗(yàn)結(jié)果可以明顯看出(表3),將學(xué)習(xí)率設(shè)置為4e-5時(shí)獲得了最優(yōu)的性能表現(xiàn)。

    另一個(gè)在BERT模型中常用的正則化技術(shù)是dropout。該技術(shù)會(huì)隨機(jī)地將部分神經(jīng)元輸出設(shè)為零,有助于降低模型過擬合風(fēng)險(xiǎn)。在BERT-LSTM-CRF模型中,我們對(duì)dropout率進(jìn)行調(diào)整實(shí)驗(yàn)。結(jié)果表明(表4),在實(shí)驗(yàn)中將dropout設(shè)置為0.1時(shí),能夠獲得最佳性能效果。

    實(shí)驗(yàn)結(jié)果進(jìn)一步強(qiáng)調(diào)了超參數(shù)選擇的重要性,凸顯了在BERT-LSTM-CRF模型中的學(xué)習(xí)率和dropout率對(duì)模型性能影響的關(guān)鍵性。這些參數(shù)的優(yōu)化可在一定程度上提高模型性能和泛化能力。實(shí)驗(yàn)的命名實(shí)體識(shí)別模型結(jié)果見表5。

    所有考慮的模型中,BERT-LSTM-CRF表現(xiàn)最佳,其精確度、召回率和F1值分別達(dá)0.898 4、0.992 7和0.910 4。在使用BERT與CRF結(jié)合的情況下,精確度、召回率和F1值分別為0.880 7、0.902 9和0.891 7。在引入雙向LSTM網(wǎng)絡(luò)后,F(xiàn)1值出現(xiàn)下降,可能是因?yàn)锽ERT已具良好的詞向量表示,而引入BiLSTM后導(dǎo)致過擬合現(xiàn)象。

    當(dāng)使用RoBERTa預(yù)訓(xùn)練模型時(shí),識(shí)別效果普遍下降。盡管RoBERTa和BERT均基于Transformer架構(gòu)的預(yù)訓(xùn)練語(yǔ)言模型,但在預(yù)訓(xùn)練細(xì)節(jié)、超參數(shù)等方面可能存在差異。BERT的架構(gòu)和超參數(shù)設(shè)置更適合地質(zhì)礦物領(lǐng)域的命名實(shí)體識(shí)別任務(wù)。值得注意的是,在中文文本中,巖石和礦物類型相對(duì)容易辨別,且其標(biāo)簽數(shù)量在所有實(shí)體中占比超過50%,因此,所有模型均表現(xiàn)出對(duì)“巖石”和“礦物類型”實(shí)體的良好識(shí)別效果,F(xiàn)1得分均超過90%。此外,表現(xiàn)較好的另外兩種實(shí)體類型是“地層”和“地質(zhì)時(shí)間”,且它們對(duì)應(yīng)的標(biāo)簽數(shù)量也相對(duì)較多。

    上述結(jié)果表明,在礦物實(shí)體識(shí)別任務(wù)中,BERT-LSTM-CRF模型的表現(xiàn)最佳,而RoBERTa預(yù)訓(xùn)練模型表現(xiàn)一般。不同類型的礦物實(shí)體在各模型的識(shí)別效果也呈現(xiàn)出一定差異。

    3? 結(jié)論和展望

    本研究主要致力于運(yùn)用深度學(xué)習(xí)構(gòu)建命名實(shí)體識(shí)別模型,即從大量地質(zhì)礦物相關(guān)文檔中提取命名實(shí)體。該工作為構(gòu)建地質(zhì)礦物知識(shí)圖譜提供了重要數(shù)據(jù)支持。基于BERT-LSTM-CRF模型,筆者團(tuán)隊(duì)從地質(zhì)礦物文獻(xiàn)中提取出6種類型實(shí)體,實(shí)現(xiàn)了平均精確度0.898 4,平均召回率0.922 7,平均F1分?jǐn)?shù)0.910 4。從實(shí)驗(yàn)結(jié)果中得出以下結(jié)論:

    (1) 在命名實(shí)體識(shí)別任務(wù)中,BERT-LSTM-CRF模型表現(xiàn)最佳,但引入BiLSTM會(huì)導(dǎo)致過擬合,從而降低模型性能。

    (2) 當(dāng)中文實(shí)體的語(yǔ)義區(qū)別明確且標(biāo)簽充足時(shí),實(shí)體識(shí)別效果更好。

    (3) 在地質(zhì)礦物領(lǐng)域命名實(shí)體識(shí)別任務(wù)中,RoBERTa不如BERT表現(xiàn)出色。BERT的架構(gòu)和超參數(shù)設(shè)置更適合地質(zhì)礦物領(lǐng)域命名實(shí)體識(shí)別任務(wù)。

    盡管本研究在礦物命名實(shí)體識(shí)別方面取得了良好效果,仍有待進(jìn)一步改進(jìn)的空間:

    (1) 針對(duì)標(biāo)注較少的實(shí)體類型,有進(jìn)一步提升其識(shí)別性能的空間。我們計(jì)劃通過擴(kuò)充數(shù)據(jù)集中的礦物實(shí)體數(shù)量來(lái)解決此問題。

    (2) 未來(lái)將針對(duì)地質(zhì)礦物領(lǐng)域的特點(diǎn)進(jìn)行模型調(diào)整和優(yōu)化,以提高模型的領(lǐng)域適應(yīng)性。

    (3) 根據(jù)從地質(zhì)礦物文本中所提取的信息構(gòu)建地質(zhì)礦物相關(guān)的領(lǐng)域知識(shí)圖譜。

    參考文獻(xiàn)

    [1] Ali S H,Giurco D,Arndt N,et al.Mineral supply for sustainable development requires resource governance[J].Nature,2017,543(7645):367-372.

    [2] Cernuzzi L,Pane J.Toward open government in Paraguay[J].It Professional,2014,16(5):62-64.

    [3] Ma X.Linked Geoscience Data in practice:Where W3C standards meet domain knowledge,data visualization and OGC standards[J].Earth Science Informatics,2017,10(4):429-441.

    [4] Gao J,Li M,Huang C N,et al.Chinese word segmentation and named entity recognition:A pragmatic approach[J].Computational Linguistics,2005,31(4):531-574.

    [5] Huang L,Du Y,Chen G.GeoSegmenter:A statistically learned Chinese word segmenter for the geoscience domain[J].Computers & geosciences,2015,76:11-17.

    [6] Zhang X,F(xiàn)an D,Xu J,et al.Sedimentary laminae in muddy inner continental shelf sediments of the East China Sea:Formation and implications for geochronology[J].Quaternary International,2018,464:343-351.

    [7] Qiu Q,Xie Z,Wu L,et al.BiLSTM-CRF for geological named entity recognition from the geoscience literature[J].Earth Science Informatics,2019,12:565-579.

    [8] Li W,Ma K,Qiu Q,et al.Chinese Word Segmentation Based on Self-Learning Model and Geological Knowledge for the Geoscience Domain[J].Earth and Space Science,2021,8(6):1673.

    [9] Wang B,Ma K,Wu L,et al.Visual analytics and information extraction of geological content for text-based mineral exploration reports[J].Ore Geology Reviews,2022,144:104818.

    [10] Sobhana N,Mitra P,Ghosh S K.Conditional random field based named entity recognition in geological text[J].International Journal of Computer Applications,2010,1(3):143-147.

    [11] Devlin J,Chang M W,Lee K,et al.Bert:Pre-training of deep bidirectional transformers for language understanding[J].arXiv preprint arXiv:2018,1810.

    [12] Radford A,Narasimhan K,Salimans T,et al.Improving language understanding by generative pre-training[J].2018.

    [13] Peters M E,Neumann M,Iyyer M,et al.Deep contextualized word representations[J].arXiv preprint arXiv,2018,1802.

    [14] Vaswani A,Shazeer N,Parmar N,et al.Attention is all you need[J].Advances in neural information processing systems,2017,30.

    [15] Bengio Y,Simard P,F(xiàn)rasconi P.Learning long-term dependencies with gradient descent is difficult[J].IEEE transactions on neural networks,1994,5(2):157-166.

    [16] Hochreiter S,Schmidhuber J.Long short-term memory[J].Neural computation,1997,9(8):1735-1780.

    [17] 莊云行,季鐸,馬堯,等.基于Bi-LSTM的涉恐類案件法律文書的命名實(shí)體識(shí)別研究[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2023 (7):36-39.

    [18] 邱芹軍,田苗,馬凱,等.區(qū)域地質(zhì)調(diào)查文本中文命名實(shí)體識(shí)別[J].地質(zhì)論評(píng),2023,69(04):1423-1433.

    Geological Mineral Attribute Recognition Method Based on

    Large-Scale Pre-Trained Model and Its Application

    Wang Binbin1,2,4, Zhou Kefa2,3,5, Wang Jinlin1,2,3,4, Wang Wei1,2,3,4, Li Chao5, Cheng Yinyi2

    (1.Xinjiang Research Center for Mineral Resources,Xinjiang Institute of Ecology and Geography,Chinese Academy

    of Sciences,Urumqi,Xinjiang,830011,China;2.University of Chinese Academy of Sciences,Beijing,100049,China;

    3.Technology and Engineering Center for Space Utilization, Chinese Academy of Sciences,Beijing,100094,China;

    4.Xinjiang Key Laboratory of Mineral Resources and Digital Geology,Urumqi,Xinjiang,830011,China;

    5.Institute of Geological Survey,China University of Geosciences,Wuhan,Hubei,430074,China)

    Abstract: Geoscience research results are usually documented in technical reports, journal papers, books, and other literature; however, many detailed geoscience reports are unused, which provides challenges and opportunities for information extraction. To this end, we propose a deep neural network model called GMNER (Geological Minerals named entity recognize, MNER) for recognizing and extracting key information such as mineral types, geological formations, rocks, and geological time. Unlike traditional methods, we employ a large-scale pre-trained model BERT (Bidirectional Encoder Representations from Transformers, BERT) and deep neural network to capture contextual information and combine it with a conditional random field (CRF) to obtain more accurate and accurate information. The experimental results show that the MNER model performs well in Chinese geological literature, achieving an average precision of 0.8984, an average recall of 0.9227, and an average F1 score of 0.9104. This study not only provides a new way for automated mineral information extraction but also is expected to promote the progress of mineral resource management and sustainable utilization.

    Key words: Mineral information extraction; Deep neural network; Mineral documentation; Named entity recognition

    項(xiàng)目資助:新疆維吾爾自治區(qū)重大科技專項(xiàng)(2021A03001-3)、新疆科學(xué)考察項(xiàng)目(2022xjkk1306)、深空大數(shù)據(jù)智能建設(shè)(292022000059)聯(lián)合資助

    收稿日期:2023-09-18;修訂日期:2024-01-09

    第一作者簡(jiǎn)介:王彬彬(1998-),男,陜西咸陽(yáng)人,中國(guó)科學(xué)院大學(xué)地球探測(cè)與信息技術(shù)專業(yè)在讀碩士,研究方向?yàn)榈刭|(zhì)大數(shù)據(jù);

    E-mail: wangbinbin21@mails.ucas.ac.cn

    猜你喜歡
    深度神經(jīng)網(wǎng)絡(luò)
    基于多注意力多尺度特征融合的圖像描述生成算法
    基于深度卷積神經(jīng)網(wǎng)絡(luò)的交通流量預(yù)測(cè)數(shù)學(xué)模型設(shè)計(jì)
    基于改進(jìn)SIFT特征和神經(jīng)網(wǎng)絡(luò)結(jié)合的場(chǎng)景識(shí)別
    軟件工程(2019年5期)2019-07-03 02:31:14
    基于Kaldi的語(yǔ)音識(shí)別算法
    深度神經(jīng)網(wǎng)絡(luò)在船舶自動(dòng)舵中的應(yīng)用
    基于深度神經(jīng)網(wǎng)絡(luò)的低延遲聲源分離方法
    基于大數(shù)據(jù)網(wǎng)絡(luò)的運(yùn)動(dòng)損傷評(píng)估模型研究
    試論基于深度神經(jīng)網(wǎng)絡(luò)的汽車車型識(shí)別問題
    深度神經(jīng)網(wǎng)絡(luò)的發(fā)展現(xiàn)狀
    基于深度神經(jīng)網(wǎng)絡(luò)的身份識(shí)別研究
    蜜桃亚洲精品一区二区三区| 中文在线观看免费www的网站| 亚洲国产精品成人综合色| 日韩欧美三级三区| 久久久久精品久久久久真实原创| 中文天堂在线官网| 欧美三级亚洲精品| 久久久久久久久久成人| 精品久久久久久久人妻蜜臀av| 欧美3d第一页| 久久久久性生活片| 免费观看的影片在线观看| 一本久久精品| 能在线免费看毛片的网站| 婷婷色综合www| 亚洲高清免费不卡视频| 久久97久久精品| 亚洲最大成人av| 一级a做视频免费观看| 国内精品美女久久久久久| 日韩在线高清观看一区二区三区| 午夜福利在线观看免费完整高清在| 日韩欧美一区视频在线观看 | 舔av片在线| 精品久久久久久久久av| 日本wwww免费看| 日韩伦理黄色片| 精品久久久久久久久亚洲| 只有这里有精品99| 免费高清在线观看视频在线观看| 中文字幕av成人在线电影| 国产成人精品久久久久久| 亚洲第一区二区三区不卡| 日本黄大片高清| 亚洲色图av天堂| 成年版毛片免费区| 国产精品国产三级国产av玫瑰| 国内揄拍国产精品人妻在线| 亚洲乱码一区二区免费版| ponron亚洲| 纵有疾风起免费观看全集完整版 | 中文欧美无线码| 国产成人精品久久久久久| 国产免费福利视频在线观看| 日本免费在线观看一区| 三级男女做爰猛烈吃奶摸视频| 伦理电影大哥的女人| 内射极品少妇av片p| 内射极品少妇av片p| 看免费成人av毛片| 中国美白少妇内射xxxbb| 国产精品久久久久久久久免| 午夜老司机福利剧场| 国产黄色小视频在线观看| 最近中文字幕高清免费大全6| 天美传媒精品一区二区| 日韩成人av中文字幕在线观看| 18禁在线播放成人免费| 亚洲av电影在线观看一区二区三区 | 大又大粗又爽又黄少妇毛片口| 精品国内亚洲2022精品成人| 成人一区二区视频在线观看| 久久久a久久爽久久v久久| 又爽又黄无遮挡网站| 干丝袜人妻中文字幕| 99久国产av精品| 欧美成人精品欧美一级黄| 亚洲av不卡在线观看| 亚洲精品中文字幕在线视频 | 最近中文字幕高清免费大全6| 日韩成人av中文字幕在线观看| 一级二级三级毛片免费看| 青青草视频在线视频观看| 亚洲精品久久午夜乱码| 欧美激情在线99| 最近中文字幕高清免费大全6| 综合色丁香网| 亚洲国产精品成人综合色| 国精品久久久久久国模美| 久久99热这里只频精品6学生| 久久6这里有精品| 色播亚洲综合网| 欧美成人a在线观看| 天天躁日日操中文字幕| 亚洲国产精品成人综合色| 69av精品久久久久久| 日本爱情动作片www.在线观看| 一区二区三区四区激情视频| 69av精品久久久久久| 精品久久久久久久末码| 日韩欧美精品免费久久| 春色校园在线视频观看| 欧美xxxx黑人xx丫x性爽| 久久国内精品自在自线图片| 精品欧美国产一区二区三| 麻豆成人午夜福利视频| 国产美女午夜福利| 亚洲精品第二区| 麻豆乱淫一区二区| 国产精品一二三区在线看| 一级黄片播放器| 成人鲁丝片一二三区免费| 欧美 日韩 精品 国产| 亚洲天堂国产精品一区在线| 亚洲在线观看片| 国产免费又黄又爽又色| 97超碰精品成人国产| 亚洲最大成人中文| 免费av不卡在线播放| 成年女人看的毛片在线观看| 国产免费一级a男人的天堂| 两个人的视频大全免费| 肉色欧美久久久久久久蜜桃 | 大陆偷拍与自拍| 成人亚洲精品一区在线观看 | 免费电影在线观看免费观看| 九色成人免费人妻av| 欧美一区二区亚洲| 两个人视频免费观看高清| 欧美成人a在线观看| 毛片女人毛片| 乱系列少妇在线播放| 麻豆精品久久久久久蜜桃| 中文字幕亚洲精品专区| 别揉我奶头 嗯啊视频| 免费少妇av软件| a级一级毛片免费在线观看| 国产成人午夜福利电影在线观看| 天天一区二区日本电影三级| 亚洲欧洲国产日韩| 久久精品久久久久久噜噜老黄| 欧美bdsm另类| 丰满人妻一区二区三区视频av| 淫秽高清视频在线观看| 两个人视频免费观看高清| 国产精品熟女久久久久浪| 久久久久网色| 亚洲成人久久爱视频| 日本黄色片子视频| 尤物成人国产欧美一区二区三区| 中文字幕人妻熟人妻熟丝袜美| 赤兔流量卡办理| 国产探花极品一区二区| 国产老妇女一区| 成年女人看的毛片在线观看| 国产爱豆传媒在线观看| 久久99蜜桃精品久久| 精品久久久久久久久亚洲| 日韩三级伦理在线观看| 久久精品综合一区二区三区| 国产免费视频播放在线视频 | 欧美最新免费一区二区三区| 91午夜精品亚洲一区二区三区| 美女大奶头视频| 高清日韩中文字幕在线| 久久人人爽人人爽人人片va| 欧美性猛交╳xxx乱大交人| 性色avwww在线观看| 免费黄色在线免费观看| 国产在视频线在精品| 亚洲精品一二三| 老司机影院毛片| 亚洲欧美日韩无卡精品| 久久这里只有精品中国| 色综合站精品国产| 国产精品久久视频播放| 国产淫片久久久久久久久| 国产91av在线免费观看| 一级毛片aaaaaa免费看小| 精品酒店卫生间| 国产女主播在线喷水免费视频网站 | 精品人妻偷拍中文字幕| 少妇被粗大猛烈的视频| 国产亚洲午夜精品一区二区久久 | 欧美日韩国产mv在线观看视频 | 男女啪啪激烈高潮av片| 人人妻人人澡欧美一区二区| 99久久中文字幕三级久久日本| 亚洲最大成人av| 亚洲欧美清纯卡通| 青春草国产在线视频| 国产在线一区二区三区精| 中文字幕av在线有码专区| 黄色日韩在线| 日韩欧美 国产精品| 日韩精品有码人妻一区| 2018国产大陆天天弄谢| 两个人视频免费观看高清| 国产人妻一区二区三区在| 精品亚洲乱码少妇综合久久| 18+在线观看网站| 免费观看av网站的网址| 国产一区二区三区av在线| 中文精品一卡2卡3卡4更新| 一级毛片久久久久久久久女| 一本久久精品| 韩国av在线不卡| 高清在线视频一区二区三区| 欧美激情国产日韩精品一区| 成人毛片60女人毛片免费| 国产欧美另类精品又又久久亚洲欧美| 欧美日韩视频高清一区二区三区二| 亚洲国产色片| 中文字幕亚洲精品专区| 国产在线男女| 亚洲国产日韩欧美精品在线观看| 免费观看在线日韩| 久久精品夜夜夜夜夜久久蜜豆| 亚洲精品国产成人久久av| 97热精品久久久久久| 天堂俺去俺来也www色官网 | 国产高清不卡午夜福利| 国产 一区精品| 色吧在线观看| 久久6这里有精品| 韩国av在线不卡| 中文字幕久久专区| 免费无遮挡裸体视频| 人人妻人人澡欧美一区二区| 亚洲精品色激情综合| 亚洲高清免费不卡视频| 国产精品一二三区在线看| 久久精品熟女亚洲av麻豆精品 | 五月伊人婷婷丁香| 国产高清国产精品国产三级 | 日本-黄色视频高清免费观看| 美女主播在线视频| 青春草亚洲视频在线观看| 亚洲av免费高清在线观看| 九九爱精品视频在线观看| 97超碰精品成人国产| 欧美精品一区二区大全| 我的女老师完整版在线观看| 一二三四中文在线观看免费高清| 欧美3d第一页| 人妻夜夜爽99麻豆av| 成人毛片60女人毛片免费| 日韩不卡一区二区三区视频在线| 99九九线精品视频在线观看视频| 男人和女人高潮做爰伦理| av黄色大香蕉| 成人高潮视频无遮挡免费网站| 91av网一区二区| 久久久精品欧美日韩精品| 亚洲精品日本国产第一区| 国产色爽女视频免费观看| 一个人看的www免费观看视频| 美女大奶头视频| 国产一区二区亚洲精品在线观看| 大香蕉97超碰在线| 精品久久久久久成人av| 国产一区二区三区综合在线观看 | av国产免费在线观看| 综合色av麻豆| 久久久久网色| 国产成人a区在线观看| 美女脱内裤让男人舔精品视频| 高清日韩中文字幕在线| 精品久久久久久久末码| 亚洲精品456在线播放app| 国产亚洲精品av在线| 欧美精品一区二区大全| 777米奇影视久久| 免费观看的影片在线观看| 国产综合懂色| 国产高清不卡午夜福利| 菩萨蛮人人尽说江南好唐韦庄| 我要看日韩黄色一级片| 婷婷色av中文字幕| 久久久久免费精品人妻一区二区| 中文天堂在线官网| 久久久国产一区二区| 国产片特级美女逼逼视频| 十八禁国产超污无遮挡网站| 免费观看av网站的网址| 99久久精品热视频| 好男人视频免费观看在线| 欧美日韩亚洲高清精品| 亚洲性久久影院| 人人妻人人澡欧美一区二区| 一边亲一边摸免费视频| 高清欧美精品videossex| 别揉我奶头 嗯啊视频| 国产一区二区三区综合在线观看 | 又大又黄又爽视频免费| 69av精品久久久久久| 嘟嘟电影网在线观看| 国产成人freesex在线| 日韩伦理黄色片| 日日干狠狠操夜夜爽| 超碰97精品在线观看| 99re6热这里在线精品视频| 日韩欧美精品v在线| 欧美一区二区亚洲| 欧美3d第一页| 亚洲,欧美,日韩| 久久国产乱子免费精品| 成人漫画全彩无遮挡| 午夜激情欧美在线| 免费少妇av软件| 国内少妇人妻偷人精品xxx网站| 亚洲自偷自拍三级| 插阴视频在线观看视频| 精品久久久久久久久久久久久| 欧美最新免费一区二区三区| 久久这里只有精品中国| 午夜福利视频1000在线观看| 精品亚洲乱码少妇综合久久| 免费av不卡在线播放| 日韩欧美三级三区| 国产精品熟女久久久久浪| 国产日韩欧美在线精品| 日韩av在线免费看完整版不卡| 91久久精品国产一区二区三区| 日韩 亚洲 欧美在线| 小蜜桃在线观看免费完整版高清| 亚洲欧美精品专区久久| 美女xxoo啪啪120秒动态图| 久久久久久久大尺度免费视频| 国产探花极品一区二区| 精品人妻视频免费看| av卡一久久| 别揉我奶头 嗯啊视频| 白带黄色成豆腐渣| 亚洲av.av天堂| 一本久久精品| 国产免费又黄又爽又色| 国产精品综合久久久久久久免费| 国产视频首页在线观看| 麻豆精品久久久久久蜜桃| 国产午夜精品论理片| 国产 一区精品| 午夜福利视频精品| 色尼玛亚洲综合影院| 免费观看在线日韩| 国产成人精品婷婷| 亚洲精品第二区| 久久久久久久久久成人| 又大又黄又爽视频免费| 色播亚洲综合网| 真实男女啪啪啪动态图| 天堂中文最新版在线下载 | 亚洲成色77777| 亚洲av.av天堂| 久久国内精品自在自线图片| 波多野结衣巨乳人妻| 国产精品无大码| 久久午夜福利片| 亚洲av成人精品一区久久| 两个人的视频大全免费| 国产精品日韩av在线免费观看| 日韩一区二区三区影片| 九草在线视频观看| 亚洲av.av天堂| 国产片特级美女逼逼视频| 人人妻人人看人人澡| 99久久九九国产精品国产免费| 久久99热这里只有精品18| 一本久久精品| 国产又色又爽无遮挡免| 日本与韩国留学比较| 性插视频无遮挡在线免费观看| 国产色爽女视频免费观看| 午夜日本视频在线| 亚洲av一区综合| 熟妇人妻不卡中文字幕| av.在线天堂| 色哟哟·www| 国产单亲对白刺激| 黄色日韩在线| 床上黄色一级片| 欧美丝袜亚洲另类| 精品久久久久久久人妻蜜臀av| 高清午夜精品一区二区三区| 免费观看av网站的网址| 夜夜爽夜夜爽视频| 婷婷色综合www| 国产精品1区2区在线观看.| 嫩草影院入口| 久久久久网色| 久久草成人影院| 久久久久国产网址| 99热网站在线观看| 能在线免费观看的黄片| 欧美高清成人免费视频www| 少妇被粗大猛烈的视频| 亚洲欧美中文字幕日韩二区| 免费无遮挡裸体视频| 国产亚洲91精品色在线| a级毛色黄片| 三级经典国产精品| 国产av不卡久久| 国产精品一二三区在线看| 久久久久久久久久人人人人人人| 草草在线视频免费看| 午夜爱爱视频在线播放| 九草在线视频观看| 国产精品人妻久久久影院| 免费看av在线观看网站| 人人妻人人澡人人爽人人夜夜 | 国模一区二区三区四区视频| 国产成人a区在线观看| 蜜臀久久99精品久久宅男| 91精品伊人久久大香线蕉| 亚洲av成人精品一区久久| 国产亚洲5aaaaa淫片| 性插视频无遮挡在线免费观看| 久久精品熟女亚洲av麻豆精品 | 熟妇人妻久久中文字幕3abv| 又大又黄又爽视频免费| 国模一区二区三区四区视频| 日韩视频在线欧美| 免费观看a级毛片全部| 性色avwww在线观看| 在线播放无遮挡| 又大又黄又爽视频免费| 亚洲国产色片| 色综合色国产| 精品午夜福利在线看| 久久精品久久久久久久性| 色网站视频免费| 日韩强制内射视频| 老师上课跳d突然被开到最大视频| 日韩av不卡免费在线播放| 国产精品久久久久久av不卡| 啦啦啦韩国在线观看视频| 精品久久久久久久久亚洲| 成人性生交大片免费视频hd| 免费无遮挡裸体视频| 国产精品爽爽va在线观看网站| 免费黄频网站在线观看国产| 免费观看a级毛片全部| 好男人在线观看高清免费视频| 日本熟妇午夜| 成人特级av手机在线观看| 免费少妇av软件| 欧美bdsm另类| 国产精品一区www在线观看| 黄色一级大片看看| 高清av免费在线| av黄色大香蕉| 亚洲自拍偷在线| 最后的刺客免费高清国语| 国产成人一区二区在线| 亚洲内射少妇av| 高清在线视频一区二区三区| 亚洲自拍偷在线| 国产淫片久久久久久久久| 国产精品.久久久| 国产黄a三级三级三级人| 亚洲人成网站在线播| 日韩一本色道免费dvd| 大香蕉97超碰在线| 亚洲经典国产精华液单| 亚洲av电影在线观看一区二区三区 | 美女xxoo啪啪120秒动态图| 韩国高清视频一区二区三区| 久久久久久久久久成人| 国产一区亚洲一区在线观看| 亚洲人成网站在线播| 男女边摸边吃奶| 精品久久久精品久久久| www.av在线官网国产| 嫩草影院精品99| 国产成人精品一,二区| 久久久久精品久久久久真实原创| 韩国av在线不卡| 好男人视频免费观看在线| 亚洲精华国产精华液的使用体验| 丰满人妻一区二区三区视频av| 日日啪夜夜爽| 最新中文字幕久久久久| 韩国高清视频一区二区三区| 免费观看在线日韩| 色播亚洲综合网| 亚洲性久久影院| 激情 狠狠 欧美| 国产伦精品一区二区三区四那| 我的女老师完整版在线观看| 欧美日韩亚洲高清精品| 在线观看av片永久免费下载| 男插女下体视频免费在线播放| 伦理电影大哥的女人| 欧美性感艳星| 久久这里有精品视频免费| 国产 亚洲一区二区三区 | 亚洲精品第二区| 欧美激情久久久久久爽电影| 国产精品人妻久久久影院| 啦啦啦啦在线视频资源| 纵有疾风起免费观看全集完整版 | 亚洲美女搞黄在线观看| 久久99蜜桃精品久久| 非洲黑人性xxxx精品又粗又长| 国产一级毛片七仙女欲春2| 18禁在线无遮挡免费观看视频| 天天一区二区日本电影三级| 久久久精品欧美日韩精品| 联通29元200g的流量卡| 高清日韩中文字幕在线| 亚洲美女搞黄在线观看| 亚洲欧美日韩无卡精品| 韩国高清视频一区二区三区| 日韩av不卡免费在线播放| 久久久久网色| 免费观看在线日韩| 性插视频无遮挡在线免费观看| 欧美激情国产日韩精品一区| 国产一区二区亚洲精品在线观看| 免费少妇av软件| 免费电影在线观看免费观看| 亚洲美女搞黄在线观看| 美女主播在线视频| 美女高潮的动态| 亚洲精品乱码久久久久久按摩| 婷婷色综合www| 国产男女超爽视频在线观看| 校园人妻丝袜中文字幕| 日韩在线高清观看一区二区三区| 精品久久久久久久久av| 欧美97在线视频| 在线免费观看的www视频| 成年av动漫网址| 欧美日韩精品成人综合77777| 日韩一区二区三区影片| 久久精品人妻少妇| 日韩亚洲欧美综合| 天堂中文最新版在线下载 | 国产视频首页在线观看| 国产欧美日韩精品一区二区| 久久人人爽人人爽人人片va| 精品国内亚洲2022精品成人| 国产成人免费观看mmmm| 亚洲精品乱码久久久v下载方式| 在线观看一区二区三区| 18禁动态无遮挡网站| 97人妻精品一区二区三区麻豆| 色视频www国产| 亚洲欧美日韩无卡精品| 嘟嘟电影网在线观看| 亚洲熟女精品中文字幕| 国产精品蜜桃在线观看| 又大又黄又爽视频免费| av黄色大香蕉| 国产 亚洲一区二区三区 | 极品少妇高潮喷水抽搐| 精品一区二区免费观看| av黄色大香蕉| 免费不卡的大黄色大毛片视频在线观看 | 精品酒店卫生间| 丝袜美腿在线中文| 老司机影院毛片| 99久国产av精品国产电影| 免费观看av网站的网址| 春色校园在线视频观看| 欧美日韩一区二区视频在线观看视频在线 | 全区人妻精品视频| 午夜精品在线福利| 午夜福利在线观看免费完整高清在| 国产亚洲精品久久久com| 午夜福利在线观看免费完整高清在| 美女cb高潮喷水在线观看| 人妻夜夜爽99麻豆av| 国产淫片久久久久久久久| 中文天堂在线官网| 简卡轻食公司| 国内少妇人妻偷人精品xxx网站| 国产麻豆成人av免费视频| 免费高清在线观看视频在线观看| 天堂俺去俺来也www色官网 | 中国国产av一级| 熟妇人妻久久中文字幕3abv| 69av精品久久久久久| 亚洲成人av在线免费| 午夜福利视频1000在线观看| 亚洲欧美精品自产自拍| 国产在视频线精品| av在线蜜桃| 最近2019中文字幕mv第一页| 蜜臀久久99精品久久宅男| 啦啦啦啦在线视频资源| 久久精品国产自在天天线| 别揉我奶头 嗯啊视频| 日韩制服骚丝袜av| 国产高清三级在线| 2018国产大陆天天弄谢| 波多野结衣巨乳人妻| 免费大片18禁| 黄色一级大片看看| 欧美xxxx黑人xx丫x性爽| 亚洲电影在线观看av| 国产精品美女特级片免费视频播放器| 久久久午夜欧美精品| 女人被狂操c到高潮| 草草在线视频免费看| 国产高清三级在线| 亚洲欧洲日产国产| 高清视频免费观看一区二区 | 亚洲精华国产精华液的使用体验| 超碰av人人做人人爽久久| 国产成人freesex在线| 一区二区三区免费毛片| 国产精品久久久久久久电影| 国产精品熟女久久久久浪| 国产高潮美女av| 秋霞在线观看毛片| 男人舔女人下体高潮全视频| 天堂影院成人在线观看| 国产av不卡久久| 中国美白少妇内射xxxbb| 91在线精品国自产拍蜜月| av天堂中文字幕网| 男人爽女人下面视频在线观看| 亚洲精品久久久久久婷婷小说| 亚洲成人一二三区av|