• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于小樣本學(xué)習(xí)的中文文本關(guān)系抽取方法

    2023-09-23 01:59:56季一木劉尚東邱晨陽朱金森
    關(guān)鍵詞:原型實(shí)例實(shí)體

    季一木,張 旺,劉 強(qiáng),2,劉尚東,洪 程,邱晨陽,朱金森,惠 巖,肖 婉

    (1.南京郵電大學(xué) 計(jì)算機(jī)學(xué)院,江蘇 南京 210023 2.南京郵電大學(xué)高性能計(jì)算與大數(shù)據(jù)處理研究所,江蘇南京 210023 3.國家高性能計(jì)算中心南京分中心,江蘇 南京 210023 4.南京郵電大學(xué)高性能計(jì)算與智能處理工程研究中心,江蘇 南京 210023 5.南京郵電大學(xué) 教育科學(xué)與技術(shù)學(xué)院,江蘇 南京 210023)

    隨著互聯(lián)網(wǎng)的快速發(fā)展,數(shù)據(jù)越來越多樣化,文本作為信息傳播的主要形式之一,不斷地更新[1]。實(shí)體關(guān)系抽取作為文本挖掘和信息抽取的核心任務(wù),是知識圖譜構(gòu)建過程中的關(guān)鍵一環(huán)。 其主要目的是對句子中實(shí)體與實(shí)體之間的關(guān)系進(jìn)行識別,抽取句子中的三元組信息,即實(shí)體1-實(shí)體2-關(guān)系三元組,得到的三元組信息可以提供給知識圖譜的構(gòu)建、問答、機(jī)器閱讀等下游自然語言處理(Natural Language Processing, NLP)[2]任務(wù)。 由于近年來自然語言處理的發(fā)展與應(yīng)用,關(guān)系抽取也吸引了許多研究者。 有監(jiān)督的關(guān)系抽取方法如CNN、RNN、LSTM 等[2]在該任務(wù)上已取得非常好的效果。 但是,有監(jiān)督的關(guān)系抽取的準(zhǔn)確率往往過于依賴高質(zhì)量的數(shù)據(jù)集,而人工標(biāo)準(zhǔn)數(shù)據(jù)集往往需要耗費(fèi)大量精力。 為了快速構(gòu)造有標(biāo)簽的大規(guī)模數(shù)據(jù)集, Mintz等[3]提出了遠(yuǎn)程監(jiān)督的思想,用來生成帶標(biāo)簽的大規(guī)模數(shù)據(jù)集。 該思想基于這樣一個假設(shè):如果一個句子中含有一個關(guān)系涉及的實(shí)體對,那這個句子就是描述的這個關(guān)系。 因此,遠(yuǎn)程監(jiān)督的數(shù)據(jù)里存在大量噪聲。 為了緩解噪聲數(shù)據(jù)問題,Zeng 等[4]使用分段卷積神經(jīng)網(wǎng)絡(luò)(PCNN)提取特征,基于該模型的擴(kuò) 展 有PCNN +MIL[4]、PCNN +ATT[5]、PCNN +BAG[6]等。 雖然這些模型在公共關(guān)系上取得了令人滿意的結(jié)果,但當(dāng)某些關(guān)系的訓(xùn)練實(shí)例很少時,它們的分類性能仍然會急劇下降[7]。 且現(xiàn)有的遠(yuǎn)程監(jiān)督模型忽略了長尾關(guān)系的問題,這使得這些模型難以從純文本中提取全面的信息。

    在小樣本學(xué)習(xí)(Few-shot Learning)方法中,僅僅需要幾個樣本實(shí)例就能使模型學(xué)會區(qū)分不同關(guān)系類型的能力[8],從而緩解大量無標(biāo)簽數(shù)據(jù)帶來的標(biāo)注壓力。 小樣本學(xué)習(xí)的概念最早從計(jì)算機(jī)視覺(Computer Vision)領(lǐng)域興起,近幾年受到廣泛關(guān)注,在圖像分類任務(wù)中已有很多性能優(yōu)異的算法模型,但是在自然語言處理領(lǐng)域發(fā)展得較為緩慢,主要原因是與圖像相比,文本更加多樣化和嘈雜[9]。 最近,隨著元學(xué)習(xí)方法[10-11](Mate-Learning)、圖卷積神經(jīng)網(wǎng)絡(luò)[12](Graph Convolutional Network, GCN)等概念的提出,使得模型能快速地從少量的樣本中進(jìn)行學(xué)習(xí)。 Han 等[13]構(gòu)建了一個用于小樣本關(guān)系抽取的數(shù)據(jù)集FewRel,并基于不同的少樣本模型對其進(jìn)行了評估。 在這些模型中, 基于原型網(wǎng)絡(luò)(Prototypical Network)[14]和 匹 配 網(wǎng) 絡(luò)(Matching Network)[15]的方法能快速有效地對小樣本進(jìn)行學(xué)習(xí)并取得比較好的效果。 但是FewRel 是針對英文文本構(gòu)建的關(guān)系抽取數(shù)據(jù)集,而相對于英文來說,中文更為復(fù)雜,具體表現(xiàn)在:(1) 在中文里,最小的語義單位是字,而字與字之間又能組成不同語義的詞,所以在處理中文分詞時容易遇到歧義問題;(2) 隨著互聯(lián)網(wǎng)的發(fā)展,會對一些詞賦予新的含義,同時組合不同的字也會產(chǎn)生一些新的詞匯,給模型的訓(xùn)練帶來了不小的難度;(3) 中文還有一個特點(diǎn)是重意合而不重形式,句子結(jié)構(gòu)比較松散,不易于提取特征。

    為了解決上述問題,本文以FinRE[16]為基礎(chǔ),重新構(gòu)建了中文關(guān)系抽取數(shù)據(jù)集,使用語義關(guān)系的網(wǎng)絡(luò)HowNet[17]對抽取實(shí)體進(jìn)行語義細(xì)分,同時基于改進(jìn)后的Clues-BERT[18-19]對輸入的文本進(jìn)行編碼,使用少樣本學(xué)習(xí)中的原型網(wǎng)絡(luò)對數(shù)據(jù)進(jìn)行關(guān)系抽取。 同時,為了減少噪聲數(shù)據(jù)對結(jié)果準(zhǔn)確率的影響,考慮到每一次訓(xùn)練中,不同的實(shí)例對結(jié)果的影響不同,這里使用了基于實(shí)例級別的注意力機(jī)制對模型進(jìn)行優(yōu)化。

    綜上所述,本文的主要貢獻(xiàn)如下:

    (1) 基于FinRE 重新構(gòu)建了適合少樣本學(xué)習(xí)的中文數(shù)據(jù)集。

    (2) 在對句子級的注意力機(jī)制的基礎(chǔ)上,使用HowNet[17]對實(shí)體進(jìn)行語義拆分,引入了實(shí)體級別編碼層面的注意力機(jī)制,使模型關(guān)注質(zhì)量更高的特征,提高實(shí)例編碼質(zhì)量。

    (3) 為了評測該方法的有效性,人工地在訓(xùn)練集里加入了一定比例的噪聲數(shù)據(jù)進(jìn)行訓(xùn)練。 結(jié)果顯示,基于注意力機(jī)制的原型網(wǎng)絡(luò)要優(yōu)于原始原型網(wǎng)絡(luò),關(guān)系抽取的準(zhǔn)確率提升在1%~2%之間。

    1 相關(guān)工作

    關(guān)系抽取是非常重要的一項(xiàng)任務(wù),許多研究者提出了各種不同的解決方法。 處理關(guān)系抽取任務(wù)的第一步就是需要將文本字符編碼成計(jì)算機(jī)可以理解的數(shù)值常量,以便于提取特征。 Mikolov 等[20]開源了一款用于詞向量計(jì)算的工具——Word2Vec,用于計(jì)算非常大數(shù)據(jù)集中單詞的連續(xù)矢量表示。 但是由于計(jì)算出來的詞和向量是一對一的關(guān)系,所以一次多義的問題無法解決。 這種缺點(diǎn)在中文上表現(xiàn)得比較明顯,因?yàn)橹形睦飭为?dú)的字的含義就非常豐富,組合成詞的語義就更為繁多復(fù)雜。 Google 發(fā)布的BERT[18]模型在處理輸入的中文序列時,將每個字視為最小的語義單位,使用雙向Transforme 進(jìn)行編碼, 使得每個詞都要和該句子中的所有詞進(jìn)行注意力計(jì)算,從而學(xué)習(xí)句子內(nèi)部的詞依賴關(guān)系,捕獲句子的內(nèi)部結(jié)構(gòu)。 目前,BERT 在NLP 的多個研究領(lǐng)域中都取得良好效果。 但是,原始的BERT 模型參數(shù)眾多,導(dǎo)致模型訓(xùn)練速度慢,且對中文詞向量的表示效果遠(yuǎn)不如英文。 本文使用Xu 等[19]提供的基于BERT 的預(yù)訓(xùn)練模型CLUE-BERT,該模型使用100 GB的原始語料庫,包含350 億個漢字。 與Google 發(fā)布的原生模型BERT-Base 相比較,在保證準(zhǔn)確率不受影響的情況下,訓(xùn)練和預(yù)測速度均有提高。

    在將句子編碼為向量后,如何優(yōu)化關(guān)系抽取模型也是研究的熱點(diǎn)。 最近,元學(xué)習(xí)的思想被應(yīng)用到少樣本關(guān)系抽取中,目的是讓模型獲得一種學(xué)習(xí)能力,這種學(xué)習(xí)能力可以讓模型在新的領(lǐng)域自動學(xué)習(xí)到一些元知識。 在常規(guī)小樣本關(guān)系抽取算法中,基于度量和優(yōu)化的元學(xué)習(xí)方法最為常見。 Ye 等[21]提出基于卷積神經(jīng)網(wǎng)絡(luò)的多級別匹配聚合網(wǎng)絡(luò),Xu等[22]提 出 的 基 于 圖 網(wǎng) 絡(luò) 的 Frog-GNN 以 及Mueller[23]提出的標(biāo)簽語義感知預(yù)訓(xùn)練等方案提升了少樣本關(guān)系抽取的準(zhǔn)確率。 但這些復(fù)雜的方法往往對訓(xùn)練時間要求更長以及機(jī)器的性能要求更高,同時在小樣本關(guān)系分類任務(wù)上的表現(xiàn)相較于基于簡單度量和優(yōu)化的方法并沒有特別大的提升。 原型網(wǎng)絡(luò)的思想和實(shí)現(xiàn)方法都十分簡單明晰,效果與之前的工作相比得到了一定的提升。 Snell 等[14]基于簡單度量的元學(xué)習(xí)方法提出了原型網(wǎng)絡(luò)(Prototypical Network),認(rèn)為每個類別在向量空間中都存在一個原型(Prototype),通過將不同類別的樣例數(shù)據(jù)映射成向量并提取它們的“均值”表示一個類別的原型,通過比較向量之間的歐式距離進(jìn)行相似度的判斷。然而簡單地提取樣例數(shù)據(jù)映射向量的均值并不能很好地反映類別的特征,因?yàn)椴煌臉永龑υ拖蛄康挠绊懖煌?4]。 由于樣本量少,分類邊界存在誤差,當(dāng)數(shù)據(jù)存在噪聲時,容易對結(jié)果造成干擾。 在少樣本學(xué)習(xí)圖像任務(wù)中,注意力機(jī)制已被用于減少噪聲的影響[25]。 Gao 等[26]提出了基于混合注意力的原型網(wǎng)絡(luò),針對實(shí)例級別和特征級別分別設(shè)計(jì)了不同的關(guān)注方案,以分別突出關(guān)鍵實(shí)例和特征,在英文數(shù)據(jù)集FewRel2.0[27]取得了比較好的效果。 但是在中文語境里,一個實(shí)體往往有更為豐富的含義。 因此,如何在中文語境里準(zhǔn)確地關(guān)注每個實(shí)體在上下文中對應(yīng)的語義,以及如何減少噪聲實(shí)例對模型準(zhǔn)確率的影響是本文的關(guān)注點(diǎn)。 在本文工作中,使用雙重注意力機(jī)制給每個類別的不同樣例以及每個實(shí)體不同的含義賦予不同的權(quán)重參數(shù),在一定程度上減少了噪聲對結(jié)果的影響,提升了模型對抗噪聲的能力。 同時,在少樣本關(guān)系抽取中,無需構(gòu)造數(shù)據(jù),數(shù)據(jù)不會存在長尾關(guān)系,僅需要少量的樣本就能訓(xùn)練出優(yōu)質(zhì)的模型。

    2 基于HowNet 的雙重注意力機(jī)制小樣本關(guān)系抽取算法

    本節(jié)詳細(xì)介紹基于小樣本學(xué)習(xí)的中文文本關(guān)系抽取方法。 整體框架圖如圖1 所示,S表示支持集,Q表示查詢集,F(xiàn)ramework 為總體框架圖,Proto-Vector 部分為原型網(wǎng)絡(luò)計(jì)算出來的原型向量,Attention 部分為注意力機(jī)制計(jì)算結(jié)構(gòu)圖。

    圖1 模型的體系結(jié)構(gòu)

    2.1 符號和定義

    在小樣本關(guān)系抽取問題中,將訓(xùn)練數(shù)據(jù)集劃分為已分類的支持集合S和待分類的查詢集合Q, 該任務(wù)被定義為預(yù)測查詢集中的實(shí)體對(h,t) 在對應(yīng)的支持集中屬于關(guān)系r。 對于給定關(guān)系集合R, 支持集S以及查詢集Q,有如下定義

    2.2 基于HowNet 的實(shí)例編碼

    HowNet 是一個大規(guī)模高質(zhì)量的跨語言(中英)常識知識庫,蘊(yùn)含著豐富的語義信息。 其中將詞義概念用更小的語義單位描述,這種語義單位被稱為“義原”(Sememe),是最基本的、不易于再分割的意義的最小單位。 在實(shí)際關(guān)系抽取任務(wù)中,一個實(shí)體通常在不同的上下文環(huán)境中具有不同的含義,如“喬布斯創(chuàng)造了蘋果”和“牛頓因?yàn)樘O果發(fā)現(xiàn)了萬有引力”中的“蘋果”,在前者中是“特定品牌”的意思,而在后者中是“水果”的意思。 為了減少歧義對抽取結(jié)果的影響,使用HowNet 可以獲取每個實(shí)體的最小的義原,例如“蘋果”一詞經(jīng)過HowNet 拆分后可以得到的義原為“tree |樹, SpeBrand |特定牌子,tool|用具, computer|電腦等”,如圖2 所示。 然后經(jīng)過BERT 編碼后進(jìn)行權(quán)重分配,計(jì)算出最符合上下文語義的向量,這一部分將在后面詳細(xì)描述。

    圖2 “蘋果”義原分解圖

    對于給定的實(shí)例x ={w1,w2,…,wn},假設(shè)其中的頭實(shí)體為h,尾實(shí)體為t, 使用HowNet 獲取每個實(shí)體的義原,即h→{h1,h2,…,hi},t→{t1,t2,…,tj}。 將 序 列{x,h,t} 使 用 預(yù) 訓(xùn) 練 模 型CLUEBERT,將句子編碼為低維度向量以表示該實(shí)例的語義信息。 例如,對于給定的實(shí)例x,經(jīng)過編碼后句子中的每一單詞wi將會與一個向量對應(yīng)。

    其中,BERT(·) 表示將輸入的單詞進(jìn)行低維度嵌入,得到的向量ωi用來表示該單詞的語義信息和語法信息。 最后將該實(shí)例中的所有詞向量經(jīng)過一個特征提取層,從而生成一個固定大小的句子嵌入向量X。

    其中,Pool(·)用于提取每個單詞特征,并輸出一個固定大小的維度向量dw表示整個實(shí)例的語義和語法信息,編碼流程如圖3 所示。

    圖3 基于HowNet 的實(shí)例編碼

    2.3 原型網(wǎng)絡(luò)

    原型網(wǎng)絡(luò)(Prototypical Networks)的主要思想是每個類別的關(guān)系類型在高維向量空間中都存在一個原型(Prototype),也稱作類別中心點(diǎn)。 原型網(wǎng)絡(luò)使用神經(jīng)網(wǎng)絡(luò)將不同的句子映射成一個向量,對于同屬于一個關(guān)系類別的樣本,求這一類樣本向量的平均值作為該關(guān)系類型的原型,計(jì)算原型向量的一般方法是對支持集中所有的向量化樣例數(shù)據(jù)取均值得到。其中,ci為原型網(wǎng)絡(luò)為每個類別ri計(jì)算出的一個原型,為支持集S中的一個關(guān)系類型ri的嵌入式向量表示,K表示一次N way K Shot 分類中每個關(guān)系類型實(shí)例的數(shù)量。

    在原型網(wǎng)絡(luò)的計(jì)算中,所有實(shí)例都被同等地對待,但是在現(xiàn)實(shí)中并不是每個實(shí)例對結(jié)果都具有一樣的相關(guān)性。 因此,在訓(xùn)練中應(yīng)該關(guān)注那些更能代表該關(guān)系類型的實(shí)例。 在這里使用的方法中,簡單的平均機(jī)制被實(shí)例級注意所取代,以突出支持集中那些更相關(guān)的實(shí)例,將在下一部分中討論。 在分類時,原形網(wǎng)絡(luò)使用Softmax(·)計(jì)算查詢集Q與向量ci的距離,用來表示查詢集總實(shí)例x在關(guān)系集合R中的概率。

    其中,- d(·,·) 為計(jì)算兩個向量距離的函數(shù),f?(·) 表示 對 輸入 的 查 詢 集 實(shí) 例x進(jìn) 行 編 碼,p?(y = ri |x) 表示查詢實(shí)例x是關(guān)系類型ri的概率。 距離函數(shù)有多種選擇,根據(jù)Snell 等[14]的研究,歐幾里德距離優(yōu)于其他距離函數(shù),因此在該網(wǎng)絡(luò)中,選擇使用歐幾里德距離計(jì)算兩個向量之間的距離。

    2.4 雙重注意力機(jī)制

    每個實(shí)例中的實(shí)體經(jīng)過HowNet 分解得到不同的義原,然而在現(xiàn)實(shí)中每個實(shí)體根據(jù)上下文的不同而具有不同的意義。 為了更為準(zhǔn)確地表示實(shí)體在上下文中的意義,對其所有義原根據(jù)其相關(guān)性進(jìn)行權(quán)重分配,從而減少噪聲對訓(xùn)練結(jié)果的影響。 義原在經(jīng)過CLUE-BERT 編碼后得到其對應(yīng)的向量表示形式,即Sems ={Sem1,Sem2,…,Semk},k =6,k為得到的義原數(shù)量。 為每一個義原權(quán)重分配一個權(quán)重βj(如圖1 中Entity-Attention 所示),從而計(jì)算實(shí)體的向量為

    其中,βj被定義為

    將每個實(shí)例中的實(shí)體進(jìn)行如上計(jì)算,即可得到該實(shí)例的向量表示{ω1,ω2,…,ωn,Semh,Semt}。

    對于每個關(guān)系類型,原型網(wǎng)絡(luò)采用實(shí)例的平均向量作為關(guān)系原型。 但是,在現(xiàn)實(shí)世界中,每個關(guān)系類型的不同實(shí)例與該關(guān)系類型的相關(guān)性并不是一樣的。 特別是在少樣本場景中,由于缺少訓(xùn)練數(shù)據(jù),一個實(shí)例的表示形式與其他實(shí)例的表示形式相差很遠(yuǎn),這將導(dǎo)致相應(yīng)原型的巨大偏差。 如果訓(xùn)練集中存在噪聲數(shù)據(jù),或者一種關(guān)系類型存在多種語義,這將會對結(jié)果的準(zhǔn)確率產(chǎn)生非常大的影響。 為了解決上述問題,根據(jù)相關(guān)性的大小對輸入的實(shí)例分配不同的權(quán)重,從而減少噪聲的影響。 對于訓(xùn)練時支持集S中的每一個實(shí)例向量,為其分配一個權(quán)重αj(如圖1 中Sentence-Attention 所示),從而計(jì)算原型向量的方法變?yōu)?/p>

    其中,αj被定義為

    其中,f(·) 為一個線性層,☉為將兩個矩陣的對應(yīng)元素進(jìn)行相乘的操作,σ(·) 為一個激活函數(shù),這里使用的是tanh(·) 函數(shù)保證計(jì)算的結(jié)果在[1,-1]范圍內(nèi),sum{}用來對向量所有元素求和。 通過訓(xùn)練實(shí)例級的注意力機(jī)制,支持集中的實(shí)例特征與查詢實(shí)例特征越相似,將獲得更高的權(quán)重,最終計(jì)算的原型向量更接近這些實(shí)例。

    2.5 算法實(shí)現(xiàn)

    對于支持集輸入的句子,首先將頭實(shí)體和尾實(shí)體輸入HowNet 網(wǎng)絡(luò),解析得到不同的義原,然后將得到的義原和實(shí)例輸入CLUE-BERT 模塊進(jìn)行編碼。 此時得到的輸出包含實(shí)例和實(shí)體的編碼,先使用算法1 計(jì)算出每個義原的權(quán)重,將權(quán)重與對應(yīng)的向量相乘,得到代表該實(shí)體的向量表示;同理,使用算法2 進(jìn)行權(quán)重計(jì)算,可以得到類型的向量表示;對查詢集輸入的句子,進(jìn)行如上的計(jì)算得到一個向量表示;最后將兩個向量使用歐幾里德距離計(jì)算相似度。 由于交叉熵?fù)p失函數(shù)常應(yīng)用于多分類任務(wù)中,因此訓(xùn)練過程中選擇其作為目標(biāo)函數(shù),通過反向傳播調(diào)整模型的權(quán)重,該損失函數(shù)表達(dá)式如下

    其中,c為計(jì)算出的相似度,class為類別數(shù)。

    算法1Entity-Attention 算法

    算法2Sentence-Attention 算法

    3 實(shí)驗(yàn)與結(jié)果分析

    3.1 實(shí)驗(yàn)數(shù)據(jù)集

    以Li 等[16]手動標(biāo)注的數(shù)據(jù)集FinRE 為基礎(chǔ),重新構(gòu)建了支持少樣本學(xué)習(xí)的中文數(shù)據(jù)集。 該數(shù)據(jù)集一共有44 種關(guān)系,其中30 種關(guān)系用來訓(xùn)練,14種關(guān)系用來測試和驗(yàn)證。 為保證實(shí)驗(yàn)結(jié)果的準(zhǔn)確性,在測試集中出現(xiàn)的關(guān)系類型,不會被劃分到訓(xùn)練集中。 為了驗(yàn)證基于注意力機(jī)制的原型網(wǎng)絡(luò)的有效性,在數(shù)據(jù)集中人工地添加0%、10%、30%、50%的噪聲數(shù)據(jù),這些數(shù)據(jù)在訓(xùn)練時將會被當(dāng)成正確的數(shù)據(jù)進(jìn)行訓(xùn)練。

    3.2 參數(shù)設(shè)置

    實(shí)驗(yàn)中所有的參數(shù)設(shè)置如表1 所示,對于訓(xùn)練文本中的每個實(shí)例,單詞數(shù)量大于40 的,截取前40 個,不足的則以“[PAD]”填充。 對于詞嵌入,使用CLUE-BERT 預(yù)訓(xùn)練好的輕量級模型對輸入的文本序列進(jìn)行編碼,該模型包含35 kB 的中文詞匯,輸入詞向量的維度為312,設(shè)置原始原型網(wǎng)絡(luò)的迭代次數(shù)為30 000 次。 所有模型都在訓(xùn)練集上進(jìn)行訓(xùn)練,然后選擇在驗(yàn)證集上表現(xiàn)最佳的模型在測試集上進(jìn)行測試。

    表1 參數(shù)設(shè)置

    3.3 結(jié)果分析

    為了證明基于實(shí)例級注意力機(jī)制的小樣本關(guān)系抽取方法對抗噪聲的有效性,通過計(jì)算該模型對關(guān)系實(shí)例抽取的準(zhǔn)確率來評測模型的效果,結(jié)果如表2 所示,分別是在0%、20%、30%、50%的噪聲數(shù)據(jù)下,使用原始的原型網(wǎng)絡(luò)(Proto)和基于注意力機(jī)制的原型網(wǎng)絡(luò)(Proto-att)得到的關(guān)系抽取的準(zhǔn)確率。 可以看出,在少樣本關(guān)系抽取中,隨著關(guān)系類別的增加,準(zhǔn)確率會隨之下降;隨著每個關(guān)系類別的實(shí)例增多,準(zhǔn)確率會上升,但并不是無限上升,當(dāng)達(dá)到某一個水平時,上升速率趨近飽和,增加實(shí)例的數(shù)量對準(zhǔn)確率的提升不再有明顯優(yōu)勢。 與原型網(wǎng)絡(luò)相比較,當(dāng)存在噪聲數(shù)據(jù)時,基于雙重注意力機(jī)制的原型網(wǎng)絡(luò)會有更好的性能表現(xiàn)。

    表2 關(guān)系抽取準(zhǔn)確度比較 %

    表3 是基于HowNet 的雙重注意力機(jī)制的小樣本關(guān)系抽取模型與其他模型,在沒有添加噪聲數(shù)據(jù)情況下抽取準(zhǔn)確率的對比,實(shí)驗(yàn)證明了基于HowNet的雙重注意力機(jī)制的小樣本關(guān)系抽取模型在抽取準(zhǔn)確率方面相較于其他模型有一定的提升,使用的基線模型如下:

    表3 各模型在FinRE 數(shù)據(jù)集上準(zhǔn)確率對比 %

    (1) ProtoNet(CNN)[22]是利用卷積神經(jīng)網(wǎng)絡(luò)作為編碼器,將非線性地映射到向量空間,最后衡量歐式距離做分類。

    (2) ProtoNet(BERT)是利用Google 發(fā)布的原生預(yù)訓(xùn)練語言模型BERT,將整個句子編碼到統(tǒng)一的語義空間中,利用預(yù)訓(xùn)練的優(yōu)勢能極大提升訓(xùn)練的效率。

    (3) ProtoNet(KEPLER)利用了Wang 等[28]在預(yù)訓(xùn)練語言模型的基礎(chǔ)上,結(jié)合知識圖譜將知識嵌入到預(yù)訓(xùn)練語言模型中,在預(yù)訓(xùn)練過程中對整個語言模型進(jìn)行優(yōu)化。

    (4) Proto(CLUE-BERT)利用了Xu 等[19]在BERT 的基礎(chǔ)上對預(yù)訓(xùn)練語言模型的改進(jìn),使用了大量的中文語料庫進(jìn)行訓(xùn)練,在中文的語言建模、預(yù)訓(xùn)練或生成型任務(wù)等方面具有優(yōu)秀的表現(xiàn)。

    4 結(jié)束語

    本文重新構(gòu)建了中文關(guān)系抽取數(shù)據(jù)集FinRE,使之適合于少樣本關(guān)系抽取。 使用CLUE-BERT 對中文文本進(jìn)行編碼,并引入了HowNet 語義網(wǎng)絡(luò),使用雙重注意力機(jī)制的原型網(wǎng)絡(luò)模型對該數(shù)據(jù)集進(jìn)行了評估實(shí)驗(yàn)。 在數(shù)據(jù)集中摻雜不同比例的噪聲數(shù)據(jù),實(shí)驗(yàn)結(jié)果表明,基于注意力機(jī)制的原型網(wǎng)絡(luò)有更好的效果以及魯棒性。

    猜你喜歡
    原型實(shí)例實(shí)體
    包裹的一切
    前海自貿(mào)區(qū):金融服務(wù)實(shí)體
    中國外匯(2019年18期)2019-11-25 01:41:54
    《哈姆雷特》的《圣經(jīng)》敘事原型考證
    實(shí)體的可感部分與實(shí)體——兼論亞里士多德分析實(shí)體的兩種模式
    兩會進(jìn)行時:緊扣實(shí)體經(jīng)濟(jì)“釘釘子”
    振興實(shí)體經(jīng)濟(jì)地方如何“釘釘子”
    論《西藏隱秘歲月》的原型復(fù)現(xiàn)
    原型理論分析“門”
    人間(2015年20期)2016-01-04 12:47:08
    完形填空Ⅱ
    完形填空Ⅰ
    国产黄频视频在线观看| 男女无遮挡免费网站观看| 久久久精品免费免费高清| 女人久久www免费人成看片| 最新的欧美精品一区二区| 大片电影免费在线观看免费| 欧美日韩国产mv在线观看视频| 丝袜在线中文字幕| 男女床上黄色一级片免费看| 嫁个100分男人电影在线观看| av网站在线播放免费| 国精品久久久久久国模美| 成人精品一区二区免费| 国产在线精品亚洲第一网站| 考比视频在线观看| 91麻豆精品激情在线观看国产 | 欧美日韩成人在线一区二区| 亚洲熟女精品中文字幕| 国产黄频视频在线观看| 亚洲国产av影院在线观看| 国产精品亚洲av一区麻豆| 777米奇影视久久| 国产成人啪精品午夜网站| 国产精品欧美亚洲77777| 正在播放国产对白刺激| 免费av中文字幕在线| 搡老乐熟女国产| 窝窝影院91人妻| 无限看片的www在线观看| 欧美精品啪啪一区二区三区| 久久久国产欧美日韩av| 最近最新中文字幕大全免费视频| 少妇的丰满在线观看| netflix在线观看网站| 999久久久国产精品视频| 日本黄色日本黄色录像| 日本一区二区免费在线视频| 成人特级黄色片久久久久久久 | 操出白浆在线播放| 黑人操中国人逼视频| 丝瓜视频免费看黄片| 成人免费观看视频高清| 久久精品亚洲av国产电影网| 久久久精品94久久精品| 久久久久久免费高清国产稀缺| 1024香蕉在线观看| 高清毛片免费观看视频网站 | 无限看片的www在线观看| 国产精品亚洲av一区麻豆| 美女扒开内裤让男人捅视频| 少妇猛男粗大的猛烈进出视频| 色播在线永久视频| 欧美日韩精品网址| 午夜精品国产一区二区电影| 亚洲美女黄片视频| 欧美av亚洲av综合av国产av| 亚洲美女黄片视频| 乱人伦中国视频| 国产又爽黄色视频| 人人妻人人爽人人添夜夜欢视频| 十八禁网站网址无遮挡| 91av网站免费观看| 亚洲av日韩在线播放| tocl精华| 99香蕉大伊视频| e午夜精品久久久久久久| 久久久国产一区二区| 黄片播放在线免费| 欧美性长视频在线观看| 97人妻天天添夜夜摸| 天天躁夜夜躁狠狠躁躁| 美女高潮喷水抽搐中文字幕| 黄色视频,在线免费观看| 91国产中文字幕| 日韩中文字幕视频在线看片| 色尼玛亚洲综合影院| xxxhd国产人妻xxx| 久久国产亚洲av麻豆专区| 色综合婷婷激情| 老司机亚洲免费影院| 精品一区二区三区视频在线观看免费 | 一本一本久久a久久精品综合妖精| 丁香欧美五月| 中文字幕人妻丝袜一区二区| 满18在线观看网站| 18在线观看网站| 99精品久久久久人妻精品| 亚洲伊人久久精品综合| 亚洲欧洲精品一区二区精品久久久| 日本av手机在线免费观看| 大片免费播放器 马上看| 国产精品国产高清国产av | 久热爱精品视频在线9| 黑人巨大精品欧美一区二区蜜桃| 欧美在线黄色| 亚洲熟妇熟女久久| 国产伦人伦偷精品视频| 中文欧美无线码| 日本撒尿小便嘘嘘汇集6| 国产日韩一区二区三区精品不卡| 亚洲av成人一区二区三| 一边摸一边做爽爽视频免费| 国产精品麻豆人妻色哟哟久久| 免费女性裸体啪啪无遮挡网站| 国产成人欧美在线观看 | 午夜福利欧美成人| 人成视频在线观看免费观看| xxxhd国产人妻xxx| 色在线成人网| 久久久久久久久久久久大奶| 日日夜夜操网爽| av天堂在线播放| 久久中文字幕一级| 黄色丝袜av网址大全| 亚洲成人免费电影在线观看| 性高湖久久久久久久久免费观看| 国产男女超爽视频在线观看| 99精国产麻豆久久婷婷| 精品福利观看| 国产亚洲av高清不卡| 热re99久久精品国产66热6| 日日爽夜夜爽网站| 成人三级做爰电影| 老司机午夜十八禁免费视频| 国产免费福利视频在线观看| 天堂动漫精品| 午夜福利视频在线观看免费| 国产xxxxx性猛交| av不卡在线播放| 在线播放国产精品三级| 制服诱惑二区| 99国产精品一区二区蜜桃av | 久久久久久久大尺度免费视频| 亚洲中文日韩欧美视频| 久久热在线av| 最新美女视频免费是黄的| 极品人妻少妇av视频| 人妻久久中文字幕网| 精品卡一卡二卡四卡免费| 免费在线观看日本一区| 黄色成人免费大全| 日韩欧美一区视频在线观看| 最近最新中文字幕大全免费视频| 热99re8久久精品国产| 亚洲 欧美一区二区三区| 精品福利观看| 欧美精品高潮呻吟av久久| 国产成人精品在线电影| 中亚洲国语对白在线视频| 精品熟女少妇八av免费久了| 精品第一国产精品| 少妇猛男粗大的猛烈进出视频| 咕卡用的链子| 99国产精品一区二区三区| 女性被躁到高潮视频| 国产精品电影一区二区三区 | 国产国语露脸激情在线看| 久久中文字幕人妻熟女| 国产日韩欧美亚洲二区| 女性被躁到高潮视频| 国产精品久久久久久精品电影小说| 久久精品亚洲精品国产色婷小说| 久久国产精品人妻蜜桃| 大片免费播放器 马上看| 天天躁夜夜躁狠狠躁躁| 啦啦啦 在线观看视频| 桃红色精品国产亚洲av| 亚洲国产av新网站| 两人在一起打扑克的视频| 黄片大片在线免费观看| 一边摸一边抽搐一进一小说 | 亚洲一码二码三码区别大吗| 黄色片一级片一级黄色片| 91麻豆av在线| 日日夜夜操网爽| 黑人巨大精品欧美一区二区mp4| 丁香六月天网| 亚洲精品美女久久久久99蜜臀| 男女边摸边吃奶| 久久精品国产99精品国产亚洲性色 | 欧美成狂野欧美在线观看| 国产男女内射视频| 99久久99久久久精品蜜桃| 大型黄色视频在线免费观看| 美女高潮喷水抽搐中文字幕| 丝袜人妻中文字幕| 国产男女内射视频| 美女视频免费永久观看网站| 欧美精品一区二区大全| 成人精品一区二区免费| 精品亚洲成国产av| 一区二区三区精品91| 中文字幕av电影在线播放| videos熟女内射| av网站免费在线观看视频| 天堂8中文在线网| 国产精品影院久久| 久久精品91无色码中文字幕| 国产成人精品久久二区二区免费| 在线永久观看黄色视频| av片东京热男人的天堂| 国产精品久久久久久精品古装| 90打野战视频偷拍视频| 一本—道久久a久久精品蜜桃钙片| 国产日韩欧美视频二区| 男女免费视频国产| 看免费av毛片| 国产野战对白在线观看| 免费观看a级毛片全部| 丝袜美足系列| 午夜福利,免费看| 亚洲成a人片在线一区二区| 美女国产高潮福利片在线看| 亚洲人成77777在线视频| 老司机福利观看| 黄色成人免费大全| 成在线人永久免费视频| 久久久久久久久免费视频了| avwww免费| 两性夫妻黄色片| 中文字幕高清在线视频| 99精品欧美一区二区三区四区| av片东京热男人的天堂| 黄色 视频免费看| 免费观看av网站的网址| 免费在线观看日本一区| 国产精品国产av在线观看| 亚洲人成伊人成综合网2020| 亚洲情色 制服丝袜| 亚洲国产欧美网| 天天操日日干夜夜撸| 国产97色在线日韩免费| 50天的宝宝边吃奶边哭怎么回事| 免费日韩欧美在线观看| 亚洲欧美激情在线| av天堂在线播放| 啦啦啦 在线观看视频| 制服诱惑二区| 久久青草综合色| 欧美亚洲日本最大视频资源| 国产欧美日韩精品亚洲av| 国产精品偷伦视频观看了| 午夜久久久在线观看| 色婷婷久久久亚洲欧美| 欧美在线黄色| 老鸭窝网址在线观看| www.精华液| 在线观看66精品国产| 在线观看人妻少妇| 99国产综合亚洲精品| 欧美精品av麻豆av| 免费少妇av软件| 男人操女人黄网站| 五月天丁香电影| 亚洲熟妇熟女久久| 久久久精品94久久精品| 国产精品久久久av美女十八| 在线观看免费午夜福利视频| 侵犯人妻中文字幕一二三四区| 老司机影院毛片| 久久午夜综合久久蜜桃| 久久精品aⅴ一区二区三区四区| 一边摸一边抽搐一进一出视频| 日本精品一区二区三区蜜桃| 久久久国产一区二区| 成人国产一区最新在线观看| 国产av又大| 欧美日韩精品网址| 视频区欧美日本亚洲| 欧美黄色淫秽网站| 脱女人内裤的视频| 菩萨蛮人人尽说江南好唐韦庄| 亚洲精品av麻豆狂野| 国产精品99久久99久久久不卡| 国产欧美日韩一区二区三| 亚洲熟女精品中文字幕| 99久久99久久久精品蜜桃| 欧美在线黄色| 视频区欧美日本亚洲| 一本久久精品| 一区二区日韩欧美中文字幕| 在线观看免费午夜福利视频| 多毛熟女@视频| 欧美乱码精品一区二区三区| 宅男免费午夜| 99久久精品国产亚洲精品| 亚洲va日本ⅴa欧美va伊人久久| 久久毛片免费看一区二区三区| 亚洲一卡2卡3卡4卡5卡精品中文| av国产精品久久久久影院| 亚洲精品在线观看二区| 男女边摸边吃奶| 女人爽到高潮嗷嗷叫在线视频| 国产精品国产av在线观看| 老司机午夜十八禁免费视频| av免费在线观看网站| 欧美黑人欧美精品刺激| 99热网站在线观看| 麻豆成人av在线观看| 国产一区二区激情短视频| 成人国语在线视频| 老熟妇乱子伦视频在线观看| www.999成人在线观看| 久久久精品国产亚洲av高清涩受| 欧美日韩精品网址| 亚洲熟妇熟女久久| 欧美成人免费av一区二区三区 | 黑人欧美特级aaaaaa片| 欧美日韩亚洲高清精品| 中文字幕另类日韩欧美亚洲嫩草| 最新美女视频免费是黄的| 亚洲av成人不卡在线观看播放网| 免费女性裸体啪啪无遮挡网站| av天堂久久9| videos熟女内射| 国产色视频综合| 免费在线观看视频国产中文字幕亚洲| av视频免费观看在线观看| 后天国语完整版免费观看| 亚洲自偷自拍图片 自拍| 亚洲第一青青草原| 成人国语在线视频| 建设人人有责人人尽责人人享有的| 亚洲九九香蕉| 搡老乐熟女国产| 国产男靠女视频免费网站| 桃红色精品国产亚洲av| 黑人操中国人逼视频| 免费黄频网站在线观看国产| 国产黄频视频在线观看| 日韩免费高清中文字幕av| 国产日韩欧美在线精品| 丁香欧美五月| 黄片大片在线免费观看| 亚洲av片天天在线观看| 在线永久观看黄色视频| 亚洲成a人片在线一区二区| 国产精品1区2区在线观看. | 飞空精品影院首页| 中文字幕人妻丝袜制服| 亚洲综合色网址| 不卡一级毛片| 午夜福利在线免费观看网站| 国产男女内射视频| av线在线观看网站| 制服诱惑二区| 无限看片的www在线观看| 一进一出好大好爽视频| 99久久国产精品久久久| 国产日韩欧美视频二区| 国内毛片毛片毛片毛片毛片| 成人18禁在线播放| 在线观看免费视频日本深夜| 两个人免费观看高清视频| 国产不卡av网站在线观看| 如日韩欧美国产精品一区二区三区| 丝袜美足系列| 91麻豆精品激情在线观看国产 | 大型黄色视频在线免费观看| 午夜福利在线观看吧| 美国免费a级毛片| 人人妻人人爽人人添夜夜欢视频| 久久久久久亚洲精品国产蜜桃av| 亚洲熟女毛片儿| 精品国产乱码久久久久久男人| 久久国产精品人妻蜜桃| 丝袜喷水一区| 免费人妻精品一区二区三区视频| 久久 成人 亚洲| 在线观看免费视频网站a站| 日本一区二区免费在线视频| 9热在线视频观看99| 午夜福利免费观看在线| 亚洲精品国产一区二区精华液| 男人舔女人的私密视频| 国产精品 国内视频| 在线观看舔阴道视频| 一本一本久久a久久精品综合妖精| 十分钟在线观看高清视频www| 精品国产亚洲在线| 日本a在线网址| 9色porny在线观看| 国产又爽黄色视频| 美女主播在线视频| 下体分泌物呈黄色| 美女高潮到喷水免费观看| 男女高潮啪啪啪动态图| 午夜福利视频在线观看免费| 国产熟女午夜一区二区三区| 色老头精品视频在线观看| 国产亚洲欧美在线一区二区| 日韩大片免费观看网站| 麻豆成人av在线观看| 黄频高清免费视频| 国产精品电影一区二区三区 | 欧美日本中文国产一区发布| 久久久国产一区二区| 亚洲少妇的诱惑av| 桃红色精品国产亚洲av| 女人爽到高潮嗷嗷叫在线视频| 亚洲男人天堂网一区| 婷婷丁香在线五月| 老熟妇仑乱视频hdxx| 国产成人精品久久二区二区91| 99久久99久久久精品蜜桃| 深夜精品福利| 色综合欧美亚洲国产小说| 新久久久久国产一级毛片| 国产国语露脸激情在线看| 两性午夜刺激爽爽歪歪视频在线观看 | 一本一本久久a久久精品综合妖精| 18禁黄网站禁片午夜丰满| 又紧又爽又黄一区二区| 叶爱在线成人免费视频播放| 一级毛片电影观看| 亚洲伊人色综图| 男人操女人黄网站| 亚洲五月色婷婷综合| 久久人妻福利社区极品人妻图片| 99精品在免费线老司机午夜| 热99久久久久精品小说推荐| 一本色道久久久久久精品综合| 午夜精品国产一区二区电影| 在线观看免费日韩欧美大片| 老司机深夜福利视频在线观看| 亚洲av日韩精品久久久久久密| 亚洲精品久久午夜乱码| 国产不卡一卡二| 菩萨蛮人人尽说江南好唐韦庄| 丝袜在线中文字幕| av超薄肉色丝袜交足视频| 咕卡用的链子| 亚洲精品国产精品久久久不卡| 9色porny在线观看| 国产精品香港三级国产av潘金莲| av片东京热男人的天堂| 每晚都被弄得嗷嗷叫到高潮| 嫁个100分男人电影在线观看| www.熟女人妻精品国产| 一级黄色大片毛片| 日韩欧美免费精品| 精品少妇久久久久久888优播| 久久精品熟女亚洲av麻豆精品| 99久久精品国产亚洲精品| 丝袜在线中文字幕| 这个男人来自地球电影免费观看| 在线 av 中文字幕| 一个人免费在线观看的高清视频| 国产99久久九九免费精品| 国产一卡二卡三卡精品| 777米奇影视久久| 亚洲美女黄片视频| 欧美日韩福利视频一区二区| 精品一区二区三区视频在线观看免费 | 国产97色在线日韩免费| 午夜视频精品福利| 欧美精品一区二区免费开放| 老司机在亚洲福利影院| 天堂中文最新版在线下载| 亚洲午夜理论影院| 啦啦啦 在线观看视频| 人人澡人人妻人| 午夜福利一区二区在线看| 老司机福利观看| 在线观看一区二区三区激情| 国产一区二区在线观看av| 嫩草影视91久久| 午夜精品久久久久久毛片777| 亚洲专区国产一区二区| 久久免费观看电影| 九色亚洲精品在线播放| 大陆偷拍与自拍| 免费一级毛片在线播放高清视频 | 波多野结衣一区麻豆| 亚洲中文字幕日韩| 免费看十八禁软件| 欧美激情久久久久久爽电影 | 最新在线观看一区二区三区| 亚洲 国产 在线| 亚洲一卡2卡3卡4卡5卡精品中文| 亚洲成人免费电影在线观看| 国产精品九九99| 国精品久久久久久国模美| 一二三四社区在线视频社区8| 久久热在线av| 久久毛片免费看一区二区三区| 夫妻午夜视频| 午夜福利乱码中文字幕| 国产亚洲欧美精品永久| 免费黄频网站在线观看国产| aaaaa片日本免费| 涩涩av久久男人的天堂| 两人在一起打扑克的视频| 男女午夜视频在线观看| 精品久久久久久电影网| 久久久久久人人人人人| 欧美亚洲 丝袜 人妻 在线| 亚洲专区国产一区二区| 中亚洲国语对白在线视频| 老熟妇乱子伦视频在线观看| 国产福利在线免费观看视频| 国产精品国产高清国产av | 又大又爽又粗| 侵犯人妻中文字幕一二三四区| 亚洲一码二码三码区别大吗| 不卡av一区二区三区| 性色av乱码一区二区三区2| 99九九在线精品视频| 午夜福利在线免费观看网站| 国产免费视频播放在线视频| 岛国毛片在线播放| 国产成人免费无遮挡视频| 国产精品九九99| 一级毛片精品| 国产亚洲欧美在线一区二区| 真人做人爱边吃奶动态| 岛国毛片在线播放| 久久国产亚洲av麻豆专区| 女人久久www免费人成看片| 美女福利国产在线| 亚洲av日韩精品久久久久久密| 亚洲成人手机| 久久国产精品大桥未久av| 9191精品国产免费久久| 亚洲av日韩精品久久久久久密| 午夜福利视频精品| 90打野战视频偷拍视频| 美女福利国产在线| 亚洲人成77777在线视频| 国产亚洲精品一区二区www | 男女边摸边吃奶| 国产精品一区二区精品视频观看| 精品福利永久在线观看| 免费在线观看视频国产中文字幕亚洲| 香蕉丝袜av| 国产老妇伦熟女老妇高清| a级毛片在线看网站| 亚洲熟女毛片儿| 亚洲天堂av无毛| 好男人电影高清在线观看| 99久久精品国产亚洲精品| 免费黄频网站在线观看国产| 亚洲成国产人片在线观看| 国产真人三级小视频在线观看| 一本—道久久a久久精品蜜桃钙片| 国产一区有黄有色的免费视频| av网站在线播放免费| 蜜桃在线观看..| 午夜免费鲁丝| 女人久久www免费人成看片| 丝袜美足系列| 一夜夜www| 9热在线视频观看99| 久久天躁狠狠躁夜夜2o2o| 亚洲欧美日韩另类电影网站| 视频在线观看一区二区三区| 国产精品香港三级国产av潘金莲| 久久久国产一区二区| 午夜福利一区二区在线看| 国产精品一区二区免费欧美| 啦啦啦 在线观看视频| 色播在线永久视频| 久久人妻福利社区极品人妻图片| 9191精品国产免费久久| 国产亚洲精品久久久久5区| 国产精品国产高清国产av | 国产欧美日韩一区二区精品| 久久精品国产a三级三级三级| 中文字幕色久视频| 国产主播在线观看一区二区| 国产人伦9x9x在线观看| 高清视频免费观看一区二区| 中文字幕av电影在线播放| 黄色视频,在线免费观看| 免费日韩欧美在线观看| 久久免费观看电影| 热re99久久精品国产66热6| 99热国产这里只有精品6| 精品亚洲成国产av| 午夜成年电影在线免费观看| 午夜福利一区二区在线看| 久久青草综合色| 亚洲性夜色夜夜综合| 国产精品国产高清国产av | 午夜老司机福利片| 日韩成人在线观看一区二区三区| 国产激情久久老熟女| 免费在线观看完整版高清| 男男h啪啪无遮挡| 国产福利在线免费观看视频| 日韩一区二区三区影片| 人人妻人人澡人人看| 少妇精品久久久久久久| 国产成人啪精品午夜网站| 亚洲视频免费观看视频| 啦啦啦在线免费观看视频4| 成人亚洲精品一区在线观看| 我要看黄色一级片免费的| 亚洲国产欧美一区二区综合| 美女视频免费永久观看网站| 桃花免费在线播放| 久热这里只有精品99| 婷婷丁香在线五月| 午夜福利欧美成人| 亚洲欧洲日产国产| 99国产精品免费福利视频| 欧美日韩国产mv在线观看视频| 肉色欧美久久久久久久蜜桃| 欧美 亚洲 国产 日韩一| 亚洲一码二码三码区别大吗| 久久国产精品影院| 久久性视频一级片| www.自偷自拍.com| 精品久久蜜臀av无| 国产淫语在线视频|