• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于Transformer編碼器的語(yǔ)義相似度算法研究

    2021-07-28 13:08:12喬偉濤黃海燕
    關(guān)鍵詞:注意力語(yǔ)義編碼

    喬偉濤,黃海燕,王 珊

    華東理工大學(xué) 信息科學(xué)與工程學(xué)院,上海200237

    隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,每時(shí)每刻有大量的信息以文本的形式產(chǎn)生。如何對(duì)文本信息進(jìn)行分析處理是NLP(自然語(yǔ)言處理)研究的主要內(nèi)容。其中的語(yǔ)義相似度計(jì)算是NLP領(lǐng)域中非常重要的研究方向,該技術(shù)可廣泛應(yīng)用于搜索引擎、問(wèn)答系統(tǒng)中,為系統(tǒng)篩選出更為準(zhǔn)確的答案,也可應(yīng)用在內(nèi)容去重中,例如對(duì)門(mén)戶網(wǎng)站的標(biāo)題進(jìn)行語(yǔ)義相似度計(jì)算實(shí)現(xiàn)去除重復(fù)新聞。

    目前,語(yǔ)義相似度的主流計(jì)算方法主要分為四類:第一類是傳統(tǒng)的基于稀疏特征的統(tǒng)計(jì)學(xué)方法,第二類是基于語(yǔ)義詞典的計(jì)算方法,第三類是基于向量空間模型的方法,第四類是基于深度神經(jīng)網(wǎng)絡(luò)的方法。傳統(tǒng)的統(tǒng)計(jì)學(xué)的方法是利用句子中的共現(xiàn)詞、統(tǒng)計(jì)詞頻等特征來(lái)計(jì)算相似度。張培穎[1]通過(guò)統(tǒng)計(jì)句子間的詞語(yǔ)距離、結(jié)構(gòu)以及長(zhǎng)度差異等特征,通過(guò)對(duì)不同的特征賦予不同的權(quán)重來(lái)調(diào)節(jié)各個(gè)特征對(duì)于句子相似度的貢獻(xiàn)來(lái)計(jì)算句子間的相似度?;谡Z(yǔ)義詞典的方法是利用外部詞匯資源來(lái)提取句子文本中的特征,例如中文語(yǔ)義詞典HowNet 和英文語(yǔ)義詞典的WordNet,F(xiàn)ernando 等人[2]基于WordNet 提取出句子相似關(guān)系矩陣相結(jié)合來(lái)計(jì)算句子之間的相似度。朱新華等人[3]在HowNet和同義詞詞林的相似度檢測(cè)上重新設(shè)計(jì)權(quán)重計(jì)算方法取得較好的結(jié)果。在向量空間模型中,用關(guān)鍵詞組成的集合來(lái)表示文本,關(guān)鍵詞在文本中權(quán)值可以通過(guò)詞頻-逆文檔概率(TF-IDF)方法計(jì)算出,將關(guān)鍵詞的權(quán)值映射為向量中各個(gè)元素,則文本可以通過(guò)向量的形式來(lái)表示,然后再利用向量的余弦相似度來(lái)表示句子的語(yǔ)義相似度[4]。句子由詞組成,詞的不同詞性及其在句子中的位置對(duì)句子的語(yǔ)義有著重要的影響,以上介紹的傳統(tǒng)方法都圍繞句子中出現(xiàn)的詞語(yǔ)特征進(jìn)行建模計(jì)算,而忽略了句子中詞語(yǔ)的順序和句子的深層語(yǔ)義,容易造成對(duì)句子語(yǔ)義的曲解,在具體任務(wù)的表現(xiàn)上來(lái)看,都不能達(dá)到令人滿意的效果,例如對(duì)“我乘坐北京到上海的高鐵”和“我乘坐上海到北京的高鐵”兩句話容易造成誤判斷。

    基于神經(jīng)網(wǎng)絡(luò)模型的方法是利用word2vec[5]等詞向量方法將詞語(yǔ)轉(zhuǎn)換為詞向量,然后輸入神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型中,得出句子的語(yǔ)義特征表示,然后送入全連接層或使用距離公式進(jìn)行語(yǔ)義相似度計(jì)算。Hu 等人[6]首次使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型分別對(duì)兩個(gè)句子進(jìn)行建模,通過(guò)抽取出的語(yǔ)義向量計(jì)算相似度。Mueller 等人[7]也提出一種基于孿生長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)模型的網(wǎng)絡(luò)結(jié)構(gòu)并結(jié)合曼哈頓距離用于計(jì)算句子對(duì)之間的語(yǔ)義相似度,并取得了較好的效果。紀(jì)明宇等人[8]將門(mén)控循環(huán)網(wǎng)絡(luò)(GRU)應(yīng)用在智能客服數(shù)據(jù)的相似度計(jì)算上取得不錯(cuò)的效果。

    綜上所述,神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型在處理語(yǔ)義相似度問(wèn)題上是較好的解決思路,但是使用LSTM模型存在速度較慢的問(wèn)題,并且不能充分提取句子間的相似信息。CNN模型由于其池化機(jī)制會(huì)過(guò)濾掉大量和句子底層信息,不能充分地對(duì)語(yǔ)義進(jìn)行編碼。因此,針對(duì)以上問(wèn)題,本文在文獻(xiàn)[7]研究的基礎(chǔ)上,對(duì)模型進(jìn)行改進(jìn),首先使用Transformer-encoder 網(wǎng)絡(luò)取代原來(lái)的單向LSTM 網(wǎng)絡(luò),使模型能夠捕捉語(yǔ)義中的上下文信息,Transformer網(wǎng)絡(luò)的并行結(jié)構(gòu)可以加快模型計(jì)算速度,然后利用交互注意力機(jī)制[9],使得模型可以自動(dòng)地集中注意力在兩個(gè)句子中相似的語(yǔ)義信息,并且不需要任何額外的知識(shí),增強(qiáng)模型魯棒性,更好地計(jì)算語(yǔ)義相似度,實(shí)驗(yàn)表明該模型在語(yǔ)義相似度計(jì)算數(shù)據(jù)集上準(zhǔn)確率提升了5%。

    1 基于Transformer編碼器的語(yǔ)義相似度模型

    基于Transformer 編碼器的語(yǔ)義相似度模型TEAM主要包括以下五部分:詞向量嵌入表示,Transformer 編碼層,交互注意力層,特征融合層,輸出層。圖1是本文提出的TEAM 模型框架圖,輸入句子1 和輸入句子2 首先通過(guò)預(yù)處理層,進(jìn)行文本清洗、去除停用詞和數(shù)字化等操作,接著經(jīng)過(guò)詞嵌入層將句子中的詞映射為對(duì)應(yīng)的詞向量,轉(zhuǎn)化后分別得到S1=(a1,a2,…,al),S2=(b1,b2,…,bl),其中ai表示句子1 中第i個(gè)詞的詞向量,bi表示句子2 中第i個(gè)詞的詞向量,然后經(jīng)過(guò)Transformer編碼層得到句子的全局語(yǔ)義特征,同時(shí)將重新編碼的詞向量經(jīng)過(guò)交互注意力層,得到兩個(gè)句子的局部相似特征,最終將以上的特征通過(guò)拼接融合并輸入到全連接層進(jìn)行語(yǔ)義相似度計(jì)算。

    圖1 TEAM模型框架

    TEAM 模型充分利用Transformer 模型的上下文語(yǔ)義編碼能力提取句子內(nèi)的語(yǔ)義信息,對(duì)句子進(jìn)行深層語(yǔ)義編碼,并通過(guò)引入交互注意力機(jī)制,在編碼兩個(gè)句子時(shí)利用交互注意力機(jī)制提取兩個(gè)句子之間關(guān)聯(lián)的相似特征,使模型更擅長(zhǎng)捕捉句子內(nèi)部重要的語(yǔ)義信息,本章接下來(lái)將會(huì)對(duì)模型各個(gè)部分進(jìn)行詳細(xì)介紹。

    1.1 詞嵌入技術(shù)

    詞是構(gòu)成句子的最小單位,要使計(jì)算機(jī)能處理自然語(yǔ)言,將詞轉(zhuǎn)化為數(shù)字是必不可少的第一步。傳統(tǒng)的表示方法是采用One-hot表示法,這種表示方法存在“維度災(zāi)難”的問(wèn)題,也無(wú)法表示詞與詞之間的語(yǔ)義關(guān)系。Bengio等[10]最先提出神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型,使用這種模型可以實(shí)現(xiàn)詞的分布式表示,將單詞轉(zhuǎn)化為低維的稠密向量。

    Mikolov 等[5]提出了被廣泛使用的word2vec 模型,它包括CBOW(Continues Bag-of-Words)和Skip-gram兩種不同的結(jié)構(gòu),可以在大量的無(wú)監(jiān)督文本集上進(jìn)行訓(xùn)練,使用該模型訓(xùn)練出來(lái)的詞向量可以讓相似的詞語(yǔ)在向量空間內(nèi)具有相似的位置,斯坦福NLP團(tuán)隊(duì)在2014年提出了基于詞共現(xiàn)矩陣的Glove 模型[11],在一些任務(wù)上的表現(xiàn)超過(guò)word2vec 模型,可見(jiàn)詞向量的好壞對(duì)實(shí)驗(yàn)結(jié)果會(huì)產(chǎn)生直接的影響。根據(jù)Lai等[12]在詞向量訓(xùn)練實(shí)驗(yàn)結(jié)果可知,好的詞向量與訓(xùn)練語(yǔ)料的大小緊密相關(guān),因此本文采用由騰訊在海量數(shù)據(jù)上訓(xùn)練的800 萬(wàn)詞向量[13],該詞向量具有語(yǔ)料大、覆蓋范圍廣等特點(diǎn)。

    1.2 Transformer編碼器模型

    傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡(luò)如LSTM、GRU在編碼句子時(shí)無(wú)法進(jìn)行并行計(jì)算,尤其在層數(shù)深時(shí)模型計(jì)算速度嚴(yán)重下降。2017年Vaswani等[14]提出一種基于自注意力機(jī)制的序列編碼模型Transformer,該模型包括編碼器和解碼器兩個(gè)部分。本文使用的是其中的編碼器部分,編碼器包含6 層疊加的Transformer-block,每個(gè)Transformerblock 的結(jié)構(gòu)如圖2 所示,主要包含多頭注意力機(jī)制、殘差連接、層歸一化、全連接網(wǎng)絡(luò)四個(gè)部分,輸入為句子詞匯的詞向量編碼和位置編碼之和,位置編碼的目的是區(qū)分句子中詞的位置關(guān)系,計(jì)算公式如下:

    圖2 Transformerblock結(jié)構(gòu)圖

    其中,pos表示詞語(yǔ)在句子中的位置,i表示詞向量的位置,dmodel表示詞向量的維度。多頭注意力的計(jì)算公式如下:

    其中,xi表示輸入矩陣x的第i維,m和σ分別表示輸入x的均值和方差,α、β是引入的待學(xué)習(xí)的參數(shù),彌補(bǔ)歸一化的過(guò)程中損失掉的信息,? 是防止除數(shù)等于0設(shè)置的無(wú)窮小的數(shù)。層歸一化的作用在于加快模型的收斂速度,提高訓(xùn)練效率。全連接層計(jì)算公式如下:

    其中,W1、W2為全連接層的權(quán)重矩陣,b1,b2為全連接層的偏置。

    1.3 交互注意力機(jī)制

    注意力機(jī)制最近取得了廣泛的應(yīng)用在深度學(xué)習(xí)領(lǐng)域,例如常見(jiàn)的問(wèn)答系統(tǒng)、機(jī)器翻譯、語(yǔ)音識(shí)別和圖像識(shí)別等任務(wù)[15-16]。注意力機(jī)制最早出現(xiàn)在圖像領(lǐng)域,例如對(duì)于一張圖片,人們會(huì)選擇性地關(guān)注所有信息的一部分,同時(shí)忽略其他部分信息。在自然語(yǔ)言處理領(lǐng)域,例如機(jī)器翻譯中的Encoder-Decoder框架[17],注意力機(jī)制可以使模型翻譯當(dāng)前詞的時(shí)候重點(diǎn)關(guān)注與當(dāng)前詞語(yǔ)境相關(guān)的詞匯,顯著地提高了機(jī)器翻譯的性能。

    對(duì)于語(yǔ)義相似度計(jì)算問(wèn)題,兩個(gè)句子間的關(guān)聯(lián)相似特征是重要的判斷標(biāo)準(zhǔn)之一,而不是單純地將兩個(gè)句子表示為獨(dú)立的向量,然后計(jì)算匹配值。例如對(duì)于下面的句子對(duì):

    句子a:下周有哪些好產(chǎn)品?

    句子b:元月份有什么理財(cái)產(chǎn)品?

    從語(yǔ)義層面看這兩句話,可以看出兩句話的語(yǔ)義有明顯的差別,但是通過(guò)結(jié)構(gòu)對(duì)比發(fā)現(xiàn)在句子a 和句子b中有較多相似的成分,例如“下周”和“元月份”都表示時(shí)間狀語(yǔ),“有哪些”和“有什么”是相似的疑問(wèn)詞,“產(chǎn)品”和“理財(cái)產(chǎn)品”在語(yǔ)義中同屬于詢問(wèn)對(duì)象,這些語(yǔ)義相似的句子成分對(duì)于語(yǔ)義的相似程度具有重要影響,并且只有通過(guò)聯(lián)系另一句話的語(yǔ)義,才能提取出兩個(gè)句子中相似的語(yǔ)義單元。因此,本文提出使用交互注意力來(lái)提取句子間的相似特征。

    本文的交互注意力機(jī)制設(shè)計(jì)思路為,首先計(jì)算相似度矩陣得到兩個(gè)句子中詞匯之間的相似度,然后利用注意力機(jī)制分別對(duì)每個(gè)句子的詞匯進(jìn)行重新編碼,具體計(jì)算公式如下:

    其中,E為兩個(gè)句子的相似度矩陣,為句子1 經(jīng)過(guò)Transformer編碼后的全局語(yǔ)義特征的轉(zhuǎn)置,T2為句子2的語(yǔ)義特征,eij是矩陣E中第i行第j列的元素,表示句子1 中第i個(gè)詞和句子2 中第j個(gè)詞的相似度,s1是利用注意力機(jī)制提取句子2 中與句子1 的相似信息,s2是利用注意力機(jī)制提取句子1 中與句子2 的相似信息,s1和s2是模型用于預(yù)測(cè)的重要特征。

    1.4 特征融合及輸出

    Transformer 層編碼了輸入句子全局的語(yǔ)義特征t1、t2,其中t1表示句子1的語(yǔ)義特征,t2表示句子2的語(yǔ)義特征,交互注意力層提取了每個(gè)句子中的局部相似特征s1、s2,其中s1表示句子1 的相似特征,s2表示句子2 的相似特征,特征融合層根據(jù)公式(14)將兩部分特征進(jìn)行融合:

    其中,t1-t2、s1-s2是向量的相減操作,目的是為了獲取差異特征,最后通過(guò)向量拼接的方式,得到最終的特征融合向量m。輸出層采用全連接網(wǎng)絡(luò)對(duì)特征進(jìn)行權(quán)重調(diào)整及softmax 函數(shù)進(jìn)行預(yù)測(cè)分類結(jié)果y,輸入為融合的特征融合向量m,計(jì)算過(guò)程如公式(15)、(16)所示,經(jīng)過(guò)實(shí)驗(yàn)證明采用全連接層作為輸出效果好于使用歐式距離或余弦相似度作為輸出:

    模型的損失函數(shù)采用交叉熵?fù)p失函數(shù)如下:

    其中ri∈?m是以one-hot 編碼的標(biāo)簽真實(shí)值,yi∈?m是由softmax 函數(shù)預(yù)測(cè)的每個(gè)類別的概率,k是類別的個(gè)數(shù),λ是L2 正則的超參數(shù),本文同時(shí)使用L2 正則和dropout[18]來(lái)防止模型過(guò)擬合,模型的詳細(xì)參數(shù)將會(huì)在2.3節(jié)介紹。

    2 實(shí)驗(yàn)分析

    2.1 實(shí)驗(yàn)數(shù)據(jù)

    為了驗(yàn)證模型的有效性,本文采用兩個(gè)公開(kāi)數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),中文數(shù)據(jù)集采用智能客服數(shù)據(jù)(2018 全國(guó)知識(shí)圖譜與語(yǔ)義計(jì)算大會(huì)智能客服問(wèn)句匹配大賽),英文數(shù)據(jù)集采用SICK(Sentences Involving Compositional Knowledge)數(shù)據(jù)集[19],其中智能客服數(shù)據(jù)為分類任務(wù),判斷兩個(gè)句子語(yǔ)義相似或不相似,SICK 數(shù)據(jù)集的標(biāo)簽為兩個(gè)句子的相似度分?jǐn)?shù),分?jǐn)?shù)區(qū)間為1~5,5分表示完全相似,1 分表示完全不相似。表1 列出了兩個(gè)數(shù)據(jù)集的統(tǒng)計(jì)信息,表2列出了數(shù)據(jù)集樣例。

    表1 實(shí)驗(yàn)數(shù)據(jù)集統(tǒng)計(jì)信息

    表2 數(shù)據(jù)集樣例

    2.2 實(shí)驗(yàn)評(píng)價(jià)指標(biāo)

    對(duì)于智能客服數(shù)據(jù),本實(shí)驗(yàn)采用準(zhǔn)確率(accuracy)和F1 值(F1-score)指標(biāo)作為評(píng)價(jià)指標(biāo),對(duì)于SICK數(shù)據(jù)集,采用皮爾遜系數(shù)作為評(píng)價(jià)指標(biāo)。具體計(jì)算公式如下:

    其中,TP表示正例預(yù)測(cè)為正例的個(gè)數(shù),F(xiàn)P表示負(fù)例預(yù)測(cè)為正例的個(gè)數(shù),F(xiàn)N表示正例預(yù)測(cè)為負(fù)例的個(gè)數(shù),TN表示負(fù)例預(yù)測(cè)為負(fù)例的個(gè)數(shù),X為實(shí)際值,Y為預(yù)測(cè)值。

    2.3 實(shí)驗(yàn)設(shè)置

    本文實(shí)驗(yàn)基于Google 開(kāi)源的TensorFlow 1.14.0 深度學(xué)習(xí)框架實(shí)現(xiàn),中文的詞向量采用的是騰訊開(kāi)源的800 萬(wàn)詞向量[13],并且使用哈工大分詞工具包pyltp0.2.0進(jìn)行中文分詞,英文詞向量的采用的是由斯坦福大學(xué)預(yù)訓(xùn)練的glove[11]詞向量,未登陸詞通過(guò)高斯分布隨機(jī)初始化,所有的參數(shù)包括詞向量都隨訓(xùn)練過(guò)程更新,序列的最大長(zhǎng)度根據(jù)實(shí)驗(yàn)語(yǔ)料長(zhǎng)度覆蓋率95%以上進(jìn)行選取,為防止訓(xùn)練過(guò)程抖動(dòng),優(yōu)化方法采用Adam算法[20],實(shí)驗(yàn)采用earlystopping 防止過(guò)模型擬合,表3 列出了實(shí)驗(yàn)具體的超參數(shù)。

    表3 實(shí)驗(yàn)超參數(shù)設(shè)置

    2.4 實(shí)驗(yàn)結(jié)果及分析

    為了驗(yàn)證本文方法的有效性,同時(shí)為了比較不同的深度學(xué)習(xí)模型的效果,本文加入了Siamese-CNN、Siamese-LSTM 以及Siamese-LSTM-Att 模型進(jìn)行對(duì)比,另外也加入了傳統(tǒng)TF-IDF 方法進(jìn)行對(duì)比,本文提出的模型為T(mén)EAM,實(shí)驗(yàn)采用五折交叉驗(yàn)證的方式選取評(píng)價(jià)指標(biāo)的平均值作為結(jié)果。

    2.4.1 智能客服數(shù)據(jù)實(shí)驗(yàn)分析

    智能客服數(shù)據(jù)上的實(shí)驗(yàn)結(jié)果如表4所示。

    通過(guò)實(shí)驗(yàn)結(jié)果可以看出傳統(tǒng)的TF-IDF方法通過(guò)淺層詞匯匹配只能達(dá)到70.2%的準(zhǔn)確率,本文提出的TEAM 模型比傳統(tǒng)模型在準(zhǔn)確率上提升了24.5 個(gè)百分點(diǎn),比其他深度學(xué)習(xí)模型平均提升了15 個(gè)百分點(diǎn)。通過(guò)表4 可以看出深度學(xué)習(xí)模型較傳統(tǒng)模型性能提升很多。基于卷積神經(jīng)網(wǎng)絡(luò)編碼的Siamese-CNN 只能達(dá)到74.4%的準(zhǔn)確率,這是由于卷積神經(jīng)網(wǎng)絡(luò)只能提取每個(gè)句子的局部特征,不能獲得全局的語(yǔ)義編碼。Siamese-LSTM 模型的準(zhǔn)確率比Siamese-CNN 提升了15 個(gè)百分點(diǎn),證明循環(huán)神經(jīng)網(wǎng)絡(luò)對(duì)語(yǔ)義的編碼能力比卷積神經(jīng)網(wǎng)絡(luò)表現(xiàn)得更好,加入了注意力機(jī)制的Siamese-LSTM-Att模型相比Siamese-LSTM 模型準(zhǔn)確率只提升了0.9 個(gè)百分點(diǎn),F(xiàn)1 值提升了0.5個(gè)百分點(diǎn),可以看出局部注意力并沒(méi)有對(duì)模型表現(xiàn)帶來(lái)很大的提升。此外,TEAM模型相比Siamese-LSTM模型提升了5.1個(gè)百分點(diǎn),較Siamese-CNN 模型提升了20.3 個(gè)百分點(diǎn),可以看出基于Transformer 的模型比傳統(tǒng)的CNN,LSTM 模型性能提升很多,證明Transformer網(wǎng)絡(luò)的語(yǔ)義編碼能力更強(qiáng)。

    表4 智能客服測(cè)試數(shù)據(jù)集結(jié)果 %

    實(shí)驗(yàn)過(guò)程對(duì)比曲線如圖3所示。

    圖3 智能客服數(shù)據(jù)準(zhǔn)確率變化曲線

    由圖3 可知,TEAM 模型只用了2 個(gè)epoch 達(dá)到了90%的準(zhǔn)確率,并在第8個(gè)epoch開(kāi)始提升緩慢,模型接近收斂點(diǎn),證明TEAM 模型的收斂速度明顯快于其他模型。

    2.4.2 SICK數(shù)據(jù)實(shí)驗(yàn)分析

    不同模型在SICK 數(shù)據(jù)集上的表現(xiàn)如表5 所示,由實(shí)驗(yàn)結(jié)果可以看出,TEAM 模型的表現(xiàn)好于其他模型,比其他模型皮爾遜相關(guān)系數(shù)平均提升了0.3,證明TEAM模型在英文數(shù)據(jù)集上的有效性,但相比Siamese-LSTMAtt模型皮爾遜相關(guān)系數(shù)僅提升了0.052,效果提升不明顯。由圖4可知,由于SICK數(shù)據(jù)集數(shù)據(jù)較小,TEAM模型在訓(xùn)練過(guò)程中出現(xiàn)了過(guò)擬合的現(xiàn)象,證明基于Transformer的模型在數(shù)據(jù)集較小的數(shù)據(jù)上性能還有待提升。

    表5 SICK測(cè)試數(shù)據(jù)集結(jié)果

    圖4 SICK數(shù)據(jù)皮爾遜系數(shù)變化曲線

    2.4.3 交互注意力機(jī)制的有效性分析

    為了進(jìn)步一驗(yàn)證模型有效性,引入將TEAM模型去除交互注意力機(jī)制的模型TEM,分別在兩個(gè)數(shù)據(jù)集上進(jìn)行對(duì)比實(shí)驗(yàn),驗(yàn)證加入句子間交互注意力對(duì)模型的影響。表6 為實(shí)驗(yàn)的結(jié)果,圖5 是模型在兩個(gè)實(shí)驗(yàn)數(shù)據(jù)上的訓(xùn)練過(guò)程,由表6 實(shí)驗(yàn)結(jié)果可知,交互注意力對(duì)模型提升效果明顯,在智能客服數(shù)據(jù)上TEAM 比TEM 準(zhǔn)確率提升2.7個(gè)百分點(diǎn),在SICK數(shù)據(jù)上皮爾遜相關(guān)系數(shù)提升0.05,證明交互注意力使模型充分學(xué)習(xí)到句子間的相似特征,進(jìn)而對(duì)相似度進(jìn)行更準(zhǔn)確的預(yù)測(cè)。其次,實(shí)驗(yàn)結(jié)果同時(shí)證明句子間的交互信息對(duì)于相似度計(jì)算問(wèn)題具有重要作用。由訓(xùn)練對(duì)比曲線可知,TEAM模型由于可以捕捉到句子的交互特征,使得模型的收斂更快。

    表6 TEAM和TEM結(jié)果對(duì)比

    圖5 TEAM和TEM訓(xùn)練曲線

    3 結(jié)束語(yǔ)

    本文提出了一種基于Transformer 編碼器的語(yǔ)義相似度計(jì)算模型,并引入了交互注意力機(jī)制提取句子間的相似特征,綜合考慮了相似度計(jì)算問(wèn)題中的全局語(yǔ)義編碼和局部相似特征編碼,在不同數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果證明本文模型在中文英文數(shù)據(jù)上比基準(zhǔn)模型有顯著的改善,并且證明了交互注意力機(jī)制的有效性。目前的實(shí)驗(yàn)數(shù)據(jù)及模型對(duì)象都是針對(duì)短文本語(yǔ)料,且數(shù)據(jù)分布均衡,長(zhǎng)文本面臨著計(jì)算時(shí)間長(zhǎng)以及注意力分散的問(wèn)題,在后序的工作中,將開(kāi)展長(zhǎng)文本相似度計(jì)算方法的研究和優(yōu)化,增強(qiáng)模型的泛化能力。

    猜你喜歡
    注意力語(yǔ)義編碼
    讓注意力“飛”回來(lái)
    基于SAR-SIFT和快速稀疏編碼的合成孔徑雷達(dá)圖像配準(zhǔn)
    《全元詩(shī)》未編碼疑難字考辨十五則
    語(yǔ)言與語(yǔ)義
    子帶編碼在圖像壓縮編碼中的應(yīng)用
    電子制作(2019年22期)2020-01-14 03:16:24
    Genome and healthcare
    “揚(yáng)眼”APP:讓注意力“變現(xiàn)”
    A Beautiful Way Of Looking At Things
    “上”與“下”語(yǔ)義的不對(duì)稱性及其認(rèn)知闡釋
    認(rèn)知范疇模糊與語(yǔ)義模糊
    久久99热6这里只有精品| 一级毛片我不卡| 国产一区二区在线av高清观看| 国产一区二区在线观看日韩| 黄片wwwwww| 久久久久久久久大av| 久久中文看片网| 少妇的逼好多水| 国产不卡一卡二| 日韩欧美 国产精品| 欧美日本视频| 十八禁国产超污无遮挡网站| 男女那种视频在线观看| 99热这里只有精品一区| 乱系列少妇在线播放| 一个人观看的视频www高清免费观看| 毛片一级片免费看久久久久| 俺也久久电影网| 中国美女看黄片| 久久久精品欧美日韩精品| 91午夜精品亚洲一区二区三区| 欧美不卡视频在线免费观看| 日韩国内少妇激情av| 免费av不卡在线播放| av.在线天堂| 亚洲第一区二区三区不卡| 看十八女毛片水多多多| 欧美日韩一区二区视频在线观看视频在线 | 亚洲欧美日韩卡通动漫| 国内揄拍国产精品人妻在线| 久久精品久久久久久噜噜老黄 | 亚洲五月天丁香| videossex国产| 在线免费十八禁| 国产单亲对白刺激| 亚洲av不卡在线观看| 日本在线视频免费播放| 男人狂女人下面高潮的视频| av卡一久久| 97在线视频观看| 深夜精品福利| 99久久中文字幕三级久久日本| 日韩欧美一区二区三区在线观看| 美女黄网站色视频| 亚洲av免费在线观看| 91久久精品国产一区二区三区| or卡值多少钱| 男女视频在线观看网站免费| 91久久精品国产一区二区成人| 久久国产乱子免费精品| 日韩欧美 国产精品| 国产老妇女一区| 大香蕉久久网| 成人高潮视频无遮挡免费网站| 成人欧美大片| 少妇熟女aⅴ在线视频| 99视频精品全部免费 在线| 波多野结衣高清无吗| 99久久精品热视频| 日韩欧美三级三区| 99热网站在线观看| 在线观看av片永久免费下载| 国产精品久久久久久久电影| 日韩,欧美,国产一区二区三区 | 欧美精品国产亚洲| 免费大片18禁| 欧美性感艳星| 久久精品影院6| 久久久成人免费电影| 国产精品无大码| 五月伊人婷婷丁香| 热99在线观看视频| 久久精品国产自在天天线| 一级毛片久久久久久久久女| 亚洲精品乱码久久久v下载方式| 亚洲色图av天堂| eeuss影院久久| 男女边吃奶边做爰视频| 亚洲av第一区精品v没综合| 校园人妻丝袜中文字幕| 深夜精品福利| 午夜福利18| 欧美又色又爽又黄视频| 人人妻人人澡欧美一区二区| 国产精品一及| 久久九九热精品免费| 精品久久久久久久久久久久久| 国产成人一区二区在线| 亚洲专区国产一区二区| 国产国拍精品亚洲av在线观看| 亚洲激情五月婷婷啪啪| 悠悠久久av| 国产精品1区2区在线观看.| 99视频精品全部免费 在线| 日韩欧美 国产精品| 蜜臀久久99精品久久宅男| 最近视频中文字幕2019在线8| 欧美成人一区二区免费高清观看| 热99re8久久精品国产| 男人和女人高潮做爰伦理| 夜夜爽天天搞| 欧美日韩乱码在线| 欧美一区二区亚洲| 亚洲av第一区精品v没综合| 一本久久中文字幕| 欧美成人免费av一区二区三区| 国产精品野战在线观看| 欧美人与善性xxx| 日韩欧美在线乱码| 亚洲三级黄色毛片| 观看免费一级毛片| 乱码一卡2卡4卡精品| 国产在视频线在精品| 在线观看免费视频日本深夜| 亚洲精品成人久久久久久| АⅤ资源中文在线天堂| 国产精品国产三级国产av玫瑰| 国产精品福利在线免费观看| 国产成人精品久久久久久| 麻豆久久精品国产亚洲av| 色在线成人网| 亚洲精品色激情综合| 草草在线视频免费看| 搡女人真爽免费视频火全软件 | 18禁在线播放成人免费| 噜噜噜噜噜久久久久久91| 日本精品一区二区三区蜜桃| 免费高清视频大片| 色哟哟·www| 俄罗斯特黄特色一大片| 精品免费久久久久久久清纯| 狂野欧美白嫩少妇大欣赏| 在线播放国产精品三级| 真人做人爱边吃奶动态| 国产精品电影一区二区三区| 日日摸夜夜添夜夜添小说| 色尼玛亚洲综合影院| 国产高清三级在线| 亚洲人成网站在线观看播放| 精品不卡国产一区二区三区| 亚洲自拍偷在线| 国产成人福利小说| 精品免费久久久久久久清纯| 99在线人妻在线中文字幕| avwww免费| 国产一区二区在线观看日韩| 黑人高潮一二区| 男女之事视频高清在线观看| 亚洲成a人片在线一区二区| 亚洲丝袜综合中文字幕| 内射极品少妇av片p| 日日摸夜夜添夜夜添av毛片| 国产伦在线观看视频一区| 亚洲中文日韩欧美视频| 久久久久久久久久成人| 女同久久另类99精品国产91| 国产 一区精品| 我要搜黄色片| 中文字幕精品亚洲无线码一区| 国产精品一区二区免费欧美| 91在线观看av| 国产精品乱码一区二三区的特点| 欧美三级亚洲精品| 国产成人精品久久久久久| 久99久视频精品免费| 亚洲欧美中文字幕日韩二区| 欧美日本视频| 亚洲一级一片aⅴ在线观看| 在现免费观看毛片| 免费观看精品视频网站| 黄色日韩在线| 自拍偷自拍亚洲精品老妇| 国产 一区精品| 久久精品夜夜夜夜夜久久蜜豆| 人人妻,人人澡人人爽秒播| avwww免费| 日韩强制内射视频| 成人午夜高清在线视频| 欧美色欧美亚洲另类二区| 精品少妇黑人巨大在线播放 | 国产一级毛片七仙女欲春2| 中国国产av一级| 蜜桃亚洲精品一区二区三区| 91在线观看av| 99久久久亚洲精品蜜臀av| 搡老岳熟女国产| 少妇被粗大猛烈的视频| 日本精品一区二区三区蜜桃| 变态另类丝袜制服| av视频在线观看入口| 一进一出抽搐动态| 观看免费一级毛片| 欧美又色又爽又黄视频| 激情 狠狠 欧美| 能在线免费观看的黄片| 在线看三级毛片| 偷拍熟女少妇极品色| 久久国内精品自在自线图片| 国产人妻一区二区三区在| 亚洲国产精品成人久久小说 | 91在线精品国自产拍蜜月| 国产精品嫩草影院av在线观看| 国产成人a区在线观看| 悠悠久久av| 欧美一区二区国产精品久久精品| 成人性生交大片免费视频hd| 在线播放国产精品三级| 国产在线男女| 伦精品一区二区三区| 特级一级黄色大片| 国产精品一区二区性色av| 国产蜜桃级精品一区二区三区| 乱人视频在线观看| 日本欧美国产在线视频| 精品国内亚洲2022精品成人| 最新中文字幕久久久久| 99热全是精品| 成年女人看的毛片在线观看| 男女之事视频高清在线观看| 欧美另类亚洲清纯唯美| 一个人看的www免费观看视频| 国产一区二区在线观看日韩| 国产精品免费一区二区三区在线| 国产男人的电影天堂91| 精品乱码久久久久久99久播| 国产欧美日韩精品亚洲av| 嫩草影院入口| 在线免费观看不下载黄p国产| 丝袜喷水一区| 在线观看66精品国产| 热99在线观看视频| 少妇猛男粗大的猛烈进出视频 | 日日撸夜夜添| 噜噜噜噜噜久久久久久91| 少妇猛男粗大的猛烈进出视频 | 国产极品精品免费视频能看的| 2021天堂中文幕一二区在线观| 成人特级av手机在线观看| 国产69精品久久久久777片| 天天一区二区日本电影三级| 精品久久久久久久久亚洲| 精品乱码久久久久久99久播| 在线免费观看的www视频| 露出奶头的视频| 卡戴珊不雅视频在线播放| 精品一区二区三区视频在线| 日韩欧美国产在线观看| 日韩成人伦理影院| 亚洲自拍偷在线| 最近手机中文字幕大全| 亚洲色图av天堂| 九九热线精品视视频播放| 欧美极品一区二区三区四区| 黄色配什么色好看| 日本与韩国留学比较| 国产伦精品一区二区三区视频9| 国内少妇人妻偷人精品xxx网站| 亚洲电影在线观看av| 精华霜和精华液先用哪个| 99热只有精品国产| 美女cb高潮喷水在线观看| 又爽又黄a免费视频| 人人妻,人人澡人人爽秒播| 亚洲四区av| 国产成人freesex在线 | 亚洲欧美精品综合久久99| 少妇高潮的动态图| 少妇被粗大猛烈的视频| 嫩草影院精品99| 91久久精品国产一区二区成人| 91精品国产九色| 观看免费一级毛片| 欧美日韩国产亚洲二区| ponron亚洲| 一区福利在线观看| 六月丁香七月| 色5月婷婷丁香| 国产精品一区二区三区四区久久| 精品久久久久久成人av| av天堂在线播放| 免费看美女性在线毛片视频| 欧美色欧美亚洲另类二区| 亚洲三级黄色毛片| 国产亚洲精品av在线| 三级男女做爰猛烈吃奶摸视频| 免费在线观看影片大全网站| 久久久久久伊人网av| 午夜亚洲福利在线播放| 久99久视频精品免费| h日本视频在线播放| 99在线人妻在线中文字幕| 国产亚洲欧美98| 日韩精品中文字幕看吧| 亚洲乱码一区二区免费版| 欧美bdsm另类| 国产一区二区激情短视频| 69人妻影院| 男人狂女人下面高潮的视频| 中文字幕av在线有码专区| 精品一区二区三区视频在线观看免费| 夜夜爽天天搞| 亚洲性久久影院| 久久人人爽人人爽人人片va| 97超级碰碰碰精品色视频在线观看| 国产亚洲精品av在线| 美女免费视频网站| 日韩欧美三级三区| 日韩av在线大香蕉| 色视频www国产| 大又大粗又爽又黄少妇毛片口| 一个人看的www免费观看视频| 日本 av在线| 亚洲av免费高清在线观看| 久久久久久久久久成人| 亚州av有码| 精品人妻视频免费看| 成人漫画全彩无遮挡| 国产黄色视频一区二区在线观看 | 亚洲欧美精品自产自拍| 色综合亚洲欧美另类图片| 97热精品久久久久久| 午夜精品国产一区二区电影 | 十八禁国产超污无遮挡网站| 国产午夜福利久久久久久| 丰满人妻一区二区三区视频av| 久久综合国产亚洲精品| 日韩高清综合在线| 99久国产av精品| 中文资源天堂在线| 村上凉子中文字幕在线| 免费观看人在逋| 特大巨黑吊av在线直播| 国产视频一区二区在线看| 狂野欧美激情性xxxx在线观看| 国产色婷婷99| 精品久久久久久久久av| 99热精品在线国产| 色哟哟·www| 免费观看精品视频网站| 久久久久久久久大av| 久久久久性生活片| 白带黄色成豆腐渣| 哪里可以看免费的av片| 1024手机看黄色片| 国产v大片淫在线免费观看| 国产精品人妻久久久久久| 亚洲精品亚洲一区二区| 欧美一区二区亚洲| 在线看三级毛片| 亚洲最大成人中文| 99久久精品热视频| 国产美女午夜福利| 看十八女毛片水多多多| 国产一区二区在线观看日韩| 日本一二三区视频观看| av专区在线播放| 国产真实伦视频高清在线观看| 欧美性猛交黑人性爽| 人妻少妇偷人精品九色| 老师上课跳d突然被开到最大视频| 全区人妻精品视频| 长腿黑丝高跟| 久久久国产成人免费| 真人做人爱边吃奶动态| 我的女老师完整版在线观看| 尤物成人国产欧美一区二区三区| 婷婷精品国产亚洲av在线| 国产精品久久视频播放| 精品国内亚洲2022精品成人| 亚洲欧美精品自产自拍| 久久婷婷人人爽人人干人人爱| 丰满乱子伦码专区| 亚洲四区av| 十八禁国产超污无遮挡网站| 亚洲国产高清在线一区二区三| 99热只有精品国产| 女人被狂操c到高潮| 亚洲精品日韩在线中文字幕 | 狂野欧美激情性xxxx在线观看| 欧美xxxx性猛交bbbb| 小蜜桃在线观看免费完整版高清| 此物有八面人人有两片| 岛国在线免费视频观看| 成人性生交大片免费视频hd| 人人妻人人看人人澡| 亚洲激情五月婷婷啪啪| 91在线精品国自产拍蜜月| 国产色婷婷99| 18禁黄网站禁片免费观看直播| 国产高清有码在线观看视频| 国产久久久一区二区三区| 成人特级黄色片久久久久久久| 久久精品国产清高在天天线| 女人十人毛片免费观看3o分钟| 亚洲国产精品国产精品| 在线a可以看的网站| 久久精品影院6| 成年女人毛片免费观看观看9| 99久久久亚洲精品蜜臀av| 69人妻影院| 成人美女网站在线观看视频| 变态另类成人亚洲欧美熟女| 免费av毛片视频| 国产人妻一区二区三区在| 亚洲人成网站高清观看| 日韩人妻高清精品专区| 日韩av在线大香蕉| 男女那种视频在线观看| 亚洲成人精品中文字幕电影| 麻豆成人午夜福利视频| 国产精品乱码一区二三区的特点| 国产精品一区二区三区四区久久| 欧美xxxx性猛交bbbb| 成人永久免费在线观看视频| 男人舔女人下体高潮全视频| 日本精品一区二区三区蜜桃| 最近在线观看免费完整版| 波多野结衣巨乳人妻| 日韩制服骚丝袜av| aaaaa片日本免费| 成年女人看的毛片在线观看| 欧美在线一区亚洲| 亚洲人成网站高清观看| 2021天堂中文幕一二区在线观| 六月丁香七月| 欧美高清成人免费视频www| 久久这里只有精品中国| 能在线免费观看的黄片| 两性午夜刺激爽爽歪歪视频在线观看| 日本 av在线| 亚洲人与动物交配视频| 亚洲性久久影院| 97超视频在线观看视频| 免费看av在线观看网站| 久久精品国产自在天天线| 欧美国产日韩亚洲一区| 99热只有精品国产| 波多野结衣巨乳人妻| 久久久精品欧美日韩精品| 国产探花极品一区二区| 久久6这里有精品| 一级黄色大片毛片| 亚洲国产色片| 99国产极品粉嫩在线观看| 国产v大片淫在线免费观看| 日韩制服骚丝袜av| 亚洲在线观看片| 久久久久久大精品| 欧美绝顶高潮抽搐喷水| 18禁在线无遮挡免费观看视频 | 成人无遮挡网站| 精品一区二区三区视频在线观看免费| 最近的中文字幕免费完整| 精品人妻视频免费看| 欧洲精品卡2卡3卡4卡5卡区| 长腿黑丝高跟| 特级一级黄色大片| 日韩高清综合在线| 男女啪啪激烈高潮av片| 特大巨黑吊av在线直播| 国产精品一及| 青春草视频在线免费观看| 日韩强制内射视频| 黄色一级大片看看| 晚上一个人看的免费电影| 在线天堂最新版资源| 亚洲欧美清纯卡通| 99国产极品粉嫩在线观看| 色av中文字幕| 亚洲自偷自拍三级| 国产午夜精品论理片| 免费人成视频x8x8入口观看| 免费观看在线日韩| 国产精品一二三区在线看| 少妇人妻一区二区三区视频| 老师上课跳d突然被开到最大视频| 国产一区二区激情短视频| 熟妇人妻久久中文字幕3abv| 高清毛片免费观看视频网站| 日韩一本色道免费dvd| 欧美成人精品欧美一级黄| 我的女老师完整版在线观看| 在线国产一区二区在线| av卡一久久| 12—13女人毛片做爰片一| 免费看av在线观看网站| 丰满人妻一区二区三区视频av| 赤兔流量卡办理| 日本爱情动作片www.在线观看 | 热99re8久久精品国产| 精品久久久久久久久亚洲| 男女那种视频在线观看| 欧美一区二区亚洲| 高清午夜精品一区二区三区 | 亚洲成av人片在线播放无| 91久久精品国产一区二区成人| 国产成人精品久久久久久| 日本黄色片子视频| 我的女老师完整版在线观看| 欧美日本视频| 99riav亚洲国产免费| 国产三级中文精品| 日本三级黄在线观看| 国产一区二区在线av高清观看| 不卡视频在线观看欧美| 99久国产av精品国产电影| 国产三级在线视频| 国产aⅴ精品一区二区三区波| 久久精品综合一区二区三区| 看十八女毛片水多多多| 一进一出抽搐动态| 国产精品av视频在线免费观看| 可以在线观看毛片的网站| 一区二区三区四区激情视频 | 日韩三级伦理在线观看| 十八禁国产超污无遮挡网站| 黑人高潮一二区| 亚洲在线观看片| 亚洲熟妇熟女久久| av在线老鸭窝| 美女黄网站色视频| 天堂影院成人在线观看| 噜噜噜噜噜久久久久久91| 欧美最新免费一区二区三区| 非洲黑人性xxxx精品又粗又长| 欧美bdsm另类| 国产伦精品一区二区三区四那| 美女xxoo啪啪120秒动态图| 成人高潮视频无遮挡免费网站| 少妇猛男粗大的猛烈进出视频 | 国产淫片久久久久久久久| 中文亚洲av片在线观看爽| 99久久无色码亚洲精品果冻| 久久久久国产精品人妻aⅴ院| 免费观看人在逋| 久久鲁丝午夜福利片| 嫩草影院新地址| 欧美激情久久久久久爽电影| 91在线精品国自产拍蜜月| 成人永久免费在线观看视频| 校园人妻丝袜中文字幕| 国产精品一区二区三区四区免费观看 | 1024手机看黄色片| 九九在线视频观看精品| 亚洲高清免费不卡视频| 亚洲最大成人中文| 欧美性感艳星| 国产亚洲精品综合一区在线观看| 精品久久国产蜜桃| av专区在线播放| 久久久精品94久久精品| 欧美最黄视频在线播放免费| 少妇的逼好多水| 成人欧美大片| 免费大片18禁| 国内精品美女久久久久久| 女的被弄到高潮叫床怎么办| 成年女人永久免费观看视频| 一个人看视频在线观看www免费| 欧美激情在线99| 成人亚洲欧美一区二区av| 亚洲精品影视一区二区三区av| 国产探花极品一区二区| 久久6这里有精品| 少妇熟女aⅴ在线视频| 少妇裸体淫交视频免费看高清| 尾随美女入室| 美女xxoo啪啪120秒动态图| 日韩成人伦理影院| 少妇裸体淫交视频免费看高清| 久久久久久久久久成人| 一夜夜www| 久久久久国产精品人妻aⅴ院| 亚洲五月天丁香| 男人舔奶头视频| 极品教师在线视频| 国产精品久久久久久精品电影| 亚洲欧美日韩高清在线视频| 国产一区二区在线av高清观看| 亚洲丝袜综合中文字幕| 久久久久久大精品| 91在线观看av| 99九九线精品视频在线观看视频| 搡老熟女国产l中国老女人| 日韩成人av中文字幕在线观看 | 免费高清视频大片| a级一级毛片免费在线观看| 狂野欧美激情性xxxx在线观看| 久久久久久久久久成人| 色播亚洲综合网| 女同久久另类99精品国产91| 能在线免费观看的黄片| 亚洲精品一区av在线观看| 亚洲人成网站在线播| 草草在线视频免费看| 日本一本二区三区精品| 亚洲熟妇中文字幕五十中出| 精品国内亚洲2022精品成人| 久久久精品94久久精品| 日日摸夜夜添夜夜添av毛片| 日本免费a在线| 国产白丝娇喘喷水9色精品| 18禁裸乳无遮挡免费网站照片| 欧美三级亚洲精品| 国产美女午夜福利| 美女免费视频网站| 最近最新中文字幕大全电影3| 成年女人永久免费观看视频| 欧美激情国产日韩精品一区| 99国产精品一区二区蜜桃av| 99久久九九国产精品国产免费| 插阴视频在线观看视频| 国产高清视频在线播放一区| 欧美xxxx性猛交bbbb| av在线观看视频网站免费|