• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于神經(jīng)網(wǎng)絡(luò)的文本標(biāo)題生成原型系統(tǒng)設(shè)計(jì)

    2021-05-12 13:47:24張仕森孫憲坤李世璽
    電子科技 2021年5期
    關(guān)鍵詞:解碼器原型語(yǔ)義

    張仕森,孫憲坤,尹 玲,李世璽

    (上海工程技術(shù)大學(xué) 電子電氣工程學(xué)院,上海 201620)

    隨著近幾年互聯(lián)網(wǎng)的發(fā)展,網(wǎng)絡(luò)中的文本信息資源的數(shù)量呈現(xiàn)指數(shù)級(jí)增長(zhǎng)。根據(jù)中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)發(fā)布的《中國(guó)互聯(lián)網(wǎng)發(fā)展報(bào)告2019》,截至2018年底,我國(guó)網(wǎng)頁(yè)總數(shù)量已達(dá)到2 816億,這些網(wǎng)頁(yè)中所包含的信息覆蓋了社會(huì)生活的各個(gè)領(lǐng)域。然而這其中也包含了海量不規(guī)范的文本信息,例如市場(chǎng)上眾多移動(dòng)客戶端中自媒體文章的“標(biāo)題黨”,以及互聯(lián)網(wǎng)中大量無(wú)標(biāo)題的評(píng)論、微博等,這些不規(guī)范的文本信息給人們帶來(lái)了巨大的信息過(guò)載壓力。為這些不規(guī)范的文本信息生成一條簡(jiǎn)潔、切合原文表達(dá)的標(biāo)題可以緩解信息過(guò)載壓力,提高工作效率并為相關(guān)部門監(jiān)察社會(huì)輿論提供幫助。

    實(shí)際工作中采用傳統(tǒng)的人工總結(jié)編寫標(biāo)題的方式在耗費(fèi)大量時(shí)間、人力成本的同時(shí)難以應(yīng)對(duì)每天產(chǎn)生的海量不規(guī)范文本。標(biāo)題生成是以文本內(nèi)容作為輸入,以標(biāo)題作為輸出的一種文本摘要任務(wù)的變體,因此通過(guò)標(biāo)題生成技術(shù)可以高效、經(jīng)濟(jì)地解決這一問(wèn)題。

    文獻(xiàn)[1]通過(guò)詞頻、逆序文本頻率等文本特征來(lái)計(jì)算文章中每一個(gè)句子作為摘要的概率,研發(fā)出一種基于貝葉斯分類模型的自動(dòng)文本摘要系統(tǒng)DimSim。但在自然語(yǔ)言中,特征與特征之間并不是相互獨(dú)立的,而是存在某些內(nèi)部聯(lián)系,因此文獻(xiàn)[2]使用決策樹(shù)替換樸素貝葉斯分類器來(lái)構(gòu)造新的摘要系統(tǒng)。文獻(xiàn)[3]在谷歌公司提出PageRank[4]算法的基礎(chǔ)上提出了TextRank算法來(lái)實(shí)現(xiàn)文本摘要的生成。這些方法都是通過(guò)判斷原始文本中各個(gè)單詞或句子的重要程度,對(duì)原文中語(yǔ)句進(jìn)行重新排序,按照重要性的大小抽取原文中的語(yǔ)句來(lái)構(gòu)成摘要的抽取式技術(shù)。抽取式技術(shù)實(shí)現(xiàn)簡(jiǎn)單、快速,但是無(wú)法滿足人們對(duì)于生成摘要準(zhǔn)確性和流暢性的要求。

    隨著近年來(lái)深度學(xué)習(xí)技術(shù)的發(fā)展,對(duì)文本內(nèi)容進(jìn)行整體的全面總結(jié)凝練,然后生成摘要的生成式技術(shù)逐漸成為文本摘要任務(wù)的主流方法。抽取式技術(shù)僅僅是抽取原文中的語(yǔ)句來(lái)構(gòu)成摘要,而生成式技術(shù)則更加符合人類的閱讀和思考習(xí)慣,生成出來(lái)的摘要也更符合人工撰寫摘要的規(guī)律。

    文獻(xiàn)[5]在新聞標(biāo)題生成任務(wù)中應(yīng)用Seq2Seq(Sequence to Sequence)模型取得了良好的效果。文獻(xiàn)[6]在Seq2Seq模型的基礎(chǔ)上引入了注意力機(jī)制,完成了生成式的中文文本摘要生成。本文基于神經(jīng)網(wǎng)絡(luò)和生成式技術(shù)對(duì)中文文本標(biāo)題生成原型系統(tǒng)進(jìn)行了設(shè)計(jì)與實(shí)現(xiàn)。

    1 自然語(yǔ)言的文本表示

    自然語(yǔ)言的文本表示是指由于計(jì)算機(jī)無(wú)法直接識(shí)別語(yǔ)言的符號(hào)文字[7],因此需要將這些符號(hào)文字轉(zhuǎn)換為文本向量這種計(jì)算機(jī)可以進(jìn)行運(yùn)算的數(shù)學(xué)表達(dá)形式。轉(zhuǎn)換之后得到的文本向量一般包含語(yǔ)言的語(yǔ)法、語(yǔ)義等重要特征[8]。自然語(yǔ)言處理技術(shù)經(jīng)過(guò)長(zhǎng)久的發(fā)展,形成了兩種最主要的文本表示方法:離散表示與分布式表示。

    1.1 離散表示

    在離散表示方法中,對(duì)于詞典中的每一個(gè)詞一般使用一個(gè)長(zhǎng)度和詞典總詞數(shù)大小相同的離散高維向量來(lái)表示詞語(yǔ)。這個(gè)離散的高維向量中每一個(gè)元素都對(duì)應(yīng)詞典中的某一個(gè)詞,其中只有一個(gè)元素的數(shù)值為1,其余均是0,元素為1的位置代表其對(duì)應(yīng)詞在詞典中的位置。

    利用離散向量的方式對(duì)文本進(jìn)行表示的方法有兩個(gè)弊端[9]:(1)離散表示方法向量的維度隨著詞的數(shù)量增大而増大,具有超高的維度和極大的稀疏性,高維度和稀疏性會(huì)產(chǎn)生自然語(yǔ)言處理中的“維數(shù)災(zāi)難”問(wèn)題,占用較大的運(yùn)算空間,增加了神經(jīng)網(wǎng)絡(luò)的計(jì)算代價(jià);(2)離散表示方法會(huì)導(dǎo)致任意兩個(gè)詞之間是相對(duì)獨(dú)立的,相當(dāng)于給每個(gè)詞分配一個(gè)id,導(dǎo)致離散表示方式不能有效地表達(dá)詞與詞之間的語(yǔ)義關(guān)系,無(wú)法表示語(yǔ)言復(fù)雜的語(yǔ)義信息[10]。在一定程度上離散表示是假設(shè)了語(yǔ)義的單一性,即認(rèn)為語(yǔ)義僅僅是一維的,然而實(shí)際上語(yǔ)義應(yīng)該是多維的。例如對(duì)于詞語(yǔ)“家園”,有的人會(huì)聯(lián)想到“安全”、“溫馨”,有的人則會(huì)聯(lián)想到“地球”、“環(huán)境”。由于不同人對(duì)同一個(gè)詞的理解存在著較大的差異,因此僅通過(guò)給每個(gè)詞分配一個(gè)id很難將詞語(yǔ)放在合適的位置。此外,離散也無(wú)法衡量詞語(yǔ)的相似性,即使是同義詞在離散表示上也會(huì)被表示為完全不同的向量。

    1.2 分布式表示

    自然語(yǔ)言中的詞語(yǔ)并非是全部獨(dú)立的,例如“賓館”和“旅館”,“母?!焙汀按髮W(xué)”,它們具有一定的關(guān)聯(lián)性和相似性。離散表示將每一個(gè)詞看作一個(gè)完整獨(dú)立的個(gè)體,假設(shè)了語(yǔ)義的單一性,無(wú)法衡量詞語(yǔ)之間的相似性。為了解決傳統(tǒng)離散表示方法的這一缺點(diǎn),文獻(xiàn)[11]提出了詞向量(Word Vector)的概念。詞向量又稱為詞嵌入(Word Embedding),是指用一種低維的、連續(xù)實(shí)值向量的形式來(lái)表示詞語(yǔ)[12]。通過(guò)用詞向量對(duì)詞語(yǔ)進(jìn)行表示,可使每個(gè)詞語(yǔ)都變?yōu)樵~典的N維向量空間中的一個(gè)點(diǎn)。詞向量可以有效解決傳統(tǒng)離散表示的“維數(shù)災(zāi)難”問(wèn)題。此外,不同詞語(yǔ)在N維向量空間對(duì)應(yīng)的點(diǎn)與點(diǎn)之間有距離的遠(yuǎn)近關(guān)系,從而可以通過(guò)計(jì)算對(duì)應(yīng)點(diǎn)之間的距離得到詞與詞之間的語(yǔ)義關(guān)系。圖1展示的是部分中文詞向量空間示意圖。

    圖1 部分詞向量空間示意圖

    從圖1中可以看出,語(yǔ)義相關(guān)的詞在詞典向量空間中的相對(duì)位置較為接近,例如“健康”和“預(yù)防”、“需求”和“增加”等??梢钥闯?,相對(duì)于假設(shè)語(yǔ)義單一性的離散表示,分布式表示可以有效地表達(dá)出詞與詞之間的聯(lián)系。

    2 帶注意力機(jī)制的編碼器-解碼器標(biāo)題生成網(wǎng)絡(luò)模型

    標(biāo)準(zhǔn)的編碼器-解碼器標(biāo)題生成網(wǎng)絡(luò)模型的結(jié)構(gòu)[13]如圖2所示。其是將整個(gè)輸入序列編碼為一個(gè)固定大小的上下文語(yǔ)義向量c,之后用這個(gè)固定大小的向量進(jìn)行解碼操作,即標(biāo)題中每個(gè)輸出詞語(yǔ)yi的生成過(guò)程為

    (1)

    其中,f是解碼器Decoder的非線性變換函數(shù)。由式(1)可以看出,標(biāo)準(zhǔn)的序列到序列模型,在生成標(biāo)題中每個(gè)輸出詞語(yǔ)yi時(shí)使用的上下文語(yǔ)義向量c都是相同的,即無(wú)論生成y1,y2,…,yn時(shí),輸入文本中任意詞語(yǔ)對(duì)于某個(gè)輸出詞語(yǔ)yi來(lái)說(shuō)影響力都是相同的。

    圖2 編碼器-解碼器模型網(wǎng)絡(luò)結(jié)構(gòu)圖

    但在實(shí)際應(yīng)用中,編碼器Encoder將整個(gè)輸入序列的信息壓縮到一個(gè)固定長(zhǎng)度的向量會(huì)導(dǎo)致這個(gè)固定長(zhǎng)度的上下文語(yǔ)義向量c無(wú)法有效表示輸入文本的全部信息,導(dǎo)致文本信息的丟失。

    在標(biāo)準(zhǔn)的編碼器-解碼器標(biāo)題生成網(wǎng)絡(luò)模型中引入注意力機(jī)制可以減輕上下文語(yǔ)義向量c所承擔(dān)的信息壓力。其具體操作為:使用根據(jù)當(dāng)前生成詞而不斷變化的上下文向量ci來(lái)替換原來(lái)Encoder端固定長(zhǎng)度的上下文語(yǔ)義向量c,并且在生成上下文向量ci的同時(shí)還會(huì)生成針對(duì)每個(gè)輸入的注意力權(quán)重參數(shù)ai。在解碼器端解碼時(shí),隱藏層向量h′i不僅僅要與Encoder端編碼出來(lái)的上下文語(yǔ)義向量ci進(jìn)行混合,還要與注意力權(quán)重參數(shù)ai進(jìn)行混合,共同決定當(dāng)前時(shí)刻的輸出。

    雙向門控循環(huán)神經(jīng)網(wǎng)絡(luò)可以對(duì)上下文同時(shí)進(jìn)行建模計(jì)算[14],充分利用上下文語(yǔ)句之間的語(yǔ)義聯(lián)系,提高最終的文本生成效果。因此本文研究選取的模型在編碼階段采用了雙向長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)[15]進(jìn)行編碼建模,在解碼階段則采用了單向長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)進(jìn)行解碼操作。網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。

    圖3 帶注意力機(jī)制的編碼器-解碼器模型結(jié)構(gòu)圖

    圖3中注意力權(quán)重參數(shù)a′i及根據(jù)當(dāng)前生成詞而不斷變化的上下文向量ci的計(jì)算如下

    (2)

    (3)

    式(2)和式(3)中,hj是編碼過(guò)程中j時(shí)刻的LSTM神經(jīng)網(wǎng)絡(luò)隱藏層向量,h′i是解碼過(guò)程中i時(shí)刻的LSTM神經(jīng)網(wǎng)絡(luò)隱藏層向量;w是注意力權(quán)重矩陣。

    此時(shí)標(biāo)題中每個(gè)輸出詞語(yǔ)yi的生成過(guò)程變?yōu)槭?4)。

    (4)

    在每個(gè)時(shí)間步,解碼器會(huì)根據(jù)當(dāng)前解碼器的隱藏層向量來(lái)引導(dǎo)編碼器產(chǎn)生的上下文語(yǔ)義向量ci生成對(duì)應(yīng)的輸出序列。因此在生成標(biāo)題的每個(gè)詞語(yǔ)時(shí),注意力機(jī)制將幫助生成模型選擇與此部分高度相關(guān)的原文信息,進(jìn)而生成更貼合原文的相關(guān)標(biāo)題。

    最終結(jié)合注意力機(jī)制的編碼器-解碼器標(biāo)題生成網(wǎng)絡(luò)模型標(biāo)題生成詞的條件概率如式(5)所示。

    (5)

    3 標(biāo)題生成原型系統(tǒng)的設(shè)計(jì)

    3.1 標(biāo)題生成原型系統(tǒng)的整體結(jié)構(gòu)

    標(biāo)題生成原型系統(tǒng)主要由前端展示和后端算法兩部分組成,系統(tǒng)的整體結(jié)構(gòu)如圖4所示。

    圖4 標(biāo)題生成系統(tǒng)的整體結(jié)構(gòu)

    其中前端展示模塊主要的作用是進(jìn)行人機(jī)交互,即用戶輸入想得到標(biāo)題的文本后,前端界面可以返回給用戶該文本在標(biāo)題生成原型系統(tǒng)中生成的對(duì)應(yīng)標(biāo)題。后端算法部分則在接收到用戶輸入的原始文本后,對(duì)用戶的輸入文本進(jìn)行分詞、文本向量化表示、標(biāo)題生成等步驟,并將系統(tǒng)生成的標(biāo)題傳遞給前端界面并展示給用戶。

    3.2 標(biāo)題生成原型系統(tǒng)的功能模塊

    3.2.1 人機(jī)交互模塊

    人機(jī)交互模塊在前端可視化界面中展示,主要用于負(fù)責(zé)接收用戶輸入的待生成標(biāo)題的原始文本,并將接收到的輸入文本傳遞到后端進(jìn)行處理,最后再將后端生成的標(biāo)題展示在可視化界面中。

    本文在人機(jī)交互模塊中使用Tkinter模塊來(lái)搭建標(biāo)題生成系統(tǒng)的可視化界面。Tkinter模塊是Python的標(biāo)準(zhǔn)Tk-GUI工具包的接口,可以在Windows和大多數(shù)的Unix平臺(tái)下使用,從而解決了跨平臺(tái)的兼容性問(wèn)題[16]。

    3.2.2 分詞模塊

    分詞模塊使用jieba開(kāi)源分詞工具對(duì)輸入的文本進(jìn)行分詞操作,作為后續(xù)的文本向量化模塊的預(yù)處理操作。

    例如輸入文本:近年來(lái),一些社會(huì)培訓(xùn)機(jī)構(gòu)擅自招收適齡兒童、少年,以“國(guó)學(xué)”“女德”教育等名義開(kāi)展全日制教育、培訓(xùn),替代義務(wù)教育學(xué)校教育,導(dǎo)致相關(guān)適齡兒童、少年接受義務(wù)教育的權(quán)利和義務(wù)不能依法實(shí)現(xiàn)。對(duì)此,教育部印發(fā)《禁止妨礙義務(wù)教育實(shí)施的若干規(guī)定》。該文本經(jīng)過(guò)分詞模塊后的輸出見(jiàn)表1。

    表1 分詞模塊處理示例

    3.2.3 文本向量化模塊

    文本向量化模塊將分詞模塊的輸出文本通過(guò)詞向量模型轉(zhuǎn)變?yōu)橛?jì)算機(jī)可以識(shí)別的向量表示,之后將經(jīng)過(guò)向量化表示的文本信息傳遞進(jìn)標(biāo)題生成模塊進(jìn)行最終的標(biāo)題生成。

    3.2.4 標(biāo)題生成模塊

    標(biāo)題生成模塊基于上述模塊和帶注意力機(jī)制的編碼器-解碼器標(biāo)題生成網(wǎng)絡(luò)來(lái)生成用戶輸入原始文本所對(duì)應(yīng)的標(biāo)題,并將生成結(jié)果傳遞回前端部分的人機(jī)交互模塊進(jìn)行展示。

    4 標(biāo)題生成原型系統(tǒng)的實(shí)現(xiàn)

    4.1 標(biāo)題生成網(wǎng)絡(luò)模型的訓(xùn)練

    4.1.1 訓(xùn)練數(shù)據(jù)的獲取

    訓(xùn)練標(biāo)題生成任務(wù)的神經(jīng)網(wǎng)絡(luò)模型需要文本-標(biāo)題對(duì)結(jié)構(gòu)的大規(guī)模高質(zhì)量文本數(shù)據(jù)集。基于此,本文研究主要使用了哈爾濱工業(yè)大學(xué)的LCSTS(Large Scale Chinese Short Text Summarization Dataset)[17]數(shù)據(jù)集。

    LCSTS是一個(gè)大規(guī)模的中文短文本摘要數(shù)據(jù)集,其數(shù)據(jù)主要來(lái)源于一些具有影響力的機(jī)構(gòu)或者媒體在新浪微博平臺(tái)上向公眾發(fā)布的信息。LCSTS的數(shù)據(jù)內(nèi)容如圖5所示。

    其中,human_label是志愿者對(duì)每條短文本與摘要的相關(guān)性程度的標(biāo)注,從1~5,數(shù)字越大代表短文本與摘要的相關(guān)性越高;summary則是這些具有影響力的機(jī)構(gòu)或者媒體在發(fā)布消息時(shí)所用的標(biāo)題;short_text則是發(fā)布的消息內(nèi)容。

    圖5 LCSTS數(shù)據(jù)示例

    LCSTS數(shù)據(jù)集共包含超過(guò)24萬(wàn)條短文本摘要數(shù)據(jù),其數(shù)據(jù)長(zhǎng)度分布如圖6所示。

    圖6 LCSTS數(shù)據(jù)長(zhǎng)度分布箱形圖

    由圖6可以看出,LCSTS數(shù)據(jù)集中多數(shù)short_text的長(zhǎng)度大于100,與之對(duì)應(yīng)summary的長(zhǎng)度通常小于20,即可以使用summary的內(nèi)容作為輸出標(biāo)題,short_text的內(nèi)容作為輸入文本進(jìn)行模型訓(xùn)練。

    4.1.2 標(biāo)題生成網(wǎng)絡(luò)的訓(xùn)練參數(shù)設(shè)置

    標(biāo)題生成網(wǎng)絡(luò)模型的訓(xùn)練環(huán)境主要為Intel CORE i7 9700,NVIDIA Tesla V100 32G TPU,Python3.6,Tensorflow1.4,Keras2.1.2,Numpy1.17,Pandas0.23,單次訓(xùn)練耗時(shí)約8 h。實(shí)驗(yàn)參數(shù)設(shè)置如表2所示。

    表2 TGMCN模型訓(xùn)練參數(shù)設(shè)置

    4.2 原型系統(tǒng)的效果展示

    標(biāo)題生成原型系統(tǒng)的可視化界面主要包括以下幾部分:(1)用戶文本輸入框。用戶文本輸入框用于輸入待生成標(biāo)題的原始文本;(2)標(biāo)題生成結(jié)果框。標(biāo)題生成結(jié)果框用于展示系統(tǒng)根據(jù)原始輸入文本而生成的標(biāo)題;(3)標(biāo)題生成按鈕。標(biāo)題生成按鈕用于啟動(dòng)生成系統(tǒng);(4)清空界面按鈕。清空界面按鈕用于清空輸入的文本和系統(tǒng)輸出的標(biāo)題。標(biāo)題生成原型系統(tǒng)的可視化界面如圖7所示。

    圖7 標(biāo)題生成原型系統(tǒng)的可視化界面

    如果用戶輸入的原始文本為空,則系統(tǒng)無(wú)法生成對(duì)應(yīng)標(biāo)題,此時(shí)系統(tǒng)進(jìn)行彈窗,提醒用戶原始輸入文本不能為空,點(diǎn)擊“確定”按鈕回主界面重新進(jìn)行輸入,如圖8所示。

    圖8 輸入文本錯(cuò)誤時(shí)的系統(tǒng)界面

    當(dāng)用戶輸入沒(méi)有錯(cuò)誤的原始文本后,系統(tǒng)會(huì)調(diào)用后端算法模型來(lái)生成輸入文本對(duì)應(yīng)的標(biāo)題,并將生成結(jié)果展示在標(biāo)題生成結(jié)果框中,如圖9所示。

    圖9 生成結(jié)果展示

    4.3 原型系統(tǒng)的性能評(píng)價(jià)

    4.3.1 ROUGE評(píng)價(jià)指標(biāo)

    本文標(biāo)題生成原型系統(tǒng)的性能評(píng)價(jià)采用的評(píng)價(jià)指標(biāo)是基于召回率統(tǒng)計(jì)的ROUGE(Recalloriented Understudy for Gisting Evaluation)[18]指標(biāo)。ROUGE指標(biāo)由ISI的Lin和Hovy提出,是自動(dòng)摘要研究領(lǐng)域基于機(jī)器摘要和人工摘要中N-gram匹配的情況來(lái)生成量化結(jié)果的一種評(píng)價(jià)方法。ROUGE-1、ROUGE-L的計(jì)算方法如式(6)和式(7)所示。

    (6)

    式(6)中,referencesummaries是人工編寫的摘要,Countmatch(gram)表示系統(tǒng)自動(dòng)生成的摘要和人工摘要中相同N-gram的最大數(shù)量,Count(gram)表示人工摘要中出現(xiàn)的N-gram個(gè)數(shù)。

    (7)

    式中,X和Y分別代表模型自動(dòng)生成的摘要和人工標(biāo)準(zhǔn)摘要;L(X,Y)是X和Y的最長(zhǎng)公共子序列的長(zhǎng)度;m和n分別表示人工標(biāo)準(zhǔn)摘要和系統(tǒng)自動(dòng)生成的摘要的長(zhǎng)度,即組成摘要的詞語(yǔ)個(gè)數(shù);Rl和Pl則分別表示召回率和準(zhǔn)確率;β被設(shè)置為一個(gè)趨向于正無(wú)窮的極大參數(shù),因此ROUGE-L在數(shù)值上約等于Rl。

    4.3.2 原型系統(tǒng)的性能測(cè)試結(jié)果

    由于LCSTS數(shù)據(jù)集中human_label標(biāo)簽數(shù)值為“5”的文本代表經(jīng)過(guò)志愿者標(biāo)注,認(rèn)為該條文本的標(biāo)題與文本內(nèi)容相似度較高。因此在測(cè)試原型系統(tǒng)性能時(shí),在LCSTS數(shù)據(jù)集中所有human_label標(biāo)簽數(shù)值為“5”的文本中隨機(jī)選取了510條,并將該510條文本數(shù)據(jù)移出訓(xùn)練集來(lái)構(gòu)成測(cè)試集以避免訓(xùn)練過(guò)程中的數(shù)據(jù)泄露。

    LexPageRank模型[19]是將PageRank算法應(yīng)用到文本句子關(guān)系表示的方法,是一種基于圖模型的標(biāo)題生成模型。MEAD模型[20]是通過(guò)聯(lián)合考慮句子的質(zhì)心、位置、公共子序列及關(guān)鍵詞這4種特征的標(biāo)題生成模型。為了驗(yàn)證標(biāo)題生成原型系統(tǒng)的性能,本文選取了LexPageRank和MEAD模型作為基線模型。系統(tǒng)性能測(cè)試結(jié)果見(jiàn)表3。

    表3 系統(tǒng)性能測(cè)試結(jié)果

    5 結(jié)束語(yǔ)

    隨著互聯(lián)網(wǎng)時(shí)代的快速發(fā)展,網(wǎng)絡(luò)中存在著大量不規(guī)范的文本信息。本文針對(duì)人工編寫標(biāo)題無(wú)法應(yīng)對(duì)每天產(chǎn)生的海量文本數(shù)據(jù)這一現(xiàn)象,基于生成式文本摘要技術(shù)對(duì)中文標(biāo)題生成原型系統(tǒng)進(jìn)行了設(shè)計(jì)與實(shí)現(xiàn),并對(duì)系統(tǒng)功能進(jìn)行了詳細(xì)的介紹和展示。通過(guò)在LCSTS數(shù)據(jù)集上的實(shí)驗(yàn)表明,采用訓(xùn)練結(jié)合注意力機(jī)制的編碼器-解碼器標(biāo)題生成網(wǎng)絡(luò)模型,可以使系統(tǒng)生成的標(biāo)題更符合人工撰寫摘要的規(guī)律,在一定程度上滿足人們對(duì)于生成標(biāo)題的流暢性和準(zhǔn)確性的要求。其中,ROUGE-1、ROUGE-L評(píng)價(jià)指標(biāo)的數(shù)值分別為29.91和24.68,均高于基線模型,證明了標(biāo)題生成原型系統(tǒng)的有效性。

    但是,因?yàn)橛?jì)算機(jī)硬件設(shè)備限制的客觀原因以及自身水平有限的主觀原因,本文仍然存在著有待完善優(yōu)化的地方,例如距離生成真正意義上的語(yǔ)義準(zhǔn)確、表述清晰、行文連貫的高質(zhì)量文章標(biāo)題仍有著不小的差距。此外,本文所設(shè)計(jì)并實(shí)現(xiàn)的標(biāo)題生成原型系統(tǒng)僅僅具備簡(jiǎn)單的基礎(chǔ)功能,距離實(shí)際工業(yè)應(yīng)用還有一定距離。在今后的工作中,研究人員將會(huì)持續(xù)關(guān)注國(guó)內(nèi)外在文本生成領(lǐng)域的最新研究,從而繼續(xù)優(yōu)化和改進(jìn)標(biāo)題生成系統(tǒng)的性能。

    猜你喜歡
    解碼器原型語(yǔ)義
    科學(xué)解碼器(一)
    科學(xué)解碼器(二)
    科學(xué)解碼器(三)
    包裹的一切
    語(yǔ)言與語(yǔ)義
    線圣AudioQuest 發(fā)布第三代Dragonfly Cobalt藍(lán)蜻蜓解碼器
    《哈姆雷特》的《圣經(jīng)》敘事原型考證
    論《西藏隱秘歲月》的原型復(fù)現(xiàn)
    “上”與“下”語(yǔ)義的不對(duì)稱性及其認(rèn)知闡釋
    原型理論分析“門”
    人間(2015年20期)2016-01-04 12:47:08
    少妇被粗大猛烈的视频| 欧美日韩av久久| 精品99又大又爽又粗少妇毛片| 在线观看一区二区三区激情| 日韩一区二区视频免费看| 99国产精品免费福利视频| 午夜福利在线观看免费完整高清在| 人人妻人人澡人人看| 青春草亚洲视频在线观看| 欧美国产精品va在线观看不卡| 日韩制服丝袜自拍偷拍| 久久久久国产网址| 看非洲黑人一级黄片| 国产日韩一区二区三区精品不卡| 国产日韩欧美视频二区| 宅男免费午夜| 亚洲一区二区三区欧美精品| 男女国产视频网站| 九色亚洲精品在线播放| 秋霞伦理黄片| 亚洲av中文av极速乱| 国产激情久久老熟女| av不卡在线播放| 亚洲少妇的诱惑av| 天堂中文最新版在线下载| av片东京热男人的天堂| 青春草亚洲视频在线观看| 在现免费观看毛片| 欧美 亚洲 国产 日韩一| 色播在线永久视频| 久久青草综合色| 亚洲精品av麻豆狂野| 大片免费播放器 马上看| 亚洲婷婷狠狠爱综合网| 曰老女人黄片| 飞空精品影院首页| 亚洲第一av免费看| 亚洲国产日韩一区二区| 精品国产一区二区久久| 免费观看无遮挡的男女| 女人高潮潮喷娇喘18禁视频| 免费女性裸体啪啪无遮挡网站| 日本vs欧美在线观看视频| 嫩草影院入口| 波多野结衣av一区二区av| 精品国产露脸久久av麻豆| 色婷婷av一区二区三区视频| 天天躁日日躁夜夜躁夜夜| 国产深夜福利视频在线观看| 午夜福利在线观看免费完整高清在| 亚洲成国产人片在线观看| 日韩欧美精品免费久久| 久久久久久久亚洲中文字幕| 一级片免费观看大全| 色哟哟·www| 成年人午夜在线观看视频| tube8黄色片| 狠狠婷婷综合久久久久久88av| 国产成人免费观看mmmm| 亚洲欧美清纯卡通| 日本91视频免费播放| 国产精品av久久久久免费| 桃花免费在线播放| 久久精品国产综合久久久| 久久精品国产鲁丝片午夜精品| 亚洲经典国产精华液单| 久久久久视频综合| 亚洲欧美一区二区三区国产| 热99久久久久精品小说推荐| 少妇被粗大猛烈的视频| 欧美人与性动交α欧美软件| 日韩电影二区| 国产精品国产三级专区第一集| 搡老乐熟女国产| 日韩一区二区三区影片| 五月开心婷婷网| 亚洲av成人精品一二三区| 美女福利国产在线| 欧美在线黄色| 亚洲精品自拍成人| av在线播放精品| 中文字幕制服av| 久久精品人人爽人人爽视色| av又黄又爽大尺度在线免费看| 亚洲四区av| 一个人免费看片子| 国产黄色免费在线视频| 精品少妇久久久久久888优播| 999精品在线视频| 赤兔流量卡办理| 日产精品乱码卡一卡2卡三| 搡老乐熟女国产| 热re99久久精品国产66热6| 熟女av电影| 天天躁夜夜躁狠狠久久av| 成人影院久久| 男人舔女人的私密视频| 亚洲第一区二区三区不卡| 亚洲国产欧美在线一区| 精品少妇一区二区三区视频日本电影 | 日韩一本色道免费dvd| 黑人猛操日本美女一级片| 欧美人与性动交α欧美软件| 国产精品不卡视频一区二区| 精品一区二区免费观看| 国产成人aa在线观看| 午夜免费观看性视频| 亚洲成人av在线免费| 最近最新中文字幕免费大全7| 超碰成人久久| 免费少妇av软件| 精品福利永久在线观看| 久久影院123| 在线观看www视频免费| 看免费成人av毛片| 十分钟在线观看高清视频www| 在现免费观看毛片| 日韩,欧美,国产一区二区三区| 日韩精品有码人妻一区| 美女国产高潮福利片在线看| 亚洲精品美女久久av网站| 又大又黄又爽视频免费| 成年人午夜在线观看视频| 蜜桃在线观看..| 国产一区二区三区av在线| 啦啦啦视频在线资源免费观看| 九九爱精品视频在线观看| 欧美日韩一区二区视频在线观看视频在线| 自拍欧美九色日韩亚洲蝌蚪91| 人妻少妇偷人精品九色| 国产精品不卡视频一区二区| 又大又黄又爽视频免费| 久久久久网色| 久久鲁丝午夜福利片| 性少妇av在线| 人妻系列 视频| 中文字幕色久视频| 国产黄色视频一区二区在线观看| 大香蕉久久网| 亚洲精品乱久久久久久| 精品少妇一区二区三区视频日本电影 | 精品人妻一区二区三区麻豆| 最近最新中文字幕大全免费视频 | 久久久久视频综合| 黄色视频在线播放观看不卡| 亚洲成色77777| 各种免费的搞黄视频| 午夜激情av网站| 欧美黄色片欧美黄色片| 成人国语在线视频| 最近2019中文字幕mv第一页| 国产免费现黄频在线看| www.熟女人妻精品国产| 纯流量卡能插随身wifi吗| 精品国产乱码久久久久久男人| 2018国产大陆天天弄谢| 在线观看www视频免费| 国产精品一区二区在线观看99| 少妇的丰满在线观看| 国产成人aa在线观看| 久久精品国产亚洲av涩爱| 亚洲国产av新网站| 一边摸一边做爽爽视频免费| 精品国产露脸久久av麻豆| 一级毛片电影观看| 亚洲精品一区蜜桃| 国产一区二区三区av在线| 人妻人人澡人人爽人人| 伦精品一区二区三区| 日本wwww免费看| 国产精品嫩草影院av在线观看| 国产精品不卡视频一区二区| 日本wwww免费看| 下体分泌物呈黄色| 亚洲精品美女久久久久99蜜臀 | 亚洲第一青青草原| 精品福利永久在线观看| 国产精品成人在线| √禁漫天堂资源中文www| 亚洲精品日本国产第一区| 狠狠精品人妻久久久久久综合| 久久精品aⅴ一区二区三区四区 | 日本vs欧美在线观看视频| 国产av国产精品国产| 99热全是精品| 午夜免费观看性视频| 亚洲国产精品一区二区三区在线| 日韩一卡2卡3卡4卡2021年| 中文字幕av电影在线播放| 免费看av在线观看网站| 日韩在线高清观看一区二区三区| 男女边摸边吃奶| 国产激情久久老熟女| 日韩 亚洲 欧美在线| 一级爰片在线观看| 老司机影院毛片| 欧美中文综合在线视频| 男人舔女人的私密视频| 一区二区三区精品91| 精品国产国语对白av| 80岁老熟妇乱子伦牲交| 久久久久视频综合| 久久人人97超碰香蕉20202| 最近最新中文字幕大全免费视频 | 亚洲精品国产色婷婷电影| 狠狠精品人妻久久久久久综合| 纵有疾风起免费观看全集完整版| videossex国产| 国产精品国产av在线观看| 国产一区二区在线观看av| 777久久人妻少妇嫩草av网站| 国产一区二区激情短视频 | 伦精品一区二区三区| 国产97色在线日韩免费| 在线亚洲精品国产二区图片欧美| 亚洲精品久久久久久婷婷小说| 久久精品久久精品一区二区三区| 久久久精品免费免费高清| 99香蕉大伊视频| 午夜福利视频精品| 色婷婷久久久亚洲欧美| 久久精品国产自在天天线| www.精华液| 黄色怎么调成土黄色| 午夜精品国产一区二区电影| 亚洲人成77777在线视频| 亚洲美女视频黄频| 黄色毛片三级朝国网站| 丝瓜视频免费看黄片| 美女脱内裤让男人舔精品视频| 久久精品久久久久久噜噜老黄| 免费观看性生交大片5| 丝袜在线中文字幕| 在线精品无人区一区二区三| 国产黄频视频在线观看| 在线观看美女被高潮喷水网站| 日韩中文字幕欧美一区二区 | freevideosex欧美| 一级片'在线观看视频| a级毛片黄视频| 国产又爽黄色视频| 国产av精品麻豆| 国产成人91sexporn| videossex国产| 天天躁狠狠躁夜夜躁狠狠躁| 永久网站在线| 一本色道久久久久久精品综合| 国产成人免费无遮挡视频| 999久久久国产精品视频| 波野结衣二区三区在线| 亚洲精品视频女| 中国国产av一级| 婷婷色av中文字幕| 波野结衣二区三区在线| 国产一区亚洲一区在线观看| 美女国产高潮福利片在线看| 亚洲欧美成人精品一区二区| 国产精品三级大全| 国产精品久久久av美女十八| 精品一区二区三区四区五区乱码 | 国产精品一区二区在线不卡| 亚洲精品久久成人aⅴ小说| 亚洲欧美成人综合另类久久久| 黄网站色视频无遮挡免费观看| av.在线天堂| 啦啦啦在线免费观看视频4| 人成视频在线观看免费观看| www.熟女人妻精品国产| 国产精品香港三级国产av潘金莲 | 香蕉国产在线看| 国产精品久久久久久精品电影小说| 免费高清在线观看日韩| 美女福利国产在线| 精品酒店卫生间| 成人漫画全彩无遮挡| 精品视频人人做人人爽| 一本—道久久a久久精品蜜桃钙片| 女的被弄到高潮叫床怎么办| 丝袜人妻中文字幕| 免费日韩欧美在线观看| 精品国产乱码久久久久久男人| 国精品久久久久久国模美| 精品一区二区三卡| 各种免费的搞黄视频| 久久久久久人妻| 国产精品无大码| 欧美日韩精品网址| 99国产综合亚洲精品| 在线观看美女被高潮喷水网站| 在线观看免费视频网站a站| 桃花免费在线播放| av在线app专区| 日本午夜av视频| 国产精品久久久久久精品电影小说| 叶爱在线成人免费视频播放| av国产久精品久网站免费入址| 精品少妇黑人巨大在线播放| 青青草视频在线视频观看| 国产av一区二区精品久久| 日韩三级伦理在线观看| 天天躁狠狠躁夜夜躁狠狠躁| 18禁裸乳无遮挡动漫免费视频| 18禁动态无遮挡网站| 大香蕉久久成人网| 一边摸一边做爽爽视频免费| 亚洲精品久久久久久婷婷小说| 国产精品久久久久久精品电影小说| 在线天堂最新版资源| 午夜福利视频精品| 1024香蕉在线观看| 亚洲av成人精品一二三区| 欧美日韩精品网址| av有码第一页| 大片电影免费在线观看免费| 韩国av在线不卡| 亚洲成av片中文字幕在线观看 | 久久午夜福利片| 欧美在线黄色| 只有这里有精品99| av国产久精品久网站免费入址| av视频免费观看在线观看| 99香蕉大伊视频| 免费在线观看视频国产中文字幕亚洲 | 日本欧美视频一区| 国产极品天堂在线| 久久韩国三级中文字幕| 国产xxxxx性猛交| 久久99蜜桃精品久久| 日韩欧美精品免费久久| 尾随美女入室| 久久久久视频综合| 亚洲欧美精品综合一区二区三区 | 超色免费av| 欧美日韩国产mv在线观看视频| 日韩制服丝袜自拍偷拍| 国产成人精品久久二区二区91 | 最近最新中文字幕免费大全7| 侵犯人妻中文字幕一二三四区| 国产一区二区激情短视频 | 亚洲四区av| 人人妻人人爽人人添夜夜欢视频| 亚洲综合色惰| 亚洲欧美精品综合一区二区三区 | 日韩一卡2卡3卡4卡2021年| 午夜激情av网站| 国产精品一区二区在线观看99| 男女国产视频网站| 日日啪夜夜爽| 中文欧美无线码| av电影中文网址| 成人亚洲欧美一区二区av| 在线观看免费高清a一片| 国产在线免费精品| 大片免费播放器 马上看| 久久久久久久久久久免费av| 最近中文字幕高清免费大全6| 国产毛片在线视频| 欧美日韩视频高清一区二区三区二| 亚洲,欧美精品.| 亚洲精品国产色婷婷电影| 亚洲人成网站在线观看播放| 成人影院久久| 在线精品无人区一区二区三| 高清不卡的av网站| 国产白丝娇喘喷水9色精品| 久久97久久精品| 捣出白浆h1v1| 男男h啪啪无遮挡| av有码第一页| 丰满少妇做爰视频| 亚洲欧美一区二区三区黑人 | 欧美亚洲 丝袜 人妻 在线| 亚洲五月色婷婷综合| 久久久亚洲精品成人影院| 曰老女人黄片| 最新的欧美精品一区二区| 最近的中文字幕免费完整| 精品人妻偷拍中文字幕| 建设人人有责人人尽责人人享有的| freevideosex欧美| 国产一级毛片在线| 26uuu在线亚洲综合色| 欧美 日韩 精品 国产| 哪个播放器可以免费观看大片| 亚洲国产欧美日韩在线播放| 如日韩欧美国产精品一区二区三区| 亚洲精品中文字幕在线视频| 免费播放大片免费观看视频在线观看| 新久久久久国产一级毛片| 最近最新中文字幕免费大全7| 久久久国产欧美日韩av| 自拍欧美九色日韩亚洲蝌蚪91| 青春草视频在线免费观看| 色哟哟·www| 国产午夜精品一二区理论片| 久久人人爽av亚洲精品天堂| av有码第一页| 美国免费a级毛片| 成年美女黄网站色视频大全免费| 午夜激情av网站| 午夜日本视频在线| 国产无遮挡羞羞视频在线观看| 欧美人与性动交α欧美精品济南到 | 久久精品国产亚洲av涩爱| av在线播放精品| 国产白丝娇喘喷水9色精品| videossex国产| 肉色欧美久久久久久久蜜桃| 女性被躁到高潮视频| 永久免费av网站大全| 亚洲欧美中文字幕日韩二区| 久久99精品国语久久久| 狠狠精品人妻久久久久久综合| 亚洲国产av影院在线观看| 精品亚洲成a人片在线观看| 99久久中文字幕三级久久日本| 久久国产精品男人的天堂亚洲| 欧美中文综合在线视频| 高清视频免费观看一区二区| 中文字幕av电影在线播放| 久久国产精品大桥未久av| 日韩欧美精品免费久久| 交换朋友夫妻互换小说| 丰满饥渴人妻一区二区三| 69精品国产乱码久久久| 涩涩av久久男人的天堂| 大片电影免费在线观看免费| 亚洲,欧美精品.| 91在线精品国自产拍蜜月| 90打野战视频偷拍视频| 欧美 亚洲 国产 日韩一| 母亲3免费完整高清在线观看 | 亚洲av日韩在线播放| 九色亚洲精品在线播放| 午夜av观看不卡| 狠狠精品人妻久久久久久综合| 免费观看av网站的网址| 99久国产av精品国产电影| 男女免费视频国产| 麻豆精品久久久久久蜜桃| 91aial.com中文字幕在线观看| 亚洲成人一二三区av| 人人妻人人澡人人看| 老女人水多毛片| 有码 亚洲区| kizo精华| 国产成人a∨麻豆精品| av.在线天堂| 狂野欧美激情性bbbbbb| 制服诱惑二区| 精品亚洲成a人片在线观看| 午夜激情久久久久久久| 亚洲,欧美精品.| 一二三四中文在线观看免费高清| 叶爱在线成人免费视频播放| 国语对白做爰xxxⅹ性视频网站| 女人久久www免费人成看片| 卡戴珊不雅视频在线播放| 欧美日韩综合久久久久久| 久久97久久精品| 亚洲成av片中文字幕在线观看 | 宅男免费午夜| av卡一久久| 永久网站在线| 三级国产精品片| 久久久久精品久久久久真实原创| 国产成人精品一,二区| 国产视频首页在线观看| 国产精品.久久久| 日韩免费高清中文字幕av| 精品福利永久在线观看| 国产一级毛片在线| 18禁裸乳无遮挡动漫免费视频| 国产av一区二区精品久久| xxxhd国产人妻xxx| 叶爱在线成人免费视频播放| 侵犯人妻中文字幕一二三四区| 美女主播在线视频| 午夜影院在线不卡| 制服人妻中文乱码| 成人免费观看视频高清| 亚洲一区中文字幕在线| 亚洲熟女精品中文字幕| av在线老鸭窝| 两个人看的免费小视频| 99国产综合亚洲精品| 欧美精品亚洲一区二区| 欧美人与性动交α欧美精品济南到 | 成人亚洲欧美一区二区av| 亚洲欧美中文字幕日韩二区| 69精品国产乱码久久久| 免费少妇av软件| 精品第一国产精品| 美女脱内裤让男人舔精品视频| 亚洲欧美精品综合一区二区三区 | 三级国产精品片| 搡女人真爽免费视频火全软件| 免费少妇av软件| 亚洲情色 制服丝袜| 亚洲人成77777在线视频| 午夜激情av网站| 美女主播在线视频| 欧美97在线视频| 国产一区二区 视频在线| 国产高清不卡午夜福利| 九色亚洲精品在线播放| 最新中文字幕久久久久| 欧美97在线视频| 欧美日韩视频高清一区二区三区二| 精品国产一区二区三区久久久樱花| 狂野欧美激情性bbbbbb| 少妇人妻 视频| 亚洲国产看品久久| 一区二区三区四区激情视频| 高清黄色对白视频在线免费看| 亚洲三区欧美一区| 日本vs欧美在线观看视频| 国产午夜精品一二区理论片| 嫩草影院入口| 视频在线观看一区二区三区| 亚洲av在线观看美女高潮| 欧美另类一区| 亚洲成色77777| 亚洲欧美一区二区三区国产| 少妇人妻 视频| 久热这里只有精品99| 久久国产亚洲av麻豆专区| 成人毛片a级毛片在线播放| 老汉色∧v一级毛片| 成人国语在线视频| 欧美人与善性xxx| 久久国内精品自在自线图片| 午夜av观看不卡| 天天影视国产精品| 午夜免费鲁丝| 亚洲一码二码三码区别大吗| 中文字幕制服av| 国产精品免费大片| www.av在线官网国产| 国产精品久久久久久精品电影小说| 婷婷色综合大香蕉| 男女无遮挡免费网站观看| 日日爽夜夜爽网站| 天天躁夜夜躁狠狠久久av| 韩国精品一区二区三区| 国产人伦9x9x在线观看 | 免费黄色在线免费观看| 少妇人妻久久综合中文| 国产成人午夜福利电影在线观看| 黄色毛片三级朝国网站| 最近最新中文字幕大全免费视频 | 久久97久久精品| 日本-黄色视频高清免费观看| 久久久久国产精品人妻一区二区| 99热国产这里只有精品6| 午夜影院在线不卡| 精品第一国产精品| 香蕉丝袜av| 亚洲欧美日韩另类电影网站| 国产一区二区在线观看av| 午夜福利一区二区在线看| 91精品伊人久久大香线蕉| 欧美精品一区二区大全| 国产精品蜜桃在线观看| 亚洲综合色网址| 伦精品一区二区三区| 我要看黄色一级片免费的| 国产精品成人在线| 在线观看人妻少妇| 多毛熟女@视频| 女性生殖器流出的白浆| 欧美精品亚洲一区二区| 日韩不卡一区二区三区视频在线| 久热这里只有精品99| 男男h啪啪无遮挡| 久久免费观看电影| 乱人伦中国视频| 国产精品 欧美亚洲| 国产一区二区激情短视频 | 黄色配什么色好看| 老司机影院成人| 五月伊人婷婷丁香| 巨乳人妻的诱惑在线观看| 最近中文字幕高清免费大全6| 最近最新中文字幕大全免费视频 | 好男人视频免费观看在线| 亚洲精品日韩在线中文字幕| 97在线人人人人妻| 亚洲国产精品一区三区| 免费观看在线日韩| 国产精品久久久久久久久免| 国产精品免费大片| 国产av精品麻豆| 999精品在线视频| 多毛熟女@视频| 熟女电影av网| 久热久热在线精品观看| 欧美少妇被猛烈插入视频| 色网站视频免费| 黄色 视频免费看| 国产亚洲午夜精品一区二区久久| 国产精品一区二区在线观看99| 一区二区三区激情视频| 精品午夜福利在线看| 国产成人精品福利久久| 人妻系列 视频| 一级片'在线观看视频| 久久久久久久久久人人人人人人| 亚洲成人一二三区av| 国产精品欧美亚洲77777| 中文字幕另类日韩欧美亚洲嫩草| 黑丝袜美女国产一区| 欧美亚洲日本最大视频资源| 欧美另类一区| 永久网站在线|