• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    面向中文法律裁判文書的抽取式摘要算法

    2024-01-26 07:47:28溫嘉寶
    集成技術 2024年1期
    關鍵詞:編碼器文書裁判

    溫嘉寶 楊 敏

    1(中國科學院深圳先進技術研究院 深圳 518055)2(中國科學院大學 北京 100049)

    1 引 言

    隨著人民群眾法律意識的提高和案件數(shù)量增長速度的加快,截至 2023 年 1 月,中國裁判文書網已公布超過 1.3 億份的裁判文書,并以每日數(shù)千份的速度繼續(xù)增加。這些文書包括民事、刑事、行政、賠償、執(zhí)行等多種類型,經過篩選和專業(yè)處理后被公布,形成了法律領域中數(shù)據量最大的數(shù)據庫,為司法智能化、信息化提供了強有力的數(shù)據基礎。優(yōu)質裁判文書的不斷增加對司法領域的發(fā)展具有重要意義,如可以為法律從業(yè)者提供更多的案例參考,緩解“同案不同判”的困境。然而,這也帶來了一些新的問題。

    裁判文書是法律從業(yè)者日常工作中接觸的重要資料之一,包括進行類案檢索和撰寫類案檢索報告。隨著裁判文書數(shù)據量的增加,法律從業(yè)者需要從檢索出的大量裁判文書中挑選出最合適的裁判文書。然而,裁判文書通常較長,平均長度可達數(shù)千字,甚至有少數(shù)文件長達上萬字,從中查找出關鍵信息并進行分析無疑變得越來越困難。因此,對裁判文書進行自動摘要,以去除冗余信息、精簡文本內容,能極大程度地減少法律從業(yè)者的工作量,使得他們有更多的精力從事更有價值的工作,從而提升司法行業(yè)的效率。由此可見,裁判文書自動摘要對司法領域有著重要研究價值和現(xiàn)實意義。

    根據摘要方式,自動摘要模型可分為抽取式模型和生成式模型,本文提出的方法屬于抽取式模型。抽取式模型通過從原文中直接選擇若干個重要句子進行排列重組,以形成摘要。根據學習方式的不同,抽取式摘要算法可進一步劃分為無監(jiān)督式抽取和有監(jiān)督式抽取。無監(jiān)督抽取式文本摘要方法因運行速度快,且無須人工標注訓練數(shù)據而廣受應用。相比之下,有監(jiān)督抽取式文本摘要方法的優(yōu)勢在于其具有更高的準確性。

    2 抽取式摘要研究現(xiàn)狀

    抽取式摘要是一種直接從原文中抽取關鍵句的方式,這種方式在句法上錯誤率低。從學習方式上,抽取式摘要算法可以分為無監(jiān)督和有監(jiān)督兩大類。無監(jiān)督抽取式摘要通常采用圖、聚類等方式。而有監(jiān)督抽取式摘要多采用基于神經網絡的方法。

    2.1 無監(jiān)督抽取式摘要算法

    無監(jiān)督抽取式摘要最簡單的實現(xiàn)方式是“Lead-3”法,即從文本前 3 個句子中提取信息,并作為摘要。由于作者通常在文章的標題和開頭部分闡述文章的主題(如新聞報道),因此,這種方式在該類文本中較為有效。然而,法律裁判文書的關鍵信息分布較為均勻,因此,采用 Lead-3法進行法律裁判文書的摘要不能達到理想效果。

    2004 年,Erkan 等[1]提出的 LexRank 是一種基于圖排序的抽取式摘要算法,其以句子為節(jié)點,以句子間相似度為邊的權值,構建無向有權圖。該算法采用詞袋模型表示句子向量,維度是目標語言中單詞的數(shù)量。對于出現(xiàn)在句子中的每個單詞來說,句子向量中相應維數(shù)的值是該單詞的 TF-IDF[2]值。通過計算句子向量與圖中質心之間的相似度,判斷句子是否為重要句子。其中,兩個句子之間的相似性由向量間的余弦相似度定義,而質心是由文檔中 TF-IDF 值超過某一閾值的詞構成的向量。該算法具有簡單和易于實現(xiàn)的優(yōu)點。然而,它在表示句子向量的方式上存在一定的缺陷。其一,維度較大,導致生成的句子向量非常稀疏。其二,句子向量中相應維數(shù)的值是該單詞的 TF-IDF 值。由于 TF-IDF 基于詞頻統(tǒng)計,無法考慮語義信息,因此,LexRank 在判斷句子相似性時無法充分考慮語義層面的相似度。

    2004 年,Mihalcea 等[3]提出的 TextRank 算法是一種基于圖的排序算法,其設計靈感源自于 PageRank[4]網絡排序算法。該算法將文檔表示為圖模型,將文檔中的每個句子作為圖中的一個節(jié)點,節(jié)點之間的連邊表示句子之間的相關性。然后,通過 PageRank 算法計算每個節(jié)點的TextRank 值,以確定文檔中最重要的句子,并選擇其中得分最高的幾個句子作為摘要。然而,TextRank 的句子相似度衡量方式采用了兩個句子之間的共現(xiàn)詞數(shù)量,即采用了詞袋模型,無法考慮同義詞、詞序等其他信息。這使得 TextRank算法的表現(xiàn)會受到一定的限制。

    2016 年,Padmakumar 等[5]提出了一種基于聚類的抽取算法。首先,利用 Skip Thought Vectors 進行無監(jiān)督學習,得到句子的嵌入向量。然后,通過聚類算法對生成的句子嵌入向量進行聚類。最后,將距離簇質心最近的向量所對應的句子作為文本摘要。Skip Thought Vectors 的思想是通過一個句子預測它上下文的句子,具體做法是通過 LSTM[6]編碼器將中間句子編碼為向量,再用兩個獨立的 LSTM 解碼器將句子向量解碼出前后句子。這種方式與 2013 年 Mikolov 等[7]提出的 Word2Vec 中的 Skip-gram 訓練策略相似,依據的原則是一個句子與其前后相鄰句子之間存在語義聯(lián)系。在該論文中,Padmakumar 等[5]嘗試了 K-means 和 Mean-shift 兩種聚類方法。然而,該算法的不足之處在于 LSTM 無法實現(xiàn)并行訓練,以及在處理長序列時可能面臨梯度消失和梯度爆炸的風險。

    2021 年,Padmakumar 等[8]提出了一種基于點互信息的摘要算法。該算法利用 GPT-2[9]計算給定兩個句子之間的點互信息,而點互信息定義為在給定前句的情況下,得到后句的概率。通過對摘要與原文檔中所有句子對的點互信息進行求和,可以得到摘要與原文檔的相關性。同時,通過對摘要內部所有句子對的點互信息進行求和,可以確定摘要的冗余性。最終,摘要由一個句子集合組成,該集合能最大化相關性減去冗余性的值。該算法的優(yōu)點在于利用預訓練語言模型計算句子間的點互信息,從而實現(xiàn)無監(jiān)督抽取式摘要。然而,缺點在于其時間復雜度較高,需要計算所有句子之間的點互信息。當文檔句子數(shù)量較大時,推理時間將會較長。

    2.2 有監(jiān)督抽取式摘要算法

    2017 年,Nallapati 等[10]提出了一種名為SummaRuNNer 的方法,將文本摘要任務轉化為序列標注問題。對文本中的每個句子都進行二分類(0 或 1):0 表示不納入摘要,1 表示納入摘要。最終的文本摘要由標記為 1 的句子組成。該模型包含兩個雙向門控循環(huán)單元[11]:第一個雙向門控循環(huán)單元對句子進行詞級建模,以獲得詞級表示,接著,對句子中各詞的詞級表示求平均,得到句子嵌入;第二個雙向門控循環(huán)單元則對句子嵌入進行句級建模,以獲取句級表示。最后,通過一個分類器對句級表示進行二分類,得到最終的摘要結果。該模型的優(yōu)點在于,它不僅雙向考慮了句子的局部和全局信息,還充分考慮了句子與文檔的關系、句子與前后句子的關系、絕對位置和相對位置等因素。然而,該模型的缺陷在于采用循環(huán)神經網絡(recurrent neural network,RNN)進行特征提取,導致無法進行并行訓練。此外,在處理長序列時,模型可能會面臨梯度消失和梯度爆炸的風險。

    2017 年,Isonuma 等[12]將文本分類任務與摘要任務相結合,以提升摘要效果。該方法首先采用卷積神經網絡對句子進行編碼,獲取句子向量;然后使用基于 RNN 的編碼器-解碼器框架為每個句子生成摘要概率。具體而言,在編碼器中,為每個句子生成隱藏狀態(tài);在解碼器中,利用前一個句子的摘要概率、句子向量和隱藏狀態(tài)生成當前句子的隱藏狀態(tài),并根據該隱藏狀態(tài)計算當前句子的摘要概率。接著,以摘要概率為權重,對句子向量進行加權平均,得到文本向量。最后,利用文本向量預測文本的類別。Isonuma等[12]認為,文本的類別可以被視為文本的粗糙摘要。若模型能根據文本向量準確預測文本類別,則說明模型具有抽取關鍵信息的能力。因此,可以將摘要概率較高的句子作為文本的摘要。該方法的優(yōu)點在于利用文本分類任務增強模型的摘要能力。然而,該方法也存在一些缺點:(1)卷積神經網絡主要通過局部卷積操作捕捉文本中的局部特征,對長距離依賴關系的捕捉能力較弱;(2)卷積神經網絡的卷積操作對輸入的順序不敏感,在捕捉文本中的詞序信息方面存在局限;(3)基于 RNN 的編碼器-解碼器架構無法并行計算,且存在梯度消失和梯度爆炸的風險;(4)計算過程為單向操作,在計算當前句子摘要概率時,無法考慮后續(xù)句子的信息。

    2019 年,Liu[13]首次將 BERT[14]應用于抽取式摘要任務,提出了名為 BERTSUM 的方法。即在每個句子前插入[CLS]詞元,句子后添加[SEP]詞元,最終將每個[CLS]對應的輸出視為每個句子的句子向量。Liu[13]采用了 3 種方式對句子進行分類:(1)連接線性層和 Sigmoid 函數(shù),計算句子的重要性得分;(2)句子向量表示單獨接入 Transformer[15]進行分類;(3)將句子向量表示單獨接入 LSTM 進行分類。BERTSUM 的優(yōu)勢在于充分利用了預訓練語言模型的強大特征提取能力。通過對輸入數(shù)據進行簡單的預處理和微調預訓練語言模型,便可完成抽取式摘要任務。此方法具有實現(xiàn)相對簡單、訓練代價較低等優(yōu)點。然而,BERTSUM 也存在一定的缺陷,即需要將整篇文本一次性輸入到 BERT 中,當文本長度超出模型輸入限制時,則難以完成摘要任務。

    2020 年,Zhong 等[16]提出了 MatchSum 模型,將摘要任務轉化為文本匹配任務。該模型利用預訓練語言模型對文本進行編碼,通過比較文檔上下文表示與真實摘要及候選摘要的上下文表示,計算相似度并更新參數(shù)。模型認為目標摘要與原文檔之間的相似度應最為接近,因此,當存在比目標摘要更接近原文檔的摘要時,計算損失并更新參數(shù)。文檔的候選集由多個句子的所有組合構成。為防止文檔句子過多導致組合爆炸,Zhong 等[16]采用 BERTSUM 進行粗略摘要,將部分不重要的句子剔除。在推理階段,選擇與原文檔語義相似度最高的候選摘要作為摘要結果。該算法的優(yōu)點在于將摘要任務轉換為文本匹配任務,僅需將匹配得分最高的候選結果作為摘要答案。然而,該算法也存在一些缺點:(1)使用BERTSUM 進行粗略摘要,在處理長文本時,可能會截斷文本,導致信息丟失;(2)不適用于處理句子較多的文本,當文本句子數(shù)量較大時,候選摘要集規(guī)模也會很大,將增加計算成本。

    2022 年,Shi 等[17]提出了一個基于星形架構的抽取式摘要模型 StarSum:首先,通過BERTSUM 生成每個句子的句子表示;其次,將句子表示與位置嵌入相加;再次,輸入星形 Transformer 進行文檔級編碼;最后,利用Sigmoid 函數(shù)對最后一層每個句子的輸出進行分類,從而得到文本摘要。星形 Transformer 由多個衛(wèi)星節(jié)點和一個星節(jié)點組成,構成一個全連接的星形結構。在此結構中,文本序列中第i個句子的特征由第i個衛(wèi)星節(jié)點的狀態(tài)表示。星形Transformer 包括環(huán)連接和基本連接兩種連接方式。衛(wèi)星節(jié)點通過類似雙向 RNN 的環(huán)狀連接從其鄰居節(jié)點收集信息(其中,第一個和最后一個衛(wèi)星節(jié)點相互連接),而星節(jié)點則通過基本連接從所有衛(wèi)星節(jié)點獲取信息。衛(wèi)星節(jié)點可以通過星節(jié)點以兩跳的方式實現(xiàn)信息的相互傳播。這種架構的優(yōu)點在于提高了計算效率和處理長期依賴關系的能力。然而,其缺點在于利用 BERTSUM生成句子向量表示,在處理長文本摘要時,BERTSUM 可能會截斷文本,從而導致信息丟失。

    3 基于 Transformer 編碼器的抽取式摘要算法

    本文所提抽取式摘要模型由一個基于RoBERTa-Large[18]的句子向量生成模型和一個基于 Transformer 編碼器的句分類模型組成,最后接入全連接層進行二分類,得到句子重要性,文本摘要則由重要句子組成,如圖1~2 所示。

    圖1 句向量生成模型Fig.1 Sentence vector generative model

    圖2 抽取式摘要模型結構Fig.2 Extractive summarization model

    3.1 基于預訓練語言模型的句子向量生成模型

    抽取式摘要實際上可以建模為序列標注任務,核心思想是對文本中每個句子進行二分類,0 表示不重要,1 表示重要,所有標簽為 1 的句子組成文本摘要。使用預訓練語言模型處理文本分類問題常見的方式是在文本前插入[CLS]詞元,并使用該詞元所對應的輸出進行全連接分類。但裁判文書屬于長文本,其長度普遍超過常見預訓練語言模型的單次輸入長度,如BERT(512 個 token),甚至會超過一些可以處理長文本的預訓練語言模型的單次輸入最大長度,如 Longformer[19](4 096 個 token),因此無法使用在每個句子前插入[CLS]詞元,并以[CLS]詞元作為句子分類特征的方式。本文所用方法將抽取式摘要分解為句向量生成模型和句分類模型。

    基于預訓練語言模型的句向量生成模型單次處理一個句子,將預訓練語言模型最后一層的輸出進行平均池化,得到句向量,最終裁判文書的表示為 。這種方式可以有效增加模型可處理文本長度,并減少內存需要,但無法對句向量生成模型進行微調。

    3.2 基于 Transformer 編碼器的句分類模型

    第 3.1 小節(jié)中用句子向量生成模型對每個句子單獨編碼,并不包含句子的上下文信息,而抽取式摘要需要考慮到上下文,因此不能直接對所生成的句向量進行分類。

    對于一個給定的句子來說,它的輸入表示由句子向量、位置嵌入及長度嵌入求和得到。句子向量代表句子所包含的基本語義信息。位置嵌入代表句子在裁判文書中的位置,其中,每個位置對應一個可訓練向量。長度嵌入表示當前句子所包含的長度信息,將句子長度按區(qū)間劃分,每一個長度區(qū)間對應同一個可訓練向量,計算方式如公式(1)所示。其中, 為句子長度;interval為區(qū)間間隔,一般取 5 或 10;idx為區(qū)間下標,對應長度嵌入中具體的一個可訓練向量。

    模型訓練過程分為 5 步:(1)將一個裁判文書中每個句子的句子向量、位置嵌入及長度嵌入求和,得到每個句子的輸入特征;(2)將裁判文書中所有句子輸入特征按順序拼接輸入由 Transformer 編碼器組成的文本級編碼器中;(3)通過多頭自注意力機制,從多維度融合句子上下文信息,生成句子的文本級表示;(4)通過全連接層對句子文本級表示進行二分類,得到句子重要性,0 表示不重要,1 表示重要;(5)計算損失,更新模型。句子輸入特征計算過程如公式(2)所示。

    4 實驗分析與評估

    4.1 數(shù)據集與評價指標

    本文使用 CAIL2020 摘要數(shù)據集作為實驗數(shù)據,該數(shù)據集共收錄 13 531 份一審民事判決書,涵蓋了侵權責任、借款合同、繼承合同、勞動合同、租賃合同等多種民事糾紛類別。樣本中的裁判文書預先以多個句子劃分,每個句子均有是否重要的標簽,同時提供與之對應的全文參考摘要。文書字數(shù)平均為 2 586 個,其中,最長的一篇達 14 413 個字,所有文本長度超過 512 個字,99.7% 的文書長度超過 1 024 個字,63.4% 的文書長度超過 2 048 個字。平均每個文書包含 57 個句子,最多的一份達 496 個句子。每篇文書平均抽取 12 個句子作為摘要,最多抽取 69 個句子。每個句子平均包含 44 個字,最長的一個句子長達 640 個字。文書摘要字數(shù)平均為 791 個字,最長的一個摘要長達 3 790 個字。數(shù)據集中共包含782 879 個句子,其中,171 745 個句子為重要句子,611 134 個句子為非重要句子,即正負樣本的比例為 1∶3.55。該數(shù)據集屬于長文本摘要數(shù)據集。

    數(shù)據集格式如表1 所示。其中,id 表示案例唯一標識;summary 字段表示人工總結的與文檔對應的全文參考摘要;text 字段是一個列表,按順序包含案例中每個句子,text 中的一個元素表示文本的一個帶標簽的句子,帶標簽的句子中包含 sentence 和 label;sentence 表示句子具體內容;label 表示這個句子是否重要,0 表示不重要,1 表示重要。本文所研究的方法為抽取式摘要算法,只用到 text 字段,summary 字段屬于生成式摘要所需標注的數(shù)據,對本文所研究方法作用不大,因此舍棄。

    表1 司法摘要數(shù)據集格式Table 1 Legal summarization dataset format

    鑒于將抽取任務轉化為對句子的分類任務,將F1作為評估指標,比精確率(Precision)和召回率(Recall)更能準確評價一個模型的好壞。F1指標如公式(10)所示。為了更好地與基線模型對比,本實驗還使用 ROUGE[20]指標,該指標包含多種度量摘要之間相似性的自動評估方法,是一種常用的文本摘要評價指標。ROUGE-N的召回率如公式(6)所示。

    其中,PredSums 為預測摘要。ROUGE-L 的計算公式如公式(8)和公式(9)所示。

    其中,LCS用于計算兩個字符串最長公共子串的長度;m為目標摘要長度;n為預測摘要長度。

    本實驗的實驗超參數(shù)說明如表2 所示。Max_sent_len 表示句子向量生成模型所能處理的最大句子長度。Seq_len 表示句子分類模型能處理的最大句子數(shù)量。Pos_weight 和 Neg_weight表示正例和負例的權重,由于數(shù)據集中摘要句子的正負例失衡,負例數(shù)量是正例的 3.55 倍,因此,設置正負例權重糾正偏差。Interval 表示長度間隔,模型通過長度間隔引入句子的長度信息,具體做法是將處于相同長度區(qū)間內的句子映射到同一個可訓練的長度嵌入,具體如公式(1)所示。Layer 表示句子分類模型中 Transformer 編碼器的層數(shù)。

    表2 實驗超參數(shù)Table 2 Hyperparameters in experiment

    4.2 實驗結果

    本文提出的模型將 RoBERTa-Large 作為句子編碼器,將多層 Transformer 編碼器結構作為句子分類模型,將抽取任務轉化為句子的分類任務,并且與無監(jiān)督 TextRank 基線模型進行了對比,證明了該模型的有效性。此外,本文在抽取式摘要模型中引入了與長度相關的特征,進一步提升了模型效果。實驗結果如表3~5 所示,與基線模型相比,本文提出的抽取式摘要模型在ROUGE-1、ROUGE-2 和 ROUGE-L 指標上均有明顯提升。

    表3 模型在不同長度間隔上實驗的結果Table 3 Experimental results of the model on differentlength intervals

    4.3 討論與分析

    經過數(shù)據分析發(fā)現(xiàn),句子長度信息對句子重要程度有一定影響,因此,本實驗引入了句子長度信息。具體方式是將文本長度位于相同區(qū)間的文本共享同一個可訓練向量,并在文本輸入階段與句子嵌入、句子位置融合,得到句子向量。實驗結果如表3 所示,表中結果為 Transformer 編碼器為 4 層的實驗結果。由表3 可知,加入長度信息后,F(xiàn)1指標有一定提升。長度間隔為 5時,F(xiàn)1提升 2.586%;長度間隔為 10 時,F(xiàn)1提升2.706%??梢钥闯?,句子長度信息是抽取句子所需的重要信息之一。

    為了選擇最優(yōu)的 Transformer 編碼器層數(shù),本研究進行了一系列實驗,針對 1~6 層分別計算了 Recall、Precision 和F1指標,結果如表4 所示。從表4 可以看出,隨著編碼器層數(shù)的增加,Precision 指標逐漸提高,而 Recall 指標則呈逐漸下降的趨勢。然而,F(xiàn)1指標與層數(shù)之間并沒有太大的相關性,這表明層數(shù)對模型的整體性能影響有限。在本實驗中,當編碼器層數(shù)為 4 時,模型在F1指標上取得了最佳效果。

    表4 模型在不同 Transformer 編碼器層數(shù)上實驗的結果Table 4 Experimental results of the model on differentTransformer encoder layers

    在與基線模型進行對比的實驗中,采用了ROUGE-1、ROUGE-2、ROUGE-L 指標,實驗結果詳見表5。其中,RoBERTa-Large-Transformer編碼器的 Transformer 層數(shù)為 4。

    表5 模型與基準模型的指標對比Table 5 Comparison of metrics between the model and the baseline model

    Lead-3 模型直接將文檔前 3 句話作為摘要,這種方式并不適用于重要信息比較均勻的法律文本,因此其指標并不高。

    TextRank 在選擇召回分數(shù)最高的 15 個句子時表現(xiàn)最佳。由表5 可知,與無監(jiān)督的 TextRank模型相比,RoBERTa-Large-Transformer 編碼器在3 個指標上均有較大提升。其中,ROUGE-1 的F1指標提升 16.44%;ROUGE-2 的F1指標提升21.87%;ROUGE-L 的F1指標提升 18.05%,3 個指標平均提升 18.79%。

    BERTSUM 模型是 BERT 在抽取式摘要中的首次應用。其具體做法是在句子之前插入[CLS]詞元,在句子之后插入[SEP]詞元,通過預訓練語言模型提取特征,根據[CLS]詞元對應的輸出預測句子的重要性。然而,這種方法的缺點是輸入長度受到預訓練語言模型的限制。例如,BERT 僅能輸入 512 個詞元,而即使 Longformer和 Lawformer 極大程度地增加了模型的可輸入長度,數(shù)據集中依舊有超過一半的數(shù)據超出其長度限制。本實驗采用了截斷的方式來處理超出長度限制的部分。

    基于 BERT 的 BERTSUM 模型在精確率方面具有較高的表現(xiàn),但由于信息截斷的影響,其召回率較低,因此,F(xiàn)1值相對較低。相反,基于 Longformer 的 BERTSUM 模型具有較高的召回率,但精確率偏低,同樣導致F1值較低。與基于 Longformer 的 BERTSUM 模型相比,RoBERTa-Large-Transformer 編碼器在 ROUGE-1的F1指標上提升了 22.58%;在 ROUGE-2 的F1指標上提升了 26.42%;在 ROUGE-L 的F1指標上提升了 23.08%,3 個指標的平均提升為24.03%。

    5 結 論

    本文針對中文裁判文書摘要任務提出一種基于 Transformer 編碼器的抽取式摘要模型。該模型首先通過預訓練語言模型采用平均池化的方式為每個句子生成句嵌入;然后通過 Transformer編碼器將句子嵌入、句子位置嵌入及句子長度嵌入融合;最后通過全連接網絡對句子表示進行分類,從而完成抽取式摘要任務。本文所提出模型避免了直接將長文本輸入模型導致超出預訓練語言模型的最大輸入長度的問題,從而極大程度地擴大了摘要模型可處理的文本長度。此外,抽取式摘要算法將句子長度以區(qū)間劃分,并進行映射,從而使模型可以考慮句子的長度信息,提升模型效果。本文所提出的抽取式摘要算法在ROUGE-1、ROUGE-2、ROUGE-L 指標上均遠超過基線模型。

    中文法律裁判文書的抽取式摘要任務仍處于早期探索階段,由于缺乏公開數(shù)據集,或是數(shù)據集中裁判文書種類不全,裁判文書屬于長文本,而常見的預訓練語言模型并不支持長文本等原因,該任務依然面臨著巨大挑戰(zhàn)。而從模型層面,長文本抽取式摘要仍有許多待解決的問題,例如:根據現(xiàn)在的分句標準,句子長度極其不均衡,一些句子長度過長,進行句子嵌入生成時,信息可能會被過度壓縮,導致語義信息丟失。而如果對句子進行更細致的分割,則又可能導致少部分文本句子數(shù)量過多,從而使得處于末尾部分的位置嵌入無法得到充分訓練,并會出現(xiàn)模型抽取少句子的文本效果好,而抽取多句子的文本效果差的情況。這些問題亟待進一步研究解決。

    猜你喜歡
    編碼器文書裁判
    太行山文書精品選(17)
    法官如此裁判
    法官如此裁判
    監(jiān)獄執(zhí)法文書規(guī)范探討
    法律裁判中的比較推理
    法律方法(2019年4期)2019-11-16 01:07:10
    黑水城出土《宋西北邊境軍政文書》中“砲”類文書再討論
    西夏學(2019年1期)2019-02-10 06:22:40
    清代刑事裁判中的“從重”
    法律史評論(2018年0期)2018-12-06 09:22:28
    基于FPGA的同步機軸角編碼器
    基于PRBS檢測的8B/IOB編碼器設計
    JESD204B接口協(xié)議中的8B10B編碼器設計
    電子器件(2015年5期)2015-12-29 08:42:24
    亚洲人成网站在线播| 90打野战视频偷拍视频| 好男人在线观看高清免费视频| 亚洲不卡免费看| 亚洲成av人片在线播放无| 国内精品美女久久久久久| www.色视频.com| 俄罗斯特黄特色一大片| 国产成人av教育| 国产精品久久电影中文字幕| 熟妇人妻久久中文字幕3abv| 美女大奶头视频| 一个人免费在线观看的高清视频| 女警被强在线播放| 小蜜桃在线观看免费完整版高清| 91字幕亚洲| www.999成人在线观看| 91在线精品国自产拍蜜月 | 国产真实伦视频高清在线观看 | 免费av毛片视频| 亚洲av第一区精品v没综合| 精品无人区乱码1区二区| 脱女人内裤的视频| 日韩人妻高清精品专区| 亚洲熟妇中文字幕五十中出| 国产亚洲精品久久久com| 亚洲精品乱码久久久v下载方式 | 国产成人av教育| 一级毛片女人18水好多| av在线蜜桃| 美女黄网站色视频| www.www免费av| 蜜桃久久精品国产亚洲av| 18+在线观看网站| 国产高清视频在线播放一区| 变态另类丝袜制服| 操出白浆在线播放| 免费观看精品视频网站| 欧美一区二区精品小视频在线| 久久久成人免费电影| 性色av乱码一区二区三区2| 51国产日韩欧美| 天堂网av新在线| av福利片在线观看| 欧美黄色片欧美黄色片| 青草久久国产| 国产在线精品亚洲第一网站| 三级男女做爰猛烈吃奶摸视频| 日韩 欧美 亚洲 中文字幕| 国产精品女同一区二区软件 | 国产成人影院久久av| 色综合欧美亚洲国产小说| 亚洲中文日韩欧美视频| 午夜福利18| 亚洲国产欧美人成| 日本撒尿小便嘘嘘汇集6| a级一级毛片免费在线观看| 亚洲中文字幕一区二区三区有码在线看| 国产欧美日韩一区二区三| 午夜亚洲福利在线播放| av片东京热男人的天堂| 国产熟女xx| 好男人电影高清在线观看| 天堂√8在线中文| 亚洲五月婷婷丁香| 亚洲人成网站高清观看| 国产免费一级a男人的天堂| 免费电影在线观看免费观看| 免费搜索国产男女视频| 欧美中文综合在线视频| 一个人看的www免费观看视频| 亚洲精品日韩av片在线观看 | 国产探花在线观看一区二区| 亚洲成人久久性| 久久中文看片网| 国产精品 国内视频| 亚洲av电影不卡..在线观看| 亚洲天堂国产精品一区在线| 国产视频一区二区在线看| 婷婷六月久久综合丁香| 啪啪无遮挡十八禁网站| 亚洲人成网站在线播| 少妇熟女aⅴ在线视频| av在线蜜桃| 十八禁网站免费在线| 日本一二三区视频观看| 国产探花在线观看一区二区| 久久欧美精品欧美久久欧美| 免费看美女性在线毛片视频| 国产v大片淫在线免费观看| 欧美绝顶高潮抽搐喷水| 国内揄拍国产精品人妻在线| 美女cb高潮喷水在线观看| 国产aⅴ精品一区二区三区波| 日本熟妇午夜| 婷婷六月久久综合丁香| 1024手机看黄色片| 在线播放无遮挡| 免费看a级黄色片| 国内毛片毛片毛片毛片毛片| 两人在一起打扑克的视频| 色综合婷婷激情| 久久久久亚洲av毛片大全| 最近视频中文字幕2019在线8| 两人在一起打扑克的视频| 又黄又粗又硬又大视频| 欧美bdsm另类| 嫁个100分男人电影在线观看| 国产 一区 欧美 日韩| 欧美区成人在线视频| 99热只有精品国产| 一本一本综合久久| 窝窝影院91人妻| 国产高清视频在线播放一区| 18禁美女被吸乳视频| 一卡2卡三卡四卡精品乱码亚洲| 亚洲欧美日韩东京热| 亚洲真实伦在线观看| 极品教师在线免费播放| 国产成人欧美在线观看| 成年版毛片免费区| 天堂√8在线中文| 午夜激情福利司机影院| 亚洲色图av天堂| 免费av毛片视频| 亚洲成av人片免费观看| 搡老熟女国产l中国老女人| 丁香欧美五月| 久久亚洲真实| 窝窝影院91人妻| 国产男靠女视频免费网站| 国产伦人伦偷精品视频| 日本三级黄在线观看| 在线观看免费视频日本深夜| 长腿黑丝高跟| 成年女人毛片免费观看观看9| 成人国产综合亚洲| 日本精品一区二区三区蜜桃| 狂野欧美白嫩少妇大欣赏| 搡老熟女国产l中国老女人| 国产不卡一卡二| 国模一区二区三区四区视频| 麻豆一二三区av精品| 最好的美女福利视频网| 国模一区二区三区四区视频| 亚洲国产欧美网| 国产真实伦视频高清在线观看 | 国产精品精品国产色婷婷| 性欧美人与动物交配| 免费无遮挡裸体视频| 免费电影在线观看免费观看| e午夜精品久久久久久久| 国产探花极品一区二区| 精品乱码久久久久久99久播| 97超级碰碰碰精品色视频在线观看| 日本熟妇午夜| 色吧在线观看| 国产亚洲欧美98| 日韩精品中文字幕看吧| 天堂√8在线中文| 热99re8久久精品国产| 久久精品亚洲精品国产色婷小说| 色噜噜av男人的天堂激情| 嫩草影院精品99| 久久久久九九精品影院| 亚洲第一欧美日韩一区二区三区| 国产亚洲精品一区二区www| 国产一级毛片七仙女欲春2| 亚洲精品成人久久久久久| 亚洲精品粉嫩美女一区| 俺也久久电影网| 国产v大片淫在线免费观看| av专区在线播放| av福利片在线观看| eeuss影院久久| 欧美一区二区国产精品久久精品| 亚洲成人久久爱视频| 国产综合懂色| 欧美三级亚洲精品| 国产精品,欧美在线| 亚洲七黄色美女视频| 美女 人体艺术 gogo| 两个人看的免费小视频| 夜夜看夜夜爽夜夜摸| 午夜福利欧美成人| 亚洲黑人精品在线| 亚洲天堂国产精品一区在线| 亚洲精品日韩av片在线观看 | 亚洲av五月六月丁香网| 午夜福利免费观看在线| 国产aⅴ精品一区二区三区波| 97碰自拍视频| 国产亚洲精品久久久com| 在线观看舔阴道视频| 久久婷婷人人爽人人干人人爱| 操出白浆在线播放| 中文亚洲av片在线观看爽| 亚洲av电影在线进入| 亚洲精品乱码久久久v下载方式 | 老师上课跳d突然被开到最大视频 久久午夜综合久久蜜桃 | 欧美+亚洲+日韩+国产| 91在线精品国自产拍蜜月 | 日韩欧美免费精品| 99热精品在线国产| 国产欧美日韩一区二区三| 国产中年淑女户外野战色| 欧美不卡视频在线免费观看| 亚洲精品粉嫩美女一区| 精品久久久久久成人av| 亚洲真实伦在线观看| 日韩高清综合在线| 成人高潮视频无遮挡免费网站| 午夜免费观看网址| 成熟少妇高潮喷水视频| 最好的美女福利视频网| 一本久久中文字幕| 激情在线观看视频在线高清| 丰满乱子伦码专区| 久久久久久久亚洲中文字幕 | 淫秽高清视频在线观看| 亚洲人成网站高清观看| av中文乱码字幕在线| 老鸭窝网址在线观看| 国产欧美日韩精品一区二区| 欧美黄色片欧美黄色片| 亚洲不卡免费看| 国产精品久久久久久亚洲av鲁大| 久久午夜亚洲精品久久| 亚洲va日本ⅴa欧美va伊人久久| 男女床上黄色一级片免费看| 高清在线国产一区| 亚洲专区中文字幕在线| 老鸭窝网址在线观看| 9191精品国产免费久久| 长腿黑丝高跟| 日韩欧美在线二视频| 久久精品人妻少妇| 毛片女人毛片| 国语自产精品视频在线第100页| 国产一区二区亚洲精品在线观看| 亚洲在线自拍视频| 婷婷六月久久综合丁香| 色综合欧美亚洲国产小说| 精品电影一区二区在线| 美女cb高潮喷水在线观看| 亚洲最大成人中文| 舔av片在线| 淫妇啪啪啪对白视频| eeuss影院久久| 三级毛片av免费| 三级男女做爰猛烈吃奶摸视频| 欧美性感艳星| a级一级毛片免费在线观看| 丰满的人妻完整版| 精品日产1卡2卡| 日韩免费av在线播放| 成人无遮挡网站| 亚洲一区二区三区不卡视频| 久久久国产精品麻豆| 中文在线观看免费www的网站| 日韩欧美精品v在线| 麻豆国产av国片精品| 少妇高潮的动态图| 一个人免费在线观看电影| 国产探花在线观看一区二区| 亚洲av免费在线观看| 欧美成人免费av一区二区三区| 亚洲 国产 在线| 久久久久九九精品影院| 在线观看66精品国产| 天美传媒精品一区二区| 久久精品国产综合久久久| 国产高清视频在线观看网站| 中文在线观看免费www的网站| 97人妻精品一区二区三区麻豆| 在线观看日韩欧美| 麻豆久久精品国产亚洲av| 夜夜爽天天搞| 亚洲最大成人中文| 男女之事视频高清在线观看| 91九色精品人成在线观看| 岛国视频午夜一区免费看| 色av中文字幕| 美女大奶头视频| 美女 人体艺术 gogo| 精品一区二区三区视频在线观看免费| 啪啪无遮挡十八禁网站| 少妇高潮的动态图| 欧美zozozo另类| 91在线观看av| a级毛片a级免费在线| 国产精品一区二区免费欧美| 一进一出好大好爽视频| 欧洲精品卡2卡3卡4卡5卡区| 欧美在线黄色| 亚洲精品456在线播放app | 欧美日韩黄片免| 久久亚洲真实| 网址你懂的国产日韩在线| 免费看美女性在线毛片视频| 久久久久免费精品人妻一区二区| 久久久久久国产a免费观看| 国产精品一区二区免费欧美| 亚洲,欧美精品.| 日本三级黄在线观看| 亚洲成人中文字幕在线播放| 成人鲁丝片一二三区免费| 在线观看av片永久免费下载| 国产精品美女特级片免费视频播放器| 999久久久精品免费观看国产| 中亚洲国语对白在线视频| 亚洲最大成人中文| 两个人视频免费观看高清| 欧美日本视频| av在线天堂中文字幕| 日日摸夜夜添夜夜添小说| 亚洲av美国av| 夜夜躁狠狠躁天天躁| 国产精品久久久人人做人人爽| 欧美极品一区二区三区四区| 97人妻精品一区二区三区麻豆| xxxwww97欧美| 人人妻人人澡欧美一区二区| 欧美色欧美亚洲另类二区| 亚洲 国产 在线| 99在线视频只有这里精品首页| 夜夜看夜夜爽夜夜摸| 18美女黄网站色大片免费观看| 欧美日韩瑟瑟在线播放| 亚洲av熟女| 欧美+日韩+精品| 黄色视频,在线免费观看| 窝窝影院91人妻| 亚洲熟妇中文字幕五十中出| 啦啦啦韩国在线观看视频| 久久久久久久久久黄片| 男女那种视频在线观看| 99热只有精品国产| 欧美一级a爱片免费观看看| 久久中文看片网| 天堂影院成人在线观看| 色吧在线观看| 欧美一级a爱片免费观看看| 黄片小视频在线播放| 黄色丝袜av网址大全| 一区福利在线观看| 国产久久久一区二区三区| av欧美777| 91麻豆av在线| 少妇丰满av| 91麻豆av在线| 久久精品夜夜夜夜夜久久蜜豆| 亚洲第一欧美日韩一区二区三区| 午夜福利欧美成人| 国产精品 欧美亚洲| 国产精品香港三级国产av潘金莲| 内地一区二区视频在线| 草草在线视频免费看| 色av中文字幕| 国产精品久久久人人做人人爽| 法律面前人人平等表现在哪些方面| 一级a爱片免费观看的视频| 女人被狂操c到高潮| 午夜福利18| 欧美中文日本在线观看视频| 中文字幕人成人乱码亚洲影| 蜜桃久久精品国产亚洲av| 最新中文字幕久久久久| 丰满人妻熟妇乱又伦精品不卡| 99久久精品热视频| 老师上课跳d突然被开到最大视频 久久午夜综合久久蜜桃 | АⅤ资源中文在线天堂| 国产av麻豆久久久久久久| 国产一区二区激情短视频| 日日夜夜操网爽| 天堂√8在线中文| 免费人成在线观看视频色| 床上黄色一级片| 国产精品野战在线观看| 天天添夜夜摸| 好看av亚洲va欧美ⅴa在| 免费看美女性在线毛片视频| www日本在线高清视频| 噜噜噜噜噜久久久久久91| 亚洲国产日韩欧美精品在线观看 | 麻豆成人av在线观看| 嫩草影院入口| 久久久久国产精品人妻aⅴ院| 丝袜美腿在线中文| 在线观看免费视频日本深夜| 亚洲欧美日韩高清专用| 成人国产一区最新在线观看| 少妇人妻精品综合一区二区 | 免费看a级黄色片| 欧美丝袜亚洲另类 | 成人永久免费在线观看视频| 亚洲欧美一区二区三区黑人| 黄色成人免费大全| 久久九九热精品免费| 免费在线观看影片大全网站| 国产成人av教育| av天堂在线播放| 国产中年淑女户外野战色| 日本五十路高清| 国产97色在线日韩免费| 亚洲成人中文字幕在线播放| 成熟少妇高潮喷水视频| 搡女人真爽免费视频火全软件 | 国产一区二区在线观看日韩 | 日韩欧美精品v在线| 国产精品久久久久久久久免 | 女生性感内裤真人,穿戴方法视频| 麻豆一二三区av精品| 舔av片在线| 91在线观看av| 99国产精品一区二区蜜桃av| 欧美区成人在线视频| 成年人黄色毛片网站| 精品一区二区三区人妻视频| 18禁黄网站禁片午夜丰满| 亚洲精品一区av在线观看| 又爽又黄无遮挡网站| www日本黄色视频网| 亚洲久久久久久中文字幕| 免费av毛片视频| 欧美一级a爱片免费观看看| 国产一区二区亚洲精品在线观看| 久久久久免费精品人妻一区二区| 免费搜索国产男女视频| 999久久久精品免费观看国产| 亚洲成人久久爱视频| 亚洲精品一区av在线观看| 99久国产av精品| 草草在线视频免费看| 国产高清三级在线| 成人特级av手机在线观看| 国产午夜精品论理片| 欧美成人性av电影在线观看| 女同久久另类99精品国产91| 午夜精品久久久久久毛片777| 内射极品少妇av片p| 一夜夜www| 波野结衣二区三区在线 | 亚洲av二区三区四区| 午夜老司机福利剧场| 亚洲一区二区三区色噜噜| 三级毛片av免费| 成人三级黄色视频| 中文在线观看免费www的网站| 亚洲熟妇熟女久久| 国产亚洲精品一区二区www| 91久久精品国产一区二区成人 | 欧美在线一区亚洲| 日韩中文字幕欧美一区二区| 在线免费观看不下载黄p国产 | 日韩精品青青久久久久久| 国产成人欧美在线观看| 午夜免费观看网址| 成人欧美大片| а√天堂www在线а√下载| 黄色日韩在线| 精品一区二区三区视频在线 | 国产成人啪精品午夜网站| 欧美黄色片欧美黄色片| 亚洲成av人片在线播放无| 69av精品久久久久久| 在线a可以看的网站| 午夜精品久久久久久毛片777| 亚洲真实伦在线观看| 精品久久久久久成人av| 免费高清视频大片| 9191精品国产免费久久| 亚洲精华国产精华精| 国内精品美女久久久久久| 亚洲欧美激情综合另类| 国产精品香港三级国产av潘金莲| 淫妇啪啪啪对白视频| 亚洲性夜色夜夜综合| 欧美激情久久久久久爽电影| 禁无遮挡网站| 人人妻,人人澡人人爽秒播| 老司机福利观看| 欧美黄色片欧美黄色片| 亚洲国产日韩欧美精品在线观看 | 一区二区三区高清视频在线| 老司机午夜福利在线观看视频| 精品国产美女av久久久久小说| 免费在线观看日本一区| 51午夜福利影视在线观看| 国产老妇女一区| 操出白浆在线播放| 欧美bdsm另类| 免费人成在线观看视频色| 一个人免费在线观看电影| 99视频精品全部免费 在线| 欧美日韩一级在线毛片| 国产一区在线观看成人免费| 亚洲av成人精品一区久久| 欧美性猛交╳xxx乱大交人| 欧美日韩精品网址| 一级作爱视频免费观看| 3wmmmm亚洲av在线观看| 免费观看精品视频网站| 亚洲欧美一区二区三区黑人| 欧美日韩黄片免| 国产69精品久久久久777片| 免费av毛片视频| 国产欧美日韩精品一区二区| 69av精品久久久久久| 人妻夜夜爽99麻豆av| 狂野欧美激情性xxxx| 色吧在线观看| 欧美日韩国产亚洲二区| 18禁裸乳无遮挡免费网站照片| 此物有八面人人有两片| 国产久久久一区二区三区| 国产精品三级大全| 欧美激情久久久久久爽电影| 99精品久久久久人妻精品| 搡老岳熟女国产| 午夜精品一区二区三区免费看| 观看美女的网站| 99视频精品全部免费 在线| 久久久久性生活片| 国产伦精品一区二区三区视频9 | 免费高清视频大片| 少妇熟女aⅴ在线视频| 真人一进一出gif抽搐免费| 国产成人系列免费观看| 国产色婷婷99| 69人妻影院| 我的老师免费观看完整版| 狂野欧美激情性xxxx| 中文字幕人妻丝袜一区二区| 亚洲欧美日韩东京热| 欧美色视频一区免费| 精华霜和精华液先用哪个| 男女那种视频在线观看| 国产黄色小视频在线观看| 不卡一级毛片| 人妻久久中文字幕网| АⅤ资源中文在线天堂| 婷婷亚洲欧美| 狂野欧美白嫩少妇大欣赏| 久久99热这里只有精品18| 小蜜桃在线观看免费完整版高清| 欧美xxxx黑人xx丫x性爽| 此物有八面人人有两片| 一本精品99久久精品77| 国产精品精品国产色婷婷| 一区二区三区激情视频| 色视频www国产| 深夜精品福利| 岛国在线观看网站| 国产成人aa在线观看| 热99在线观看视频| 99久久99久久久精品蜜桃| 欧美成人一区二区免费高清观看| 免费看a级黄色片| 99热这里只有是精品50| av视频在线观看入口| 在线观看av片永久免费下载| www.熟女人妻精品国产| 18禁在线播放成人免费| 亚洲一区二区三区色噜噜| 午夜福利成人在线免费观看| 国产一区二区激情短视频| 免费av不卡在线播放| 国内精品久久久久久久电影| 色吧在线观看| 亚洲最大成人中文| bbb黄色大片| 国产蜜桃级精品一区二区三区| 在线观看舔阴道视频| 亚洲成av人片免费观看| 男人舔女人下体高潮全视频| 中文字幕av在线有码专区| 中国美女看黄片| 色在线成人网| 日日夜夜操网爽| 欧美xxxx黑人xx丫x性爽| 亚洲美女黄片视频| 精品国内亚洲2022精品成人| 亚洲黑人精品在线| 国产av在哪里看| 高潮久久久久久久久久久不卡| 日韩av在线大香蕉| av天堂在线播放| 亚洲在线观看片| 一个人观看的视频www高清免费观看| 嫩草影视91久久| 真实男女啪啪啪动态图| 女人十人毛片免费观看3o分钟| 亚洲专区中文字幕在线| 老师上课跳d突然被开到最大视频 久久午夜综合久久蜜桃 | 99久久无色码亚洲精品果冻| 人人妻,人人澡人人爽秒播| 国产成人a区在线观看| 岛国在线免费视频观看| 久久欧美精品欧美久久欧美| 亚洲人成网站高清观看| 99久久无色码亚洲精品果冻| 2021天堂中文幕一二区在线观| 天堂网av新在线| 日本 欧美在线| 日韩成人在线观看一区二区三区| 国产av麻豆久久久久久久| 最后的刺客免费高清国语| 欧美在线黄色| 亚洲午夜理论影院| 免费观看的影片在线观看| 国产不卡一卡二| 久久久久免费精品人妻一区二区| 麻豆成人午夜福利视频| 久久久久久久久大av|