• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于指代消解的漢語句群自動(dòng)劃分方法

    2017-09-01 15:54:43王榮波孫小雪黃孝喜劉和平
    關(guān)鍵詞:指代代詞語料

    王榮波,孫小雪,黃孝喜,劉和平

    (1.杭州電子科技大學(xué) 計(jì)算機(jī)學(xué)院,浙江 杭州 310018;2.浙江大學(xué) 軟件學(xué)院,浙江 杭州 310000)

    基于指代消解的漢語句群自動(dòng)劃分方法

    王榮波1,孫小雪1,黃孝喜1,劉和平2

    (1.杭州電子科技大學(xué) 計(jì)算機(jī)學(xué)院,浙江 杭州 310018;2.浙江大學(xué) 軟件學(xué)院,浙江 杭州 310000)

    漢語句群自動(dòng)劃分是將篇章劃分成包含不同主題的文本片段,在信息提取、文摘生成、語篇理解及其他多個(gè)領(lǐng)域有著極為重要的應(yīng)用。指代消解是識(shí)別篇章中先行詞和照應(yīng)詞關(guān)聯(lián)起來的過程,消解不同表達(dá)是自然語言理解的基礎(chǔ)之一。針對(duì)目前的句群劃分工作的重點(diǎn)在于劃分出主題之間的邊界而較少利用其本身指代關(guān)系來進(jìn)行語言理解,或者因指代模糊而得到錯(cuò)誤的劃分結(jié)果的問題,提出了一種基于指代消解的句群自動(dòng)劃分方法。該方法從對(duì)篇章的指代情況消解出發(fā),利用適合中文的多層過濾指代消解方法得到指代鏈信息,以消除不同名詞代表相同實(shí)體、代詞指代不明的問題。結(jié)合指代鏈信息,并同時(shí)考慮篇章銜接詞因素,設(shè)計(jì)并進(jìn)行了基于多元判別分析(Multiple Discriminate Analysis,MDA)的一組評(píng)價(jià)函數(shù)J評(píng)價(jià)句群劃分驗(yàn)證實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,所提出的方法能夠有效地進(jìn)行句群自動(dòng)劃分,統(tǒng)計(jì)正確分割平均Pμ提高了7%左右。

    句群劃分;指代消解;多層過濾;多元判別分析

    1 概 述

    在中文信息處理技術(shù)的發(fā)展過程中,人們發(fā)現(xiàn)傳統(tǒng)的中文語法單位“詞語”、“句子”能夠承載的信息量太小,而“段落”、“篇章”承載的信息量又太大。根據(jù)漢語本身的意合特點(diǎn),語義相關(guān)的內(nèi)容通常會(huì)出現(xiàn)在同一片段內(nèi),要完全理解一個(gè)句子的含義往往需要充分利用其上下文信息[1],因而將篇章段落劃分為不同的句群是篇章理解的重中之重。自然語言中還存在大量的指代現(xiàn)象,篇章理解的另外一個(gè)工作就是指代消解,指代消解可以有效避免“一詞多義”和“多詞同義”的問題。指代消解連接了指代詞和先行語,明確了代詞以及有歧義的名詞指向,句群為其內(nèi)的句子提供了可靠的上下文語境,句群劃分結(jié)合指代消解在篇章分析、機(jī)器翻譯、自動(dòng)文摘領(lǐng)域有重要作用[2-3]。

    漢語句群自動(dòng)劃分是將篇章劃分成包含不同主題的文本片段,指代消解是將篇章中的先行詞和照應(yīng)詞關(guān)聯(lián)起來的過程,消解不同表達(dá)是自然語言理解的基礎(chǔ)之一。目前漢語句群的自動(dòng)劃分方法研究主要分為兩種:基于規(guī)則的漢語句群劃分方法和基于文本信息的句群劃分方法。研究者對(duì)句群這一語法單位的相關(guān)研究比較少,也不夠深入,相比較而言,他們更加注重句子、段落這種存在天然分割點(diǎn)的語法單位,或者是在研究句群劃分時(shí)忽略了語言本身的指代結(jié)構(gòu)、關(guān)聯(lián)詞等問題,從而得到不夠準(zhǔn)確的句群劃分。

    張全等[4]根據(jù)漢語篇章句群本身的語義關(guān)聯(lián)性和接應(yīng)、組合規(guī)律制定了句群劃分的相關(guān)規(guī)則;在概念層次網(wǎng)絡(luò)(HNC)語境觀的指導(dǎo)下,通過對(duì)領(lǐng)域句類知識(shí)的研究,闡述了一種新型的句群處理方法[5]。韋向峰等[6]根據(jù)HNC理論,認(rèn)為句群領(lǐng)域分析是句群分析的關(guān)鍵,通過研究自動(dòng)獲取句群的領(lǐng)域或語境信息得到句群。但是上述基于HNC概念的研究工作會(huì)受到相對(duì)固定的領(lǐng)域知識(shí)或者判定規(guī)則的限制。

    句子完整含義的理解需要有較為全面的上下文。陳怡疆等[1]認(rèn)為,如果上下文信息量太少,那么很多有用的信息就會(huì)丟失,將得不到句子全部的含義,但是如果信息量太大,又會(huì)造成搜索空間過大和數(shù)據(jù)稀疏問題,因而表示這個(gè)合適的大小不是句子或者段落,而是句群,是包含一個(gè)意義完整的主題的一組句子。他們提出了一種利用局部重現(xiàn)度較高的詞作為特征的層次聚類算法,將篇章表示成一棵句群樹,葉子節(jié)點(diǎn)為單個(gè)句子,內(nèi)部節(jié)點(diǎn)就是一個(gè)多重句群,但是并未考慮篇章指代詞的作用。李杰等[7]提出一種基于多元判別分析的漢語句群自動(dòng)劃分方法,是一種明確可計(jì)算的模型。算法通過Skip-Gram Model獲取句子的特征向量,與傳統(tǒng)VSM相比,減少了數(shù)據(jù)稀疏,再考慮句群內(nèi)部距離、句群間距離、切分片段長度和篇章銜接詞等因素,設(shè)計(jì)基于MDA方法的評(píng)價(jià)函數(shù)J,通過比較J的值獲得句群劃分結(jié)果,但僅僅考慮了句首指代詞。

    針對(duì)現(xiàn)有的句群劃分缺少指代消解的情況,在已有基于多元判別分析(MDA)的句群劃分方法的基礎(chǔ)上,通過引入指代消解來優(yōu)化漢語句群的自動(dòng)劃分?;静襟E為:利用適合中文的多層過濾指代消解模型獲取中文語料指代消解的結(jié)果[8];通過Skip-Gram Model獲取句子的特征向量;設(shè)計(jì)明確可計(jì)算的基于MDA的評(píng)價(jià)函數(shù)J,加入指代因素、考慮關(guān)聯(lián)詞的作用,實(shí)現(xiàn)對(duì)段落的切分并對(duì)所有的劃分結(jié)果進(jìn)行評(píng)價(jià);評(píng)價(jià)值最高的句群劃分序列為該段落的最佳句群劃分結(jié)果。實(shí)驗(yàn)結(jié)果表明,加入指代消解后指代鏈信息提高了句群劃分的效果,與傳統(tǒng)MDA方法的結(jié)果對(duì)比,Pu提升約9%,WindowDiff降低約1%;與未加入指代消解的相同方法相比Pu提升約7%。

    2 基于指代消解的漢語句群自動(dòng)劃分方法

    2.1 指代消解的處理

    中文指代消解的研究發(fā)展較為緩慢,主流方法主要有三類:基于無監(jiān)督的方法、基于有監(jiān)督的方法和基于規(guī)則的層次過濾的方法。因?yàn)榛跓o監(jiān)督的指代消解方法不依賴標(biāo)注好的語料庫,所以一度盛行。隨著中文語料庫的發(fā)展,基于有監(jiān)督的指代消解方法以其較高的消解準(zhǔn)確率取得一席之地。然而,基于有監(jiān)督的指代消解方法在提取的特征向量中存在一些消解正確率較低的特征,該類特征會(huì)覆蓋消解正確率較高的特征,從而影響模型的消解正確率?;谝?guī)則的層次過濾模型不需要標(biāo)注好的語料庫,而且模型的各個(gè)層次按照消解精度從高到低排列,不會(huì)出現(xiàn)消解正確率低的特征覆蓋消解正確率高的特征的現(xiàn)象,因此該方法會(huì)獲得更好的消解效果,也比較適合中文的指代消解[9]。

    按照基于規(guī)則的層次過濾指代消解的思想,該模塊的系統(tǒng)框架分為三部分:預(yù)處理、待消解項(xiàng)識(shí)別、指代消解處理[10-11]。

    (1)預(yù)處理:對(duì)語料進(jìn)行分詞,詞性標(biāo)注,命名實(shí)體識(shí)別和句法分析,句法分析結(jié)果由Stanford Parser處理得到。根據(jù)相應(yīng)的語言學(xué)規(guī)則從句法分析結(jié)果抽取出候選待消解項(xiàng),包括名詞、名詞短語和代詞。

    (2)待消解項(xiàng)識(shí)別:待消解項(xiàng)識(shí)別的精度對(duì)整個(gè)指代消解模型的精度產(chǎn)生了極大影響,并且丟失待消解項(xiàng)比錯(cuò)分指代鏈更影響消解模型的精度。待消解項(xiàng)識(shí)別分為兩部分:擴(kuò)充階段,提取所有的名詞和名詞短語,盡量保證不會(huì)丟失待消解項(xiàng);過濾階段,去除一些無需消解的停用詞,沒有意義的時(shí)間,數(shù)詞,金錢等詞匯,過濾重復(fù)詞,在保證一定召回率的同時(shí),提高待消解項(xiàng)識(shí)別的正確率[12]。

    (3)指代消解處理:字符串完全匹配,別名匹配和同位語對(duì)名詞短語的指代消解貢獻(xiàn)達(dá)到了97%[13],而代詞指代消解是篇章指代消解的一個(gè)關(guān)鍵。因此,設(shè)置四個(gè)層次,將各個(gè)過濾層次按照消解正確率從高到低排列,名詞短語和代詞通過層次過濾尋找其先行語。各個(gè)層次過濾模塊如表1所示。

    ●完全字符串匹配。

    若兩個(gè)字符串完全相同,則認(rèn)為這兩個(gè)名詞短語指向同一個(gè)實(shí)體。該層的準(zhǔn)確率最高。

    表1 指代消解各層過濾模塊

    ●別名匹配。

    若一個(gè)字符串是另外一個(gè)的子串或抽取子串,則說明它們之間有別名關(guān)系,是指向的同一個(gè)實(shí)體。例如:“普京”是“弗拉基米爾·弗拉基米羅維奇·普京”的子串,“中國”是“中華人民共和國”的抽取子串。

    ●同位語。

    若兩個(gè)短語之間有同位語關(guān)系,則說明他們指向相同。同位語的定義是一個(gè)名詞(或其他形式)對(duì)另一個(gè)名詞或代詞進(jìn)行解釋或補(bǔ)充說明,這個(gè)名詞(或其他形式)就是同位語。

    ●代詞匹配層。

    代詞指代是指代的重點(diǎn)和難點(diǎn)。這層是解決代詞和名詞或名詞短語之間是否具有指代關(guān)系,主要通過判斷單復(fù)數(shù)匹配關(guān)系、性別是否一致、有無生命,還有根據(jù)命名實(shí)體結(jié)果分為組織、地點(diǎn)、人名、雜項(xiàng)等的匹配。

    基于指代消解的漢語句群劃分方法整體框架如圖1所示。

    圖1 基于指代消解的漢語句群劃分方法整體框架圖

    2.2 句群劃分模型

    句群,顧名思義就是若干句子的組合,它們描述同一個(gè)中心,意義完整,句子的組合有一定的邏輯順序[14]。句群劃分主要依據(jù)語言本身的特點(diǎn)和組合規(guī)律。句群劃分實(shí)例如圖2所示。句群1中的“它”是一個(gè)指代詞,指代白楊樹,通過指代關(guān)系的確認(rèn)可以很好地消解詞語的二義性,對(duì)以后衡量類內(nèi)距離有重要作用;句群2揭示了其組合規(guī)律,用“難道”開頭的四個(gè)反問句表達(dá)了對(duì)北方軍民的贊頌,是一種遞進(jìn)關(guān)系,第④句中存在銜接詞“但是”,代表轉(zhuǎn)折關(guān)系,如果切分出來必然不合理,需要對(duì)這種切分結(jié)果進(jìn)行懲罰。

    圖2 句群劃分實(shí)例

    根據(jù)漢語表達(dá)習(xí)慣,一個(gè)句子可以獨(dú)立地表達(dá)一個(gè)完整的意思,相似的內(nèi)容一般出現(xiàn)在同一片段內(nèi),段落是一個(gè)意義完整性的天然分割點(diǎn)。但一個(gè)段落中可能包含不同的主題,所以句群的劃分以句子為基本單位進(jìn)行,在一個(gè)段落中劃分出不同主題的句子群。

    MDA是一種獨(dú)立于具體領(lǐng)域的文本線性分割統(tǒng)計(jì)模型方法,可以通過定義評(píng)價(jià)函數(shù)實(shí)現(xiàn)對(duì)句群劃分的全局評(píng)價(jià)[15]。具體是對(duì)句子向量構(gòu)成的數(shù)據(jù)空間進(jìn)行劃分,考慮句群內(nèi)部距離、句群之間距離、切分片段長度、指代因素以及篇章銜接詞因素,設(shè)計(jì)基于MDA的評(píng)價(jià)函數(shù)J,使函數(shù)J值取得最大的劃分即為最優(yōu)劃分結(jié)果。

    設(shè)最優(yōu)劃分結(jié)果為D,則:

    (1)

    其中,Sw為類內(nèi)離散矩陣;Sb為類間離散矩陣;SL為切分片段長度懲罰因子;Sc為指代因子;Sd為篇章銜接詞懲罰因子。

    (1)句群內(nèi)部距離與句群間距離。

    句群內(nèi)部的緊湊性和句群間的離散性是重要特點(diǎn)。類內(nèi)離散矩陣可用于衡量句群內(nèi)部的內(nèi)聚程度。

    (2)切分片段長度因素。

    當(dāng)劃分模式切分出連續(xù)的單句時(shí),需要對(duì)結(jié)果進(jìn)行懲罰。

    (3)指代因素。

    消除代詞的指代不明和實(shí)體的不同名詞短語表達(dá)問題是計(jì)算機(jī)理解自然語言的基礎(chǔ)。這里將指代消解后的指代鏈信息加入評(píng)價(jià)函數(shù)J。

    (4)篇章銜接詞因素。

    句子之間在表達(dá)形式上也會(huì)顯示出其連貫性。建立篇章銜接詞表Dict,包含“而”、“并且”等詞。

    3 實(shí)驗(yàn)測(cè)試

    3.1 實(shí)驗(yàn)語料與測(cè)評(píng)

    (1)語料設(shè)置。

    目前還沒有一個(gè)公開、通用的中文句群劃分評(píng)測(cè)語料,為了驗(yàn)證指代消解對(duì)句群劃分的影響,取與文獻(xiàn)[7]相同的實(shí)驗(yàn)語料—《讀書》雜志(1979-1983),共50期,人工標(biāo)注了其劃分結(jié)果,分割片段的平均句子數(shù)為3,段落的平均句子數(shù)為9,文獻(xiàn)作者通過計(jì)算Kappa值說明了語料的相對(duì)一致可靠性。

    首先對(duì)原語料進(jìn)行指代消解處理,得到指代鏈信息,對(duì)位于同一指代鏈上的名詞、名詞短語或者代詞進(jìn)行一定規(guī)則的替換。之后進(jìn)行句群自動(dòng)劃分的處理,分詞后使用詞向量訓(xùn)練工具word2vec獲取詞語在低維空間中的向量表示,再對(duì)形成的數(shù)據(jù)空間進(jìn)行劃分,通過評(píng)價(jià)函數(shù)J得到最優(yōu)劃分結(jié)果。

    (2)測(cè)評(píng)指標(biāo)。

    傳統(tǒng)的評(píng)價(jià)方式(準(zhǔn)確率和召回率)主要是考慮絕對(duì)匹配的情況,而在句群劃分中,這一評(píng)價(jià)方式不再適合。為此,采用文本分割中常用的Pu[16]和WindowDiff[17]評(píng)價(jià)方法。

    Pu通過計(jì)算任意兩個(gè)句子是否被算法正確劃分為同一片段的概率,分割點(diǎn)距離正確的分割點(diǎn)越近,Pu評(píng)價(jià)值越高。計(jì)算公式如下:

    (2)

    WindowDiff對(duì)不正確的分割點(diǎn)做出懲罰,即“正錯(cuò)誤”和“負(fù)錯(cuò)誤”?!罢e(cuò)誤”是指在實(shí)驗(yàn)中多做了分割,“負(fù)錯(cuò)誤”是指在實(shí)驗(yàn)中遺漏了分割。WindowDiff值越小,說明分割結(jié)果越好。計(jì)算公式如下:

    b(hypi,hypi+k)|>0)

    (3)

    其中,b(i,j)為相應(yīng)劃分模式下位置i和位置j直接的切分點(diǎn)的數(shù)量;k為平均切分片段句子數(shù)的1/2。

    3.2 實(shí)驗(yàn)結(jié)果及分析

    (1)實(shí)驗(yàn)結(jié)果。

    指代消解性能見表2。其中,P(正確率)=正確識(shí)別的個(gè)體數(shù)/識(shí)別出的個(gè)體總數(shù);R(召回率)=正確識(shí)別的個(gè)體總數(shù)/測(cè)試集中存在的個(gè)體總數(shù);F=準(zhǔn)確率*召回率*2/(準(zhǔn)確率+召回率)。

    表2 基于層次過濾的指代消解性能

    表3展示了對(duì)文本進(jìn)行指代消解后的句群劃分在不同維度下評(píng)價(jià)函數(shù)J的實(shí)驗(yàn)結(jié)果,統(tǒng)計(jì)正確分割的平均Pu值為91.26%,統(tǒng)計(jì)錯(cuò)誤分割的平均WindowDiff值為27.26%,從100~300維,Pu值略有提升、WindowDiff值下降,而在400維,Pu下降、WindowDiff上升。

    表3 不同維度下評(píng)價(jià)函數(shù)J的實(shí)驗(yàn)結(jié)果 %

    表4展示了加入指代消解和未加入指代消解的基于MDA的漢語句群自動(dòng)劃分方法的比較結(jié)果,Pu提升約7%,WindowDiff提升約2%。

    表4 加入和未加入指代消解的基于MDA的漢語句群自動(dòng)劃分方法對(duì)比 %

    表5展示了文中方法與傳統(tǒng)MDA方法的結(jié)果對(duì)比,Pu提升9%,WindowDiff降低1%。其中傳統(tǒng)MDA方法的評(píng)價(jià)函數(shù)J'通過衡量類內(nèi)離散矩陣、類間離散矩陣和切分片段長度得到。實(shí)驗(yàn)結(jié)果表明,指代因素Sc和篇章銜接詞因素Sd起到了一定的作用。

    表5 文中方法與傳統(tǒng)MDA方法的比較 %

    (2)實(shí)驗(yàn)分析。

    加入指代消解后,顯著提高了句群劃分的效果,統(tǒng)計(jì)平均正確分割Pu有一定程度的提升,統(tǒng)計(jì)錯(cuò)誤的平均分割WindowDiff有所下降。對(duì)句群劃分加入指代消解的處理消除了代詞指代不明、不同名字實(shí)則相同實(shí)體的情況,是篇章理解的重要因素,在后續(xù)衡量句群內(nèi)部的緊湊性和句群之間的離散性中發(fā)揮了重要作用。漢語篇章表述中,代詞指代是文本中數(shù)量較多的指代形式,而另外三種指代形式則出現(xiàn)較少,所以代詞指代對(duì)句群劃分的貢獻(xiàn)度最大,而因?yàn)橥耆址ヅ洹e名匹配、同位語匹配這三層準(zhǔn)確率達(dá)到97%左右,因此也很好地涵蓋了其他形式的指代情況。

    通過Skip-Gram Model訓(xùn)練大規(guī)模語料獲取詞語在低維實(shí)數(shù)空間向量表示,通過挖掘深層語義信息獲取文本表面的聯(lián)系,通過表3說明并不是維度越高越好,Pu值與維度并不是線性關(guān)系。

    由表4知,加入指代消解較未加入指代消解的Pu值提升明顯,說明加入指代消解后劃分句群的算法得到的切割點(diǎn)較接近實(shí)際的切割點(diǎn),而WindowDiff值也較未加入指代消解的大,WindowDiff是對(duì)“正錯(cuò)誤”和“負(fù)錯(cuò)誤”的衡量,說明分割算法在這方面是有缺陷的。

    4 結(jié)束語

    為了在篇章理解的基礎(chǔ)上優(yōu)化漢語句群自動(dòng)劃分,提出一種基于指代消解的句群自動(dòng)劃分方法。該方法在MDA句群劃分法的基礎(chǔ)上,從語料名詞、名詞短語、代詞的指代消解出發(fā),進(jìn)而實(shí)現(xiàn)漢語句群的自動(dòng)劃分?;谠摲椒?gòu)建了自動(dòng)劃分系統(tǒng),并實(shí)現(xiàn)了基于指代消解的句群劃分。實(shí)驗(yàn)結(jié)果表明,與傳統(tǒng)MDA方法對(duì)比,Pu提升約9%,WindowDiff降低約1%;與未加入指代消解進(jìn)行對(duì)比,Pu提升約7%。表明該方法有效可行。

    [1] 陳怡疆,史曉東,周昌樂.Automatic partition of Chinese sentence group[J].Journal of Donghua University:English Edition,2010,27(2):177-180.

    [2] 劉福君.基于指代消解的自動(dòng)文摘研究[D].合肥:安徽大學(xué),2012.

    [3] 石 晶.文本分割綜述[J].計(jì)算機(jī)工程與應(yīng)用,2006,42(35):155-159.

    [4] 吳 晨,張 全.自然語言處理中句群劃分及其判定規(guī)則研究[J].計(jì)算機(jī)工程,2007,33(4):157-159.

    [5] 韋向峰,繆建明,張 全,等.基于概念基元的句群情景框架抽取研究[J].微計(jì)算機(jī)應(yīng)用,2010,31(4):21-24.

    [6] 韋向峰,繆建明,張 全.漢語句群領(lǐng)域的自動(dòng)抽取研究[J].計(jì)算機(jī)工程與應(yīng)用,2009,45(4):11-15.

    [7] 王榮波,李 杰,黃孝喜,等.基于多元判別分析的漢語句群自動(dòng)劃分方法[J].計(jì)算機(jī)應(yīng)用,2015,35(5):1314-1319.

    [8] 周炫余,劉 娟,盧 笑.篇章中指代消解研究綜述[J].武漢大學(xué)學(xué)報(bào):理學(xué)版,2014,60(1):24-36.

    [9] 周炫余,劉 娟,羅 飛,等.中文指代消解模型的對(duì)比研究[J].計(jì)算機(jī)科學(xué),2016,43(2):31-34.

    [10] Raghunathan K,Lee H,Rangarajan S,et al.A multi-pass sieve for coreference resolution[C]//Conference on empirical methods in natural language processing.Mit Stata Center,Massachusetts,USA:A Meeting of Sigdat,A Special Interest Group of the ACL,2010:492-501.

    [11] Lee H,Peirsman Y,Chang A,et al.Stanford's multi-pass sieve coreference resolution system at the CoNLL-2011 shared task[C]//Proceedings of the fifteenth conference on computational natural language learning:shared task.[s.l.]:Association for Computational Linguistics,2011:28-34.

    [12] 孔 芳,朱巧明,周國棟.中英文指代消解中待消解項(xiàng)識(shí)別的研究[J].計(jì)算機(jī)研究與發(fā)展,2012,49(5):1072-1085.

    [13] 高俊偉,孔 芳,朱巧明,等.基于SVM的中文名詞短語指代消解研究[J].計(jì)算機(jī)科學(xué),2012,39(10):231-234.

    [14] 梅漢成.現(xiàn)代漢語句群研究概述[J].鹽城師范學(xué)院學(xué)報(bào):人文社會(huì)科學(xué)版,1996(3):35-37.

    [15] 朱靖波,葉 娜,羅海濤.基于多元判別分析的文本分割模型[J].軟件學(xué)報(bào),2007,18(3):555-564.

    [16] Beeferman D,Berger A,Lafferty J.Statistical models for text segmentation[J].Machine Learning,1999,34(1-3):177-210.

    [17] Pevzner L,Hearst M A.A critique and improvement of an evaluation metric for text segmentation[J].Computational Linguistics,2002,28(1):19-36.

    An Automatic Partition Method for Chinese Sentences Group with Coreference Resolution

    WANG Rong-bo1,SUN Xiao-xue1,HUANG Xiao-xi1,LIU He-ping2

    (1.School of Computer,Hangzhou Dianzi University,Hangzhou 310018,China;2.School of Software,Zhejiang University,Hangzhou 310000,China)

    Automatic Chinese sentence grouping is to divide the text into texts fragments with different theme and plays an important role in information extraction,summary generation,sentence comprehension and other fields.Coreference resolution is a procedure of recognizing antecedent and anaphora and associating them in the chapter.Resolution of the different expression is one of the basis of natural language understanding.Currently,focus of automatic Chinese sentences grouping is recognizing boundaries of different topics.Instead,the coreference relations of passage are rarely used for language comprehension,and inaccurate results are usually existed due to vagueness resolution.So an automatic Chinese sentences grouping method based on coreference resolution is proposed,which starts with resolution of the passages and get link of resolution with multi-layer filter resolution method to eliminate different terms referred to the same entity or to unknown.Besides,the cohesive markers of passages are taken into account.A group of evaluation functions are designed to evaluate sentences grouping and the experimental results show that it has improved the Chinese sentences grouping work,by which Pμ has increased about 7%.

    sentences grouping;coreference resolution;multi-pass sieve;MDA

    2016-09-14

    2016-12-15 網(wǎng)絡(luò)出版時(shí)間:2017-07-05

    國家自然科學(xué)基金資助項(xiàng)目(61202281,61103101);教育部人文社會(huì)科學(xué)研究項(xiàng)目青年基金(10YJCZH052,12YJCZH201)

    王榮波(1978-),男,副教授,CCF會(huì)員(E200017318M),研究方向?yàn)樽匀徽Z言處理、篇章分析。

    http://kns.cnki.net/kcms/detail/61.1450.TP.20170705.1651.062.html

    TP391

    A

    1673-629X(2017)08-0061-05

    10.3969/j.issn.1673-629X.2017.08.013

    猜你喜歡
    指代代詞語料
    Let’s Save Food To Fight Hunger
    復(fù)合不定代詞點(diǎn)撥
    奧卡姆和布列丹對(duì)指代劃分的比較
    代詞(一)
    代詞(二)
    這樣將代詞考分收入囊中
    基于語料調(diào)查的“連……都(也)……”出現(xiàn)的語義背景分析
    華語電影作為真實(shí)語料在翻譯教學(xué)中的應(yīng)用
    “不一而足”話討論
    《苗防備覽》中的湘西語料
    欧美日韩在线观看h| 成年免费大片在线观看| 黄色欧美视频在线观看| 成人亚洲欧美一区二区av| 2022亚洲国产成人精品| 天堂√8在线中文| 亚洲精品影视一区二区三区av| 久久精品夜色国产| 国产精品电影一区二区三区| 久久精品91蜜桃| 亚洲欧洲国产日韩| 一区二区三区四区激情视频| 免费看av在线观看网站| 亚洲在久久综合| 欧美又色又爽又黄视频| 九色成人免费人妻av| 午夜免费激情av| 欧美高清性xxxxhd video| 亚洲在久久综合| 人人妻人人澡欧美一区二区| 视频中文字幕在线观看| 成年免费大片在线观看| 看黄色毛片网站| 人妻夜夜爽99麻豆av| 我的女老师完整版在线观看| 91精品伊人久久大香线蕉| 久久草成人影院| 久久久久免费精品人妻一区二区| 亚洲欧美日韩无卡精品| 成人午夜高清在线视频| 亚洲欧美精品综合久久99| 国产成人一区二区在线| 亚洲精品日韩av片在线观看| 91精品伊人久久大香线蕉| 99热这里只有是精品在线观看| 麻豆一二三区av精品| 两个人的视频大全免费| 国国产精品蜜臀av免费| 秋霞在线观看毛片| 秋霞伦理黄片| 人妻夜夜爽99麻豆av| 亚洲国产欧美在线一区| 能在线免费观看的黄片| 亚洲丝袜综合中文字幕| 波多野结衣高清无吗| 变态另类丝袜制服| 久久精品国产亚洲网站| 日韩在线高清观看一区二区三区| 日韩精品青青久久久久久| 日本猛色少妇xxxxx猛交久久| 欧美成人一区二区免费高清观看| 国产色爽女视频免费观看| 国产老妇女一区| 国产伦精品一区二区三区视频9| 99国产精品一区二区蜜桃av| 尤物成人国产欧美一区二区三区| 精品熟女少妇av免费看| 精品午夜福利在线看| 99久久精品国产国产毛片| 乱码一卡2卡4卡精品| 欧美日韩综合久久久久久| 草草在线视频免费看| 亚洲国产精品成人综合色| 蜜桃亚洲精品一区二区三区| 国产白丝娇喘喷水9色精品| 村上凉子中文字幕在线| 亚洲自偷自拍三级| 久久久久久国产a免费观看| 天堂av国产一区二区熟女人妻| 久久久久久久久久久丰满| 一卡2卡三卡四卡精品乱码亚洲| 亚洲人与动物交配视频| 亚洲av免费高清在线观看| 日韩 亚洲 欧美在线| 久久草成人影院| 国产亚洲av片在线观看秒播厂 | 日日摸夜夜添夜夜爱| 美女cb高潮喷水在线观看| 欧美极品一区二区三区四区| 亚洲三级黄色毛片| 中文资源天堂在线| 国产午夜精品论理片| 中文字幕av在线有码专区| 久久亚洲国产成人精品v| 免费无遮挡裸体视频| 寂寞人妻少妇视频99o| 日韩av在线免费看完整版不卡| 亚洲精品自拍成人| 3wmmmm亚洲av在线观看| 高清日韩中文字幕在线| 亚洲国产欧美人成| 91久久精品国产一区二区成人| 少妇人妻精品综合一区二区| 国产大屁股一区二区在线视频| 国产av码专区亚洲av| 一本—道久久a久久精品蜜桃钙片 精品乱码久久久久久99久播 | 国产三级在线视频| 精品免费久久久久久久清纯| 欧美极品一区二区三区四区| 国产免费一级a男人的天堂| 一边亲一边摸免费视频| 啦啦啦啦在线视频资源| 天天一区二区日本电影三级| 亚洲一级一片aⅴ在线观看| 亚洲va在线va天堂va国产| 真实男女啪啪啪动态图| 久久热精品热| 国产免费视频播放在线视频 | 免费无遮挡裸体视频| 亚洲av成人精品一二三区| 亚洲婷婷狠狠爱综合网| 观看免费一级毛片| 国产女主播在线喷水免费视频网站 | 哪个播放器可以免费观看大片| av在线播放精品| 成人二区视频| 免费av不卡在线播放| 色吧在线观看| 亚洲人与动物交配视频| 一个人看视频在线观看www免费| 3wmmmm亚洲av在线观看| 中文乱码字字幕精品一区二区三区 | 久久精品国产亚洲av涩爱| 日韩中字成人| 一本一本综合久久| 高清视频免费观看一区二区 | 久久韩国三级中文字幕| 欧美潮喷喷水| 村上凉子中文字幕在线| 国产精华一区二区三区| 欧美日本视频| 亚洲国产精品专区欧美| 国产麻豆成人av免费视频| 日韩成人伦理影院| 久久亚洲精品不卡| 亚洲av免费高清在线观看| 久久久久久久久中文| 亚洲自拍偷在线| 性插视频无遮挡在线免费观看| 99热这里只有是精品50| 欧美日韩在线观看h| 嫩草影院入口| 亚洲av中文字字幕乱码综合| 精品国产三级普通话版| 人妻少妇偷人精品九色| 国产伦一二天堂av在线观看| 久久99热这里只有精品18| 美女被艹到高潮喷水动态| 国产黄片美女视频| 久久亚洲精品不卡| 中文乱码字字幕精品一区二区三区 | 日日摸夜夜添夜夜添av毛片| 少妇丰满av| 亚洲精品国产av成人精品| 麻豆一二三区av精品| 2021天堂中文幕一二区在线观| 色播亚洲综合网| 久久久精品大字幕| 日韩中字成人| 亚洲人与动物交配视频| 一级黄色大片毛片| 久久久久久国产a免费观看| 国产一级毛片在线| 91久久精品电影网| 国产免费视频播放在线视频 | 午夜福利在线观看免费完整高清在| 亚洲欧洲日产国产| 亚洲国产精品久久男人天堂| 亚洲精品乱码久久久久久按摩| 一夜夜www| av黄色大香蕉| 国产三级在线视频| 久久久色成人| 黄色配什么色好看| 久久精品综合一区二区三区| 男人狂女人下面高潮的视频| av天堂中文字幕网| 欧美性猛交黑人性爽| 如何舔出高潮| 亚洲精品自拍成人| 午夜福利视频1000在线观看| 不卡视频在线观看欧美| 美女黄网站色视频| 成人亚洲精品av一区二区| 日本-黄色视频高清免费观看| 亚洲精品国产成人久久av| 亚洲欧美精品综合久久99| 国产成人精品久久久久久| 国产精品精品国产色婷婷| 亚洲美女搞黄在线观看| 自拍偷自拍亚洲精品老妇| 亚洲精品影视一区二区三区av| av专区在线播放| 久久国产乱子免费精品| 精品人妻熟女av久视频| 欧美日韩综合久久久久久| 狂野欧美激情性xxxx在线观看| 成年av动漫网址| 国产成人精品久久久久久| 综合色丁香网| 国产成人a区在线观看| av在线观看视频网站免费| 能在线免费看毛片的网站| kizo精华| 亚洲国产欧洲综合997久久,| 国产久久久一区二区三区| 国产高潮美女av| 嫩草影院新地址| 精品久久久噜噜| 国产精品无大码| 午夜福利在线观看吧| 午夜免费男女啪啪视频观看| 美女国产视频在线观看| 国产一级毛片在线| 久久久久久九九精品二区国产| 69av精品久久久久久| 国产精品野战在线观看| 最新中文字幕久久久久| av女优亚洲男人天堂| 国内精品一区二区在线观看| 国产高清国产精品国产三级 | 久久久精品欧美日韩精品| 亚洲精品乱码久久久v下载方式| 男的添女的下面高潮视频| 免费搜索国产男女视频| 日日摸夜夜添夜夜添av毛片| 婷婷六月久久综合丁香| 国语对白做爰xxxⅹ性视频网站| 久久精品国产亚洲av天美| 欧美+日韩+精品| 亚洲av中文av极速乱| 97在线视频观看| 在线免费十八禁| 国产在视频线在精品| 成年版毛片免费区| 国产一区二区三区av在线| 噜噜噜噜噜久久久久久91| 精品人妻熟女av久视频| 国产精品电影一区二区三区| 国产一级毛片七仙女欲春2| 99久久精品热视频| 亚洲婷婷狠狠爱综合网| 亚洲av不卡在线观看| 亚洲最大成人中文| 五月伊人婷婷丁香| 国产成人a∨麻豆精品| 国产久久久一区二区三区| 欧美又色又爽又黄视频| 国产人妻一区二区三区在| 国产精品1区2区在线观看.| 久久久久久久午夜电影| 久久久久久久亚洲中文字幕| 搡女人真爽免费视频火全软件| 午夜激情欧美在线| 一区二区三区高清视频在线| 久久久久九九精品影院| 欧美不卡视频在线免费观看| 一夜夜www| 亚洲av中文字字幕乱码综合| 国产成人精品婷婷| 51国产日韩欧美| 亚洲欧美日韩高清专用| 美女cb高潮喷水在线观看| 最近最新中文字幕大全电影3| 国内精品一区二区在线观看| 久久精品国产自在天天线| 99国产精品一区二区蜜桃av| 亚洲国产成人一精品久久久| 国产精品1区2区在线观看.| 精品一区二区免费观看| 午夜福利视频1000在线观看| 十八禁国产超污无遮挡网站| 成年女人看的毛片在线观看| 亚洲精品乱久久久久久| 亚洲最大成人手机在线| 亚洲av成人精品一区久久| 边亲边吃奶的免费视频| 男女国产视频网站| 国产单亲对白刺激| 成人亚洲欧美一区二区av| 热99在线观看视频| 99久久精品国产国产毛片| 丝袜喷水一区| 欧美一区二区精品小视频在线| 久久人人爽人人爽人人片va| 中文字幕精品亚洲无线码一区| 一级毛片aaaaaa免费看小| 午夜福利高清视频| 久久久久久大精品| 午夜激情福利司机影院| 尾随美女入室| 日产精品乱码卡一卡2卡三| 在线观看美女被高潮喷水网站| 国产精品爽爽va在线观看网站| 国产精品一区www在线观看| 麻豆成人av视频| 亚洲av免费在线观看| 免费在线观看成人毛片| 久久精品国产亚洲av涩爱| 黄片wwwwww| 大香蕉97超碰在线| 九九在线视频观看精品| 日日干狠狠操夜夜爽| 麻豆一二三区av精品| 亚洲国产欧美在线一区| 久久久精品大字幕| 亚洲av福利一区| 乱码一卡2卡4卡精品| 免费播放大片免费观看视频在线观看 | 99热全是精品| 中文字幕av成人在线电影| 99久国产av精品国产电影| 免费av不卡在线播放| 日日干狠狠操夜夜爽| 亚洲无线观看免费| 听说在线观看完整版免费高清| 精品国内亚洲2022精品成人| 高清av免费在线| 国产高清三级在线| 菩萨蛮人人尽说江南好唐韦庄 | 男人舔奶头视频| 国产真实乱freesex| 人体艺术视频欧美日本| 亚洲婷婷狠狠爱综合网| 亚洲色图av天堂| 嫩草影院新地址| 91狼人影院| 亚洲国产欧美人成| 少妇的逼水好多| 97超视频在线观看视频| 久久人妻av系列| 搡女人真爽免费视频火全软件| 极品教师在线视频| 少妇被粗大猛烈的视频| 干丝袜人妻中文字幕| 大话2 男鬼变身卡| 亚洲欧美中文字幕日韩二区| 日韩欧美 国产精品| 精品欧美国产一区二区三| 最近中文字幕2019免费版| 嫩草影院入口| 欧美区成人在线视频| 久久午夜福利片| 国内精品一区二区在线观看| 免费搜索国产男女视频| 亚洲经典国产精华液单| 丰满少妇做爰视频| 亚洲国产高清在线一区二区三| 国产精品一区二区在线观看99 | 国产在视频线精品| 国产极品精品免费视频能看的| 午夜免费激情av| 美女脱内裤让男人舔精品视频| 色播亚洲综合网| 大香蕉久久网| 18禁在线无遮挡免费观看视频| www.av在线官网国产| 国产黄色小视频在线观看| 麻豆成人av视频| 免费看美女性在线毛片视频| 国产探花极品一区二区| 一二三四中文在线观看免费高清| 国产精品.久久久| 色播亚洲综合网| 看十八女毛片水多多多| 丝袜美腿在线中文| 亚洲成色77777| 亚洲欧美日韩卡通动漫| 国产精品.久久久| 国产成人a∨麻豆精品| 国语自产精品视频在线第100页| 91精品伊人久久大香线蕉| 国产精品.久久久| 国产精品久久久久久av不卡| 国产高清不卡午夜福利| 99久久精品国产国产毛片| 亚洲第一区二区三区不卡| 亚洲综合精品二区| 国产一级毛片七仙女欲春2| 国产精品熟女久久久久浪| 亚洲第一区二区三区不卡| 日本欧美国产在线视频| 一区二区三区高清视频在线| 精品无人区乱码1区二区| 亚洲真实伦在线观看| 国产精品国产三级国产专区5o | 国产乱人偷精品视频| 免费av毛片视频| 国产亚洲av片在线观看秒播厂 | 乱人视频在线观看| 亚洲欧美日韩东京热| 69人妻影院| 亚洲最大成人中文| videossex国产| 亚洲中文字幕日韩| 国产淫片久久久久久久久| 成人毛片60女人毛片免费| 国产精品一区www在线观看| 久久久亚洲精品成人影院| 三级毛片av免费| 蜜臀久久99精品久久宅男| 99热全是精品| 亚洲精品成人久久久久久| 亚洲久久久久久中文字幕| 草草在线视频免费看| 级片在线观看| 亚洲国产欧洲综合997久久,| 午夜免费男女啪啪视频观看| 日本av手机在线免费观看| 色综合色国产| 亚洲综合精品二区| 午夜福利高清视频| 成人鲁丝片一二三区免费| 日韩中字成人| 老女人水多毛片| 国产亚洲91精品色在线| 日韩在线高清观看一区二区三区| 狠狠狠狠99中文字幕| h日本视频在线播放| 一区二区三区免费毛片| 1000部很黄的大片| 久久人人爽人人片av| 国产三级在线视频| 免费黄网站久久成人精品| 精品久久久久久电影网 | 成人漫画全彩无遮挡| 日韩国内少妇激情av| 少妇猛男粗大的猛烈进出视频 | 国产精品一区二区三区四区免费观看| 18禁在线无遮挡免费观看视频| av天堂中文字幕网| 国产高清有码在线观看视频| 可以在线观看毛片的网站| 午夜福利网站1000一区二区三区| 男女视频在线观看网站免费| 免费一级毛片在线播放高清视频| 久久婷婷人人爽人人干人人爱| 国产精品一二三区在线看| 国内精品美女久久久久久| 色播亚洲综合网| 欧美+日韩+精品| 色综合站精品国产| 精品久久久噜噜| 亚洲av男天堂| 女的被弄到高潮叫床怎么办| 日韩一本色道免费dvd| 国内精品宾馆在线| 国产精品一区二区在线观看99 | 七月丁香在线播放| 久久久久久久国产电影| 黄片无遮挡物在线观看| 少妇人妻精品综合一区二区| 男的添女的下面高潮视频| 亚洲最大成人手机在线| 91狼人影院| 卡戴珊不雅视频在线播放| 人体艺术视频欧美日本| 国产麻豆成人av免费视频| 深夜a级毛片| 国产亚洲午夜精品一区二区久久 | 啦啦啦观看免费观看视频高清| 日韩强制内射视频| 人妻制服诱惑在线中文字幕| 美女cb高潮喷水在线观看| 熟妇人妻久久中文字幕3abv| 69av精品久久久久久| 插逼视频在线观看| 国产精品一区www在线观看| 婷婷色麻豆天堂久久 | 国产高清视频在线观看网站| 中国美白少妇内射xxxbb| 久久韩国三级中文字幕| 午夜福利网站1000一区二区三区| 成人鲁丝片一二三区免费| 九九久久精品国产亚洲av麻豆| av在线老鸭窝| 国产亚洲最大av| 伊人久久精品亚洲午夜| 国产精华一区二区三区| 国产av在哪里看| 亚洲精品乱码久久久v下载方式| 亚洲av福利一区| 小蜜桃在线观看免费完整版高清| 久久精品久久精品一区二区三区| 精品熟女少妇av免费看| 国产精品一二三区在线看| 久久婷婷人人爽人人干人人爱| 免费观看精品视频网站| 天美传媒精品一区二区| 欧美三级亚洲精品| 桃色一区二区三区在线观看| 久久久久久伊人网av| 看片在线看免费视频| 校园人妻丝袜中文字幕| 成年女人看的毛片在线观看| 欧美丝袜亚洲另类| 美女国产视频在线观看| 18+在线观看网站| 69av精品久久久久久| 亚洲av日韩在线播放| 亚洲一区高清亚洲精品| 久久婷婷人人爽人人干人人爱| 欧美潮喷喷水| 丝袜美腿在线中文| 中文天堂在线官网| 午夜福利成人在线免费观看| 高清av免费在线| 国产成人freesex在线| 免费观看的影片在线观看| 免费看a级黄色片| 精品人妻一区二区三区麻豆| 欧美性猛交黑人性爽| 国产黄片美女视频| 国产麻豆成人av免费视频| 26uuu在线亚洲综合色| 啦啦啦观看免费观看视频高清| 日本免费a在线| 免费观看在线日韩| 色视频www国产| 日日撸夜夜添| 久久久久免费精品人妻一区二区| 一级毛片我不卡| 又粗又爽又猛毛片免费看| 欧美高清性xxxxhd video| 男女边吃奶边做爰视频| 国语自产精品视频在线第100页| 精品人妻熟女av久视频| 草草在线视频免费看| 麻豆一二三区av精品| 毛片一级片免费看久久久久| 久久久久久九九精品二区国产| 午夜精品国产一区二区电影 | 午夜福利高清视频| 蜜桃久久精品国产亚洲av| 99在线人妻在线中文字幕| 亚洲在久久综合| 国产精品嫩草影院av在线观看| 亚洲乱码一区二区免费版| 日本一本二区三区精品| 免费大片18禁| 国产免费福利视频在线观看| 国产精品蜜桃在线观看| 天堂√8在线中文| 欧美激情久久久久久爽电影| 麻豆成人午夜福利视频| 国内揄拍国产精品人妻在线| 波多野结衣巨乳人妻| 亚洲高清免费不卡视频| 午夜日本视频在线| 级片在线观看| 免费观看人在逋| 亚洲电影在线观看av| 久久精品国产99精品国产亚洲性色| 精品午夜福利在线看| 国产精品乱码一区二三区的特点| 久久久色成人| 少妇丰满av| 少妇的逼水好多| 午夜老司机福利剧场| 亚洲欧美精品专区久久| 欧美一级a爱片免费观看看| 岛国在线免费视频观看| 日韩av不卡免费在线播放| 高清在线视频一区二区三区 | 99久久精品一区二区三区| 国产精品久久久久久av不卡| 2022亚洲国产成人精品| 国产高清三级在线| 国产高清有码在线观看视频| 国产乱人视频| 高清在线视频一区二区三区 | 天堂av国产一区二区熟女人妻| 六月丁香七月| 欧美日本亚洲视频在线播放| 夜夜爽夜夜爽视频| 91精品伊人久久大香线蕉| 欧美又色又爽又黄视频| 国产一区有黄有色的免费视频 | 国内精品宾馆在线| 26uuu在线亚洲综合色| 午夜免费男女啪啪视频观看| 亚洲精品国产av成人精品| 哪个播放器可以免费观看大片| 欧美潮喷喷水| 亚洲国产最新在线播放| 精品人妻视频免费看| 青春草视频在线免费观看| 一二三四中文在线观看免费高清| 久久欧美精品欧美久久欧美| 又黄又爽又刺激的免费视频.| av视频在线观看入口| 国产三级中文精品| 亚洲人成网站高清观看| 日日摸夜夜添夜夜爱| 婷婷色麻豆天堂久久 | 久久综合国产亚洲精品| 两个人的视频大全免费| 国产乱人偷精品视频| 午夜亚洲福利在线播放| 精品人妻偷拍中文字幕| 尤物成人国产欧美一区二区三区| 青青草视频在线视频观看| 午夜福利网站1000一区二区三区| 99久久人妻综合| 一个人免费在线观看电影| 久久热精品热| 久久人妻av系列| 丝袜美腿在线中文| 久久99精品国语久久久| 天堂网av新在线| 免费搜索国产男女视频| 国产三级在线视频| 可以在线观看毛片的网站| 一本久久精品| 午夜a级毛片|