• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    語義信息與CRF結(jié)合的漢語功能塊自動識別

    2011-10-15 01:37:04劉海霞黃德根
    中文信息學報 2011年5期
    關(guān)鍵詞:功能塊語料賓語

    劉海霞,黃德根

    (大連理工大學計算機科學與技術(shù)學院,遼寧大連116024)

    1 引言

    漢語功能塊識別屬于漢語句法分析范疇,漢語的句法分析按其分析處理深度可依次分為詞性標注處理、句法塊分析、句法樹分析等,功能塊分析屬于句法塊分析的一種。句法塊分析是一種部分分析技術(shù),它與完全句法分析相對,完全句法分析要求通過一系列分析過程,最終得到句子的完整的句法樹。而句法塊分析是對完整的句法樹分析進行合理分解[1],使得句法分析任務在某種程度上得到簡化,達到提高句法分析效率的目的,同時也有利于句法分析技術(shù)在大規(guī)模真實文本處理系統(tǒng)中迅速得到應用。

    由CIPS-ParsEval-2009的測試方案可知,漢語功能塊是定義在句子層面上的功能性成分,主要描述句子中反映不同事件內(nèi)容的基本信息單元[2]。它們一般占據(jù)了句子中的主語、謂語、賓語、狀語、定語、中心語等功能位置,通過組合形成不同的句式,完成對真實世界中不同事件內(nèi)容的再現(xiàn)描述,體現(xiàn)了漢語句子的基本骨架。功能塊識別的目的是正確標注出包括主語塊、狀語塊、述語塊、賓語塊、補語塊、兼語塊、定語塊、中心塊、獨立塊、其他特殊塊等在內(nèi)的功能塊標記信息,覆蓋自頂向下進行事件句式拆分而形成的各個基本信息單元,以顯示句子在小句層面上的基本結(jié)構(gòu)及骨架,為進一步的事件骨架樹分析提供最小的功能塊描述序列。

    塊(Chunk)的概念最早是由Abney在1991年提出的[3],在引入句法塊概念的同時,他將句法分析分為三個階段來進行:(1)塊識別,利用基于有限狀態(tài)分析機制的塊識別器(Chunker)識別出句子中所有的塊;(2)塊內(nèi)結(jié)構(gòu)分析,對每個塊內(nèi)部的成分賦予合適的句法結(jié)構(gòu);(3)塊間關(guān)系分析,利用塊連接器(Attacker)將各個不同的塊合成完整的句法分析樹。依據(jù)這樣的研究思路,將句法分析分解進行,一方面,可以對不同的子問題進行有針對性的處理,選用適合的語言模型和策略加以分析;另一方面,通過在塊層次上進行自底向上的塊間關(guān)系分析和自頂向下的塊內(nèi)結(jié)構(gòu)分析,可以提高整體分析效率,降低句子分析的難度。

    由于漢語功能塊與漢語組塊同屬于句法塊分析范疇,因此組塊識別的研究經(jīng)驗也可以借鑒到功能塊識別的研究任務中來。組塊識別是在自然語言學習國際會議CoNLL-2000中作為共享任務提出的,用于組塊識別研究的主流技術(shù)是統(tǒng)計機器學習方法,其中包括隱馬爾可夫模型(HMM)[4]、支持向量機模型(SVM)[5]、最大熵模型(ME)[6]和條件隨機域模型(CRFs)[7-8]等。文獻[9]采用基于HMM 的組塊分析方法,加入基于記憶學習過程的組塊生成概率,得到整體識別的F1-measure值為92.12%;文獻[10]則使用了一個標準的最大熵學習器,通過輸入單詞和詞性標記信息來生成組塊標記,最后得到整體識別的F1-measure值為 91.97%。對比于英語CONLL-2000提出的語塊共享任務的描述體系,文獻[11]提出了漢語功能塊的標注體系,強調(diào)對句子整體功能塊的描述,側(cè)重于自頂向下地描述句子的基本骨架。文獻[12]以語塊識別結(jié)果為基礎自動構(gòu)建德語和英語的部分句法樹,得到相應功能塊自動識別的整體識別準確率分別為89.73%和90.40%,召回率分別為61.45%和59.78%。文獻[13]利用判定樹模型進行各個功能塊的邊界識別研究,得到了最高 74.1%的 F1-measure值。文獻[14]利用SVM 模型對主語-述語塊(SP)和述語—賓語塊(PO)進行邊界識別,得到的最好F1-measure值分別為76.56%和82.26%。還有文獻[15]使用了兩種不同的功能塊分析模型,在詞和詞性的基礎上利用CRF模型進行序列標注,最終功能塊整體識別的F1-measure值達到了78.63%。在2009年第一屆中國中文信息學會句法分析評測中,文獻[16]利用條件隨機域模型進行漢語功能塊的分析,得到的F1-measure值為85.90%。文獻[17]在自動識別的基本塊基礎上進行基本塊到功能塊的級聯(lián)分析,利用SVM模型得到功能塊識別的F1-measure值為84.72%。

    由文獻[18]可知,由于現(xiàn)有的功能塊分析器采用統(tǒng)計學習的方法,選取的特征具有一定的局部性,所以像賓語塊這樣長度較長且結(jié)構(gòu)相對復雜的塊是現(xiàn)有分析器的一個難點所在,因此也成為識別性能提高的關(guān)鍵。本文首次將語義知識引入到漢語功能塊的識別中,不再局限于僅利用句子中的詞和詞性標注信息,而是將某種語義詞典中的語義編碼作為一種語義標記加入到訓練語料和測試語料中,把在語義和句法功能上相同或相近的詞用同一個語義編碼來代替,這樣就能夠降低特征空間的維數(shù),緩解數(shù)據(jù)稀疏問題對識別性能的影響,更好地解析復雜句子的結(jié)構(gòu),從而提高漢語功能塊的識別性能。

    2 語義資源

    隨著自然語言處理研究的不斷發(fā)展,20世紀80年代以來,許多關(guān)于英語和漢語方面的大規(guī)模語義計算資源被不斷地開發(fā)出來,其中比較有代表性的有英語方面的WordNet、FrameNet、MindNet等;漢語方面的知網(wǎng)HowNet、《同義詞詞林》等。本文需要的正是能夠反映漢語單詞語義特征的代碼化語義系統(tǒng),而《同義詞詞林》中的每一個單詞都有表示語義的編碼,正好是一個代碼化的語義系統(tǒng)。因此,我們將《同義詞詞林》引入到漢語功能塊識別系統(tǒng)中,利用詞林中每個單詞被賦予的語義編碼所包含的豐富語義信息來改善系統(tǒng)的識別效果。

    目前的語義資源中記錄的語義知識主要就是語義關(guān)系知識[19],語義關(guān)系分為聚合關(guān)系和組合關(guān)系兩類,詞義聚合關(guān)系又可以細分為各種各樣的關(guān)系,例如:同義(近義)關(guān)系、反義關(guān)系、同位關(guān)系、上位關(guān)系、下位關(guān)系和整體部分關(guān)系等?!锻x詞詞林》是通過詞義聚合關(guān)系組織起來的語義詞典,主要是用同義詞集合來表示詞義,所有同類的語義項即詞群構(gòu)成一個樹狀結(jié)構(gòu),詞語之間的上下位關(guān)系以及整體部分關(guān)系就通過這個樹狀結(jié)構(gòu)來表達。這是一部對漢語詞匯按語義進行全面分類的詞典[20],根據(jù)漢語的特點和使用原則,確定了詞的語義分類原為以詞義為主,兼顧詞類,并充分注意題材的集中。將現(xiàn)代漢語的63895個詞語義項分為大、中、小類三級,共有12個大類(A類為人、B類為物、C類為時間與空間、D類為抽象事物、E類為特征、F類為動作、G類為心理活動、H類為活動、I類為現(xiàn)象與狀態(tài)、J類為關(guān)聯(lián)、K類為助語、L類為敬語),94個中類和1428個小類,小類下再根據(jù)詞義的遠近和相關(guān)性劃分詞群,共有3925個同義詞群。

    本文使用的是哈工大信息檢索研究室的同義詞詞林擴展版,擴展后的《同義詞詞林》,含有更加豐富的語義信息。對比原版的三級分類結(jié)果擴展到了現(xiàn)在的五級分類結(jié)果,針對每個詞語義項形成的完整8位語義編碼,可以唯一的代表詞典中出現(xiàn)的詞語。編碼位按照從左到右的順序排列,第1位代表的是大類,用大寫英文字母表示,是第一級分類的編碼;第2位代表中類,用小寫英文字母表示,是第二級分類的編碼;第三級代表小類,用二位十進制整數(shù)表示,占據(jù)編碼位的第3位和第4位。第5位代表詞群,用大寫英文字母表示,是第四級分類的編碼;第五級代表原子詞群,用二位十進制整數(shù)表示,占據(jù)編碼位的第6位和第7位。隨著級別的遞增,詞義刻畫得越來越細,到了第五級,每個分類里詞語的數(shù)量己經(jīng)不多,很多只有一個詞語,已經(jīng)不可再分,所以將其稱為原子詞群、原子類或原子節(jié)點。由于第五級的分類結(jié)果需要特別說明,例如,有的行是同義詞,有的行是相關(guān)詞,有的行只有一個詞,可以分出具體的三種情況。在使用上,有時需要對這三種情況進行區(qū)別對待,所以有必要再增加標記來分別代表上述幾種情形。增加的標記占據(jù)編碼位的第8位,共有3種標記,分別是“=”、“#”和“@”,其中“=”代表“相等”、“同義”,表明本詞群中的詞語屬于同義詞語;“#”代表“不等”、“同類”,表明本詞群中的詞語屬于相關(guān)詞語;“@”代表“自我封閉”、“獨立”,這種詞群中只包含一個詞語,表明它在詞典中既沒有同義詞,也沒有相關(guān)詞。具體的編碼規(guī)則見表1。

    表1 《同義詞詞林》擴展版編碼規(guī)則表① 該表來源于《哈工大信息檢索研究室同義詞詞林擴展版》說明

    3 基于條件隨機域的功能塊識別

    3.1 條件隨機域模型

    本文將漢語功能塊的自動識別問題轉(zhuǎn)化為序列標注問題[21],利用條件隨機域建立功能塊的序列標注模型。條件隨機域(Conditional Random Fields,CRFs)模型是一個基于無向圖的條件概率模型[22],可以任意添加有效的特征向量,具有表達長距離依賴性和交疊性特征的能力,能夠較好地解決標注(分類)偏置等問題。而且所有特征可以進行全局歸一化,能夠求得全局的最優(yōu)解,對于輸入和輸出的幾率分布不像隱馬爾科夫模型那樣強烈的假設存在,很適合做序列標注分析,所以我們使用條件隨機域模型來實現(xiàn)功能塊分析的序列標注處理。

    本文介紹的條件隨機域模型是比較簡單的線性鏈條件隨機域,給定參數(shù) Λ=(λ1,λ2,…,λn),線性鏈條件隨機域定義在一個給定的觀測序列X=x1,x2,…,xT上對應的狀態(tài)標記序列Y=y1,y2,…,yT的條件概率為:

    其中ZX是所有狀態(tài)序列的歸一化因子,使得在給定輸入上所有可能狀態(tài)序列的概率之和為1。fk(yt-1,yt,x,t)通常被定義為關(guān)于整個觀測序列和位置t以及位置t-1標記的二值特征向量函數(shù),參數(shù)λk是在訓練中得到的與特征函數(shù)fk相關(guān)的權(quán)重,當訓練狀態(tài)序列被完全明確地標記后,可為該模型找到最優(yōu)的λ值,一旦這些值被找到,一個新的未標記序列的標記工作就可以用Viterbi算法來完成,k的取值范圍取決于模版中特征的數(shù)量。

    那么求解序列標注的任務就是求出使條件概率PΛ(Y|X)最大的Y,即最大可能的標記序列為:

    3.2 功能塊標注集

    將漢語功能塊的自動識別問題轉(zhuǎn)化為序列標注問題需要定義標注集合,通過為文本句子中的每個詞語標注一個合適的類別標記,實現(xiàn)功能塊的自動識別。

    為了標識塊與塊之間的邊界和功能信息,我們采用IOB2的標注集合來標記功能塊,標記集中的每個標記均由兩部分構(gòu)成,第一部分為詞語在功能塊中的位置,如功能塊的起始位置用B表示,內(nèi)部位置用I表示;第二部分為功能塊的類型標記[23],具體如表2所示,在這兩部分標記之間用“-”來分隔。對于不屬于這幾類功能塊的單詞和符號,統(tǒng)一使用O來標記。這樣10種功能標記類型加上O標記,最后形成包括21種功能塊標記的標注集合。任意一個詞被標記為21種功能塊標記中的一種,標記為同一類別B和I的詞,構(gòu)成一個功能塊,該功能塊直到遇到下一個標記為B或者O的詞為止。

    表2 功能塊類型標記集

    以“能脫離其他運動形式獨立存在,”為例,利用IOB2標注集合對其進行標注的中間結(jié)果為:“能/vM/B-P脫離/v/B-P其他/rN/B-O運動/n/I-O形式/n/I-O 獨立/aD/B-P存在/v/I-P,/wP/O”,再經(jīng)過處理得到最后的標注結(jié)果為:“[P能/vM][P脫離/v][O其他/rN運動/n形式/n][P獨立/aD存在/v],/wP”。

    4 實驗

    4.1 實驗語料及評價參數(shù)

    實驗使用的語料是第一屆中文信息學會句法分析評測發(fā)布的約48萬詞規(guī)模新聞學術(shù)類TCT(清華句法樹庫)語料庫[23],充分利用TCT中提供的豐富句法標記信息,自動提取形成了相應的功能塊標注語料庫。其中訓練語料大小為3.83M,包含約39萬詞次,測試語料大小為730K,包含9萬多詞次,訓練集和測試集的大小比例約為5∶1。

    依據(jù)CIPS-ParsEval-2009評測標準,對漢語功能塊的標注結(jié)果進行評價的主要評價指標包括功能塊分析的準確率(Precision,P)、召回率(Recall,R)和F-1測度(F-1 measure,Fβ=1)。評價功能塊識別性能指標的計算公式如下[24]:

    (1)功能塊識別準確率(Precision):

    (2)召回率(Recall):

    (3)F-1測度(F-1 measure):

    其中:

    正確功能塊數(shù):某類正確分析的功能塊總數(shù)。

    召回功能塊數(shù):某類自動分析的功能塊總數(shù)。

    功能塊總數(shù):某類Gold-standard(標準的標注結(jié)果)功能塊總數(shù)。

    4.2 實驗結(jié)果及分析

    4.2.1 條件隨機域識別結(jié)果

    條件隨機域模型識別漢語功能塊的關(guān)鍵在于特征的選擇,特征的選擇恰當與否會對識別結(jié)果產(chǎn)生直接的影響。通常來講,豐富的上下文特征對于識別精確率的提高有著積極的作用。本文在進行特征選擇的時候,不僅充分利用了詞和詞性本身的信息,考慮到詞和詞性及其上下文之間存在著的種種依賴關(guān)系,還利用了融入更多上下文信息的組合特征。表3為條件隨機域模型所采用的特征模板,其中Wn代表詞本身特征,Pn代表詞的詞性特征,其他特征為詞和詞性的組合特征。

    表3 特征模板的符號化表示

    利用表3中的特征模板,將給定的訓練語料拿到CRF①Taku Kudo開發(fā)的開源CRF++-0.53軟件包,網(wǎng)址:http://crfpp.sourceforge.net/.上進行訓練,再用訓練得到的功能塊分析模型對測試語料進行標注,最后得到功能塊的識別結(jié)果。表4是塊的邊界識別結(jié)果以及邊界加上功能信息的整體識別結(jié)果,后續(xù)實驗所取得的結(jié)果以此為基礎,并起到對比分析的作用。

    表4 條件隨機域識別結(jié)果

    4.2.2 結(jié)合語義信息識別結(jié)果

    結(jié)合語義信息識別漢語功能塊的具體做法是將《同義詞詞林》詞典文件中的語義編碼作為一種語義標記引入到語料中,把語料中的同義詞語、相關(guān)詞語和獨立詞語分別用相同的語義標記來標識,其他不在詞典中的詞或標點符號等統(tǒng)一用數(shù)字0來標識。也就是說,語料中凡是屬于同一詞群的詞語都被標記成相同的語義編碼,而不在詞典中的詞具有相同的語義編碼0,這樣就構(gòu)建出包含語義信息的訓練語料和測試語料。表5為語料中引入了語義標記的功能塊標注舉例。

    表5 帶語義標記的功能塊標注舉例

    在進行具體實驗的時候,將語義標記作為一個特征向量,也就是將詞群特征加入到條件隨機域模型當中,目的是縮小分析模型的特征空間,增強模型學習效果,從而取得更好的標注結(jié)果。本文在針對語義信息進行特征抽取實驗的時候,綜合考慮到語義信息對復雜句子識別的有效性以及盡量避免由此產(chǎn)生的模型復雜度過高,最終選定兩個特征組合加入到條件隨機域模型的特征模板中,分別為:(1)當前詞的詞群和后詞的詞群組合特征;(2)當前詞的詞群和前詞的詞群以及前兩詞的詞群組合特征。表6為新增特征組合符號化表示,其中Sn代表詞的詞群特征。

    表6 新增特征組合的符號化表示

    表7為加入兩個詞群特征組合前后,系統(tǒng)對主語塊S、述語塊P、賓語塊O和狀語塊D進行識別的結(jié)果比較??梢钥闯?詞群特征的加入改善了系統(tǒng)對這四個典型功能塊的識別性能,尤其是對結(jié)構(gòu)相對復雜的賓語塊的識別效果最好,其F值提高了0.58個百分點,召回率則提高了0.81個百分點。

    表7 結(jié)合語義前后四個典型功能塊識別結(jié)果比較

    從表7可以看出,語義信息的加入使得系統(tǒng)能夠識別出比單純條件隨機域模型更多的功能塊,尤其對賓語塊召回率的提高效果最為明顯。通過對實驗結(jié)果的分析發(fā)現(xiàn),賓語塊召回率的提高有賴于以下兩種情況:召回未被識別的賓語塊和糾正被錯誤標注成賓語塊的塊,經(jīng)過抽樣統(tǒng)計可知兩者所占比重分別為64%和36%,下面將這兩種情況的一些具體實例列于表8和表9中。

    表8 加入語義信息后新召回的賓語塊實例

    續(xù)表

    表8中第一列的斜體字部分表示應該屬于賓語塊卻被識別為其他類型的塊,第二列為加入語義信息特征之前被錯誤識別成的塊類型。

    表9 糾正被錯誤標注成賓語塊的實例

    表9中第一列的斜體字部分表示應該屬于其他類型的塊卻被錯誤地識別為賓語塊,第二列表示斜體部分應該屬于的塊類型。

    通過對實例的統(tǒng)計,混淆識別為賓語塊加中心塊的“的”字結(jié)構(gòu)(O+“的”+H)以及謂語塊加中心塊的“的”字結(jié)構(gòu)(P+“的”+H)的情況占60%以上,其典型句式除了“的”字結(jié)構(gòu),還有“之”字結(jié)構(gòu)、“等”字結(jié)構(gòu)等,其余實例大多屬于比較復雜的賓語塊,它們被錯誤標記成的塊類型可參見表2中說明。表8所示情況對賓語塊召回率的提高起主要作用,表9中第一行所起作用與表8相同,除第一行以外其他行所示情況能夠起到提高其他塊類型召回率的作用。也就是說,語義編碼這個新特征的加入使得識別系統(tǒng)能夠正確識別出更多的復雜賓語塊及“的”字結(jié)構(gòu)賓語塊,由于“的”字在現(xiàn)代漢語中是運用頻率很高的虛詞,“的”字前的定語一般修飾“的”字后的中心語,而可作定語中心語的詞類很廣泛,這就決定了“的”字結(jié)構(gòu)的普遍性所產(chǎn)生的歧義。因此可以說語義特征能夠很好的區(qū)分“的”字結(jié)構(gòu)應該屬于的塊類型,對解決這種結(jié)構(gòu)所產(chǎn)生的歧義具有重要的意義。

    表10為引入語義信息以后塊的邊界識別結(jié)果以及邊界加上功能信息的整體識別結(jié)果。

    表10 結(jié)合語義信息識別結(jié)果

    通過表4和表10的實驗數(shù)據(jù),我們發(fā)現(xiàn)加入語義特征的實驗模型比單純條件隨機域模型取得了更好的識別效果,這說明結(jié)合語義資源的漢語功能塊識別系統(tǒng)能夠獲得更加穩(wěn)定的識別性能。

    由于本文使用的實驗數(shù)據(jù)與2009年第一屆中國中文信息學會句法分析評測提供的實驗數(shù)據(jù)相同,所以我們將實驗結(jié)果與評測中使用其他方法的測試結(jié)果進行了比較,表11顯示了比較的具體情況,可以看出本文所采用的CRF結(jié)合語義資源進行漢語功能塊識別的方法取得了很好的效果。

    表11 與CIPS-ParsEval-2009結(jié)果的比較

    5 結(jié)論

    漢語功能塊識別作為一種較好的部分分析結(jié)果,相當于完整句法樹的一棵子樹,可以與完整的句法樹分析有效配合,形成可適應不同應用需求的句法分析結(jié)果。

    本文將語義資源同義詞詞林引入到功能塊的識別過程當中,用詞典中唯一的8位語義編碼代替語料中出現(xiàn)的在句法功能或者語義上相同或相近的詞。由于詞性的種類有幾十種,而詞的種類為幾十萬種,相比于詞和詞性這兩種特征之間的巨大差距,語義詞典中的詞群正好彌補了這種差距,詞群的種類為幾千種,正好是詞和詞性特征的一種折中。介于詞和詞性特征之間詞群特征不僅彌補了詞性特征區(qū)分度過小的缺點,而且還有效緩解了詞特征的數(shù)據(jù)稀疏問題。

    實驗結(jié)果表明,本系統(tǒng)可以改善漢語功能塊的自動識別性能,并且在對主語塊、述語塊、賓語塊和狀語塊的識別上均取得了不錯的效果,尤其是結(jié)構(gòu)相對復雜的賓語塊的識別結(jié)果有了較大幅度的提高。由于它們占據(jù)了功能塊總數(shù)的主要份額,所以這四個典型功能塊的識別結(jié)果對最后結(jié)果的影響較大。

    在以后的研究工作中,我們將進一步完善結(jié)合語義知識進行漢語功能塊識別的方法,在改善現(xiàn)有語義詞典的同時,將尋求更多用于功能塊識別的語義資源,并且通過結(jié)合其他方法來改善漢語功能塊的整體識別性能。

    [1]周強.漢語基本塊描述體系[J].中文信息學報,2007,21(3):21-27.

    [2]周強,李玉梅.漢語塊分析評測任務設計[J].中文信息學報,2010,24(1):123-128.

    [3]Steven Abney.Parsing by chunks[C]//Robert Berwick,Steven Abney and Carol Tenny(eds.).Principle-Based Parsing.Dordrecht:Kluwer Academic Publishers,1991,257-278.

    [4]李珩,楊峰,朱靖波,等.基于增益的隱馬爾科夫模型的文本組塊分析[J].計算機科學,2004,152-154.

    [5]李珩,朱靖波,姚天順.基于SVM的中文組塊分析[J].中文信息學報,2004,18(2):1-7.

    [6]李素建,劉群,楊志峰.基于最大熵模型的組塊分析[J].計算機報,2003,1722-1727.

    [7]Fei Sha,Fernando Pereira.Shallow parsing with conditional random fields[C]//Proc.of Human Language Technology/North American chapter of the Association for Computational Linguistics annual meeting.Edmonton:2003,213-220.

    [8]Yongmei Tan,Tianshun Yao,Qing Chen and Jingbo Zhu.Applying conditional random fields to Chinese shallow parsing[C]//Proc.of CICLing-2005.Mexico:2005,167-176.

    [9]GuoDong Zhou,Jian Su,TongGuan Tey.Hybrid text chunking[C]//Proc.of CoNLL-2000 and LLL-2000,Lisbon,Portugal:2000,163-165.

    [10]Rob Koeling.Chunking with maximum entropy models[C]//Proc.of CoNLL-2000 and LLL-2000,Lisbon,Portugal:2000,139-141.

    [11]周強,任海波,詹衛(wèi)東.構(gòu)建大規(guī)模漢語語塊庫[M]//黃昌寧,張普.自然語言理解與機器翻譯.北京:清華大學出版社,2001,102-107.

    [12]Sandra Kübler,Erhard W.Hinrichs.From chunks to function-argument structure:A similarity-based approach[C]//Proc.of ACL/EACL 2001.Toulouse,France:2001.338-345.

    [13]Elliott Franco Dr bek,Qiang Zhou.Experiments in Learning Models for Functional Chunking of Chinese Text[C]//Proc.of IEEE International Workshop on Natural Language Processing and Knowledge engineering.Tucson,Arizona,2001,859-864.

    [14]Yingze Zhao,Qiang Zhou.A SVM-based Model for Chinese Functional Chunk Parsing[C]//Proc.of the Fifth SIGHAN Workshop on Chinese Language Processing.Sydney:2006,94-101.

    [15]周強,趙穎澤.漢語功能塊自動分析[J].中文信息學報,2007,21(5):18-24.

    [16]王昕,等.基于CRF的漢語語塊分析和事件描述小句識別[C]//第一屆漢語句法分析評測學術(shù)研討會論文集.北京:2009.

    [17]李軍輝,周國棟.蘇州大學第一屆中文信息學會句法分析評測技術(shù)報告[C]//周強,朱靖波.第一屆漢語句法分析評測學術(shù)研討會論文集.北京:2009.

    [18]陳億,周強,宇航.分層次的漢語功能塊描述庫構(gòu)建分析[J].中文信息學報,2008,22(3):24-31.

    [19]詹衛(wèi)東.面向自然語言處理的大規(guī)模語義知識庫研究述要[C]//徐波.中文信息處理若干重要問題.北京:科學出版社,2003,107.

    [20]梅家駒,等.同義詞詞林[M].上海:上海辭書出版社,1983.

    [21]LanceA.Ramshaw,Mitchell P.Marcus.Text chunking using transformation-based learning[C]//Proc.of the Third ACL Workshop on Very Large Corpora.Boston:1995,82-94.

    [22]J.Lafferty,A.McCallum,F.Pereira.Conditional random fields:Probabilistic models for segmenting and labeling sequence data[C]//Proc.of the 18th International Conference on MachineLearning.San Francisco:Morgan Kaufmann,2001,282-289.

    [23]周強.漢語句法樹庫標注體系[J].中文信息學報,2004,18(4):1-8.

    [24]黃德根,于靜.分布式策略與CRFs相結(jié)合識別漢語組塊[J].中文信息學報,2009,23(1):16-23.

    [25]計峰,等.FudanN LP:一個基于在線學習算法的中文自然語言處理工具包[C]//第一屆漢語句法分析評測學術(shù)研討會論文集.北京:2009.

    [26]谷波,等.漢語基本塊與功能塊的自動分析[C]//第一屆漢語句法分析評測學術(shù)研討會論文集.北京:2009.

    猜你喜歡
    功能塊語料賓語
    連詞that引導的賓語從句
    賓語從句及練習
    Ovation系統(tǒng)FIRSTOUT和FIFO跳閘首出比較
    基于語料調(diào)查的“連……都(也)……”出現(xiàn)的語義背景分析
    中考試題中的賓語從句
    華語電影作為真實語料在翻譯教學中的應用
    自定義功能塊類型在電解槽聯(lián)鎖中的應用
    中國氯堿(2015年9期)2015-11-02 01:03:41
    基于MACSV6.5.2的鍋爐燃盡風開關(guān)量調(diào)節(jié)門控制功能塊設計
    《苗防備覽》中的湘西語料
    國內(nèi)外語用學實證研究比較:語料類型與收集方法
    99久久综合精品五月天人人| av天堂久久9| 人人妻人人爽人人添夜夜欢视频| 日韩精品青青久久久久久| 国产深夜福利视频在线观看| 色在线成人网| 91字幕亚洲| 久久久国产欧美日韩av| 国产xxxxx性猛交| 午夜福利,免费看| 国产精品日韩av在线免费观看 | 国产视频一区二区在线看| 在线观看www视频免费| 人人妻,人人澡人人爽秒播| 自线自在国产av| 女人高潮潮喷娇喘18禁视频| 超碰97精品在线观看| 啦啦啦 在线观看视频| 啦啦啦免费观看视频1| 黄片小视频在线播放| 亚洲精品粉嫩美女一区| 亚洲av熟女| 免费看十八禁软件| 在线观看日韩欧美| 97超级碰碰碰精品色视频在线观看| 国产精品一区二区在线不卡| 中文字幕高清在线视频| 99国产精品一区二区三区| 亚洲国产欧美日韩在线播放| 黄色 视频免费看| 精品久久久久久成人av| 国产精品久久电影中文字幕| 成人永久免费在线观看视频| 午夜视频精品福利| 亚洲 国产 在线| 日韩欧美一区二区三区在线观看| 亚洲成av片中文字幕在线观看| 99国产综合亚洲精品| 日韩高清综合在线| 国产伦一二天堂av在线观看| 超碰成人久久| 亚洲全国av大片| 亚洲av美国av| 国产精品久久久久久人妻精品电影| 国产av又大| 国产精品久久电影中文字幕| 亚洲专区字幕在线| 97碰自拍视频| 免费在线观看完整版高清| 亚洲aⅴ乱码一区二区在线播放 | 亚洲人成电影免费在线| 最近最新中文字幕大全电影3 | 男女之事视频高清在线观看| 中国美女看黄片| 桃色一区二区三区在线观看| 亚洲男人的天堂狠狠| 欧美久久黑人一区二区| 日日爽夜夜爽网站| 精品高清国产在线一区| a级毛片黄视频| 嫩草影视91久久| 国产高清激情床上av| 国产成人精品无人区| 精品日产1卡2卡| 一边摸一边抽搐一进一出视频| 国产又爽黄色视频| 交换朋友夫妻互换小说| 黄色丝袜av网址大全| 变态另类成人亚洲欧美熟女 | 一级,二级,三级黄色视频| 日本三级黄在线观看| 亚洲精品一卡2卡三卡4卡5卡| 午夜福利一区二区在线看| 日韩人妻精品一区2区三区| 国产成人啪精品午夜网站| 亚洲色图av天堂| 午夜福利一区二区在线看| 久久久久国内视频| 欧美久久黑人一区二区| 99久久人妻综合| 99精国产麻豆久久婷婷| 性欧美人与动物交配| 日韩免费高清中文字幕av| 成人三级黄色视频| 这个男人来自地球电影免费观看| 亚洲精品av麻豆狂野| 伊人久久大香线蕉亚洲五| 午夜福利在线免费观看网站| 亚洲成a人片在线一区二区| 一本综合久久免费| 男女做爰动态图高潮gif福利片 | x7x7x7水蜜桃| 韩国av一区二区三区四区| 波多野结衣av一区二区av| 狠狠狠狠99中文字幕| 高清av免费在线| av免费在线观看网站| 丰满的人妻完整版| 中文字幕人妻熟女乱码| 韩国av一区二区三区四区| 国产在线观看jvid| a级毛片在线看网站| av天堂久久9| 又黄又爽又免费观看的视频| 欧美在线一区亚洲| 丰满人妻熟妇乱又伦精品不卡| 侵犯人妻中文字幕一二三四区| 亚洲熟女毛片儿| 国产深夜福利视频在线观看| 在线观看免费视频网站a站| 一二三四社区在线视频社区8| 国产伦人伦偷精品视频| 母亲3免费完整高清在线观看| 欧美乱妇无乱码| 欧美精品啪啪一区二区三区| 窝窝影院91人妻| 九色亚洲精品在线播放| 国产亚洲精品第一综合不卡| 长腿黑丝高跟| 这个男人来自地球电影免费观看| 少妇的丰满在线观看| 窝窝影院91人妻| 亚洲 欧美 日韩 在线 免费| 久热这里只有精品99| 国产av精品麻豆| 在线观看免费午夜福利视频| 两个人看的免费小视频| 国产精品亚洲一级av第二区| 成人三级黄色视频| 国产av精品麻豆| 18禁黄网站禁片午夜丰满| 两人在一起打扑克的视频| 日本a在线网址| 嫁个100分男人电影在线观看| 久久久国产一区二区| 精品国内亚洲2022精品成人| 手机成人av网站| 新久久久久国产一级毛片| 国产三级黄色录像| 午夜精品在线福利| 亚洲在线自拍视频| 在线观看免费视频日本深夜| 亚洲激情在线av| 色精品久久人妻99蜜桃| 无人区码免费观看不卡| 中文字幕最新亚洲高清| 黑人巨大精品欧美一区二区mp4| 国产蜜桃级精品一区二区三区| 久久久久久大精品| 大型av网站在线播放| 97超级碰碰碰精品色视频在线观看| 黄色丝袜av网址大全| 精品高清国产在线一区| 欧美日韩精品网址| 三上悠亚av全集在线观看| 久久精品国产清高在天天线| 性色av乱码一区二区三区2| 热99re8久久精品国产| 人人妻人人添人人爽欧美一区卜| 亚洲欧美日韩另类电影网站| 国产又爽黄色视频| 久久中文字幕一级| 一进一出抽搐动态| 精品第一国产精品| 午夜两性在线视频| 欧美黑人精品巨大| 狠狠狠狠99中文字幕| 欧美丝袜亚洲另类 | 久久中文字幕人妻熟女| 夜夜爽天天搞| 亚洲,欧美精品.| 又大又爽又粗| 最新美女视频免费是黄的| 国产精品亚洲一级av第二区| 欧美一区二区精品小视频在线| 免费少妇av软件| 91av网站免费观看| e午夜精品久久久久久久| 夜夜躁狠狠躁天天躁| 在线观看66精品国产| 久久中文看片网| 一进一出好大好爽视频| 99在线人妻在线中文字幕| 欧美日本中文国产一区发布| 午夜免费激情av| 免费久久久久久久精品成人欧美视频| 丝袜美足系列| 亚洲专区中文字幕在线| 91精品三级在线观看| 久久性视频一级片| 欧美大码av| 在线观看66精品国产| 久久精品国产亚洲av香蕉五月| 久久亚洲真实| 一级a爱视频在线免费观看| 一级a爱片免费观看的视频| 午夜亚洲福利在线播放| 精品久久久久久电影网| 国产熟女xx| 丁香欧美五月| 久久99一区二区三区| 免费久久久久久久精品成人欧美视频| 中文字幕高清在线视频| 法律面前人人平等表现在哪些方面| 99久久精品国产亚洲精品| 亚洲精品国产一区二区精华液| 欧美不卡视频在线免费观看 | 国产精品1区2区在线观看.| 中文字幕人妻丝袜一区二区| 香蕉国产在线看| 精品国内亚洲2022精品成人| 乱人伦中国视频| 欧美日韩乱码在线| 亚洲第一欧美日韩一区二区三区| 欧美国产精品va在线观看不卡| 80岁老熟妇乱子伦牲交| 后天国语完整版免费观看| 我的亚洲天堂| 丝袜在线中文字幕| 国产一区二区激情短视频| 一区在线观看完整版| 黄色a级毛片大全视频| 久久久久久免费高清国产稀缺| 99精品欧美一区二区三区四区| 日韩高清综合在线| 成人18禁在线播放| 身体一侧抽搐| 好男人电影高清在线观看| 宅男免费午夜| tocl精华| 日日摸夜夜添夜夜添小说| 新久久久久国产一级毛片| 亚洲精华国产精华精| 国产日韩一区二区三区精品不卡| 12—13女人毛片做爰片一| 五月开心婷婷网| 十分钟在线观看高清视频www| 亚洲自偷自拍图片 自拍| 亚洲第一av免费看| 99国产精品一区二区蜜桃av| 色尼玛亚洲综合影院| 欧美成人午夜精品| 欧美老熟妇乱子伦牲交| av福利片在线| 亚洲专区字幕在线| 欧美午夜高清在线| 岛国视频午夜一区免费看| 制服诱惑二区| 亚洲午夜理论影院| 国产不卡一卡二| www.www免费av| 久久 成人 亚洲| 新久久久久国产一级毛片| 亚洲av熟女| 最新美女视频免费是黄的| 免费在线观看影片大全网站| 国产精品爽爽va在线观看网站 | 12—13女人毛片做爰片一| 免费观看人在逋| 欧美中文日本在线观看视频| 无限看片的www在线观看| 美女午夜性视频免费| 亚洲一区二区三区欧美精品| 欧美大码av| 久久欧美精品欧美久久欧美| 长腿黑丝高跟| 十分钟在线观看高清视频www| 香蕉久久夜色| 亚洲欧美日韩无卡精品| 99国产精品一区二区蜜桃av| 日本一区二区免费在线视频| 9191精品国产免费久久| 国产男靠女视频免费网站| 色综合站精品国产| 高清av免费在线| 亚洲精品中文字幕在线视频| 成人亚洲精品一区在线观看| 亚洲欧美精品综合久久99| a级毛片黄视频| 亚洲精品粉嫩美女一区| 狂野欧美激情性xxxx| 国产精品国产高清国产av| 欧美午夜高清在线| av福利片在线| 日韩国内少妇激情av| 天天影视国产精品| 亚洲国产精品一区二区三区在线| 精品第一国产精品| 国产精品综合久久久久久久免费 | 亚洲精品一区av在线观看| 日本免费a在线| 欧美成人免费av一区二区三区| 美女国产高潮福利片在线看| 亚洲片人在线观看| 一区二区三区精品91| 91精品国产国语对白视频| 涩涩av久久男人的天堂| 满18在线观看网站| 伦理电影免费视频| 亚洲专区国产一区二区| 日本五十路高清| 日韩三级视频一区二区三区| 99久久精品国产亚洲精品| 黄色怎么调成土黄色| 99国产极品粉嫩在线观看| 中文字幕人妻丝袜制服| 99久久综合精品五月天人人| 少妇 在线观看| 日本黄色日本黄色录像| 老司机午夜十八禁免费视频| 国产熟女xx| 国产真人三级小视频在线观看| 国产麻豆69| 欧美日韩亚洲高清精品| 精品熟女少妇八av免费久了| 国产精品综合久久久久久久免费 | 国产精品美女特级片免费视频播放器 | 欧美日韩亚洲国产一区二区在线观看| 成人三级黄色视频| 可以免费在线观看a视频的电影网站| 日韩欧美国产一区二区入口| 日韩有码中文字幕| 成人av一区二区三区在线看| 99在线视频只有这里精品首页| 亚洲欧美激情在线| 最近最新免费中文字幕在线| 黄色成人免费大全| 久久精品成人免费网站| av电影中文网址| 日韩欧美在线二视频| 亚洲自拍偷在线| 日韩一卡2卡3卡4卡2021年| 亚洲成人久久性| 两性夫妻黄色片| 亚洲人成网站在线播放欧美日韩| 十八禁人妻一区二区| 两性夫妻黄色片| 又紧又爽又黄一区二区| 日韩av在线大香蕉| 久久热在线av| 人人妻,人人澡人人爽秒播| 国产一卡二卡三卡精品| 日本 av在线| 一个人观看的视频www高清免费观看 | 欧美日韩亚洲综合一区二区三区_| 久久伊人香网站| 人人妻,人人澡人人爽秒播| 久久精品成人免费网站| 国产熟女xx| 亚洲久久久国产精品| 欧美成人免费av一区二区三区| 亚洲国产欧美日韩在线播放| 69av精品久久久久久| 国产精品野战在线观看 | 51午夜福利影视在线观看| 一个人免费在线观看的高清视频| 真人一进一出gif抽搐免费| 两性午夜刺激爽爽歪歪视频在线观看 | 久久国产亚洲av麻豆专区| 国产一区在线观看成人免费| 久久久久久久精品吃奶| 国产高清videossex| 免费日韩欧美在线观看| 国产真人三级小视频在线观看| 亚洲黑人精品在线| 成年女人毛片免费观看观看9| 纯流量卡能插随身wifi吗| 中文字幕色久视频| 亚洲情色 制服丝袜| 亚洲欧美精品综合一区二区三区| 亚洲国产欧美日韩在线播放| 99精国产麻豆久久婷婷| 伦理电影免费视频| 国产男靠女视频免费网站| 国产伦人伦偷精品视频| 精品久久久久久久久久免费视频 | 精品国内亚洲2022精品成人| 亚洲精品一卡2卡三卡4卡5卡| 女生性感内裤真人,穿戴方法视频| 99久久综合精品五月天人人| 亚洲成人久久性| 欧美成人性av电影在线观看| 日韩av在线大香蕉| 国产精品 欧美亚洲| 每晚都被弄得嗷嗷叫到高潮| 国产成人精品无人区| 级片在线观看| av天堂在线播放| 亚洲国产欧美一区二区综合| 亚洲色图综合在线观看| av在线播放免费不卡| 欧美日韩视频精品一区| 女性被躁到高潮视频| 午夜福利免费观看在线| 成人影院久久| 成人三级黄色视频| 久久香蕉激情| 成人国产一区最新在线观看| www.www免费av| 老司机深夜福利视频在线观看| 一区二区日韩欧美中文字幕| 久久久久久亚洲精品国产蜜桃av| 大型黄色视频在线免费观看| 日韩高清综合在线| 成人永久免费在线观看视频| 黄色视频不卡| 夫妻午夜视频| 韩国精品一区二区三区| 国产精品成人在线| 最新在线观看一区二区三区| 亚洲va日本ⅴa欧美va伊人久久| 亚洲av日韩精品久久久久久密| 亚洲国产欧美网| 成人亚洲精品一区在线观看| 黄片播放在线免费| 婷婷六月久久综合丁香| 免费av中文字幕在线| 精品国产一区二区三区四区第35| 97超级碰碰碰精品色视频在线观看| 伊人久久大香线蕉亚洲五| 操美女的视频在线观看| 久久狼人影院| 国产在线精品亚洲第一网站| 久久久国产精品麻豆| 午夜福利影视在线免费观看| 久久久久久久久久久久大奶| 妹子高潮喷水视频| 午夜老司机福利片| 天天影视国产精品| av天堂久久9| 亚洲熟妇熟女久久| 久久精品国产综合久久久| 18禁美女被吸乳视频| 97人妻天天添夜夜摸| 黄片大片在线免费观看| 自线自在国产av| 亚洲成国产人片在线观看| 久久亚洲精品不卡| 精品国产乱子伦一区二区三区| 久久久国产精品麻豆| 中文字幕精品免费在线观看视频| 久久天躁狠狠躁夜夜2o2o| 热re99久久精品国产66热6| 在线观看免费午夜福利视频| 欧美av亚洲av综合av国产av| 亚洲欧洲精品一区二区精品久久久| 99国产精品免费福利视频| 热re99久久国产66热| 精品国产乱码久久久久久男人| 亚洲av五月六月丁香网| 真人一进一出gif抽搐免费| 神马国产精品三级电影在线观看 | 少妇裸体淫交视频免费看高清 | 婷婷六月久久综合丁香| xxx96com| 嫩草影院精品99| 色老头精品视频在线观看| 国产黄色免费在线视频| 亚洲全国av大片| 少妇的丰满在线观看| 黄色女人牲交| 亚洲精品av麻豆狂野| 欧美激情高清一区二区三区| 亚洲专区国产一区二区| 国产欧美日韩综合在线一区二区| 亚洲欧美日韩无卡精品| 国产aⅴ精品一区二区三区波| 亚洲,欧美精品.| 在线观看免费高清a一片| 精品免费久久久久久久清纯| 一区二区三区激情视频| 色婷婷av一区二区三区视频| 午夜福利一区二区在线看| 看免费av毛片| 黄频高清免费视频| 日本黄色视频三级网站网址| 色婷婷av一区二区三区视频| 黄色女人牲交| 精品高清国产在线一区| 啪啪无遮挡十八禁网站| 午夜视频精品福利| 婷婷丁香在线五月| 天堂动漫精品| 无限看片的www在线观看| a级片在线免费高清观看视频| 久久影院123| 啦啦啦 在线观看视频| 午夜福利影视在线免费观看| 中国美女看黄片| 18禁观看日本| 精品久久久久久成人av| 日本黄色日本黄色录像| 亚洲va日本ⅴa欧美va伊人久久| 高清毛片免费观看视频网站 | 两性夫妻黄色片| 日本五十路高清| svipshipincom国产片| 日本黄色日本黄色录像| 国产精品乱码一区二三区的特点 | 淫妇啪啪啪对白视频| 极品教师在线免费播放| 亚洲五月色婷婷综合| 一级片免费观看大全| 久久婷婷成人综合色麻豆| 久久久国产成人精品二区 | 国产成人免费无遮挡视频| 女性生殖器流出的白浆| 老司机在亚洲福利影院| 日本一区二区免费在线视频| 午夜a级毛片| 亚洲 欧美一区二区三区| 日本a在线网址| 999久久久精品免费观看国产| 国产亚洲欧美98| 国产一卡二卡三卡精品| 女人爽到高潮嗷嗷叫在线视频| 免费看十八禁软件| 亚洲伊人色综图| 国产片内射在线| 欧美激情极品国产一区二区三区| 美女国产高潮福利片在线看| av福利片在线| 日本 av在线| 黄色毛片三级朝国网站| 老鸭窝网址在线观看| 亚洲欧美日韩另类电影网站| 在线观看免费日韩欧美大片| 每晚都被弄得嗷嗷叫到高潮| 黄色女人牲交| 成人黄色视频免费在线看| 成人特级黄色片久久久久久久| 久久精品国产亚洲av高清一级| 亚洲国产精品合色在线| 很黄的视频免费| 韩国精品一区二区三区| 国产成人一区二区三区免费视频网站| 麻豆久久精品国产亚洲av | 免费一级毛片在线播放高清视频 | 国产亚洲精品久久久久5区| 高清欧美精品videossex| 美女高潮到喷水免费观看| 国产99久久九九免费精品| 亚洲精品粉嫩美女一区| 国产成人免费无遮挡视频| 午夜福利免费观看在线| 99久久99久久久精品蜜桃| 久久久久久久午夜电影 | 天堂√8在线中文| 成人18禁在线播放| av欧美777| 国产人伦9x9x在线观看| 亚洲国产精品999在线| 成熟少妇高潮喷水视频| 亚洲av成人av| 日本三级黄在线观看| 精品久久久久久久毛片微露脸| 国产精品亚洲一级av第二区| 在线av久久热| 亚洲av成人av| 国产乱人伦免费视频| 女警被强在线播放| 国产真人三级小视频在线观看| 高潮久久久久久久久久久不卡| 欧美激情高清一区二区三区| 热re99久久精品国产66热6| 成年女人毛片免费观看观看9| 久久精品aⅴ一区二区三区四区| 欧美最黄视频在线播放免费 | 香蕉久久夜色| 真人一进一出gif抽搐免费| 国产精品香港三级国产av潘金莲| 丝袜美足系列| 国产精品成人在线| 精品国产一区二区三区四区第35| 黑人巨大精品欧美一区二区mp4| 亚洲免费av在线视频| 亚洲精品美女久久久久99蜜臀| 亚洲自偷自拍图片 自拍| 别揉我奶头~嗯~啊~动态视频| 欧美黑人精品巨大| 黑人操中国人逼视频| 成人手机av| 男女下面进入的视频免费午夜 | 久久久国产成人精品二区 | 岛国在线观看网站| 一进一出抽搐动态| a级片在线免费高清观看视频| 久久精品亚洲熟妇少妇任你| 女警被强在线播放| 久久中文看片网| 岛国在线观看网站| 精品一区二区三区四区五区乱码| 岛国视频午夜一区免费看| 美女国产高潮福利片在线看| 亚洲人成伊人成综合网2020| 深夜精品福利| 97人妻天天添夜夜摸| 两人在一起打扑克的视频| 久久精品影院6| 久热爱精品视频在线9| 久久精品国产99精品国产亚洲性色 | 欧美在线黄色| 色播在线永久视频| 欧美乱妇无乱码| 日韩欧美一区视频在线观看| 看黄色毛片网站| 黄片大片在线免费观看| 国产不卡一卡二| 在线观看舔阴道视频| 亚洲一卡2卡3卡4卡5卡精品中文| 日韩欧美一区二区三区在线观看| 国产精品久久久久成人av| tocl精华| 国产精品国产av在线观看| 亚洲va日本ⅴa欧美va伊人久久|