• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于《現(xiàn)代漢語語義詞典》的未登錄詞語義預(yù)測研究

    2016-10-13 02:25:12尚芬芬顧彥慧戴茹冰李斌周俊生曲維光
    關(guān)鍵詞:語料詞典正確率

    尚芬芬 顧彥慧,? 戴茹冰 李斌 周俊生 曲維光

    ?

    基于《現(xiàn)代漢語語義詞典》的未登錄詞語義預(yù)測研究

    尚芬芬1,2顧彥慧1,2,?戴茹冰3李斌3周俊生1,2曲維光1,2

    1. 南京師范大學(xué)計算機科學(xué)與技術(shù)學(xué)院, 南京 210023; 2. 江蘇省信息安全保密技術(shù)工程研究中心, 南京 210023; 3. 南京師范大學(xué)文學(xué)院, 南京 210097; ? 通信作者, E-mail: gu@njnu.edu.cn

    基于《現(xiàn)代漢語語義詞典》, 首先建立不同語義層次的詞典, 根據(jù)詞典分別構(gòu)建模型并進(jìn)行語義預(yù)測, 然后將各個模型進(jìn)行集成, 通過集成模型再對未登錄詞進(jìn)行語義預(yù)測, 得到較好的預(yù)測性能。利用預(yù)測模型對2000年《人民日報》語料進(jìn)行未登錄詞語義預(yù)測和標(biāo)注, 最終得到帶有未登錄詞語義義項標(biāo)注的語料資源。

    漢語未登錄詞; 語義預(yù)測; 語義標(biāo)注; 集成學(xué)習(xí)

    語義問題一直是自然語言處理領(lǐng)域的研究熱點。文本內(nèi)容的理解必須建立在對文本中每一個詞語的語義理解基礎(chǔ)之上。然而, 由于大量未登錄詞的存在, 其語義未知, 文本中沒有標(biāo)注未登錄詞的句法和語義類別標(biāo)記, 因此很難做到獲取所有詞語的語義, 這對很多自然語言處理(natural language processing, NLP)技術(shù)和其他以語義為基礎(chǔ)的研究是一個挑戰(zhàn)。漢語未登錄詞的語義預(yù)測研究可以為未登錄詞提供語義預(yù)測, 從而為研究者提供語義參考, 對許多NLP應(yīng)用, 如機器翻譯、信息檢索、語義分析、詞典編纂等有重要意義。

    漢語未登錄詞語義預(yù)測的研究難度較大, 因此相關(guān)研究工作較少, 除使用基于知識的模型和基于語料的模型及其混合模型外, 很少有新的模型提出。在已有的研究中使用的詞典資源也比較有限, 使用較多的是《同義詞詞林》(Cilin)。本文通過構(gòu)建多種語義預(yù)測模型, 利用《現(xiàn)代漢語語義詞典》進(jìn)行未登錄詞語義預(yù)測, 并對2000年《人民日報》語料中的未登錄詞進(jìn)行語義預(yù)測和標(biāo)注。

    1 相關(guān)研究

    在對漢語未登錄詞的語義預(yù)測研究中, 學(xué)者們先后提出不同的模型方法, Chen等[1-3]、Lu[4-5]、Tseng等[6-7]以及Qiu等[8-9]等都為漢語未登錄詞語義預(yù)測的研究做出了貢獻(xiàn)。有研究指出, 對于一個8萬詞的詞典而言, 大約有3.51%的未登錄詞存 在[1]。這些未登錄詞中包含復(fù)合名詞51%, 復(fù)合動詞34%, 專業(yè)名詞只占15%[3]。目前對專業(yè)名詞已有大量的研究來確定其語義類別。與只占15% 的專業(yè)名詞相比, 占85% 的復(fù)合詞語的語義類別預(yù)測研究顯得更為重要[10-13]。因此, 近期的研究更多傾向于未登錄詞中復(fù)合詞語的語義猜測, 比如Chen等[3]和Lua[14]的研究。

    關(guān)于漢語未登錄詞語義預(yù)測, 現(xiàn)有研究大多采用基于詞語結(jié)構(gòu)信息和基于規(guī)則的方法, 也有利用未登錄詞上下文信息, 通過計算與已知詞類詞語上下文的相似度來進(jìn)行預(yù)測。依據(jù)模型和算法的不同, 歸納為以下3種方法。

    1) 基于知識的方法。大部分學(xué)者對未登錄詞語義預(yù)測的研究是基于知識的模型, 最早使用該方法的研究者之一是Lua[14], 目的是把雙音節(jié)中文詞分類到同義詞詞林中的大類或者中類, 使用三層反向傳播神經(jīng)網(wǎng)絡(luò), 模擬雙音節(jié)詞的語義類別與其兩個組成字的語義類別之間的依賴性。此后, 又發(fā)展出基于實例的方法[3]以及基于相似度的方法[2]; 文獻(xiàn)[4-5]的研究涉及重疊字模型、字-類別關(guān)聯(lián)模型以及基于規(guī)則的模型。此外, 還有基于《知網(wǎng)》的模型[15-16]。

    2) 基于語料的方法。Lu[4-5]提出的基于語料的模型是根據(jù)未登錄詞出現(xiàn)的上下文預(yù)測其語義類別, 從語料中抽取出《同義詞詞林》中每個語義類別的廣義上下文, 再計算未登錄詞的上下文與每個候選語義類別的廣義上下文之間的相似度, 通過相似度的大小來確定未登錄詞的語義類別。

    3) 基于知識和基于語料的混合方法。Lu[4-5]提出基于知識和基于語料的混合模型, 使用基于知識的模型為每個未登錄詞提供候選語義類別, 然后從語料中抽取《同義詞詞林》中每個語義類別的廣義上下文, 再計算出未登錄詞的上下文與每個候選語義類別的廣義上下文之間的相似度。

    早期的研究主要集中在基于知識的模型, 隨后出現(xiàn)加入上下文信息的模型研究, 但效果不是很好, 接著使用基于知識的模型與基于上下文信息松散結(jié)合的混合模型, 效果也不理想。近期的研究將未登錄詞的知識與上下文信息更緊密地結(jié)合成混合模型, 取得較好的預(yù)測效果。

    2 語義資源及詞典構(gòu)建

    漢語未登錄詞語義預(yù)測研究使用較多的語義資源是《同義詞詞林》, 少部分研究使用《知網(wǎng)》(HowNet), 幾乎沒有相關(guān)研究使用《現(xiàn)代漢語語義詞典》(The Semantic Knowledge-base of Contem-porary Chinese, SKCC)[17-18]?!冬F(xiàn)代漢語語義詞典》擁有豐富的語義義項分類, 并且各個義項下有充分的成員詞語, 因此, 本文利用該詞典進(jìn)行未登錄詞語義預(yù)測的研究。

    2.1 語義資源介紹

    本文未登錄詞語義預(yù)測研究使用的語義資源是《現(xiàn)代漢語語義詞典》,這是一部面向NLP的語義知識庫,收錄6.5萬余條漢語實詞。作為綜合型語言知識庫(Comprehensive Language Knowledge Base, CLKB)的一部分, SKCC廣泛應(yīng)用于計算詞匯語義學(xué)的基礎(chǔ)研究和應(yīng)用研究中。SKCC采用Microsoft Access數(shù)據(jù)庫實現(xiàn), 其中包含全部詞語的總庫1個, 每類詞語(實詞)各建一庫, 每個庫文件中都包含詞語與其語義的關(guān)系。由于名詞庫的分類較為詳細(xì), 因此本文主要研究名詞庫的詞語。

    根據(jù)SKCC名詞庫的語義分類, 可以分五級對語義詞典SKCC名詞庫中不同語義層次的詞語數(shù)目進(jìn)行統(tǒng)計, 如表1所示。

    表1 語義詞典SKCC名詞庫中不同語義層次的詞語數(shù)目

    2.2 詞典構(gòu)建

    利用SKCC進(jìn)行未登錄詞語義預(yù)測, 屬于基于詞典的方法, 是根據(jù)詞典中詞語的信息構(gòu)造預(yù)測模型, 需要詞典中詞語位于詞典樹型結(jié)構(gòu)的同一語 義層次, 便于統(tǒng)計每個語義類別中的詞語信息。SKCC的語義體系呈現(xiàn)樹型結(jié)構(gòu), 但是語義詞典SKCC名詞庫中的詞語并不是全都劃分到樹型結(jié)構(gòu)的最底層, 而是劃分到不同的語義層次(如圖1所示), 這樣不便于語義分類。因此, 先構(gòu)造出語義類別的樹型結(jié)構(gòu), 再將所有詞語都?xì)w為第一級來構(gòu)造詞典。由于劃分到第一級語義類別粒度較大, 因此再將詞語盡量(當(dāng)詞語無法向下級語義劃分時, 則將該詞去除)歸為第二級和第三級, 由第二級和第三級詞語信息構(gòu)造詞典。本文分別構(gòu)建3個SKCC詞典。

    2.2.1 第一級語義類別SKCC1

    將SKCC中所有詞語都?xì)w為第一級語義類別匯總, 記為SKCC1。第一級的各個語義類別所包含的詞語數(shù)目如表2所示。

    表2 SKCC1的各個語義類別詞語數(shù)目

    2.2.2 第二級語義類別SKCC2

    語義詞典SKCC的詞語劃分到第二級語義類 別中所構(gòu)造的詞典, 記為SKCC2。構(gòu)造語義詞典SKCC2時, 語義詞典SKCC的詞語語義類別向上劃分, 可以全部劃分到父節(jié)點(也就是第一級語義類別中), 但是如果劃分到第二級語義類別中時, 所有歸屬于第一級語義類別的詞語就無法向下劃分到第二級的語義類別中。因此, 基于SKCC2詞典的研究只包含屬于二級及以下類別的詞語, 并且將這些詞語都向上劃分到第二級父節(jié)點上的詞語。

    第二級語義類別分為16個。SKCC名詞庫劃到第二級的16個語義類別的詞語數(shù)目如表3所示。

    表3 SKCC2的各個語義類別及類別下詞語數(shù)目

    2.2.3 第三級語義類別SKCC3

    語義詞典SKCC的詞語劃分到第三級語義類別中所構(gòu)造的詞典, 記為SKCC3。將詞語劃歸到第三級語義層次時, 所有歸屬于第一級和第二級語義類別的詞語由于所屬語義節(jié)點層次高, 難以向下劃分到第三級的語義類別中。因此, 基于SKCC3詞典的研究只包含屬于三級及以下類別的詞語, 并且把這些詞語都向上劃分到第三級父節(jié)點上。

    第三級語義類別分為17個, 具體語義類別和詞語數(shù)目如表4所示。其中, 語義類別“非生物構(gòu)件”的詞數(shù)為0, 原因是詞語劃分到其祖先類別中, 該類別沒有詞語和子類別。

    表2 SKCC3的各個語義類別及類別下詞語數(shù)目

    3 模型構(gòu)建

    根據(jù)詞典詞語信息, 分別構(gòu)建基于重疊字的模型、基于字-類別關(guān)聯(lián)的模型(Character-Category Association Model)和基于規(guī)則的模型。

    3.1 基于重疊字的模型

    根據(jù)現(xiàn)代漢語的構(gòu)詞規(guī)則, 大多數(shù)新詞的語義都與其組成詞素相關(guān), 兩者之間有著相同或者相近的語義, 不同詞語共享相同的組成詞素極為常見, 因此利用詞語組成詞素相重疊的知識可以更好地預(yù)測新構(gòu)成詞語的語義義項。重疊字模型通過計算未登錄詞與每個語義類別成員詞的重疊字個數(shù)來預(yù)測未登錄詞的語義類別。

    對于Cilin中的每個語義類別, 抽取其成員詞的所有不重復(fù)的字, 并且統(tǒng)計每個字現(xiàn)在詞頭、詞中、詞尾的總頻數(shù)。根據(jù)這些信息, 提出3對變式。在每一對變式中, 變式a通過計算類別和未登錄詞的重疊字的數(shù)目, 計算出未登錄詞的一個類別的得分。相應(yīng)地, 變式b計算上述分?jǐn)?shù)的一個帶權(quán)值的或歸一化的副本。這些變式中, Score(Cat,)表示分配類別Cat為未登錄詞類別的得分;代表未 登錄詞的長度;c代表未登錄詞的第個字;P表示第個字c在詞中的位置, 包括{詞頭, 詞中, 詞尾};(c)表示類別Cat中第個字的全部頻率;(c,p)表示在Cat中位于pc的頻率;表示在Cat中的字的總數(shù);N表示在類別Cat中, 位于位置p的字的總數(shù);N表示在類別Cat中詞的總數(shù)。

    變式1: 變式1a中, 類別的得分是這個類別中未登錄詞的每個組成字出現(xiàn)次數(shù)的總和; 變式1b中, 每個次數(shù)都由類別中字的總數(shù)加權(quán)得到。

    變式2: 變式2a中, 類別的得分是這個類別中未登錄詞的每個組成字在未登錄詞的相應(yīng)位置出現(xiàn)次數(shù)的總和; 變式2b中, 每個次數(shù)由類別中字在未登錄詞相應(yīng)位置出現(xiàn)的總數(shù)加權(quán)得到。

    變式3: 變式3a中, 類別的得分是這個類別中未登錄詞的尾字c在未登錄詞的詞尾p出現(xiàn)的數(shù)的總和; 變式3b中, 得分是由類別中所有詞總數(shù)加權(quán)得到。

    變式1用最直接的方法得到重疊字語義的預(yù)測, 變式2與每個組成字在未登錄詞和類別的成員詞中出現(xiàn)的位置相關(guān), 變式3只考慮未登錄詞的最后一個字和每個類別成員詞的最后一個字。每一個變式, 得分最高的類別被推薦為未登錄詞的類別。

    3.2 基于字-類別關(guān)聯(lián)的模型

    字-類別關(guān)聯(lián)模型采用多種復(fù)雜的信息理論模型來估算詞語組成字與語義類別之間的關(guān)聯(lián), 再估算詞語與語義類別之間的關(guān)聯(lián), 為未登錄詞預(yù)測合適的語義。字-類別關(guān)聯(lián)模型計算字與語義類別之間的關(guān)聯(lián)值, 使用的統(tǒng)計量包括互信息和2, 如式(7)~(9)所示:

    其中, Asso(Char, Cat)表示字符Char與語義類別Cat的關(guān)聯(lián),()和()分別表示的概率和頻率。

    計算出字-類關(guān)聯(lián)后, 詞-類關(guān)聯(lián)就可以通過對類別和詞的每個組成字的關(guān)聯(lián)加權(quán)求和計算出來, 如式(10)所示:

    其中, Char表示詞的第個字符, ||表示詞的長度,表示Char與Cat之間關(guān)聯(lián)的權(quán)重,的和為1。

    3.3 基于規(guī)則的模型

    基于規(guī)則模型的原理是觀察未登錄詞的組成結(jié)構(gòu)信息, 對之進(jìn)行歸納總結(jié), 獲得可以匹配到更多未登錄詞詞語結(jié)構(gòu)的規(guī)則。通過設(shè)定的規(guī)則模式進(jìn)行未登錄詞語義的預(yù)測, 實際上是依據(jù)未登錄詞組成字的句法和語義類別來預(yù)測未登錄詞子集的語義類別?;谝?guī)則的方法是對不同長度的未登錄詞分別設(shè)計不同的規(guī)則集。例如: 對于三字長的未登錄詞ABC, 如果BC與“學(xué)家”相同, 猜測ABC為SKCC1的類別“具體事物”, 如表5所示。

    表5 三字詞ABC規(guī)則A+“學(xué)家”舉例

    4 模型實驗

    4.1 實驗語料與預(yù)處理

    實驗中使用1998年1月的《人民日報》語料, 該語料主要用于抽選測試詞。測試詞抽取條件是: 分別從構(gòu)造的語義詞典中隨機抽取; 存在于1998年1月的《人民日報》語料中; 詞語長度為2~4個字; 詞語詞性為名詞。對1998年1月的《人民日報》語料做如下的預(yù)處理: 1) 處理為包含詞語、詞性標(biāo)記和詞頻信息的格式; 2) 過濾掉停用詞和命名實體; 3) 抽取出詞性標(biāo)記為n的詞語。

    4.2 實驗與分析

    從SKCC1中隨機抽取3000個測試詞, 這些是已知語義類別的詞語, 再從SKCC1中去除這3000個詞語。然后, 基于去除測試詞的SKCC1, 利用構(gòu)建的模型進(jìn)行語義預(yù)測, 并對比其正確的語義類別, 計算語義分類的正確率。

    實驗1 基于重疊字模型的6個變式的未登錄 詞語義預(yù)測正確數(shù)和正確率。抽取未登錄詞的總數(shù)為3000, 實驗結(jié)果如表6所示。結(jié)果顯示, 這些模型的正確率都較高, 其中最高值是變式2a得到的77.0%。

    表6 基于SKCC1詞典的重疊字模型預(yù)測結(jié)果

    實驗 2 基于字-類別關(guān)聯(lián)模型不同統(tǒng)計量的未登錄詞語義預(yù)測正確數(shù)和正確率。抽取未登錄詞的總數(shù)為3000, 實驗結(jié)果如表7所示。結(jié)果顯示, 統(tǒng)計量MI與2相比,2得到更高的語義預(yù)測正確率, 為74.3%。

    表7 基于SKCC1詞典的字-類別關(guān)聯(lián)模型預(yù)測結(jié)果

    實驗3 基于規(guī)則模型的未登錄詞語義預(yù)測正確數(shù)和正確率。所抽取的未登錄詞總數(shù)為861, 即在3000個測試詞語中, 模型預(yù)測出語義的詞語共 有861個, 實驗結(jié)果如表8所示。可以看出, 正確 率很高, 但是召回率很低。

    表8 基于SKCC1詞典的規(guī)則模型的未登錄詞語義預(yù)測結(jié)果

    實驗4 多模型的集成。由于基于規(guī)則的模型得到的預(yù)測正確率較高, 但召回率較低, 因此本實驗設(shè)計基于規(guī)則的模型與其他模型的集成。集成模型的預(yù)測語義由以下兩條確定。

    1) 如果能夠由基于規(guī)則的模型預(yù)測出語義, 則將這個語義作為混合模型預(yù)測語義。

    2) 如果基于規(guī)則的模型不能夠給出預(yù)測語義, 那么對基于重疊字模型和基于字-類別關(guān)聯(lián)模型的語義預(yù)測進(jìn)行投票, 并對投票結(jié)果進(jìn)行排序, 取票數(shù)最高的語義類別作為該未登錄詞的混合模型預(yù)測語義。

    集成模型對所抽取出的3000個未登錄詞進(jìn)行語義預(yù)測, 得到的正確數(shù)和正確率如表9所示??梢娂赡P偷玫捷^高的正確率(77.9%), 同時也克服了基于規(guī)則模型召回率較低的問題, 獲得較好的未登錄詞語義預(yù)測性能。

    表9 基于SKCC1詞典的集成模型語義預(yù)測結(jié)果

    5 漢語未登錄詞語義預(yù)測應(yīng)用

    在基于不同詞典和不同模型對2000年《人民日報》語料的未登錄詞標(biāo)注中, 基于規(guī)則的模型得到的預(yù)測正確率較高, 但是其覆蓋率較低。比如詞語“股東會”, 在基于規(guī)則模型中, 基于SKCC3得到預(yù)測語義“人”; 該詞在字-類別關(guān)聯(lián)模型的預(yù)測結(jié)果為SKCC3 “人, 人”; 在重疊字模型中, 該詞語的預(yù)測結(jié)果為SKCC3 “人”。預(yù)測語義都與對應(yīng)人工標(biāo)注相同。集成模型結(jié)合了基于規(guī)則的模型與其他模型, 得到較高的正確率, 可見集成模型對基于SKCC3的語義預(yù)測性能較好。本文根據(jù)基于SKCC3的集成模型所獲得的未登錄詞預(yù)測語義標(biāo)注到2000年《人民日報》語料中, 所得到的語料示例如表10所示。

    表10 基于SKCC3標(biāo)注未登錄詞語義語料示例

    表10的語料示例中共有3個未登錄名詞, 分別是“主景”、“凹版”、“凹凸感”。其中, 詞語“凹凸感”語義預(yù)測有誤, 正確語義應(yīng)該為“意識”而不是“情感”, 其余兩個詞語語義預(yù)測正確。

    在基于SKCC對2000年《人民日報》語料的研究中, 未登錄詞的語義可以劃分到SKCC第二級和第三級。但是, 由于尚無對2000年《人民日報》語料未登錄詞語義標(biāo)注的標(biāo)準(zhǔn)語料, 無法確定未登錄詞預(yù)測語義的正確性。針對這個問題, 本文取基于SKCC已標(biāo)注的第二級語義和第三級語義進(jìn)行分析。

    假設(shè)未登錄詞預(yù)測出的第三級語義為GuessThirdCat(), GuessThirdCat()在SKCC樹型語義結(jié)構(gòu)的上一級語義為SecondCat(), 預(yù)測出的在SKCC中第二級的語義為GuessSecondCat(), 如果GuessSecondCat() = SecondCat(), 那么認(rèn)為該未登錄詞所預(yù)測的二級語義為正確的。使用該評估方法可以判定2000年《人民日報》語料中12162個未登錄詞的預(yù)測語義正確, 正確率為72.2%。

    6 總結(jié)與展望

    本文首次使用《現(xiàn)代漢語語義詞典》進(jìn)行漢語未登錄詞語義預(yù)測的研究, 通過構(gòu)建的模型對2000年《人民日報》語料的未登錄詞進(jìn)行語義預(yù)測和標(biāo)注, 得到具有未登錄詞語義標(biāo)注的語料。在未來的工作中, 我們將探索改進(jìn)語義預(yù)測方法, 并嘗試將未登錄詞語義預(yù)測拓展到實際應(yīng)用中。

    [1]Chen H, Lin C. Sense-tagging Chinese corpus // Proceedings of ACL-2000 Workshop on Chinese Language. Hong Kong, 2000: 7?14

    [2]Chen C. Character-sense association and compoun-ding template similarity: automatic semantic classifica-tion of Chinese compounds // Proceedings of the 3rd SIGHAN Workshop on Chinese Language Processing. Barcelona, 2004: 33?40

    [3]Chen K, Chen C. Automatic semantic classification for Chinese unknown compound nouns // Proceedings of the 18th International Conference on Computa-tional Linguistics (COLING). Saarbrücken, 2000: 173?179

    [4]Lu Xiaofei. Hybrid model for Chinese unknown word resolution [D]. Ohio: The Ohio State University, 2006

    [5]Lu Xiaofei. Hybrid model for semantic classification of Chinese unknown words // Proceedings of North American Chapter of the Association for Computa-tional Linguistics: Human Language Technologies. Rochester, 2007: 188?195

    [6]Tseng H. Semantic classification of Chinese unknown words // Proceedings of the Student Research Work-shop at the 41st Annual Meeting of the Association for Computational Linguistics (ACL). Sapporo, 2003: 72?79

    [7]Tseng H, Chen K J. Design of Chinese morphological analyzer // Proceedings of the First SIGHAN Work-shop on Chinese Language Processing. Stroudsburg, 2002: 1?7

    [8]Qiu Likun, Wu Yunfang, Shao Yanqiu. Combining contextual and structural information for supersense tagging of Chinese unknown words // Proceedings of CICLing, PartⅠ, LNCS 6608. Tokyo, 2011: 15?28

    [9]Qiu Likun, Zhao Kai, Hu Changjian. A hybrid model for sense guessing of Chinese unknown words // Proceedings of 23rd Pacific Asia Conference on Language, Information and Computation (PACLIC). Hong Kong, 2009: 464?473

    [10]Cucerzan S. Large-scale named entity disambiguation based on wikipedia data // Procedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Lan-guage Learning. Prague, 2007: 708?716

    [11]周俊生, 戴新宇, 尹存燕, 等. 基于層疊條件隨機場模型的中文機構(gòu)名自動識別. 電子學(xué)報, 2006, 34(5): 804?809

    [12]陳鈺楓, 宗成慶, 蘇克毅. 漢英雙語命名實體識別與對齊的交互式方法. 計算機學(xué)報, 2011, 34(9): 1688?1696

    [13]馮元勇, 孫樂, 張大鯤, 等. 基于小規(guī)模尾字特征的中文命名實體識別研究. 電子學(xué)報, 2008, 36(9): 1833?1837

    [14]Lua K T. Prediction of meaning of bi-syllabic Chinese compound words using back propagation neural net-work. Computational Processing of Oriental Langua- ges, 1997, 11(2): 133?144

    [15]張瑞霞, 肖漢. 基于《知網(wǎng)》的詞圖構(gòu)造. 華北水利水電學(xué)院學(xué)報, 2008, 29(3): 53?56

    [16]張瑞霞, 楊國增, 閆新慶. 基于《知網(wǎng)》的漢語普通未登錄詞語義分析模型. 計算機應(yīng)用與軟件, 2012, 29(8): 126?130

    [17]王惠, 詹衛(wèi)東, 俞士汶. 現(xiàn)代漢語語義詞典規(guī)格說明書. 漢語語言與計算學(xué)報, 2003, 13(2): 159?176

    [18]Bai M H, Hsieh Y M, Chen K J, et al. Translating Chinese unknown words by automatically acquired templates // Proceedings of the Sixth International Joint Conference on Natural Language Processing (IJCNLP). Nagoya, 2013: 839?843

    Research on the Sense Guessing of Chinese Unknown Words Based on “Semantic Knowledge-base of Modern Chinese”

    SHANG Fenfen1,2, GU Yanhui1,2,?, DAI Rubing3, LI Bin3, ZHOU Junsheng1,2, QU Weiguang1,2

    1. School of Computer Science and Technology, Nanjing Normal University, Nanjing 210023; 2. Jiangsu Research Center of Information Security & Privacy Technology, Nanjing 210023; 3. School of Chinese Language and Culture, Nanjing 210097; ? Corresponding author, E-mail: gu@njnu.edu.cn

    Based on the research issue of sense guessing of Chinese unknown words, different levels of semantic dictionary were introduced by applying “Semantic Knowledge-base of Modern Chinese”. Models have constructed for sense guessing by using these dictionary. Each model was intergrated to predict the unknown words and obtained better performance. Based on each model, semantic prediction and annotation of the unknown words in People’s Daily which published in 2000 were evaluated. Finally, corpus resources with the sense annotation of unknown words were obtained.

    Chinese unknown words; sense guessing; semantic annotation; ensemble learning

    10.13209/j.0479-8023.2016.009

    TP391

    2015-06-19;

    2015-09-03; 網(wǎng)絡(luò)出版日期: 2015-09-30

    國家自然科學(xué)基金(61272221, 61472191)、國家社會科學(xué)基金(11CYY030, 10CYY021)、江蘇省社會科學(xué)基金(12YYA002)和江蘇省高校自然科學(xué)基金(14KJB520022)資助

    猜你喜歡
    語料詞典正確率
    門診分診服務(wù)態(tài)度與正確率對護患關(guān)系的影響
    米沃什詞典
    文苑(2019年24期)2020-01-06 12:06:50
    評《現(xiàn)代漢語詞典》(第6版)
    詞典例證翻譯標(biāo)準(zhǔn)探索
    基于語料調(diào)查的“連……都(也)……”出現(xiàn)的語義背景分析
    生意
    品管圈活動在提高介入手術(shù)安全核查正確率中的應(yīng)用
    天津護理(2016年3期)2016-12-01 05:40:01
    生意
    故事會(2016年15期)2016-08-23 13:48:41
    華語電影作為真實語料在翻譯教學(xué)中的應(yīng)用
    《苗防備覽》中的湘西語料
    精品国产一区二区久久| 国产亚洲精品综合一区在线观看 | 自线自在国产av| 色婷婷久久久亚洲欧美| 可以在线观看毛片的网站| 午夜成年电影在线免费观看| 人妻久久中文字幕网| 人人妻人人澡人人看| 国产熟女午夜一区二区三区| 午夜福利免费观看在线| 欧美亚洲日本最大视频资源| 夜夜看夜夜爽夜夜摸 | 午夜免费成人在线视频| 午夜影院日韩av| 侵犯人妻中文字幕一二三四区| 搡老熟女国产l中国老女人| 夫妻午夜视频| 老司机福利观看| 免费不卡黄色视频| 欧美人与性动交α欧美精品济南到| 亚洲欧美一区二区三区黑人| 日韩三级视频一区二区三区| 久久久国产精品麻豆| 亚洲美女黄片视频| 国产精品98久久久久久宅男小说| 免费在线观看视频国产中文字幕亚洲| 国产日韩一区二区三区精品不卡| www.熟女人妻精品国产| 欧美中文日本在线观看视频| 首页视频小说图片口味搜索| 露出奶头的视频| 国产91精品成人一区二区三区| 女人高潮潮喷娇喘18禁视频| 国产99白浆流出| 精品少妇一区二区三区视频日本电影| 久久精品亚洲熟妇少妇任你| 国产1区2区3区精品| 亚洲欧洲精品一区二区精品久久久| 久久久精品国产亚洲av高清涩受| 99riav亚洲国产免费| 大型av网站在线播放| 亚洲精品中文字幕一二三四区| 国产一区二区激情短视频| 岛国视频午夜一区免费看| 人人妻人人爽人人添夜夜欢视频| 黄色女人牲交| 波多野结衣高清无吗| 长腿黑丝高跟| 久热这里只有精品99| 一级a爱片免费观看的视频| 韩国精品一区二区三区| 久久久久亚洲av毛片大全| 在线观看免费视频日本深夜| 免费av中文字幕在线| 国产国语露脸激情在线看| 男女下面插进去视频免费观看| 18禁美女被吸乳视频| 在线看a的网站| 丝袜人妻中文字幕| 中文字幕另类日韩欧美亚洲嫩草| 亚洲久久久国产精品| 黄片小视频在线播放| 18禁国产床啪视频网站| 亚洲精品一二三| 亚洲精品美女久久av网站| 欧美黑人欧美精品刺激| 亚洲成av片中文字幕在线观看| 国产午夜精品久久久久久| 波多野结衣av一区二区av| a级毛片黄视频| 欧美国产精品va在线观看不卡| 国产成人精品久久二区二区免费| 国产成人av激情在线播放| 淫妇啪啪啪对白视频| 在线播放国产精品三级| 欧美成人免费av一区二区三区| 黄色片一级片一级黄色片| 在线观看免费午夜福利视频| 最近最新免费中文字幕在线| 亚洲黑人精品在线| 最近最新中文字幕大全免费视频| 免费高清在线观看日韩| 亚洲av第一区精品v没综合| 国产成人精品在线电影| videosex国产| 午夜a级毛片| 亚洲 国产 在线| 久久久久久免费高清国产稀缺| 欧美日韩av久久| 亚洲av五月六月丁香网| 欧美性长视频在线观看| www日本在线高清视频| 高清欧美精品videossex| 99久久99久久久精品蜜桃| 日韩大尺度精品在线看网址 | 成人手机av| 一区二区三区精品91| 欧美成狂野欧美在线观看| 真人一进一出gif抽搐免费| 国产熟女午夜一区二区三区| 久久久久九九精品影院| 色精品久久人妻99蜜桃| 国产av又大| 国产精华一区二区三区| 别揉我奶头~嗯~啊~动态视频| 无人区码免费观看不卡| 精品欧美一区二区三区在线| 欧洲精品卡2卡3卡4卡5卡区| 自拍欧美九色日韩亚洲蝌蚪91| 精品一区二区三区四区五区乱码| 精品久久蜜臀av无| 国产欧美日韩综合在线一区二区| 黄色片一级片一级黄色片| 极品人妻少妇av视频| 十分钟在线观看高清视频www| 首页视频小说图片口味搜索| 免费在线观看亚洲国产| 夫妻午夜视频| 国产精品一区二区在线不卡| www.精华液| www.精华液| 91老司机精品| 怎么达到女性高潮| 高潮久久久久久久久久久不卡| 高清欧美精品videossex| 激情在线观看视频在线高清| 97人妻天天添夜夜摸| 日韩国内少妇激情av| 欧美日韩av久久| 一边摸一边做爽爽视频免费| 麻豆成人av在线观看| 欧美日韩av久久| 亚洲精品成人av观看孕妇| 久久香蕉精品热| 午夜精品国产一区二区电影| 午夜免费成人在线视频| 精品电影一区二区在线| 国产又爽黄色视频| 亚洲成人精品中文字幕电影 | 久久精品国产亚洲av香蕉五月| 色在线成人网| 亚洲国产毛片av蜜桃av| 久久国产乱子伦精品免费另类| 国产av又大| 国产91精品成人一区二区三区| 欧美亚洲日本最大视频资源| 高潮久久久久久久久久久不卡| 50天的宝宝边吃奶边哭怎么回事| 久久影院123| 国产高清国产精品国产三级| 男女高潮啪啪啪动态图| 成年女人毛片免费观看观看9| 日日摸夜夜添夜夜添小说| 九色亚洲精品在线播放| 久久久久亚洲av毛片大全| a级片在线免费高清观看视频| 极品教师在线免费播放| 日韩高清综合在线| 亚洲色图 男人天堂 中文字幕| 桃红色精品国产亚洲av| 在线观看免费日韩欧美大片| 国产精品成人在线| 亚洲一卡2卡3卡4卡5卡精品中文| a在线观看视频网站| 国产色视频综合| 免费在线观看黄色视频的| 欧美久久黑人一区二区| 成年版毛片免费区| 日韩欧美一区二区三区在线观看| 一个人观看的视频www高清免费观看 | 国产主播在线观看一区二区| 在线天堂中文资源库| 国产精品久久视频播放| 久久久国产成人精品二区 | 国产免费av片在线观看野外av| 国产一区二区三区在线臀色熟女 | 欧美一区二区精品小视频在线| 国产精品二区激情视频| 别揉我奶头~嗯~啊~动态视频| 50天的宝宝边吃奶边哭怎么回事| 少妇 在线观看| 日韩成人在线观看一区二区三区| 亚洲av第一区精品v没综合| 成熟少妇高潮喷水视频| 国产精品一区二区精品视频观看| 国产一卡二卡三卡精品| 久久精品成人免费网站| 99久久综合精品五月天人人| a级毛片黄视频| 久久精品国产亚洲av香蕉五月| 久久久久久久久久久久大奶| 成人18禁高潮啪啪吃奶动态图| 每晚都被弄得嗷嗷叫到高潮| 老汉色av国产亚洲站长工具| 国产精品偷伦视频观看了| av国产精品久久久久影院| 大型黄色视频在线免费观看| 久久精品影院6| 一区二区三区精品91| 国产精品久久电影中文字幕| 侵犯人妻中文字幕一二三四区| 欧美日本亚洲视频在线播放| 亚洲熟妇熟女久久| 一级,二级,三级黄色视频| 在线av久久热| 午夜免费鲁丝| 麻豆久久精品国产亚洲av | 黄片播放在线免费| 欧美激情久久久久久爽电影 | 亚洲国产毛片av蜜桃av| 俄罗斯特黄特色一大片| 这个男人来自地球电影免费观看| 99香蕉大伊视频| 久久午夜综合久久蜜桃| 亚洲人成网站在线播放欧美日韩| 亚洲精品久久成人aⅴ小说| 男女下面插进去视频免费观看| 亚洲欧美精品综合久久99| 一区二区三区国产精品乱码| 每晚都被弄得嗷嗷叫到高潮| 女生性感内裤真人,穿戴方法视频| 免费在线观看黄色视频的| 精品高清国产在线一区| 变态另类成人亚洲欧美熟女 | 欧美激情极品国产一区二区三区| 88av欧美| 亚洲av第一区精品v没综合| 免费在线观看亚洲国产| 91大片在线观看| 日本vs欧美在线观看视频| 亚洲色图综合在线观看| 99久久人妻综合| 亚洲av第一区精品v没综合| 免费久久久久久久精品成人欧美视频| 午夜福利影视在线免费观看| 国产精品影院久久| 大陆偷拍与自拍| 久久精品国产99精品国产亚洲性色 | 在线永久观看黄色视频| 日韩大码丰满熟妇| 国产精品一区二区在线不卡| 久久久久久免费高清国产稀缺| 一二三四社区在线视频社区8| a在线观看视频网站| 久久热在线av| 国产精品综合久久久久久久免费 | 亚洲专区中文字幕在线| 90打野战视频偷拍视频| 亚洲人成电影免费在线| 国产又色又爽无遮挡免费看| 亚洲av电影在线进入| 高清毛片免费观看视频网站 | 搡老熟女国产l中国老女人| 国产深夜福利视频在线观看| 亚洲人成77777在线视频| 国产麻豆69| 日韩免费高清中文字幕av| 色在线成人网| 日日干狠狠操夜夜爽| 久久伊人香网站| 又黄又爽又免费观看的视频| av视频免费观看在线观看| 精品福利永久在线观看| 亚洲欧美精品综合久久99| 激情在线观看视频在线高清| 精品乱码久久久久久99久播| 夜夜爽天天搞| 亚洲av片天天在线观看| 日本黄色日本黄色录像| 欧洲精品卡2卡3卡4卡5卡区| 国产成人系列免费观看| aaaaa片日本免费| 久久婷婷成人综合色麻豆| av超薄肉色丝袜交足视频| 香蕉久久夜色| 90打野战视频偷拍视频| 看片在线看免费视频| 在线免费观看的www视频| 99久久综合精品五月天人人| 日韩成人在线观看一区二区三区| 在线观看免费午夜福利视频| 999精品在线视频| 久久天躁狠狠躁夜夜2o2o| 中文字幕精品免费在线观看视频| 国产av精品麻豆| 免费在线观看日本一区| 人人妻人人爽人人添夜夜欢视频| 最新美女视频免费是黄的| 日本欧美视频一区| 夜夜夜夜夜久久久久| 色哟哟哟哟哟哟| 这个男人来自地球电影免费观看| 久热爱精品视频在线9| 一夜夜www| 亚洲国产欧美网| 99在线人妻在线中文字幕| 自拍欧美九色日韩亚洲蝌蚪91| 久久久久亚洲av毛片大全| 黄片大片在线免费观看| 久久国产亚洲av麻豆专区| 亚洲国产欧美日韩在线播放| 757午夜福利合集在线观看| 午夜a级毛片| 嫁个100分男人电影在线观看| 免费在线观看日本一区| 国产亚洲精品第一综合不卡| 亚洲aⅴ乱码一区二区在线播放 | 久久这里只有精品19| 久久人人爽av亚洲精品天堂| 超碰97精品在线观看| 日韩视频一区二区在线观看| 老司机午夜十八禁免费视频| 欧美乱码精品一区二区三区| 99re在线观看精品视频| 日本a在线网址| 99久久精品国产亚洲精品| 女性被躁到高潮视频| 国产在线观看jvid| 亚洲av电影在线进入| 亚洲第一欧美日韩一区二区三区| 97人妻天天添夜夜摸| 久久精品国产清高在天天线| 丝袜人妻中文字幕| 男女高潮啪啪啪动态图| 黄网站色视频无遮挡免费观看| 亚洲熟妇中文字幕五十中出 | 国产精品一区二区精品视频观看| 日韩欧美三级三区| 三级毛片av免费| a级毛片黄视频| 中文字幕人妻丝袜一区二区| 无人区码免费观看不卡| 老司机亚洲免费影院| 十八禁网站免费在线| 亚洲免费av在线视频| 国产精品98久久久久久宅男小说| 亚洲精品美女久久av网站| 亚洲第一欧美日韩一区二区三区| 精品国产超薄肉色丝袜足j| 俄罗斯特黄特色一大片| 黑人猛操日本美女一级片| ponron亚洲| 99国产精品一区二区蜜桃av| 99在线视频只有这里精品首页| 久久久国产成人免费| 日本三级黄在线观看| 在线观看www视频免费| 亚洲av成人av| 夜夜夜夜夜久久久久| 久久香蕉精品热| 免费高清在线观看日韩| 丰满人妻熟妇乱又伦精品不卡| 一边摸一边做爽爽视频免费| 大陆偷拍与自拍| 最新美女视频免费是黄的| 午夜免费成人在线视频| av超薄肉色丝袜交足视频| 在线看a的网站| www.熟女人妻精品国产| 久久久久久人人人人人| 国产欧美日韩精品亚洲av| 欧洲精品卡2卡3卡4卡5卡区| 在线观看www视频免费| 在线看a的网站| 欧美最黄视频在线播放免费 | 老汉色av国产亚洲站长工具| 日韩欧美在线二视频| 日韩欧美国产一区二区入口| www.www免费av| 亚洲中文日韩欧美视频| 男女午夜视频在线观看| 又大又爽又粗| 成人精品一区二区免费| 搡老岳熟女国产| 久久香蕉激情| 亚洲色图av天堂| 亚洲中文av在线| 国产精品一区二区在线不卡| 午夜影院日韩av| 成人黄色视频免费在线看| a级毛片黄视频| 91成年电影在线观看| 成人18禁高潮啪啪吃奶动态图| 国产成人系列免费观看| 中文字幕人妻熟女乱码| 变态另类成人亚洲欧美熟女 | 母亲3免费完整高清在线观看| 看片在线看免费视频| 国产蜜桃级精品一区二区三区| 老司机福利观看| 精品一品国产午夜福利视频| 欧美大码av| 国产成年人精品一区二区 | 久久久国产成人精品二区 | 精品一区二区三区av网在线观看| 久久精品影院6| 日日爽夜夜爽网站| 大陆偷拍与自拍| 一本大道久久a久久精品| 久久精品国产亚洲av高清一级| 日韩精品中文字幕看吧| 日韩高清综合在线| 欧美日韩黄片免| 香蕉国产在线看| 国产99白浆流出| 国产欧美日韩一区二区精品| 嫩草影视91久久| 日韩有码中文字幕| 久热爱精品视频在线9| 日本免费a在线| 日韩大尺度精品在线看网址 | 大型黄色视频在线免费观看| 高清黄色对白视频在线免费看| 丁香六月欧美| 美女午夜性视频免费| 欧美日韩视频精品一区| 手机成人av网站| 天天添夜夜摸| 男女高潮啪啪啪动态图| 亚洲少妇的诱惑av| 国产成人一区二区三区免费视频网站| 精品电影一区二区在线| 女人被狂操c到高潮| 午夜福利欧美成人| 91大片在线观看| 日本黄色日本黄色录像| 99久久99久久久精品蜜桃| 日本免费a在线| 激情在线观看视频在线高清| 一区二区三区精品91| 成人av一区二区三区在线看| 精品久久久久久电影网| 午夜福利欧美成人| 精品第一国产精品| 琪琪午夜伦伦电影理论片6080| 91九色精品人成在线观看| 欧美成人性av电影在线观看| 亚洲熟女毛片儿| 国产欧美日韩一区二区精品| 免费看a级黄色片| 99久久综合精品五月天人人| 宅男免费午夜| 精品高清国产在线一区| 高清黄色对白视频在线免费看| 一级黄色大片毛片| 欧美日韩一级在线毛片| 日韩成人在线观看一区二区三区| 在线播放国产精品三级| 亚洲精品粉嫩美女一区| 中文字幕精品免费在线观看视频| 亚洲一区二区三区欧美精品| 老熟妇仑乱视频hdxx| 桃色一区二区三区在线观看| 国产高清激情床上av| 国产精品一区二区在线不卡| 啦啦啦 在线观看视频| 久久久久久久久中文| 少妇裸体淫交视频免费看高清 | 久久人妻福利社区极品人妻图片| 九色亚洲精品在线播放| 亚洲一卡2卡3卡4卡5卡精品中文| 波多野结衣av一区二区av| 夫妻午夜视频| 成年人免费黄色播放视频| 一级毛片精品| 亚洲七黄色美女视频| 国产视频一区二区在线看| 99在线视频只有这里精品首页| 日本五十路高清| 免费久久久久久久精品成人欧美视频| 亚洲久久久国产精品| 精品国产国语对白av| 51午夜福利影视在线观看| 国产精品98久久久久久宅男小说| av网站在线播放免费| 亚洲成国产人片在线观看| 国产亚洲精品一区二区www| 亚洲精品国产精品久久久不卡| 成人影院久久| 黄色女人牲交| 日本vs欧美在线观看视频| 午夜精品国产一区二区电影| 久久久久久久精品吃奶| 黄色片一级片一级黄色片| 久久精品国产99精品国产亚洲性色 | 久久中文字幕一级| 午夜老司机福利片| 久久婷婷成人综合色麻豆| 久久人妻熟女aⅴ| 久久久久国产精品人妻aⅴ院| 精品免费久久久久久久清纯| 色婷婷久久久亚洲欧美| 大型av网站在线播放| 又黄又爽又免费观看的视频| av网站免费在线观看视频| 99国产精品一区二区三区| 精品免费久久久久久久清纯| 热99国产精品久久久久久7| 在线看a的网站| 老司机在亚洲福利影院| 亚洲七黄色美女视频| 老司机在亚洲福利影院| 视频在线观看一区二区三区| 精品少妇一区二区三区视频日本电影| 精品免费久久久久久久清纯| 国产成+人综合+亚洲专区| 精品免费久久久久久久清纯| 在线十欧美十亚洲十日本专区| 国内毛片毛片毛片毛片毛片| 欧美人与性动交α欧美软件| 在线看a的网站| 国产精品一区二区精品视频观看| 精品福利永久在线观看| 一二三四在线观看免费中文在| 视频在线观看一区二区三区| 激情视频va一区二区三区| 麻豆国产av国片精品| 精品国产超薄肉色丝袜足j| 欧美乱妇无乱码| 一级a爱视频在线免费观看| cao死你这个sao货| 在线观看66精品国产| 亚洲五月天丁香| 午夜日韩欧美国产| 黄片小视频在线播放| 伦理电影免费视频| 80岁老熟妇乱子伦牲交| 成人三级做爰电影| 日韩欧美一区视频在线观看| 黑人猛操日本美女一级片| 在线视频色国产色| 首页视频小说图片口味搜索| 天天影视国产精品| 成年女人毛片免费观看观看9| 丁香欧美五月| 久久久国产一区二区| 一进一出好大好爽视频| 制服人妻中文乱码| 久久精品国产清高在天天线| 成人18禁高潮啪啪吃奶动态图| 黄片小视频在线播放| 一级片'在线观看视频| 在线观看一区二区三区| 久久香蕉激情| av片东京热男人的天堂| 黑人巨大精品欧美一区二区蜜桃| 99香蕉大伊视频| 动漫黄色视频在线观看| 欧美成人性av电影在线观看| 欧美乱色亚洲激情| 国产精品自产拍在线观看55亚洲| 国产精品野战在线观看 | 极品人妻少妇av视频| 新久久久久国产一级毛片| 久久精品国产99精品国产亚洲性色 | 久久影院123| 长腿黑丝高跟| 精品高清国产在线一区| 久久中文字幕一级| 色老头精品视频在线观看| 日韩人妻精品一区2区三区| 亚洲人成网站在线播放欧美日韩| 如日韩欧美国产精品一区二区三区| 麻豆久久精品国产亚洲av | 久久久久久人人人人人| av片东京热男人的天堂| 国产真人三级小视频在线观看| 色尼玛亚洲综合影院| 亚洲男人天堂网一区| 亚洲色图综合在线观看| 久久久精品欧美日韩精品| 欧美性长视频在线观看| 啪啪无遮挡十八禁网站| 午夜91福利影院| 激情视频va一区二区三区| 制服诱惑二区| ponron亚洲| 精品国产一区二区久久| 国产伦一二天堂av在线观看| 丝袜美腿诱惑在线| 色婷婷久久久亚洲欧美| 老鸭窝网址在线观看| 欧美日韩av久久| 中国美女看黄片| 亚洲精品中文字幕在线视频| 久久香蕉激情| 波多野结衣高清无吗| 99久久综合精品五月天人人| 80岁老熟妇乱子伦牲交| 黄色怎么调成土黄色| 淫秽高清视频在线观看| 99国产精品一区二区三区| 视频在线观看一区二区三区| 欧美日韩亚洲高清精品| 女人精品久久久久毛片| 男人舔女人下体高潮全视频| 久久热在线av| 久久久久久大精品| 美女国产高潮福利片在线看| 大香蕉久久成人网| 黑人巨大精品欧美一区二区蜜桃| 精品日产1卡2卡| 精品国产美女av久久久久小说| 看免费av毛片| 久久人妻福利社区极品人妻图片| av免费在线观看网站| 久9热在线精品视频| 91成人精品电影| 欧美中文综合在线视频| 天堂√8在线中文| 国产成人精品久久二区二区免费| 嫁个100分男人电影在线观看| 国产真人三级小视频在线观看| 丝袜美足系列| 欧美成狂野欧美在线观看|