• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于熵模型的英漢人名對(duì)齊

      2016-05-04 01:14:56劉穎曹項(xiàng)
      中文信息學(xué)報(bào) 2016年3期
      關(guān)鍵詞:音譯命名詞典

      劉穎,曹項(xiàng)

      (清華大學(xué) 中文系,北京 100084)

      基于熵模型的英漢人名對(duì)齊

      劉穎,曹項(xiàng)

      (清華大學(xué) 中文系,北京 100084)

      該文使用熵模型來(lái)對(duì)中英文雙語(yǔ)語(yǔ)料進(jìn)行人名對(duì)齊。熵模型綜合利用雙語(yǔ)人名詞典、雙語(yǔ)姓氏詞典、詞匯對(duì)齊概率、中英文人名的共現(xiàn)特征、基于最小編輯距離的音譯相似度和基于語(yǔ)音匹配的音譯相似度。實(shí)驗(yàn)結(jié)果表明,基于熵模型的中英文人名對(duì)齊在大規(guī)模語(yǔ)料庫(kù)的實(shí)驗(yàn)中達(dá)到了較好的人名對(duì)齊正確率和召回率。我們分析了人名對(duì)齊存在的主要錯(cuò)誤,并針對(duì)主要錯(cuò)誤給出了可能的解決方案。

      人名對(duì)齊;熵模型;音譯相似度; 最小編輯距離;詞典

      1 引言

      中英文命名實(shí)體對(duì)齊尤其是人名的對(duì)齊一直是自然語(yǔ)言處理中一個(gè)非常重要的課題,它對(duì)于機(jī)器翻譯、跨語(yǔ)言信息檢索的發(fā)展具有重要作用[1]。

      目前,基于雙語(yǔ)語(yǔ)料庫(kù)的命名實(shí)體對(duì)齊主要有基于音譯的方法、基于雙語(yǔ)平行語(yǔ)料庫(kù)的方法和基于雙語(yǔ)可比較語(yǔ)料庫(kù)的方法。

      基于音譯的統(tǒng)計(jì)首先從雙語(yǔ)語(yǔ)料庫(kù)中對(duì)齊的命名實(shí)體對(duì)或雙語(yǔ)詞典中學(xué)習(xí)帶有概率的音譯規(guī)律,然后利用學(xué)習(xí)的知識(shí)對(duì)新的命名實(shí)體進(jìn)行排序,從而產(chǎn)生最優(yōu)翻譯?;谝糇g的統(tǒng)計(jì)方法把一種語(yǔ)言的命名實(shí)體A翻譯到另一種語(yǔ)言命名實(shí)體B的主要思路是: 首先把命名實(shí)體A轉(zhuǎn)換成其發(fā)音,然后把A發(fā)音轉(zhuǎn)換成B的發(fā)音,再把B發(fā)音轉(zhuǎn)換成命名實(shí)體B。Kevin Knight[2]把英語(yǔ)命名實(shí)體翻譯成日語(yǔ)的命名實(shí)體。首先把英文短語(yǔ)轉(zhuǎn)換成英文發(fā)音序列,然后把英文發(fā)音序列轉(zhuǎn)換成日文發(fā)音序列,再把日文發(fā)音序列轉(zhuǎn)換成日文片假名。Bonnie G S[3]改進(jìn)了文獻(xiàn)[2]的方法并把阿拉伯語(yǔ)命名實(shí)體翻譯成英語(yǔ)。Helen M M[4]建立了英語(yǔ)音節(jié)規(guī)則、英文音素串與中文拼音音節(jié)對(duì)應(yīng)規(guī)則和中文拼音生成規(guī)則,綜合運(yùn)用詞的翻譯、二元概率模型和最優(yōu)搜索從收音機(jī)播放的漢語(yǔ)故事中檢索英文命名實(shí)體。Yaser Al-Onaizan[5]把阿拉伯命名實(shí)體翻譯成英語(yǔ),利用英語(yǔ)詞概率、英語(yǔ)詞發(fā)音概率、英語(yǔ)發(fā)音轉(zhuǎn)換成阿拉伯書(shū)面語(yǔ)的概率以及英語(yǔ)詞轉(zhuǎn)換成阿拉伯字符序列的概率。Yuqing Guo[6]把音譯過(guò)來(lái)的漢語(yǔ)人名轉(zhuǎn)換成漢語(yǔ)拼音,然后把漢語(yǔ)拼音轉(zhuǎn)換成相應(yīng)的英語(yǔ)子音節(jié),再把英語(yǔ)子音節(jié)轉(zhuǎn)換成英語(yǔ)人名。Chun-Jen Lee[7]使用音譯模型從雙語(yǔ)語(yǔ)料庫(kù)中抽取音譯對(duì),該方法不使用語(yǔ)音詞典,也不需要人工給出雙語(yǔ)詞對(duì)的語(yǔ)音相似度,模型中的參數(shù)值從雙語(yǔ)人名列表中自動(dòng)學(xué)習(xí)得到。Li Haizhou[8]和Asif Ekbal[9]采用聯(lián)合信源信道模型(n元音譯模型),以因素為基礎(chǔ)來(lái)計(jì)算中英文間的翻譯概率。龐薇[10]研發(fā)了一種基于WFST加權(quán)有限狀態(tài)轉(zhuǎn)換器的人名翻譯系統(tǒng),以字符串轉(zhuǎn)換和發(fā)音轉(zhuǎn)換等為基礎(chǔ)進(jìn)行人名翻譯?;诮y(tǒng)計(jì)的音譯方法處理非音譯命名實(shí)體(例如,Jackie Chan(成龍))有困難,并且準(zhǔn)確率較低。

      基于平行語(yǔ)料庫(kù)的統(tǒng)計(jì)方法主要從雙語(yǔ)語(yǔ)料庫(kù)對(duì)齊的命名實(shí)體及上下文統(tǒng)計(jì)多個(gè)特征,然后綜合利用這些特征對(duì)齊新的命名實(shí)體。一般統(tǒng)計(jì)的特征包括: 音譯相似度、共現(xiàn)特征、互信息、對(duì)齊概率和語(yǔ)義相似度等。Fei Huang[11-12]提出的命名實(shí)體翻譯模型,把語(yǔ)音相似度和語(yǔ)義相似度相結(jié)合。語(yǔ)音相似度是根據(jù)表面字符串音譯模型來(lái)估計(jì),語(yǔ)義相似度是根據(jù)上下文向量語(yǔ)義模型來(lái)估計(jì)。陳懷興[13]對(duì)源語(yǔ)言進(jìn)行命名實(shí)體標(biāo)注而對(duì)目標(biāo)語(yǔ)言不標(biāo)注,并利用隱馬爾科夫模型來(lái)進(jìn)行命名實(shí)體對(duì)齊。陳鈺楓[14]對(duì)漢英雙語(yǔ)對(duì)齊的句子,分別識(shí)別出其中包含的漢英命名實(shí)體,再把意譯特征、音譯特征和共現(xiàn)特征結(jié)合到對(duì)齊模型中進(jìn)行命名實(shí)體對(duì)齊?;谄叫械碾p語(yǔ)語(yǔ)料庫(kù)統(tǒng)計(jì)方法可獲得高質(zhì)量的命名實(shí)體翻譯,但大規(guī)模的雙語(yǔ)平行語(yǔ)料庫(kù)比較缺乏。

      目前可利用的非平行雙語(yǔ)語(yǔ)料庫(kù)主要是可比較的雙語(yǔ)語(yǔ)料庫(kù)和兩個(gè)單語(yǔ)言語(yǔ)料庫(kù)??杀容^的雙語(yǔ)語(yǔ)料庫(kù)指的是互不為翻譯但討論的是相同或相關(guān)主題的雙語(yǔ)文本?;诳杀容^的雙語(yǔ)語(yǔ)料庫(kù)統(tǒng)計(jì)方法主要利用實(shí)體間、實(shí)體的上下文以及實(shí)體的關(guān)系來(lái)發(fā)現(xiàn)其他實(shí)體間的翻譯。Jinhan Kim[15-16]從可比較的語(yǔ)料庫(kù)中抽取命名實(shí)體翻譯,把跨語(yǔ)言命名實(shí)體間的語(yǔ)音相似度、命名實(shí)體上下文間的相似度、命名實(shí)體間關(guān)系的相似度和命名實(shí)體關(guān)系上下文的相似度結(jié)合起來(lái),形成一個(gè)整體的圖映射方法。Taesung Lee[17]把雙語(yǔ)命名實(shí)體的種子翻譯評(píng)分、命名實(shí)體的語(yǔ)義關(guān)系相似度評(píng)分和命名實(shí)體的相似文檔對(duì)的評(píng)分結(jié)合起來(lái),通過(guò)迭代方法抽取命名實(shí)體翻譯結(jié)果。Gae-Won You[18]利用音譯相似度從搜索引擎搜索的兩個(gè)單語(yǔ)語(yǔ)料庫(kù)抽取命名實(shí)體關(guān)系圖,然后通過(guò)確定命名實(shí)體關(guān)系圖中的匹配映射來(lái)發(fā)現(xiàn)其他命名實(shí)體的翻譯。張永臣[19]首先利用雙語(yǔ)普通詞典和詞典中的詞在語(yǔ)料庫(kù)中出現(xiàn)的頻率選擇種子詞,然后利用詞匯與種子詞在雙語(yǔ)非平行語(yǔ)料的共現(xiàn)關(guān)系建立向量空間,并根據(jù)向量相似度來(lái)抽取專(zhuān)業(yè)領(lǐng)域雙語(yǔ)詞典。可以獲取大規(guī)模的非平行雙語(yǔ)語(yǔ)料庫(kù),但由于兩個(gè)語(yǔ)料庫(kù)的實(shí)體及實(shí)體關(guān)系不是嚴(yán)格的一對(duì)一關(guān)系,導(dǎo)致該種方法的實(shí)體翻譯準(zhǔn)確度不高[20-21]。

      由此可見(jiàn),對(duì)命名實(shí)體對(duì)齊,因命名實(shí)體的音譯特征比較顯著,大部分命名實(shí)體翻譯中均運(yùn)用了不同種類(lèi)的音譯模型或音譯相似度[22]。但Fei Huang[12]、陳鈺楓[14]指出不同類(lèi)別的實(shí)體傾向于不同的對(duì)齊形式,人名對(duì)齊主要是音譯形式,地名和機(jī)構(gòu)名的對(duì)齊是意譯和音譯形式的組合。陳鈺楓[14]進(jìn)一步針對(duì)LDC機(jī)構(gòu)發(fā)布的漢英雙語(yǔ)命名實(shí)體語(yǔ)料庫(kù)(LDC 2005T34)進(jìn)行統(tǒng)計(jì),發(fā)現(xiàn)人名翻譯對(duì)音譯詞占100%,地名翻譯對(duì)音譯詞占89.4%,機(jī)構(gòu)名翻譯對(duì)音譯詞占12.6%。本文在他人研究的基礎(chǔ)上,使用熵模型進(jìn)行英中人名對(duì)齊。熵模型綜合利用人名詞典、姓氏詞典、詞匯對(duì)齊概率、中英文命名實(shí)體的共現(xiàn)特征、基于最小編輯距離的音譯相似度和基于Metaphone 語(yǔ)音匹配的音譯相似度六個(gè)特征。本文熵模型的主要特色是綜合了音譯、統(tǒng)計(jì)和詞典等三大類(lèi)適用于人名對(duì)齊的特征。每一類(lèi)特征中又分別采取兩種方法來(lái)取長(zhǎng)補(bǔ)短: 詞典特征采用了人名全名詞典和常見(jiàn)姓氏詞典;統(tǒng)計(jì)特征綜合了人名共現(xiàn)信息和上下文信息;音譯特征運(yùn)用了基于最小編輯距離的音譯相似度和基于Metaphone的音譯相似度。詞典特征可以有效地對(duì)齊常見(jiàn)的中英文人名,同時(shí)對(duì)語(yǔ)料庫(kù)中未識(shí)別出的人名和識(shí)別錯(cuò)誤的人名進(jìn)行補(bǔ)充和修正。音譯特征符合了絕大多數(shù)中英文人名對(duì)是以音譯為主的現(xiàn)象,從發(fā)音相似角度發(fā)現(xiàn)互為翻譯的人名。統(tǒng)計(jì)特征綜合考慮了詞語(yǔ)對(duì)齊過(guò)程中的統(tǒng)計(jì)和上下文等信息,兩個(gè)詞的上下文信息越相似,兩個(gè)詞的語(yǔ)義越相近。

      本文主要內(nèi)容安排如下: 第二部分介紹英中人名對(duì)齊過(guò)程。第三部分介紹熵模型。第四部分介紹實(shí)驗(yàn)過(guò)程、實(shí)驗(yàn)結(jié)果、結(jié)果分析、錯(cuò)誤類(lèi)型分析和可能的解決方案。最后給出結(jié)論。

      2 英中人名對(duì)齊過(guò)程

      本文主要探討由英文人名到中文人名的對(duì)齊?;陟啬P偷挠⒅腥嗣麑?duì)齊步驟:

      (1) 對(duì)英中雙語(yǔ)語(yǔ)料庫(kù)進(jìn)行標(biāo)序號(hào)處理和拆分。

      (2) 對(duì)中文進(jìn)行分詞,并對(duì)中英文進(jìn)行人名識(shí)別。

      采用斯坦福大學(xué)命名實(shí)體識(shí)別程序NER*http://nlp.stanford.edu/software/CRF-NER.shtml對(duì)英文人名進(jìn)行識(shí)別。采用中國(guó)科學(xué)院計(jì)算技術(shù)研究所研發(fā)的ICTCLAS系統(tǒng)*http:// ictclas.nlpir.org/對(duì)漢語(yǔ)進(jìn)行分詞和詞性標(biāo)注,同時(shí)也會(huì)識(shí)別出人名命名實(shí)體,如nr代表人名、nr1代表漢語(yǔ)姓氏、nr2代表漢語(yǔ)名字、nrj代表日語(yǔ)人名、nrf代表音譯人名等。

      人名識(shí)別可以提高漢語(yǔ)切分、詞性標(biāo)注、詞語(yǔ)對(duì)齊、句法分析以及機(jī)器翻譯的準(zhǔn)確率。 張華平實(shí)現(xiàn)的基于角色標(biāo)注的中國(guó)人名識(shí)別提高了ICTCLAS的切分正確率1.41%[23]。本文中人名識(shí)別可以提高人名對(duì)齊的準(zhǔn)確率。

      進(jìn)一步利用人名詞典和姓氏詞典對(duì)NER和ICTCLAS系統(tǒng)識(shí)別的結(jié)果進(jìn)行修正和補(bǔ)充。

      (3) 從經(jīng)過(guò)處理的中文語(yǔ)句中篩選、提取生成與英文人名相對(duì)應(yīng)的中文人名候選。

      英文人名被識(shí)別后,對(duì)于含兩個(gè)或三個(gè)標(biāo)注為PERSON(中間不含逗號(hào)、頓號(hào)等標(biāo)點(diǎn)符號(hào)) 的英文人名,則把它們合并作為一個(gè)人名對(duì)待。例如,F(xiàn)rancis/PERSON Harvey/PERSON可以合并成Francis Harvey/PERSON。對(duì)于拼音人名,姓氏首字母一般都大寫(xiě),名字可能有一個(gè)字或多個(gè)字。名字為一個(gè)字時(shí),名字的拼音首字母大寫(xiě);名字為多個(gè)字時(shí),名字的第一個(gè)字首字母大寫(xiě),第二個(gè)字首字母可以大寫(xiě)也可以小寫(xiě)。此外遵照西方傳統(tǒng),有些個(gè)別語(yǔ)料中也會(huì)把名字放在姓氏的前面。例如,Yang Lijun,Yang LiJun,Yang Li Jun,Yang Li-Jun,Yang Li-jun,Lijun Yang,LiJun Yang,Li Jun Yang,Li-jun Yang,Li-Jun Yang。所有這些情況都合并成一個(gè)人名。

      中文人名組成規(guī)律有“姓+名,姓,名,前綴+姓,姓+后綴,姓+姓+名”等多種情況。對(duì)于句子中只出現(xiàn)單獨(dú)的姓或單獨(dú)的名,則直接可以與英文的人名對(duì)齊。對(duì)于“姓+名,前綴+姓,姓+后綴,姓+姓+名”四種情況,則把它們合并作為一個(gè)完整的人名與英文的人名對(duì)齊。

      對(duì)于邊界識(shí)別錯(cuò)誤的中文人名,需要進(jìn)行邊界修正。

      例如,洛/b 夫/n 喬伊/nrf,/wd 居/v 無(wú)/v 定/v 所/q,/wd 被/pbei 控/v 謀殺/vn。/wj

      Lovejoy/PERSON,of no fixed abode,was charged with murder.

      Lovejoy和“洛夫喬伊”這對(duì)人名在中文中只識(shí)別對(duì)了“喬伊”部分,我們借鑒了蔣龍[20]提出的方法來(lái)對(duì)人名識(shí)別錯(cuò)誤的邊界進(jìn)行修正。首先,估計(jì)與英文人名相對(duì)應(yīng)的中文人名長(zhǎng)度,我們把英文人名進(jìn)行音節(jié)分解,如“Smith史密斯”有“S”,“mi”和“th”三個(gè)音節(jié),其對(duì)應(yīng)的中文名字的最大長(zhǎng)度應(yīng)為音節(jié)數(shù)目3,最小長(zhǎng)度應(yīng)為元音的音節(jié)數(shù)目1。而Lovejoy的最大長(zhǎng)度是4,最小長(zhǎng)度是3,我們以識(shí)別出來(lái)nrf的“喬伊”為中心,向左側(cè)和右側(cè)自動(dòng)延伸1或2個(gè)漢字,從而形成長(zhǎng)度為3至4的符合要求的候選詞,如“夫喬伊”和“洛夫喬伊”等。

      (4) 用GIS算法[24]對(duì)熵模型參數(shù)進(jìn)行迭代訓(xùn)練。采用Och開(kāi)發(fā)的YASMET*http://www-i6.informatik.rwth-aachen.de/web/Software/來(lái)訓(xùn)練。

      (5) 用訓(xùn)練過(guò)的熵模型對(duì)中文人名的候選詞進(jìn)行排序,從而輸出最優(yōu)的英中人名實(shí)體對(duì)。

      3 熵模型

      我們采用熵模型對(duì)英漢人名進(jìn)行對(duì)齊。最大熵原理是Jaynes E T[25]提出的,其主要思想是: 在只掌握關(guān)于未知分布的部分知識(shí)時(shí),應(yīng)該選取符合這些知識(shí)但熵值最大的概率分布。Berger Adam L[26]將它應(yīng)用于自然語(yǔ)言處理中來(lái)建立語(yǔ)言模型。熵模型一個(gè)最為重要的優(yōu)點(diǎn)是可以將各種不同信息的知識(shí)運(yùn)用到同一個(gè)模型中,從而解決一些相對(duì)復(fù)雜的問(wèn)題。目前熵模型已廣泛應(yīng)用于自然語(yǔ)言處理中,比如文本分類(lèi)、切分和詞性標(biāo)注、詞語(yǔ)對(duì)齊、短語(yǔ)對(duì)齊和機(jī)器翻譯等,并在這些方面取得了令人滿(mǎn)意的結(jié)果。英中人名對(duì)齊的概率公式為式(1)[27]。

      (1)

      其中CN是中文人名候選詞,EN是英文人名,i為熵模型特征數(shù)量,取值范圍為1~6,F(xiàn)1到F6為六個(gè)特征函數(shù),依次為人名詞典、姓氏詞典、基于GIZA++的詞匯對(duì)齊概率、中英文命名實(shí)體的共現(xiàn)特征、基于最小編輯距離的音譯相似度和基于Metaphone語(yǔ)音匹配的音譯相似度。

      英中人名對(duì)齊的最大熵模型為(2),根據(jù)(2),我們可以得到熵值最大的中文人名。

      (2)

      為了獲取熵值最高的n個(gè)(記為top-n)結(jié)果,我們使用熵模型式(3)。當(dāng)n=1時(shí),式(3)就是式(2)。

      (3)

      3.1 人名雙語(yǔ)詞典

      我們通過(guò)詞典進(jìn)行匹配查詢(xún)。

      (4)

      (1) 常見(jiàn)的通過(guò)英文音譯的中文人名,約800條,如約翰(John)、史密斯(Smith)等;

      (2) 中文知名人士詞典及其譯文,約200條,如胡錦濤(HuJintao)和賈寶玉(JiaBaoyu)等;

      (3) 英文知名人士詞典及其譯文,約100條,如巴菲特(Buffett)、奧巴馬(Obama) 等。

      3.2 雙語(yǔ)姓氏詞典

      我們對(duì)中文名字的首字進(jìn)行匹配查詢(xún)。

      (5)

      式(5)表示: 如果(CN,EN)的姓出現(xiàn)在雙語(yǔ)姓氏詞典D2中,則特征函數(shù)F2(CN,EN)賦值為1,否則為0。姓氏詞典共400多條,例如,趙(Zhao)、王(Wang)和李(Li)等。

      3.3 基于GIZA++的詞匯對(duì)齊概率

      GIZA++是GIZA的改良版*http://www-i6.informatik.rwth-aachen.de/web/Software/,采用了IBM公司提出的五個(gè)模型和隱馬爾科夫模型,可以從句子對(duì)齊得到雙語(yǔ)詞匯對(duì)齊的概率。

      (6)

      其中,P(CN,EN)是根據(jù)GIZA++得到的中文翻譯候選詞CN與英文人名EN對(duì)齊的概率,如John—約翰 1;John—時(shí)約 5.72726e-08等。GIZA++詞匯對(duì)齊考慮了詞匯之間一對(duì)一、一對(duì)多和多對(duì)一等情況,同時(shí)考慮了詞匯對(duì)齊的位置和語(yǔ)言模型。語(yǔ)言模型中考慮了上下文的情況。

      3.4 共現(xiàn)特征

      語(yǔ)料庫(kù)中人名共現(xiàn)特征對(duì)于命名實(shí)體的識(shí)別和對(duì)齊也有重要意義。中英文名字在一個(gè)中英文句對(duì)中的共現(xiàn)次數(shù)也可以成為其是否為翻譯等價(jià)對(duì)的特征之一,本文使用的共現(xiàn)頻率特征如式(7)所示。

      (7)

      其中,f(CN,EN)是中英文人名同時(shí)在中英句對(duì)中共現(xiàn)的次數(shù),f(EN)是英文人名EN在所有雙語(yǔ)句對(duì)中出現(xiàn)的次數(shù),f(CN)是中文人名CN在所有雙語(yǔ)句對(duì)中出現(xiàn)的次數(shù)。F4(CN,EN)綜合了條件概率P(CN|EN)和P(EN|CN)。

      3.5 基于最小編輯距離的音譯相似度

      關(guān)于英文人名和中文人名的音譯相似度,我們借鑒并改進(jìn)了Gae-won You[18]的編輯距離。其基本原理就是將中文名字轉(zhuǎn)換成拼音序列,與英文名字的字母序列進(jìn)行比對(duì),并計(jì)算出由中文名字拼音序列轉(zhuǎn)換成英文名字字母序列的編輯距離,由此得出中英文人名從發(fā)音角度的相似度概率。

      采用式(8)來(lái)計(jì)算中文名字CN和英文名字EN的發(fā)音相似度概率。

      (8)

      CPY是將CN轉(zhuǎn)換成標(biāo)準(zhǔn)普通話(huà)的拼音序列。Num(x)是計(jì)算x的字符個(gè)數(shù)。ED(EN,CPY)是指從EN到CPY的最小編輯操作數(shù)量,包括插入、刪除及替換等。例如,對(duì)中英文名字對(duì)“比爾·蓋茨 — Bill Gates”,CPY=bi er gai ci,EN=Bill Gates,EN和CPY的最小編輯距離ED是5,最佳的編輯路徑是Bill—Bi er,ED為2;Gates—gai ci,ED為3。“比爾·蓋茨 — Bill Gates”的發(fā)音相似度為1-5/9=0.44。如果英文人名是按照中文拼音直接翻譯而來(lái),則其最小編輯距離為0,音譯相似度為1。例如,胡錦濤—Hu Jintao,音譯相似度為1。如果兩個(gè)相同長(zhǎng)度的名字之間沒(méi)有任何相同字母,F(xiàn)5=0。而按Gae-won You[18]的公式則為1/2。這是我們對(duì)基于最小編輯距離的音譯相似度的改進(jìn)。

      另一方面,由于輔音在發(fā)音中占據(jù)很重要的角色,而元音在發(fā)音過(guò)程中存在不穩(wěn)定性[22]。我們也從輔音字母的角度來(lái)考察英中人名的相似程度。

      3.6 基于語(yǔ)音匹配的音譯相似度

      Lawrence Philips[28]開(kāi)發(fā)了Metaphone語(yǔ)音匹配系統(tǒng)*http://en.wikipedia.org/wiki/Metaphone,主要通過(guò)單詞的英文發(fā)音對(duì)單詞進(jìn)行檢索,被廣泛應(yīng)用于英文拼寫(xiě)錯(cuò)誤檢查中。2009年Metaphone更新了最新版本Metaphone 3,優(yōu)化了對(duì)英文和與英文近似語(yǔ)言的語(yǔ)音解碼,同時(shí)加強(qiáng)了對(duì)美國(guó)常見(jiàn)人名姓氏的解碼,把準(zhǔn)確度從Double Metaphone的89%提高到了Metaphone 3的99%。

      Metaphone通常采取16個(gè)符號(hào)—0、B、F、H、J、K、L、M、N、P、R、S、T、W、X、Y,字符0代表th,X代表sh或ch,元音A、E、I、O、U只有在詞首時(shí)才被保留,其他情況下刪除。

      基于Metaphone 語(yǔ)音匹配的音譯相似度計(jì)算公式為(9)。

      (9)

      中文名字CN通過(guò)拼音轉(zhuǎn)換得到拼音序列CPY,再把拼音序列CPY輸入到Metaphone系統(tǒng)中得到結(jié)果CPYM字符序列。ENM字符序列則是把英文單詞EN直接通過(guò)Metaphone系統(tǒng)解碼得到的。把中英文名字轉(zhuǎn)換得到的這兩串字符序列求交集后得到的字符個(gè)數(shù)乘2,再除以CPYM與ENM的字符個(gè)數(shù)之和得出其相似度值。比如史蒂芬·喬布斯(Steve Jobs),轉(zhuǎn)換后的CPYM為XTFN KBS,ENM為STFN JBS,所以ScoreMP(CN,EN)=2×5/(7+7)=0.72。

      4 實(shí)驗(yàn)與結(jié)果分析

      4.1 實(shí)驗(yàn)語(yǔ)料和評(píng)價(jià)標(biāo)準(zhǔn)

      本文的語(yǔ)料庫(kù)是一萬(wàn)對(duì)英中文雙語(yǔ)句對(duì)語(yǔ)料庫(kù),包括訓(xùn)練語(yǔ)料9 000句對(duì),測(cè)試語(yǔ)料1 000句對(duì)。其中英文人名的翻譯等價(jià)對(duì)(Colin—柯林)約占59.1%,中文拼音(溫家寶—Wen Jiabo)的翻譯等價(jià)對(duì)占32.6%,中英文拼音和譯名混合的翻譯等價(jià)對(duì)(成龍—Jackie Chan)約占1.8%,日韓等其他語(yǔ)言中英文人名翻譯等價(jià)對(duì)約占2.4%(福井—Fukui),其他情況約占4.1%。

      本文采用正確率(P)、召回率(R)和F值三個(gè)指標(biāo)來(lái)對(duì)人名對(duì)齊進(jìn)行評(píng)價(jià)。為了評(píng)價(jià)熵模型和其特征結(jié)合的效果,引入top-n 評(píng)價(jià)標(biāo)準(zhǔn)。P(top-n)是指經(jīng)排序后的前n個(gè)中文人名候選詞中含正確翻譯的人名占所有人名對(duì)的比例。

      4.2 實(shí)驗(yàn)結(jié)果及分析

      我們采用詞典和基于GIZA++詞匯對(duì)齊概率作為我們的對(duì)齊基準(zhǔn)系統(tǒng)。表1給出了使用熵模型分別在 top-1、top-3和top-6下的正確率,從第二行到第四行分別給出熵模型不同特征及特征組合下的正確率。通過(guò)實(shí)驗(yàn),當(dāng)同時(shí)運(yùn)用六個(gè)特征時(shí),式(3)中的權(quán)重分別為:1=0.21,2=0.12,3=0.19,4=0.10,5=0.23,6=0.15,此時(shí)最大熵模型的正確率最高。

      從表1可以看出以下三個(gè)規(guī)律:

      (1) 當(dāng)top-n中的n相同時(shí),利用詞典和GIZA++的英中人名對(duì)齊正確率最低,隨著特征的增加,正確率逐步增加,同時(shí)考慮六個(gè)特征的正確率最高。

      (2) 當(dāng)使用的特征相同時(shí),隨著top-n中的n增加,正確率也增加。

      (3) 把詞典、熵模型的各種特征相結(jié)合的人名翻譯準(zhǔn)確率最高。

      表2給出了在取不同特征及特征組合下基于最大熵模型的英中人名對(duì)齊的正確率、召回率和F值。從表2可以看出,隨著特征的增加,正確率、召回率和F值也逐步增加。

      表1和表2說(shuō)明了我們選取的這些特征對(duì)于提高英中人名對(duì)齊的正確率、召回率和F值是有效的,也就是這些特征對(duì)于對(duì)齊英中人名確實(shí)是有幫助的。英中人名全名詞典包含了人名翻譯的正確信

      表2 基于最大熵的英中人名對(duì)齊的P、R和F值(%)

      息,是人名對(duì)齊的基礎(chǔ)。姓氏雙語(yǔ)詞典可以有效地給出人名中的部分信息,可以用來(lái)確定人名的界限,然后再根據(jù)英文人名的音節(jié)來(lái)判斷漢語(yǔ)人名的最小和最大長(zhǎng)度,從而可以找出中文人名的界限?;贕IZA++的詞匯對(duì)齊不但考慮了英中文人名互為翻譯的概率、人名翻譯的位置信息,同時(shí)考慮了上下文信息(后一個(gè)詞匯的對(duì)齊與前一個(gè)詞匯對(duì)齊的位置和翻譯都是有關(guān)系的),這些信息對(duì)于判斷英中文人名翻譯是很有幫助的?;诠铂F(xiàn)特征不但考慮了給定英文人名的英中人名條件概率,同時(shí)考慮了給定中文人名的中英人名條件概率。這個(gè)特征對(duì)于兩者高頻共現(xiàn)比較有效。鑒于英中人名絕大多數(shù)從發(fā)音上都是相似的,音譯相似度從兩個(gè)角度考慮了英中人名的發(fā)音相似與否,從人名發(fā)音的層面給出了英文人名與中文人名之間存在的內(nèi)在語(yǔ)言學(xué)聯(lián)系信息。

      4.3 英中人名對(duì)齊的錯(cuò)誤類(lèi)型分析

      英中人名錯(cuò)誤主要分四個(gè)類(lèi)型: 語(yǔ)料預(yù)處理錯(cuò)誤、雙語(yǔ)語(yǔ)料中只含有單語(yǔ)言的人名、邊界修正后仍存在錯(cuò)誤以及熵模型排序錯(cuò)誤等。

      (1) 預(yù)處理錯(cuò)誤,主要包括: 切詞錯(cuò)誤、詞性標(biāo)注錯(cuò)誤、人名未被識(shí)別出來(lái)或人名識(shí)別錯(cuò)誤等。

      例1 該/rz 隱/v 對(duì)/p 弟弟/n亞伯/nrf 說(shuō)/v : /wm “/wyz 我們/rr 到/v 野外/s 去/vf 吧/y。/wj ”/wyy

      該句中,“該/rz 隱/v”被切分和標(biāo)注錯(cuò)誤。

      例2 人名未被識(shí)別出來(lái)。

      例如,Lady Capulet looked down and stared at Juliet/PERSON in horror.

      Capulet這個(gè)人名未被識(shí)別出來(lái)。

      例3 人名被識(shí)別出錯(cuò)誤。

      例如,The hostility that many Americans felt toward Freud/LOCATION is real.

      英文中Freud被錯(cuò)誤地識(shí)別成地名。

      例4 其他非人名被識(shí)別出人名。

      例如,Poor/PERSON Ladawn/PERSON is a bleeding heart.

      Poor被錯(cuò)誤標(biāo)注成人名。

      (2) 雙語(yǔ)語(yǔ)料本身不存在人名對(duì)齊。英文句子中出現(xiàn)人名,中文句子中沒(méi)有與之對(duì)應(yīng)的人名,而只出現(xiàn)了代詞?;蛘?,中文句子中出現(xiàn)人名,英文中沒(méi)有與之對(duì)應(yīng)的人名。

      例5 我/rr 還/d 會(huì)/v 給/p 你/rr 寫(xiě)信/vi 的/ude1。

      I’ll write to you again,Laura/PERSON.

      中文中沒(méi)有與Laura相對(duì)應(yīng)的人名。

      (3) 通過(guò)中文人名識(shí)別邊界修正后仍然存在錯(cuò)誤。

      例6 卡布利特/nrf 夫人/n 往/p 下/f 看/v,/wd 然后/c 驚駭/a 地/ude2 凝視/v 茱/x 麗/ag 葉/ng。/wj

      中文人名“茱/x 麗/ag 葉/ng”識(shí)別錯(cuò)誤,同時(shí)這三個(gè)字都沒(méi)有被識(shí)別成人名用字導(dǎo)致邊界修正模塊也失效。

      (4) 熵模型排序出現(xiàn)錯(cuò)誤。

      (a) 一小部分英中人名不是根據(jù)發(fā)音翻譯的,并且在雙語(yǔ)語(yǔ)料庫(kù)中出現(xiàn)次數(shù)又很少,詞典中又未收錄該雙語(yǔ)人名。英中人名不符合音譯規(guī)律導(dǎo)致熵模型中的兩個(gè)音譯特征值比較小,頻率小導(dǎo)致兩個(gè)統(tǒng)計(jì)特征值很小,未在詞典中出現(xiàn)導(dǎo)致兩個(gè)詞典特征為0。從而6個(gè)特征的特征值都很小或?yàn)?。

      例7 如Ayumi Hamasaki—濱崎步,英文是通過(guò)日文發(fā)音翻譯過(guò)來(lái),而中文譯名卻是從日文意譯而來(lái)。

      (b) 從雙語(yǔ)語(yǔ)料庫(kù)中獲取的人名翻譯與標(biāo)準(zhǔn)不一致。這主要是因?yàn)橐徊糠钟⑽娜嗣卸鄠€(gè)譯文,都是根據(jù)發(fā)音翻譯過(guò)來(lái)的。例如,Emily根據(jù)雙語(yǔ)語(yǔ)料的中文翻譯是“艾米莉”,而用來(lái)計(jì)算準(zhǔn)確率的翻譯是“艾米麗”。

      (c) 最大熵排序出現(xiàn)問(wèn)題。

      例8 吉姆/nrf ·/w 賈/nr1 木/ng 許/v 的/ude1 《/wkz 破碎/v 之/uzhi 花/n 》/wky 緊/d 隨/v 其/rz 后/f ……。

      “賈”字被識(shí)別成姓氏nr1,邊界修正后提取到了“賈木”“賈木許”“賈木許的”等翻譯候選詞,但熵模型排序未能將正確翻譯 “賈木許”排在首位。

      從上所述,導(dǎo)致英中人名對(duì)齊錯(cuò)誤主要在于漢語(yǔ)切詞和詞性標(biāo)注、英中人名識(shí)別、人名有多個(gè)譯名、雙語(yǔ)語(yǔ)料不存在人名對(duì)齊、人名邊界修正錯(cuò)誤和熵模型排序等方面存在錯(cuò)誤。其中,主要錯(cuò)誤在于英語(yǔ)和漢語(yǔ)人名識(shí)別錯(cuò)誤以及熵模型排序錯(cuò)誤。為進(jìn)一步提高人名對(duì)齊正確率和召回率,需要提高中文切詞、詞性標(biāo)注和人名識(shí)別的正確率。 針對(duì)ICTCLAS系統(tǒng)和斯坦福大學(xué)命名實(shí)體識(shí)別程序NER識(shí)別的錯(cuò)誤人名,采用李中國(guó)和劉穎提出的邊界模板和局部統(tǒng)計(jì)相結(jié)合的方法來(lái)進(jìn)一步提高人名識(shí)別準(zhǔn)確率[29]。對(duì)于熵模型排序錯(cuò)誤,需進(jìn)一步增加詞典的規(guī)模,進(jìn)一步增加雙語(yǔ)語(yǔ)料庫(kù)的規(guī)模,同時(shí)利用大規(guī)模語(yǔ)料中正確的人名對(duì)來(lái)自動(dòng)訓(xùn)練六個(gè)特征的權(quán)重,使得人名對(duì)齊的正確率進(jìn)一步提高。

      4.4 熵模型的優(yōu)勢(shì)

      (1) 熵模型利用了兩種類(lèi)型的音譯特征,更突出了音譯特征。這樣可以對(duì)絕大多數(shù)以音譯為主的英中人名翻譯提供有力的數(shù)據(jù)支持。我們針對(duì)人名來(lái)進(jìn)行對(duì)齊,就是因?yàn)閷?duì)于人名、地名和機(jī)構(gòu)名,音譯和意譯占的比例差距很大,并且不同的雙語(yǔ)語(yǔ)料三者所占的比例可能會(huì)有所不同。因此應(yīng)該根據(jù)各自不同的規(guī)律給出適合三者的不同特征。

      (2) 我們首先利用雙語(yǔ)人名詞典和姓氏詞典來(lái)進(jìn)行人名識(shí)別后的重新矯正和補(bǔ)充,然后利用雙語(yǔ)詞典來(lái)進(jìn)行人名對(duì)齊。原因在于人名識(shí)別是人名對(duì)齊的基礎(chǔ),人名識(shí)別的準(zhǔn)確率高,人名對(duì)齊的準(zhǔn)確率才有可能高。雙語(yǔ)詞典對(duì)于人名識(shí)別的一些錯(cuò)誤可以有效地進(jìn)行改正,對(duì)于沒(méi)有識(shí)別出的一些人名和姓氏可以進(jìn)行適當(dāng)?shù)难a(bǔ)充,從而適當(dāng)?shù)財(cái)U(kuò)大人名對(duì)齊的空間。姓氏列表與根據(jù)英文人名音節(jié)長(zhǎng)度判斷的中文人名的最小和最大長(zhǎng)度相結(jié)合提供了更多中文人名的候選,為進(jìn)一步利用熵模型中的其他特征提供了比較有效的搜索空間。

      (3) 熵模型中利用了六個(gè)特征,既有語(yǔ)言學(xué)層面的特征(兩個(gè)詞典),也有統(tǒng)計(jì)層面的特征(兩個(gè)統(tǒng)計(jì)層面的特征—基于GIZA++的詞匯對(duì)齊和共現(xiàn)特征),也有與人名對(duì)齊緊密聯(lián)系的兩個(gè)音譯特征。而從我們的實(shí)驗(yàn)中可以得出,我們所利用的這些特征對(duì)于人名對(duì)齊的確都是有幫助的。

      (4) 我們綜合利用了詞典和雙語(yǔ)平行語(yǔ)料。詞典是人名翻譯的基礎(chǔ),尤其對(duì)于比較特殊的人名翻譯,放在詞典中比較有效。根據(jù)雙語(yǔ)平行語(yǔ)料進(jìn)行的詞語(yǔ)對(duì)齊準(zhǔn)確率比較高,但大規(guī)模的高質(zhì)量的雙語(yǔ)平行語(yǔ)料庫(kù)比較缺乏。

      下一步的工作是構(gòu)建大規(guī)模的高質(zhì)量的雙語(yǔ)平行語(yǔ)料庫(kù)和從其他角度(例如,網(wǎng)絡(luò)挖掘)來(lái)獲取更多的人名翻譯。

      5 結(jié)論

      本文提出的基于熵模型的中英文人名對(duì)齊,綜合了人名詞典、姓氏詞典、詞匯對(duì)齊概率、中英文命名實(shí)體的共現(xiàn)特征、基于最小編輯距離的音譯相似度和基于Metaphone 語(yǔ)音匹配的音譯相似度六個(gè)特征,達(dá)到了較好的人名對(duì)齊及翻譯效果。把詞典、詞匯對(duì)齊、音譯相似度結(jié)合起來(lái)可以融合每種特征的優(yōu)勢(shì),三種特征結(jié)合使得人名翻譯準(zhǔn)確率最高。本文對(duì)實(shí)驗(yàn)產(chǎn)生的結(jié)果及對(duì)齊錯(cuò)誤進(jìn)行了深入的分析,為進(jìn)一步改進(jìn)熵模型和提高英中人名對(duì)齊正確率奠定基礎(chǔ)。

      [1] Stephen Wan,Cornelia Verspoor. Automatic English-Chinese Name Transliteration for development of Multilingual Resources [C]//Processings of Coling-ACL 1998 : 1352-1356.

      [2] Kevin Knight,Jonathan Graehl.Machine transliteration[J]. Computational Linguistics. 1998,24(4): 599-612.

      [3] Bonnie Glover Stalls,Kevin Knight. Translating names and technical terms in Arabic text[C]//Proceedings of the Workshop on Computational Approaches to Semitic Languages.1998: 34-41.

      [4] Helen M.meng,Wai-Kit Lo,Berlin Chen et al. Generating phonetic cognates to handle named entities in english-chinese cross-language spoken document retrieval[C]//Proceedings of the Automatic Speech Recognition and Understanding. 2001: 311-314.

      [5] Yaser Al-Onaizan,Kevin Knight. Translating named entities using monolingual and bilingual resources[C]//Proceedings of the 40th Annual Meeting on Association for Computational Linguistics. 2002: 400-408.

      [6] Yuqing Guo,Wang Haifeng. Chinese-to-English Backward Machine Transliteration[C]//Proceedings of the International Joint Conferences on Artificial Intelligence on Nature Language Processing. 2004.

      [7] Chun-Jen Lee,Jason S. Chang,Jyh-Shing Roger Jang. Extraction of transliteration pairs from parallel corpora using a statistical transliteration model[J]. Information Sciences. 2006,176(1): 67-90.

      [8] Li Haizhou,Zhang Min,Su Jian. A Joint Source-Channel Model for Machine Transliteration[C]//Proceedings of the 42nd Annual Meeting of the Association for Computational Linguistics. 2004: 21-26.

      [9] AsifEkbal,Sudip Kumar Naskar,Sivaji Bandyopadhyay. A Modified Joint Source-Channel Model for Transliteration[C]//Proceedings of the Coling/ACL 2006 Main Conference Poster Sessions.2006: 191-198

      [10] 龐薇,徐波.基于多模型融合的人名翻譯系統(tǒng)[J].中文信息學(xué)報(bào),2009,23(1): 44-49.

      [11] Fei Huang,Stephan Vogel,Alex Waibel. Automatic extraction of named entity translingual equivalence based on multi-feature cost minimization[C]//Proceedings of the ACL 2003 Workshop on Multilingual and Mixed-language Named Entity Recognition. 15: 9-16.

      [12] Fei Huang,Stephan Vogel,Alex Waibel. Improving Named Entity Translation Combining Phonetic and Semantic Similarities[C]//Proceedings of the Human Language Technology Conference and the 3rd Meeting of the North American Chapter of the Association for Computational Linguistics. 2004: 281-288.

      [13] 陳懷興,尹存燕,陳家駿.一種命名實(shí)體翻譯等價(jià)對(duì)的抽取方法[J].中文信息學(xué)報(bào),2008,22(4): 55-60.

      [14] 陳鈺楓,宗成慶,蘇克毅.漢英雙語(yǔ)命名實(shí)體識(shí)別與對(duì)齊的交互式方法[J].計(jì)算機(jī)學(xué)報(bào),2011,34(9): 1688-1696.

      [15] Jinhan Kim,Long Jiang,Seung-Won Hwang et al. Mining Entity Translations From Comparable Corpora: a holistic Graph Mapping Approach[C]//Proceedings of the 20th ACM international conference on Information and knowledge management. 2011: 1295-1304

      [16] Jinhan Kim,Seung-won Hwang,Long Jiang,Young-In Song,Ming Zhou. Entity Translation Mining from Comparable Corpora: Combining Graph Mapping with Corpus Latent Features[J]. IEEE Trans. Knowl. Data Eng. 2012,25(8): 1787-1800.

      [17] Taesung Lee and Seung-won Hwang. Bootstrapping Entity Translation on Weakly Comparable Corpora[C]Proceedings of the The 51st Annual Meeting of the Association for Computational Linguistic. 2013: 4-9.

      [18] You Gae-won,Hwang Seung-won,Song Young-in,Jiang Long. Nie Zaiqing. Efficient Entity Translation Mining-A Parallelized Graph Alignment Approach[J]. ACM Transactions on Information Systems. 2012,30(4): 1-23.

      [19] 張永臣,孫樂(lè),李飛等.基于Web數(shù)據(jù)的特定領(lǐng)域雙語(yǔ)詞典抽取[J].中文信息學(xué)報(bào),2006,20(2): 16-23.

      [20] 蔣龍,周明,簡(jiǎn)立峰.利用音譯和網(wǎng)絡(luò)挖掘翻譯命名實(shí)體[J].中文信息學(xué)報(bào),2007,21(1): 23-29

      [21] 郭稷,呂雅娟,劉群. 一種有效的基于Web的雙語(yǔ)翻譯對(duì)獲取方法[J].中文信息學(xué)報(bào),2008,22(6): 103-109

      [22] 趙明明,洪宇,姚建民,朱巧明. 基于音譯和網(wǎng)絡(luò)的命名實(shí)體翻譯方法研究[C]//第六屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集. 2010: 357-366

      [23] 張華平,劉群.基于角色標(biāo)注的中國(guó)人名自動(dòng)識(shí)別研究[J].計(jì)算機(jī)學(xué)報(bào).2004,Vol.27,No.1: 85-91.

      [24] J. N. Darroch,D. Ratcliff. Generalized Iterative Scaling for Log-Linear Models[J]. Annals of Mathematical Statistics. 1972,43(5): 1470-1480.

      [25] Jaynes,E.T. Information Theory and Statistical Mechanics[J]. Physical Review.2009,106(4): 620-630.

      [26] Berger,Adam L,Stephen A. Della Pietra,Vincent J. Della Pietra. A Maximum Entropy Approach to Natural Language Processing[J]. Computation Linguistic. 1996,22(1): 39-71.

      [27] Franz Josef Och,Hermann Ney. Discriminative Training and Maximum Entropy Models for Statistical Machine Translation[C]//Proceedings of the 40th Annual meeting of the Association for Computational Linguistics. 2002: 295-302.

      [28] Lawrence Philips. Hanging on the Metaphone[J]. Computer Language. 1990,7(12): 38-45.

      [29] 李中國(guó),劉穎. 邊界模板和局部統(tǒng)計(jì)相結(jié)合的中國(guó)人名識(shí)別[J]. 中文信息學(xué)報(bào),2006,20(5): 44-50.

      Entropy Based English-Chinese Person Name Alignment

      LIU Ying, CAO Xiang

      (Department of Chinese Language and Literature, Tsinghua University, Beijing 100084, China)

      Entropy model is used to align English-Chinese person name for English-Chinese parallel corpus. The model makes use of person name dictionary, surname dictionary, word alignment probability, co-occurrence feature, transliteration similarity based on minimum edit distance and transliteration similarity based on Metaphone. The experimental results show this method can achieve better precision and recall rate for large parallel corpus. We also investigate the alignment errors in English-Chinese person names and suggest possible solutions.

      person name alignment; entropy model; transliteration similarity; minimum edit distance; dictionary

      劉穎(1969—),副教授,博士,主要研究領(lǐng)域?yàn)樽匀徽Z(yǔ)言處理。E?mail:yingliu@tsinghua.edu.cn曹項(xiàng)(1987—),碩士,主要研究領(lǐng)域?yàn)樽匀徽Z(yǔ)言處理。E?mail:yingliu@tsinghua.edu.cn

      2014-01-09 定稿日期: 2014-03-28

      國(guó)家自然科學(xué)基金(61171114);教育部自主科研項(xiàng)目(20111081010);教育部回國(guó)人員啟動(dòng)項(xiàng)目(20101021603)

      1003-0077(2016)03-0052-08

      TP391

      A

      猜你喜歡
      音譯命名詞典
      命名——助力有機(jī)化學(xué)的學(xué)習(xí)
      清末民初音譯元素名規(guī)范方案用字探析
      米沃什詞典
      文苑(2019年24期)2020-01-06 12:06:50
      有一種男人以“暖”命名
      東方女性(2018年3期)2018-04-16 15:30:02
      為一條河命名——在白河源
      評(píng)《現(xiàn)代漢語(yǔ)詞典》(第6版)
      夏譯漢籍中的音譯誤字
      西夏學(xué)(2017年1期)2017-10-24 05:31:38
      詞典例證翻譯標(biāo)準(zhǔn)探索
      新疆地名的音譯轉(zhuǎn)寫(xiě)及英譯規(guī)范
      英漢音譯規(guī)律探微*
      富裕县| 黄陵县| 襄汾县| 化德县| 台北市| 津市市| 谢通门县| 仪陇县| 综艺| 临清市| 紫阳县| 璧山县| 四会市| 邳州市| 禹州市| 龙井市| 佛学| 全椒县| 宜兰县| 滨州市| 福贡县| 莱芜市| 汶上县| 汉寿县| 肇源县| 壤塘县| 财经| 临安市| 芷江| 平乡县| 布尔津县| 奇台县| 威远县| 泰顺县| 水富县| 昌都县| 交口县| 东莞市| 荥经县| 凌源市| 秦皇岛市|