• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于條件隨機(jī)場(chǎng)的維吾爾文組塊分析

      2016-05-04 01:15:41艾山吾買(mǎi)爾吐?tīng)柛?/span>依布拉音卡哈爾江阿比的熱西提早克熱卡德?tīng)?/span>買(mǎi)合木提買(mǎi)買(mǎi)提亞森艾則孜
      中文信息學(xué)報(bào) 2016年3期
      關(guān)鍵詞:維語(yǔ)組塊語(yǔ)料庫(kù)

      艾山·吾買(mǎi)爾,吐?tīng)柛ひ啦祭?,卡哈爾江·阿比的熱西提,早克熱·卡德?tīng)?,買(mǎi)合木提·買(mǎi)買(mǎi)提,亞森·艾則孜

      (新疆大學(xué) 信息科學(xué)與工程學(xué)院,新疆 烏魯木齊,830046)

      基于條件隨機(jī)場(chǎng)的維吾爾文組塊分析

      艾山·吾買(mǎi)爾,吐?tīng)柛ひ啦祭?,卡哈爾江·阿比的熱西提,早克熱·卡德?tīng)?,買(mǎi)合木提·買(mǎi)買(mǎi)提,亞森·艾則孜

      (新疆大學(xué) 信息科學(xué)與工程學(xué)院,新疆 烏魯木齊,830046)

      該文對(duì)維吾爾語(yǔ)樹(shù)庫(kù)標(biāo)注體系進(jìn)行分析,根據(jù)組塊劃分原則,在短語(yǔ)標(biāo)記集的基礎(chǔ)上制定了維吾爾語(yǔ)組塊標(biāo)記集,從已完成標(biāo)注的3 000句語(yǔ)料庫(kù)構(gòu)建組塊庫(kù)。根據(jù)維文語(yǔ)言的特點(diǎn),在英漢組塊識(shí)別特征基礎(chǔ)上,增加了詞干、詞綴、同義詞標(biāo)記等特征。該文中的性能評(píng)價(jià)指標(biāo)采用了國(guó)際通用的準(zhǔn)確率,召回率和F值,3 000個(gè)標(biāo)注句子作為訓(xùn)練和測(cè)試語(yǔ)料庫(kù)用,實(shí)驗(yàn)采用了交叉驗(yàn)證法,訓(xùn)練和測(cè)試語(yǔ)料庫(kù)的比例分別為9∶1,8∶2,2∶1,召回率分別為80.34%,76.87%,66.76%。實(shí)驗(yàn)表明,語(yǔ)料庫(kù)規(guī)模對(duì)模型性能影響較大。

      條件隨機(jī)場(chǎng);維吾爾;組塊分析

      1 引言

      組塊是一種位于詞語(yǔ)和句子中間的句法結(jié)構(gòu),也稱作淺層句法分析(shallow parsing)或部分句法分析(partial parsing),致力于識(shí)別句子中的某些結(jié)構(gòu)相對(duì)簡(jiǎn)單、功能和意義相對(duì)重要的成分,而不以完整的句法分析樹(shù)作為目標(biāo),從而簡(jiǎn)化分析的復(fù)雜度,提升分析的性能。Abney在1991年率先提出了組塊分析的思想[1]。國(guó)外的學(xué)者們采用基于轉(zhuǎn)換的錯(cuò)誤驅(qū)動(dòng)學(xué)習(xí)方法、基于規(guī)則的分析方法等對(duì)組塊分析進(jìn)行了研究。2000年,國(guó)際自然語(yǔ)言學(xué)習(xí)會(huì)議(Computational Language Learning,CoNLL)在Abney描述的組塊定義框架的基礎(chǔ)上,重新分解和細(xì)化了組塊的定義,并提出了英文的組塊分析共享任務(wù)[2]。在這個(gè)定義下,很多學(xué)者嘗試了使用基于支持向量機(jī)、基于手寫(xiě)規(guī)則、基于半指導(dǎo)學(xué)習(xí)等方法解決組塊分析問(wèn)題[3-4]。

      近幾年來(lái),中文組塊分析研究逐步得到人們的重視。周強(qiáng)在1996年對(duì)中文的語(yǔ)塊和基本短語(yǔ)進(jìn)行了研究[5]。1999年,趙軍和黃昌寧對(duì)漢語(yǔ)基本名詞短語(yǔ)的定義和自動(dòng)識(shí)別進(jìn)行了研究[6]。中國(guó)科學(xué)院計(jì)算技術(shù)研究所的李素建提出了12種漢語(yǔ)組塊類型,根據(jù)這些組塊類型和賓州大學(xué)中文樹(shù)庫(kù)短語(yǔ)類型的對(duì)應(yīng)關(guān)系進(jìn)行轉(zhuǎn)化得到組塊庫(kù)[7]。周強(qiáng)進(jìn)行了大規(guī)模中文語(yǔ)料庫(kù)的組塊標(biāo)注研究[5],建立了一個(gè)完整的組塊劃分體系,構(gòu)建了200萬(wàn)漢字的組塊平衡語(yǔ)料庫(kù)[8],張玉潔等也對(duì)中文組塊分析進(jìn)行了研究[9]。文獻(xiàn)[10]提出了一體化的分析模型,文獻(xiàn)[11]提出了一種基于分治策略的組塊分析方法。

      因(維語(yǔ))自然語(yǔ)言處理技術(shù)的研究起步較晚,詞法分析技術(shù)沒(méi)達(dá)到可用水平等原因,維語(yǔ)句法分析技術(shù)的研究基本處于初級(jí)階段。本文中對(duì)維語(yǔ)組塊分析進(jìn)行研究,采用條件隨機(jī)場(chǎng)建立了組塊分析算法。

      2 組塊定義和語(yǔ)料庫(kù)的構(gòu)建

      2.1 組塊定義和劃分原則

      根據(jù)Abney的定義,本文中為維語(yǔ)組塊確定如下定義。

      定義1 組塊是一種較詞復(fù)雜而較句子簡(jiǎn)單,處于詞和短語(yǔ)之間,具有一定句法功能的非遞歸、不重疊、不嵌套的短語(yǔ)。

      對(duì)上面的定義進(jìn)行詳細(xì)的解讀: 組塊由詞序列組成,其被標(biāo)記了句法功能標(biāo)記,并且是非遞歸、非嵌套的。組塊內(nèi)部一般包含一個(gè)中心成分以及中心成分的前置修飾成分,而不包含后置附屬結(jié)構(gòu)。組塊處于詞和短語(yǔ)之間,最簡(jiǎn)單的組塊就是一個(gè)詞,而最長(zhǎng)的組塊就是非嵌套的短語(yǔ)。組塊嚴(yán)格按照句法形式定義,而不體現(xiàn)語(yǔ)義性或者功能性。組塊分析的目的是識(shí)別句子中某些結(jié)構(gòu)相對(duì)簡(jiǎn)單、但有重要意義的成分,在詞法分析和完全句法分析中間架起一座橋梁,從而簡(jiǎn)化句法分析并且提高句法分析的性能。

      2.2 維吾爾語(yǔ)組塊標(biāo)記集的制定

      研究和制定樹(shù)庫(kù)標(biāo)注標(biāo)記集和規(guī)范之前,對(duì)英語(yǔ)樹(shù)庫(kù)和TCT樹(shù)庫(kù)的構(gòu)建過(guò)程進(jìn)行深入的研究,并與維語(yǔ)句法結(jié)構(gòu)進(jìn)行了對(duì)比研究。根據(jù)研究與分析后,按照以下步驟展開(kāi)了標(biāo)注標(biāo)記集的制定工作。

      步驟1 根據(jù)語(yǔ)法書(shū)初步制定一套現(xiàn)代維語(yǔ)短語(yǔ)標(biāo)記集;

      步驟2 從語(yǔ)料庫(kù)選擇句子結(jié)構(gòu)差異較大的100個(gè)句子;

      步驟3 對(duì)100個(gè)句子進(jìn)行人工標(biāo)注,登記使用現(xiàn)有標(biāo)記集不能準(zhǔn)確地標(biāo)記的現(xiàn)象;

      步驟4 若有現(xiàn)有標(biāo)記集不能準(zhǔn)確地標(biāo)記的現(xiàn)象,則對(duì)標(biāo)記集進(jìn)行分析與修正;

      步驟5 若標(biāo)記集沒(méi)有任何問(wèn)題,則檢查人工標(biāo)注的句子是否達(dá)到了500句,若沒(méi)有,則轉(zhuǎn)到步驟2,若達(dá)到了,則轉(zhuǎn)到步驟6;

      步驟6 結(jié)束標(biāo)注階段。

      按照以上步驟,反復(fù)地進(jìn)行標(biāo)記集的制定、修正,并最終確定了37個(gè)維語(yǔ)短語(yǔ)結(jié)構(gòu)標(biāo)記集和八個(gè)功能語(yǔ)塊標(biāo)記集。本文中,根據(jù)組塊分析的特點(diǎn)從37個(gè)短語(yǔ)標(biāo)記集定義了18個(gè)組塊標(biāo)記類型(表1)。

      表1 維吾爾語(yǔ)組塊類型和標(biāo)記

      2.3 維吾爾語(yǔ)組塊語(yǔ)料庫(kù)的構(gòu)建

      目前,被標(biāo)注完成的維語(yǔ)樹(shù)庫(kù)有3 000句,本文中從該樹(shù)庫(kù)語(yǔ)料庫(kù)抽取構(gòu)建維語(yǔ)組塊庫(kù)。從維語(yǔ)標(biāo)注樹(shù)庫(kù)中提取產(chǎn)生式右邊同時(shí)包含非終結(jié)符和終結(jié)符的產(chǎn)生式集合以及產(chǎn)生式右邊只包含終結(jié)符的產(chǎn)生式集合。對(duì)同時(shí)包含非終結(jié)符和終結(jié)符的產(chǎn)生式集合進(jìn)行人工校對(duì),然后與產(chǎn)生式右邊只包含終結(jié)符的產(chǎn)生式集合合并,根據(jù)該集合把原始句子轉(zhuǎn)換成組塊標(biāo)注的句子(表2)。目前構(gòu)建的維語(yǔ)組塊庫(kù)有31 184個(gè)組塊。例如,從標(biāo)注句子提取組塊的過(guò)程如下:

      拉丁文: [FS[SS[NP[NP Uning ?yidiki][NP Aq k?ngüllük]] [VP [UP q?rindashliqni [UP[CP b?sip chüshken] Idi]]]].]

      表2 從以上例組抽取過(guò)程

      表3所示的組塊是維語(yǔ)樹(shù)庫(kù)中的高頻組塊,占所有組塊的90.40%。

      表3 主要的十種組塊統(tǒng)計(jì)

      3 基于統(tǒng)計(jì)學(xué)習(xí)模型的組塊分析算法

      3.1 組塊分析的問(wèn)題描述

      組塊分析可以看作一個(gè)機(jī)器學(xué)習(xí)過(guò)程。它的任務(wù)是: 在給定組塊定義和類別下,對(duì)輸入句子自動(dòng)進(jìn)行塊劃分和對(duì)劃分的塊類型進(jìn)行標(biāo)記。其可以被形式化地描述如下:

      給定樣本集合W=w1,w2,…,wn和類別集合C=c1,c2,…,cn,尋找一個(gè)從樣本集W到類別集C的關(guān)系模型(映射規(guī)則)f: W×C →Boolean,然后利用這種學(xué)習(xí)得到的關(guān)系模型對(duì)新的輸入樣本進(jìn)行類別判斷。具體而言,給定由詞序列W=w1,w2,…,wk組成的句子,句子可以被劃分成若干個(gè)組塊,每個(gè)詞wi被標(biāo)記了組塊標(biāo)記ti,T=t1,t2,…,tn代表組塊標(biāo)記序列。組塊分析的結(jié)果如式(1)和式(2)所示。

      W=…[wi,wi+1,…,wi+m]wi+m+1,…,wi+m+n…

      (1)

      T=…[ti,ti+1,…,ti+m]ti+m+1,…,ti+m+n…

      (2)

      組塊分析的映射規(guī)則是系統(tǒng)根據(jù)機(jī)器學(xué)習(xí)的每類樣本特征信息,自動(dòng)學(xué)習(xí)出的分類規(guī)律和判別準(zhǔn)則。在分析中,這種映射是一對(duì)一的單標(biāo)號(hào)分類映射。

      3.2 組塊分析方法研究與分析

      組塊分析問(wèn)題可以被轉(zhuǎn)化為序列化標(biāo)注的問(wèn)題。而序列標(biāo)注可用的方法或模型有基于轉(zhuǎn)換錯(cuò)誤的方法、隱馬爾科夫模型、最大熵模型、支持向量機(jī)、條件隨機(jī)場(chǎng)模型等。在以上的方法或模型中,性能最優(yōu)的是條件隨機(jī)場(chǎng)模型,因此,本文采用條件隨機(jī)場(chǎng)建立維語(yǔ)組塊分析模型。

      3.3 特征空間的構(gòu)建

      判別式統(tǒng)計(jì)模型的關(guān)鍵是找出對(duì)消除歧義有貢獻(xiàn)的各類特征,并使用這些特征組合出不同的特征模板,通過(guò)實(shí)驗(yàn)驗(yàn)證特征模板的有效性,并選擇出最佳特征模板。本文中參考英文、中文等語(yǔ)種基于條件隨機(jī)場(chǎng)的組塊分析算法所用的特征,在此基礎(chǔ)上構(gòu)建維語(yǔ)組塊分析的特征空間。

      對(duì)于詞類序列W=w1,w2,…,wk,英文、中文的組塊分析中選取寬度為5的窗口,抽取當(dāng)前詞wi和前后各兩個(gè)詞的特征,提取的特征有詞形、詞性、詞綴、組塊標(biāo)記等,在中文的組塊分析模型中加入了前綴和后綴的特征。本文中,保留以上的特征基礎(chǔ)上,根據(jù)維語(yǔ)詞的特點(diǎn),還加入詞干、詞綴、詞性一級(jí)標(biāo)記、詞性二級(jí)標(biāo)記、同義詞標(biāo)記等構(gòu)建特征空間(表4)。

      表4 特征空間

      3.4 同義詞標(biāo)記庫(kù)的構(gòu)建

      以上特征空間中的SY(synonym)代表同義詞標(biāo)記,以下詳細(xì)解釋該標(biāo)記相關(guān)內(nèi)容。因?yàn)椋壳皹?gòu)建的維語(yǔ)樹(shù)庫(kù)規(guī)模較少,使用統(tǒng)計(jì)模型容易發(fā)生數(shù)據(jù)稀疏問(wèn)題造成的參數(shù)估計(jì)不準(zhǔn)確。如果能夠把詞義完全相同的單詞使用某種標(biāo)記或編號(hào)表達(dá)出來(lái),那么在一定的程度上可以緩解語(yǔ)料庫(kù)規(guī)模所帶來(lái)的分析性能的下降。因此,從現(xiàn)有的維語(yǔ)同義詞詞典構(gòu)建了一個(gè)維語(yǔ)同義詞標(biāo)記詞典。該詞典原有9 902個(gè)詞條,其中1 778個(gè)詞是復(fù)合詞,為了保證同義詞標(biāo)記的準(zhǔn)確率,本文中從其余的8 104個(gè)同義詞選出詞義嚴(yán)格相同的4 623個(gè)同義詞,并構(gòu)建了具有詞性標(biāo)注的同義詞庫(kù),對(duì)所有的同義詞進(jìn)行根據(jù)詞義和詞性的分類,并給每一個(gè)分類分配了一個(gè)標(biāo)記,最終構(gòu)建了有971個(gè)同義詞標(biāo)記的詞典,該同義詞標(biāo)記詞典結(jié)構(gòu)如表5所示。

      表5 同義詞標(biāo)記詞表

      3.5 組塊分析系統(tǒng)結(jié)構(gòu)

      條件隨機(jī)場(chǎng)模型是有指導(dǎo)的機(jī)器學(xué)習(xí)模型,先需要使用一定規(guī)模的標(biāo)注語(yǔ)料庫(kù)進(jìn)行模型參數(shù)的估計(jì),然后可以使用訓(xùn)練好的模型進(jìn)行解碼,即對(duì)未標(biāo)注語(yǔ)料進(jìn)行標(biāo)注。模型的訓(xùn)練使用L-BFGS算法,采用BeamSearch 算法進(jìn)行搜索,搜索寬度為5,CRF模型使用CRFComLib訓(xùn)練和測(cè)試。

      4 實(shí)驗(yàn)與分析

      本文中把3 000個(gè)被標(biāo)注的句子作為訓(xùn)練和測(cè)試語(yǔ)料庫(kù),由于語(yǔ)料庫(kù)的規(guī)模較少,采用交叉驗(yàn)證法進(jìn)行實(shí)驗(yàn)(圖1)。本文的組塊分析算法的性能評(píng)價(jià)指標(biāo)采用了國(guó)際通用的準(zhǔn)確率(P,Precision),召回率(R,Recall)和F值。

      圖1基于條件隨機(jī)場(chǎng)的維吾爾文組塊分析系統(tǒng)結(jié)構(gòu)

      4.1 特征選擇

      特征模板的選取和特征選擇是判別學(xué)習(xí)模型訓(xùn)練和應(yīng)用中的關(guān)鍵一步。特征是從訓(xùn)練樣本中抽取而來(lái)的,直接反映了組塊文本中的各種知識(shí)和實(shí)例。選取的特征規(guī)模和特征描述能力直接影響著分析系統(tǒng)的性能。對(duì)于不同的語(yǔ)言處理任務(wù),選取的特征也會(huì)不相同。一般的特征選取辦法分為兩種:

      1) 根據(jù)語(yǔ)言學(xué)家的語(yǔ)言學(xué)知識(shí)和文本的統(tǒng)計(jì)信息總結(jié)出來(lái)的經(jīng)驗(yàn),基于文本中的文字和標(biāo)記,定義形式化的特征模板,并利用特征模板從文本中抽取特征,或者稱為特征模板的實(shí)例化。

      2) 根據(jù)語(yǔ)言學(xué)家對(duì)于語(yǔ)言學(xué)知識(shí)的總結(jié),例如語(yǔ)言規(guī)則,語(yǔ)法規(guī)則,詞典和資源庫(kù)等外部信息,給予文本額外的信息和標(biāo)記。

      由于特征的任務(wù)相關(guān)性,有針對(duì)性的、任務(wù)驅(qū)動(dòng)的特征模板和特征定義往往可以給予分析系統(tǒng)很大的幫助,而無(wú)效的特征反而會(huì)降低系統(tǒng)的性能。

      本節(jié)中,根據(jù)文獻(xiàn)[10]中的實(shí)驗(yàn)結(jié)果,分別采用詞形、詞干、詞綴、詞性、同義詞標(biāo)記等構(gòu)建原子特征空間,在此基礎(chǔ)上組合不同的特征模板進(jìn)行實(shí)驗(yàn),如表6所示。

      表6 特征模板

      續(xù)表

      為了測(cè)試詞形、詞性、詞綴、詞干等特征信息的貢獻(xiàn),在文獻(xiàn)[10]進(jìn)行的總結(jié)的基礎(chǔ)上,構(gòu)建表6所示的特征模板。模板A是詞形模板,模板B是增加詞干信息,可以觀察詞性對(duì)模型性能的影響。模板C在模板B的基礎(chǔ)上只增加了詞綴特征。模板D中引入了一級(jí)詞性標(biāo)記,模板E中同時(shí)使用了一級(jí)和二級(jí)詞性標(biāo)記,模板F中引入了同義詞標(biāo)記。為了觀察一級(jí)標(biāo)記和二級(jí)標(biāo)記對(duì)模型性能的影響,模板G中只使用了二級(jí)標(biāo)記。為了選取最佳模板,利用所有的數(shù)據(jù)對(duì)表6包含的模板進(jìn)行實(shí)驗(yàn),如表7所示。

      表7 封閉測(cè)試結(jié)果

      4.1 交叉驗(yàn)證測(cè)試

      由于語(yǔ)料庫(kù)規(guī)模較少,實(shí)驗(yàn)中采用交叉驗(yàn)證法。為了觀察模型使用不同規(guī)模的語(yǔ)料庫(kù)訓(xùn)練時(shí)表現(xiàn)出的性能,進(jìn)行三次實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表8所示。

      實(shí)驗(yàn)A 把語(yǔ)料庫(kù)分成十個(gè)沒(méi)有交叉數(shù)據(jù)的子集,每一個(gè)子集的規(guī)模為300句,進(jìn)行十次實(shí)驗(yàn),最終求十次實(shí)驗(yàn)的平均值。

      實(shí)驗(yàn)B 把語(yǔ)料庫(kù)分成五個(gè)沒(méi)有交叉數(shù)據(jù)的子集,每一個(gè)子集的規(guī)模為600句,進(jìn)行五次實(shí)驗(yàn),最終求五次實(shí)驗(yàn)的平均值。

      實(shí)驗(yàn)C 把語(yǔ)料庫(kù)分成三個(gè)沒(méi)有交叉數(shù)據(jù)的子集,每一個(gè)子集的規(guī)模為1000句,進(jìn)行三次實(shí)驗(yàn),最終求三次實(shí)驗(yàn)的平均值。

      表8 開(kāi)放測(cè)試結(jié)果

      從實(shí)驗(yàn)結(jié)果可知,語(yǔ)料庫(kù)的規(guī)模對(duì)模型的影響力較大,主要的原因是使用模型訓(xùn)練的語(yǔ)料庫(kù)規(guī)模還不能足以讓模型達(dá)到飽和狀態(tài),即語(yǔ)料庫(kù)規(guī)模的擴(kuò)大不能提高模型性能的狀態(tài)。因此,語(yǔ)料庫(kù)的規(guī)模導(dǎo)致模型參數(shù)的估計(jì)出現(xiàn)更多的局部性或片面性。

      [1] Abney S P. Parsing by Chunks[J]. Computation and psycholinguistics,1991: 257-278.

      [2] T K Sang,S Buchholz.Introduction to the Conll-2000 Shared Task: Chunking[C]//Proceeding of CoNLL-2000,Lisbon,Portugal,2000: 127-132.

      [3] A Kinyon. A Language-Independent Shallow-Parser Compiler[C]//Proceedings of 39th ACL Conference,Tourouse,France,2001: 322-329.

      [4] J Hammerton,M Osborne,S Armstrong. Introduction to Special Issue on Machine Learning Approaches to Shallow Parsing[J]. Journal of Machine Learning Research.2002,2: 551-558.

      [5] 周強(qiáng).漢語(yǔ)語(yǔ)料庫(kù)的短語(yǔ)自動(dòng)劃分和標(biāo)注研究[D].北京大學(xué)博士學(xué)位論文.1996.

      [6] 趙軍,黃昌寧.漢語(yǔ)基本名詞短語(yǔ)結(jié)構(gòu)分析模型[J].計(jì)算機(jī)學(xué)報(bào),1999,22(2): 141-146.

      [7] 李素建,劉群,楊志峰.基于最大熵模型的組塊分析[J].計(jì)算機(jī)學(xué)報(bào). 2003,25(12): 1722-1727.

      [8] 張昱琪,周強(qiáng).漢語(yǔ)基本短語(yǔ)自動(dòng)識(shí)別[J].中文信息學(xué)報(bào).2002,16(6): 1-8.

      [9] W Chen,Y Zhang,H Isahara. An Empirical Study of Chinese Chunking[C]//Proceedings of the 44th Annual Meeting of ACL,Sydney,Australia,2006: 97-104.

      [10] 孫廣路.基于統(tǒng)計(jì)學(xué)習(xí)的中文組塊分析技術(shù)研究[D]哈爾濱工業(yè)大學(xué)博士學(xué)位論文.2008.

      [11] 周俏麗,劉新,郎文靜,等.基于分治策略的組塊分析[J].中文信息學(xué)報(bào).2012,26(5): 120-128.

      Conditional Random Fields Based Uyghur ChunkingAishan Wumaier,Tuergen Yibulayin,Kahaerjiang Abiderexiti,

      Zaokere Kadeer,Maihemuti Maimaiti,Yashen Aizezi

      (College of Information Science & Engineering,Xinjiang University,Urumqi,Xinjiang 830046,China)

      This paper proposes a Uyghur Chunk parsing scheme,and extracts chunks from 3000 annotated sentences. According to the characteristics of Uyghur language,additional features on the stem,affixes,synonyms etc are augmented. 3000 marked sentences are constructed,and the cross-validation experiments at the training/testing ration of 9∶1,8∶2,2∶1 result in the recall rates of 80.34%,76.87% and 66.76%,respectively.

      conditional random fields;uyghur;chunk parsing

      艾山·吾買(mǎi)爾(1981—),副教授,博士,碩士生導(dǎo)師,主要研究領(lǐng)域?yàn)樽匀徽Z(yǔ)言處理。E?mail:turgun@xju.edu.cn吐?tīng)柛ひ敛祭?1958—),教授,博士生導(dǎo)師,主要研究領(lǐng)域?yàn)樽匀徽Z(yǔ)言處理,軟件工程。E?mail:turgun@xju.edu.cn卡哈爾江·阿比的熱西提(1984—),碩士,講師,主要研究領(lǐng)域?yàn)樽匀徽Z(yǔ)言處理,信息抽取。E?mail:kaharjan@xju.deu.cn

      2014-01-08 定稿日期: 2014-05-10

      新疆大學(xué)博士啟動(dòng)基金,國(guó)家自然科學(xué)基金(61063043,61262060,60963018,61063026);國(guó)家社科基金重點(diǎn)項(xiàng)目(10AYY006);新疆大學(xué)校院聯(lián)合項(xiàng)目(XY110023);新疆多語(yǔ)種信息技術(shù)重點(diǎn)實(shí)驗(yàn)室開(kāi)放課題(049807);國(guó)家社會(huì)科學(xué)基金科研項(xiàng)目(13CFX055)

      1003-0077(2016)03-0090-06

      TP391

      A

      猜你喜歡
      維語(yǔ)組塊語(yǔ)料庫(kù)
      對(duì)比語(yǔ)言學(xué)視野下的維吾爾語(yǔ)與朝鮮語(yǔ)音義相近詞比較初探
      橫浪作用下大型上部組塊雙船浮托安裝動(dòng)力響應(yīng)特性試驗(yàn)研究
      淺析維語(yǔ)口語(yǔ)技能的影響因素和提升路徑
      《語(yǔ)料庫(kù)翻譯文體學(xué)》評(píng)介
      把課文的優(yōu)美表達(dá)存進(jìn)語(yǔ)料庫(kù)
      陸豐7-2油田導(dǎo)管架平臺(tái)上部組塊低位浮托安裝關(guān)鍵技術(shù)
      基于JAVAEE的維吾爾中介語(yǔ)語(yǔ)料庫(kù)開(kāi)發(fā)與實(shí)現(xiàn)
      試析否定詞綴在漢維語(yǔ)中的不同表現(xiàn)
      英語(yǔ)詞匯組塊學(xué)習(xí)路徑研究——組塊法
      淺析現(xiàn)代維語(yǔ)部分阿拉伯—波斯語(yǔ)借詞語(yǔ)音變化
      文教資料(2012年24期)2012-04-29 00:44:03
      达孜县| 西贡区| 靖江市| 田东县| 辽阳市| 老河口市| 陇川县| 修武县| 都昌县| 临安市| 易门县| 长垣县| 上饶县| 西和县| 佳木斯市| 蒙阴县| 盐津县| 个旧市| 鹿邑县| 房山区| 依兰县| 富阳市| 信丰县| 寻甸| 嘉鱼县| 乾安县| 霸州市| 郸城县| 濮阳市| 定南县| 湛江市| 出国| 三穗县| 托克托县| 霍邱县| 贵定县| 马尔康县| 故城县| 青田县| 揭东县| 广东省|