• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    淺談信息處理用現(xiàn)代維吾爾語名詞語義分類研究

    2018-02-03 12:21:59麥麗開·阿皮孜玉素甫·艾白都拉
    電腦知識與技術(shù) 2018年2期
    關(guān)鍵詞:維吾爾語

    麥麗開·阿皮孜 玉素甫·艾白都拉

    摘要:現(xiàn)代維吾爾語各個詞類中,大部分是名詞,名詞的數(shù)量最多,句法地位也很重要。但是,目前對名詞進行語義方面的研究卻最為薄弱。為了提升維吾爾文信息處理水平,我們先建立信息處理用維吾爾語名詞語義分類體系。該文主要介紹對維吾爾語名詞語義分類的研究實踐,分類的基礎(chǔ)資源以及分類的必然性,簡要描述了分類過程中需要解決的若干問題。

    關(guān)鍵詞:維吾爾語;語義分類;名詞

    中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2018)02-0262-02

    1 基礎(chǔ)資源

    目前的名詞研究狀況來說,有關(guān)名詞知識描寫遠遠不夠,原因一方面是人們比較重視動詞研究,把動詞作為了句子核心,而對名詞關(guān)注不夠,另一方面名詞特別多,由于騎術(shù)牧龍大,研究難度也相當大,迄今為止,研究成果一直不如動詞研究那么豐富。

    詞類標注的方法自從 1960 年代開始被研究的,國外專家不斷地更新和探尋相關(guān)的研究方法。WordNet 是一種傳統(tǒng)的詞典信息與現(xiàn)代計算機技術(shù)以及心理語言學(xué)的研究成果有效結(jié)合的一個產(chǎn)物。它是一個聯(lián)機英語詞匯檢索系統(tǒng)它作為語言學(xué)本題庫, 同時又是一部語義詞典,在自然語言處理研究方面應(yīng)用非常廣泛。Wordnet中的名詞數(shù)據(jù)庫大約有8萬個名詞,分為實體,抽象物,心理特征,自然現(xiàn)象,活動,事件,集體,處所,所有物,外形,狀態(tài)等11類,有些概念進一步分為幾個小類。應(yīng)該說WordNet 類義劃分比較完備,但是缺乏一種照應(yīng)的網(wǎng)絡(luò)關(guān)系,也就是說對事物分類缺少實體和概念,實體和屬性間等關(guān)系的描述。

    北京大學(xué)與中科院計算所自1994年開始聯(lián)合開發(fā)“漢英機器翻譯模型系統(tǒng)”,就著手研制為漢英機器翻譯服務(wù)的“現(xiàn)代漢語語義詞典”?!艾F(xiàn)代漢語語義詞典”收錄的名詞37522個,名詞庫設(shè)15個字段,分為具體事物,抽象事物,過程,事件,空間等5大類,有些概念進一步分為幾個小類。

    自2008年內(nèi)蒙古大學(xué)蒙古學(xué)學(xué)院在國家自然科學(xué)基金的資助下著手研制“蒙古語語義信息詞典”,目前“蒙古語語法信息詞典名詞分庫”有了36個屬性字段,14105個名詞成為語義分類的對象。分為事,物,智慧,時間,空間,動作,量度等7個大類,有些概念進一步分為幾個小類。

    現(xiàn)代維吾爾語信息處理方面,新疆大學(xué)和新疆師范大學(xué)一直走在前列,維吾爾語詞性標注研究也得到了一定的成績,主要有:玉素甫.艾白都拉的《version1.0》和《version 2.0》的報告及有關(guān)論文;新疆大學(xué),吐爾根.依不拉音的《現(xiàn)代維吾爾語詞性標記集的探索》等。這些論文中詳細的描述了維吾爾語詞性標注的基本原則及方法,并提出了有關(guān)詞性標注標記集。目前,維吾爾語詞性標注工作主要是以基于統(tǒng)計法和規(guī)則法的兩種研究法而開展。

    2 維吾爾語名詞語義分類的必然性

    現(xiàn)代維吾爾語是黏著性語言,語法、語義范疇較為復(fù)雜。目前現(xiàn)代維吾爾語中采用的是按語法功能分類的12中詞類,這種分類方法無法滿足短語分析、句子分析、機器翻譯等現(xiàn)代維吾爾語信息處理方面的需求。為了正確的表達其包含的所有信息, 我們需要建立一個語法語義特征相結(jié)合的分類體系。雖然新疆大學(xué)和新疆師范大學(xué)理論方面提出了現(xiàn)代維吾爾語語義分類,但這個分類體系不夠詳細,缺乏很多信息,比如新疆師范大學(xué)對現(xiàn)代維吾爾語詞性標注集進行驗證性研究的過程中發(fā)現(xiàn)收錄的28133個名詞里面12926種名詞服從現(xiàn)有的現(xiàn)代維吾爾語詞性標注標記集規(guī)范,還有一部分名詞不滿足該規(guī)范的語義分類規(guī)律,這需要我們改正和補充。

    在現(xiàn)代維吾爾語信息處理研究工作中,光考慮詞語的語法意義,而忽略它的語義是會導(dǎo)致一個句子或者整篇文章的語義錯誤。例如:

    3 現(xiàn)代維吾爾語名詞語義分類難處

    現(xiàn)代維吾爾語里面名詞最多,但是名詞的分類研究基本上停留在以語法功能為基礎(chǔ)的水平。如果我們想建立一個更趨合理,相對較細的語義分類體系,必須要考慮下面幾個方面,這也算是我們所面臨的困難。

    4 結(jié)束語

    目前,現(xiàn)代維吾爾語名詞語義分類研究工作只能說是起步,但沒有停止。為實現(xiàn)名詞語義分類的合理化、系統(tǒng)化、科學(xué)化,我們還需要更重視理論認識與操作方法??傊?,我們的能力和水平有限的原因,上面所做的研究工作依然存在著不少的缺陷。因此,對語義分類體系工作要進行進一步的優(yōu)化和補充。

    參考文獻:

    [1] 玉素甫.艾白都拉,張海軍,等.信息處理用現(xiàn)代維吾爾語詞干詞類標記集研究[J].信息技術(shù)與標準化,2011(6).

    [2] 玉素甫.艾白都拉.信息處理用現(xiàn)代維吾爾語詞類標注標記集規(guī)范草案[C].新疆師范大學(xué),2011.

    [3] 吐爾根.依不拉音,阿里甫.庫爾班,阿不都熱依木.基于詞典的現(xiàn)代維吾爾語詞性自動標注系統(tǒng)的研究[J] .新疆大學(xué)學(xué)報,2011(6).

    [4] 努爾加瑪力.沙依提,現(xiàn)代維吾爾語詞性標注標記集驗證性實驗研究[D].新疆師范大學(xué),2015年5月.

    [5] 玉素甫.艾白都拉 阿布都熱依木.沙力,阿拉帕提古麗,信息處理用維吾爾語詞匯標記集的確定[J].計算機應(yīng)用,2009(7).

    [6] 王惠,詹衛(wèi)東,俞士汶,“現(xiàn)代漢語語義詞典”的結(jié)構(gòu)及應(yīng)用[J],語言文字應(yīng)用,2006(2).endprint

    猜你喜歡
    維吾爾語
    淺析維吾爾語表可能語氣詞
    統(tǒng)計與規(guī)則相結(jié)合的維吾爾語人名識別方法
    維吾爾語指示詞的語用研究
    維吾爾語話題的韻律表現(xiàn)
    中國維吾爾語、塔吉克語親屬稱謂對比研究
    語言與翻譯(2015年3期)2015-07-18 11:11:04
    指稱在維吾爾語語篇中的銜接方式及其功能
    語言與翻譯(2015年1期)2015-07-18 11:10:08
    維吾爾語主謂句SV句的語義結(jié)構(gòu)分析
    語言與翻譯(2015年2期)2015-07-18 11:09:55
    維吾爾語詞重音的形式判斷
    語言與翻譯(2015年4期)2015-07-18 11:07:45
    漢語動結(jié)式在維吾爾語中的表現(xiàn)形式
    語言與翻譯(2015年4期)2015-07-18 11:07:43
    現(xiàn)代維吾爾語中“-0wat-”的進行體特征
    語言與翻譯(2014年3期)2014-07-12 10:32:09
    乌恰县| 三门峡市| 曲水县| 武川县| 射洪县| 洛浦县| 淮北市| 泊头市| 山西省| 漠河县| 河曲县| 吉林省| 海城市| 陈巴尔虎旗| 黄梅县| 吉首市| 登封市| 丹东市| 定安县| 乳山市| 瑞安市| 眉山市| 聊城市| 北安市| 科技| 浦县| 浑源县| 南部县| 明溪县| 泾源县| 凭祥市| 江源县| 毕节市| 靖安县| 融水| 随州市| 江油市| 饶阳县| 漳州市| 达州市| 承德县|