• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      察合臺維吾爾語電子詞典研究

      2016-02-15 09:33:47新疆斯馬依江艾買爾
      作文教學研究 2016年5期
      關鍵詞:斯馬古典文學維吾爾語

      新疆 斯馬依江·艾買爾

      察合臺維吾爾語電子詞典研究

      新疆 斯馬依江·艾買爾

      目前在學術世界各位研究員利用各種各樣的詞典軟件、萬方數(shù)據(jù)庫等學術交流軟件及時的獲取相關研究資料,可是察合臺語的信息到目前為止未能電子化。

      察合臺維吾爾文 電子詞典 信息技術計算語言學 古典文獻

      一、察合臺文(語)的基本特征

      (一) 察合臺文(語)的相關理論

      察合臺維吾爾文是指從13世紀到19世紀末20世紀初在新疆和中亞地區(qū)廣泛使用的、以阿拉伯文基礎上形成的一種文字形式。已被發(fā)現(xiàn)的文獻或民間中收藏的這些文獻都用察合臺文編寫或抄寫的。這些寶貴財富設計到文學、藝術、哲學、宗教、民俗、醫(yī)學、經(jīng)濟、社會學等等多方面、具有一定的研究價值。尤其是研究我國與周邊中西亞國家之間的政治、經(jīng)濟、社會、文化關系研究方面提供不可替代的資源依據(jù)。雖然,我國盡新疆地區(qū)出土和民間收藏的察合臺文文獻資料不僅數(shù)量特別多而且涉及到的范圍也特別大,但是對察合臺文文獻研究還處于比較弱的狀態(tài)。因此,這些文獻資料的處理或研究工作納入到電子信息化的語言工程范圍內的步找特別慢或該項工作還沒有形成規(guī)模。本文探討主要問題察合臺文文獻轉換國際音標系統(tǒng)研究,而不是察合臺文文獻研究。[2]

      (二)察合臺文(語)的語音和詞匯特征

      語音特征:

      察合臺文采用阿拉伯字母,共有28~32個字母。有的字母專用于拼寫阿拉伯語-波斯語源的詞。詞中的元音往往省略不寫出。有些輔音用發(fā)音近似重復的2~4個阿拉伯字母拼寫,有個別的雙字母及清濁音混用字母,有幾個元音用同一個字母(單字母或雙字母)表示,或一個字母在不同音節(jié)中既表示元音又表示輔音的觀象。有些輔音字母在阿拉伯文中發(fā)音近似,字形不同,但在察合臺文中發(fā)音相同。除字母外,還有輔助符號。字母分詞首、詞中、詞末、單獨等形式。從右至左橫書。阿拉伯 -波斯語源的詞,依阿拉伯 -波斯文正字法拼寫;一部分現(xiàn)代維吾爾語固有詞受阿拉伯 -波斯文正字法及回鶻文書寫傳統(tǒng)影響,其音節(jié)僅由輔音字母構成。正字法遵循形態(tài)學原則。[1]

      詞匯特征:察合臺語在詞匯、語法、語音等方面盡管不同程度地受到阿拉伯語和波斯語的影響, 但還是保持古代現(xiàn)代維吾爾語的特點,并成為現(xiàn)代現(xiàn)代維吾爾語形成和發(fā)展的基礎。察合臺語詞語接受到阿拉伯語借詞、波斯語借詞、阿拉伯語-波斯語合璧借詞。該詞匯在寫過程中元音脫落,不過讀音時加

      二、察合臺語的詞典軟件研究

      (一)基本功能

      由于是紙質版的書籍給其帶來的諸多不便,查閱詞匯時會消耗大量的人力和時間。我們在查看資料時不由得想到用較少的時間來獲取較多的信息,所以我們就詞典軟件檢索察合臺詞匯。

      軟件型電子版詞典在查找詞匯方面對古代語言文學研究者來說比用紙質版詞典便利,好用。此察合臺語軟件型電子版詞典可以把查詢結果面板打印。此外,隨時可以把遇到的察合臺語生詞添加到軟件詞匯庫內。此察合臺語軟件型電子版詞典對大部分察合臺語言文學學者提供一個靈巧,便利,可用的通用工具。

      (二)建立語料庫

      詞典就要依靠詞匯對應預料庫,在本文中提到此詞匯庫應用于阿布力米提。艾海提,斯馬依。卡地爾,艾尼扎提、新疆人民衛(wèi)生出版社、2002年4月編的“察合臺現(xiàn)代維吾爾語詳解詞典”紙質版詞典收錄。由于基于規(guī)則的語言模型比較脆弱,針對性比較強,且很難根據(jù)實際的數(shù)據(jù)進行調整,因此本文試圖嘗試基于詞匯庫的察合臺詞識別,從訓練的語言數(shù)據(jù)中自動地獲取統(tǒng)計知識,建立察合臺詞用法識別的語言模型。由于察合臺詞用法的識別實際上是句子中的詞序列問題,且察合臺詞的使用與其所在的上下文語境序列有密切的聯(lián)系,因此本文選擇條件隨機場模型來進行察合臺詞用法的自動識別研究。采用基于詞匯庫的方法進行察合臺詞識別,能進一步提高轉換技術的準確率。

      三、察合臺語的詞典軟件設計實現(xiàn)

      (一)系統(tǒng)初步設計

      首先通過對察合臺語進行分析,并研究其在歷史當中的作用;對其能夠流傳至今作出科學的評判和理解。做出更加科學、合理的教學指引思路。

      軟件制作后方便學者利軟件輸入關鍵字,迅速查到關于本關鍵字的相關文獻信息。

      (二)系統(tǒng)的功能設計

      輸入察合臺語的詞匯時快速查找顯示出來此詞匯對應的現(xiàn)代維吾爾語翻譯,解釋,短語,列句子。

      確定了軟件設計結構后,通過編碼和優(yōu)化實現(xiàn)這一結構是不太復雜的。但是涉及到相關的細節(jié)問題相當多,例如,程序的初始界面是怎樣的,一開始運行程序,首先應該有字母表,否則用戶無法選取;此外,應總是有一些單詞(即使在初始狀態(tài)下),這表現(xiàn)了設計者的友好的設計風范。所以,當程序一旦加載,就應該出現(xiàn)字母表和以A字母開頭的單詞。隨著用戶的使用,界面上的單詞和釋義不斷做出變化,這一過程是交互的。還可以給單詞或釋義配音,甚至用動畫等方式帶來更易接受的效果;合理的引導信息,當用戶未點擊到有效的區(qū)域時,智能型的軟件可以給用戶做出自動提示,例如告知:“您沒有點擊到單詞上,請再試一次”等等。

      四、總結

      達到能夠有效的查閱、收集和整理古典文學研究文獻,為古典文學研究者提供良好的基礎軟件,給世界各地的維吾爾語古典文學研究者和各位學者提供一個很好的詞匯檢索軟件。通過收集察合臺語詞典的紙質版古典文學研究的維吾爾文論文信息整理并輸入到數(shù)據(jù)庫,制作古典文學研究文獻詞典軟件。

      [1]阿布都魯夫·塔克拉瑪干尼。察合臺維吾爾語法。北京民族出版總社、2007年6月

      [2]王小科、C#開發(fā)實戰(zhàn)vs2010版、清華大學出版社、2013年9月

      斯馬依江·艾買爾(1984.3~),性別:男,籍貫:新疆伽師縣,學歷(2014級碩士研究生)研究方向:計算語言學。

      (作者單位:新疆師范大學)

      通過制作“古典文學研究詞典軟件”軟件初步形成維吾爾古典文學文獻搜索引擎,為古典文學研究者提供良好的基礎軟件,還可以及時更新信息并擴展到今后維吾爾文學作品軟件體系。使世界各地的古典文學研究者和各位學者提供一個很好的詞匯檢索軟件。本軟件可以有效的彌補古典文學研究專著電子型研究軟件方面的空白。

      猜你喜歡
      斯馬古典文學維吾爾語
      更正說明
      《於于野談》與中國古典文學關系考察
      統(tǒng)計與規(guī)則相結合的維吾爾語人名識別方法
      自動化學報(2017年4期)2017-06-15 20:28:55
      中日古典文學作品中的狐意象研究
      文學教育(2016年33期)2016-08-22 12:58:32
      維吾爾語話題的韻律表現(xiàn)
      維吾爾語詞重音的形式判斷
      語言與翻譯(2015年4期)2015-07-18 11:07:45
      現(xiàn)代維吾爾語中“-0wat-”的進行體特征
      語言與翻譯(2014年3期)2014-07-12 10:32:09
      寫在改版之際
      葡萄牙飛翼難展翅
      佛教| 海门市| 洪泽县| 巴楚县| 琼中| 西乌珠穆沁旗| 邢台县| 珠海市| 榕江县| 肇东市| 东莞市| 邹平县| 突泉县| 沁阳市| 沂源县| 楚雄市| 和平区| 商丘市| 呈贡县| 科技| 永州市| 齐河县| 裕民县| 阜新| 明星| 司法| 都昌县| 浦城县| 博爱县| 斗六市| 长阳| 平凉市| 潞西市| 三亚市| 西林县| 绥中县| 英吉沙县| 南开区| 武义县| 军事| 车险|