摘 要:人機交換技術的迅速發(fā)展,帶動了多模式人機交換技術,多模式人機交換技術在手語數(shù)據(jù)庫中得到了廣泛的應用。手語數(shù)據(jù)庫的建設成為手語識別系統(tǒng)的發(fā)展趨勢,手語數(shù)據(jù)庫在手語識別系統(tǒng)中的應用與發(fā)展已成為當前手語識別系統(tǒng)研究的熱點問題。
關鍵詞:人機交換;手語數(shù)據(jù)庫;研究;手語識別
中圖分類號:G762
當前,人機交互技術的研究已經(jīng)成為計算機技術研究領域的重要組成部分。當人們信息交流時,傳遞消息的方式包括書面語及口語等自然語言,同時包括表情、手語、口型及體勢等人體語言聯(lián)合或同時使用。因而研究其與自然語言的信息融合,以及人體語言的感知模型,對于加強人機接口的可實用性和提高計算機自然語言理解水平具有重要意義。
目前我國聽力、語言殘障人士超過2000萬人,而且每年還在以2萬~3萬名的速度遞增。對使用手語交流的這類人群進行研究,有助于改善和提高這些殘疾人士的生活、學習和工作條件,為他們提供更好的服務。因此需要設計研發(fā)手語識別系統(tǒng),所謂“手語識別”,是指通過計算機采集設備獲得聾啞人的手語數(shù)據(jù),采用模式識別算法,并應用手語數(shù)據(jù)庫識別對比與分析,獲知手語含義,進而翻譯成語音,傳達給不懂手語的正常人。這樣,正常人就可以“聽懂手語”。
手語識別系統(tǒng)主要分為基于數(shù)據(jù)手套的識別和基于手語視覺圖像的識別系統(tǒng)。根據(jù)國外媒體的相關報道,美國華盛頓大學的工程師正在對一款名為MobileASL的識別工具進行測試,其工作原理是運用運動感知技術來進行美國手語的識別和以此在手機上發(fā)送圖像來進行工作。這是一項是非尖端的技術,是目前唯一可查的研究手語識別的技術,這項技是通過移動終端得以應用的。手語識別系統(tǒng)在我國的應用前景十分廣闊,目前正在積極探索這一課題。
1 手語數(shù)據(jù)庫
1.1 手語數(shù)據(jù)庫管理的內(nèi)涵和工作原理。手語數(shù)據(jù)庫管理是關建立、存儲、修改、存取手語數(shù)據(jù)信息的一種綜合性技術數(shù)據(jù)庫,它可以保證手語識別在該系統(tǒng)中正常工作以及相關工作人員的技術性管理工作的保障。手語數(shù)據(jù)庫管理的工作內(nèi)容有:手語數(shù)據(jù)庫進行重組和重構、調(diào)優(yōu)、安全控制、備份、報錯和匯總、問題分析和處理等內(nèi)容。
1.2 多媒體數(shù)據(jù)庫如何在手語識別系統(tǒng)中得以實現(xiàn)。多媒體數(shù)據(jù)庫可以實現(xiàn)多媒體數(shù)據(jù)的存儲、存取、檢索和管理等功能的保障,它是一種實用性的數(shù)據(jù)庫系統(tǒng)。那么,手語識別系統(tǒng)中如何實現(xiàn)多媒體數(shù)據(jù)庫呢?以下就是實現(xiàn)的方式:(1)關系型數(shù)據(jù)庫為主的構造方式,這是通過將關系數(shù)據(jù)庫的某個字段中存放指向多媒體塊的指針來實現(xiàn)的,這種操作方法可以大量使用于多媒體信息之間互通較少的情況下;(2)面向?qū)ο蟮臉嬙旆绞?,這是目前尚未或是很少涉及的方式,在目前,占有大量份額的還是關系數(shù)據(jù)庫方式;(3)超媒體模型方式,這是通過超媒體中的每個節(jié)點攜帶多媒體信息開存儲指向其他節(jié)點的指針信息的操作方式,由于具有功能非常強大的特點,是未來具有發(fā)展前景的方式,它主要是通過節(jié)點和鏈接作為對象來處理進行工作的。
1.3 手語數(shù)據(jù)庫的層次結構。手語數(shù)據(jù)庫總共可以分為概念層、表現(xiàn)層、物理層三個層次機構。(1)概念層。手語數(shù)據(jù)庫的概念層是對現(xiàn)實世界事物對象的描述,表示的是現(xiàn)實世界的抽象結構。數(shù)據(jù)庫開發(fā)人員主要是以概念層的數(shù)據(jù)庫語言為工作語言來實現(xiàn)對各種數(shù)據(jù)進行統(tǒng)一管理的,且存儲于這些數(shù)據(jù)庫之中。概念層的對象來自幾個不同的數(shù)據(jù)庫,所以概念層由一組對象構成,并且概念層的模式必須按照幾個不同數(shù)據(jù)庫的概念模式進行詮釋。(2)表現(xiàn)層。手語數(shù)據(jù)庫的表現(xiàn)層主要是視圖層和用戶層兩個內(nèi)容。手語數(shù)據(jù)庫的外部表現(xiàn)形式被稱為視圖層,即:用戶可見到其中的表格、圖形和畫面以及所要播放的聲音等。用戶層是通過專門的手語數(shù)據(jù)庫布局規(guī)格來說明語言從而實現(xiàn)描述的,它是以面向用戶提供使用接口的數(shù)據(jù)層。雖然有著不同的非格式數(shù)據(jù)表現(xiàn)形式,但是它們之間存在著一定的關聯(lián)性,正是這種關聯(lián)性使得手語數(shù)據(jù)庫系統(tǒng)具有更加重要的作用。(3)物理層。物理存儲描述就是數(shù)據(jù)庫的物理層,它是以形式的方式來描述手語數(shù)據(jù),也是以形式的方式來描述如何將手語數(shù)據(jù)存放在計算機的物理存儲設備之上的。相對于多媒體數(shù)據(jù)庫而言,其實際的數(shù)據(jù)是以不同的形式分散存于不同的數(shù)據(jù)庫之中。例如,學生檔案的多媒體管理數(shù)據(jù)庫中,某人的照片和聲音可能專門被保存在圖像數(shù)據(jù)庫和聲音數(shù)據(jù)庫之中,而他的其他信息可能保存在其它的相關數(shù)據(jù)庫之中。
1.4 管理技術在手語數(shù)據(jù)庫的應用。第一,加密技術可以應用于手語數(shù)據(jù)庫的管理中。對于一些諸如個人銀行信息、網(wǎng)上商城中的個人信息等非常重要的數(shù)據(jù)信息,我們可以通過加密技術來進行信息存儲,以便使得這些信息得到安全保障。那么,即便是遇到黑客侵襲,甚至是整個系統(tǒng)都遭到破壞,而存儲于系統(tǒng)數(shù)據(jù)庫里中的信息也是不會遭到破壞和丟失的。一些比較常用的加密技術如下:對機密的文件進行加密,例如可以設置權限訪問,這樣沒有授權的人就不會接收信息的,從而加密了信息。正是有了加密技術,數(shù)據(jù)庫管理系統(tǒng)的安全性才得以維護。正是如此,加密技術在手語數(shù)據(jù)庫的應用和管理中得到廣泛應用。第二,在對手語數(shù)據(jù)庫進行管理時,可以采用存取管理技術。存取管理技術需要用戶認證技術和訪問控制技術兩個方面的支持。其中,用戶認證技術包括著用戶身份驗證技術和用戶身份識別技術,正是這種等級式的管理技術就使得沒有經(jīng)過認證的惡意用戶在訪問手語數(shù)據(jù)庫時具有難度性的限制。而訪問控制技術又是由數(shù)據(jù)瀏覽控制和數(shù)據(jù)修改控制技術構成,這就在很大程度上保證了數(shù)據(jù)在可信性、正確性、保密性等方面的可靠度。第三,還可以使用數(shù)據(jù)備份技術與數(shù)據(jù)恢復技術在手語數(shù)據(jù)庫的管理過程之中。經(jīng)常對數(shù)據(jù)庫中的數(shù)據(jù)進行備份,是工作人員在平時數(shù)據(jù)建立和管理的過程中需要使用的良好方法。所以,當系統(tǒng)出現(xiàn)故障的時候,這些備份數(shù)據(jù)可以被恢復,從而得以時間和金錢的節(jié)約,也使得數(shù)據(jù)的一致性與完整性得以保障。
2 多媒體數(shù)據(jù)庫如何在手語合成與識別中得以應用
根據(jù)應用的類型的差異,多媒體數(shù)據(jù)庫可以被分為圖像數(shù)據(jù)庫、視頻數(shù)據(jù)庫和音頻數(shù)據(jù)庫。在手語合成與識別中,多媒體數(shù)據(jù)庫在手語識別應用中整個系統(tǒng)先要進行視頻采集,然后數(shù)據(jù)處理,將采集到的視頻信號與多媒體數(shù)據(jù)庫中預存儲的數(shù)據(jù)進行對比分析,最后輸出顯示結果。
2.1 圖像數(shù)據(jù)庫。與常規(guī)的數(shù)據(jù)類型不同,圖像數(shù)據(jù)庫中的圖像和圖形有著自己的一些特征,例如:其數(shù)據(jù)是靜態(tài)的,尺寸大小是可變的,數(shù)據(jù)量是不同的。其中,所有的圖像與常規(guī)的字符數(shù)據(jù)都是進行平等處理的,但是缺點是圖像對象和特征的辨認度是較低的,那么,這就意味著查詢中會存在著不精確匹配的問題。
2.2 視頻數(shù)據(jù)庫。查詢語言在視頻數(shù)據(jù)庫中的作用是重要的,因為數(shù)據(jù)建??蚣芘c查詢語言之間的影響較大,因此,它們之間的關系不能被分離,那么,就必須在規(guī)定的時間內(nèi)重放取出的場景并利用圖像處理技術進行視頻索,從而實現(xiàn)檢索功能在視頻數(shù)據(jù)庫中的應用。如果要保證圖像的質(zhì)量,能夠保證以最低數(shù)據(jù)傳輸速度進行存儲的系統(tǒng)可以被開發(fā)出來。這種新的存儲系統(tǒng)必須要有保證數(shù)據(jù)的添加的功能,這是與傳統(tǒng)的事務管理方法不同之處。此外,需要注意的是,視頻圖像數(shù)據(jù)庫服務器中的視頻圖像的版權問題必須要保護,這是具體使用中的問題。
2.3 音頻數(shù)據(jù)庫。音頻數(shù)據(jù)庫的管理對象是音頻數(shù)據(jù),這些音頻數(shù)據(jù)管理需要正確存放才可以使得數(shù)據(jù)分析存在便利性,正是這種檢索的便利性使得音頻數(shù)據(jù)庫與傳統(tǒng)的數(shù)據(jù)管理不同,便于人們在數(shù)據(jù)庫尋找有用的音頻數(shù)據(jù)。
3 結束語
本文對手語數(shù)據(jù)庫進行了較為詳細和具體的講解和介紹,分析了多媒體數(shù)據(jù)庫在手語識別系統(tǒng)中的應用。手語數(shù)據(jù)庫作為手語識別系統(tǒng)的重要組成部分,在未來手語識別領域的研究中將發(fā)揮重要作用。通過對手語數(shù)據(jù)庫的分析研究,進一步增強了手語識別系統(tǒng)的可行性,為今后手語識別系統(tǒng)的設計與開發(fā)奠定了良好的基礎。
參考文獻:
[1]萬宜.基于小波神經(jīng)網(wǎng)絡的車牌自動識別研究[D].南京:東南大學,2004:26-27.
[2]殷濤.基于幾何矩的手勢識別算法[D].上海:上海海運大學,2004:30-32.
[3]周航.基于計算機視覺的手勢識別系統(tǒng)研究[D].北京:北京交通大學,2007:32-33.
作者簡介:孫冰玉(1976.01-),女,黑龍江富錦人,本科,講師,研究方向:數(shù)據(jù)庫技術、虛擬現(xiàn)實、多媒體、人工智能。
作者單位:黑龍江職業(yè)學院第二校區(qū),黑龍江雙城 150111