摘要:隨著信息科技和人工智能的不斷發(fā)展,模式識別作為人工智能的一個(gè)方面,在該領(lǐng)域的研究也不斷深入,特別是該模式的理論基礎(chǔ)和研究范圍也不斷在擴(kuò)展。本文首先介紹了人工智能和模式識別的涵義,并著重介紹了人工智能在模式識別方面的應(yīng)用。
關(guān)鍵詞:人工智能; 模式識別;應(yīng)用
隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展,特別是對于計(jì)算機(jī)硬件領(lǐng)域的不斷拓展,使計(jì)算機(jī)在感知外界的聲音、文字、圖像等信息資料方面有了進(jìn)一步的發(fā)展。當(dāng)我們?nèi)コ匈徫飼r(shí),在結(jié)帳口收銀員用掃碼器輕輕一掃,便可感知我們所購商品的各項(xiàng)參數(shù),從而快速的算出應(yīng)付金額;在醫(yī)院,通過做B超可以感知我們臟腑情況;電視臺每天準(zhǔn)確的預(yù)報(bào)天氣情況等。諸如掃碼器等物品就是計(jì)算機(jī)感知外界的產(chǎn)物,是人工智能的產(chǎn)物。為此相應(yīng)而生的模式識別技術(shù)也成研究人員當(dāng)前研究的熱點(diǎn)。
模式識別作為人工智能研究的一個(gè)方面,主要是通過計(jì)算機(jī)來模擬人類并以人類的感知力來完成對外界環(huán)境的感知并做出正確的判斷。
1 人工智能(Artificial Intelligence)
與自然智能相對應(yīng),人工智能是計(jì)算機(jī)模擬人工的方法、技術(shù),來完延伸和擴(kuò)展人的智能,所得到的結(jié)果是“機(jī)器思維”所產(chǎn)生。
人工智能作為一門學(xué)科,科研人員的主要科研方向是研究計(jì)算機(jī)的智能行為,并研制具有人類思維活動相似的計(jì)算系統(tǒng),如在感知、推理、學(xué)習(xí)、聯(lián)想等等方面,特別是在決策等方面可以解決人類專家才能處理的復(fù)雜問題,最終實(shí)現(xiàn)計(jì)算機(jī)與人類的高度統(tǒng)一。人工智能的本質(zhì)就是實(shí)現(xiàn)計(jì)算機(jī)對人類思維的模仿。
2 模式識別
廣義的模式識別主要涉及到兩個(gè)方面:一類是以生物體作為研究對象,屬于認(rèn)識科學(xué);一類是以計(jì)算機(jī)為研究方向,研究如何實(shí)現(xiàn)計(jì)算機(jī)的擬人化。本文主要討論的是對計(jì)算機(jī)的模擬識別的理論和方法。
模式識別是人工智能研究的一個(gè)方向,主要是以計(jì)算機(jī)為媒介,采用數(shù)學(xué)技術(shù)的方法來實(shí)現(xiàn)模式的自動處理、判讀。而這里所說的“模式”是指外界的環(huán)境和環(huán)境中所客觀存在的客體,隨著信息技術(shù)和人工智能研究的不斷深入,人類對于復(fù)雜信息的處理有了一定的發(fā)展,但是這些研究尚處于初級階段,還需要我們繼續(xù)不斷的深入研究。當(dāng)前計(jì)算機(jī)對外界環(huán)境(文字、聲音、人物等)的識別是計(jì)算機(jī)模式識別的主要研究點(diǎn)。信息處理是人類根據(jù)環(huán)境的不同及情況來完成對信息的識別、判斷,對于人類而言,主要信息來源是光學(xué)信息和聲學(xué)信息,光學(xué)信息的采集主要是視覺器來獲得,聲學(xué)信息主要通過聽覺器獲得,而模式識別主要也是要讓計(jì)算機(jī)能完成與人類相類似的信息采集。當(dāng)前,市場上比較成熟的信息采集系統(tǒng)有光學(xué)字符識別系統(tǒng)(Optical Character Recognition)、語音識別系統(tǒng)等。
模式識別的研究起源于上個(gè)世紀(jì)五十年代,由F.羅森布拉特首先提出,并初步實(shí)現(xiàn)了對給定樣本的識別,隨著對模式識別的不斷研究,在八十年代,由J.荷甫菲爾德提出了人工神經(jīng)元,使計(jì)算機(jī)在模式研究方面有了更為廣闊的空間,并且,在短時(shí)間內(nèi)取得了顯著成就。
3 人工智能在模式識別方面的應(yīng)用
3.1 數(shù)字識別、漢字識別、語音識別
手寫數(shù)字在過去的銀行業(yè)務(wù)、郵政編碼識別方面起到了非常重要的作用,但是由于個(gè)體差異,不同的人的書寫習(xí)慣,使工作人員在識別方面非常困難,增加了工作難度,也容易造成失誤,所以手寫數(shù)字的智能識別是人工智能識別中的一部分,并且隨著人工智能的發(fā)展,完全可以解決這一問題。
與數(shù)字識別相比較,漢字的識別則更為困難,當(dāng)前常用漢字有6763個(gè),在使用過程中,不僅受到人為書寫習(xí)慣的影響,同時(shí)還會受到特殊符號、外國字符等多種因素的干擾,這就為智能識別增加了難度。每個(gè)字符都會有對應(yīng)的符號,如果在識別過程中,開頭出現(xiàn)變化,即相應(yīng)的后續(xù)識別都會發(fā)生畸變。并且由于龐大的漢字系統(tǒng)和所呈現(xiàn)的模式不同,也讓計(jì)算機(jī)的識別難度大大提升。因此實(shí)現(xiàn)手寫漢字的識別是較為困難的。解決這一問題的基礎(chǔ)是需要神經(jīng)網(wǎng)絡(luò)技術(shù)的支持,同時(shí)還需要不斷豐富不同類型手寫字體的模式作為樣本在計(jì)算機(jī)中錄入不斷訓(xùn)練計(jì)算機(jī)的神經(jīng)網(wǎng)絡(luò),使其熟悉不同類型的字體。當(dāng)前,比較成熟的漢字識別軟件已經(jīng)實(shí)現(xiàn)了對掃描圖片中的文字高精確度的識別,如清華紫光OCR軟件。
語音識別簡而言之就是讓計(jì)算機(jī)可以聽懂人類的語言,當(dāng)前常用的口語自動翻譯系統(tǒng)可以實(shí)現(xiàn)七國語言的翻譯,七國語言即英、日、意、法、德、中、韓。中文的實(shí)驗(yàn)平臺由中國科學(xué)院自動化所來承擔(dān)和構(gòu)建。屬于國家級重點(diǎn)實(shí)驗(yàn)室,也使我國的口語翻譯處于世界領(lǐng)先水平。該系統(tǒng)的構(gòu)建,讓我國人民在國外的生活、旅行等方面更為便捷。
3.2 基于模式識別的網(wǎng)絡(luò)考試系統(tǒng)
基于模式識別的網(wǎng)絡(luò)考試系統(tǒng)主要采用SQL Serve數(shù)據(jù)庫和指紋模式,并且也成功的實(shí)現(xiàn)了網(wǎng)上考試、培訓(xùn)和學(xué)習(xí)。
隨著信息技術(shù)的飛速發(fā)展,各個(gè)公司、單位的人員需要不斷的進(jìn)行學(xué)習(xí)、培訓(xùn),才能滿足工作的發(fā)展需要,由于人員的數(shù)量龐大和流動性,這就給安排的工作人員增加了很大的負(fù)擔(dān),而基于模式識別的網(wǎng)絡(luò)考試系統(tǒng)則簡化了工作流程,減輕了工作人員的負(fù)擔(dān)。
在企業(yè)中,基于模式識別的考試系統(tǒng)主要在多媒體教室中應(yīng)用,主要構(gòu)成由一臺服務(wù)器和兩個(gè)指紋識別儀即可。開發(fā)工具是c++Builder5.0,Windows是操作系統(tǒng)。對于考試系統(tǒng)的軟件構(gòu)成主要有四個(gè)方面:指紋校驗(yàn)、試卷管理、考試管理、考試記錄。
指紋校驗(yàn)是該系統(tǒng)的關(guān)機(jī)技術(shù),采用的就是模式識別,指紋校驗(yàn)分為驗(yàn)證和識別,驗(yàn)證即是對已采集的指紋和考試人員的指紋進(jìn)行匹配,來確認(rèn)身份的一個(gè)過程,識別則是把現(xiàn)場采集的指紋與已采集的指紋相匹配,從而證明其合法性。計(jì)算機(jī)的指紋采集所得到的只是有限的信息,并不能做到百分之百的精確,因此結(jié)果也不能完全保證沒有差池。盡管在指紋識別方面存在安全隱患,但相比較傳統(tǒng)的用戶ID+密碼的方式,已經(jīng)有更高的安全等級。
3.3 人臉立體模式識別
人臉的識別過程較為復(fù)雜,主要分為三個(gè)部分:人臉模式庫、面部特征的定位、比對。首先是要對人臉進(jìn)行采集,并構(gòu)建數(shù)據(jù)庫;其次是對現(xiàn)場采集的人臉的主要器官和形狀信息進(jìn)行歸一化處理;最后要與以后數(shù)據(jù)庫進(jìn)行比對,從而確定人物的身份。當(dāng)前比較常用的人臉識別技術(shù)主要有以下幾個(gè)方面:第一是基于幾何特征的方法,這個(gè)方法最為典型,但是需要與其他方法相結(jié)合,才能獲得滿意的效果;第二是基于模板的方法,根據(jù)模板對象的不同,分為基于臉部特征的方法、基于線性判別分析的方法、基于神經(jīng)網(wǎng)絡(luò)的方法等等;第三是基于模型的方法,常用的有基于隱馬爾可夫模型的方法、基于主動外觀模型的方法等等。
基于人臉特征來實(shí)現(xiàn)身份的驗(yàn)證,精確度高、認(rèn)可程度高,更重要的是穩(wěn)定性好,因此從推廣初期就受到了用戶的一致好評。在應(yīng)用過程中,由于表情、光照等因素的影響,也是當(dāng)前人臉識別技術(shù)中主要的影響因素。在人臉二維、三維所獲得的人臉特征各有所長,二維獲得的圖像灰度值所呈現(xiàn)的是臉部表面亮度的差異,三維所獲得的則是臉型數(shù)據(jù)的差異,信息獲取方面,三維則更為豐富,對于人臉識別的精準(zhǔn)度更高。
TMS320C6701 DSP是由TI公司研發(fā)的,其信息的存儲都采用片內(nèi)存儲,圖像的操作在片上執(zhí)行,這種模式不僅耗能低,并且可以提供高性能。特別適用于人臉識別。并且根據(jù)圖像數(shù)據(jù)庫的大小,可智能化的擴(kuò)展Flash;還可以根據(jù)人臉識別中的具體要求來更換合適的DSP。并且TI公司還推出了集成性DSPs軟件開發(fā)工具,即CCS,通過這個(gè)工具,可以根據(jù)不同要求對軟件進(jìn)行編輯、翻譯、調(diào)試,以達(dá)到想要的效果。
4 結(jié)語
本文簡要介紹了人工智能和模式識別的涵義,并著重介紹了人工智能在模式識別中的應(yīng)用。當(dāng)前對于人工智能在模式識別中的研究還處于發(fā)展階段,隨著科研人員對模式識別研究的不斷深入,其應(yīng)用范圍也會越來越廣,人工智能化在未來則會有出更為廣闊的天地。
參考文獻(xiàn):
[1]陜粉麗.人工智能在模式識別方面的應(yīng)用[J].長治學(xué)院學(xué)報(bào),2007(4):3032.
[2]Adaptive Signal Dependent Audio Watermarking Based on Human Auditory System and Neural Networks. Applied Intelligence 23, 191 206, 2005. 2005 Springer Science +Business Media, Inc. Manufactured in The Netherlands.Manufactured in The Netherlands.
[3]鄭高.人工智能方法在電梯交通模式識別中的應(yīng)用[J].湖南農(nóng)技,2014,2(41):4849.
作者簡介:郝彥琴(1975),女,山西原平人,本科,講師,主要從事計(jì)算機(jī)語言研究。