曾旎 鄭世玨 周駿 朱峰
摘要:隨著時代的進步,語音技術已經(jīng)變成一門綜合人類智能各項領域的技術。實現(xiàn)人與機器之間的自然通信是當今科學技術發(fā)展的主流,通過介紹語音識別與合成技術,嵌入以語音交互為核心的科大迅飛人工智能開放平臺,以高校學生思想政治教育與校園生活建設為背景,設計出符合高校輔導員與學生之間的語音對話庫,實現(xiàn)了Web端與手機APP端上的高校虛擬輔導員的語音對話系統(tǒng),進一步實現(xiàn)在教育行業(yè)突破性應用,推進高校教育事業(yè)。
關鍵詞:高校虛擬輔導員;語音識別與合成;語音對話;語音數(shù)據(jù)庫
隨著移動互聯(lián)網(wǎng)技術的快速發(fā)展,尤其是語音技術的發(fā)展,人們更希望通過采取語音對話這樣更加自然的方式去獲取信息,達到對話交流的效果。高校輔導員作為高等學校教師隊伍的重要組成部分,是高等學校從事德育工作,引導和陪伴大學生健康成長的骨干力量,也是大學生進行學風建設、日常管理的有力力量。
在20世紀50年代,美國AT&TBell實驗室研究出了可以識別十個英文數(shù)字的Audry語音識別系統(tǒng),打開了語音研究領域的大門。20世紀60年代,隨著人工網(wǎng)絡的引入,打開了語音識別的新思維,而其中的線性預測編碼LinearPredictive Coding(LPC)和動態(tài)時間彎折Dynamic Time Warp兩大技術更是奠定了神經(jīng)網(wǎng)絡在語音識別中的地位;美國佛羅里達州立大學教授貝勒從事RITL虛擬教師創(chuàng)新技術研究(Research of Innovative Technologies for Learning)。在國內(nèi)以中科院自動化所、哈爾濱工業(yè)大學、科大訊飛等為代表的一流大學和機構在語音研究中也投入相當多的研究精力。正是因為語音技術的發(fā)展,“虛擬人”概念應運而生。清華大學研究基于人工智能情感的機器人控制體系以及浙江大學研究的虛擬人物構造,由此可見,對虛擬人方面的研究正不斷深入,從而奠定了本系統(tǒng)的開發(fā)基礎。
本文通過研究語音識別與合成技術,嵌入科大訊飛提供的API作為支撐,采用Android移動開發(fā)技術,將語音識別與合成技術應用到當今高校教育中,打破傳統(tǒng)人機交互模式,實現(xiàn)了高校虛擬輔導員智能語音對話系統(tǒng),使得高校輔導員的工作以及高校學生的培養(yǎng)更加人性化,極大減輕我國高校輔導員作為大學生思想上的引路人、生活中的關心人、學習上的指導者、心理上的疏導者繁重的工作任務。
1.系統(tǒng)的相關技術
1.1科大迅飛語音API
科大訊飛作為我國最大的智能語音技術提供商,在語音的發(fā)展過程中起到了舉足輕重的作用??拼笥嶏w提供了語音開發(fā)過程中使用整合的API(API,Application ProgrammingInterface)接口。在實際的項目應用中,良好的編程接口設計可以使降低系統(tǒng)各部分的相互依賴,提高內(nèi)存單元的內(nèi)聚性,降低單元間的耦合度,從而提高系統(tǒng)的維護性和擴展性。科大訊飛APl的功能十分強大,其特色是與AJAX、JavaScript、XML或JSON等技術相結合。在我們的研究中,選用了科大訊飛API作為系統(tǒng)語音識別與轉換技術支持部分,并將科大訊飛語音識別嵌入到本系統(tǒng)中,通過網(wǎng)絡直接對科大迅飛平臺進行訪問,調(diào)用其API數(shù)據(jù)庫,高效地實現(xiàn)了文字與語音之間的靈活轉化,減輕編程負擔。