郝雪燕
摘 要 隨著智能手機(jī)的普及,社交網(wǎng)絡(luò)成為人們交流溝通的重要方式,各類(lèi)基于實(shí)時(shí)語(yǔ)音的社交平臺(tái)APP層出不窮,豐富了人們的娛樂(lè)生活。人們?cè)谏缃黄脚_(tái)的語(yǔ)音交流越來(lái)越頻繁,因此,如何通過(guò)語(yǔ)音識(shí)別系統(tǒng)識(shí)別出低俗、垃圾信息,從而對(duì)用戶進(jìn)行監(jiān)管,是當(dāng)前社交平臺(tái)環(huán)境凈化的重要內(nèi)容。本文研究了基于語(yǔ)音識(shí)別的社交平臺(tái)環(huán)境凈化系統(tǒng)的關(guān)鍵技術(shù),包括語(yǔ)音識(shí)別技術(shù)的選取、實(shí)時(shí)語(yǔ)音轉(zhuǎn)寫(xiě)的流程、模型數(shù)據(jù)庫(kù)的訓(xùn)練、關(guān)鍵詞識(shí)別。
關(guān)鍵詞 語(yǔ)音識(shí)別;社交平臺(tái);環(huán)境凈化
引言
語(yǔ)言是人們用于有效溝通的一種交流方式,人們可以通過(guò)語(yǔ)言的交流來(lái)傳遞信息,隨著 智能手機(jī)和網(wǎng)絡(luò)技術(shù)的發(fā)展,實(shí)時(shí)語(yǔ)音類(lèi)的社交平臺(tái)近年在全球發(fā)展迅猛,如各類(lèi)直播平臺(tái)、基于語(yǔ)音的游戲APP,為人們之間的交流溝通提供了極大便利,其滲透人們?nèi)粘I畹姆绞街钊?、用戶?shù)量之龐大,讓人不能忽視其影響。社交網(wǎng)絡(luò)平臺(tái)的信息傳播具有迅捷、開(kāi)放、碎片化的特點(diǎn),若缺乏有效的信息管理與審核機(jī)制,往往會(huì)使低俗語(yǔ)音、垃圾語(yǔ)音充斥在網(wǎng)絡(luò)環(huán)境中[1]。
1社交平臺(tái)的環(huán)境凈化的現(xiàn)狀
一些社交平臺(tái)的網(wǎng)絡(luò)環(huán)境治理上有值得借鑒之處。例如,F(xiàn)acebook在處理垃圾信息時(shí),采取的是機(jī)器與人工審核結(jié)合的模式,并在2017年5月向社會(huì)公開(kāi)了自己的指導(dǎo)手冊(cè)[1]。而谷歌采用的凈化網(wǎng)絡(luò)環(huán)境最新手段核心是“降權(quán)”。
目前基于實(shí)時(shí)語(yǔ)音的社交平臺(tái)對(duì)于低俗、垃圾語(yǔ)音的稽查大多仍然停留在人工進(jìn)行錄音核查、處理的階段,由于聽(tīng)讀錄音的效率遠(yuǎn)不如直接觀看文字或者通過(guò)機(jī)器學(xué)習(xí)自動(dòng)識(shí)別來(lái)的高效,如何提高效率對(duì)客服的質(zhì)量進(jìn)行把關(guān)是亟須研究的問(wèn)題。目前興起的機(jī)器學(xué)習(xí)、人工智能等技術(shù)可以進(jìn)行圖像識(shí)別、語(yǔ)音識(shí)別、語(yǔ)義識(shí)別等,通過(guò)應(yīng)用機(jī)器學(xué)習(xí)來(lái)訓(xùn)練識(shí)別低俗、垃圾語(yǔ)音信息的模型,可以自動(dòng)識(shí)別出低俗、垃圾語(yǔ)音信息。
2語(yǔ)音識(shí)別技術(shù)
語(yǔ)音識(shí)別技術(shù)是人工智能的一個(gè)分支,經(jīng)過(guò)多年的發(fā)展,如今已經(jīng)比較成熟。語(yǔ)音信號(hào)經(jīng)過(guò)去噪音、 端點(diǎn)檢測(cè)等預(yù)處理之后,提取它的聲學(xué)特征,經(jīng)過(guò)訓(xùn)練生成模板庫(kù),識(shí)別的時(shí)候?qū)⑿枰R(shí)別的語(yǔ)音的特征與模板庫(kù)進(jìn)行匹配,分析出語(yǔ)音對(duì)應(yīng)的文字,然后經(jīng)過(guò)后處理,輸出最終的識(shí)別結(jié)果[2]。
從語(yǔ)音識(shí)別模型的角度來(lái)說(shuō),主流的語(yǔ)音識(shí)別系統(tǒng)理論是建立在統(tǒng)計(jì)模式識(shí)別基礎(chǔ)之上的。本系統(tǒng)通過(guò)建立使用卷積神經(jīng)網(wǎng)絡(luò)的語(yǔ)音模型,通過(guò) Web Socket 協(xié)議建立客戶端與服務(wù)器端的長(zhǎng)連接,將連續(xù)的語(yǔ)音內(nèi)容即時(shí)上傳,服務(wù)器端實(shí)時(shí)進(jìn)行語(yǔ)音識(shí)別,并返回對(duì)應(yīng)的文字信息。對(duì)得到的語(yǔ)音信息進(jìn)行特征提取,然后通過(guò)與計(jì)算機(jī)中存放的語(yǔ)音模板的語(yǔ)音特征進(jìn)行對(duì)比,找到最優(yōu)解,最后使用這種方式可以得到更好地音素識(shí)別率。語(yǔ)音識(shí)別方法中實(shí)際包括語(yǔ)音識(shí)別判斷和模板數(shù)據(jù)庫(kù)訓(xùn)練兩部分的關(guān)鍵內(nèi)容,同時(shí)為實(shí)現(xiàn)有效的語(yǔ)音識(shí)別還往往包含兩部分。首先是引入固定標(biāo)準(zhǔn)識(shí)別方法進(jìn)行匯聚和訓(xùn)練,以通過(guò)采集得到相應(yīng)的完整語(yǔ)音參數(shù),將該語(yǔ)音參數(shù)進(jìn)行存儲(chǔ)并用做參考模板,經(jīng)過(guò)多個(gè)參考模板的整合形成相應(yīng)的參考模板數(shù)據(jù)庫(kù),以此應(yīng)用于語(yǔ)音識(shí)別的參考標(biāo)準(zhǔn)。其次是語(yǔ)音識(shí)別中將參考模板數(shù)據(jù)庫(kù)中的模板和被采集的樣本進(jìn)行對(duì)比,基于相似度最高的原則進(jìn)行識(shí)別。
3基于語(yǔ)音識(shí)別的社交平臺(tái)環(huán)境凈化系統(tǒng)的構(gòu)建
語(yǔ)音識(shí)別技術(shù)在社交平臺(tái)環(huán)境凈化系統(tǒng)構(gòu)建中的引入,能夠規(guī)避傳統(tǒng)的人工審核的不利影響,同時(shí)提升社交平臺(tái)用戶的實(shí)際使用體驗(yàn)。基于此問(wèn)題和要求我們提出了基于語(yǔ)音識(shí)別的社交平臺(tái)環(huán)境凈化系統(tǒng)的模型。不同的社交平臺(tái)中出現(xiàn)的低俗、垃圾語(yǔ)音信息有所不同,該系統(tǒng)主要應(yīng)用大數(shù)據(jù)技術(shù)、人工智能技術(shù)對(duì)相應(yīng)平臺(tái)中出現(xiàn)的低俗、垃圾語(yǔ)音信息進(jìn)行分析,同時(shí)智能語(yǔ)音識(shí)別技術(shù)還能夠?qū)φZ(yǔ)音技術(shù)進(jìn)行采集,并且將采集到的語(yǔ)音信息轉(zhuǎn)換為文本,結(jié)合智能分析技術(shù)、數(shù)據(jù)庫(kù)比對(duì)技術(shù)分析文字語(yǔ)音,通過(guò)和數(shù)據(jù)庫(kù)中模型的對(duì)比判定用戶的語(yǔ)音中是否存在低俗、垃圾語(yǔ)音信息,對(duì)于判別中發(fā)現(xiàn)的異常信息可以對(duì)用戶進(jìn)行相關(guān)處理,如自動(dòng)封鎖賬號(hào)、禁言等。
4系統(tǒng)測(cè)試
通過(guò)在某基于實(shí)時(shí)語(yǔ)音的社交平臺(tái)APP內(nèi)進(jìn)行測(cè)試,本系統(tǒng)的語(yǔ)音識(shí)別準(zhǔn)確率是極高的。該APP為一款基于實(shí)時(shí)語(yǔ)音的游戲類(lèi)社交APP,日活用戶約為10萬(wàn)人。在使用本系統(tǒng)之前,該APP主要依靠用戶舉報(bào)、人工審核的機(jī)制來(lái)識(shí)別低俗、垃圾信息,很多不當(dāng)言論因?yàn)闆](méi)有被舉報(bào)所以并未發(fā)現(xiàn)和處理,同時(shí)因?yàn)槿斯徍瞬患皶r(shí),對(duì)APP的用戶口碑產(chǎn)生惡劣影響,也增加了APP運(yùn)營(yíng)商的運(yùn)營(yíng)成本。本系統(tǒng)首先從該APP的原始數(shù)據(jù)中提取出10000條不當(dāng)言論的語(yǔ)音信息,使用100條測(cè)試數(shù)據(jù)反復(fù)進(jìn)行特征訓(xùn)練,最終生成匹配該APP的模板數(shù)據(jù)庫(kù)。用戶在使用APP的過(guò)程中,如果被系統(tǒng)識(shí)別出了低俗、垃圾語(yǔ)音信息,會(huì)立即進(jìn)行警告處理,情節(jié)嚴(yán)重的還會(huì)被禁言或者封號(hào),同時(shí)和該用戶相關(guān)的用戶也會(huì)看到處理信息,這樣用戶的舉報(bào)信息就大大減少了,降低了人工核查的工作量。如果用戶對(duì)處理有爭(zhēng)議,還可以人工進(jìn)行二次核驗(yàn)。通過(guò)對(duì)比發(fā)現(xiàn),使用本系統(tǒng)前,該平臺(tái)每天收到的舉報(bào)信息約為2000條;使用本系統(tǒng)后,每天收到的舉報(bào)信息約為30條,二次核驗(yàn)信息約為20條。由此可見(jiàn),應(yīng)用本系統(tǒng)對(duì)于社交平臺(tái)的環(huán)境凈化起到了很大的作用。
5結(jié)束語(yǔ)
社交平臺(tái)是隨著互聯(lián)網(wǎng)技術(shù)的進(jìn)步而產(chǎn)生的,平臺(tái)上的信息對(duì)用戶社會(huì)生活的影響也在不斷增強(qiáng)。但是社交平臺(tái)上信息的即時(shí)性和共享性、信息傳播網(wǎng)絡(luò)的動(dòng)態(tài)性,以及審核機(jī)制的不完善、審核人缺失的特點(diǎn),使社交平臺(tái)網(wǎng)絡(luò)信息環(huán)境存在著天然的缺陷,需要人為進(jìn)行凈化,或采取其他更為有效的信息篩選處理措施。在機(jī)器學(xué)習(xí)和人工智能技術(shù)水平不斷提高的背景下,其在社交平臺(tái)環(huán)境凈化中的應(yīng)用也是必然的。在人工智能技術(shù)的應(yīng)用中,還必須要各個(gè)社交平臺(tái)的現(xiàn)狀與平臺(tái)用戶和運(yùn)營(yíng)商的實(shí)際需求結(jié)合起來(lái),在提升工作效率的同時(shí),提升用戶的滿意度,以此來(lái)維持平臺(tái)信息環(huán)境健康有序地發(fā)展。
參考文獻(xiàn)
[1] 戴維·邦德.Facebook 網(wǎng)帖審核政策曝光[N/OL].FTChinese, http://www.ftchinese.com/story/001072698?archive,2017-05-23.
[2] 侯一民,周慧瓊,王政一.深度學(xué)習(xí)在語(yǔ)音識(shí)別中的研究進(jìn)展綜述[J].計(jì)算機(jī)應(yīng)用研究,2017,34(8):2241-2246.