孟寶燦
(作者單位:國家新聞出版廣電總局五五三臺)
?
語音自動評估系統(tǒng)在廣播遙控監(jiān)測中的應(yīng)用
孟寶燦
(作者單位:國家新聞出版廣電總局五五三臺)
摘 要:隨著我國廣播電視監(jiān)測事業(yè)的發(fā)展。監(jiān)測手段由傳統(tǒng)依靠人工手動監(jiān)測逐漸發(fā)展到自動化、網(wǎng)絡(luò)化的監(jiān)測模式。監(jiān)測業(yè)務(wù)向深度和廣度發(fā)展的同時,對廣播效果評估自動化的需求日益增加,本文重點探討語音自動評估技術(shù)在廣播遙控監(jiān)測中的應(yīng)用。
關(guān)鍵詞:遙控監(jiān)測;語音比對;自動評估
隨著音頻識別、圖像處理技術(shù)的發(fā)展,很多新技術(shù)都達(dá)到了在相應(yīng)條件下的應(yīng)用水平,如何適應(yīng)新時期遙控監(jiān)測站廣播效果評估的新要求和新業(yè)務(wù)模式,充分應(yīng)用計算機(jī)對于海量節(jié)目內(nèi)容自動處理,將眾多語音比對先進(jìn)技術(shù)與廣播效果評估監(jiān)測相結(jié)合,實現(xiàn)遙控站廣播效果評估的自動化、智能化和標(biāo)準(zhǔn)化,是廣播監(jiān)測業(yè)務(wù)向深度和廣度發(fā)展所面臨的緊迫問題。
遙控監(jiān)測站廣播效果語音自動評估系統(tǒng)主要由以下3部分組成:數(shù)據(jù)采集單元、數(shù)據(jù)庫和數(shù)據(jù)存儲單元、引擎計算節(jié)點和客戶端顯示單元。
系統(tǒng)工作流程如下:根據(jù)監(jiān)測運行圖及人工設(shè)置好的評分流程,按照V8接口標(biāo)準(zhǔn)遠(yuǎn)程控制遙控站設(shè)備,獲取遙控站回傳的流媒體音頻信號。
遙控監(jiān)測站廣播效果語音自動評估系統(tǒng)主要包括以下4個功能模塊。
2.1 自動打分引擎
自動打分引擎基本組成部分包括任務(wù)調(diào)度器、計算節(jié)點和任務(wù)監(jiān)視器。其中,計算節(jié)點承擔(dān)了主要的音頻數(shù)據(jù)計算處理任務(wù)。具體的比對流程如下:1)檢查目標(biāo)音頻信號是否存在,是否滿足比對引擎要求(≥3秒),若不滿足則直接上報給人工處理,滿足條件則進(jìn)入下一步;2)對目標(biāo)音頻信號進(jìn)行分類,判斷為音樂、語音、白噪聲或靜音,若靜音則直接上報人工處理,若不是靜音則進(jìn)入下一步處理;3)判斷與音量是否達(dá)到門限,并判斷是否有參考信號存在,若不存在,則計算信噪比,進(jìn)行綜合質(zhì)量評估,最后得出分值及置信度并輸出,若存在,則進(jìn)入下一步;4)判斷參考源類型是否為目標(biāo)源,然后結(jié)合目標(biāo)音頻信號與參考音頻信號進(jìn)行匹配沒最后綜合質(zhì)量評估,得出分值及置信度。
2.2 音頻數(shù)據(jù)與音頻特征采集子系統(tǒng)
音頻數(shù)據(jù)與音頻特征采集子系統(tǒng)根據(jù)所采集的數(shù)據(jù)源類型分為2種:前端采集子系統(tǒng)與中心采集子系統(tǒng)。
2.2.1 前端采集子系統(tǒng)
用于遠(yuǎn)程控制遙控站接收機(jī)執(zhí)行頻點任務(wù),并采集從遙控站接收機(jī)傳回的目標(biāo)音頻數(shù)據(jù);同時,提取目標(biāo)音頻數(shù)據(jù)中有用的音頻特征數(shù)據(jù),傳送給自動打分引擎進(jìn)行計算。另外,由于系統(tǒng)必須提供廣播效果音頻回放功能,作為廣播效果人工校對的依據(jù)。因此,采集后廣播效果音頻以及音頻特征的歷史數(shù)據(jù)必須保存,在存儲介質(zhì)中存放。
前端采集子系統(tǒng)的工作流程如下:啟動前端采集系統(tǒng)后,系統(tǒng)等待到達(dá)工作的時間段;獲取當(dāng)前時段運行圖數(shù)據(jù);創(chuàng)建臨時存儲區(qū),將當(dāng)前時段運行圖中的頻點任務(wù)以隊列的形式存儲,根據(jù)人工配置文件對當(dāng)前時段運行圖中的頻點任務(wù)進(jìn)行分析;將隊列中的頻點任務(wù)進(jìn)行優(yōu)先級排序;動態(tài)規(guī)劃當(dāng)前時段頻點任務(wù)的執(zhí)行流程;開始從隊列中取出頻點任務(wù)并執(zhí)行;自動提取音頻中的音頻特征值數(shù)據(jù);數(shù)據(jù)入庫,通知打分引擎任務(wù)準(zhǔn)備完畢,等待引擎處理;判斷隊列中是否有其他任務(wù),若有則繼續(xù)執(zhí)行任務(wù),若無則結(jié)束任務(wù)。
2.2.2 中心采集子系統(tǒng)
用于采集從衛(wèi)星接收機(jī)上傳來的模擬音頻信號,并轉(zhuǎn)換為數(shù)字音頻信號,同時完成運行圖同步的工作。其工作流程如下:初始化系統(tǒng)后,啟動運行圖同步線程,判斷是否到達(dá)同步時間;初始化采集卡;多線程采集參考源信號;達(dá)到采集時間后,存儲音頻文件。
2.3 Web服務(wù)
系統(tǒng)的Web服務(wù)框架采用Struts框架、Free Marker模板技術(shù)以及Web Service相結(jié)合的方式。
通過Struts框架與FreeMarker模板的結(jié)合,很好地均衡了客戶端與服務(wù)器端的工作負(fù)載,在很大程度上提高了頁面的瀏覽速度以及用戶與服務(wù)器的交互性,增強(qiáng)了用戶的體驗;同時,采用了Web Service的相關(guān)技術(shù),由客戶端瀏覽器發(fā)起的Web Service請求,由Web Service服務(wù)器調(diào)用相關(guān)的服務(wù),由服務(wù)邏輯訪問數(shù)據(jù)庫,完成請求的處理,并返回處理結(jié)果。
2.4 評估結(jié)果自動上報數(shù)據(jù)中心子系統(tǒng)
評估結(jié)果自動上報數(shù)據(jù)中心子系統(tǒng)用于自動上報符合標(biāo)準(zhǔn)(置信度大于某一門限)的自動評估結(jié)果,不符合標(biāo)準(zhǔn)的自動評估結(jié)果留待人工校對后再進(jìn)行上報。其工作流程如下:初始化系統(tǒng)后,開始更新數(shù)據(jù)中心數(shù)據(jù)庫;首先訪問本系統(tǒng)的數(shù)據(jù)庫,獲取最新的自動評估結(jié)果,并判斷自動評估結(jié)果是否滿足標(biāo)準(zhǔn),若不符合標(biāo)準(zhǔn),則過濾該自動評估結(jié)果,并留待系統(tǒng)人工校對后再自動上報數(shù)據(jù)中心。
通過語音自動評估系統(tǒng)在廣播遙控監(jiān)測中的應(yīng)用,極大地減輕了值班人員的工作量,提高了廣播監(jiān)測智能化的水平。隨著音頻識別、圖像處理技術(shù)的繼續(xù)發(fā)展,相信在不久的將來,通過技術(shù)優(yōu)化一定能夠進(jìn)一步提高語音自動評估的準(zhǔn)確率,為廣播監(jiān)測智能化事業(yè)的發(fā)展添磚加瓦。