賈玉升,崔 雨
(北京廣播電視臺(tái),北京 100000)
北京廣播電視臺(tái)冬奧紀(jì)實(shí)4K超高清頻道2020年12月30日正式開(kāi)播,這是我國(guó)首個(gè)上星播出的省級(jí)4K超高清頻道,也是國(guó)內(nèi)惟一的標(biāo)清、高清和超高清同播頻道[1]。4K超高清已成為未來(lái)視頻發(fā)展的必然趨勢(shì)。相較于高清頻道,4K超高清頻道的圖像清晰度更加細(xì)膩,色彩亮度的表現(xiàn)更加豐富,可達(dá)到電影水平,4K聲音效果也與影院相當(dāng),三維聲的音響效果甚至可以超過(guò)影院,觀眾可以在家體驗(yàn)到影院的視聽(tīng)感受[2]。
北京電視臺(tái)嚴(yán)格執(zhí)行國(guó)家廣播電視總局的相關(guān)安全播出要求,同時(shí)利用人工智能技術(shù)針對(duì)目前的監(jiān)錄監(jiān)播系統(tǒng)進(jìn)行升級(jí)改造。實(shí)現(xiàn)針對(duì)北京電視臺(tái)4K超高清頻道、1080P高清頻道、標(biāo)清頻道的實(shí)時(shí)錄制、監(jiān)測(cè)、智能報(bào)警功能,確保安全播出工作無(wú)漏洞、無(wú)死角、無(wú)隱患。
北京電視臺(tái)所有頻道采用TS封裝,其中4K超高清頻道(3840*2160 50fps)視頻編碼采用AVS2、H265,音頻編碼采用Dolby AC3;1080P高清頻道(1920*1080 25fps)視頻編碼采用AVS+、H264、MPEG-2、音頻編碼采用Dolby AC3;標(biāo)清頻道(720*57625fps)視頻編碼采用AVS+、H264、MPEG-2,音頻編碼采用MP2;廣播節(jié)目音頻編碼為MP2。智能監(jiān)播監(jiān)錄系統(tǒng)建設(shè)需要具備以下能力:智能收錄、智能解碼、智能編碼、智能報(bào)警、智能存儲(chǔ)等能力。
系統(tǒng)運(yùn)用面向服務(wù)架構(gòu)設(shè)計(jì)方法、“模塊化”設(shè)計(jì)理念,使系統(tǒng)應(yīng)用構(gòu)建在模塊化的基礎(chǔ)平臺(tái)之上,從而實(shí)現(xiàn)易于擴(kuò)展、可重用、標(biāo)準(zhǔn)化、可分布部署的應(yīng)用系統(tǒng)。整個(gè)系統(tǒng)可分為四層結(jié)構(gòu):采集接入層、數(shù)據(jù)處理層、業(yè)務(wù)匯聚層和應(yīng)用展示層。
系統(tǒng)應(yīng)采用全I(xiàn)P化設(shè)計(jì),位于信號(hào)接入層的各類監(jiān)測(cè)板卡將音視頻信號(hào)數(shù)據(jù)IP化之后送入監(jiān)測(cè)分析層的數(shù)據(jù)分析模塊、轉(zhuǎn)碼處理單元和收錄單元。
系統(tǒng)建設(shè)聚焦基本監(jiān)播監(jiān)錄功能實(shí)現(xiàn),重點(diǎn)部署信號(hào)采集、轉(zhuǎn)碼收錄、多畫(huà)面監(jiān)看、監(jiān)錄管理等軟硬件設(shè)備。其余功能模塊通過(guò)預(yù)留接口為未來(lái)功能拓展、升級(jí)完善做好技術(shù)準(zhǔn)備。
圖1 系統(tǒng)業(yè)務(wù)邏輯架構(gòu)圖
采集接入層完成信號(hào)的采集、分析、監(jiān)測(cè)、TS over IP轉(zhuǎn)發(fā),將分析數(shù)據(jù)和節(jié)目數(shù)據(jù)通過(guò)統(tǒng)一網(wǎng)絡(luò)協(xié)議接口送至后級(jí)設(shè)備。
信號(hào)采集監(jiān)測(cè)模塊采用無(wú)中心嵌入式設(shè)計(jì),采集模塊除支持ASI、SDI信號(hào)格式外,兼容IP/IPTV/HLS/RTMP、模擬音頻、AES/EBU、模擬RF等信號(hào)格式,對(duì)信號(hào)進(jìn)行實(shí)時(shí)監(jiān)測(cè),實(shí)時(shí)傳送監(jiān)測(cè)結(jié)果到數(shù)據(jù)庫(kù)服務(wù)器記錄并在大屏頁(yè)面上顯示。
數(shù)據(jù)處理層由數(shù)據(jù)分析、錄制控制和轉(zhuǎn)碼處理三部分組成。
數(shù)據(jù)分析針對(duì)采集層傳送過(guò)來(lái)的數(shù)據(jù)進(jìn)行分析,結(jié)合應(yīng)用層預(yù)設(shè)的參數(shù),實(shí)時(shí)對(duì)碼流中的各種表格作出解析,判斷碼流是否符合傳輸標(biāo)準(zhǔn),并將結(jié)果報(bào)給業(yè)務(wù)匯聚層以便于應(yīng)用層使用。數(shù)據(jù)分析是整個(gè)系統(tǒng)的核心部分,對(duì)播出信號(hào)的碼流層的監(jiān)測(cè)處理,以及對(duì)監(jiān)測(cè)內(nèi)容的故障信息報(bào)警,都集中在該模塊完成。系統(tǒng)具備圖形報(bào)警、語(yǔ)音報(bào)警、文字報(bào)警等多種直觀報(bào)警手段,同時(shí)具備遠(yuǎn)程報(bào)警功能,可以向相關(guān)部門和領(lǐng)導(dǎo)進(jìn)行報(bào)警,如電話和短信等形式。
轉(zhuǎn)碼處理是針對(duì)采集層傳送的視音頻數(shù)據(jù)進(jìn)行,對(duì)高清,超高清節(jié)目碼流進(jìn)行壓縮,在保障音視頻質(zhì)量的基礎(chǔ)上降低碼率。以便壓縮后的播后節(jié)目流媒體能夠在應(yīng)用層的交互界面上流暢回放。轉(zhuǎn)碼模塊為軟硬結(jié)合方式,服務(wù)器負(fù)責(zé)解碼,轉(zhuǎn)碼卡負(fù)責(zé)再編碼打包封裝。轉(zhuǎn)碼模塊支持GPU加速引擎技術(shù)、支持優(yōu)化視頻編碼算法、支持視頻增強(qiáng)技術(shù),支持H.265編碼格式,實(shí)現(xiàn)高密度、高質(zhì)量視頻編轉(zhuǎn)碼。轉(zhuǎn)碼模塊支持H.264、H.265等視頻編碼算法,音頻支持杜比5.1/7.1聲道自動(dòng)混音頻輸入;轉(zhuǎn)碼模塊支持多封裝協(xié)議輸出技術(shù),滿足多種輸出要求。
錄制控制是整個(gè)系統(tǒng)數(shù)據(jù)的樞紐,主要由網(wǎng)絡(luò)設(shè)備與存儲(chǔ)設(shè)備構(gòu)成。網(wǎng)絡(luò)設(shè)備主要用于實(shí)現(xiàn)網(wǎng)絡(luò)交換過(guò)程中高數(shù)據(jù)量、高效率的數(shù)據(jù)包轉(zhuǎn)發(fā);存儲(chǔ)設(shè)備主要用于實(shí)現(xiàn)系統(tǒng)各類數(shù)據(jù)的存儲(chǔ),是系統(tǒng)各類應(yīng)用的內(nèi)容提供中心。
業(yè)務(wù)匯聚層是整個(gè)系統(tǒng)應(yīng)用的支撐基礎(chǔ),匯聚了所有操作日志以及全部任務(wù)的調(diào)度。系統(tǒng)提供全程收錄、故障收錄、任務(wù)調(diào)度、轉(zhuǎn)碼、多畫(huà)面監(jiān)測(cè)、系統(tǒng)檢測(cè)、流媒體點(diǎn)播、統(tǒng)一認(rèn)證、消息服務(wù)、策略管理、網(wǎng)絡(luò)管理、任務(wù)注冊(cè)、任務(wù)編排等公共Web管理;數(shù)據(jù)采集、分析、匯總、事件統(tǒng)計(jì)、各類方式展現(xiàn)等應(yīng)用管理;從系統(tǒng)底層更加科學(xué)地解決管理上可能遇到的繁雜問(wèn)題,通過(guò)后臺(tái)服務(wù)器支撐平臺(tái)向應(yīng)用前端提供快速數(shù)據(jù)反應(yīng)。
應(yīng)用表示層是所有可操作以及系統(tǒng)可視內(nèi)容的集合。其中Web配置管理提供給不同用戶進(jìn)行前臺(tái)業(yè)務(wù)操作的應(yīng)用組合,主要由業(yè)務(wù)配置、信源管理、多畫(huà)面管理、轉(zhuǎn)碼管理、收錄管理、報(bào)警管理、設(shè)備管理、數(shù)據(jù)報(bào)表組成。大屏監(jiān)看則包含多畫(huà)面監(jiān)看、節(jié)目相關(guān)性分析、內(nèi)容層分析、聲光報(bào)警。
AI給未來(lái)的生活帶來(lái)了無(wú)限的想象,人工智能語(yǔ)音技術(shù)被得到了廣泛的應(yīng)用,本系統(tǒng)創(chuàng)新性的將語(yǔ)音控制與監(jiān)播監(jiān)錄系統(tǒng)相融合,用戶可以通過(guò)語(yǔ)音指令的方式打開(kāi)系統(tǒng)各個(gè)模塊并進(jìn)行操作,例如“打開(kāi)報(bào)警界面”“導(dǎo)出報(bào)警日志”等。通過(guò)語(yǔ)音指令可以使用戶遠(yuǎn)離鼠標(biāo)鍵盤的控制,通過(guò)最直接的方式發(fā)出指令,不再需要更為復(fù)雜的操作。
圖2 智能語(yǔ)音控制系統(tǒng)流程圖
通過(guò)智能語(yǔ)音識(shí)別引擎準(zhǔn)確識(shí)別指定頻道中的語(yǔ)音數(shù)據(jù),并翻譯為文字保存形成文稿庫(kù)。當(dāng)設(shè)定關(guān)鍵字以后,系統(tǒng)根據(jù)所設(shè)置的關(guān)鍵庫(kù)在文稿庫(kù)中進(jìn)行搜索,搜索完成后通過(guò)語(yǔ)義分析,將含有關(guān)鍵字的部分句段從文稿庫(kù)中摘出,并和視音頻文件做時(shí)間同步,然后自動(dòng)剪切出正確的碎片化節(jié)目段落。
在傳統(tǒng)語(yǔ)音合成技術(shù)中,合成的語(yǔ)音大多比較生硬和突兀,很難做到自然流暢,本系統(tǒng)依托領(lǐng)先的語(yǔ)音技術(shù)和深度學(xué)習(xí)算法,為北京電視臺(tái)提供全面優(yōu)質(zhì)的文字轉(zhuǎn)語(yǔ)音服務(wù)。支持中英雙語(yǔ),合成語(yǔ)音自然流暢,近乎真人發(fā)聲。當(dāng)智能監(jiān)播監(jiān)錄系統(tǒng)發(fā)生異常信息時(shí),可通過(guò)語(yǔ)音合成進(jìn)行報(bào)警,讓?xiě)?yīng)用準(zhǔn)確地開(kāi)口說(shuō)話。
4K超高清頻道智能監(jiān)播監(jiān)錄系統(tǒng)引入智能化工具,提升異態(tài)信號(hào)識(shí)別精度,建立統(tǒng)一的安全播出質(zhì)量監(jiān)測(cè)展示和故障報(bào)警技術(shù)質(zhì)量監(jiān)播等綜合服務(wù)管理應(yīng)用平臺(tái),利用節(jié)目監(jiān)錄數(shù)據(jù)為全臺(tái)提供高清內(nèi)容的應(yīng)用和服務(wù),在保證安全播出的同時(shí)、實(shí)現(xiàn)播后節(jié)目數(shù)據(jù)的有效利用。