□歐陽林子
傳統(tǒng)的廣播電視行業(yè)受到網(wǎng)絡(luò)行業(yè)的不斷沖擊,在這一背景下,要想持續(xù)提升廣播電視的影響力,就要取長補短,加強技術(shù)發(fā)展。數(shù)字音頻技術(shù)無疑是其中內(nèi)容之一。數(shù)字化音頻技術(shù)具有低成本、高效率和高質(zhì)量等特點,尤其是在遠(yuǎn)距離傳輸中效果明顯,為音頻領(lǐng)域帶來質(zhì)的飛躍。相比于模擬音頻技術(shù),數(shù)字音頻技術(shù)的數(shù)字解析力更高,信噪比更高,頻率響應(yīng)更平衡、延伸更好,同時數(shù)字錄音方便編輯,且軟件編輯不會像硬件編輯那樣每一級設(shè)備都會有音質(zhì)損耗。將其應(yīng)用在廣播電視工程之中,勢必能夠更進一步推動廣播電視工程發(fā)展。
分析“數(shù)字音頻技術(shù)”,不得不提到以前的“模擬音頻技術(shù)”?!澳M音頻技術(shù)”以晶體管和集成電路為主要形式,是用原始波形振幅的相似形來代替聲音,這里面涉及“相似”的概念。也正因為如此,在多代復(fù)制拷貝中,模擬音頻也就體現(xiàn)出劣勢,運用“相似”的次數(shù)越多,每一次復(fù)制拷貝都會不可避免地丟失一些東西,或者說每一次復(fù)制拷貝的內(nèi)容都與原內(nèi)容有一定的偏離,最后導(dǎo)致出現(xiàn)音質(zhì)問題。在此前提下,伴隨著數(shù)字技術(shù)的不斷發(fā)展,“數(shù)字音頻技術(shù)”進入人們視野。
數(shù)字音頻技術(shù)脈沖編碼調(diào)制的過程,本質(zhì)上就是“采樣—量化—編碼”的過程。
首先,對聲音的振幅進行量化采樣,對于一個原始音頻,信號先通過一個低通濾波器,切除低于20kHz 以上的所有頻率,剩下的信號通過一個模擬轉(zhuǎn)數(shù)字(A/D)的轉(zhuǎn)換器,再通過特定的采樣速率去測量音頻電平,計算機每隔幾微秒就會抓拍一次信號,比如一個48kHz的采樣率,每秒鐘就有4.8 萬個采樣,也就是說每秒鐘測量4.8萬次。
其次,計算機再將這些抓拍的信號轉(zhuǎn)化為一串串?dāng)?shù)字,用來定義聲音的振幅的變化,然后使用平滑濾波恢復(fù)成波形的形狀。
最后,通過二進制的方式,將所有數(shù)值存儲起來,代替了波形,同時又準(zhǔn)確反映波形的特點,和波形有關(guān)聯(lián)性關(guān)系。根據(jù)耐奎斯特定理:采樣頻率比信號頻率的兩倍還高時,信號是可以完全還原的。因此在實際中,采樣最常見的為信號最好頻率的2.56~4倍。三點合一,就是“模數(shù)轉(zhuǎn)換”。
“模數(shù)轉(zhuǎn)換”出現(xiàn)后,隨之出現(xiàn)了采樣率、采樣位數(shù)、聲道、比特率等多點概念。采樣率即每秒內(nèi)進行采樣的次數(shù),采樣率越高,采樣的內(nèi)容就越多,后續(xù)量化和編碼的內(nèi)容就越多,聲音還原就越真實。如果用一個波形坐標(biāo)系來代表聲音,橫坐標(biāo)就是時間,縱坐標(biāo)就是聲音相位值,采用率就是在橫坐標(biāo)方向上可采取的若干點,采樣率越高,采樣的點也就越多,自然也就越精準(zhǔn)。采樣位數(shù)也被稱為采樣精度,含義是用多少個點來描述聲音信號的強度,采樣位數(shù)越高,對于采樣的精度就越精細(xì)。聲道則是不同空間位置采集或回放的相對獨立的音頻信號。比特是二進制數(shù)中的位,是最小計量單位,比特率則指的是每秒傳送或處理的比特的數(shù)量,可簡單理解為數(shù)字帶寬或數(shù)字編譯率。
數(shù)字音頻應(yīng)用的過程,是一個“模數(shù)”轉(zhuǎn)化的過程,音頻的采集和播放這兩端其實都是模擬的,采集端是(AD)模數(shù)轉(zhuǎn)換,一方面要保證模擬音頻本身信號的質(zhì)量,這樣轉(zhuǎn)換成的數(shù)字信號才有源的保證,另一方面,AD 轉(zhuǎn)換器也要求量化噪聲越小越好,因為在AD 轉(zhuǎn)換時是會引入量化噪聲的,這個與AD 轉(zhuǎn)換有關(guān),也與量化bit數(shù)有關(guān)。在播放端口是DA數(shù)模轉(zhuǎn)換的過程,也就是AD轉(zhuǎn)換的逆向過程,數(shù)字的音頻轉(zhuǎn)成模擬時要求盡量保真還原。
結(jié)合上文提到的,模擬音頻技術(shù)每次復(fù)制拷貝的過程,復(fù)制拷貝的內(nèi)容都與原內(nèi)容有一定的偏離,相似度越來越差。而數(shù)字音頻技術(shù)的應(yīng)用,則可實現(xiàn)高清晰度、高還原度。理論上,在技術(shù)支持下,采樣頻率越高,采樣內(nèi)容就會越豐富、越精準(zhǔn)。同時,采樣數(shù)據(jù)位深越大,采樣的精度就越精細(xì),也就具有了更高的保真度。但是在實際應(yīng)用中對設(shè)備有一定的要求。設(shè)備的數(shù)字功能足夠強大,模擬效果才更好,能支持?jǐn)?shù)字音頻技術(shù)全部功能的模擬調(diào)音臺是非常復(fù)雜、非常精細(xì)的。此外,數(shù)字信號越精準(zhǔn),所需要的網(wǎng)絡(luò)與帶寬、信號傳輸時的數(shù)據(jù)包也將更大,未來將借助5G 通信技術(shù),強化大數(shù)據(jù)包的打包與解析。
數(shù)字音頻是相對于模擬音頻而言,把模擬音頻離散化(數(shù)字化)。數(shù)字化音頻記錄方式,常用的有1bit和多bit記錄,而多bit數(shù)字音頻又可以按有損,比如mp3,或者無損,比如wave或flac進一步編碼。數(shù)字音頻技術(shù)的多軌錄音軟件技術(shù)功能強大,能夠?qū)⑷寺?、樂器聲等進行分別采集,編輯為一個完整的節(jié)目。如果后續(xù)廣播電視節(jié)目有任何問題,也可快速進行聲音采集補救錄制;需要增錄聲音的時候,也可以增錄這一個軌道的聲音,并將其加入原本節(jié)目即可。
由此可見,多軌錄音技術(shù),讓廣播電視節(jié)目的制作更加靈活。模擬音頻技術(shù)難以進行二次制作,需要倒帶、快進尋找二次制作點,編輯過程是順序的、線性的,而數(shù)字音頻技術(shù)的應(yīng)用,可以根據(jù)數(shù)字音頻的編譯規(guī)則,進行瞬時定位,找準(zhǔn)二次制作點進行快速制作。
人們所采集的音頻信號是比較冗雜的,雖然能夠隨時隨地獲得需要的音頻信息,但是獲得的音頻信號冗余較多,也會影響到音頻信號的清晰度和還原度。對此,如何有效去除音頻信號中冗雜的部分,是一個重大問題。模擬音頻技術(shù)是難以處理的,而數(shù)字音頻技術(shù)則具備一定的去除冗余內(nèi)容的手段。原理是圖像相鄰像素、音頻相鄰振幅之間是有規(guī)則的、有關(guān)聯(lián)的,通過數(shù)字建模的方式去了解這種關(guān)聯(lián)性,也就對視頻、音頻內(nèi)容具有了更高的解析能力,根據(jù)關(guān)聯(lián)性特征,可以將冗余內(nèi)容有目的性地去除,從而大大提升音頻的質(zhì)量。反映在數(shù)字音頻技術(shù)上,即表現(xiàn)為數(shù)字解析力更高,信噪比更高,頻率響應(yīng)更平衡延伸更好。
音頻內(nèi)容的數(shù)據(jù)量非常龐大,而模擬音頻技術(shù)的數(shù)據(jù)傳輸空間能力與編譯能力是不足的,其要存儲在磁帶或黑膠唱片等模擬介質(zhì),介質(zhì)不易保管,同時其編譯的速度更慢,所能存儲的空間也有限。而數(shù)據(jù)量大必然是未來音頻內(nèi)容進行編譯、存儲、傳播的特點,也就是說,要想獲得足夠的數(shù)據(jù)存儲空間能力,要想提升數(shù)據(jù)編譯能力,還是要將目光放在數(shù)字音頻技術(shù)上,數(shù)字音頻技術(shù)的數(shù)字信號經(jīng)過壓縮后,存儲能力顯著提升。
身處于商業(yè)化高度發(fā)展的今天,資產(chǎn)保護成為人們又一個熱議的話題,對于廣播電視工程來說,一些音頻內(nèi)容是商業(yè)資產(chǎn),可能需要收費才能獲取,一些音頻內(nèi)容僅供對應(yīng)專業(yè)應(yīng)用或有條件接收。在數(shù)字資產(chǎn)保護領(lǐng)域,數(shù)字音頻技術(shù)有著突出作用,將數(shù)字技術(shù)和密碼技術(shù)相結(jié)合,能夠很好地進行數(shù)字信息的加密、解密以及加擾、解擾等,也就能更好地對數(shù)字資產(chǎn)進行保護。
從廣播電視工程發(fā)展來說,數(shù)字音頻技術(shù)具有較強的可拓展性,數(shù)字音頻技術(shù)可以很好地和其他數(shù)字設(shè)備相結(jié)合,在各類通信信道和網(wǎng)絡(luò)上進行傳輸,方便人們?nèi)粘J褂?。較強的可拓展性,在廣播電視工程上也就意味著更廣的傳播范疇,數(shù)字音頻內(nèi)容可以在很多渠道流通與展示,以獲得更多受眾,增強用戶黏性。
數(shù)字音頻技術(shù)的應(yīng)用,尤其是在5G 通信技術(shù)的加持下,在“輸入”端,音頻內(nèi)容制作更優(yōu)秀、更加方便快捷,可發(fā)展高清晰度音質(zhì)內(nèi)容。在軟件技術(shù)加持下,隨時錄制、隨時播放的“直播”形式將是未來發(fā)展方向,這也是傳統(tǒng)的廣播電視較難攻克的難題。
伴隨著數(shù)字音頻技術(shù)的持續(xù)發(fā)展,音頻內(nèi)容的實時獲取與傳輸能力會更強大,直播這一模塊需進行調(diào)整、優(yōu)化。在“存儲”和“傳輸”端,5G 通信技術(shù)的加持下,數(shù)字音頻內(nèi)容具有更強的存儲能力和傳輸速度,這本就是廣播電視工程領(lǐng)域的核心業(yè)務(wù),將變得更加突出,也將成為行業(yè)競爭優(yōu)勢所在。在“輸出”端,數(shù)字音頻廣播立足于人耳的聽覺特征和個性需求,發(fā)揮智能技術(shù),根據(jù)人耳特點智能調(diào)控播音模式。是數(shù)字音頻廣播更加人性化的體現(xiàn)。例如,數(shù)字音頻技術(shù)的發(fā)展,讓遠(yuǎn)程會議的音頻內(nèi)容更加清晰,且實現(xiàn)實時傳輸,讓遠(yuǎn)程會議更高效。再如,在音樂領(lǐng)域,音樂經(jīng)歷了從模擬到數(shù)字音樂的轉(zhuǎn)變,未來數(shù)字音樂還將發(fā)揮更大的作用,讓用戶在家中就能感受演唱會現(xiàn)場的美妙音質(zhì)。
在數(shù)字化時代,廣播電視提出“廣播+”概念,指出“聚合—分化—聚合”的過程:第一個“聚合”,指內(nèi)容的采集是數(shù)字化采集,并儲存在共用數(shù)據(jù)庫中;“分化”,指各種媒體從數(shù)據(jù)庫中取用素材,加工并發(fā)布到用戶習(xí)慣接受的平臺;第二個“聚合”,指媒體通過分化發(fā)布聚合用戶,通過多方式和多層次的傳播形態(tài),來滿足受眾的不同需求,這就是數(shù)字音頻技術(shù)在廣播電視工程中的應(yīng)用途徑。
在廣播電視工程中,通常使用數(shù)字調(diào)音臺來支持?jǐn)?shù)字音頻信號的采集和編譯,它的功能強大,能應(yīng)對復(fù)雜的活動現(xiàn)場,具備放大、處理、合并、調(diào)節(jié)與控制等多方面功能,將通道輸入的信號分配到該去的地方,數(shù)字解析力更高,信噪比更高,頻率響應(yīng)更平衡,延伸更好。另外,數(shù)字調(diào)音臺在節(jié)目處理方面也有很多實用應(yīng)用,數(shù)字調(diào)音臺具有數(shù)據(jù)庫功能,在均衡、壓限、機內(nèi)效果等音頻處理環(huán)節(jié)有不少現(xiàn)存的經(jīng)過標(biāo)準(zhǔn)處理模式處理過的可供調(diào)用的數(shù)字音頻;也可對數(shù)字音頻進行靈活處理??梢哉f在廣播數(shù)字調(diào)音臺中集成數(shù)字音頻技術(shù),應(yīng)用功能強大。
電視廣播工程中數(shù)字音頻技術(shù)的應(yīng)用,還在于系統(tǒng)中的音頻嵌入和解嵌技術(shù)。系統(tǒng)中的音頻嵌入和解嵌技術(shù),指的是對某一個特定區(qū)域的音頻進行嵌入,能在錄制與制作過程中對音頻進行控制與監(jiān)督,使得數(shù)字音頻的內(nèi)容符合設(shè)計,質(zhì)量有所保障。
數(shù)字音頻技術(shù)中的云存儲功能,可以在云端進行存儲。由于數(shù)字內(nèi)容的信號量容量較大,連帶著對連接、帶寬等都有較高要求。在數(shù)字音頻技術(shù)的輔助下,加之5G 技術(shù)的加持,可以實現(xiàn)大帶寬、高速率地傳輸信號。基于此,收聽廣播節(jié)目就可以實現(xiàn)跨地域、跨平臺、跨終端。在其強大的基礎(chǔ)資源、數(shù)據(jù)資源和豐富的媒體功能組件支撐下,為媒體用戶在資源利用率、業(yè)務(wù)功能呈現(xiàn)、快速生成發(fā)布等方面提供最為強大的業(yè)務(wù)支持。具體處理時,先接收數(shù)字音頻內(nèi)容,之后對數(shù)字內(nèi)容進行解譯并使用,解譯的方式正好和編譯的方式相反,通過一個數(shù)字轉(zhuǎn)模擬(D/A)轉(zhuǎn)化器將數(shù)字信號轉(zhuǎn)換成由電壓級差組成的模擬信號,再由反折疊濾波器,比如低通濾波器、平滑濾波器、重建濾波器等,把模擬信號內(nèi)的極差加以平滑,還原成初始的模擬信號。
數(shù)字音頻技術(shù)的未來有三大發(fā)展趨勢。
一是物理建模。對一個樂器的物理發(fā)聲原理通過一個復(fù)雜系統(tǒng)的數(shù)學(xué)模型來進行建模,物理建模的特點在于它參數(shù)的可調(diào)性或者說聲音的可塑性,比如對樂器演奏而言,建模使得其能根據(jù)不同樂器的特點去模擬不同參數(shù),讓聲音還原度和清晰度更上一層樓。
二是3D 音頻渲染技術(shù)。3D 音頻渲染技術(shù)將具有逼真的空間感,3D立體聲效果的逼真程度極高,并且不同的音頻對象可以呈現(xiàn)準(zhǔn)確的聲學(xué)特征,能夠有效提升音質(zhì)。
三是更深入的聲源分離技術(shù)。結(jié)合上文提到的“分軌錄音技術(shù)”來看,分軌錄音技術(shù)還是存在一定雜質(zhì),對音質(zhì)造成負(fù)面影響,相信未來的聲源分離技術(shù)會更加成熟,優(yōu)化算法,提升分軌錄音的音質(zhì)。
綜上所述,數(shù)字音頻技術(shù)的迅速發(fā)展對廣播電視工程有非常大的價值,其具有高清晰度、高還原度、編輯制作更加簡單、去除大量冗余、數(shù)據(jù)量大、編譯速度快、能夠更好地保護數(shù)字資產(chǎn)、具有較強的可拓展性、數(shù)字音頻廣播系統(tǒng)更加人性化等多方面特點,在廣播電視工程應(yīng)用中有著極大優(yōu)勢。廣播電視工程可以充分利用數(shù)字音頻技術(shù)去改善當(dāng)下經(jīng)營困局,促進廣播電視工程進一步發(fā)展。