廣播電視工程中數(shù)字音頻技術(shù)應(yīng)用分析

2023-12-13 17:07:50歐陽林子

記者搖籃 2023年9期

□歐陽林子

傳統(tǒng)的廣播電視行業(yè)受到網(wǎng)絡(luò)行業(yè)的不斷沖擊，在這一背景下，要想持續(xù)提升廣播電視的影響力，就要取長補短，加強技術(shù)發(fā)展。數(shù)字音頻技術(shù)無疑是其中內(nèi)容之一。數(shù)字化音頻技術(shù)具有低成本、高效率和高質(zhì)量等特點，尤其是在遠(yuǎn)距離傳輸中效果明顯，為音頻領(lǐng)域帶來質(zhì)的飛躍。相比于模擬音頻技術(shù)，數(shù)字音頻技術(shù)的數(shù)字解析力更高，信噪比更高，頻率響應(yīng)更平衡、延伸更好，同時數(shù)字錄音方便編輯，且軟件編輯不會像硬件編輯那樣每一級設(shè)備都會有音質(zhì)損耗。將其應(yīng)用在廣播電視工程之中，勢必能夠更進一步推動廣播電視工程發(fā)展。

一、數(shù)字音頻技術(shù)綜述

1.模擬音頻技術(shù)背景

分析“數(shù)字音頻技術(shù)”，不得不提到以前的“模擬音頻技術(shù)”?！澳M音頻技術(shù)”以晶體管和集成電路為主要形式，是用原始波形振幅的相似形來代替聲音，這里面涉及“相似”的概念。也正因為如此，在多代復(fù)制拷貝中，模擬音頻也就體現(xiàn)出劣勢，運用“相似”的次數(shù)越多，每一次復(fù)制拷貝都會不可避免地丟失一些東西，或者說每一次復(fù)制拷貝的內(nèi)容都與原內(nèi)容有一定的偏離，最后導(dǎo)致出現(xiàn)音質(zhì)問題。在此前提下，伴隨著數(shù)字技術(shù)的不斷發(fā)展，“數(shù)字音頻技術(shù)”進入人們視野。

2.數(shù)字音頻技術(shù)

數(shù)字音頻技術(shù)脈沖編碼調(diào)制的過程，本質(zhì)上就是“采樣—量化—編碼”的過程。

首先，對聲音的振幅進行量化采樣，對于一個原始音頻，信號先通過一個低通濾波器，切除低于20kHz 以上的所有頻率，剩下的信號通過一個模擬轉(zhuǎn)數(shù)字（A/D）的轉(zhuǎn)換器，再通過特定的采樣速率去測量音頻電平，計算機每隔幾微秒就會抓拍一次信號，比如一個48kHz的采樣率，每秒鐘就有4.8 萬個采樣，也就是說每秒鐘測量4.8萬次。

其次，計算機再將這些抓拍的信號轉(zhuǎn)化為一串串?dāng)?shù)字，用來定義聲音的振幅的變化，然后使用平滑濾波恢復(fù)成波形的形狀。

最后，通過二進制的方式，將所有數(shù)值存儲起來，代替了波形，同時又準(zhǔn)確反映波形的特點，和波形有關(guān)聯(lián)性關(guān)系。根據(jù)耐奎斯特定理：采樣頻率比信號頻率的兩倍還高時，信號是可以完全還原的。因此在實際中，采樣最常見的為信號最好頻率的2.56～4倍。三點合一，就是“模數(shù)轉(zhuǎn)換”。

“模數(shù)轉(zhuǎn)換”出現(xiàn)后，隨之出現(xiàn)了采樣率、采樣位數(shù)、聲道、比特率等多點概念。采樣率即每秒內(nèi)進行采樣的次數(shù)，采樣率越高，采樣的內(nèi)容就越多，后續(xù)量化和編碼的內(nèi)容就越多，聲音還原就越真實。如果用一個波形坐標(biāo)系來代表聲音，橫坐標(biāo)就是時間，縱坐標(biāo)就是聲音相位值，采用率就是在橫坐標(biāo)方向上可采取的若干點，采樣率越高，采樣的點也就越多，自然也就越精準(zhǔn)。采樣位數(shù)也被稱為采樣精度，含義是用多少個點來描述聲音信號的強度，采樣位數(shù)越高，對于采樣的精度就越精細(xì)。聲道則是不同空間位置采集或回放的相對獨立的音頻信號。比特是二進制數(shù)中的位，是最小計量單位，比特率則指的是每秒傳送或處理的比特的數(shù)量，可簡單理解為數(shù)字帶寬或數(shù)字編譯率。

3.數(shù)字音頻技術(shù)“模數(shù)轉(zhuǎn)化”過程

數(shù)字音頻應(yīng)用的過程，是一個“模數(shù)”轉(zhuǎn)化的過程，音頻的采集和播放這兩端其實都是模擬的，采集端是（AD）模數(shù)轉(zhuǎn)換，一方面要保證模擬音頻本身信號的質(zhì)量，這樣轉(zhuǎn)換成的數(shù)字信號才有源的保證，另一方面，AD 轉(zhuǎn)換器也要求量化噪聲越小越好，因為在AD 轉(zhuǎn)換時是會引入量化噪聲的，這個與AD 轉(zhuǎn)換有關(guān)，也與量化bit數(shù)有關(guān)。在播放端口是DA數(shù)模轉(zhuǎn)換的過程，也就是AD轉(zhuǎn)換的逆向過程，數(shù)字的音頻轉(zhuǎn)成模擬時要求盡量保真還原。

二、數(shù)字音頻技術(shù)的優(yōu)勢

1.高清晰度、高還原度

結(jié)合上文提到的，模擬音頻技術(shù)每次復(fù)制拷貝的過程，復(fù)制拷貝的內(nèi)容都與原內(nèi)容有一定的偏離，相似度越來越差。而數(shù)字音頻技術(shù)的應(yīng)用，則可實現(xiàn)高清晰度、高還原度。理論上，在技術(shù)支持下，采樣頻率越高，采樣內(nèi)容就會越豐富、越精準(zhǔn)。同時，采樣數(shù)據(jù)位深越大，采樣的精度就越精細(xì)，也就具有了更高的保真度。但是在實際應(yīng)用中對設(shè)備有一定的要求。設(shè)備的數(shù)字功能足夠強大，模擬效果才更好，能支持?jǐn)?shù)字音頻技術(shù)全部功能的模擬調(diào)音臺是非常復(fù)雜、非常精細(xì)的。此外，數(shù)字信號越精準(zhǔn)，所需要的網(wǎng)絡(luò)與帶寬、信號傳輸時的數(shù)據(jù)包也將更大，未來將借助5G 通信技術(shù)，強化大數(shù)據(jù)包的打包與解析。

2.編輯制作更加簡單

數(shù)字音頻是相對于模擬音頻而言,把模擬音頻離散化（數(shù)字化）。數(shù)字化音頻記錄方式，常用的有1bit和多bit記錄，而多bit數(shù)字音頻又可以按有損，比如mp3，或者無損，比如wave或flac進一步編碼。數(shù)字音頻技術(shù)的多軌錄音軟件技術(shù)功能強大，能夠?qū)⑷寺?、樂器聲等進行分別采集，編輯為一個完整的節(jié)目。如果后續(xù)廣播電視節(jié)目有任何問題，也可快速進行聲音采集補救錄制；需要增錄聲音的時候，也可以增錄這一個軌道的聲音，并將其加入原本節(jié)目即可。

由此可見，多軌錄音技術(shù)，讓廣播電視節(jié)目的制作更加靈活。模擬音頻技術(shù)難以進行二次制作，需要倒帶、快進尋找二次制作點,編輯過程是順序的、線性的，而數(shù)字音頻技術(shù)的應(yīng)用，可以根據(jù)數(shù)字音頻的編譯規(guī)則，進行瞬時定位，找準(zhǔn)二次制作點進行快速制作。

3.去除大量冗余

人們所采集的音頻信號是比較冗雜的，雖然能夠隨時隨地獲得需要的音頻信息，但是獲得的音頻信號冗余較多，也會影響到音頻信號的清晰度和還原度。對此，如何有效去除音頻信號中冗雜的部分，是一個重大問題。模擬音頻技術(shù)是難以處理的，而數(shù)字音頻技術(shù)則具備一定的去除冗余內(nèi)容的手段。原理是圖像相鄰像素、音頻相鄰振幅之間是有規(guī)則的、有關(guān)聯(lián)的，通過數(shù)字建模的方式去了解這種關(guān)聯(lián)性，也就對視頻、音頻內(nèi)容具有了更高的解析能力，根據(jù)關(guān)聯(lián)性特征，可以將冗余內(nèi)容有目的性地去除，從而大大提升音頻的質(zhì)量。反映在數(shù)字音頻技術(shù)上，即表現(xiàn)為數(shù)字解析力更高，信噪比更高，頻率響應(yīng)更平衡延伸更好。

4.數(shù)據(jù)量大、編譯速度快

音頻內(nèi)容的數(shù)據(jù)量非常龐大，而模擬音頻技術(shù)的數(shù)據(jù)傳輸空間能力與編譯能力是不足的，其要存儲在磁帶或黑膠唱片等模擬介質(zhì)，介質(zhì)不易保管，同時其編譯的速度更慢，所能存儲的空間也有限。而數(shù)據(jù)量大必然是未來音頻內(nèi)容進行編譯、存儲、傳播的特點，也就是說，要想獲得足夠的數(shù)據(jù)存儲空間能力，要想提升數(shù)據(jù)編譯能力，還是要將目光放在數(shù)字音頻技術(shù)上，數(shù)字音頻技術(shù)的數(shù)字信號經(jīng)過壓縮后，存儲能力顯著提升。

5.能夠更好地保護數(shù)字資產(chǎn)

身處于商業(yè)化高度發(fā)展的今天，資產(chǎn)保護成為人們又一個熱議的話題，對于廣播電視工程來說，一些音頻內(nèi)容是商業(yè)資產(chǎn)，可能需要收費才能獲取，一些音頻內(nèi)容僅供對應(yīng)專業(yè)應(yīng)用或有條件接收。在數(shù)字資產(chǎn)保護領(lǐng)域，數(shù)字音頻技術(shù)有著突出作用，將數(shù)字技術(shù)和密碼技術(shù)相結(jié)合，能夠很好地進行數(shù)字信息的加密、解密以及加擾、解擾等，也就能更好地對數(shù)字資產(chǎn)進行保護。

6.具有較強的可拓展性

從廣播電視工程發(fā)展來說，數(shù)字音頻技術(shù)具有較強的可拓展性，數(shù)字音頻技術(shù)可以很好地和其他數(shù)字設(shè)備相結(jié)合，在各類通信信道和網(wǎng)絡(luò)上進行傳輸，方便人們?nèi)粘Ｊ褂?。較強的可拓展性，在廣播電視工程上也就意味著更廣的傳播范疇，數(shù)字音頻內(nèi)容可以在很多渠道流通與展示，以獲得更多受眾，增強用戶黏性。

7.數(shù)字音頻廣播系統(tǒng)更加人性化

數(shù)字音頻技術(shù)的應(yīng)用，尤其是在5G 通信技術(shù)的加持下，在“輸入”端，音頻內(nèi)容制作更優(yōu)秀、更加方便快捷，可發(fā)展高清晰度音質(zhì)內(nèi)容。在軟件技術(shù)加持下，隨時錄制、隨時播放的“直播”形式將是未來發(fā)展方向，這也是傳統(tǒng)的廣播電視較難攻克的難題。

伴隨著數(shù)字音頻技術(shù)的持續(xù)發(fā)展，音頻內(nèi)容的實時獲取與傳輸能力會更強大，直播這一模塊需進行調(diào)整、優(yōu)化。在“存儲”和“傳輸”端，5G 通信技術(shù)的加持下，數(shù)字音頻內(nèi)容具有更強的存儲能力和傳輸速度，這本就是廣播電視工程領(lǐng)域的核心業(yè)務(wù)，將變得更加突出，也將成為行業(yè)競爭優(yōu)勢所在。在“輸出”端，數(shù)字音頻廣播立足于人耳的聽覺特征和個性需求，發(fā)揮智能技術(shù)，根據(jù)人耳特點智能調(diào)控播音模式。是數(shù)字音頻廣播更加人性化的體現(xiàn)。例如，數(shù)字音頻技術(shù)的發(fā)展，讓遠(yuǎn)程會議的音頻內(nèi)容更加清晰，且實現(xiàn)實時傳輸，讓遠(yuǎn)程會議更高效。再如，在音樂領(lǐng)域，音樂經(jīng)歷了從模擬到數(shù)字音樂的轉(zhuǎn)變，未來數(shù)字音樂還將發(fā)揮更大的作用，讓用戶在家中就能感受演唱會現(xiàn)場的美妙音質(zhì)。

三、應(yīng)用途徑

在數(shù)字化時代，廣播電視提出“廣播+”概念，指出“聚合—分化—聚合”的過程：第一個“聚合”，指內(nèi)容的采集是數(shù)字化采集，并儲存在共用數(shù)據(jù)庫中；“分化”，指各種媒體從數(shù)據(jù)庫中取用素材，加工并發(fā)布到用戶習(xí)慣接受的平臺；第二個“聚合”，指媒體通過分化發(fā)布聚合用戶，通過多方式和多層次的傳播形態(tài)，來滿足受眾的不同需求，這就是數(shù)字音頻技術(shù)在廣播電視工程中的應(yīng)用途徑。

1.在廣播數(shù)字調(diào)音臺中應(yīng)用數(shù)字音頻技術(shù)

在廣播電視工程中，通常使用數(shù)字調(diào)音臺來支持?jǐn)?shù)字音頻信號的采集和編譯，它的功能強大，能應(yīng)對復(fù)雜的活動現(xiàn)場，具備放大、處理、合并、調(diào)節(jié)與控制等多方面功能，將通道輸入的信號分配到該去的地方，數(shù)字解析力更高，信噪比更高，頻率響應(yīng)更平衡，延伸更好。另外，數(shù)字調(diào)音臺在節(jié)目處理方面也有很多實用應(yīng)用，數(shù)字調(diào)音臺具有數(shù)據(jù)庫功能，在均衡、壓限、機內(nèi)效果等音頻處理環(huán)節(jié)有不少現(xiàn)存的經(jīng)過標(biāo)準(zhǔn)處理模式處理過的可供調(diào)用的數(shù)字音頻；也可對數(shù)字音頻進行靈活處理?？梢哉f在廣播數(shù)字調(diào)音臺中集成數(shù)字音頻技術(shù)，應(yīng)用功能強大。

2.音頻嵌入技術(shù)中應(yīng)用數(shù)字音頻技術(shù)

電視廣播工程中數(shù)字音頻技術(shù)的應(yīng)用，還在于系統(tǒng)中的音頻嵌入和解嵌技術(shù)。系統(tǒng)中的音頻嵌入和解嵌技術(shù)，指的是對某一個特定區(qū)域的音頻進行嵌入，能在錄制與制作過程中對音頻進行控制與監(jiān)督，使得數(shù)字音頻的內(nèi)容符合設(shè)計，質(zhì)量有所保障。

3.利用數(shù)字音頻技術(shù)處理數(shù)字內(nèi)容

數(shù)字音頻技術(shù)中的云存儲功能，可以在云端進行存儲。由于數(shù)字內(nèi)容的信號量容量較大，連帶著對連接、帶寬等都有較高要求。在數(shù)字音頻技術(shù)的輔助下，加之5G 技術(shù)的加持，可以實現(xiàn)大帶寬、高速率地傳輸信號。基于此，收聽廣播節(jié)目就可以實現(xiàn)跨地域、跨平臺、跨終端。在其強大的基礎(chǔ)資源、數(shù)據(jù)資源和豐富的媒體功能組件支撐下，為媒體用戶在資源利用率、業(yè)務(wù)功能呈現(xiàn)、快速生成發(fā)布等方面提供最為強大的業(yè)務(wù)支持。具體處理時，先接收數(shù)字音頻內(nèi)容，之后對數(shù)字內(nèi)容進行解譯并使用，解譯的方式正好和編譯的方式相反，通過一個數(shù)字轉(zhuǎn)模擬（D/A）轉(zhuǎn)化器將數(shù)字信號轉(zhuǎn)換成由電壓級差組成的模擬信號，再由反折疊濾波器，比如低通濾波器、平滑濾波器、重建濾波器等，把模擬信號內(nèi)的極差加以平滑，還原成初始的模擬信號。

四、數(shù)字音頻技術(shù)的未來發(fā)展趨勢

數(shù)字音頻技術(shù)的未來有三大發(fā)展趨勢。

一是物理建模。對一個樂器的物理發(fā)聲原理通過一個復(fù)雜系統(tǒng)的數(shù)學(xué)模型來進行建模，物理建模的特點在于它參數(shù)的可調(diào)性或者說聲音的可塑性，比如對樂器演奏而言，建模使得其能根據(jù)不同樂器的特點去模擬不同參數(shù)，讓聲音還原度和清晰度更上一層樓。

二是3D 音頻渲染技術(shù)。3D 音頻渲染技術(shù)將具有逼真的空間感，3D立體聲效果的逼真程度極高，并且不同的音頻對象可以呈現(xiàn)準(zhǔn)確的聲學(xué)特征，能夠有效提升音質(zhì)。

三是更深入的聲源分離技術(shù)。結(jié)合上文提到的“分軌錄音技術(shù)”來看，分軌錄音技術(shù)還是存在一定雜質(zhì)，對音質(zhì)造成負(fù)面影響，相信未來的聲源分離技術(shù)會更加成熟，優(yōu)化算法，提升分軌錄音的音質(zhì)。

五、結(jié)語

綜上所述，數(shù)字音頻技術(shù)的迅速發(fā)展對廣播電視工程有非常大的價值，其具有高清晰度、高還原度、編輯制作更加簡單、去除大量冗余、數(shù)據(jù)量大、編譯速度快、能夠更好地保護數(shù)字資產(chǎn)、具有較強的可拓展性、數(shù)字音頻廣播系統(tǒng)更加人性化等多方面特點，在廣播電視工程應(yīng)用中有著極大優(yōu)勢。廣播電視工程可以充分利用數(shù)字音頻技術(shù)去改善當(dāng)下經(jīng)營困局，促進廣播電視工程進一步發(fā)展。