在多媒體的通信中其同步是服務(wù)質(zhì)量衡量的標(biāo)準,因此多媒體在通信中實現(xiàn)同步受到了學(xué)術(shù)領(lǐng)域的熱切關(guān)注。本文主要論述了多媒體的同步通信,分析其音視頻在同步時存在的問題,主要是對時延抖動的影響。在研究該問題中也比較了語音優(yōu)先的復(fù)用模型、FIFO模型在同步問題上的性能,有利于更好的選用通信協(xié)議,實現(xiàn)對數(shù)據(jù)的可靠性傳輸指標(biāo)。
【關(guān)鍵詞】多媒體 通信 音視頻 同步 問題 探討
當(dāng)今通信網(wǎng)絡(luò)都采用了TCP、IP兼存的協(xié)議,提升了數(shù)據(jù)在傳輸過程中的可靠性能。然而,多媒體在通信的業(yè)務(wù)方面需及時處理音視頻的相關(guān)數(shù)據(jù),以確保通信服務(wù)的質(zhì)量。由于諸多原因都會致使通信出現(xiàn)延遲和抖動等,嚴重影響了音視頻播放的質(zhì)量。因此,多媒體在傳輸數(shù)據(jù)時對同步誤差的有效控制十分重要。只有音視頻數(shù)據(jù)在通信中實現(xiàn)了同步的控制,能夠為該通信網(wǎng)絡(luò)減少傳輸誤差的負擔(dān),進而在該基礎(chǔ)上提升通信網(wǎng)絡(luò)服務(wù)的總質(zhì)量。
1 多媒體同步通信的概述
該通信在廣義上其媒體對象主要包含了內(nèi)容、時間及空間的關(guān)系,實現(xiàn)同步也是針對時間而言,尤其是在多媒體的通信之中,在時間上同步的實現(xiàn)是基于系統(tǒng)中多個媒體間的時間關(guān)系,實現(xiàn)同步的主要目的為了向用戶實時播放多媒體的相關(guān)信息。在分布式的多媒體有關(guān)系統(tǒng)中,存在著多個信源或信宿及其信道。其中一個信源及信宿的系統(tǒng)屬于“點到點”通信。它對同步的基本要求主要是功能,故涉及的問題也是流內(nèi)、流間的同步。
2 研究基于H.323多媒體通信的音視頻同步的問題
2.1 媒體間音視頻的同步
2.1.1 媒體的復(fù)用框架
不同媒體的數(shù)據(jù)對網(wǎng)絡(luò)承載有著差異性的要求,其音頻、視頻數(shù)據(jù)就對實時性有較高要求,因而網(wǎng)絡(luò)的傳送機制必須具備較好的實時性。然而,數(shù)據(jù)、控制信息還要求網(wǎng)絡(luò)必須提供具有可靠性的傳送性能,對其實時性的性能無高要求。在H.323的系統(tǒng)之中形成了RTP分組,使用不可靠的UDP傳輸協(xié)議實現(xiàn)了傳送,有效抑制了通信的延時問題。但要想得到可靠性的的數(shù)據(jù)傳輸,就需應(yīng)用TCP協(xié)議。在多媒體的通信中要求該關(guān)系必須具備準確性,否則時間抖動會對視頻、音頻的傳輸造成破壞播映,進而影響了各分組的通信質(zhì)量。
2.1.2 語音優(yōu)先的復(fù)用模型
此模型允許目前正執(zhí)行傳輸任務(wù)的分組繼續(xù)傳輸高級分組,若設(shè)置一致的模型條件和參數(shù),研究其平均時延W。針對語音隊列而言,對其進行分組前其視頻分組的數(shù)要設(shè)為0。根據(jù)Wi=Ri+Ni 整理得出
,可知該視頻分組“平均時延”定大于語音分組“平均時延”。同時和FFIO模型進行對比,語音的優(yōu)先模型中語音分組“平均時延”小于FIFO模型。其視頻分組“平均時延”大于FFIO模型。此外,由于音視頻分組“平均時延”具有不等性,故兩者排隊的時延產(chǎn)生的偏移不能為O,因此此模型在實現(xiàn)同步時性能較弱。
2.2 媒體內(nèi)音視頻的同步
2.2.1 音頻流、視頻流的特性
在語音特性中最關(guān)鍵的參數(shù)是分組幀數(shù),增加幀數(shù)能降低其網(wǎng)絡(luò)分組的成本。語音會出現(xiàn)時延的同步問題,不利于通信實現(xiàn)語音服務(wù)。由于語音分組屬于UDP單元,故需有UDP頭結(jié)合IP分組。一個完整的視頻幀可由幾個段組成,但音頻幀就不需分段組成。視頻分段會令其分組在短時間之內(nèi)突發(fā)“多個”視頻的分組。該突發(fā)狀況可能會令視頻分組產(chǎn)生時延及抖動,通過設(shè)置不同視頻分段的長度對該分組產(chǎn)生時延、抖動進行分析,且研究其產(chǎn)生的具體影響。
2.2.2 MFS對音頻時延抖動的影響
音視頻分組在通信使用中會影響其發(fā)送數(shù)據(jù)的同步時間,致使語音分組也產(chǎn)生了時延、抖動。通過設(shè)置不用的模擬參數(shù),如:256B、512B、768B分段長度,分析語音分組的“視頻字節(jié)數(shù)”特性。當(dāng)MFS在256B和512B之時,均值和標(biāo)準差在大小上無明顯差異,當(dāng)MFS在768B之時,兩項參數(shù)就明顯的減小了。因此,通過表1可知,MFS減小時其音頻性能很難得到提升,相反會增大其音頻在同步中的時延及抖動。
2.2.3 MFS對視頻時延抖動的影響
通過分析推算發(fā)送的時延、到達的間隔所產(chǎn)生的時間變化,進而令分組實驗產(chǎn)生抖動。當(dāng)MFS為256B時,視頻分組會產(chǎn)生較大的抖動;當(dāng)MFS為512B時,其會產(chǎn)生較小的抖動;當(dāng)MFS為768B時,其時延、抖動有明顯的下降跡象。同時,可對MFS為256B、512B、768B各值時分析其同步的性能。通過相關(guān)計算可知,MFS在256B時其RMSE的誤差為43毫秒,MFS在512B時其誤差為37毫秒,則在768B時誤差為25毫秒。因此,MFS在256B時其視頻分組產(chǎn)生了最大的時延抖動,即當(dāng)MFS增大時其發(fā)送端的視頻分組會降低時延的抖動。
3 總結(jié)
多媒體同步是多媒體通信系統(tǒng)的關(guān)鍵技術(shù)之一,它涉及了較廣的范圍。通過概述多媒體的同步通信,進而研究了其音視頻同步的問題。在多媒體的環(huán)境下切實分析了同步問題,有利于為廣大用戶提供相對可靠、穩(wěn)定性能的音視頻通信,解決其音視頻在該通信中的同步難題。
參考文獻
[1]劉可釗.多媒體通信中的音視頻同步問題研究[D].南京:南京理工大學(xué)碩士論文,2010,6(29):1-71.
[2]王少燕.多媒體通信中的音視頻同步問題研究與實現(xiàn)[D].西安:西安電子科技大學(xué)碩士學(xué)位論文,2010,3(12):1-69.
作者簡介
蒙敏榮(1974-),男,陜西省富平縣人。研究生學(xué)歷?,F(xiàn)為西安西芬探測科技有限公司DSP高級工程師。研究方向為音視頻、圖像。