馮玖江,瞿 輝,袁星勇,于興網(wǎng)
(重慶金美通信有限責(zé)任公司,重慶 400030)
隨著網(wǎng)絡(luò)和多媒體技術(shù)的不斷發(fā)展,多媒體業(yè)務(wù)逐漸在Internet應(yīng)用中占據(jù)主導(dǎo)地位,用戶對手持終端的使用要求越來越高,使用方式不局限于簡單的文字消息、電話業(yè)務(wù),更希望能集成視頻、圖片、短語音消息、狀態(tài)顯示、地理位置共享等業(yè)務(wù)。于是,融合通信技術(shù)應(yīng)運(yùn)而生,很好地將上述要求進(jìn)行了融合統(tǒng)一。語音會議作為它的重要應(yīng)用,逐漸被提上研究議程,越來越受到關(guān)注。
本文通過分析現(xiàn)有語音會議系統(tǒng)架構(gòu),提出了在終端側(cè)集中混音的分布式語音會議方法,并利用SIP協(xié)議優(yōu)良的擴(kuò)展性實(shí)現(xiàn)SIP終端多方通話的信令接續(xù),完成語音會議功能。
目前,IP網(wǎng)絡(luò)上的語音會議系統(tǒng)主要采用SIP和H.323協(xié)議作為控制信令,采用RTP(RealtimeTransport Protocol,實(shí)時傳輸協(xié)議)作為語音流的傳輸協(xié)議,主要架構(gòu)模型有信令集中式和語音集中式、信令集中式和語音分布式、信令集中式和語音組播式三種模型,拓?fù)浞謩e如圖1、圖2和圖3所示[1]。
圖1 語音集中式處理模型
圖2 語音分布式處理模型
圖3 語音組播式處理模型
三種會議系統(tǒng)模型都是信令集中式處理,但是語音處理方式不相同,其優(yōu)缺點(diǎn)如下所述。
(1)語音集中處理模型
優(yōu)點(diǎn):參與語音會議的終端用戶不需要自己進(jìn)行混音處理,不需要關(guān)心其他參與者的語音編解碼類型。
缺點(diǎn):需要預(yù)約會議,靈活性差;需要單獨(dú)部署會議服務(wù)器對會議進(jìn)行管理和對語音進(jìn)行混音,增加了部署成本;如果建立大規(guī)模會議或者會議室很多的情況下,會增加會議服務(wù)器的運(yùn)行壓力。
(2)語音分布式處理模型
優(yōu)點(diǎn):每個參與終端相當(dāng)于一個混音服務(wù)器,不需要專門的會議服務(wù)器進(jìn)行語音混音,降低了部署成本。
缺點(diǎn):每一個參與語音會議的終端必須具有混音功能和會議管理功能,從而降低了會議參與的靈活性;每一個終端都會向其他所有參與終端發(fā)送混音后的語音數(shù)據(jù),導(dǎo)致語音數(shù)據(jù)的網(wǎng)絡(luò)開銷急劇增加。
(3)語音組播處理模型
優(yōu)點(diǎn):會議參與終端需向網(wǎng)絡(luò)中指定的一個組播IP地址發(fā)送語音數(shù)據(jù),組播設(shè)備將收到的語音數(shù)據(jù)向網(wǎng)絡(luò)中的終端設(shè)備進(jìn)行傳遞,降低了網(wǎng)絡(luò)開銷。
缺點(diǎn):每一個會議參與終端需要具備混音功能和會議管理功能,從而降低了會議參與的靈活性;需要增加網(wǎng)絡(luò)組播設(shè)備,同樣增加了部署成本。
本文對語音分布式處理模型進(jìn)行改進(jìn),會議模型中不需要單獨(dú)部署會議服務(wù)器和媒體服務(wù)器,只需要一個SIP信令服務(wù)器做信令轉(zhuǎn)發(fā),對語音混音的控制和會議管理都主要由語音會議召集終端執(zhí)行,語音會議拓?fù)淙鐖D4所示。
圖4 語音會議拓?fù)?/p>
優(yōu)點(diǎn)如下:
(1)不需要預(yù)約,可以隨時建立、撤銷語音會議;
(2)對參與成員來說,語音會議只相當(dāng)于一路普通通話;
(3)只對會議召集終端有混音功能和會議控制功能,對參與語音會議的終端沒有能力要求,一部普通SIP電話即可加入語音會議;
(4)互聯(lián)網(wǎng)中,任意一個具有會議功能的終端都可以發(fā)起一個語音會議,不需要單獨(dú)的會議服務(wù)器,可以實(shí)現(xiàn)多點(diǎn)分布式語音會議。
分布式語音會議拓?fù)淙鐖D5所示[2-3]:
圖5 分布式語音會議模型
SIP協(xié)議能夠?qū)崿F(xiàn)發(fā)起、終止、修改會話參數(shù)等,但SIP并不提供會議控制服務(wù),可以在其基礎(chǔ)上實(shí)現(xiàn)會議控制功能來建立、拆除一個會議[4]。
語音會議的信令采用SIP信令建立通話連接,沒有會議室的概念,所有會議參與方都是一路普通呼叫。當(dāng)新的參與方接通后,語音會議召集終端將新的通話合并到已經(jīng)存在的通話中,從而完成一個語音會議的建立。會議建立流程如圖6所示。
圖6 會議建立流程
該系統(tǒng)設(shè)計不限制成員退出會議。當(dāng)某一路參與者想退出語音會議時,直接發(fā)送BYE信令掛機(jī),并關(guān)閉語音流即可退出。會議召集者如果要移除參與成員,向被移除成員發(fā)送BYE掛機(jī)信令,即可將該參與者移除當(dāng)前會議。當(dāng)語音會議中沒有參與成員時,語音會議自動拆除。會議拆除流程如圖7所示。
圖7 會議拆除流程
會議管理單元負(fù)責(zé)協(xié)調(diào)參與會議各成員的信令溝通,維護(hù)會話流程的建立和調(diào)度,可以對參與成員進(jìn)行禁止發(fā)言和恢復(fù)發(fā)言的管理,可以邀請新成員或者移除新成員。邀請新成員進(jìn)入會議,可以采用Dial-in方式,即成員主動呼叫召集者的URI,召集者在回復(fù)200OK的contact頭域中加入isfocus標(biāo)識來表明自己是會議召集者。也可以采用Dial-out方式,會議召集者主動邀請會話參與者進(jìn)入會議,在發(fā)送的INVITE消息的contact頭域中加入isfocus標(biāo)識來表明自己是會話召集者。移除成員則直接向成員發(fā)送BYE信令;會議狀態(tài)管理采用SIP的REFER方法,將新加入的成員信息或者剛退出的成員信息通知給其他參與成員,其他參與成員則更新自己的會議狀態(tài)信息。會話管理流程如圖8所示。
媒體策略包括媒體混合單元和媒體控制單元。媒體混合單元是一個對語音媒體處理的部件,其功能是完成對語音的編碼、解碼和混合,目前能夠支持PCMA、PCMU、G.729的編解碼[5];媒體控制單元從網(wǎng)絡(luò)中收取RTP語音流,然后將語音載荷送到媒體混合單元進(jìn)行處理,并根據(jù)會議管理單元的信令將媒體混合單元的語音數(shù)據(jù)通過RTP[6]發(fā)往對應(yīng)的網(wǎng)絡(luò)地址。
圖8 會議管理流程
本文設(shè)計的終端側(cè)混音分布式語音會議能滿足基本的語音會議要求,可以實(shí)現(xiàn)簡單的會議管理。SIP作為業(yè)務(wù)控制信令實(shí)現(xiàn)簡單,且對SIP稍作擴(kuò)展還可以實(shí)現(xiàn)更加豐富的功能。終端側(cè)的混音也降低了會議服務(wù)器的部署成本,是一個在性能和成本之間折中的較佳方案。