楊春輝
(河北傳媒學(xué)院,河北 石家莊 050000)
AI語(yǔ)音技術(shù)的發(fā)展,促使人工智能與播音主持在傳媒領(lǐng)域擦出新的火花。AI合成主播作為人工智能與播音主持融合的技術(shù)產(chǎn)品,其功能的發(fā)揮,在一定程度上不僅將真實(shí)的播音員主持人從繁重的勞動(dòng)中解脫出來(lái),也滿足了受眾的收視需求。但是,AI主播的功用目前只是停留在有稿播音層面,其在未來(lái)的發(fā)展中還存在很大的空間。
人工智能在傳媒業(yè)的探索過(guò)程中不斷取得新的突破,AI合成主播的推出與優(yōu)化升級(jí)便是最好的證明。“AI合成主播”主要是從聲音和圖像這兩個(gè)層次進(jìn)行研發(fā)建構(gòu),通過(guò)提取真實(shí)播音員在進(jìn)行新聞播報(bào)時(shí)的有聲語(yǔ)言及副語(yǔ)言表達(dá)的特征,運(yùn)用語(yǔ)音、唇形、表情合成等技術(shù)構(gòu)建AI主播。例如,全球首個(gè)AI合成女主播“新小萌”,其聲音與形象脫胎于新華社新聞主播屈萌。
目前,AI合成主播主要應(yīng)用于新聞播報(bào)。2018年11月,搜狗公司與新華社聯(lián)合發(fā)布以新華社新聞主播邱浩為原型的全球首個(gè)“AI合成主播”;2019年2月,升級(jí)為站立式AI合成主播“新小浩”,同日發(fā)布全球首個(gè)AI合成女主播“新小萌”在今年兩會(huì)時(shí)上崗。AI合成主播自在新華社平臺(tái)上崗以來(lái),參與了2019年春運(yùn)、春節(jié)、兩會(huì)等重要事件的新聞報(bào)道,已播報(bào)新聞上千余篇。
2019年兩會(huì)期間,全球首個(gè)人工智能多語(yǔ)種虛擬主播“小晴”上崗,通過(guò)中、英、韓、日等多語(yǔ)種進(jìn)行兩會(huì)新聞報(bào)道。在2019年3·15晚會(huì)預(yù)熱新媒體直播中,央視財(cái)經(jīng)聯(lián)合搜狗推出以央視主持人姚雪松為原型的AI主播“姚小松”,為大家播報(bào)關(guān)于315晚會(huì)的重要消息。
AI合成主播的研發(fā),主要是使語(yǔ)音合成和圖像生成這些特定的程序能夠生成如同真實(shí)的播音員主持人一樣的智能產(chǎn)品,具備主持人的功能和作用,高效完成節(jié)目制作,實(shí)現(xiàn)對(duì)受眾的精準(zhǔn)化服務(wù)。
AI合成主播隨時(shí)在崗是它的一大優(yōu)勢(shì),它可以全天候24小時(shí)為官方網(wǎng)絡(luò)以及社交媒體平臺(tái)工作,對(duì)于夜間的新聞播報(bào)也能夠以積極的狀態(tài)進(jìn)行,在一定程度上分化了真實(shí)播音員的勞動(dòng),極大地減輕了真實(shí)主持人的工作任務(wù)。例如,在新華社客戶端中,3月3日的最后一條新聞是在夜間23:04:24發(fā)布的,3月5日的第一條新聞是在凌晨00:52:22發(fā)布的,AI主播的播講狀態(tài)始終積極。
AI合成主播能夠進(jìn)行新聞播報(bào)是建立在數(shù)據(jù)庫(kù)的基礎(chǔ)之上,通過(guò)語(yǔ)音識(shí)別、語(yǔ)音合成、人臉識(shí)別、人臉建模等技術(shù)完成的。例如,新華社AI合成主播“新小浩”正是通過(guò)多項(xiàng)人工智能技術(shù),將真實(shí)主持人邱浩“復(fù)制”出來(lái),呈現(xiàn)出AI合成主播與真實(shí)播音員的語(yǔ)音和形象極度相似的新聞播出效果。人對(duì)AI合成主播輸入所需播報(bào)的文本數(shù)據(jù),AI合成主播即可實(shí)時(shí)完成新聞信息的播報(bào)并生成視頻,極大地提升了電視新聞的制作效率,使新聞時(shí)效性更強(qiáng)、信息傳遞也更及時(shí)準(zhǔn)確。
AI語(yǔ)音背景下,AI合成主播、虛擬主持人、智能機(jī)器主持人等新興傳播載體的誕生及應(yīng)用,推動(dòng)中國(guó)電視傳媒產(chǎn)業(yè)在數(shù)字化信息交互平臺(tái)的發(fā)展,極大地豐富了電視節(jié)目的傳播手段。尤其是信息傳播技術(shù)的飛速發(fā)展,信息資源的全球性流通與共享,促使中國(guó)電視傳媒產(chǎn)業(yè)實(shí)現(xiàn)全球性的傳播與發(fā)展。
2019年兩會(huì)期間,由科大訊飛推出的全球首個(gè)人工智能多語(yǔ)種虛擬主播“小晴”上崗,依托機(jī)器翻譯技術(shù)進(jìn)行多國(guó)語(yǔ)言翻譯,可以使用中、英、韓、日等多語(yǔ)種進(jìn)行兩會(huì)新聞報(bào)道,實(shí)現(xiàn)一個(gè)聲音多語(yǔ)種播報(bào)。同時(shí),多語(yǔ)種AI虛擬主播“小晴”的多語(yǔ)種播報(bào),更是在第一時(shí)間將中國(guó)兩會(huì)期間的新聞信息對(duì)外傳遞,加大了信息世界化的傳播力度,加強(qiáng)了中國(guó)電視對(duì)外傳播的交流力度。
在高科技競(jìng)爭(zhēng)日益激烈的情況下,AI合成主播的頻繁使用與不斷優(yōu)化升級(jí),意味著中國(guó)電視的傳播媒介取得了新的進(jìn)展,這也是全球傳播大發(fā)展中,中國(guó)電視新聞信息傳播的新機(jī)遇。
人工智能技術(shù)在傳媒領(lǐng)域所應(yīng)用的功能,是屬于程序性的、無(wú)需人發(fā)揮的信息傳輸功能,其語(yǔ)音輸出及視頻輸出是基于大數(shù)據(jù)的輸入由數(shù)據(jù)庫(kù)自動(dòng)生成的。AI在廣播電視領(lǐng)域的應(yīng)用,目前主要應(yīng)用于廣播電視節(jié)目中較為規(guī)整的、無(wú)變化的、簡(jiǎn)單的播音主持創(chuàng)作活動(dòng)。
AI合成主播是基于人工智能技術(shù)而產(chǎn)生的一種新的電視節(jié)目傳播載體,是完全依賴于技術(shù)的“電視播音員”,其語(yǔ)音輸出、面部表情、肢體動(dòng)作等都是按照人所設(shè)定的程序及發(fā)出的指令行事。AI合成主播主要應(yīng)用于新聞播報(bào),屬于較為簡(jiǎn)單、規(guī)整的新聞稿件的語(yǔ)音及圖像輸出,它在接收到新聞稿件的文本數(shù)據(jù)后即可程序性的輸出音頻和視頻數(shù)據(jù),無(wú)需人的發(fā)揮。從某種意義上來(lái)說(shuō),AI合成主播是一種把人們從繁重的勞動(dòng)中解脫出來(lái)的工具。
目前,我國(guó)的人工智能技術(shù)雖在語(yǔ)音及圖像處理方面取得較大突破,但讓AI合成主播能夠自如呈現(xiàn),使其語(yǔ)音功能和虛擬形象如同真實(shí)播音員一樣自然和諧,仍然有待提高。
語(yǔ)流音變是我們?cè)谶B續(xù)說(shuō)話時(shí)產(chǎn)生的現(xiàn)象。在語(yǔ)流中,相鄰的音節(jié)會(huì)受到影響,讀音發(fā)生變化就是語(yǔ)流音變[1]。在普通話中較為典型的語(yǔ)流音變是變調(diào)、輕聲、兒化的變化。如果連續(xù)說(shuō)話時(shí),只是把每一個(gè)音節(jié)的音讀準(zhǔn)確,而未改變組合音節(jié)的發(fā)音,是不符合音變規(guī)律的,更難以使語(yǔ)音自然和諧。
AI合成主播的語(yǔ)音是多音節(jié)的連續(xù)輸出,相對(duì)于人的自然語(yǔ)音機(jī)械性較強(qiáng),缺乏語(yǔ)流音變。例如,2019年3月6日,在新華社客戶端“新小浩上兩會(huì)”專欄中,AI合成主播“新小浩”在播報(bào)“又見(jiàn)直播‘利器’”這則新聞時(shí),將“什么東西最難攜帶?什么東西最沉最累人?”這句話中的“東西”二字均讀為陰平,并未進(jìn)行音變處理?!皷|西”在指方位時(shí)不發(fā)生音變,但在形容具體的事、物時(shí),其第二個(gè)音節(jié)“西”應(yīng)讀輕聲。長(zhǎng)此以往,容易引起人們發(fā)音上的混淆,對(duì)人們產(chǎn)生誤導(dǎo)。
在有聲語(yǔ)言的表達(dá)中,停頓是聲音中斷、休止的地方[2]。播音員主持人在進(jìn)行備稿時(shí)要通讀全文,了解全文語(yǔ)句的句法、結(jié)構(gòu)及語(yǔ)句的意思,根據(jù)語(yǔ)義確定停頓的位置。語(yǔ)句的意義完成,聲音才能停頓。如若停頓位置錯(cuò)誤,就會(huì)使語(yǔ)義發(fā)生變化,促使語(yǔ)義不明,甚至導(dǎo)致對(duì)文本的誤讀。
文稿中有單句和復(fù)句,對(duì)于復(fù)句的處理要從語(yǔ)義著手,根據(jù)語(yǔ)句之間的邏輯關(guān)系確定停頓的位置。目前,AI合成主播難以通過(guò)分析語(yǔ)句結(jié)構(gòu)準(zhǔn)確找到停頓的位置。例如,在新華社客戶端“新小浩上兩會(huì)”專欄中,“新小浩”在2019年3月9日的新聞報(bào)道中讀到“邀請(qǐng)全國(guó)人大環(huán)境與資源保護(hù)委員會(huì)委員程立峰等就‘人大立法工作’相關(guān)問(wèn)題回答記者提問(wèn)”這句話時(shí),在“環(huán)境”后面做了停頓。通過(guò)分析語(yǔ)句得知“全國(guó)人大環(huán)境與資源保護(hù)委員會(huì)”是一個(gè)機(jī)構(gòu),這種專有名詞不能在中間做停頓處理。
廣播電視有聲語(yǔ)言的傳播分為兩種,一種是表達(dá)語(yǔ)言的表層意思,另一種則為語(yǔ)言的深層含義,即通過(guò)語(yǔ)言還能了解為什么[3]。目前,AI合成主播還處于傳遞表層信息的階段,不能做到“言志傳神”。播音員主持人在進(jìn)行文稿的再創(chuàng)作時(shí),不能僅僅停留在文字表面,文字是具有表情、表意方面的多向性的,要把握播講目的。不同的新聞稿件有不同的背景,主播要充分理解,運(yùn)用與之相對(duì)應(yīng)的情感基調(diào)進(jìn)行報(bào)道。AI主播的情感基調(diào)是固定的,難以通過(guò)語(yǔ)音表達(dá)文字的深層含義。
在播音創(chuàng)作中,理解稿件需要從內(nèi)容和形式兩方面深入分析。新聞分為消息、評(píng)論、通訊等不同形式,播音員針對(duì)不同體裁的稿件要運(yùn)用與之相對(duì)應(yīng)的話語(yǔ)樣式。AI主播的語(yǔ)音播報(bào)是從文本內(nèi)容出發(fā),而忽略了稿件的形式,難以正確地傳播稿件內(nèi)容。真實(shí)播音員的播音創(chuàng)作是一種有意識(shí)、有目的的社會(huì)實(shí)踐,而AI主播屬于機(jī)器,無(wú)法傳達(dá)特定語(yǔ)境下文字所蘊(yùn)含的深層內(nèi)涵。
人工智能時(shí)代背景下,AI合成主播成為電視新聞信息傳播的載體,在一定程度上確實(shí)起到了真實(shí)播音員的傳播作用。目前,AI合成主播的語(yǔ)音功能相較于人的自然語(yǔ)音具有一定的優(yōu)劣性,難以完全起到主持傳播的作用,唯有不斷提升人工智能技術(shù),才能使得AI合成主播獲得持續(xù)不斷的發(fā)展動(dòng)力。