張 文
(蘭州現(xiàn)代職業(yè)學(xué)院,甘肅 蘭州 730020)
虛擬數(shù)字人技術(shù)的崛起正在改變新聞行業(yè)的面貌。本文旨在深入探討虛擬數(shù)字人技術(shù)的概念、關(guān)鍵技術(shù)組成、發(fā)展現(xiàn)狀以及多個應(yīng)用領(lǐng)域,特別關(guān)注其在新聞領(lǐng)域的應(yīng)用,揭示虛擬數(shù)字人技術(shù)如何重塑新聞生產(chǎn)方式,影響新聞質(zhì)量和傳播效果,并探討其對未來新聞業(yè)的深遠(yuǎn)影響。
虛擬數(shù)字人是指存在于非物理世界中,由計算機(jī)圖形學(xué)、圖形渲染、動作捕捉、深度學(xué)習(xí)、語音合成等計算機(jī)手段創(chuàng)造及使用,具有多重人類特征的綜合產(chǎn)物[1]。這些虛擬數(shù)字人不僅能夠模擬人類的外貌和語音,還具備自主決策、自然語言理解和情感表達(dá)的能力。虛擬數(shù)字人應(yīng)用范圍廣泛,包括虛擬偶像、虛擬主播、虛擬助手、游戲角色及在線教育導(dǎo)師等,具有擬人化、互動性、智能化3 個特點(diǎn)。
虛擬數(shù)字人包括多種關(guān)鍵技術(shù)。這些技術(shù)協(xié)同工作,創(chuàng)造逼真的虛擬個體。計算機(jī)圖形學(xué)技術(shù)用來創(chuàng)建虛擬數(shù)字人的外貌和環(huán)境,包括建模人物的三維外觀、紋理映射、骨骼動畫等,確保虛擬數(shù)字人的外觀和動作逼真。圖形渲染技術(shù)用于將虛擬場景呈現(xiàn)在屏幕上,制造光照、陰影、反射和抗鋸齒等效果,以提高視覺真實(shí)感。動作捕捉技術(shù)用來捕捉現(xiàn)實(shí)世界中的運(yùn)動和動作,并將其應(yīng)用于虛擬數(shù)字人,有助于實(shí)現(xiàn)自然的動作和表情。深度學(xué)習(xí)算法用于面部表情生成、姿勢識別和語義理解等方面。深度學(xué)習(xí)模型從大量數(shù)據(jù)中進(jìn)行學(xué)習(xí),提高虛擬數(shù)字人的智能水平。語音合成技術(shù)用于創(chuàng)建虛擬數(shù)字人的聲音,生成自然流暢的語音,使虛擬數(shù)字人能夠與用戶進(jìn)行實(shí)時語音互動[2]。
艾媒咨詢調(diào)查報告顯示,2022 年,我國虛擬人帶動產(chǎn)業(yè)市場規(guī)模和核心市場規(guī)模分別為1 866.1 億元和120.8 億元,預(yù)計2025 年將分別達(dá)到6 402.7 億元和480.6 億元,呈現(xiàn)強(qiáng)勁增長態(tài)勢[3]。
虛擬數(shù)字人產(chǎn)業(yè)的發(fā)展離不開企業(yè)的支持。早期企業(yè)包括科大訊飛、騰訊、阿里、百度等企業(yè),此類互聯(lián)網(wǎng)早期企業(yè)技術(shù)力量扎實(shí),較早布局虛擬數(shù)字人產(chǎn)業(yè)。此后,商湯智能科技、火山引擎、中科深智、小冰等企業(yè)紛紛入局虛擬數(shù)字人產(chǎn)業(yè)[4]。如2018 年騰訊旗下的NExT Studios 發(fā)布Siren 虛擬數(shù)字人,2021 年發(fā)布全球首位數(shù)字航天員小諍。又如,2021 年,百度發(fā)布數(shù)字人直播平臺“曦靈”,提供虛擬主持人、虛擬員工、虛擬偶像及品牌代言人等虛擬數(shù)字人創(chuàng)建與運(yùn)營服務(wù)。字節(jié)跳動旗下北京火山引擎推出虛擬數(shù)字人應(yīng)用平臺,為各行業(yè)提供客服、智慧導(dǎo)覽、智能助理、虛擬直播等場景的虛擬數(shù)字人應(yīng)用解決方案。2022 年8 月,芒果TV 創(chuàng)新研究院與騰訊云聯(lián)合發(fā)布虛擬人直播互動平臺,為企業(yè)提供輕量化、異地化、專業(yè)化的虛擬內(nèi)容生產(chǎn)服務(wù)[5]。
虛擬數(shù)字人技術(shù)在各個領(lǐng)域都有廣泛的應(yīng)用。第一,娛樂領(lǐng)域。虛擬數(shù)字人技術(shù)在電子游戲、虛擬現(xiàn)實(shí)、增強(qiáng)現(xiàn)實(shí)等娛樂領(lǐng)域得到廣泛應(yīng)用,創(chuàng)建逼真的游戲角色,增強(qiáng)游戲體驗(yàn),并為虛擬世界賦予生命。第二,教育領(lǐng)域。教育界利用虛擬數(shù)字人來提供個性化的在線教育體驗(yàn)。虛擬教育導(dǎo)師與學(xué)生互動,解答問題,甚至提供情感支持,提高教育質(zhì)量。第三,新聞領(lǐng)域。在新聞領(lǐng)域,虛擬數(shù)字人用于新聞報道、播報和主持,提供即時新聞更新,解釋復(fù)雜的話題,增強(qiáng)新聞體驗(yàn),甚至在危機(jī)時刻提供信息。第四,客戶服務(wù)。虛擬數(shù)字人在客戶服務(wù)中充當(dāng)虛擬助手,可以回答常見問題,提供產(chǎn)品信息,提高客戶滿意度,并減輕人工客服的壓力。第五,藝術(shù)和文化。虛擬數(shù)字人技術(shù)為藝術(shù)家和文化創(chuàng)意工作者提供了無限可能性,可用于創(chuàng)作虛擬角色、數(shù)字藝術(shù)和互動演出。
將虛擬數(shù)字人應(yīng)用在新聞采訪中,是新聞領(lǐng)域的一項(xiàng)創(chuàng)新。虛擬數(shù)字人可以充當(dāng)新聞采訪者的角色。比如虛擬記者,能夠提出問題、追問信息,甚至模擬各種采訪風(fēng)格和語氣,與被采訪者進(jìn)行互動。新聞采訪中的虛擬數(shù)字人角色一般具有以下功能。
(1)實(shí)時信息獲取。虛擬數(shù)字人可以接入實(shí)時新聞源和數(shù)據(jù)庫,迅速獲取和整理大量信息,以支持采訪過程。這有助于提供準(zhǔn)確和及時的新聞報道。
(2)語言翻譯。虛擬數(shù)字人能夠在多語言采訪中發(fā)揮關(guān)鍵作用,可快速翻譯和轉(zhuǎn)述采訪對象的話語,使跨文化和多語言報道更容易實(shí)現(xiàn)。
(3)自然語言理解。虛擬數(shù)字人能夠理解和分析采訪對象的回答,從中提取重要信息,有助于報道的深度分析。
(4)互動性。虛擬數(shù)字人具有互動性,允許觀眾通過虛擬平臺參與采訪,提出問題,與虛擬采訪者互動,從而增強(qiáng)新聞體驗(yàn)。
以百度虛擬數(shù)字人度曉曉為例,其在新聞采訪過程中發(fā)揮著關(guān)鍵作用。度曉曉基于百度大腦7.0核心技術(shù)驅(qū)動,整合了多模態(tài)交互技術(shù)、3D 數(shù)字人建模、機(jī)器翻譯、語音識別、自然語言理解等多項(xiàng)技術(shù),展現(xiàn)出強(qiáng)大的人工智能(Artificial Intelligence,AI)交互能力及生成式人工智能(Artificial Intelligence Generated Content,AIGC)能力,為用戶提供更加親切、更具科技感、沉浸感的體驗(yàn)。2022年5 月,虛擬數(shù)字人度曉曉擔(dān)任工人日報特派“AI記者”,參加全國五一勞動獎獲得者新聞采訪活動。度曉曉還以“AI 記者”身份參與了首屆大國工匠創(chuàng)新交流大會新聞采訪活動。大會以線上3D VR展廳、全景“云巡館”、直播“云觀展”等多種形式呈現(xiàn),“AI 記者”度曉曉帶領(lǐng)觀眾云端游覽展會,向觀眾解讀我國工業(yè)與制造業(yè)發(fā)展成果[6]。
虛擬數(shù)字人在新聞編輯中的應(yīng)用,給新聞產(chǎn)業(yè)帶來了革命性的改變,主要表現(xiàn)在以下方面。
(1)自動化新聞生成。虛擬數(shù)字人自動分析數(shù)據(jù)、事件和信息源,然后生成新聞文章,能夠迅速提供大量的新聞內(nèi)容,節(jié)省新聞編輯的時間和勞動力。
(2)新聞稿件的多語言轉(zhuǎn)化。虛擬數(shù)字人技術(shù)能夠?qū)⑿侣劯寮焖俜g成多種語言,擴(kuò)大了新聞報道的受眾范圍。
(3)自然語言處理。虛擬數(shù)字人在新聞編輯中具備自然語言處理能力,幫助編輯分析和提取新聞材料中的關(guān)鍵信息,輔助編寫和編輯過程。
(4)內(nèi)容個性化。虛擬數(shù)字人能夠根據(jù)用戶的興趣和偏好,自動生成個性化的新聞內(nèi)容,提高用戶體驗(yàn)和新聞觀眾的忠誠度。
(5)數(shù)據(jù)可視化。虛擬數(shù)字人將數(shù)據(jù)轉(zhuǎn)化為可視化圖表和圖形,使復(fù)雜的數(shù)據(jù)更容易理解,豐富了新聞報道的形式。
(6)人機(jī)協(xié)作。虛擬數(shù)字人與人類編輯協(xié)同工作,提供新聞稿件的初稿,由編輯進(jìn)行進(jìn)一步的審查和修改。
以天津津云新媒體集團(tuán)股份有限公司的虛擬數(shù)字人2.0 內(nèi)容生產(chǎn)系統(tǒng)為例,其在新聞編輯中發(fā)揮了關(guān)鍵性作用,主要用于生成高質(zhì)量的虛擬數(shù)字人視頻內(nèi)容。該系統(tǒng)采用AI 技術(shù)和3D 建模技術(shù),快速、準(zhǔn)確地生成虛擬數(shù)字人視音頻內(nèi)容,大大提高了新聞內(nèi)容的生產(chǎn)效率和質(zhì)量?;谏疃葘W(xué)習(xí)的面部捕捉和身體姿態(tài)捕捉系統(tǒng),實(shí)時捕捉演員的表情和動作,并將其轉(zhuǎn)化為虛擬數(shù)字人的表情和動作,擁有強(qiáng)大的語音合成和語音識別功能,實(shí)現(xiàn)語音交互和自動字幕生成等功能。以北京美攝網(wǎng)絡(luò)科技有限公司的AIGC+Avata 數(shù)字人解決方案為例,使用先進(jìn)的計算機(jī)視覺和人工智能技術(shù),實(shí)現(xiàn)更加逼真、交互性更強(qiáng)的AIGC 內(nèi)容生產(chǎn)創(chuàng)作新體驗(yàn)。對新聞編輯工作而言,使用AIGC+Avata 數(shù)字人解決方案,能夠?qū)崿F(xiàn)新聞內(nèi)容的自動生成,包括文字、圖片、音頻、視頻形式。
虛擬數(shù)字人在新聞播報和主持中的應(yīng)用是新聞行業(yè)的一項(xiàng)創(chuàng)新,擔(dān)任主持人和播音員的角色,具有以下關(guān)鍵功能和應(yīng)用。第一,新聞播報。虛擬數(shù)字人用逼真的外貌和語音合成技術(shù)來播報新聞,使得新聞機(jī)構(gòu)能夠?qū)崿F(xiàn)7×24 h 的新聞播報,減少對人力資源的依賴,并確保新聞不受時間限制。第二,多語言播報。虛擬數(shù)字人技術(shù)使得播音員輕松切換多種語言,滿足不同觀眾的需求,擴(kuò)大了新聞報道的受眾范圍。第三,即時新聞更新。虛擬數(shù)字人可以迅速更新新聞,特別是在緊急情況下,以提供即時的新聞報道,有助于觀眾獲得最新的信息。第四,節(jié)目主持。虛擬數(shù)字人用于主持新聞節(jié)目,引導(dǎo)討論、采訪嘉賓,甚至提供評論和分析。第六,可定制性。虛擬數(shù)字人可根據(jù)需要進(jìn)行定制,包括外貌、聲音、語言、風(fēng)格和主題,以滿足不同的新聞節(jié)目需求。
以2020 年上海廣播電視臺虛擬新聞主播申?雅為例,其是虛擬數(shù)字人在新聞播報和主持領(lǐng)域的典型應(yīng)用,通過4D 掃描、智能綁定、實(shí)時渲染引擎,不斷提升角色表現(xiàn)力,應(yīng)用動作捕捉采集技術(shù)、影視級面捕技術(shù)、計算機(jī)動畫(Computer Graphics,CG)技術(shù)合成等全新的技術(shù)流程,使得虛擬數(shù)字人從表情到動作更加生動自然。在新聞播報中,申?雅可以自動生成新聞報道,語言流暢自然,與真實(shí)人類主播無異。她能夠準(zhǔn)確地播報新聞,包括國內(nèi)外的政治、經(jīng)濟(jì)、文化、體育等各個領(lǐng)域的新聞。申?雅通過模擬人類情感和語氣,使得新聞播報更加生動、有趣。申?雅多次參與重大新聞播報,如“迎接黨的二十大”主題宣傳報道、第五屆進(jìn)博會全媒體直播特別報道、“慶祝香港回歸祖國25 周年”全媒體特別報道、2022 全國兩會系列報道、2022 世界人工智能大會、2022 北京冬奧會等。此外,還有虛擬主持人言東方、新華社的新小浩和新小萌、虛擬主持人小冰、3D 超寫實(shí)虛擬數(shù)字人小C 等虛擬數(shù)字人被廣泛應(yīng)用于新聞播報,為新聞媒體的發(fā)展提供了新的可能性。
本文深入研究了虛擬數(shù)字人技術(shù)在新聞采編播中的創(chuàng)新應(yīng)用,重點(diǎn)關(guān)注虛擬數(shù)字人在新聞采訪、編輯和播報中的角色、功能和效益。虛擬數(shù)字人已經(jīng)成為新聞領(lǐng)域的重要工具,提高了新聞生產(chǎn)效率,拓展了報道的多樣性。