洪少華 盧曉華 劉洪靜
摘要:人工智能的發(fā)展推動了虛擬數(shù)字人技術(shù)的成熟與落地,國內(nèi)主流媒體緊跟技術(shù)發(fā)展趨勢,積極探索虛擬數(shù)字人在專業(yè)服務(wù)、偶像娛樂等場景中的應(yīng)用,推出了虛擬記者、虛擬主播、虛擬主持人等一大批“數(shù)字媒體人”。針對當(dāng)前虛擬數(shù)字人在主流媒體的應(yīng)用痛點,可在拓展應(yīng)用場景、突出情感設(shè)計的同時加速構(gòu)建虛擬數(shù)字人的商業(yè)運作模式和身份認(rèn)證體系,推動虛擬數(shù)字人的更新迭代及其在主流媒體的應(yīng)用完善。
關(guān)鍵詞:虛擬數(shù)字人 主流媒體 人工智能
2018年5月2日,以著名主持人康輝為原型的虛擬主持人亮相央視新聞頻道《直播長江》欄目,標(biāo)志著虛擬數(shù)字人在國內(nèi)傳媒業(yè),尤其是在主流媒體中的新一輪應(yīng)用熱潮的到來。此后,人民日報、新華社、中央廣播電視總臺、浙江衛(wèi)視、上海廣播電視臺等各級各類主流媒體相繼加入對虛擬數(shù)字人的應(yīng)用探索,先后推出了數(shù)十位由虛擬數(shù)字人擔(dān)任的記者、主播、主持人、傳媒推廣人。虛擬數(shù)字人的應(yīng)用不僅為媒體深度融合提供了動力,也加快了人機共生時代來臨的步伐。聚焦虛擬數(shù)字人在主流媒體的最新應(yīng)用動態(tài)、省思其現(xiàn)狀與問題對促進主流媒體自我革新、推動數(shù)字人技術(shù)發(fā)展進步意義重大。
智能化是媒體深度融合的重要趨勢,人工智能為媒體智能化發(fā)展和全媒體傳播體系構(gòu)建提供了技術(shù)支撐,也為虛擬數(shù)字人的技術(shù)研發(fā)、落地實踐和應(yīng)用創(chuàng)新注入了新的動力。虛擬數(shù)字人在包括傳媒行業(yè)在內(nèi)的各個社會生產(chǎn)領(lǐng)域迎來了廣闊、蓬勃的發(fā)展前景。
1.“虛擬數(shù)字人”定義。“數(shù)字人”(Digital Human)指的是借助信息科學(xué)方法對人體進行虛擬仿真而得到的多層次數(shù)字模型。數(shù)字人是生命科學(xué)與信息科學(xué)碰撞、交融的產(chǎn)物,能夠從微觀到宏觀,從生理到智能,從分子、細(xì)胞、組織、到器官、整體等不同層級實現(xiàn)對人體的精確模擬。與生命科學(xué)領(lǐng)域稍有差異的是,應(yīng)用于信息傳播領(lǐng)域的數(shù)字人多指的是“虛擬數(shù)字人”(Virtual Human),即具備類人化數(shù)字外形與認(rèn)知能力、在數(shù)字虛擬環(huán)境中行使自動化代理功能的交互式虛擬人物。有別于實體機器人,虛擬數(shù)字人需要以數(shù)字顯示設(shè)備為存在載體,能夠從外觀、行為、智能等方面模擬人類,比如模擬人類的容貌、性征、語言、表情、動作,部分虛擬數(shù)字人可識別外部環(huán)境并實現(xiàn)與外界的交流互動。虛擬數(shù)字人是通往元宇宙的入口,是人工智能技術(shù)在圖形動畫領(lǐng)域的關(guān)鍵性應(yīng)用。融合了多種高新尖智能技術(shù)的虛擬數(shù)字人,在驅(qū)動社會各行業(yè)發(fā)展及拓展人類生存體驗的同時,也拉開了全新人機共生智媒時代的序幕。
2.人工智能為虛擬數(shù)字人的繁榮和升級提供技術(shù)動力。當(dāng)前,虛擬數(shù)字人仍處于技術(shù)研發(fā)和落地實踐的初期階段,業(yè)界對虛擬數(shù)字人的通用系統(tǒng)框架尚未形成統(tǒng)一定論。參考《2020年虛擬數(shù)字人發(fā)展白皮書》,虛擬數(shù)字人通用系統(tǒng)框架可初步劃分為基礎(chǔ)模塊和拓展模塊兩類,前者包含語音生成、動畫生成、人物形象和音視頻合成顯示等四大模塊,后者則主要指代交互模塊。語音生成模塊負(fù)責(zé)生成基于文本的人物語音,動畫生成模塊負(fù)責(zé)生成與人物語音匹配的人物動畫,二者共同服務(wù)于人物表達。產(chǎn)出的語音和動畫再經(jīng)由音視頻合成顯示模塊加工成視頻。人物形象模塊主要負(fù)責(zé)虛擬數(shù)字人的形象設(shè)計,如外形風(fēng)格(超寫實、寫實或卡通等)和外觀維度(2D或3D)。交互模塊則決定了虛擬數(shù)字人是否具有基于語音識別、視覺識別等智能技術(shù)的交互功能,而按照是否配備交互模塊,虛擬數(shù)字人又可劃分為交互型數(shù)字人和非交互型數(shù)字人。
自2018年起,隨著深度學(xué)習(xí)算法的快速發(fā)展,虛擬數(shù)字人,尤其是智能驅(qū)動型數(shù)字人的研發(fā)與應(yīng)用不斷取得突破,更加精細(xì)、更加智能的虛擬數(shù)字人在社會生產(chǎn)各領(lǐng)域嶄露頭角。人工智能技術(shù)從人物生成、合成顯示、分析決策等方面推動虛擬數(shù)字人應(yīng)用所依賴的關(guān)鍵技術(shù)發(fā)展成熟。同時,在制作和應(yīng)用成本大幅下降的同時,虛擬數(shù)字人的交流互動能力和虛擬仿真程度卻在不斷提升,其行業(yè)應(yīng)用場景得到極大拓展,不僅傳媒行業(yè)積極展開虛擬數(shù)字人應(yīng)用探索,影視、游戲、文旅、教育等行業(yè)都在積極擁抱數(shù)字人技術(shù)。
早在本世紀(jì)初傳媒行業(yè)便開始了對虛擬數(shù)字人的應(yīng)用探索。在國外,2000年英國PA New Media公司推出了全球首位虛擬主播“安娜諾娃”(Ananova),隨后日本、韓國也先后出現(xiàn)了虛擬偶像“寺井有紀(jì)”(Yuki)、“露西雅”(Lusia)。在國內(nèi),2004年中央電視臺電影頻道上崗了國內(nèi)第一位傳媒數(shù)字人——以主持人身份亮相《光影周刊》節(jié)目的“小龍”。2018年起,隨著人工智能技術(shù)的成熟,國內(nèi)新一輪虛擬數(shù)字人應(yīng)用熱潮來臨,主流媒體成為落地虛擬數(shù)字人應(yīng)用實踐的先鋒力量。
1.廣泛落地數(shù)字人應(yīng)用實踐,積極推動數(shù)字人應(yīng)用創(chuàng)新。在過去五年里,人工智能的發(fā)展為虛擬數(shù)字人的研發(fā)、迭代和落地實踐提供了強大的技術(shù)支撐。國內(nèi)主流媒體緊跟技術(shù)發(fā)展趨勢,積極探索虛擬數(shù)字人應(yīng)用,從廣電媒體到報業(yè)集團,從中央媒體到地方媒體,各傳媒機構(gòu)紛紛投入虛擬數(shù)字人應(yīng)用探索,推出虛擬主播、虛擬記者、虛擬編輯、虛擬主持人等“數(shù)字媒體人”。虛擬數(shù)字人在主流媒體中迎來了蓬勃、繁榮的整體發(fā)展態(tài)勢。目前,國內(nèi)主流媒體的“數(shù)字員工”已經(jīng)多達數(shù)十位,其中最為知名的有央視網(wǎng)的數(shù)字小編“小C”、新華社的數(shù)字記者“小錚”、央視新媒體中心的“AI王冠”,以及浙江衛(wèi)視的“谷小雨”、北京電視臺的“時間小妮”等。其中,新華社“小錚”采用的是目前全球領(lǐng)先的實時高保真數(shù)字人技術(shù)。從高精度的超寫實數(shù)字人到著名主持人的虛擬分身,越來越多風(fēng)格、氣質(zhì)各異的虛擬數(shù)字媒體人走上崗位,成為業(yè)界認(rèn)可、大眾熟悉的傳媒新生力量。
2.聚力專業(yè)服務(wù)場景,探索多元應(yīng)用途徑。虛擬數(shù)字人主要應(yīng)用于專業(yè)服務(wù)、偶像娛樂、情感陪伴三大場景,具體應(yīng)用形式多樣,包括虛擬主持、虛擬偶像、虛擬導(dǎo)游、虛擬客服、虛擬陪護等。主流媒體的虛擬數(shù)字人應(yīng)用主要集中在專業(yè)服務(wù)場景,對偶像娛樂場景的開發(fā)呈現(xiàn)拓展之勢,但受經(jīng)費、策劃等原因限制對情感陪伴場景的涉入較少。
在專業(yè)服務(wù)場景中,主流媒體主要聚焦于虛擬主持的開發(fā)利用,虛擬數(shù)字人的主要工作是資訊播報和節(jié)目主持。聚力虛擬主持的原因主要有二:一是該類應(yīng)用符合主流媒體內(nèi)容生產(chǎn)的提質(zhì)增效需求。隨著數(shù)字人數(shù)據(jù)采集技術(shù)的進步和使用成本的下降,由虛擬數(shù)字人負(fù)責(zé)視聽內(nèi)容播報的便捷性大幅提升而門檻大幅降低。二是該類應(yīng)用能夠在運營、客戶服務(wù)、視聽內(nèi)容生產(chǎn)等各方面推動主流媒體的創(chuàng)新發(fā)展。以北京廣播電視臺的智能交互虛擬數(shù)字主持人“時間小妮”為例,目前“時間小妮”已經(jīng)從稿件、互動、大數(shù)據(jù)等各方面實現(xiàn)了與客戶端的全面API對接,具備了在客戶端進行客戶服務(wù)、資訊播報、交互問答的全智能視頻服務(wù)能力,能夠應(yīng)對不同個體在不同場景下的用戶需求。
3.業(yè)務(wù)場景引領(lǐng)能力要求,合作研發(fā)推動技術(shù)賦能。主流媒體虛擬數(shù)字員工的能力要求主要取決于其應(yīng)用場景:視聽播報場景中的虛擬主播主要負(fù)責(zé)信息播報,可以實現(xiàn)多語言播報、場景切換和一鍵換裝,但大多不具備交互能力。訪問直播場景中的虛擬主持人交互能力相對更強,對技術(shù)和內(nèi)容安全的要求也更高,工作過程中經(jīng)常需要在人工接管和AI驅(qū)動之間切換。虛擬偶像場景中的數(shù)字人需要同時具備突出的交互能力和動作能力,因此現(xiàn)階段仍以人工驅(qū)動為主,其動作生成主要來自于對真人肢體動作的采集和遷移。
在研發(fā)層面上,主流媒體自主展開虛擬數(shù)字人技術(shù)研究和實踐應(yīng)用的相對較少,這主要是因為虛擬數(shù)字人的升級迭代對人工智能的依賴非常大,與人工智能企業(yè)合作更有利于整合各方資源、加快研究進程。在與人工智能企業(yè)的合作分工中,主流媒體負(fù)責(zé)應(yīng)用場景的提供和虛擬數(shù)字人的整體運營,企業(yè)則負(fù)責(zé)提供技術(shù)保障。如新華社的“小錚”、央視網(wǎng)的“小C”便分別是主流媒體與騰訊游戲、百度智能云合作的成果。
從現(xiàn)階段的應(yīng)用實踐不難看出,當(dāng)前國內(nèi)主流媒體虛擬數(shù)字人應(yīng)用的核心痛點是應(yīng)用場景過于局限、商業(yè)模式不夠明晰以及受技術(shù)與使用成本的鉗制較大。未來,主流媒體可以從應(yīng)用場景拓展、產(chǎn)品設(shè)計升維、商業(yè)模式構(gòu)建、認(rèn)證體系完善等方面入手激發(fā)虛擬數(shù)字人的傳播潛能。
1.明晰商業(yè)運作模式,強化虛擬數(shù)字人商業(yè)變現(xiàn)能力。商業(yè)運作模式不清晰、變現(xiàn)能力不強是主流媒體虛擬數(shù)字人應(yīng)用的重大瓶頸之一。當(dāng)前,虛擬數(shù)字人,尤其是高仿真和人工智能驅(qū)動類的數(shù)字人的研發(fā)和體驗成本依然高昂,迫切的應(yīng)用需求和巨大的資金壓力讓虛擬數(shù)字人的商業(yè)變現(xiàn)問題愈加凸顯。不同于Noonoouri、Lil Miquela等在抖音、YouTube平臺上擁有超高人氣,能夠通過打賞、贊助、廣告、訂閱、平臺分成、電商帶貨等多樣化路徑實現(xiàn)大規(guī)模變現(xiàn)的虛擬網(wǎng)紅和時尚博主,虛擬數(shù)字人在主流媒體中的應(yīng)用主要集中于生產(chǎn)端提效,其營收的核心途徑是規(guī)模非常有限的新媒體廣告。為了保證虛擬數(shù)字人的研發(fā)、應(yīng)用品質(zhì)和可持續(xù)運營,主流媒體要有意識地增強虛擬數(shù)字人的“造血”能力??蓞⒄仗摂M偶像的運作模式,加強跨界運營、突破資源合作壁壘,積極探索數(shù)字藏品、非同質(zhì)化代幣等新型商業(yè)模式,加大虛擬數(shù)字人的知識產(chǎn)權(quán)開發(fā)力度,不斷拓展數(shù)字人的應(yīng)用場景和變現(xiàn)途徑。
2.緊扣數(shù)字人本質(zhì),深挖虛擬數(shù)字人應(yīng)用價值。從媒介傳播的視角來看,虛擬數(shù)字人的本質(zhì)是一種由新興數(shù)字技術(shù)所創(chuàng)造的新型軀體,對虛擬數(shù)字人的應(yīng)用是一種智能身體傳播實踐。這種傳播范式有效整合了被傳統(tǒng)大眾傳媒無意中割裂的各類人體感官,并通過對多重時間和復(fù)合空間的彌合進一步豐富了人類生存狀態(tài)。相較于傳統(tǒng)媒介,融媒體內(nèi)容生產(chǎn)的核心優(yōu)勢在于它高效促成了人類感官的再造與重組。從這個意義上看,能夠以數(shù)字化方式生動復(fù)刻人類外觀、行動、情感和智力的虛擬數(shù)字人可謂是融媒體內(nèi)容生產(chǎn)、創(chuàng)新的新高峰。隨著技術(shù),尤其是強人工智能的成熟,虛擬數(shù)字人極有可能由智能身體傳播的中介升格為傳播主體,深化主流媒體的“多域整合”進程,助力主流媒體創(chuàng)新內(nèi)容生產(chǎn),甚至扭轉(zhuǎn)主流媒體在當(dāng)前信息傳播格局中的不利位置,為主流媒體探索元宇宙多維信息傳播模式、參與構(gòu)建跨維度信息傳播格局提供強勁動力。
虛擬數(shù)字人的應(yīng)用價值來自于對人的價值的模擬仿真,而隨著人工智能技術(shù)的發(fā)展和數(shù)字人情感化設(shè)計的持續(xù)升溫,虛擬數(shù)字人的傳播價值和媒體應(yīng)用場景將大幅拓展。當(dāng)前主流媒體能夠為虛擬數(shù)字人提供的工作場景較為有限,主要集中在新聞播報方面。這主要是因為虛擬主播、虛擬主持人的應(yīng)用成本和技術(shù)要求相對較低,需要的運營支撐相對輕量。此外,在現(xiàn)有的應(yīng)用場景中,虛擬數(shù)字人的本質(zhì)是工具,其價值尚未超越場景中信息的價值。未來,虛擬數(shù)字人作為信息的價值、作為服務(wù)的作用會隨著智能技術(shù)的發(fā)展進一步凸顯,更多數(shù)字人將成為涉足“表演人”場景、“專業(yè)人”場景,在社交、表演、教育、資訊等活動中擔(dān)當(dāng)主角。
3.提升情感設(shè)計層次,突破數(shù)字人“工具”價值定位。美國認(rèn)知心理學(xué)家唐納德·諾曼認(rèn)為,情感在產(chǎn)品設(shè)計、傳播中扮演著極為重要的角色,他的《情感化設(shè)計》將產(chǎn)品的情感設(shè)計劃分為三個層次:一是本能層,即產(chǎn)品給使用者帶來的先于思考和邏輯的直觀印象;二是行為層,即產(chǎn)品與用戶的理性交互關(guān)系;三是反思層,即產(chǎn)品能夠激發(fā)使用者獨特記憶、情感共鳴并使其忠于產(chǎn)品的品牌差異性。
虛擬數(shù)字人要實現(xiàn)價值超越就必須具有交互和共情的能力,因此必須借助情感化設(shè)計來滿足受眾在本能層、行為層和反思層的使用訴求。在本能層,可以通過優(yōu)化虛擬數(shù)字人的外觀、衣著和氣質(zhì)強化其視覺吸引力,為受眾帶來更好的視覺體驗和審美享受。在行為層,要強化語音合成、自然語言理解等技術(shù)的應(yīng)用與升級,提升虛擬數(shù)字人的人機交互能力,做到“能聽、能說、能理解”。在反思層,要重點提升虛擬數(shù)字人的共情能力,一方面要借助人工智能強大虛擬數(shù)字人的情感計算中樞,幫助其識別、理解人類情感,提升交互的準(zhǔn)確性;另一方面要做好虛擬數(shù)字人的持續(xù)運營,通過人設(shè)塑造、跨界合作等方式強化其個性與才能,幫助虛擬數(shù)字人贏得大眾的信任與認(rèn)可。
4.完善數(shù)字人身份認(rèn)證體系,警惕技術(shù)濫用風(fēng)險。在積極探索虛擬數(shù)字人技術(shù)與應(yīng)用的同時,主流媒體還需要對高新技術(shù)應(yīng)用可能帶來的負(fù)面社會影響和內(nèi)容安全隱患保持警惕。技術(shù)是一把雙刃劍,能夠創(chuàng)造出仿真主播的數(shù)字人技術(shù)同樣可以被用于偽造包括政要、名人在內(nèi)的一切真實人類。對虛擬數(shù)字人的濫用,不論是政治抹黑、恐怖行動,還是色情暴力、經(jīng)濟詐騙,抑或者詆毀誹謗、虛假信息傳播等,都可能給社會造成不利影響甚至巨大災(zāi)難。具體到傳媒領(lǐng)域,考慮到媒體機構(gòu)不同于個人的巨大社會影響力,一旦媒體數(shù)字人應(yīng)用失范,將極大可能引起媒體社會信任破壞、新聞客觀性消解等重大問題。對此,主流媒體必須在虛擬數(shù)字人的應(yīng)用中始終保持人文反思與技術(shù)警惕,大力發(fā)展溯源追蹤和內(nèi)容鑒別技術(shù),逐步建立健全數(shù)字人身份認(rèn)證體系,保證虛擬數(shù)字人應(yīng)用的正當(dāng)性和內(nèi)容生產(chǎn)的安全性。
作者洪少華系新疆大學(xué)新聞與傳播學(xué)院副教授
盧曉華系新疆大學(xué)新聞與傳播學(xué)院副教授
劉洪靜系新疆大學(xué)新聞與傳播學(xué)院研究生
參考文獻
[1]孫柏林.虛擬化背景下的“數(shù)字人”[J].計算機仿真,2023(01).
[2]王瑩,梁雪媛.虛擬主體性與虛擬物質(zhì)性:論數(shù)字人形象[J].福建師范大學(xué)學(xué)報(哲學(xué)社會科學(xué)版),2022(05).
[3]郭全中.虛擬數(shù)字人發(fā)展的現(xiàn)狀、關(guān)鍵與未來[J].新聞與寫作,2022(07).
[4]譚春林.虛擬數(shù)字人用于學(xué)術(shù)期刊視頻融合出版實踐[J].編輯學(xué)報,2023(01).
[5]侯文軍,卜瑤華,劉聰林.虛擬數(shù)字人:元宇宙人際交互的技術(shù)性介質(zhì)[J].傳媒,2023(04).
[6]朱永瓊,宋章通,方浩.“文旅元宇宙”中虛擬數(shù)字人的應(yīng)用[J].傳媒,2023(03).
【編輯:朱垚穎】