虛擬數(shù)字人在國內(nèi)主流媒體的應(yīng)用實踐與完善路徑

2023-12-20 03:12:13洪少華盧曉華劉洪靜

傳媒 2023年23期

洪少華盧曉華劉洪靜

摘要：人工智能的發(fā)展推動了虛擬數(shù)字人技術(shù)的成熟與落地，國內(nèi)主流媒體緊跟技術(shù)發(fā)展趨勢，積極探索虛擬數(shù)字人在專業(yè)服務(wù)、偶像娛樂等場景中的應(yīng)用，推出了虛擬記者、虛擬主播、虛擬主持人等一大批“數(shù)字媒體人”。針對當(dāng)前虛擬數(shù)字人在主流媒體的應(yīng)用痛點，可在拓展應(yīng)用場景、突出情感設(shè)計的同時加速構(gòu)建虛擬數(shù)字人的商業(yè)運作模式和身份認(rèn)證體系，推動虛擬數(shù)字人的更新迭代及其在主流媒體的應(yīng)用完善。

關(guān)鍵詞：虛擬數(shù)字人主流媒體人工智能

2018年5月2日，以著名主持人康輝為原型的虛擬主持人亮相央視新聞頻道《直播長江》欄目，標(biāo)志著虛擬數(shù)字人在國內(nèi)傳媒業(yè)，尤其是在主流媒體中的新一輪應(yīng)用熱潮的到來。此后，人民日報、新華社、中央廣播電視總臺、浙江衛(wèi)視、上海廣播電視臺等各級各類主流媒體相繼加入對虛擬數(shù)字人的應(yīng)用探索，先后推出了數(shù)十位由虛擬數(shù)字人擔(dān)任的記者、主播、主持人、傳媒推廣人。虛擬數(shù)字人的應(yīng)用不僅為媒體深度融合提供了動力，也加快了人機共生時代來臨的步伐。聚焦虛擬數(shù)字人在主流媒體的最新應(yīng)用動態(tài)、省思其現(xiàn)狀與問題對促進主流媒體自我革新、推動數(shù)字人技術(shù)發(fā)展進步意義重大。

一、技術(shù)發(fā)展推動虛擬數(shù)字人應(yīng)用繁榮

智能化是媒體深度融合的重要趨勢，人工智能為媒體智能化發(fā)展和全媒體傳播體系構(gòu)建提供了技術(shù)支撐，也為虛擬數(shù)字人的技術(shù)研發(fā)、落地實踐和應(yīng)用創(chuàng)新注入了新的動力。虛擬數(shù)字人在包括傳媒行業(yè)在內(nèi)的各個社會生產(chǎn)領(lǐng)域迎來了廣闊、蓬勃的發(fā)展前景。

1.“虛擬數(shù)字人”定義。“數(shù)字人”（Digital Human）指的是借助信息科學(xué)方法對人體進行虛擬仿真而得到的多層次數(shù)字模型。數(shù)字人是生命科學(xué)與信息科學(xué)碰撞、交融的產(chǎn)物，能夠從微觀到宏觀，從生理到智能，從分子、細(xì)胞、組織、到器官、整體等不同層級實現(xiàn)對人體的精確模擬。與生命科學(xué)領(lǐng)域稍有差異的是，應(yīng)用于信息傳播領(lǐng)域的數(shù)字人多指的是“虛擬數(shù)字人”（Virtual Human），即具備類人化數(shù)字外形與認(rèn)知能力、在數(shù)字虛擬環(huán)境中行使自動化代理功能的交互式虛擬人物。有別于實體機器人，虛擬數(shù)字人需要以數(shù)字顯示設(shè)備為存在載體，能夠從外觀、行為、智能等方面模擬人類，比如模擬人類的容貌、性征、語言、表情、動作，部分虛擬數(shù)字人可識別外部環(huán)境并實現(xiàn)與外界的交流互動。虛擬數(shù)字人是通往元宇宙的入口，是人工智能技術(shù)在圖形動畫領(lǐng)域的關(guān)鍵性應(yīng)用。融合了多種高新尖智能技術(shù)的虛擬數(shù)字人，在驅(qū)動社會各行業(yè)發(fā)展及拓展人類生存體驗的同時，也拉開了全新人機共生智媒時代的序幕。

2.人工智能為虛擬數(shù)字人的繁榮和升級提供技術(shù)動力。當(dāng)前，虛擬數(shù)字人仍處于技術(shù)研發(fā)和落地實踐的初期階段，業(yè)界對虛擬數(shù)字人的通用系統(tǒng)框架尚未形成統(tǒng)一定論。參考《2020年虛擬數(shù)字人發(fā)展白皮書》，虛擬數(shù)字人通用系統(tǒng)框架可初步劃分為基礎(chǔ)模塊和拓展模塊兩類，前者包含語音生成、動畫生成、人物形象和音視頻合成顯示等四大模塊，后者則主要指代交互模塊。語音生成模塊負(fù)責(zé)生成基于文本的人物語音，動畫生成模塊負(fù)責(zé)生成與人物語音匹配的人物動畫，二者共同服務(wù)于人物表達。產(chǎn)出的語音和動畫再經(jīng)由音視頻合成顯示模塊加工成視頻。人物形象模塊主要負(fù)責(zé)虛擬數(shù)字人的形象設(shè)計，如外形風(fēng)格（超寫實、寫實或卡通等）和外觀維度（2D或3D）。交互模塊則決定了虛擬數(shù)字人是否具有基于語音識別、視覺識別等智能技術(shù)的交互功能，而按照是否配備交互模塊，虛擬數(shù)字人又可劃分為交互型數(shù)字人和非交互型數(shù)字人。

自2018年起，隨著深度學(xué)習(xí)算法的快速發(fā)展，虛擬數(shù)字人，尤其是智能驅(qū)動型數(shù)字人的研發(fā)與應(yīng)用不斷取得突破，更加精細(xì)、更加智能的虛擬數(shù)字人在社會生產(chǎn)各領(lǐng)域嶄露頭角。人工智能技術(shù)從人物生成、合成顯示、分析決策等方面推動虛擬數(shù)字人應(yīng)用所依賴的關(guān)鍵技術(shù)發(fā)展成熟。同時，在制作和應(yīng)用成本大幅下降的同時，虛擬數(shù)字人的交流互動能力和虛擬仿真程度卻在不斷提升，其行業(yè)應(yīng)用場景得到極大拓展，不僅傳媒行業(yè)積極展開虛擬數(shù)字人應(yīng)用探索，影視、游戲、文旅、教育等行業(yè)都在積極擁抱數(shù)字人技術(shù)。

二、國內(nèi)主流媒體虛擬數(shù)字人應(yīng)用實踐現(xiàn)狀

早在本世紀(jì)初傳媒行業(yè)便開始了對虛擬數(shù)字人的應(yīng)用探索。在國外，2000年英國PA New Media公司推出了全球首位虛擬主播“安娜諾娃”（Ananova），隨后日本、韓國也先后出現(xiàn)了虛擬偶像“寺井有紀(jì)”（Yuki）、“露西雅”（Lusia）。在國內(nèi)，2004年中央電視臺電影頻道上崗了國內(nèi)第一位傳媒數(shù)字人——以主持人身份亮相《光影周刊》節(jié)目的“小龍”。2018年起，隨著人工智能技術(shù)的成熟，國內(nèi)新一輪虛擬數(shù)字人應(yīng)用熱潮來臨，主流媒體成為落地虛擬數(shù)字人應(yīng)用實踐的先鋒力量。

1.廣泛落地數(shù)字人應(yīng)用實踐，積極推動數(shù)字人應(yīng)用創(chuàng)新。在過去五年里，人工智能的發(fā)展為虛擬數(shù)字人的研發(fā)、迭代和落地實踐提供了強大的技術(shù)支撐。國內(nèi)主流媒體緊跟技術(shù)發(fā)展趨勢，積極探索虛擬數(shù)字人應(yīng)用，從廣電媒體到報業(yè)集團，從中央媒體到地方媒體，各傳媒機構(gòu)紛紛投入虛擬數(shù)字人應(yīng)用探索，推出虛擬主播、虛擬記者、虛擬編輯、虛擬主持人等“數(shù)字媒體人”。虛擬數(shù)字人在主流媒體中迎來了蓬勃、繁榮的整體發(fā)展態(tài)勢。目前，國內(nèi)主流媒體的“數(shù)字員工”已經(jīng)多達數(shù)十位，其中最為知名的有央視網(wǎng)的數(shù)字小編“小C”、新華社的數(shù)字記者“小錚”、央視新媒體中心的“AI王冠”，以及浙江衛(wèi)視的“谷小雨”、北京電視臺的“時間小妮”等。其中，新華社“小錚”采用的是目前全球領(lǐng)先的實時高保真數(shù)字人技術(shù)。從高精度的超寫實數(shù)字人到著名主持人的虛擬分身，越來越多風(fēng)格、氣質(zhì)各異的虛擬數(shù)字媒體人走上崗位，成為業(yè)界認(rèn)可、大眾熟悉的傳媒新生力量。

2.聚力專業(yè)服務(wù)場景，探索多元應(yīng)用途徑。虛擬數(shù)字人主要應(yīng)用于專業(yè)服務(wù)、偶像娛樂、情感陪伴三大場景，具體應(yīng)用形式多樣，包括虛擬主持、虛擬偶像、虛擬導(dǎo)游、虛擬客服、虛擬陪護等。主流媒體的虛擬數(shù)字人應(yīng)用主要集中在專業(yè)服務(wù)場景，對偶像娛樂場景的開發(fā)呈現(xiàn)拓展之勢，但受經(jīng)費、策劃等原因限制對情感陪伴場景的涉入較少。

在專業(yè)服務(wù)場景中，主流媒體主要聚焦于虛擬主持的開發(fā)利用，虛擬數(shù)字人的主要工作是資訊播報和節(jié)目主持。聚力虛擬主持的原因主要有二：一是該類應(yīng)用符合主流媒體內(nèi)容生產(chǎn)的提質(zhì)增效需求。隨著數(shù)字人數(shù)據(jù)采集技術(shù)的進步和使用成本的下降，由虛擬數(shù)字人負(fù)責(zé)視聽內(nèi)容播報的便捷性大幅提升而門檻大幅降低。二是該類應(yīng)用能夠在運營、客戶服務(wù)、視聽內(nèi)容生產(chǎn)等各方面推動主流媒體的創(chuàng)新發(fā)展。以北京廣播電視臺的智能交互虛擬數(shù)字主持人“時間小妮”為例，目前“時間小妮”已經(jīng)從稿件、互動、大數(shù)據(jù)等各方面實現(xiàn)了與客戶端的全面API對接，具備了在客戶端進行客戶服務(wù)、資訊播報、交互問答的全智能視頻服務(wù)能力，能夠應(yīng)對不同個體在不同場景下的用戶需求。

3.業(yè)務(wù)場景引領(lǐng)能力要求，合作研發(fā)推動技術(shù)賦能。主流媒體虛擬數(shù)字員工的能力要求主要取決于其應(yīng)用場景：視聽播報場景中的虛擬主播主要負(fù)責(zé)信息播報，可以實現(xiàn)多語言播報、場景切換和一鍵換裝，但大多不具備交互能力。訪問直播場景中的虛擬主持人交互能力相對更強，對技術(shù)和內(nèi)容安全的要求也更高，工作過程中經(jīng)常需要在人工接管和AI驅(qū)動之間切換。虛擬偶像場景中的數(shù)字人需要同時具備突出的交互能力和動作能力，因此現(xiàn)階段仍以人工驅(qū)動為主，其動作生成主要來自于對真人肢體動作的采集和遷移。

在研發(fā)層面上，主流媒體自主展開虛擬數(shù)字人技術(shù)研究和實踐應(yīng)用的相對較少，這主要是因為虛擬數(shù)字人的升級迭代對人工智能的依賴非常大，與人工智能企業(yè)合作更有利于整合各方資源、加快研究進程。在與人工智能企業(yè)的合作分工中，主流媒體負(fù)責(zé)應(yīng)用場景的提供和虛擬數(shù)字人的整體運營，企業(yè)則負(fù)責(zé)提供技術(shù)保障。如新華社的“小錚”、央視網(wǎng)的“小C”便分別是主流媒體與騰訊游戲、百度智能云合作的成果。

三、國內(nèi)主流媒體虛擬數(shù)字人應(yīng)用完善路徑

從現(xiàn)階段的應(yīng)用實踐不難看出，當(dāng)前國內(nèi)主流媒體虛擬數(shù)字人應(yīng)用的核心痛點是應(yīng)用場景過于局限、商業(yè)模式不夠明晰以及受技術(shù)與使用成本的鉗制較大。未來，主流媒體可以從應(yīng)用場景拓展、產(chǎn)品設(shè)計升維、商業(yè)模式構(gòu)建、認(rèn)證體系完善等方面入手激發(fā)虛擬數(shù)字人的傳播潛能。

1.明晰商業(yè)運作模式，強化虛擬數(shù)字人商業(yè)變現(xiàn)能力。商業(yè)運作模式不清晰、變現(xiàn)能力不強是主流媒體虛擬數(shù)字人應(yīng)用的重大瓶頸之一。當(dāng)前，虛擬數(shù)字人，尤其是高仿真和人工智能驅(qū)動類的數(shù)字人的研發(fā)和體驗成本依然高昂，迫切的應(yīng)用需求和巨大的資金壓力讓虛擬數(shù)字人的商業(yè)變現(xiàn)問題愈加凸顯。不同于Noonoouri、Lil Miquela等在抖音、YouTube平臺上擁有超高人氣，能夠通過打賞、贊助、廣告、訂閱、平臺分成、電商帶貨等多樣化路徑實現(xiàn)大規(guī)模變現(xiàn)的虛擬網(wǎng)紅和時尚博主，虛擬數(shù)字人在主流媒體中的應(yīng)用主要集中于生產(chǎn)端提效，其營收的核心途徑是規(guī)模非常有限的新媒體廣告。為了保證虛擬數(shù)字人的研發(fā)、應(yīng)用品質(zhì)和可持續(xù)運營，主流媒體要有意識地增強虛擬數(shù)字人的“造血”能力?？蓞⒄仗摂M偶像的運作模式，加強跨界運營、突破資源合作壁壘，積極探索數(shù)字藏品、非同質(zhì)化代幣等新型商業(yè)模式，加大虛擬數(shù)字人的知識產(chǎn)權(quán)開發(fā)力度，不斷拓展數(shù)字人的應(yīng)用場景和變現(xiàn)途徑。

2.緊扣數(shù)字人本質(zhì)，深挖虛擬數(shù)字人應(yīng)用價值。從媒介傳播的視角來看，虛擬數(shù)字人的本質(zhì)是一種由新興數(shù)字技術(shù)所創(chuàng)造的新型軀體，對虛擬數(shù)字人的應(yīng)用是一種智能身體傳播實踐。這種傳播范式有效整合了被傳統(tǒng)大眾傳媒無意中割裂的各類人體感官，并通過對多重時間和復(fù)合空間的彌合進一步豐富了人類生存狀態(tài)。相較于傳統(tǒng)媒介，融媒體內(nèi)容生產(chǎn)的核心優(yōu)勢在于它高效促成了人類感官的再造與重組。從這個意義上看，能夠以數(shù)字化方式生動復(fù)刻人類外觀、行動、情感和智力的虛擬數(shù)字人可謂是融媒體內(nèi)容生產(chǎn)、創(chuàng)新的新高峰。隨著技術(shù)，尤其是強人工智能的成熟，虛擬數(shù)字人極有可能由智能身體傳播的中介升格為傳播主體，深化主流媒體的“多域整合”進程，助力主流媒體創(chuàng)新內(nèi)容生產(chǎn)，甚至扭轉(zhuǎn)主流媒體在當(dāng)前信息傳播格局中的不利位置，為主流媒體探索元宇宙多維信息傳播模式、參與構(gòu)建跨維度信息傳播格局提供強勁動力。

虛擬數(shù)字人的應(yīng)用價值來自于對人的價值的模擬仿真，而隨著人工智能技術(shù)的發(fā)展和數(shù)字人情感化設(shè)計的持續(xù)升溫，虛擬數(shù)字人的傳播價值和媒體應(yīng)用場景將大幅拓展。當(dāng)前主流媒體能夠為虛擬數(shù)字人提供的工作場景較為有限，主要集中在新聞播報方面。這主要是因為虛擬主播、虛擬主持人的應(yīng)用成本和技術(shù)要求相對較低，需要的運營支撐相對輕量。此外，在現(xiàn)有的應(yīng)用場景中，虛擬數(shù)字人的本質(zhì)是工具，其價值尚未超越場景中信息的價值。未來，虛擬數(shù)字人作為信息的價值、作為服務(wù)的作用會隨著智能技術(shù)的發(fā)展進一步凸顯，更多數(shù)字人將成為涉足“表演人”場景、“專業(yè)人”場景，在社交、表演、教育、資訊等活動中擔(dān)當(dāng)主角。

3.提升情感設(shè)計層次，突破數(shù)字人“工具”價值定位。美國認(rèn)知心理學(xué)家唐納德·諾曼認(rèn)為，情感在產(chǎn)品設(shè)計、傳播中扮演著極為重要的角色，他的《情感化設(shè)計》將產(chǎn)品的情感設(shè)計劃分為三個層次：一是本能層，即產(chǎn)品給使用者帶來的先于思考和邏輯的直觀印象；二是行為層，即產(chǎn)品與用戶的理性交互關(guān)系；三是反思層，即產(chǎn)品能夠激發(fā)使用者獨特記憶、情感共鳴并使其忠于產(chǎn)品的品牌差異性。

虛擬數(shù)字人要實現(xiàn)價值超越就必須具有交互和共情的能力，因此必須借助情感化設(shè)計來滿足受眾在本能層、行為層和反思層的使用訴求。在本能層，可以通過優(yōu)化虛擬數(shù)字人的外觀、衣著和氣質(zhì)強化其視覺吸引力，為受眾帶來更好的視覺體驗和審美享受。在行為層，要強化語音合成、自然語言理解等技術(shù)的應(yīng)用與升級，提升虛擬數(shù)字人的人機交互能力，做到“能聽、能說、能理解”。在反思層，要重點提升虛擬數(shù)字人的共情能力，一方面要借助人工智能強大虛擬數(shù)字人的情感計算中樞，幫助其識別、理解人類情感，提升交互的準(zhǔn)確性；另一方面要做好虛擬數(shù)字人的持續(xù)運營，通過人設(shè)塑造、跨界合作等方式強化其個性與才能，幫助虛擬數(shù)字人贏得大眾的信任與認(rèn)可。

4.完善數(shù)字人身份認(rèn)證體系，警惕技術(shù)濫用風(fēng)險。在積極探索虛擬數(shù)字人技術(shù)與應(yīng)用的同時，主流媒體還需要對高新技術(shù)應(yīng)用可能帶來的負(fù)面社會影響和內(nèi)容安全隱患保持警惕。技術(shù)是一把雙刃劍，能夠創(chuàng)造出仿真主播的數(shù)字人技術(shù)同樣可以被用于偽造包括政要、名人在內(nèi)的一切真實人類。對虛擬數(shù)字人的濫用，不論是政治抹黑、恐怖行動，還是色情暴力、經(jīng)濟詐騙，抑或者詆毀誹謗、虛假信息傳播等，都可能給社會造成不利影響甚至巨大災(zāi)難。具體到傳媒領(lǐng)域，考慮到媒體機構(gòu)不同于個人的巨大社會影響力，一旦媒體數(shù)字人應(yīng)用失范，將極大可能引起媒體社會信任破壞、新聞客觀性消解等重大問題。對此，主流媒體必須在虛擬數(shù)字人的應(yīng)用中始終保持人文反思與技術(shù)警惕，大力發(fā)展溯源追蹤和內(nèi)容鑒別技術(shù)，逐步建立健全數(shù)字人身份認(rèn)證體系，保證虛擬數(shù)字人應(yīng)用的正當(dāng)性和內(nèi)容生產(chǎn)的安全性。

作者洪少華系新疆大學(xué)新聞與傳播學(xué)院副教授

盧曉華系新疆大學(xué)新聞與傳播學(xué)院副教授

劉洪靜系新疆大學(xué)新聞與傳播學(xué)院研究生

參考文獻

[1]孫柏林.虛擬化背景下的“數(shù)字人”[J].計算機仿真，2023（01）.

[2]王瑩，梁雪媛.虛擬主體性與虛擬物質(zhì)性：論數(shù)字人形象[J].福建師范大學(xué)學(xué)報（哲學(xué)社會科學(xué)版），2022（05）.

[3]郭全中.虛擬數(shù)字人發(fā)展的現(xiàn)狀、關(guān)鍵與未來[J].新聞與寫作，2022（07）.

[4]譚春林.虛擬數(shù)字人用于學(xué)術(shù)期刊視頻融合出版實踐[J].編輯學(xué)報，2023（01）.

[5]侯文軍，卜瑤華，劉聰林.虛擬數(shù)字人：元宇宙人際交互的技術(shù)性介質(zhì)[J].傳媒，2023（04）.

[6]朱永瓊，宋章通，方浩.“文旅元宇宙”中虛擬數(shù)字人的應(yīng)用[J].傳媒，2023（03）.

【編輯：朱垚穎】

虛擬數(shù)字人在國內(nèi)主流媒體的應(yīng)用實踐與完善路徑

一、技術(shù)發(fā)展推動虛擬數(shù)字人應(yīng)用繁榮

二、國內(nèi)主流媒體虛擬數(shù)字人應(yīng)用實踐現(xiàn)狀

三、國內(nèi)主流媒體虛擬數(shù)字人應(yīng)用完善路徑

一、技術(shù)發(fā)展推動虛擬數(shù)字人應(yīng)用繁榮

二、國內(nèi)主流媒體虛擬數(shù)字人應(yīng)用實踐現(xiàn)狀

三、國內(nèi)主流媒體虛擬數(shù)字人應(yīng)用完善路徑