【內(nèi)容提要】2023年,大模型技術(shù)的快速發(fā)展把生成式人工智能(AIGC)推向了新的發(fā)展階段,AI技術(shù)由1.0時(shí)代正式進(jìn)入了2.0時(shí)代,而作為AIGC最具代表性的產(chǎn)物之一的“虛擬數(shù)字人”也成了各個(gè)領(lǐng)域的熱門話題。為了加快媒體數(shù)字化轉(zhuǎn)型,實(shí)現(xiàn)傳媒業(yè)向全面智能化的方向發(fā)展,2024年以來,以內(nèi)蒙古日?qǐng)?bào)社、內(nèi)蒙古廣播電視臺(tái)等為代表的區(qū)內(nèi)多家單位都對(duì)虛擬數(shù)字人技術(shù)進(jìn)行了積極探索和深入應(yīng)用。本文將對(duì)虛擬數(shù)字人技術(shù)進(jìn)行簡(jiǎn)單概述,并從內(nèi)蒙古典型代表單位的應(yīng)用現(xiàn)狀出發(fā),深入討論該技術(shù)在傳媒領(lǐng)域的驅(qū)動(dòng)力與戰(zhàn)略價(jià)值,為該技術(shù)在傳媒行業(yè)的應(yīng)用和未來發(fā)展方向提供新的視角。
【關(guān)鍵詞】數(shù)字人" 智能化" 大模型" "數(shù)字化轉(zhuǎn)型
一、引言
自2013年媒體融合被正式提出以來,通過10多年的實(shí)踐和摸索,內(nèi)蒙古的媒體融合轉(zhuǎn)型已經(jīng)向縱深推進(jìn)。近年來得益于大模型、AI等前沿技術(shù)的驅(qū)動(dòng),內(nèi)蒙古日?qǐng)?bào)社在數(shù)字化轉(zhuǎn)型進(jìn)程中又邁出了重要的一步,形成了“報(bào)+網(wǎng)+微+端+云+虛擬IP”的多終端、一體化的全媒體矩陣。[1]以內(nèi)蒙古日?qǐng)?bào)社、內(nèi)蒙古廣播電視臺(tái)為代表的傳統(tǒng)媒體紛紛因勢(shì)而謀、應(yīng)勢(shì)而動(dòng)、順勢(shì)而為,分別以“草原云”“奔騰融媒”客戶端為依托打造了各自的虛擬數(shù)字人IP,對(duì)傳統(tǒng)的內(nèi)容生產(chǎn)流程進(jìn)行了革新,重塑了區(qū)內(nèi)傳媒領(lǐng)域的品牌形象與影響力。
從特征上來看,數(shù)字人、虛擬人、虛擬數(shù)字人為依次包含關(guān)系,在沒有交互功能的時(shí)候,它們?nèi)齻€(gè)的邊界是模糊的,但如果嚴(yán)格來說的話,它們之間還有著不小的差別,簡(jiǎn)單地說數(shù)字人只要求它存在于數(shù)字世界中就可以了,可以是虛構(gòu)的,也可以是真實(shí)人物的復(fù)刻,比如明星龔俊的數(shù)字人;虛擬人則是通過計(jì)算機(jī)圖形學(xué)技術(shù)進(jìn)行虛擬制作的,在現(xiàn)實(shí)世界中并不存在;而虛擬數(shù)字人則存在于非物理世界中,通過計(jì)算機(jī)圖形學(xué)、圖形渲染、動(dòng)作捕捉、深度學(xué)習(xí)、語音合成等計(jì)算機(jī)技術(shù)創(chuàng)造出來的人物,并具有多重人類特征的綜合產(chǎn)物。[2]
虛擬數(shù)字人的通用系統(tǒng)架構(gòu)由人物形象、語音生成模塊、動(dòng)畫生成模塊、音頻合成顯示模塊、交互模塊這五個(gè)部分組成,人物形象主要分為2D和3D兩大類別,但其本質(zhì)都依托AI、高精度建模、動(dòng)態(tài)捕捉、PBR渲染、重光照4D掃描等技術(shù)來進(jìn)行建模。通過交互模塊可以分為交互型和非交互型兩種,其中交互型根據(jù)技術(shù)驅(qū)動(dòng)的維度,可分為真人驅(qū)動(dòng)和智能算法驅(qū)動(dòng)兩種;而非交互型則是依據(jù)文本或聲音來進(jìn)行驅(qū)動(dòng),由AI語音合成技術(shù)對(duì)文字或自然語言進(jìn)行分析,[3]從而來驅(qū)動(dòng)虛擬數(shù)字人的口型、表情、動(dòng)作,并合成音視頻呈現(xiàn)給用戶。
二、虛擬數(shù)字人在內(nèi)蒙古傳媒領(lǐng)域的應(yīng)用現(xiàn)狀
當(dāng)下我們正處于一個(gè)信息爆炸的時(shí)代,海量信息的瞬時(shí)涌現(xiàn)和高速更迭成為這個(gè)時(shí)代的顯著特征,在這樣的背景下,如何吸引用戶的注意力,使用戶愿意在我們呈現(xiàn)的新聞內(nèi)容前停留,成為當(dāng)前媒體行業(yè)面臨的重大挑戰(zhàn)。虛擬數(shù)字人作為一種新穎的呈現(xiàn)方式,可以在前期吸引用戶的關(guān)注,通過深度的人機(jī)交互和人機(jī)協(xié)作,在用戶中建立情感共鳴和深層次的連接。這種連接超越了簡(jiǎn)單的信息傳遞,而是經(jīng)過算法模型訓(xùn)練后,做到深刻理解用戶需求,捕捉用戶細(xì)膩的情感變化,及時(shí)響應(yīng)用戶反饋,使用戶的角色從被動(dòng)的信息接收者轉(zhuǎn)變成主動(dòng)參與,共同創(chuàng)造的一部分。用戶在這個(gè)過程中所感受到的歸屬感和參與感,正是虛擬數(shù)字人激發(fā)用戶好奇心和探索欲,持續(xù)提升用戶黏性的關(guān)鍵。而虛擬數(shù)字人的技術(shù)也已進(jìn)入了縱深發(fā)展階段,尤其是在各大主流媒體和互聯(lián)網(wǎng)大廠的布局推動(dòng)下,已形成了相對(duì)完善的產(chǎn)業(yè)鏈。其中,掌握核心技術(shù)的研發(fā)主體位于產(chǎn)業(yè)鏈上游,為虛擬數(shù)字人在傳媒領(lǐng)域落地提供了有力保障;在中游,以騰訊云、字節(jié)跳動(dòng)、百度云等為代表的各大平臺(tái)對(duì)多種技術(shù)進(jìn)行了集成,方便了數(shù)字人的應(yīng)用;在下游,作為虛擬數(shù)字人在傳媒領(lǐng)域落地的關(guān)鍵一環(huán),是以各大傳媒單位為代表的數(shù)字人運(yùn)營(yíng)方,主要負(fù)責(zé)各類數(shù)字人的內(nèi)容創(chuàng)作和生態(tài)構(gòu)建,呈現(xiàn)了虛擬數(shù)字人應(yīng)用的最終效果。[4]
在此時(shí)代背景下,如圖1所示,內(nèi)蒙古的多個(gè)地區(qū)和行業(yè)也緊跟時(shí)代步伐,實(shí)現(xiàn)了對(duì)數(shù)字人技術(shù)的探索與應(yīng)用。
2022年9月,錫林郭勒盟太仆寺旗依托二次元虛擬形象打造了首個(gè)鄉(xiāng)村振興虛擬數(shù)字人“太星人”,“她”具備電商主播和文旅宣傳推薦官的雙重身份,在多個(gè)直播和短視頻活動(dòng)中表現(xiàn)出色,直接帶動(dòng)農(nóng)產(chǎn)品銷售額超百萬元;同年12月,內(nèi)蒙古知名企業(yè)蒙牛集團(tuán)以蒙古族少女形象為基準(zhǔn)推出了超寫實(shí)虛擬數(shù)字人“奶思”,“她”精通蒙古語、漢語、英語三種語言,在電商直播、品牌宣傳等場(chǎng)景進(jìn)行了廣泛使用;2024年通遼市政務(wù)服務(wù)局上線了虛擬數(shù)字人主播“政小通”,實(shí)現(xiàn)了“真人+AI數(shù)字人主播”24小時(shí)不打烊直播服務(wù),切實(shí)搭建起與企業(yè)群眾溝通交流、咨詢幫辦的新橋梁;同年,準(zhǔn)格爾旗也推出了自己的全域一體化宣傳數(shù)字人“準(zhǔn)宣宣”,呼倫貝爾市推出了文旅數(shù)字人“呼倫”和“貝爾”,其余各地的數(shù)字人發(fā)展也進(jìn)入緊鑼密鼓的籌備之中。
而在區(qū)內(nèi)傳媒領(lǐng)域,以內(nèi)蒙古日?qǐng)?bào)社、內(nèi)蒙古廣播電視臺(tái)為代表積極開展數(shù)字人的探索和應(yīng)用。早在2019年草原云融平臺(tái)建設(shè)之初,內(nèi)蒙古日?qǐng)?bào)社就開始了對(duì)數(shù)字人的初步探索,在草原云客戶端中引入了名為“小美”的卡通數(shù)字人形象,來對(duì)客戶端新聞稿件進(jìn)行智能播報(bào),展現(xiàn)了數(shù)字人技術(shù)在新聞播報(bào)、語音合成等方面的應(yīng)用潛力。2023年,隨著ChatGPT、大模型等技術(shù)的發(fā)展,內(nèi)蒙古日?qǐng)?bào)社在之前的經(jīng)驗(yàn)之上,對(duì)虛擬數(shù)字人進(jìn)行了更深入的探索,先后考察了網(wǎng)宿科技的真人驅(qū)動(dòng)式數(shù)字人和騰訊云的AIGC數(shù)字人,多次研究論證后,于2024年初,以社內(nèi)3位優(yōu)秀主持人為原始形象進(jìn)行了形象采集,依據(jù)騰訊云平臺(tái)構(gòu)建了云小婷、云小旭、云小敬3個(gè)數(shù)字人形象,依托數(shù)字人打造了“AI云播報(bào)”“典韻傳音”“夜讀”等多個(gè)專題板塊。與此同時(shí),內(nèi)蒙古日?qǐng)?bào)社在蒙古語新聞方面也十分注重技術(shù)創(chuàng)新,打造了國(guó)內(nèi)首個(gè)蒙古語虛擬主播“小薩”。在慶祝新中國(guó)75周年華誕之際,內(nèi)蒙古日?qǐng)?bào)社依托虛擬數(shù)字人“小薩”推出重點(diǎn)策劃的報(bào)道——《傳遞草原祝福,天安門共賀祖國(guó)華誕!》。該報(bào)道采用虛擬數(shù)字人與演播室主播視頻連線互動(dòng)的形式,展現(xiàn)草原祝福、共賀祖國(guó)華誕的盛景,以跨時(shí)空對(duì)話互動(dòng)為明線,以虛擬主播“小薩”第一時(shí)間采訪蘇尼特右旗桑寶拉格蘇木巴彥烏拉嘎查熱烈歡迎受表彰的“全國(guó)民族團(tuán)結(jié)進(jìn)步模范集體”代表載譽(yù)歸來的瞬間、同時(shí)橫穿內(nèi)蒙古收集2400萬草原兒女祝福、在天安門廣場(chǎng)參加升國(guó)旗儀式、對(duì)話全國(guó)民族團(tuán)結(jié)進(jìn)步模范個(gè)人阿拉坦巴根等事件為主線,開啟了一場(chǎng)前所未有的報(bào)道之旅,展現(xiàn)了內(nèi)蒙古日?qǐng)?bào)社在AI技術(shù)應(yīng)用中的最新成果,完美地詮釋了祖國(guó)的繁榮發(fā)展和輝煌成就,實(shí)現(xiàn)了報(bào)道角度的優(yōu)勢(shì)互補(bǔ)。在內(nèi)容上呈現(xiàn)出角度的層次感與梯度感,也展現(xiàn)了內(nèi)蒙古日?qǐng)?bào)社在深入貫徹落實(shí)習(xí)近平總書記關(guān)于鑄牢中華民族共同體意識(shí)的有效落實(shí);在蒙古語AI應(yīng)用上實(shí)現(xiàn)了突破,拓寬了對(duì)內(nèi)蒙古每日新聞的即時(shí)播報(bào)和解讀的途徑,更好地宣傳了內(nèi)蒙古地區(qū)的優(yōu)秀傳統(tǒng)文化,助力了“立足全世界,宣傳內(nèi)蒙古”的主題宣傳路線,極大地提升了內(nèi)容生產(chǎn)效率,縮短了整個(gè)視頻制作周期,彌補(bǔ)了傳統(tǒng)紙媒在缺少主持人和視頻制作上的短板,也提升了用戶的體驗(yàn)和獲取新聞的及時(shí)性,創(chuàng)新探索AI技術(shù)全時(shí)段賦能媒體融合的實(shí)現(xiàn)路徑。2024年全國(guó)兩會(huì)期間,內(nèi)蒙古廣播電視臺(tái)也依據(jù)奔騰融媒客戶端,推出了AI主播“曉奔”“曉騰”,同時(shí)推出了《AI主播上兩會(huì)》系列融媒體產(chǎn)品,兩位主播穿梭多個(gè)虛擬場(chǎng)景中,帶著大家全景式觀看過去一年內(nèi)蒙古經(jīng)濟(jì)社會(huì)各方面成績(jī)和亮點(diǎn),豐富了全國(guó)兩會(huì)播報(bào)的“新聞+”應(yīng)用場(chǎng)景。[5]
三、數(shù)字人技術(shù)在新聞傳媒行業(yè)數(shù)字化轉(zhuǎn)型中的意義和價(jià)值
媒體在傳統(tǒng)的內(nèi)容生產(chǎn)模式下,視頻新聞的采集、制作和分發(fā)等環(huán)節(jié)往往需要大量的人力、物力投入,而且制作周期較長(zhǎng),同時(shí)傳統(tǒng)的新聞播報(bào)方式往往受限于主持人的個(gè)人風(fēng)格和表現(xiàn)能力。內(nèi)蒙古日?qǐng)?bào)社在新聞傳媒行業(yè)的數(shù)字化轉(zhuǎn)型中,緊跟時(shí)代主流,積極探索虛擬數(shù)字人技術(shù),以此來推動(dòng)自我轉(zhuǎn)型升級(jí),同時(shí)在內(nèi)容、形式、風(fēng)格上推陳出新,從多方向、多角度打造數(shù)字人產(chǎn)品。
第一,通過操作后臺(tái),對(duì)數(shù)字人小樣進(jìn)行簡(jiǎn)單調(diào)整,在5分鐘內(nèi)便可以制作出表情豐富和動(dòng)作流暢的視頻內(nèi)容,極大地提升了生產(chǎn)效率,縮短了視頻制作周期,也提升了用戶的體驗(yàn),塑造了傳媒領(lǐng)域通過數(shù)字人技術(shù)重建自身傳播力、引導(dǎo)力、影響力的典范,為同行業(yè)提供了有效經(jīng)驗(yàn)。
第二,創(chuàng)新了新聞表現(xiàn)形式與互動(dòng)體驗(yàn)。我們通過虛擬數(shù)字人技術(shù),積極探索它在新聞傳播中的應(yīng)用,通過數(shù)字人的使用場(chǎng)景來創(chuàng)新新聞的表現(xiàn)形式和與用戶的互動(dòng)體驗(yàn),打破空間局限性,實(shí)現(xiàn)了虛擬數(shù)字人與現(xiàn)實(shí)場(chǎng)景的無縫銜接,給用戶提供了沉浸式的場(chǎng)景體驗(yàn)。
第三,積極應(yīng)對(duì)新媒體人才短缺的挑戰(zhàn)。通過發(fā)揮數(shù)字人快速智能的獨(dú)特優(yōu)勢(shì),在視頻采集、制作、互動(dòng)、播報(bào)等多個(gè)過程中,實(shí)現(xiàn)了7×24小時(shí)的工作機(jī)制和突發(fā)新聞事件的快速響應(yīng),極大地優(yōu)化了人員配置方案,降低了對(duì)固定崗位主播的強(qiáng)依賴關(guān)系,為報(bào)社的穩(wěn)定發(fā)展提供了有力保障。
第四,數(shù)字人在幫助傳統(tǒng)媒體數(shù)字化轉(zhuǎn)型,提升媒體品牌形象、促進(jìn)品牌年輕化以及擴(kuò)大影響力上展現(xiàn)了驚人的潛力。內(nèi)蒙古日?qǐng)?bào)社以數(shù)字人為依托,打造自治區(qū)主流媒體的代表性虛擬IP,通過現(xiàn)實(shí)世界和虛擬世界的無縫銜接,打破人們對(duì)新聞內(nèi)容的固有印象,通過年輕化、時(shí)尚化、科技化的特點(diǎn)吸引年輕用戶參與進(jìn)來,拓寬新聞受眾群體的年齡跨度,讓其成為傳媒行業(yè)數(shù)字化轉(zhuǎn)型的重要推手。
第五,開辟新的商業(yè)模式與盈利空間。未來,內(nèi)蒙古日?qǐng)?bào)社將對(duì)虛擬數(shù)字人的商業(yè)價(jià)值進(jìn)行深入的挖掘和探索,通過直播活動(dòng)、品牌宣傳、助力文旅、帶動(dòng)農(nóng)產(chǎn)品銷售等方式,來實(shí)現(xiàn)價(jià)值轉(zhuǎn)換,開發(fā)數(shù)字人的周邊商品、游戲、動(dòng)漫等產(chǎn)品,將虛擬產(chǎn)品進(jìn)行現(xiàn)實(shí)轉(zhuǎn)換,把數(shù)字人打造為創(chuàng)新性營(yíng)銷手段的代表工具。
四、結(jié)語
隨著虛擬數(shù)字人技術(shù)的不斷進(jìn)步,信息傳播和交流的方式正在發(fā)生深刻變革,在這一波技術(shù)浪潮的推動(dòng)下,新聞傳媒行業(yè)的人工智能化即將成為推動(dòng)數(shù)字化轉(zhuǎn)型發(fā)展的新趨勢(shì)。而虛擬數(shù)字人技術(shù)作為人工智能在新媒體領(lǐng)域應(yīng)用的典型代表,憑借其得天獨(dú)厚的優(yōu)勢(shì),正逐步成為引領(lǐng)整個(gè)行業(yè)向數(shù)字化轉(zhuǎn)型發(fā)展的新引擎及風(fēng)向標(biāo),其加速升級(jí)迭代將會(huì)給未來行業(yè)發(fā)展帶來巨大的變革和賦能空間,不論是內(nèi)容生產(chǎn)方式上,抑或是實(shí)時(shí)新聞報(bào)道及個(gè)性化互動(dòng)體驗(yàn)等方面,都將開拓出更廣闊的可能性。
但這種變化在帶來諸多機(jī)遇的同時(shí)也引發(fā)了一系列社會(huì)問題和道德挑戰(zhàn),亟待我們深入思考數(shù)字人技術(shù)未來發(fā)展的方向。從技術(shù)的角度出發(fā),未來數(shù)字人技術(shù)應(yīng)該利用“多模態(tài)+大模型+基于人類反饋”的強(qiáng)化學(xué)習(xí)技術(shù)來提升其智能性能,通過大規(guī)模的模型訓(xùn)練,整合圖像、文本、語音、動(dòng)作等多種模態(tài)信息,數(shù)字人將實(shí)現(xiàn)更自然流暢的交互體驗(yàn)。其發(fā)展宗旨應(yīng)當(dāng)著眼于更有效地輔助人類的工作而非取代人類,它應(yīng)通過提升人類的工作效率、改善決策過程及優(yōu)化操作流程,為創(chuàng)新生產(chǎn)方式鋪路,進(jìn)而深化虛擬數(shù)字人在主流媒體的應(yīng)用,推動(dòng)主流媒體的深度改革,加快形成主流媒體的新質(zhì)生產(chǎn)力。
參考文獻(xiàn):
[1]黃淼.傳媒技術(shù):大模型浪潮席卷下的探索與調(diào)適[J].青年記者,2024,(01):16-19.
[2]李莉貞.融媒體時(shí)代數(shù)字圖像處理技術(shù)在傳媒中的應(yīng)用[J].哈爾濱職業(yè)技術(shù)學(xué)院學(xué)報(bào),2020,(05):112-114.
[3]劉建澤.從賦能到“賦魂”:虛擬數(shù)字人在傳媒領(lǐng)域的應(yīng)用現(xiàn)狀、挑戰(zhàn)及展望[J].傳媒,2024,(07):52-54.
[4]王衛(wèi)明,王淞慶.傳媒集團(tuán)數(shù)字化轉(zhuǎn)型的實(shí)踐與探索以人民日?qǐng)?bào)、江西日?qǐng)?bào)等傳媒集團(tuán)為例[J].數(shù)據(jù),2021,(08):22-24.
[5]沈浩,任天知.智能重構(gòu)傳播生態(tài):內(nèi)容生成的范式演進(jìn)與智能交互的未來構(gòu)想[J].現(xiàn)代出版,2024,(07):55-63.
作者簡(jiǎn)介:劉超,高級(jí)編輯,內(nèi)蒙古日?qǐng)?bào)社全媒體技術(shù)中心主任;張雨、尹濤迪,內(nèi)蒙古日?qǐng)?bào)社全媒體技術(shù)中心新媒體技術(shù)工程師
編輯:王洪越