章佳
近年來(lái),隨著科技發(fā)展,越來(lái)越多數(shù)字技術(shù)相關(guān)的服務(wù)和產(chǎn)品得以精準(zhǔn)落地。AI數(shù)字人的智能服務(wù)成為數(shù)實(shí)融合的“連接器”,實(shí)時(shí)3D數(shù)字建模技術(shù)讓文化遺產(chǎn)得到“數(shù)字永生”,文化消費(fèi)的空間更加豐富多維,從社會(huì)消費(fèi)端向生產(chǎn)端延伸,廣泛發(fā)揮“以數(shù)促實(shí)”的價(jià)值。這些數(shù)字技術(shù)的發(fā)展不僅支撐文化產(chǎn)業(yè)升級(jí),也以豐富的數(shù)字化場(chǎng)景促進(jìn)社會(huì)高效協(xié)作、實(shí)體產(chǎn)業(yè)轉(zhuǎn)型,助力企業(yè)降本、增效、提質(zhì)并最終走向全真互聯(lián)。
近年來(lái),隨著生成式AI(Generative AI)技術(shù)的快速發(fā)展創(chuàng)新,尤其是AI大模型和多模態(tài)AI技術(shù)的融合發(fā)展,以生成式AI為代表的AIGC技術(shù)的通用化能力和工業(yè)化水平快速提升,AIGC迎來(lái)“物種大爆發(fā)”,從語(yǔ)言文字快速擴(kuò)展到圖像、音視頻、3D場(chǎng)景等各類數(shù)字內(nèi)容。2022年,AIGC在技術(shù)進(jìn)展、商業(yè)應(yīng)用等層面都進(jìn)入新階段,其對(duì)數(shù)字內(nèi)容和社會(huì)各行各業(yè)的影響在未來(lái)幾年將持續(xù)彰顯。
《2022文化科技十大前沿應(yīng)用趨勢(shì)》(下稱報(bào)告)指出,OpenAI的DALL-E 2、Stable Diffusion、MidJourney等可以生成圖片的AIGC模型引爆了AI作畫領(lǐng)域,讓AIGC加速進(jìn)入公眾視野,各主流互聯(lián)網(wǎng)公司也紛紛推出自己的圖片、視頻生成模型。2022年11月OpenAI推出的ChatGPT模型,發(fā)布后不到一周就獲得了100萬(wàn)用戶。ChatGPT作為一個(gè)通用性的對(duì)話機(jī)器人,在與用戶交互過(guò)程中可以完成各式各樣的文本任務(wù),包括寫代碼、作詩(shī)、寫文章、提供專業(yè)知識(shí)等等。
隨著生成式AI模型的軟件開(kāi)源、API接口開(kāi)放等,越來(lái)越多的“大眾式”AI內(nèi)容生產(chǎn)工具不斷出現(xiàn),讓普通大眾可以通過(guò)AIGC參與文化藝術(shù)創(chuàng)作,這種創(chuàng)作力的大爆發(fā)將推動(dòng)創(chuàng)作主體格局改變,使文化藝術(shù)的生產(chǎn)與消費(fèi)進(jìn)一步走向大眾化,助力文化藝術(shù)的創(chuàng)新發(fā)展與普及傳承。
報(bào)告認(rèn)為,在這一趨勢(shì)下,要更加關(guān)注并妥善解決AICG可能帶來(lái)的信息內(nèi)容安全、知識(shí)產(chǎn)權(quán)保護(hù)、算法歧視和社會(huì)倫理等問(wèn)題,建立生成式AI和AIGC應(yīng)用的倫理指南,通過(guò)技術(shù)手段識(shí)別、標(biāo)記AI生成、合成內(nèi)容,打造安全、可控、可信的AIGC應(yīng)用。
近年來(lái),國(guó)際重大文體活動(dòng)成為文化科技創(chuàng)新的“孵化器”,數(shù)字孿生技術(shù)屢屢成為賽場(chǎng)“黑科技”。
一是通過(guò)虛擬仿真技術(shù)搭建文化遺產(chǎn)、景區(qū)、體育館等場(chǎng)景的“副本”,既能夠支持觀眾進(jìn)行虛擬游覽,也能對(duì)場(chǎng)景進(jìn)行可視化、實(shí)時(shí)動(dòng)態(tài)的監(jiān)測(cè)與管理。2022年卡塔爾世界杯通過(guò)數(shù)字孿生方案,為每個(gè)體育場(chǎng)都構(gòu)建了一個(gè)“3D數(shù)字孿生”,將八大賽事場(chǎng)館連接為一體,并從約4萬(wàn)個(gè)物聯(lián)網(wǎng)設(shè)備獲取實(shí)時(shí)數(shù)據(jù)?;谶@套技術(shù)方案,數(shù)字孿生統(tǒng)一指揮中心能夠?qū)崿F(xiàn)對(duì)賽場(chǎng)的實(shí)時(shí)可視化監(jiān)控、遠(yuǎn)程指揮控制,以更高的效率解決問(wèn)題、保障體育賽事的運(yùn)營(yíng)安全。
二是支持文化創(chuàng)意在仿真場(chǎng)景中進(jìn)行預(yù)演,推動(dòng)演出、賽事等內(nèi)容的制播更加高效、精準(zhǔn)。2022年,北京冬奧會(huì)首次以數(shù)字孿生的方式搭建了“VSS虛擬場(chǎng)館仿真系統(tǒng)”,支持媒體完成“線上彩排”,谷愛(ài)凌在北京首鋼滑雪大跳臺(tái)比賽時(shí),位于裁判塔的轉(zhuǎn)播機(jī)位完美記錄了她的奪冠瞬間,最終轉(zhuǎn)播實(shí)時(shí)呈現(xiàn)的效果,與轉(zhuǎn)播導(dǎo)演團(tuán)隊(duì)借助仿真系統(tǒng)設(shè)計(jì)好的效果高度一致。
2022年,工信部發(fā)布《虛擬現(xiàn)實(shí)與行業(yè)應(yīng)用融合發(fā)展行動(dòng)計(jì)劃(2022—2026年)》,提出要搭建常態(tài)化的虛擬現(xiàn)實(shí)線上演播攝制播出環(huán)境,支持沉浸式業(yè)態(tài)體驗(yàn)落地推廣。
相關(guān)技術(shù)和政策環(huán)境的日益成熟,推動(dòng)虛擬制作技術(shù)應(yīng)用提速,為視聽(tīng)節(jié)目制作帶來(lái)深遠(yuǎn)影響。
一方面,虛擬制作技術(shù)拓展了現(xiàn)實(shí)舞臺(tái)場(chǎng)景,豐富了視聽(tīng)節(jié)目的表達(dá)空間。2022年,虛擬制作被越來(lái)越多地應(yīng)用于電視臺(tái)和網(wǎng)絡(luò)節(jié)目制作中,呈現(xiàn)出多樣化的視聽(tīng)設(shè)計(jì)。2022年,河南衛(wèi)視“奇妙游”系列節(jié)目通過(guò)“5G+XR”技術(shù)實(shí)現(xiàn)舞臺(tái)與虛擬場(chǎng)景特效的結(jié)合,將河南歷史文化中最耀眼的元素與精彩的歌舞、戲曲、武術(shù)等藝術(shù)表演結(jié)合起來(lái);央視推出的《中國(guó)考古大會(huì)》節(jié)目,借助XR技術(shù)模擬考古探險(xiǎn)地面實(shí)景和空中虛擬景觀共同構(gòu)成的“魔幻場(chǎng)景”,實(shí)現(xiàn)“現(xiàn)實(shí)—考古進(jìn)行時(shí)—?dú)v史事件發(fā)生時(shí)”三重時(shí)態(tài)的舞臺(tái)轉(zhuǎn)換,以創(chuàng)造性表達(dá)的方式向觀眾還原考古探險(xiǎn)場(chǎng)景。
另一方面,虛擬制作技術(shù)增強(qiáng)了實(shí)時(shí)交互體驗(yàn),塑造了“虛擬化在場(chǎng)+實(shí)時(shí)互動(dòng)”的內(nèi)容直播效果。2022北京冬奧會(huì)賽事直播中,咪咕公司基于“5G+XR”技術(shù)打造了虛實(shí)結(jié)合的多賽同看三維直播空間,在技術(shù)上突破了傳統(tǒng)的演播廳模式,同時(shí)支持三場(chǎng)比賽直播,實(shí)現(xiàn)360度全方位自由布局與實(shí)時(shí)互動(dòng)。
2022年,社會(huì)生活與服務(wù)場(chǎng)景下的“數(shù)字人含量”實(shí)現(xiàn)爆發(fā)式增長(zhǎng)。根據(jù)市場(chǎng)分析機(jī)構(gòu)預(yù)測(cè),到2026年中國(guó)AI數(shù)字人市場(chǎng)規(guī)模將達(dá)102.4億元。
伴隨數(shù)字人生產(chǎn)效能的提升,2022年高保真數(shù)字人、超寫實(shí)數(shù)字人、AI數(shù)字人在多方向的應(yīng)用進(jìn)一步成熟,為行業(yè)效率提升、服務(wù)升級(jí)提供人性化的工具,引發(fā)了數(shù)字人社會(huì)應(yīng)用的新爆發(fā):一方面,高保真數(shù)字人、超寫實(shí)數(shù)字人提升了信息交互的沉浸感,為新聞報(bào)道、直播、綜藝等領(lǐng)域提供了創(chuàng)新業(yè)務(wù)形態(tài)、吸引年輕人的突破口。例如,新華社聯(lián)手騰訊公司NExT Studios打造的全球首位數(shù)字航天員小諍,作為超寫實(shí)數(shù)字人實(shí)現(xiàn)了逼真、細(xì)膩的外形塑造,在航天新聞報(bào)道、知識(shí)科普等領(lǐng)域和年輕人群建立溝通,成為數(shù)字人助力媒體融合的典型案例。
另一方面,AI驅(qū)動(dòng)的數(shù)字人能夠在各類場(chǎng)景提供接近真人的服務(wù),成為傳媒、文旅、金融等行業(yè)數(shù)字化轉(zhuǎn)型的“加速器”。例如,央視頻3D智能語(yǔ)音助手“央小云”首次將數(shù)字人的技術(shù)能力應(yīng)用于新聞熱點(diǎn)問(wèn)答;在企業(yè)服務(wù)領(lǐng)域,結(jié)合行業(yè)知識(shí)圖譜,數(shù)字人能夠通過(guò)不斷的自學(xué)習(xí)、自適應(yīng)提升服務(wù)能力,助力企業(yè)數(shù)字化轉(zhuǎn)型力,越來(lái)越多的“數(shù)字員工”開(kāi)始走進(jìn)千行百業(yè)。
報(bào)告指出,未來(lái),行業(yè)也需要探索建立數(shù)字人領(lǐng)域的知識(shí)產(chǎn)權(quán)保護(hù)措施,加強(qiáng)對(duì)知識(shí)產(chǎn)權(quán)、人文倫理等風(fēng)險(xiǎn)的研究和關(guān)注。
隨著掃描建模技術(shù)、引擎渲染技術(shù)、PCG(Procedural Content Generation,程序化內(nèi)容生成)等技術(shù)的進(jìn)步,文化遺產(chǎn)的3D還原走向更加精細(xì)、逼真、具有沉浸感。
2022年,3D數(shù)字建模技術(shù)為文化遺產(chǎn)的保護(hù)與傳承提供了創(chuàng)新路徑,進(jìn)一步拉近大眾與文化遺產(chǎn)之間的距離。例如,故宮和騰訊聯(lián)合主辦的“紋”以載道——故宮騰訊沉浸式數(shù)字體驗(yàn)展,向大眾展示了“故宮最大裸眼3D文物”,讓文物實(shí)現(xiàn)22倍高清放大,使用戶體驗(yàn)到實(shí)物展也難以感受的豐富細(xì)節(jié),同時(shí)打破物理空間限制,將故宮文物展覽“搬運(yùn)”到距離故宮博物院兩千余公里外的廣東深圳,實(shí)現(xiàn)了“文化+科技”的創(chuàng)新融合發(fā)展,以數(shù)字技術(shù)助力文化遺產(chǎn)煥發(fā)新的活力。
目前通過(guò)3D建模助力文化遺產(chǎn)數(shù)字化的方式,主要?dú)w為兩種:一是將現(xiàn)實(shí)世界中的文化遺產(chǎn),通過(guò)激光或者照掃的方式,制作為數(shù)字模型。目前在對(duì)精妙珍稀的小型文物進(jìn)行數(shù)字化掃描時(shí),通常使用16K高精度照掃模型制作。16K代表貼圖分辨率,數(shù)值越高,照掃出來(lái)的模型精度就越細(xì)膩。二是在3D建模軟件中建構(gòu)模型,讓已經(jīng)消失的文化遺產(chǎn)在數(shù)字世界中“復(fù)生”。借助Houdini、ZBrush、Adobe Substance等三維內(nèi)容制作軟件制作場(chǎng)景,同時(shí)可以通過(guò)PCG(程序化內(nèi)容生成)工具,利用算法來(lái)自動(dòng)生成相應(yīng)的內(nèi)容。
3D數(shù)字建模高精度超寫實(shí)還原文化遺產(chǎn),其成果可以廣泛應(yīng)用于影視、游戲、藝術(shù)設(shè)計(jì)、工業(yè)設(shè)計(jì)、廣告等領(lǐng)域,讓觀眾以更加立體和沉浸式的方式感受文化遺產(chǎn),貼近與歷史和文化的距離,并助力文化遺產(chǎn)實(shí)現(xiàn)“數(shù)字永生”。
報(bào)告指出,以游戲引擎為代表的數(shù)字交互引擎,不僅能夠支持游戲創(chuàng)意落地,也能助力實(shí)體經(jīng)濟(jì)領(lǐng)域進(jìn)行測(cè)試、演練,實(shí)現(xiàn)“以數(shù)促實(shí)”,正在成為建筑設(shè)計(jì)、汽車制造、航空航天等實(shí)體領(lǐng)域的“新型工業(yè)軟件”,為“超級(jí)數(shù)字場(chǎng)景”的構(gòu)建提供底層技術(shù)支撐。
2022年,游戲產(chǎn)業(yè)在硬件和軟件突破的加持下,向?qū)崿F(xiàn)更大規(guī)模、更流暢、更逼真的實(shí)時(shí)3D體驗(yàn)進(jìn)發(fā)。硬件層面,英偉達(dá)、AMD、Intel三家芯片巨頭均發(fā)布新一代顯卡產(chǎn)品,圖形芯片算力加速發(fā)展;軟件層面,Epic發(fā)布最新虛幻5游戲引擎,使實(shí)時(shí)3D畫面接近真實(shí)世界;終端層面,Meta等公司帶來(lái)新一代XR設(shè)備,帶動(dòng)消費(fèi)級(jí)XR產(chǎn)品銷量提升,更多用戶在虛擬世界中體驗(yàn)沉浸式視頻、直播、娛樂(lè)、社交生活。
文保場(chǎng)景中,敦煌研究院聯(lián)合騰訊推出“數(shù)字敦煌”項(xiàng)目,通過(guò)數(shù)字照掃、游戲引擎、云游戲等游戲技術(shù),毫米級(jí)高精度復(fù)現(xiàn)了敦煌藏經(jīng)洞及其百年前室藏6萬(wàn)余卷珍貴文物的盛況,生動(dòng)演繹藏經(jīng)洞及文物背后的千年文化故事。
未來(lái),各行各業(yè)的數(shù)字化轉(zhuǎn)型將產(chǎn)生更多對(duì)實(shí)時(shí)3D場(chǎng)景、沉浸式人機(jī)協(xié)作與交互的需求。以游戲引擎為代表的數(shù)字交互引擎,有望在新型終端、云邊協(xié)同等領(lǐng)域?qū)崿F(xiàn)廣泛應(yīng)用,成為更多社會(huì)需求的創(chuàng)新解決方案,助力構(gòu)建一個(gè)具有豐富價(jià)值與可能的“超級(jí)數(shù)字場(chǎng)景”。
隨著實(shí)時(shí)音視頻技術(shù)(Real-time Communication,RTC)在穩(wěn)定性和流暢性方面實(shí)現(xiàn)提升,音視頻技術(shù)融入會(huì)議、教育、電商直播等廣泛場(chǎng)景。2022年,以RTC技術(shù)為核心的遠(yuǎn)程實(shí)時(shí)操控類應(yīng)用發(fā)展迅速,并廣泛落地于生產(chǎn)作業(yè)、專業(yè)服務(wù)、大眾消費(fèi)體驗(yàn)等各類場(chǎng)景。
當(dāng)前在遠(yuǎn)程操控場(chǎng)景下,音視頻技術(shù)可以跨界應(yīng)用于多種場(chǎng)合:第一類是生產(chǎn)作業(yè)類場(chǎng)景。在高危和環(huán)境惡劣的作業(yè)場(chǎng)景下,5G和RTC技術(shù)的結(jié)合,能夠以遠(yuǎn)程操作的方式替代工作人員“在場(chǎng)作業(yè)”,將工作人員從艱苦的作業(yè)環(huán)境中解放出來(lái),轉(zhuǎn)移到安全舒適的遠(yuǎn)程端,實(shí)現(xiàn)少人化和安全作業(yè)。
第二類是專業(yè)服務(wù)類場(chǎng)景。傳統(tǒng)的實(shí)時(shí)音視頻主要是支持人與人的線上交互,而遠(yuǎn)程操控為“線上人力向線下服務(wù)”帶來(lái)了全新可能。在遠(yuǎn)程醫(yī)療領(lǐng)域,5G和RTC技術(shù)的結(jié)合能夠支持實(shí)時(shí)影像的高清、流暢傳輸,讓處于線上的醫(yī)生如同“在場(chǎng)”一般對(duì)病人進(jìn)行檢查、診斷與手術(shù)。
第三類是大眾消費(fèi)體驗(yàn)類場(chǎng)景。在5G和RTC技術(shù)的支持下,遠(yuǎn)程操控使“線上用戶體驗(yàn)線下資源”成為可能。例如在“無(wú)人機(jī)云旅游”場(chǎng)景下,用戶通過(guò)操控?zé)o人機(jī),在家就可以自由觀賞風(fēng)景、獲得旅游體驗(yàn)。
當(dāng)前技術(shù)融合的速度明顯加快,實(shí)時(shí)音視頻技術(shù)和5G、VR/AR等技術(shù)的深入融合,將使人與人、人與物、物與物實(shí)現(xiàn)更深層次、更逼真的連接,為社會(huì)協(xié)作、實(shí)時(shí)交互提供更加順暢便捷的渠道,愈發(fā)成為打破時(shí)空局限、推動(dòng)“在線”轉(zhuǎn)向“在場(chǎng)”的橋梁。