所謂大模型,是指將海量數(shù)據(jù)導(dǎo)入具有億量級(jí)參數(shù)的深度學(xué)習(xí)模型,由機(jī)器學(xué)習(xí)數(shù)據(jù)中蘊(yùn)含的特征、結(jié)構(gòu),最終模型被訓(xùn)練成具有邏輯推理和分析能力的人工智能。簡(jiǎn)單地說(shuō),大模型具有人一樣的對(duì)話能力,能夠理解人的意思,根據(jù)對(duì)語(yǔ)言的理解、生成圖像、視頻等。目前,以ChatGPT為代表的大語(yǔ)言模型應(yīng)用成為互聯(lián)網(wǎng)空間新生態(tài),開(kāi)放域多輪對(duì)話與生成式技術(shù)突破帶來(lái)傳播研究新變化。我們從三個(gè)方面來(lái)看,首先是大模型的技術(shù)突破,其次是大模型如何改變影像的生產(chǎn)方式,最后是人類(lèi)在這一過(guò)程中還能發(fā)揮怎樣的作用。
一、大模型技術(shù)在人機(jī)關(guān)系中突破了什么?
大模型給我們帶來(lái)了什么?大模型技術(shù)突破的核心在于語(yǔ)言處理能力的飛躍,像 ChatGPT 由單輪對(duì)話突破到多輪對(duì)話,這就是整個(gè)大語(yǔ)言模型帶來(lái)的巨大技術(shù)突破。過(guò)去,人工智能在進(jìn)行人機(jī)對(duì)話時(shí),主要依賴(lài)匹配法,機(jī)器無(wú)法真正理解人類(lèi)語(yǔ)言深層含義。例如,當(dāng)詢(xún)問(wèn)機(jī)器是否了解成龍時(shí),機(jī)器能夠給出肯定回答,但進(jìn)一步詢(xún)問(wèn)關(guān)于成龍的兒子時(shí),機(jī)器便無(wú)法回應(yīng)。這顯示了機(jī)器在理解人類(lèi)語(yǔ)言方面的局限性。
但是,當(dāng)2022年年底ChatGPT出現(xiàn)以后,機(jī)器具備了交互能力,實(shí)現(xiàn)了多輪對(duì)話功能。這意味著機(jī)器有了類(lèi)似人類(lèi)的語(yǔ)言能力,人類(lèi)文明發(fā)展的關(guān)鍵就是語(yǔ)言,這才是最核心的點(diǎn)。我們?cè)?021年對(duì)語(yǔ)言處理技術(shù)進(jìn)行過(guò)深入探討時(shí),當(dāng)時(shí)很多人認(rèn)為,對(duì)話是機(jī)器難以逾越的障礙。然而,ChatGPT的出現(xiàn)卻讓我們看到了機(jī)器在多人對(duì)話方面的巨大潛力。
大模型發(fā)展呈現(xiàn)多模態(tài)發(fā)展模式。多模態(tài)是指不同類(lèi)型信息模式同時(shí)被利用,如文字、圖像、聲音等。過(guò)去,我們的傳媒產(chǎn)業(yè)都是按單模態(tài)來(lái)布局,如今,大模型技術(shù)發(fā)展,Sora等平臺(tái)出現(xiàn),為我們帶來(lái)了多模態(tài)發(fā)展的可能性。一個(gè)對(duì)話成為一個(gè)平臺(tái),這是影像生產(chǎn)、傳媒變革的趨勢(shì),是單模態(tài)變?yōu)槎嗄B(tài)的發(fā)展。大模型推動(dòng)了跨語(yǔ)言發(fā)展。我們以前經(jīng)常會(huì)提及“地球村”概念,但在互聯(lián)網(wǎng)時(shí)代,不同語(yǔ)言之間是一個(gè)網(wǎng)絡(luò),如日語(yǔ)、阿拉伯語(yǔ)與漢語(yǔ)不是互通的,但是大模型會(huì)打破其邊界,使全人類(lèi)能夠共同參與某一個(gè)內(nèi)容的生產(chǎn)。這一變革意味著人工智能技術(shù)從簡(jiǎn)單模仿向更復(fù)雜、更全面的方向發(fā)展,從原本的鸚鵡學(xué)舌進(jìn)化為真正具有語(yǔ)言和多模態(tài)能力的人類(lèi)智慧。
二、 大模型時(shí)代的影像生產(chǎn)方式會(huì)發(fā)生什么變化?
大眾時(shí)代是點(diǎn)到面的中心化傳播,隨后,我們進(jìn)入了分布式網(wǎng)絡(luò)結(jié)構(gòu),即社交媒體的網(wǎng)狀形態(tài),信息從A到B到C到D傳遞。進(jìn)入大模型時(shí)代,我們?cè)俣然氐街行幕?,即所有人通過(guò)大模型進(jìn)行對(duì)話。在這一過(guò)程中,所有人生產(chǎn)的內(nèi)容構(gòu)成了大眾生產(chǎn)的大模型內(nèi)容。由于大模型基于無(wú)數(shù)人類(lèi)的大數(shù)據(jù)生成,實(shí)質(zhì)上是個(gè)體與大眾的對(duì)話,也構(gòu)成了一種新型人際關(guān)系。
大模型為我們帶來(lái)了新的人際關(guān)系,人機(jī)對(duì)話變成了個(gè)體與眾人的對(duì)話。首先,最為明顯的變化體現(xiàn)在創(chuàng)意領(lǐng)域。個(gè)體創(chuàng)意已經(jīng)不再是唯一,而是與機(jī)器、眾人的創(chuàng)意相互交織。如之前所提及的案例所示,許多原本需要個(gè)體投入大量思考和創(chuàng)意的生產(chǎn)任務(wù),現(xiàn)在可以由機(jī)器輔助甚至完全取代。無(wú)論是文本創(chuàng)作,還是視頻制作,這種變革已經(jīng)悄然發(fā)生。
其次是制作方式的改變,人的生產(chǎn)變?yōu)闄C(jī)器參與的生產(chǎn)。例如,在音樂(lè)方面,我們只要輸入指令,便可通過(guò)機(jī)器自動(dòng)生成作品。
第三是影像生產(chǎn)機(jī)制在發(fā)生改變,傳統(tǒng)團(tuán)隊(duì)協(xié)作方式正在被個(gè)體行為所替代。我們以往要制作一部影片,需要有很多團(tuán)隊(duì)相互協(xié)作;現(xiàn)今,個(gè)體便能夠獨(dú)立完成這些工作,無(wú)須再依賴(lài)團(tuán)隊(duì)協(xié)作。這對(duì)整體影像產(chǎn)業(yè)產(chǎn)生巨大影響,有些工作或者工種有可能會(huì)被機(jī)器替代。在這樣的轉(zhuǎn)變之下,我們不得不思考:人在影像產(chǎn)業(yè)中還能扮演什么角色?
三、大模型時(shí)代下人類(lèi)還能做什么?
在影像制作領(lǐng)域,我們發(fā)現(xiàn)其核心主要依賴(lài)人類(lèi)的創(chuàng)意、構(gòu)思與制作,這種生產(chǎn)方式,已經(jīng)沿襲了數(shù)十年。然而,大模型時(shí)代,機(jī)器創(chuàng)意與機(jī)器制作已逐漸變?yōu)楝F(xiàn)實(shí)。那么,在這樣的變革下,人類(lèi)角色發(fā)生了怎樣的轉(zhuǎn)變?其實(shí),無(wú)論技術(shù)怎么發(fā)展,它依然需要依靠人的想法和選擇。這也為我們提供了一個(gè)巨大發(fā)展機(jī)會(huì),那就是提示工程,這一領(lǐng)域需要大量的人力投入。例如,從去年開(kāi)始,北師大傳播學(xué)院就開(kāi)始訓(xùn)練學(xué)生如何進(jìn)行提示工程,如何在現(xiàn)有模型基礎(chǔ)上開(kāi)發(fā)新技術(shù)。這正是人類(lèi)強(qiáng)項(xiàng)所在。我們可以根據(jù)自己的需求和創(chuàng)意來(lái)制定提示詞,從而推動(dòng)提示工程發(fā)展,所以“人的想法”很重要。
再就是人的選擇,在創(chuàng)作大量圖片時(shí),個(gè)人審美和選擇能力將直接影響作品質(zhì)量。每個(gè)人的選擇都是不同的,選擇能力決定了作品的水平高低。在今后的工作中,在創(chuàng)意和生產(chǎn)環(huán)節(jié)中的工作逐漸被大模型分流和取代的情況下,我們將更加注重提示工程和審美選擇工程的發(fā)展,以適應(yīng)大模型時(shí)代的發(fā)展需求和挑戰(zhàn)。同時(shí),我們需要關(guān)注這一技術(shù)對(duì)社會(huì)、經(jīng)濟(jì)、文化等方面的影響,制定相應(yīng)措施和政策,確保大模型技術(shù)健康發(fā)展。W
(本文整理自2024年第十一屆中國(guó)網(wǎng)絡(luò)視聽(tīng)大會(huì)發(fā)言。作者張洪忠系北京師范大學(xué)新聞傳播學(xué)院院長(zhǎng),北京師范大學(xué)新媒體傳播研究中心主任、教授)