袁凱
輸入寥寥數(shù)語便能生成效果炸裂的60秒視頻。近日,美國開放人工智能研究中心(OpenAI)推出的視頻生成模型Sora震驚全球。Sora的強大功能為視頻制作領(lǐng)域帶來了革命性的變革,這種高效、便捷的視頻生成方式不僅降低了視頻制作的門檻,使得更多人能夠參與到視頻創(chuàng)作中來,同時也為創(chuàng)作者提供了前所未有的創(chuàng)作空間和想象力。無論是廣告、宣傳還是娛樂領(lǐng)域,Sora都能為創(chuàng)作者帶來全新的創(chuàng)作體驗,讓他們的創(chuàng)意在一分鐘內(nèi)得到完美呈現(xiàn),視頻制作領(lǐng)域或許正在進入全新的時代。
從行業(yè)到社會,Sora模型引發(fā)了大家的廣泛討論。它有什么特點?發(fā)展趨勢如何?Sora代表的人工智能技術(shù)對社會有哪些影響?帶來了怎樣的問題和挑戰(zhàn)?怎樣才能更好地利用人工智能技術(shù)為社會發(fā)展和進步作出貢獻(xiàn)?
Sora有何本領(lǐng)?
從OpenAI發(fā)布的視頻來看,Sora生成的視頻中的主體與背景保持了高度流暢性與穩(wěn)定性,無論是場景的轉(zhuǎn)換還是物體的運動都顯得自然而協(xié)調(diào)。更令人驚嘆的是,Sora在一個視頻中實現(xiàn)了多角度鏡頭的切換,分鏡之間的過渡邏輯清晰且流暢,仿佛是由專業(yè)的攝影師精心拍攝而成。此外,Sora對于光影反射、運動方式以及鏡頭移動等細(xì)節(jié)的處理也非常到位。它能夠準(zhǔn)確地捕捉光影的微妙變化,呈現(xiàn)出逼真的場景氛圍;同時,物體運動方式非常自然,沒有任何生硬或突兀的感覺。鏡頭移動的流暢性和穩(wěn)定性更是讓人驚嘆,仿佛是由經(jīng)驗豐富的攝像師親自操作一般。
值得一提的是,在OpenAI公布的部分樣片中,Sora還展現(xiàn)了對“物理規(guī)律”超強的學(xué)習(xí)能力。無論是飄逸的毛發(fā)還是水體波紋,Sora都能根據(jù)物理原理進行呈現(xiàn),使得生成的視頻更加真實可信。這種對物理規(guī)律的學(xué)習(xí)和應(yīng)用能力,使得Sora在視頻生成領(lǐng)域具有更高的實用性和更廣泛的應(yīng)用前景。
視頻生成對于機器學(xué)習(xí)來說是一項極具挑戰(zhàn)性的任務(wù)。與圖像相比,視頻不僅包含了空間關(guān)系,還增加了時間維度,這種時空關(guān)系使得視頻生成變得更加復(fù)雜。過去,業(yè)界雖然在這方面有所嘗試,但所生成的視頻往往局限于“幾秒級”,這反映了當(dāng)時技術(shù)在這一領(lǐng)域的局限性。
如今,Sora所展現(xiàn)出的高超視頻生成能力,給許多專業(yè)攝影師帶來了巨大的沖擊?!缎】怠贰ぶ袊】稻W(wǎng)采訪了多位活躍在電影與攝影領(lǐng)域的工作者,其中一位攝影師表示:“在傳統(tǒng)的電影和攝影領(lǐng)域,攝影師們通過多年的學(xué)習(xí)和實踐,積累了豐富的經(jīng)驗和技巧。他們通過獨特的視角、精準(zhǔn)的光影控制以及精細(xì)的畫面構(gòu)圖,為觀眾呈現(xiàn)出令人震撼的視覺效果。然而,Sora的出現(xiàn),使得這些復(fù)雜的創(chuàng)作過程變得簡單而高效。或許,一個完全不懂?dāng)z影的人,就能利用Sora制作出精美的視頻畫面。”
有Sora這一利器“縱橫江湖”,從事視頻工作的人員真的要因此“失業(yè)”了嗎?對此,不少攝影師并未持有過于悲觀的看法。他們認(rèn)為,AI技術(shù)可以幫助提高生產(chǎn)效率,優(yōu)化工作流程,但人類的情感、審美、創(chuàng)意以及對復(fù)雜場景的理解和處理能力,是AI無法完全替代的。因此,在這些領(lǐng)域,人類的優(yōu)勢和價值仍然不可替代。
復(fù)旦大學(xué)新聞學(xué)院傳播學(xué)系教授鄧建國同樣認(rèn)為AI始終無法取代具有創(chuàng)造性的工作。他表示,我們要檢視自己的工作狀態(tài),自己的工作如果偏向于機器的話,就容易被機器取代。但是,如果你的工作越來越具有創(chuàng)造性,越來越能夠提供情感價值,對情商要求比較高的話,那么近期被取代的可能性會比較小。
回顧歷史,人工智能發(fā)軔于1956年。通過綜合運用機器學(xué)習(xí)、深度學(xué)習(xí)、自然語言處理等關(guān)鍵技術(shù),人工智能在數(shù)據(jù)處理、模式識別、決策推理等多個方面實現(xiàn)了自動化和智能化的飛躍。特別是在2013年,深度學(xué)習(xí)技術(shù)的突破性進展為人工智能領(lǐng)域注入了新的活力。在此后的10余年間,人工智能的場景融合能力不斷提升。可以想象,今后人工智能的應(yīng)用前景將更加廣闊。
但正如鄧建國所言:“盡管人類創(chuàng)造力的高峰已經(jīng)被Sora等人工智能技術(shù)重重包圍、步步逼近,但最高處的紅旗仍將獵獵招展、高高飄揚?!?/p>
哪些行業(yè)將受到影響?
Sora火了之后,360創(chuàng)始人周鴻祎連發(fā)6段視頻和1篇長文,指出Sora可能“顛覆廣告業(yè)、電影預(yù)告片、短視頻行業(yè),把電影工業(yè)的效率提升100倍”。
特斯拉CEO埃隆·馬斯克在Sora一條樣片下回復(fù)網(wǎng)友,“gg?humans(人類愿賭服輸)”。人工智能專家吳甘沙認(rèn)為,一圖勝千言,圖和視頻的信息傳遞損耗遠(yuǎn)低于文字,從這個意義上來看,它未來沖擊的不僅僅是視頻、電影行業(yè),也會影響書籍、知識、教育等一切信息輸出的行業(yè)。
在人工智能上又前進了一大步的Sora似乎無所不會、無所不能。其實,當(dāng)今受到Sora影響的行業(yè)遠(yuǎn)沒有那么多。業(yè)內(nèi)人士普遍認(rèn)為,目前Sora的影響還集中在短視頻制作與影視領(lǐng)域。
在短期內(nèi),文生視頻技術(shù)能夠根據(jù)給定的文字提示直接生成視頻,這將極大降低短視頻制作的綜合成本和門檻。這一變革有望解決當(dāng)前短視頻行業(yè)中“重制作而輕創(chuàng)作”的共性問題,為創(chuàng)作者提供更加便捷、高效的創(chuàng)作工具。因此,短視頻、市場營銷、動漫、社交媒體等行業(yè)將迎來新一輪的“行業(yè)洗牌”,在產(chǎn)品、成本控制、生產(chǎn)流程等維度加速與大模型的融合和轉(zhuǎn)型。這將促使行業(yè)內(nèi)的企業(yè)積極擁抱新技術(shù),探索新的商業(yè)模式和競爭優(yōu)勢。
長期來看,Sora等文生視頻技術(shù)在生成視頻長度、多角度鏡頭能力等方面的顯著優(yōu)勢,有望大幅減少實景拍攝的需求。這將為企業(yè)帶來真正的降本增效效果,促進產(chǎn)品、服務(wù)質(zhì)量的提升或模式創(chuàng)新。同時,隨著技術(shù)的不斷發(fā)展,可能會出現(xiàn)新的、空間更大的用戶生成內(nèi)容平臺,這將進一步推動文化、影視、娛樂、創(chuàng)意、游戲、教育、電商、醫(yī)療等產(chǎn)業(yè)的深刻變革。
與此同時,哪怕是在短視頻與影視行業(yè)內(nèi)部,不少人依舊心態(tài)良好。他們普遍的觀點是,市場需求和技術(shù)創(chuàng)新是推動Sora產(chǎn)業(yè)新格局的兩大核心力量。它們之間的相互作用和相互影響將推動產(chǎn)業(yè)的持續(xù)發(fā)展和創(chuàng)新,為市場帶來更多的機遇和挑戰(zhàn)。但目前,業(yè)內(nèi)更需要做的是平衡技術(shù)創(chuàng)新與市場需求的關(guān)系。
從事廣告制作的王飛(化名)告訴《小康》·中國小康網(wǎng),盡管隨著人工智能技術(shù)的不斷發(fā)展和普及,消費者對于智能化、便捷化的產(chǎn)品和服務(wù)的需求在不斷增長,但如今這種需求還不足以推動企業(yè)在技術(shù)創(chuàng)新上的投入和研發(fā)。以Sora這樣的視頻生成AI為例,市場需求的增長完全帶動不了技術(shù)的快速發(fā)展和應(yīng)用。
王飛幫許多大品牌都拍攝過廣告宣傳片。據(jù)他所言,目前能接受完全由AI生成視頻的用戶尚在少數(shù)。即便是三分鐘的片子里出現(xiàn)幾秒鐘AI素材,客戶也不會滿意?!爸饕蚴侨缃竦拇蟛糠諥I都還不如人工,AI廣告宣傳片的完成度并不高。即便采用少部分AI素材,也不能完全適配機器上拍出來的視頻?!蓖躏w坦言,“我估計至少五年里,Sora這樣的AI都不能生成任何片子?!?/p>
在市場需求和技術(shù)創(chuàng)新的共同推動下,Sora渴望形成新的格局。一方面,企業(yè)需要密切關(guān)注市場需求的變化和趨勢,及時調(diào)整自身的技術(shù)創(chuàng)新方向和策略,以滿足消費者的需求和期望;另一方面,企業(yè)也需要加大在技術(shù)創(chuàng)新上的投入和研發(fā)力度,不斷推出更加先進、高效、便捷的產(chǎn)品和服務(wù),以贏得市場的競爭優(yōu)勢。
“純粹基于好奇心的基礎(chǔ)研究雖然有其價值,但在商業(yè)化和產(chǎn)業(yè)化方面可能難以取得突破。”王飛強調(diào)。
爭議與展望
在科技領(lǐng)域,顛覆式創(chuàng)新層出不窮,如何平衡技術(shù)進步與社會安全,已經(jīng)成為各界共同關(guān)注的焦點。對于Sora這樣的多模態(tài)大模型而言,其可能帶來的倫理、版權(quán)、內(nèi)容質(zhì)量監(jiān)管等問題等也引發(fā)了廣泛的擔(dān)憂。如何在推動Sora等技術(shù)創(chuàng)新的同時,確保社會的安全和穩(wěn)定,成為了擺在我們面前的重要課題。
南開大學(xué)法學(xué)院副院長、南開大學(xué)競爭法研究中心主任陳兵認(rèn)為,Sora生成內(nèi)容在倫理層面所呈現(xiàn)的風(fēng)險主要體現(xiàn)在使用者基于不道德或違法目的輸入特定內(nèi)容,生成歧視性或不道德內(nèi)容的風(fēng)險;以及模型本身可能存在的瑕疵導(dǎo)致生成內(nèi)容不可控這兩方面。
在前種情況下,用戶隱私與數(shù)據(jù)安全問題顯得尤為突出。需要建立一套完善的用戶輸入監(jiān)管機制,通過技術(shù)手段對輸入內(nèi)容進行嚴(yán)格的篩選和過濾,確保只有符合倫理規(guī)范的內(nèi)容才能被模型處理。同時,還需要提高用戶對倫理問題的認(rèn)識,通過教育、培訓(xùn)等方式,引導(dǎo)他們以負(fù)責(zé)任的態(tài)度利用Sora等生成式人工智能技術(shù)。
針對后種情況,Sora等人工智能應(yīng)用首先需要在技術(shù)上加強對算法模型的研究和優(yōu)化。通過引入更先進的算法和技術(shù),提升模型的準(zhǔn)確性和真實性,減少生成歧視性內(nèi)容或侵權(quán)內(nèi)容的風(fēng)險。同時,模型的公平性和透明度更應(yīng)該受到關(guān)注,確保模型在處理不同用戶輸入時保持一致性,并為用戶提供可解釋的結(jié)果。
在法律與監(jiān)管方面,目前,我國在人工智能領(lǐng)域的監(jiān)管已經(jīng)取得了一定成果,構(gòu)建了多元化的監(jiān)管格局。特別是2023年7月頒布的《生成式人工智能服務(wù)管理暫行辦法》,對生成式人工智能服務(wù)進行了“分類”和“分級”監(jiān)管,明確了深度偽造服務(wù)提供者的責(zé)任等相關(guān)條例。這些規(guī)定對于規(guī)范生成式人工智能技術(shù)的應(yīng)用、保障用戶權(quán)益和防止濫用具有重要意義。
但法律的滯后性同樣體現(xiàn)在人工智能領(lǐng)域。不少法律界人士認(rèn)為,我們必須清醒地認(rèn)識到,生成式技術(shù)的發(fā)展日新月異,未來仍需進一步完善與AI相關(guān)的法律法規(guī),以適應(yīng)技術(shù)發(fā)展的新形勢和新要求。
首先,加強對生成式人工智能技術(shù)的法律研究,深入了解其技術(shù)特點、應(yīng)用場景和潛在風(fēng)險,為制定更加精準(zhǔn)有效的法律法規(guī)提供科學(xué)依據(jù)。其次,建立健全生成式人工智能技術(shù)的監(jiān)管機制,明確監(jiān)管主體、監(jiān)管對象和監(jiān)管手段,形成覆蓋全鏈條的監(jiān)管體系。同時,加強跨部門協(xié)作和信息共享,提高監(jiān)管效率和準(zhǔn)確性。再次,完善生成式人工智能技術(shù)的責(zé)任體系,明確各方在技術(shù)應(yīng)用過程中的責(zé)任和義務(wù),特別是要強化深度偽造服務(wù)提供者的責(zé)任,防止其濫用技術(shù)造成不良后果。最后,加強公眾對生成式人工智能技術(shù)的認(rèn)知和教育,提高公眾的風(fēng)險防范意識和能力,形成全社會共同參與的監(jiān)管氛圍。作為應(yīng)對生成式人工智能技術(shù)風(fēng)險挑戰(zhàn)的重要手段之一,完善立法能夠健全監(jiān)管機制、責(zé)任體系,提高公眾認(rèn)知,確保生成式人工智能技術(shù)的健康發(fā)展和社會秩序的穩(wěn)定。
總之,擁抱技術(shù)進步和確保社會安全是一個復(fù)雜而長期的任務(wù)。通過加強合作、注重實踐、完善法規(guī)和加強監(jiān)管等多方面的努力,有望實現(xiàn)二者的平衡,讓像Sora這樣的顛覆式創(chuàng)新技術(shù)為社會帶來更多的福祉和貢獻(xiàn)。