魏珍珍 周鈿
摘要:隨著人工智能(Artificial Intelligence,AI)的快速發(fā)展,其在繪畫方面的應(yīng)用愈加廣泛。文章分析現(xiàn)有AI繪畫工具,探討其技術(shù)發(fā)展、局限性與發(fā)展趨勢(shì),分析其與藝術(shù)的差異和相關(guān)道德性,從而引導(dǎo)創(chuàng)作者正確看待和利用AI繪畫。
關(guān)鍵詞:人工智能技術(shù);AI繪畫;計(jì)算機(jī)視覺(jué);藝術(shù)創(chuàng)作工具
中圖分類號(hào):TP18;J204 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1004-9436(2023)02-0-03
人類對(duì)生活情感的記錄和表達(dá)是本性,而科技的發(fā)展一直影響著人類看待世界的方式。近年來(lái),人工智能技術(shù)不斷更新迭代,吸引了大量藝術(shù)家的關(guān)注,相關(guān)研究者也開(kāi)始探索人工智能技術(shù)在藝術(shù)創(chuàng)作方面的應(yīng)用。此外,藝術(shù)展示場(chǎng)所出現(xiàn)的人工智能藝術(shù)創(chuàng)作產(chǎn)品,其是否稱得上是藝術(shù)品,各種觀點(diǎn)也層出不窮,吸引著人們對(duì)AI繪畫這一新興技術(shù)和藝術(shù)相結(jié)合的產(chǎn)物展開(kāi)理論和實(shí)踐方面的討論。本文主要介紹AI圖像生成的技術(shù)發(fā)展與當(dāng)前存在的局限性,并分析未來(lái)AI繪畫的發(fā)展趨勢(shì),希望在此基礎(chǔ)上引導(dǎo)創(chuàng)作者正確看待和利用AI繪畫。
1 智能圖像的生成與藝術(shù)特性
本文所探討的AI繪畫,主要針對(duì)的是基于機(jī)器學(xué)習(xí)模型進(jìn)行自動(dòng)數(shù)字繪圖的計(jì)算機(jī)程序。AI繪畫良好的創(chuàng)作能力來(lái)源于神經(jīng)網(wǎng)絡(luò)的發(fā)展,即通過(guò)神經(jīng)網(wǎng)絡(luò)的計(jì)算,不斷縮小需求輸入與期望輸出的差距。目前的AI生成技術(shù)主要由三個(gè)神經(jīng)網(wǎng)絡(luò)相互組合搭建而成,一是文本轉(zhuǎn)換網(wǎng)絡(luò),將輸入的提示語(yǔ)轉(zhuǎn)化成網(wǎng)絡(luò)能夠理解的字符串;二是生成網(wǎng)絡(luò),收到文本后,與內(nèi)部數(shù)據(jù)庫(kù)進(jìn)行匹配,衡量各字符串的權(quán)重,模擬計(jì)算后輸出匹配圖像;三是放大網(wǎng)絡(luò),將輸出的圖像清晰化,得到符合現(xiàn)階段分辨率限制的圖像。經(jīng)過(guò)大量研究證明,以上生成式AI模型在訓(xùn)練成本和出圖效果上都有比較理想的成績(jī)。
1.1 智能圖像生成的技術(shù)發(fā)展
AI繪畫創(chuàng)作在過(guò)去10年中發(fā)展迅速,其中不乏出現(xiàn)了一些重要的技術(shù)里程碑。例如,GAN的技術(shù)創(chuàng)新對(duì)當(dāng)前人工智能藝術(shù)運(yùn)動(dòng)的興起作出了重大貢獻(xiàn)。2012年,一些計(jì)算機(jī)學(xué)者通過(guò)神經(jīng)網(wǎng)絡(luò)GAN進(jìn)行上萬(wàn)張圖片的模型訓(xùn)練,最終生成了一個(gè)非常模糊的貓臉,人們認(rèn)識(shí)到可以通過(guò)計(jì)算機(jī)生成圖像,這成為人工智能與藝術(shù)相接的轉(zhuǎn)折點(diǎn)。將輸入字符串生成的圖像與真實(shí)樣本進(jìn)行對(duì)比,經(jīng)過(guò)多次循環(huán)后得到的圖像會(huì)越來(lái)越接近輸入文本需求。該框架的實(shí)現(xiàn)使得各種類型的圖像內(nèi)容生成取得了令人印象深刻的結(jié)果,很快成為人工智能最重要的研究領(lǐng)域之一,并且出現(xiàn)了許多高級(jí)和特定領(lǐng)域的原始架構(gòu)變體,如CycleGAN(循環(huán)生成對(duì)抗網(wǎng)絡(luò))、StyleGAN(風(fēng)格生成對(duì)抗網(wǎng)絡(luò))和BigGAN(龐大生成對(duì)抗網(wǎng)絡(luò))等智能圖像生成軟件。
2015年,Mordvintsev(莫爾德溫采夫)等人使用DeepDreams(深度夢(mèng)想),通過(guò)可視化和最大化神經(jīng)元激活的模式來(lái)提高深度CNN(卷積神經(jīng)網(wǎng)絡(luò))的可解釋性。隨著計(jì)算機(jī)圖形學(xué)和計(jì)算機(jī)視覺(jué)研究的不斷深入,深度神經(jīng)網(wǎng)絡(luò)與手工繪畫相結(jié)合,開(kāi)發(fā)了許多渲染和紋理合成算法。其中包括將“繪畫風(fēng)格”應(yīng)用于圖像生成過(guò)程,在輸出時(shí)可以選擇水彩或素描風(fēng)格的融入。而促使藝術(shù)人工智能技術(shù)快速發(fā)展的最具標(biāo)志性的人工智能發(fā)明之一則是NST(神經(jīng)風(fēng)格遷移),這種方法由Gatys(加茨比)等人在工作中引入,計(jì)算機(jī)將生成圖像的“內(nèi)容”簡(jiǎn)單理解為可識(shí)別的相關(guān)物體,將“風(fēng)格”直接理解為一種美學(xué)上令人愉悅或有趣的視覺(jué)偏差,通過(guò)分離與組合圖像“內(nèi)容”和“風(fēng)格”,證明了CNN在創(chuàng)建風(fēng)格化圖像方面的成功。盡管NST方法代表了自動(dòng)圖像處理領(lǐng)域中一項(xiàng)非常有趣的技術(shù)貢獻(xiàn),但使用NST方法生成的程式化圖像通常表現(xiàn)為有圖像輸入的明顯組合,而不是原創(chuàng)和獨(dú)特的藝術(shù)創(chuàng)作。
綜上所述,人工智能繪畫有諸多優(yōu)點(diǎn)。第一,數(shù)據(jù)庫(kù)龐大,既囊括了不同時(shí)期不同風(fēng)格畫家的作品,又存儲(chǔ)了使用者依據(jù)AI創(chuàng)作的繪畫作品。第二,使用AI輸出繪畫作品,效率高且操作簡(jiǎn)便,哪怕是之前沒(méi)有基礎(chǔ)的使用者,在經(jīng)過(guò)指南操作和基礎(chǔ)練習(xí)后也能達(dá)到正常使用的水平。
1.2 AI繪畫的技術(shù)現(xiàn)狀與局限性
如今,AI繪畫模型正在以前所未有的速度爆發(fā)性增長(zhǎng)。2022年8月22號(hào),Stable Diffusion宣布開(kāi)源,不僅是程序,還包括訓(xùn)練好的模型。它是目前水平最高的繪畫AI之一,它的開(kāi)源意味著接下來(lái)會(huì)有很多包裝stable fusion(穩(wěn)定融合)內(nèi)核的產(chǎn)品出現(xiàn),這是一個(gè)指數(shù)型增長(zhǎng)的開(kāi)始。同年10月,能夠自動(dòng)續(xù)寫小說(shuō)的AI工具Novel AI Diffusion(新型人工智能擴(kuò)散)將它的配圖功能單獨(dú)工具化,這是目前最成功的能夠進(jìn)行動(dòng)漫風(fēng)格繪畫的AI生成器,能夠根據(jù)提示詞輸出想要的角色,同時(shí)還具有干凈漂亮的線條。但是,Novel AI生成的圖比以往任何一個(gè)AI生成的圖的拼貼感都強(qiáng),甚至能比對(duì)上原圖,在網(wǎng)上飽受爭(zhēng)議,主要原因有兩點(diǎn):第一,Novel AI使用了爭(zhēng)議極大的數(shù)據(jù)源Danbooru(丹布魯),這個(gè)數(shù)據(jù)源本身存在大量無(wú)授權(quán)的圖片;第二,Novel AI的計(jì)算沒(méi)有對(duì)輸出模型進(jìn)行對(duì)比檢查,通常導(dǎo)致“過(guò)擬合”問(wèn)題。雖然Diffusion(擴(kuò)散)的技術(shù)原理本質(zhì)上并不是縫合拼貼,但是基于以上原因,在結(jié)果上確實(shí)會(huì)出現(xiàn)和原作者過(guò)度雷同從而引發(fā)抄襲和侵權(quán)的風(fēng)險(xiǎn),Novel AI就是最好的例子。
雖然AI的功能令人驚嘆,但目前仍然存在很大的發(fā)展空間,主要受制于算法的發(fā)展。第一,AI繪畫過(guò)度依賴訓(xùn)練數(shù)據(jù)?,F(xiàn)有的計(jì)算僅局限于數(shù)據(jù)庫(kù)中已導(dǎo)入的圖像或者藝術(shù)數(shù)據(jù),導(dǎo)致目前的AI繪畫只是對(duì)過(guò)去一段時(shí)期的藝術(shù)整合,并沒(méi)有實(shí)時(shí)跟進(jìn)藝術(shù)的發(fā)展。第二,AI所能理解的提示詞有限,以繪畫風(fēng)格和繪畫內(nèi)容為主,且無(wú)法繪制文字作品,當(dāng)輸入詞涉及語(yǔ)義邏輯時(shí)會(huì)難以計(jì)算。第三,AI繪畫不具系列性,在同一AI繪畫軟件上輸入類似的文本,AI會(huì)重新進(jìn)行計(jì)算而無(wú)法得到與之前相互關(guān)聯(lián)的同系列輸出圖像,因此,AI繪畫輸出的是一張張獨(dú)立圖像,難以進(jìn)行同系列的創(chuàng)作。
不僅在繪畫領(lǐng)域,AI也在其他領(lǐng)域同樣得到了快速發(fā)展和廣泛應(yīng)用。例如,工業(yè)領(lǐng)域在大力發(fā)展智能語(yǔ)音識(shí)別技術(shù),對(duì)人們?nèi)粘W匀徽Z(yǔ)言進(jìn)行理解與轉(zhuǎn)化;互聯(lián)網(wǎng)領(lǐng)域在發(fā)展拍照識(shí)物和尋找類似物品的程序;科研領(lǐng)域在不斷進(jìn)行類似結(jié)果的模擬計(jì)算,不斷總結(jié)與更新,進(jìn)行比對(duì)和驗(yàn)證得到最佳結(jié)果。各個(gè)領(lǐng)域最終都會(huì)相互結(jié)合,AI在繪畫領(lǐng)域的發(fā)展勢(shì)不可當(dāng),必將成為繪畫創(chuàng)作的一大新潮流。
2 正確看待和利用AI繪畫
正確看待和利用AI繪畫,與傳統(tǒng)繪畫進(jìn)行比較分析是必要的。傳統(tǒng)繪畫是使用一定的物質(zhì)材料作為工具,運(yùn)用色彩、線條等進(jìn)行構(gòu)圖,必須由藝術(shù)家完成,這需要藝術(shù)家進(jìn)行一定時(shí)間的訓(xùn)練。AI繪畫則依據(jù)機(jī)器數(shù)據(jù)庫(kù)識(shí)別輸入文本,通過(guò)對(duì)以往作品的計(jì)算,進(jìn)行圖像匹配創(chuàng)作繪畫。
2.1 AI繪畫的道德性
在人工智能藝術(shù)創(chuàng)作過(guò)程中,機(jī)器和藝術(shù)家二者間的人機(jī)關(guān)系一直存在爭(zhēng)議。2022年8月,在美國(guó)科羅拉多州博覽會(huì)藝術(shù)比賽中,Jason Allen(杰森·艾倫)的作品《太空歌劇院》奪得頭獎(jiǎng)。由于該畫作使用AI繪圖工具M(jìn)idjourney完成,因此引來(lái)了不少人類藝術(shù)家的指責(zé),AI繪畫到底算不算藝術(shù)呢[1]?除此之外,其他重要問(wèn)題,如與人工智能藝術(shù)的新穎性、原創(chuàng)性和自主性相關(guān)的問(wèn)題,也開(kāi)始受到藝術(shù)史學(xué)家、藝術(shù)家以及人工智能科學(xué)家和開(kāi)發(fā)人員的關(guān)注。
這些爭(zhēng)議與計(jì)算機(jī)在作出被認(rèn)為對(duì)創(chuàng)作過(guò)程至關(guān)重要的決策時(shí)的自主程度有關(guān)。計(jì)算技術(shù)是否仍然被視為單純的工具,還是它們表現(xiàn)出獨(dú)立“行為”的特性?盡管原則上藝術(shù)作品具有可復(fù)制性,這也是人造器物總可以被人仿制的原因所在,但是機(jī)械復(fù)制代表的則是與之不同的新東西。在《機(jī)械復(fù)制時(shí)代的藝術(shù)作品》中,本雅明指出技術(shù)復(fù)制好比一把雙刃劍,在割裂了本真性,導(dǎo)致“靈韻”丟失,不斷貶低原作價(jià)值本質(zhì)的同時(shí),也極大地增強(qiáng)了作品的空間靈活性,提高了公眾參與度[2]。因此,這就很難確定AI藝術(shù)品的價(jià)值應(yīng)該取決于其輸出結(jié)果所涉及的技術(shù)復(fù)雜性和創(chuàng)新性,還是僅取決于最終的視覺(jué)表現(xiàn)。Hertzmann(赫茨曼)表示,“人工智能算法不是自主創(chuàng)造者,在可預(yù)見(jiàn)的未來(lái)也不會(huì)出現(xiàn)。它們?nèi)匀恢皇枪ぞ?,可供藝術(shù)家探索和利用”。
另一個(gè)值得注意的是作者版權(quán)和倫理問(wèn)題。2018年10月,Obvious(無(wú)創(chuàng)意)集體制作的AI藝術(shù)品《埃德蒙德·貝拉米》在佳士得拍賣會(huì)上以432 500美元的價(jià)格售出,這一拍賣引發(fā)了關(guān)于作者身份和版權(quán)問(wèn)題的討論,并引發(fā)了關(guān)于在制作、推廣和銷售作品時(shí)必須考慮的版權(quán)問(wèn)題的討論[3]。在上述拍賣的情況下,人工智能藝術(shù)品雖然是由人工智能系統(tǒng)自主生產(chǎn),但創(chuàng)建該系統(tǒng)的作者,以及用于運(yùn)行網(wǎng)絡(luò)的代碼的作者,都沒(méi)有收到任何正式的版權(quán)許可。
盡管爭(zhēng)論不斷,但最近出售的大多數(shù)人工智能藝術(shù)品的案例表明,目前這些藝術(shù)品的著作權(quán)歸于使用人工智能技術(shù)制作藝術(shù)品的藝術(shù)家,不管創(chuàng)作過(guò)程如何,哪怕在藝術(shù)品上明確標(biāo)注了由AI進(jìn)行制作,那些計(jì)算模型的開(kāi)發(fā)者和軟件運(yùn)營(yíng)商的貢獻(xiàn)仍然被忽略,類似計(jì)算機(jī)行業(yè)套用代碼源,僅僅將代碼當(dāng)成一種公開(kāi)工具來(lái)使用。而在使用AI進(jìn)行繪畫創(chuàng)作中,數(shù)據(jù)庫(kù)中的部分圖像也可能涉及原始作者創(chuàng)作版權(quán),即在沒(méi)有征得作者許可的情況下進(jìn)行了計(jì)算輸出。當(dāng)然,這在最終作品中幾乎不會(huì)被注意到,但仍然需要從道德角度承認(rèn),人工智能藝術(shù)品中的版權(quán)侵權(quán)是一個(gè)需要系統(tǒng)解決的問(wèn)題。
2.2 AI繪畫——?jiǎng)?chuàng)作者的工具
目前對(duì)AI繪畫的看法主要分為兩大類,一部分激進(jìn)的人認(rèn)為AI具有比人類藝術(shù)家更強(qiáng)大的學(xué)習(xí)和計(jì)算能力,AI繪畫將取代人類成為更具創(chuàng)作經(jīng)驗(yàn)和技巧的“藝術(shù)家”。不過(guò),AI繪畫創(chuàng)作出的作品是毫無(wú)感情的圖像,將大大減少繪畫的原創(chuàng)性,這意味著人類最神圣且不可冒犯的領(lǐng)域已經(jīng)接近陷落。而另一部分人認(rèn)為AI只不過(guò)是另一個(gè)繪畫工具,將AI繪畫看作藝術(shù)技術(shù)性載體,而不是作為主體的藝術(shù),它不能替代人類獨(dú)有的創(chuàng)造力,因?yàn)樗囆g(shù)來(lái)源于真實(shí)生活,而這是機(jī)器所不能感受的人類那種特有的復(fù)雜生活閱歷與人生感悟。雖然借助深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)算法讓AI繪畫創(chuàng)意無(wú)限,但提供創(chuàng)作需求的主導(dǎo)者依舊是人,人對(duì)表達(dá)的持續(xù)渴望是本能,并不會(huì)被AI所替代[4]。
AI繪畫模型能夠作為人類藝術(shù)傳承的工具。自古流傳下來(lái)的文墨書(shū)畫或石碑壁畫,飽受歲月侵蝕,上面具體的內(nèi)容或許早已無(wú)法識(shí)別。而AI繪畫可以借助VAE(重構(gòu)變分自編碼器)和GAN,通過(guò)訓(xùn)練圖畫的缺失部分,生成圖像記憶,填補(bǔ)受損區(qū)域[5]。此外,AI還能通過(guò)計(jì)算對(duì)比鑒別古畫的真?zhèn)?,將需要鑒別的藝術(shù)品拍照上傳后,AI會(huì)在數(shù)據(jù)庫(kù)進(jìn)行匹配,通過(guò)每一個(gè)組成代碼的比對(duì)計(jì)算來(lái)判斷相似度。
AI繪畫模型能夠作為創(chuàng)作者的繪畫工具。它能夠幫助創(chuàng)作者將靈感具體化,通過(guò)在同一主題下更換不同關(guān)鍵詞,得到不同的輸出可能性,而內(nèi)部又具有完整的統(tǒng)一性,具有一種“在明確邊界內(nèi)的豐富可能性”。類似中國(guó)傳統(tǒng)的山水畫創(chuàng)作,墨水流動(dòng)的不確定性與AI計(jì)算類似,給予了畫家源源不斷的創(chuàng)作想法。接下來(lái),畫家會(huì)在大致區(qū)分開(kāi)的山水上繪制細(xì)節(jié),將自己創(chuàng)作的情感帶入,逐步填充和調(diào)整細(xì)節(jié)。相較于傳統(tǒng)的文檔、草圖、照片等繁雜且耗時(shí)的需求來(lái)源,創(chuàng)作者將自己一時(shí)的靈感轉(zhuǎn)換成文字關(guān)鍵詞輸入給AI,便能將其具象圖像化,囊括氣氛、光線、風(fēng)格和質(zhì)感等。
此外,AI繪畫模型還降低了藝術(shù)體驗(yàn)的門檻,讓普通人都可以體驗(yàn)藝術(shù)創(chuàng)作的過(guò)程。只需要提供一個(gè)粗陋的輪廓或者大致想法,人人都能立即得到自己想要的圖像。這正好迎合了當(dāng)代藝術(shù)的價(jià)值方向,即破除了藝術(shù)家與普通人的界限,人人皆為藝術(shù)家。其中,類似潑墨的過(guò)程在AI繪畫創(chuàng)作過(guò)程中被簡(jiǎn)化,創(chuàng)作者可以根據(jù)原始圖像來(lái)繪制細(xì)節(jié),作為創(chuàng)作者的練習(xí),為后續(xù)的藝術(shù)創(chuàng)作積累經(jīng)驗(yàn)。當(dāng)然,AI繪畫也存在不合理的取舍細(xì)節(jié)和缺乏共情感染力、氛圍感的缺點(diǎn),而這些剛好是人類藝術(shù)家擅長(zhǎng)處理的方面。
3 結(jié)語(yǔ)
當(dāng)前繪畫創(chuàng)作緊跟科技發(fā)展步伐,AI繪畫與傳統(tǒng)繪畫的結(jié)合是時(shí)代趨勢(shì),隨著繪畫藝術(shù)的發(fā)展,繪畫藝術(shù)的邊界將不斷發(fā)生變化。繪畫與科技的結(jié)合越來(lái)越緊密,AI繪畫的局限性也會(huì)不斷縮小。將AI繪畫作為人類藝術(shù)傳承和提高創(chuàng)作效率的工具,將其作為人腦的延伸而不會(huì)取代人,未來(lái)會(huì)有越來(lái)越多的繪畫藝術(shù)形式將在人類和AI的協(xié)作下完成。隨著AI算法的不斷更新與AI繪畫相關(guān)條例的逐步完善,普通人也能夠用AI生產(chǎn)高質(zhì)量視覺(jué)作品,這將極大改變?nèi)祟惖乃囆g(shù)生活。
參考文獻(xiàn):
[1] 王方方. AI繪畫引發(fā)的思考[J].科技與金融,2022(10):60.
[2] 王子銘.作為藝術(shù)事件:本雅明論機(jī)械復(fù)制時(shí)代的藝術(shù)作品[J].文藝評(píng)論,2022(3):11-19.
[3] 郭霽瑤.偷竊的藝術(shù),還是重新定義原創(chuàng)?AI繪畫背后的藝術(shù)變革與爭(zhēng)議[J].中國(guó)經(jīng)濟(jì)周刊,2022(23):75-77.
[4] 王少文.數(shù)字時(shí)代繪畫主體性探討[J].四川戲劇,2022(9):157-159.
[5] 童茵.數(shù)字人文范式框架與繪畫文物AI智能研究[J].計(jì)算機(jī)產(chǎn)品與流通,2020(3):133-135.
作者簡(jiǎn)介:魏珍珍(1980—),女,湖北武漢人,碩士,副教授,研究方向:視覺(jué)傳達(dá)設(shè)計(jì)。
周鈿(1999—),女,湖北襄陽(yáng)人,碩士在讀,研究方向:視覺(jué)傳達(dá)設(shè)計(jì)。