摘? 要:AI飛速發(fā)展所導致插畫行業(yè)的變革正在萌芽,AI繪畫也受到了人們的廣泛關(guān)注。本文從AI繪畫的發(fā)展現(xiàn)狀入手,分析了AI繪畫的原理,結(jié)合AI繪畫工具輔助插畫設計的前期和中期階段的實際案例,探討AI輔助插畫設計實踐探索的可能性,旨在探索如何利用AI技術(shù)提高插畫設計的效率和質(zhì)量,以期為插畫從業(yè)人員提供新的思路。
關(guān)鍵詞:AI繪畫;插畫設計;AI繪畫工具
一、插畫設計的發(fā)展
插畫設計是指運用手繪或電腦繪畫技術(shù),創(chuàng)作出用于出版物、廣告、包裝、產(chǎn)品設計等領域的平面圖像。插畫設計的目的是為了傳達信息和概念,增強視覺效果和吸引力。插畫作品通常具有強烈的個性和創(chuàng)意性,能夠吸引人們的眼球,并通過圖像來表達復雜的思想和情感。插畫設計的發(fā)展可以追溯到古代文明時期,如埃及、希臘、羅馬等文明都有插畫作品的存在?,F(xiàn)代插畫設計的發(fā)展可以追溯到文藝復興時期,當時歐洲的藝術(shù)家們開始將插畫作品應用于印刷品的制作中。隨著印刷技術(shù)的發(fā)展,插畫設計也得到了進一步的發(fā)展和應用。
20世紀初期,插畫設計成為了廣告和出版業(yè)的重要組成部分,隨著攝影技術(shù)的普及,插畫設計的重要性逐漸減弱。但是,隨著數(shù)字技術(shù)的發(fā)展,插畫設計再次獲得了新的發(fā)展機遇。現(xiàn)代插畫設計采用數(shù)字制作和處理技術(shù),使得插畫作品的制作更加便捷和高效。同時,插畫設計常用于兒童書籍、漫畫、廣告海報、標志、T恤、海報等,成為了現(xiàn)代文化產(chǎn)業(yè)中不可或缺的一部分。隨著AI繪畫工具的發(fā)展,插畫設計將迎來新一輪的革命,使用AI繪畫工具只需要輸入指令,不需要人類參與到繪制過程,便能夠快速生成從令人驚艷的畫作。AI繪畫工具的便捷引起了人們的廣泛關(guān)注和討論,為插畫從業(yè)者提供了新的可能和機遇。
二、AI繪畫的原理
AI繪畫是一種使用人工智能技術(shù)進行圖像生成和繪畫創(chuàng)作的方法。本質(zhì)上它通過對已有的大量藝術(shù)作品的學習,利用算法對作品的內(nèi)容和風格進行解析,生成新的作品。它的實現(xiàn)離不開圖像風格遷移技術(shù)、圖文預訓練模型和擴散模型的發(fā)展[1]。圖像風格遷移技術(shù)很大程度上依賴生成式對抗網(wǎng)絡(GAN)算法,GAN算法是一種深度學習算法,它可以通過學習數(shù)據(jù)集中的圖像來生成新的圖像。它由生成器和判別器這兩個神經(jīng)網(wǎng)絡組成。生成器負責生成繪畫作品,而判別器負責判斷生成的繪畫作品是否與真實繪畫作品相似[2]。通過反復迭代訓練,生成器可以生成越來越逼真地繪制作品,而判別器也會變得越來越準確。相比傳統(tǒng)的計算機圖形學技術(shù),GAN算法可以通過學習藝術(shù)家的作品從而生成更加自然、具有個性化風格的繪畫作品。
圖文預訓練模型的出現(xiàn)加速了AI繪畫的發(fā)展,以支撐圖文預訓練模型的可對比語言——圖像預訓練(CLIP)算法為例,它可以利用圖文的特征,將兩者“對齊”,再結(jié)合已有的生成模型實現(xiàn)“以圖生圖”或者“圖和文生圖”。操作人員使用自然語言就可以操控模型生成繪畫作品。
對于AI繪畫的崛起,擴散模型起著至關(guān)重要的作用,它的原理是通過人為逐步添加噪聲,讓圖像逐漸變“模糊”,再不斷學習去噪過程,如此人工智能就能從完全是噪聲的圖片中逐漸還原出清晰的圖片,即“畫”出圖像[3]。
三、AI繪畫的發(fā)展歷程
早在20世紀60年代,藝術(shù)家和科學家一起創(chuàng)造出了一個全新的藝術(shù)形式,即“算法藝術(shù)”?!八惴ㄋ囆g(shù)”這種藝術(shù)形式利用計算機程序和算法來生成圖像、動畫和交互式作品,它強調(diào)了過程和代碼的重要性。早期的“算法藝術(shù)”作品常常是一些抽象、無序的圖像,它們可以在電子屏幕上隨機變幻,展現(xiàn)出不同的色彩、形狀和運動軌跡。這些作品的生成過程是由程序自主完成的,藝術(shù)家只需要設定一些參數(shù)和規(guī)則,就可以讓程序生成出不同的藝術(shù)作品[4]。
20世紀90年代,英國藝術(shù)家哈羅德·科恩在開始研究AARON①,并在之后的幾十年中不斷改進程序。經(jīng)過多年的改進和完善,AARON成為了一款可以自主生成繪畫作品的程序。AARON的創(chuàng)作過程基于一系列的算法和規(guī)則,包括隨機性、重復性和自我修正。藝術(shù)家可以通過設定一些參數(shù)來影響AARON的創(chuàng)作風格和方式,但最終的作品是由程序自主生成的。AARON使用的算法和規(guī)則是基于哈羅德·科恩對繪畫和藝術(shù)的理解和經(jīng)驗,以及對計算機程序設計的深入研究和實踐。AARON的作品已經(jīng)在世界各地的博物館和畫廊展出,包括紐約現(xiàn)代藝術(shù)博物館、倫敦泰特現(xiàn)代藝術(shù)館和巴黎蓬皮杜藝術(shù)中心。AARON的創(chuàng)作方式和作品也對計算機藝術(shù)的發(fā)展和探索產(chǎn)生了深遠的影響,被認為是計算機藝術(shù)的先驅(qū)之一。
2012年,美國的Andrew Ng和Jeff Dean在Google進行了一次實驗,該實驗使用1.6萬個CPU和1000萬個貓臉圖片訓練了當時最大的深度學習網(wǎng)絡,這個網(wǎng)絡被稱為“Google Brain”,它使用深度學習算法,能夠自動識別和分類圖像等信息。在這個實驗中,Google Brain學習了大量的貓臉圖片,并生成了一個全新的貓臉。
2017年7月,F(xiàn)acebook聯(lián)合羅格斯大學和查爾斯頓學院藝術(shù)史系,創(chuàng)造了一個創(chuàng)造性對抗網(wǎng)絡,它被成為“CAN”。這一模型的創(chuàng)造為AI繪畫的發(fā)展奠定了基礎,它通過大量學習藝術(shù)家作品從而輸出獨一無二的作品。并且經(jīng)過研究人員的測試,53%的被測者無法分辨CAN模型生成的是AI繪畫作品。這是圖靈測試的首次突破。
2018年10月,一幅由AI創(chuàng)作的肖像畫《愛德蒙·德·貝拉米肖像》在佳士得拍賣會上,以43萬美元的價格出售,創(chuàng)下了由人工智能算法創(chuàng)作的藝術(shù)品售價的紀錄。這幅畫是由一家名為“Obvious”的美國公司使用GAN算法創(chuàng)作的。Obvious公司使用了一個由15000個肖像畫組成的數(shù)據(jù)集來訓練GAN算法,并在最終生成的圖像中選擇了一個男性肖像畫。同年,谷歌公司的數(shù)字藝術(shù)家凱爾·麥克唐納設計制作人工智能機器“Deep Dream”,它可以通過藝術(shù)家的作品進行學習,生成出與該藝術(shù)家相同風格的作品。
2021年初,美國人工智能研究公司Open AI發(fā)布了廣受關(guān)注的DALL—E系統(tǒng),AI開始擁有了一個重要的能力,就是按照輸入的提示進行創(chuàng)作。這一系統(tǒng)的發(fā)明對AI繪畫的發(fā)展具有劃時代的意義。
2022年是AI繪畫的爆發(fā)年份,在當年美國科羅拉多博覽會的藝術(shù)競賽上,一幅由創(chuàng)作者結(jié)合AI繪圖工具Midjourney②繪制的《太空歌劇院》拔得頭籌,此事件在藝術(shù)領域引起了軒然大波。AI繪畫開始廣為人知,最早引發(fā)廣泛關(guān)注的兩個AI繪畫工具是Disco Diffusion和Midjourney。這兩個軟件都是基于人工智能的繪畫軟件,它們都可以將文本描述生成精美的圖片。隨著這類平臺的興起,國外的谷歌、微軟和Meta等公司都加大了在此領域的研發(fā)投入,國內(nèi)的平臺也開始逐漸崛起,例如國內(nèi)最早出現(xiàn)的Tiamat和百度的文心一格、盜夢師等平臺。此外,國外還有Facebook(Meta)的make a scene、微軟的Nuwa女媧、Stable Diffusion等人工智能繪畫平臺。
四、插畫師應用AI繪畫工具的必要性
插畫設計作為商業(yè)插畫的重要組成部分,要求插畫設計師需要具備扎實的繪畫技巧、創(chuàng)意思維、審美能力和設計感等能力。插畫師在工作中不僅需要美術(shù)相關(guān)的專業(yè)知識,而且還要能理解客戶的需求,設計出符合市場需求的作品。這要求插畫師需要不斷提升自己,以獲取適應商業(yè)市場的能力。資本市場除了優(yōu)質(zhì)的插畫內(nèi)容產(chǎn)出之外,同時追求高效率的產(chǎn)出。2016年阿里公司的“魯班”AI系統(tǒng)在當年的天貓雙11上制作了1.7億張商品展示廣告,達成“千人千面”的廣告頁面展示效果,顯示不同的商品推薦頁面,為用戶個性化推薦商品,這樣的展示效果需要巨大的工作量,這是普通設計部門的人力在短時間內(nèi)無法實現(xiàn)的。雖然“魯班”系統(tǒng)本質(zhì)上只是對已有素材進行組合,需要人類設計師提供最基礎的素材,只能支持較為簡單和模板化的設計工作。但是,最后的效果也足以沖擊到比較底層的美工,頂替了大量的人力。
在AI繪畫不斷更新迭代的今天,AI繪畫工具不僅能夠完成簡單的畫面設計,還可以生成越來越復雜和精美的畫面,這不僅對底層美工產(chǎn)生沖擊,很多需要高質(zhì)量的創(chuàng)意插畫行業(yè)受到了波及。數(shù)家大中小型游戲公司對已有的插畫團隊進行裁員,取消原有的插畫外包業(yè)務,鼓勵企業(yè)中的插畫員工使用AI繪畫工具協(xié)助辦公。一些自由插畫師原本依靠承接外包插畫的單子可以獲得不錯的收入,由于AI繪圖工具的風靡,客戶對于插畫的預算大幅度降低,導致行業(yè)內(nèi)的插畫師收入受到了一定程度的影響。面對AI繪畫工具出現(xiàn)以后導致行業(yè)的巨大波動,美術(shù)從業(yè)者更應該主動學習,提高自身的競爭力。
AI不具備物理空間的社會生活經(jīng)歷,缺少與人共情的情感體驗,而藝術(shù)本質(zhì)上是一種情感的表達,因此,AI作為創(chuàng)作主體存在很大的爭議[5]。AI繪畫作為輔助繪畫工具參與到創(chuàng)作中,通過人類操控進行創(chuàng)作,可以很大程度上彌補這個短板。從本質(zhì)上講,人類依然是作為創(chuàng)作主體,而AI繪畫是作為工具使用。而且AI工具本質(zhì)上是從一個巨大的素材庫中提取內(nèi)容進行整合輸出,它本身并不具備對情感的理解能力,只能通過理性的專業(yè)詞語對內(nèi)容進行提取,這就需要插畫師了解各種藝術(shù)語言和藝術(shù)風格,使用恰當?shù)拿枋鲈~對AI繪畫工具下達指令,這關(guān)乎著生成結(jié)果的質(zhì)量,也是人機協(xié)作的關(guān)鍵性所在。雖然AI工具省略了人類藝術(shù)家常規(guī)的創(chuàng)作步驟,僅僅是對現(xiàn)有藝術(shù)品進行拼接重組,但是作為提高生產(chǎn)力的工具,它確實有著不容小覷的能力。
市場的需求促使插畫師使用AI繪畫工具提高生產(chǎn)效率,而AI繪畫工具必須借助插畫師的力量,才能夠發(fā)揮到最大效用。
五、AI繪畫輔助插畫設計的應用分析
目前主流的AI繪畫工具主要采取“文生圖”和“圖生圖”兩種操作模式[6]。操作者可以使用自然語言對需求畫面進行描述或者給出相關(guān)圖片,AI繪畫工具會根據(jù)相關(guān)指令,生成對應的圖片。除了直接使用文和圖的指令之外,操作者也可以自己訓練模型以達到更加穩(wěn)定的畫面輸出。本文將使用以上功能對AI繪畫輔助插畫設計進行探索。
(一)AI繪畫輔助插畫設計前期概念圖
AI繪圖軟件給出圖1四幅不同風格的圖片,我們選擇其中一個比較合適的放大,效果如圖2,也可以繼續(xù)選擇合適的風格繼續(xù)生成其他圖片。這組圖片從選擇關(guān)鍵詞到生成圖片用時不到2分鐘,插畫師在創(chuàng)作前期進行概念輸出的時候,可以借助AI工具,便捷地生成多種風格的圖片,便于搜集素材和更好地向客戶展示方案。當然如圖2所示,我們可以看到左下角的以為男性角色的褲腳是出現(xiàn)了一些問題,右下角的兩位女性中間也出現(xiàn)了不確定的圖形,畫面前方的兩位小孩的比例并不是很協(xié)調(diào)。AI畫圖不可避免地會出現(xiàn)人物肢體和物理空間的錯位,這些都是隨機出現(xiàn)的。這些圖可以在插畫師前期工作時作為一個彩色草圖和靈感啟發(fā)使用,一定程度上提升了工作效率。
(二)AI繪畫輔助插畫設計線稿上色
在插畫設計中,不同的配色方案,對最終效果圖起著至關(guān)重要的作用。色彩不僅是畫面氛圍的重要組成元素,更具有直接傳遞情感的作用。在插畫設計中期,在已經(jīng)確定畫面內(nèi)容和構(gòu)圖的基礎上,只對色彩和風格進行多樣化的輸出。使用AI繪畫工具給已有的插畫線稿上色,可以在框定的范圍內(nèi)更加穩(wěn)定的產(chǎn)出圖像,這樣不僅可以給插畫師提供高效的配色方案,還可以直接產(chǎn)生高品質(zhì)的效果圖,降低在上色環(huán)節(jié)的實驗成本,插畫師和客戶都可以很直觀的看到接近成品的效果圖,以便確立最終的上色方案。
目前主流的使用AI輔助線稿上色的方法是多樣的,基礎原理是通過工具識別線稿,在線稿處于完全符合識別算法的理想的狀態(tài)下,可以得到充分的提取,即可進入下一步上色環(huán)節(jié),便于識別的線稿黑白對比明顯、線條閉合且粗細恰當。在線稿得到充分識別的基礎上,在操作框中添加畫面的描述語,運行模型即可生成上色作品。在模型不變的情況下,AI輔助繪畫會產(chǎn)生風格相同,配色不同的作品;更換或者添加新的模型,則會產(chǎn)生不同風格和配色方案的作品。
AI繪畫工具中支持多種不同風格的模型,這些模型是由官方和非官方兩種組織制作,都是基于大量風格化的素材進行機器學習和訓練的結(jié)果,主要根據(jù)畫面的色彩、人物造型風格、寫實、三維、二維、線描等分類。在輔助線稿進行上色階段,繪畫者需要安裝相應的模型,調(diào)整各種參數(shù)來控制最終的生成結(jié)果。從線稿上傳到添加描述詞,最后選擇模型,點擊生成,繪畫者在短時間內(nèi)就可以得到一幅作品。雖然目前由于線稿與算法之間不能完美匹配,可能會出現(xiàn)部分區(qū)域無法識別的情況,在上色環(huán)節(jié)也會出現(xiàn)部分區(qū)域的顏色不符合物理空間邏輯的情況(如圖3),我們可以看到從左起第二幅和第三幅的右邊肩部衣袖和左邊出現(xiàn)了不同的色塊。上色的結(jié)果并不是每一幅都有很高的審美,需要多次生成,再進行挑選。即使如此,AI繪畫工具的上色效率是傳統(tǒng)人工上色所無法企及的。伴隨著AI繪畫工具的更新迭代,它也在不斷得優(yōu)化,逐步解決出現(xiàn)得問題,變成更加高效的工具。
六、AI繪畫輔助插畫設計的優(yōu)勢和挑戰(zhàn)
經(jīng)過以上實踐可以得知,AI繪畫工具輔助插畫設計具有很大的優(yōu)勢:第一,AI繪畫工具在前期概念圖設計和中期線稿上色階段都表現(xiàn)不俗,可以極大的提高工作效率。第二,AI繪畫工具可以快速提供多種不同的概念圖和色彩風格作品,豐富插畫設計的表現(xiàn)形式和風格。插畫師在設計作品時,受個人藝術(shù)修養(yǎng)、造型能力和時間成本等多方面因素制約,AI作為擁有復制風格和高效產(chǎn)出的工具,它可以作為人類畫師的一個巨大的數(shù)據(jù)庫,提供多種多樣的藝術(shù)呈現(xiàn)方式去傳遞藝術(shù)家自身的情感,將畫家從重復性的勞動中解放出來,探索藝術(shù)的邊界[7]。第三,AI繪畫工具可以降低插畫設計的成本和門檻,插畫設計從業(yè)者都是經(jīng)過數(shù)年的美術(shù)專業(yè)培訓,不僅在造型能力和藝術(shù)修養(yǎng)上都付出了極高的時間成本,在進行造型訓練的時候,需要大量重復的練習,使專業(yè)知識不單單是停留在腦海里,更是要心手合一。AI繪圖工具的使用不要求操作者具有造型能力,只是通過對它輸入提示詞和運行模型,便可以得到一幅作品。操作者只需要對藝術(shù)語言有一定的認識,具備藝術(shù)史相關(guān)的知識儲備,對各種繪畫風格和代表人物有一定的了解,這極大地降低了插畫設計的門檻,人人都可以使用AI工具進行插畫設計,效率的大幅度提高和入行門檻的降低,會極大地降低企業(yè)使用插畫的成本。
AI繪畫輔助插畫設計有很多優(yōu)勢,但現(xiàn)階段也有很多不足:第一,由于AI繪畫工具在操作過程中有很多不可控的因素,這些都會增加使用者的時間成本和操作難度。插畫師在使用AI繪畫輔助插畫設計時,需要使用準確的專業(yè)描述詞,例如,畫面物理內(nèi)容、構(gòu)圖、色彩、鏡頭和風格等,這能提高最后輸出結(jié)果的準確性,但即使如此,在同操作方式的系統(tǒng)中,前期仍然需要花費大量的時間調(diào)試,以獲取更為理想的效果圖。第二,AI繪畫工具本質(zhì)上不具備創(chuàng)新生產(chǎn)的能力,而是使用已有的繪畫作品進行提取學習,再對其進行重組[8]。這種通過他人畫作訓練出來的模型,被免費放置在公共網(wǎng)絡中,任何人都可以獲取使用,這使得畫家多年來積累創(chuàng)造的繪畫風格變得廉價,損害了原有畫家的利益。而通過他人作品拼接縫合生產(chǎn)出來的作品是否版權(quán),也有很大的爭議。第三,插畫行業(yè)人才的流失,更低的用工成本會減少插畫領域人才的流入,對于想要學習插畫設計的人會產(chǎn)生更大的阻力,對于AI工具快捷高效的過程相比人類在進行造型學習會顯得更加艱苦。第四,AI繪畫工具由于它和常規(guī)的繪畫流程差異較大,操作者想要得到更準確的結(jié)果,前期需要時間成本了解它的運行原理和使用方法,而AI繪圖工具也在飛速更新迭代,這也需要操作者密切關(guān)注其發(fā)展變化,不停地更新自我的認知,養(yǎng)成終身學習的習慣。
七、結(jié)語
AI繪圖工具已經(jīng)向大眾展示了巨大的潛力,雖然現(xiàn)階段的AI繪畫工具還具有一定的局限性,但是它作為一個高效的工具輔助插畫設計可以很大程度上提高工作效率。對比上一輪數(shù)字技術(shù)發(fā)展所迎來的產(chǎn)業(yè)革命,這次的革命可能不僅僅是使用工具的變化,而是直接在生產(chǎn)環(huán)節(jié)上進行了改變,由文字到圖畫的生成過程,是創(chuàng)作過程的急速飛躍,生產(chǎn)方式的變革迎來生產(chǎn)效率的提升。未來,無論是插畫行業(yè)的從業(yè)人員的數(shù)量還是工作方式都將產(chǎn)生巨大的變化。面對這新一輪的技術(shù)沖擊,插畫從業(yè)者需要及時更新已有觀念,擁抱新的科技,才能在這次浪潮的席卷中站穩(wěn)腳跟。
注釋:
①AARON是由抽象畫家哈羅德·科恩(Harold Cohen,1928—2016)在1972年著手開發(fā)的計算機繪圖程序,這是最早也是最復雜的藝術(shù)作品生成程序之一。
②Midjourney是一款2022年3月面世的AI繪畫工具,創(chuàng)始人是美國的David Holz。
參考文獻:
[1]金鳳.AI繪畫“小秘密”都在這里[J].科學大觀園,2023(4):8-11.
[2]繆虹,王敬雷.AI繪畫創(chuàng)作的運行規(guī)律及應用[J].絲網(wǎng)印刷,2023(7):96-98.
[3]喻思南.人工智能,如何妙筆“生”畫[N].人民日報,2022-12-23(11).
[4]鄧靜.價值與局限:人工智能繪畫作為新型藝術(shù)媒介的研究[J].鞋類工藝與設計,2023,3(10):54-56.
[5]郭超,魯越,林懿倫,卓凡,王飛躍.平行藝術(shù):人機協(xié)作的藝術(shù)創(chuàng)作[J].智能科學與技術(shù)學報,2019(4):335-341.
[6]劉書亮.論AI繪畫對文化創(chuàng)意領域的影響[J].當代動畫,2023(2):91-95.
[7]李媛.人工智能對藝術(shù)創(chuàng)作帶來的影響分析[J].藝術(shù)品鑒,2023(8):23-26.
[8]張兆羽.AI繪畫在數(shù)字媒體設計中的應用[J].藝術(shù)品鑒,2023(9):114-117.
作者簡介:曹娜,貴州師范大學美術(shù)專業(yè)研究生。