陳奇佳?徐陽
【摘 要】 AI藝術(shù)創(chuàng)作本質(zhì)上仍是在執(zhí)行某種或繁或簡的算法,這是談?wù)揂I藝術(shù)尤其是文字類AI藝術(shù)的前提。將藝術(shù)創(chuàng)作所需要的基本要素算法化,以形成AI創(chuàng)作所需的邏輯參數(shù),進(jìn)而評估AI對這些邏輯參數(shù)進(jìn)行習(xí)得和轉(zhuǎn)化的現(xiàn)實可能性,這是探討AI寫作的另一前提。探尋文字組合的規(guī)律性問題以及較大尺度的文字傳情達(dá)意的類型模型,則是研究文字?jǐn)⑹聦懽骺伤慊那疤?。?dāng)前,AI寫作主要在大尺度的類型組合的學(xué)習(xí)上取得了一定突破,但根據(jù)現(xiàn)有的計算機(jī)技術(shù),AI寫作的前景似不樂觀。不過,目前的探索也不排除形成AI自身敘事方法和邏輯通解的可能性。
【關(guān)鍵詞】 算法;人工智能;文字?jǐn)⑹?邏輯架構(gòu);具身性
引言
自20世紀(jì)中葉以來,人工智能(Artif icial Intelligence,簡稱AI)作為一種技術(shù)現(xiàn)實和文化想象,與人文科學(xué)、藝術(shù)實踐的關(guān)系日益緊密。1983年,計算機(jī)程序雷克特(Racter)創(chuàng)作的名為《警察的胡子是半成品》(The Policeman’s Beard is Half-Constructed)的實驗性書籍問世,這意味著AI的文學(xué)創(chuàng)作之路正式開始。進(jìn)入21世紀(jì)后,隨著相關(guān)領(lǐng)域技術(shù)水平、認(rèn)知能力的飛速提升,AI在藝術(shù)實踐上的潛能得到極大釋放,AI的文學(xué)創(chuàng)作也取得了新的突破與發(fā)展。2008年,俄羅斯圣彼得堡出版了史上第一部AI創(chuàng)作的長篇小說《真愛》,其主人公借自名著《安娜 · 卡列尼娜》,情節(jié)取自17本經(jīng)典小說組成的情節(jié)庫,行文風(fēng)格上則仿照村上春樹。這部由計算機(jī)程序(PC Writer 2008)耗時僅三天便寫就的長達(dá)320頁的小說被予以厚望(不過PC Writer 2008程序的設(shè)定卻耗費語言學(xué)家和程序員八個月之久),出版社宣稱若此書銷售量可觀,之后會陸續(xù)推出AI撰寫的其他小說,但此事并無進(jìn)展。[1] 2016年,以科幻小說《計算機(jī)寫小說的那一天》為代表的AI作品參選第三屆日經(jīng)新聞社的“星新一微型小說文學(xué)獎”,最終由日本公立函館未來大學(xué)松原仁教授的團(tuán)隊研發(fā)的AI作品通過初審,但此后再無下文。綜合考量,上述作品的基本內(nèi)容、人物設(shè)定和故事框架等基本要素均由設(shè)計者所擬定,AI所做的僅是對這些素材進(jìn)行加工和重組。因此,這類文學(xué)“制品”客氣地說是人機(jī)合作的產(chǎn)物,不客氣地說,僅是專門為展示而制作的樣品,其中人工干預(yù)、揀選的因素恐怕過于強(qiáng)烈,距離真正的AI“寫作”相去甚遠(yuǎn)。
不過,近幾年AI創(chuàng)作取得了較大的進(jìn)步和發(fā)展,尤以微軟小冰的創(chuàng)作為突出代表。截至目前,微軟小冰在詩歌、繪畫乃至音樂等諸多藝術(shù)領(lǐng)域都頗有建樹。就文學(xué)創(chuàng)作而言,2017年5月,小冰出版了第一部由AI創(chuàng)作的詩集《陽光失了玻璃窗》;2019年,小冰與人類共同創(chuàng)作的詩集《花是綠水的沉默》被稱為世界上第一部真正意義上由智能機(jī)器和人類共同創(chuàng)作的文學(xué)作品。就最新成果而言,AI在仿寫中文長篇著作、續(xù)寫英文長篇小說等方面所依賴的文本生成模型是GPT-3 [1]。GPT-3是由人工智能組織Open AI于2020年6月發(fā)布的自然語言處理模型,也是有史以來最為強(qiáng)大的語言模型。GPT-3采用單向語言模型訓(xùn)練方式,有著較大體量的訓(xùn)練模型,利用預(yù)訓(xùn)練—精調(diào)兩段式框架進(jìn)行訓(xùn)練。該模型通過將單詞向量化形成矩陣,在許多自然語言處理數(shù)據(jù)集上均具有出色的性能,包括翻譯、問答和文本填空任務(wù),還包括一些需要即時推理或領(lǐng)域適應(yīng)的任務(wù)等,有著較高的處理水平與能力。GPT-3模型的建構(gòu)使得關(guān)于AI寫作可能性的討論再次提上日程。事實上,依照目前AI的發(fā)展形勢,其一般的、可通過圖靈測試的“寫作”能力從理論上而言已成為現(xiàn)實。不過,這些寫作的成品是否稱得上“文學(xué)作品”、AI的工作在何種尺度上能夠被納入文學(xué)領(lǐng)域(或者說,介入到當(dāng)代文學(xué)的實際生產(chǎn)環(huán)節(jié))中討論,都頗費思量。事實上,AI這些文本生成究竟在何種意義上能夠被稱為“寫作”,也遠(yuǎn)不是一個自明的問題。因為就當(dāng)前AI藝術(shù)的實踐來看,在其自運(yùn)作的條件下,較容易通過圖靈測試的,大概都集中于抒情或抽象藝術(shù)的領(lǐng)域。因此,在進(jìn)入相關(guān)具體問題的研究之前,我們最好不要用想象來代替現(xiàn)實,既不要低估AI未來的潛力,也不要鑿空想象AI寫作的無限未知和可能性領(lǐng)域。人類在這方面過于激進(jìn)與過于保守的論斷都會產(chǎn)生不少笑柄。著名人工智能專家雷 · 庫茲韋爾(Ray Kurzweil)在其1999年出版的《靈魂機(jī)器的時代:當(dāng)計算機(jī)超過人類智能時》一書中曾列舉了不少技術(shù)保守主義的笑料:
“我想全球市場也許只需要5臺計算機(jī)?!薄獓H商用機(jī)器公司董事長托馬斯·沃森,1943年。
“未來的計算機(jī)也許不會超過1噸半。”—《通用機(jī)械學(xué)》雜志,1949年。
“對任何人來說,640K的內(nèi)存都應(yīng)該夠用了?!薄葼枴どw茨,1981年。
“互聯(lián)網(wǎng)將在1996年災(zāi)難性地癱瘓?!薄_伯特·梅特卡夫(以太網(wǎng)的發(fā)明者)。[2]
但如以“后見之明”去評論庫茲韋爾的言論,我們會發(fā)現(xiàn)他的激進(jìn)想象也有很多令人解頤之處。比如他認(rèn)為到2019年,“電腦大部分是看不到的,嵌裝在各處—墻上、桌子上、椅子上、服飾上、珠寶上和人體內(nèi)?!蠖鄶?shù)道路安裝有自動驅(qū)動系統(tǒng)。人們開始與機(jī)器人建立聯(lián)系,把它們當(dāng)作同伴、教師、看管人和愛人。虛擬藝術(shù)家,靠著自己的聲譽(yù),出現(xiàn)于各種藝術(shù)領(lǐng)域”[1]。顯然,他很大程度上高估了AI的發(fā)展水平。
不妨往后退一步,擱置AI寫作的藝術(shù)性、文學(xué)性、詩性,也暫且擱置AI寫作的潛能等話題,回到問題的起始之點,叩問今天的AI何種層面、何種形式的活動能夠與人類所謂的藝術(shù)活動相接近、相配稱?其實也就是這樣一個問題:當(dāng)前的AI活動是否已經(jīng)可以將某些人類公認(rèn)的藝術(shù)形式轉(zhuǎn)化為一種確定的算法?具體到寫作領(lǐng)域,我們顯然就有必要脫離一般文學(xué)研究的領(lǐng)域,撇開文學(xué)與其他藝術(shù)形式的共性與差異性討論等傳統(tǒng)模式,僅從文學(xué)表達(dá)的基本物質(zhì)基礎(chǔ)也就是文字表意的可算化這一前提出發(fā),討論當(dāng)前AI文字寫作算法的邏輯構(gòu)造樣態(tài)及其實踐成效,分析其邏輯樣態(tài)的必然結(jié)果,以此與人類文字寫作的結(jié)果比照;并根據(jù)當(dāng)代AI最新、最強(qiáng)大的深度學(xué)習(xí)模式,追問這種比照學(xué)習(xí)的發(fā)展?jié)摿σ嗉雌溥_(dá)成或超越人類同類型文字寫作的可能性。
就AI當(dāng)前的寫作學(xué)習(xí)來說,其參考人類文字寫作模式的邏輯構(gòu)造,大抵可分作兩種基本的類型,即抒情寫作與敘事寫作。抒情寫作的基本學(xué)習(xí)對象是抒情詩,微軟小冰的現(xiàn)代詩創(chuàng)作能力是通過對1920年后519位現(xiàn)代詩人的上千首詩學(xué)習(xí)上萬次后而達(dá)成的;而敘事寫作的基本學(xué)習(xí)對象是故事與小說,2015年阿里巴巴推出了聲稱擁有龐大的故事資料庫的智能創(chuàng)作系統(tǒng)“阿里編編”,對外宣稱平均創(chuàng)作一集電視劇劇本只要10分鐘,而創(chuàng)作一個完整的電影劇本也只需30分鐘。2021年,阿里巴巴作為第二大股東的科技公司“海馬輕帆”又進(jìn)一步推出“小說轉(zhuǎn)劇本”智能寫作功能。AI的抒情寫作和敘事寫作涉及兩種迥然不同的算法構(gòu)造邏輯,本文主要討論AI在敘事寫作上,按照人類的寫作方式,需要建構(gòu)什么樣的底層的邏輯形態(tài)及其實踐的可能性。
一、可算:
AI創(chuàng)作與人類創(chuàng)作可比較的基礎(chǔ)
從根本上講,人類的思維模式與計算機(jī)的處理模式所能直接相比較的地方是算法,這是我們討論一切問題的前提。
早在20世紀(jì)中葉,“計算機(jī)之父”約翰 · 馮 · 諾依曼(John von Neumann,1903—1957)曾創(chuàng)造性地從數(shù)學(xué)的角度對計算機(jī)的數(shù)學(xué)運(yùn)算和人腦思維的過程進(jìn)行過比較研究,這一創(chuàng)舉不僅為計算機(jī)的創(chuàng)新、人工智能的發(fā)展指明了方向,也為今天AI藝術(shù)與人類藝術(shù)提供了可比較的理論基礎(chǔ)。這便是馮 · 諾依曼死后所出版的《計算機(jī)與人腦》(The Computer and the brain,1958)一書的基本思想。
目前計算機(jī)的理論架構(gòu)仍基于馮 · 諾依曼體系結(jié)構(gòu)(Von Neumann architecture),僅在其基礎(chǔ)上略作改進(jìn),并沒有真正超越。這意味著我們在討論文字?jǐn)⑹滤惴ㄑ芯康那疤釙r仍可以從馮 · 諾依曼對人腦和計算機(jī)可比較基本點—算法開始,這也是我們從理論層面對AI創(chuàng)作進(jìn)行合理分析的大前提。馮 · 諾依曼認(rèn)為,任何為人類所用,特別是為控制復(fù)雜過程而建造的人工自動機(jī),通常都具有純粹的邏輯部分和算術(shù)部分。不論人類設(shè)計者制定何種程序,他們都必須用數(shù)值相等或不相等的方式對所要執(zhí)行的任務(wù)予以設(shè)定,然后交由能夠?qū)崿F(xiàn)該任務(wù)的自動機(jī)去處理。[2]類似的,人腦的神經(jīng)系統(tǒng)也具有兩種類型的通信—不涉及算術(shù)公式的通信和算術(shù)通信。前者屬指令通信(邏輯形式),后者屬數(shù)字通信(算術(shù)形式);前者可以用適當(dāng)?shù)恼Z言來描述,后者可以用數(shù)字來描述。[1]因此,依馮 · 諾依曼而言,人腦與計算機(jī)的相似點和可比較之處在算法上:計算機(jī)的處理系統(tǒng)能夠在不同實用領(lǐng)域大展身手,是因為學(xué)習(xí)了人工算法的部分原理,而人腦的神經(jīng)系統(tǒng)可以被視為能夠以相當(dāng)?shù)偷木韧瓿蓸O其復(fù)雜工作、具有相當(dāng)高可靠性的計算機(jī)。不過,雖然計算機(jī)的所有算法都由邏輯架構(gòu)和邏輯演算兩部分構(gòu)成,但基于人腦和計算機(jī)的相似性對AI創(chuàng)作和人類創(chuàng)作予以比較時,我們著重討論算法的邏輯架構(gòu)部分,至于更為煩瑣復(fù)雜的邏輯演算體系則屬于程序員專攻的領(lǐng)域。
從理論上來講,AI邏輯架構(gòu)的實現(xiàn)與神經(jīng)沖動(能量)產(chǎn)生的信號傳遞類似:計算機(jī)設(shè)定者給出一個目的性指令(從這個角度說,AI運(yùn)作的底層機(jī)制必然是因果性的),計算機(jī)便根據(jù)一定驗算框架(即代碼)進(jìn)行運(yùn)作,之后根據(jù)相應(yīng)電信號的回饋得到某種回應(yīng)指令。一臺機(jī)器若要通過計算來解決一個具體問題,就必須由一組完整的代碼來控制它?,F(xiàn)代計算機(jī)的使用是基于用戶就該機(jī)器要解決的給定問題而開發(fā)和制定出必要的完整代碼的能力。[2]代碼的復(fù)雜性在此也可暫時擱置不談,因為正如馮 · 諾依曼所言,一臺機(jī)器在任何復(fù)雜的、各種可能的指令系統(tǒng)的控制下做任何運(yùn)算,都好像它只包含“基本”運(yùn)算,即那些基本的、非復(fù)合的原始指令。[3]因此,AI的所謂“創(chuàng)作”,只是按照既定算法程序進(jìn)行演算,是這種演算邏輯的隨機(jī)性成果。它之所以有時看起來跟人的創(chuàng)作有可比較性,是因為經(jīng)過揀選的樣本看起來與人類創(chuàng)作的某些文本類型有相似性,而不是AI真正按照人類的創(chuàng)作規(guī)則在寫作。當(dāng)前AI寫作(創(chuàng)作)努力的方向,就是試圖按照某一種算法,至少將人的某一類型的寫作方式徹底地程序化,在這一程序邏輯中,以深度學(xué)習(xí)的方式,使得AI最終獲得類型文本自生成的能力—就像當(dāng)年圍棋程序阿爾法狗(AlphaGo)曾經(jīng)達(dá)成的目標(biāo)那樣。這是比較人類創(chuàng)作與AI創(chuàng)作是否可能具有相似性或者說可比較性的唯一基礎(chǔ)。
基于此,本文就人類自身出發(fā),將人類的藝術(shù)形式解析為一種算法。不過,當(dāng)以算法為基礎(chǔ)比較AI創(chuàng)作與人類創(chuàng)作時,我們所必須面對的問題便是算法無法將諸如情感、信仰、宗教等雖對藝術(shù)創(chuàng)作至關(guān)重要但卻不可演算之物統(tǒng)籌在內(nèi)。事實上,像情感、信仰、宗教等要素對人文藝術(shù)的發(fā)展功不可沒,在中西文明的演進(jìn)過程中扮演了至關(guān)重要的角色。但我們從現(xiàn)實層面讓AI如科幻小說中的人物那樣擁有情感、保有信仰既無可能更無必要。換言之,在真正對AI作品和人類作品予以比較之時,一是我們僅能討論二者在客觀上可被比較和可被計算的環(huán)節(jié),也就是以人類身體為經(jīng)驗的建構(gòu)藝術(shù)作品時所涉及的環(huán)節(jié);二是在對比過程中我們的基本設(shè)想是將人類藝術(shù)創(chuàng)作算法化,而非漫無標(biāo)準(zhǔn)地設(shè)想AI依據(jù)何種高級程序能夠達(dá)到人類創(chuàng)作的標(biāo)準(zhǔn)等。在這兩大前提下,相較具體AI程序的運(yùn)作而言,我們的討論將不可避免地顯得粗泛和宏觀,但這確是目前研究首先需要澄清的問題。
二、具身習(xí)得的邏輯參數(shù):
AI創(chuàng)作的理論構(gòu)想
在對比AI創(chuàng)作和人類創(chuàng)作的過程中,我們所采取的基本思路是將藝術(shù)創(chuàng)作所需要的基本要素算法化,以形成AI創(chuàng)作所需的邏輯參數(shù),評估AI對這些邏輯參數(shù)進(jìn)行習(xí)得和轉(zhuǎn)化的現(xiàn)實可能性,從而回應(yīng)AI寫作的潛能等話題。這里的邏輯參數(shù)是指將藝術(shù)創(chuàng)作所涉及的人類所有思維內(nèi)容還原為明確的生理表征行為,描述為可被描述和必須被描述的要素,因為它們與人類身體經(jīng)驗直接相關(guān),因此又可被稱為具身習(xí)得的邏輯參數(shù)。這種具身習(xí)得的邏輯參數(shù)從人類自身經(jīng)驗出發(fā),將與藝術(shù)創(chuàng)作相關(guān)的環(huán)節(jié)分解為最小的單元模塊。最小單元模塊是指在現(xiàn)有人類藝術(shù)經(jīng)驗層面,以現(xiàn)象學(xué)還原的方式考察各種與藝術(shù)活動相關(guān)的基礎(chǔ)范疇,所設(shè)定的可算的基礎(chǔ)藝術(shù)模塊。在集合論的意義上,它們又是可算化藝術(shù)活動的最大單位。這些模塊本身是可微的,但從與人類藝術(shù)經(jīng)驗的對應(yīng)關(guān)系來說,它們其實是一種最大的集合,即只有在這些集合條件下,人類那些被具身化的邏輯參數(shù)才處于彼此平行、可有交集但互不包容的狀態(tài)。當(dāng)然,還有必要指出的是,我們在此討論藝術(shù)活動的具身化,絕不意味著所有藝術(shù)活動的形式范疇都是一致或近似的,不同藝術(shù)形式所對應(yīng)的邏輯范疇自然有所側(cè)重,同一藝術(shù)形式之中也有非常復(fù)雜的邏輯范疇變異情況。
根據(jù)人類藝術(shù)的實踐經(jīng)驗,我們可以將相關(guān)可算的具身化邏輯參數(shù)分成三種基本類型。
第一類可稱為單純描述性的邏輯參數(shù)。這類參數(shù)一般涉及人類天賦的理性認(rèn)知能力,為全人類所共有,有希望以某種剛性的算法求得普通解(當(dāng)然,這是極端樂觀主義的猜想,這類所謂天賦能力完全有可能涉及神秘層次,最終并不能被徹底認(rèn)識,這就無所謂“普通解”了)。語言問題就是其一。這里所說的語言只涉及音義傳播與理解問題(書面文字之間有更復(fù)雜的運(yùn)作機(jī)制,不能歸入基礎(chǔ)算法的層面)。從人類理解的層面來說,單純語音的交流是完全可能的;單純依靠語音而完成不同方言和語言體系的交流也是可能的,這足以證明人類擁有某種相同的關(guān)于語言習(xí)得和運(yùn)用的類的能力,也就是說,我們獲得關(guān)于語言的通解是可能的(盡管自喬姆斯基之后語言理論在這方面進(jìn)展有限)。再比如在圖形層面,人類也可能期望通過一種窮盡描述的方法獲得準(zhǔn)確的具身化邏輯參數(shù)。人類的圖形認(rèn)知,大致應(yīng)當(dāng)分為幾何式、符號式和具象感知等不同類型。根據(jù)康德、胡塞爾、榮格、皮爾斯、德里達(dá)等人的討論,也根據(jù)目前科學(xué)的發(fā)展(如費爾馬大定理的證明等),在邏輯上AI有希望通過深度學(xué)習(xí)模式在這些方面獲得結(jié)構(gòu)性的突破進(jìn)展。此外,如果以人的身體為基準(zhǔn)作測量,進(jìn)行命名和限定,那么,運(yùn)動辨認(rèn)、空間、時間,包括顏色、聲音、觸覺等感官認(rèn)知的內(nèi)容,也有可能通過剛性的力迫運(yùn)算,實現(xiàn)其中包含內(nèi)容的算法化。
第二類則是轉(zhuǎn)化性的邏輯參數(shù)。這一類邏輯參數(shù)所涉及的現(xiàn)象,大多與個體精神體驗相關(guān),具有很大的個體差異性;并且它們牽涉部分大多缺乏客觀世界相對應(yīng)的客體事實,因此AI似乎不可能對其做直接的窮盡描述。但盡管如此,這些藝術(shù)現(xiàn)象仍然能夠借助某些具身化手段,通過相關(guān)生理表征行為的抽樣、建模、統(tǒng)計、概率計算等手段予以轉(zhuǎn)化性的過渡描述。這類邏輯參數(shù),多與人類情感相關(guān)。各種欲望因素如性欲等,毫無爭議與藝術(shù)創(chuàng)作具有極為緊密的關(guān)聯(lián)。AI本身沒有欲望可言(可算化也許是其唯一欲望),它如果要深度習(xí)得人類的藝術(shù)創(chuàng)作能力,邏輯上說它應(yīng)當(dāng)有能力辨認(rèn)藝術(shù)實踐中那些與欲望相關(guān)的現(xiàn)象并把它們轉(zhuǎn)化為可算的邏輯單元。但欲望在創(chuàng)作中介入的深度因人而異,比如在《金瓶梅》《索多瑪120天》等書中,很多意象都與性欲相關(guān),但在某些佛教作品中,性欲的因素差可歸結(jié)到無。如何從具身習(xí)得的角度出發(fā)描述此種現(xiàn)象,從目前來看,人們尚只能借助血壓、唾液、腎上腺素等的分泌、眼球轉(zhuǎn)動等生理指標(biāo)的測量、計算、模型化等予以轉(zhuǎn)化性說明。這種轉(zhuǎn)化有多少有效性,目前來看自然是很值得質(zhì)疑的。但從長遠(yuǎn)來看,如果樣本量足夠,且當(dāng)前的AI學(xué)習(xí)模式有長足進(jìn)步,AI此種轉(zhuǎn)化性邏輯參數(shù)測定、可算化仍有一定的理論實現(xiàn)可能。人類的激情和沖動,如憤怒、悲憫、仇恨、嫉妒、愛好(癖好、習(xí)性)、報復(fù)(復(fù)仇)欲等,以及參與到藝術(shù)創(chuàng)作的各種感覺因素(包括嗅覺、味覺等),都屬于這個層次的問題。前面我們談到了此類參數(shù)轉(zhuǎn)化生成的可能性,但實踐中可能問題重重。如果將各類激情和沖動都轉(zhuǎn)化為生物指標(biāo),這類轉(zhuǎn)化需要的人類學(xué)證據(jù)將是不可思議的龐大。如果還考慮到這些激情和沖動同時還能夠構(gòu)成多少種復(fù)雜藝術(shù)現(xiàn)象,這些現(xiàn)象且自有其歷史演化過程,那么這種轉(zhuǎn)化性可算表達(dá)幾乎是不可能的。更何況過度依賴心電圖、血壓、分泌物等來作為藝術(shù)具身化的主要參考指標(biāo),看起來也過于線性與簡單化了。
第三類為綜合的邏輯參數(shù)。人類藝術(shù)活動的基本經(jīng)驗,除了來自那些類屬性和個體情感(這些都與身體經(jīng)驗感知直接相關(guān)),還有部分與外在存在事實緊密相關(guān)。它們屬于被建構(gòu)的實體性精神事件:能夠被身體所感知、明證,但一般來說只存在于某一特定的群體中—且在這群體中存在著極大的差異空間,有時涉及重要的時間變量。比如說對特定國家之愛,對現(xiàn)代人來說,它肯定是一個能夠被理解的客體性事實,但此種愛意,大多數(shù)情況下只存在于該國家的公民群體中,并且群體中個體差別極大,既有勇于為國家之愛奉獻(xiàn)生命者,也可能有背叛國家者。考察這類經(jīng)驗的可算化問題,除了適當(dāng)引入前述描述性或轉(zhuǎn)化性研究的部分要素,還必須分析其中所包含的各種綜合性內(nèi)容,如歷史、地域、文化傳承、共同體性質(zhì)(政治、意識形態(tài))、群體間關(guān)系、技術(shù)條件等。文化傳承包含文字、倫理、信仰、趣味等,其中的信仰等內(nèi)容也必然是從世俗化一面來作思考的,是去神秘化的、可算的。這些綜合生成的東西,其根源盡管不是發(fā)自直接的身體經(jīng)驗,但對藝術(shù)創(chuàng)作往往具有強(qiáng)大的支配力,因此也可以將它們視同身體本能,必須歸納、總結(jié)某些特殊的邏輯參數(shù)形態(tài),比如關(guān)于文字的感覺、意識模式。再以技術(shù)背景為例,在透視法沒有被發(fā)明之前,它不可能被自覺地應(yīng)用到繪畫領(lǐng)域;在運(yùn)動攝像技術(shù)沒有興起時,便無所謂蒙太奇手法等問題。而在今天,透視、蒙太奇已成為現(xiàn)代人觀察世界、想象世界的精神本能,從這個角度說,現(xiàn)代視覺經(jīng)驗包括精神測量世界的基本姿態(tài),就是包含著對現(xiàn)代視覺機(jī)器(技術(shù))的理解(想象)的。因此在藝術(shù)活動中,它們就顯然需要被處理成為一個獨立的可算的集合(模塊)。這是第三類邏輯參數(shù)需要被單獨分立的理由。
截至目前,在AI藝術(shù)研發(fā)史上,繪畫是嘗試最多且成果最豐富的項目。無論是輔助繪畫、模仿繪畫,還是AI獨立創(chuàng)作技術(shù),都在不斷推陳出新,進(jìn)行著一場場技術(shù)革命,其中不少作品顯然已經(jīng)能夠通過圖靈測試。在此,我們以圖像為例結(jié)合上述分析從理論上還原AI創(chuàng)作的基本邏輯。第一步,分解各種圖像素材。無論進(jìn)行何種圖像創(chuàng)作,分解圖像素材都是基礎(chǔ)步驟。在這一過程中,可能涉及的基本分解邏輯是:(1)分解人、動物、植物與圖形相關(guān)的基本構(gòu)造單元(如將臉部肌肉按解剖學(xué)意義分解);(2)按某些功能、組合命名某些表情傳意的最小單元(如笑、哭、恐懼等);(3)按照某些基本物理事態(tài)(如光影對比、輪廓變形等)分解最小的功能單位,如石頭、皮膚、水、草木等不同的反射率、色彩變化等;(4)分解圖形靜止態(tài)與運(yùn)動態(tài)最核心的姿態(tài)差異(如電影《長城》的穿幫鏡頭其原因就在于完全沒有考慮風(fēng)與毛發(fā)飄動的關(guān)系)。第二步,按一定的邏輯組合、命名這些素材,以期形成更具表現(xiàn)能力的圖像模塊。第三步,在更大的尺度上定義某些人類活動的精神運(yùn)動態(tài)勢,在此尺度上定義、分解某些人類工作的學(xué)習(xí)樣本,從而使AI學(xué)習(xí)并模仿生成。
以上是關(guān)于一般藝術(shù)創(chuàng)作所涉及的內(nèi)在算法邏輯架構(gòu)的基本思考,并以圖像生成為例嘗試分析了AI的藝術(shù)創(chuàng)作過程。然而,除卻以上的歸納是否還有其他要素類型?如何研究這些要素在不同的藝術(shù)形式和藝術(shù)類型之間的具體邏輯關(guān)系?上述籠統(tǒng)的要素分析其內(nèi)涵如何更明確地界定?……相當(dāng)多的問題都超出了現(xiàn)有科學(xué)與人文認(rèn)識的水平,在此只能略過不談。
三、算法敘事的邏輯參數(shù):
AI寫作的理論構(gòu)想
前文討論了藝術(shù)活動可能涉及的一般經(jīng)驗領(lǐng)域如何實現(xiàn)可算的邏輯架構(gòu)問題,但現(xiàn)實中藝術(shù)活動還有很多具體形式架構(gòu)規(guī)定性。簡單來說,根據(jù)人類的藝術(shù)經(jīng)驗,上述要素還有某些結(jié)構(gòu)性的(也許是固化的)穩(wěn)定的形式樣態(tài)。這些形式樣態(tài)也需要做出可算化的邏輯描寫,這可能是當(dāng)前AI寫作想要取得明顯突破之處的關(guān)鍵。
總體來說,目前AI寫作(也包括其他藝術(shù)領(lǐng)域)的實踐分為抒情與敘事兩種基本形式類型,這也吻合人類藝術(shù)文體實踐的基本經(jīng)驗。我們在此主要探討文字?jǐn)⑹驴伤慊那疤帷?/p>
首先需要指出的是,從可算化的角度進(jìn)入,文字?jǐn)⑹滦枰c其他的敘事形態(tài)做出區(qū)別。恰如羅蘭 · 巴特所言:“對人類來說,似乎任何材料都適宜于敘事:敘事承載物可以是口頭或書面的有聲語言、是固定的或活動的畫面、是手勢,以及所有這些材料的有機(jī)混合?!盵1]不同形態(tài)的敘事,其內(nèi)核的遞歸邏輯不同。從算法角度來講,基本敘事形態(tài)可分為文字?jǐn)⑹?、圖像敘事、人體姿態(tài)敘事、綜合性敘事四種類型。文字?jǐn)⑹律院笥休^詳細(xì)討論,在此對其他三種基本的敘事進(jìn)路略作介紹。圖像敘事指單純依靠圖形的連接完成意義顯現(xiàn)、因果構(gòu)成。兒童的看圖說話,可以部分證明人類敘事可能擺脫文字甚至語言完成。當(dāng)代諸多的圖像理論以及榮格的原型理論、讓—呂克 · 戈達(dá)爾(Jean-Luc Godard)的電影實踐等,都為這方面的話題提供了一些重要的討論前提。當(dāng)前AI敘事創(chuàng)作的研究進(jìn)路之一,就是以圖畫敘事寓意的分析為AI敘事邏輯構(gòu)建提供學(xué)習(xí)樣本。[2]且不論此種邏輯構(gòu)建成效如何,這也說明圖像敘事的邏輯可能是自為的。姿態(tài)敘事則指以表情、身體動作、手勢、態(tài)度等為媒介的敘事方式。布萊希特的史詩劇就可被稱為姿態(tài)劇,另外像傀儡戲、啞劇、馬戲、舞蹈、體操等都說明姿態(tài)具有自身自為的敘事潛能。朗西埃的《美感論》、吉奧喬 · 阿甘本(Giorgio Agamben)的《普爾奇內(nèi)拉或獻(xiàn)給孩童的嬉游曲》(Pulcinella ovvero Divertimento per li regazzi)以及當(dāng)代諸多的姿態(tài)研究理論,都為這方面的話題提供了一些重要的討論前提。所謂綜合性敘事是指除了綜合文字、圖像、姿態(tài)等敘事外,還包括因為其綜合性生成某種獨有的敘事邏輯的敘事類型。比如以運(yùn)動的方式綜合各種敘事表現(xiàn)時,運(yùn)動所造成的事態(tài)便將生成諸多新的敘事可能和樣態(tài);又如蒙太奇和長鏡頭兩種理論為電影的敘事方法提供了不同可能性;再如劇場效應(yīng)需考慮到空間范疇,需要聲、光、電等諸種要素的結(jié)合才能夠?qū)崿F(xiàn)。由此觀之,動態(tài)所能夠形成的算法本質(zhì)上與靜態(tài)畫面完全不同。這四種基本敘事形態(tài)的實現(xiàn)從理論上講要依賴不同的AI算法邏輯才能得以實現(xiàn)。
文字?jǐn)⑹聦懽鞯目伤慊挚煞譃閮纱蟀鍓K。
第一板塊是文字組合的規(guī)律性問題。文字組合的可算化,所需要考慮的邏輯參數(shù)至少包含如下七個層面的內(nèi)容。第一,文字符號的組合規(guī)律。涉及文字?jǐn)⑹碌难菟銌栴}首先要考慮的是文字演算過程中會涉及的符號組合規(guī)律,主要是語法問題。相對而言,第一項是最易掌握也最具規(guī)律性的,也是目前AI本身取得突破最大的層面。第二,字的層面。這一項主要涉及音、義、字之間可能的不同組合方式。像方塊文字、象形文字、表音文字等之間的組合均不一樣,不過對于計算機(jī)程序本身而言,實現(xiàn)這一層面的突破從理論上講并不困難,只要學(xué)習(xí)積累到一定層次,便可以較好地呈現(xiàn)出不同類型文字間的組合方式。第三,詞的層面。根據(jù)一般的詞性分類,在演算過程中必須考慮到名詞、代詞、動詞、介詞、形容詞及其他如擬聲詞、數(shù)量詞等不同的詞性。一句話形成的關(guān)鍵在于詞和詞的搭配使用,從演算角度來講,詞的組合也是構(gòu)成一個句子表意的關(guān)鍵所在。這其中又涉及兩個難點。其一是詞與詞的組合,從現(xiàn)象上看描述的理論難度不大,但十分煩瑣(比如如何限定一個詞在什么樣的情況下可以與另一個詞搭配,且能夠準(zhǔn)確傳達(dá)敘事構(gòu)造所欲傳達(dá)的涵義)。其二的問題由第一點引發(fā)。從人類心智的角度看,習(xí)得詞的組合能力一定不是描述性的而是生成性的。原則上人類掌握不多的生成規(guī)律就能識別一切詞義組合的可能性。從這個角度說AI也應(yīng)當(dāng)具備生成性的詞義組合能力。這完全依賴于人類對各種類詞性的本質(zhì)功能界定和準(zhǔn)確描述。但從目前語言學(xué)界的研究看,要在這方面取得大的突破可能還有很長的路要走。比如說,如何令A(yù)I習(xí)得識別專有名詞及其向普通名詞轉(zhuǎn)化的能力,就可能是一件非常困難的事情。在所有的語法理論中,專有名詞均是一個自明的語言現(xiàn)象,但各家定義有所不同(有趣的是,人類心智在很早的階段就已具備這一能力)。第四,文字與聲音層面。眾所周知,所有的文字符號均來自聲音,以至于我們在閱讀文字時會不由自主地想象它的聲音。不過文字符號的組合又有擺脫聲音的過程。文字與聲音的關(guān)系需要更為充足的、特別是結(jié)構(gòu)主義語言學(xué)背景來予以支撐,但二者關(guān)系如何轉(zhuǎn)化為文字?jǐn)⑹滤惴梢粤?xí)得的邏輯框架仍是未知的問題。第五,文字的歷史演變。在設(shè)計文字演算過程時,必須要考慮文字的歷史演變因素。像漢語便有古今異義詞的區(qū)分,一些詞語意義發(fā)展至今其內(nèi)涵也會有一定的發(fā)展變化。人類在創(chuàng)作過程中會有意無意間加入某個或某些詞的古意以形成一種特殊的敘事效果,但這些詞語如何進(jìn)行算法,這對AI來講目前還是一大難題。第六,外來詞、生造詞(如許多網(wǎng)絡(luò)語言)的運(yùn)用。人類對于外來詞的識別和轉(zhuǎn)化都不成問題,許多日常詞匯如沙發(fā)、咖啡等都屬于外來詞的范疇。但在面對一些較為生僻的外來詞時,對計算機(jī)而言,要進(jìn)行合理的算法邏輯描述也具有一定的難度。第七,文字信號與因果律構(gòu)建。詞與詞之間、句與句之間邏輯上的因果構(gòu)造,某一些信號的聯(lián)系必然會導(dǎo)引出某一種預(yù)定的結(jié)果。但這種描述若轉(zhuǎn)化成相應(yīng)的算法則十分困難,因為人類在使用文字來進(jìn)行敘述時,通過文字的組合形成的與事件相關(guān)的演算信號,包含了許多因果律上的直觀見解,其中的典型代表便是敘事中的省略問題。對文學(xué)敘事而言,省略是最重要的因果律的構(gòu)建方式之一。而具體的省略如何進(jìn)行,何種因果條件可以不提及省略的前提,何種情況又可以不談及省略的過程,何種又不用論及結(jié)果,這些都是考驗人類敘事能力最直觀的部分。但這種能力對于算法的描述而言相當(dāng)困難。不過,就文字信號和因果律這一層面而言,不排除在計算機(jī)層面可以被繞過的可能性(即通過算法與學(xué)習(xí)窮盡各種省略的必要條件)。關(guān)于這方面的具體討論則需要更為專業(yè)的思考。
第二板塊,即繞過文字組合規(guī)律的細(xì)節(jié),根據(jù)風(fēng)格論與敘事類型學(xué)的理論,在較大尺度上給出文字組合的基本模型。希望在足夠的樣本學(xué)習(xí)基礎(chǔ)上,通過恰當(dāng)調(diào)試,令A(yù)I掌握基本的文字表現(xiàn)形式,并通過圖靈測試。當(dāng)前AI文字寫作的基本邏輯構(gòu)造,看起來主要便基于第二板塊的邏輯構(gòu)造模式。根據(jù)這種模式,目前的AI抒情寫作與敘事寫作其實是一回事。從現(xiàn)實操作而言,二者的本質(zhì)邏輯是相同的,即通過有聯(lián)系的連續(xù)幾張圖像,提取其中可能包含的人物的情感色彩或故事的情節(jié)發(fā)展,以規(guī)定的文字方式呈現(xiàn)出來(參見圖1)。不過,AI敘事寫作就既有成果而言仍有很長的路要走。比如像同樣基于圖像學(xué)習(xí)的微軟小冰敘事詩的創(chuàng)作,其生成重點更強(qiáng)調(diào)故事情節(jié)的連貫性與敘述的完整性。若要培養(yǎng)AI“自主創(chuàng)作”的發(fā)展方向,很有可能會無法兼顧AI的詩歌語言學(xué)習(xí),這就導(dǎo)致生成的詩歌走向“按圖說話”的模式,其敘事功能僅停留在表面,而忽略了詩歌的文學(xué)性和抒情功能的表達(dá),這也是敘事詩歌質(zhì)量較不穩(wěn)定的原因。而在更為復(fù)雜的長篇敘事寫作中,AI則面臨著更多的挑戰(zhàn)。最新的語言生成算法模型GPT-3體現(xiàn)了自然語言處理取得的進(jìn)步。人工智能語言生成器中的挑戰(zhàn)之一是在長文本范圍內(nèi)保持連貫性,像之前的GPT-2模型往往在幾句話之后便失去了一致性。GPT-3確實能夠在幾段文字上仍保持一定的話題性,這主要是因為GPT-3最基本的功能是自動補(bǔ)全,給它一個詞或句子,它就會逐字逐句地生成它認(rèn)為接下來該出現(xiàn)的詞句。但從根本上講,GPT-3不會帶來任何新變化,較GPT-2而言所獨有的只是訓(xùn)練數(shù)據(jù)集和“計算”量,而若想在模型中灌輸常識、因果推理或道德判斷,仍是AI目前不能實現(xiàn)的挑戰(zhàn)。
基于深度學(xué)習(xí)的AI寫作技術(shù)想要真正取得突破必須具備一系列基本條件,包括須是單一任務(wù),任務(wù)邊界清楚,信息完備,結(jié)果判斷量化、明確,等等。但就目前而言,AI敘事從理論上來講就面臨著幾大難以突破的難題。首先,AI敘事缺乏目的,缺乏標(biāo)準(zhǔn),樣本量太大。事實上這種可再生成性的語匯的邏輯關(guān)系,還是需要獲得重大突破才可能形成一種內(nèi)在的可計算的、但是又能自由轉(zhuǎn)化的語言。其次,AI敘事對名詞的辨析較為困難。名詞,特別是作為普通名詞而言,往往包含了非常復(fù)雜的記憶性內(nèi)容。這種記憶性的內(nèi)容通常還包含家庭、宗教、社會以及文本、虛構(gòu)科技等要素。人要辨析一個普通名詞中所包含的特征即轉(zhuǎn)化機(jī)制非常容易,但是對于機(jī)器來說卻很困難。一旦小說涉及諸多非邏輯的話題如意志、欲望、敘事、暴力、道德、死亡等類似具身體驗的東西,機(jī)器根本無法習(xí)得,就只能在一定邏輯框架中做外部模仿。再次,AI難以將虛構(gòu)內(nèi)容向?qū)嶓w性內(nèi)容轉(zhuǎn)化。實體性的內(nèi)容是一個客觀實在,它的存在不會因為別的任何方式的介入而改變或消失。從這一邏輯來講,敘事包含著兩種實體的天然的區(qū)別:一種實體能夠找到世界情況的客觀對應(yīng);另一種實體是人類虛構(gòu)的,若讓機(jī)器進(jìn)行這種虛構(gòu)向?qū)嶓w的轉(zhuǎn)變則十分困難。最后,AI難以習(xí)得純粹觀念性的內(nèi)容。機(jī)器最容易習(xí)得的是科學(xué)觀念性的內(nèi)容,但是對比如佛、上帝這種概念既找不到它的外延,也找不到它的內(nèi)涵。
就目前技術(shù)水平而言,AI敘事寫作之所以看起來像是敘事,是因為:第一,它用來組合的類型化樣本片段比較大,這種既有的樣本化素材本身就包含了一些事件的組合關(guān)系,根據(jù)格式塔心理,人們會強(qiáng)行為這些拼貼的樣本的事件之間補(bǔ)足因果關(guān)系;第二,這些類型學(xué)習(xí)的樣本內(nèi)在邏輯構(gòu)造是極其線性化與單調(diào)的。這種算法模型能否完成長篇的、有內(nèi)在變化的因果律組合,頗可懷疑。
結(jié)語
從算法角度出發(fā),就計算機(jī)與人腦可比較的層面而言,根據(jù)現(xiàn)有的計算機(jī)技術(shù)(包括算法等),拷問AI是否可能具有藝術(shù)能力,很可能本質(zhì)上就是一個緣木求魚的問題。就目前的AI技術(shù)而言,它參與人類活動并能超越人類能力,一般都在可計算的領(lǐng)域。它的內(nèi)部邏輯構(gòu)造再復(fù)雜,其實目標(biāo)是單一且確定的。就像阿爾法狗圍棋上戰(zhàn)勝人類,其突破主要是在發(fā)明了一種通過概率計算的方法,繞過了龐大數(shù)據(jù)對技術(shù)能力的考驗。但其邏輯目標(biāo)本身是簡單的:設(shè)定一種程序,依照圍棋的規(guī)則,爭取在19路棋盤上達(dá)到或超過181點以上的點位,能夠完成這一目的計算即為成功,否則就是失敗。而對藝術(shù)工作而言,在大多場合都很難說有什么是非判斷的標(biāo)準(zhǔn);各藝術(shù)品之間也很難說有什么統(tǒng)一的標(biāo)準(zhǔn),那么如何能夠有效地根據(jù)一定的邏輯計算方法判定AI演算的有效性呢?即便人們在藝術(shù)標(biāo)準(zhǔn)等方面達(dá)成了一些極有彈性的、通解方面的認(rèn)識,文中談到的幾個前提仍將對相關(guān)的工作提出巨大考驗。
盡管如此,當(dāng)前的AI藝術(shù)探索,仍然是極具價值的,我們不能排除AI未來會形成專屬于自己的敘事方法的可能性,也不排除會產(chǎn)生一種諸多要素具有通解的邏輯框架。此外,還有一種理論上的可能,那便是計算機(jī)通過超大樣本的學(xué)習(xí),使得AI敘事自動覆蓋或超越人類敘事。因為就計算機(jī)與人腦的對比而言,人腦的演算精度與計算機(jī)相距太遠(yuǎn)。而是否有可能設(shè)想這就是智慧生命最終本質(zhì)的差距。如果情況是這樣,據(jù)人類創(chuàng)作過程架構(gòu)的邏輯框架對具有超精度計算能力的計算機(jī)而言,其本身就是一種不好的邏輯框架,我們依據(jù)人類藝術(shù)活動經(jīng)驗來規(guī)約、設(shè)想AI藝術(shù)的發(fā)展可能本身就是一種坐井觀天的想法。當(dāng)然,盡管科幻文藝在這方面已經(jīng)談了許多(如阿西莫夫的小說,如電影《銀翼殺手》),但從目前AI發(fā)展的情況來看,這些基本都可以歸于玄談,暫可存而不論。
本文系中國人民大學(xué)科學(xué)研究基金重大項目“新時期歐美戲劇理論譯介與影響研究(1980—2019)”(項目批準(zhǔn)號:2021030015)階段性成果。
責(zé)任編輯:秦興華