翟秀鳳
( 首都師范大學 文化研究院,北京,100089 )
AIGC(人工智能生成內(nèi)容)已成為業(yè)界和學界的熱門議題。由于AIGC在創(chuàng)造性內(nèi)容上的生成性,其對學術(shù)生產(chǎn)和出版的影響得到諸多研究者的關(guān)注。不過,現(xiàn)有研究主要聚焦于人工智能的技術(shù)可能性及其傳播倫理風險,較少將作為網(wǎng)絡內(nèi)容經(jīng)濟主體和生成性智能所有者的平臺作為關(guān)鍵主體加以探析。事實上,智能技術(shù)的實踐性恰恰來自于其與平臺內(nèi)容經(jīng)濟及其資本邏輯結(jié)合之后所引發(fā)的政治、經(jīng)濟及社會效應?;诖?對AIGC與學術(shù)出版關(guān)系的分析,需要將前者置于其賴以發(fā)展的平臺經(jīng)濟形態(tài)中,以厘清平臺內(nèi)容經(jīng)濟的發(fā)展邏輯如何介入知識生產(chǎn)過程及其產(chǎn)業(yè)模式。本文首先通過回溯UGC(用戶內(nèi)容生產(chǎn))到AIGC的內(nèi)容產(chǎn)業(yè)脈絡,分析AIGC誕生的必然性。在此基礎(chǔ)上,探討平臺經(jīng)濟何以依托其規(guī)則和技術(shù)優(yōu)勢形成對學術(shù)出版產(chǎn)業(yè)的挑戰(zhàn)和風險,并嘗試沿著這一思路探討可能的治理進路。
平臺的內(nèi)容生產(chǎn)機制經(jīng)歷了從UGC、PGC(專業(yè)內(nèi)容生產(chǎn))、AI輔助內(nèi)容生產(chǎn)到AIGC的演進歷程。在不同的發(fā)展階段,平臺選擇性地創(chuàng)造和調(diào)用不同的生產(chǎn)理念及運行模式,以適應其內(nèi)容變現(xiàn)的原初目標?;仡欉@一歷程,將有助于理解算法迭代如何助推了平臺內(nèi)容經(jīng)濟的演進,并厘清平臺內(nèi)容經(jīng)濟所遵循的基本邏輯。
平臺內(nèi)容經(jīng)濟緣起于用戶的免費勞動和自發(fā)性參與。在平臺興起的初期,吸納和鼓勵用戶加入社交網(wǎng)絡,并迅速完成原始數(shù)據(jù)積累是平臺發(fā)展的首要目標。這一階段,以倡導參與式傳播為特征的UGC成為平臺發(fā)展的主流理念,與之伴隨的是一套以去中心化、反權(quán)威性和技術(shù)賦權(quán)為核心的主流話語。然而,隨著用戶體量和規(guī)模的上升,平臺迅速發(fā)現(xiàn)了以UGC為基礎(chǔ)的商業(yè)模式的內(nèi)在悖論:散亂無章的用戶業(yè)余內(nèi)容與商業(yè)營銷的明確需求之間的矛盾。一方面,平臺需要吸引大量用戶持續(xù)生產(chǎn)內(nèi)容,以便積累用于營銷活動的數(shù)據(jù);另一方面,“用戶生成的業(yè)余內(nèi)容可能不像主流媒體商業(yè)內(nèi)容那樣符合廣告的要求”(1)Andrejevic M, “Exploiting YouTube: Contradictions of user-generated labor”, The Youtube Reader, vol.413,No.36, 2009, pp.406-423.,因為廣告商需要的是與自身商業(yè)訴求相一致的專業(yè)內(nèi)容。這一階段,平臺商業(yè)宣傳往往聚焦于用戶總數(shù)及其變現(xiàn)潛力,其本身數(shù)據(jù)挖掘和算法開發(fā)的能力仍十分有限。
在解決上述悖論的過程中,平臺內(nèi)容經(jīng)濟模式逐漸發(fā)生轉(zhuǎn)變:PGC成為平臺更為青睞的生產(chǎn)機制。傳統(tǒng)媒體生產(chǎn)機構(gòu)(新聞機構(gòu)、電視臺或其他影視制作機構(gòu))有更為專業(yè)的生產(chǎn)能力和對目標受眾的吸納能力。他們的入駐使傳統(tǒng)媒體影響力向平臺機構(gòu)逐漸轉(zhuǎn)移,傳統(tǒng)媒體也試圖借此完成其數(shù)字化轉(zhuǎn)型和渠道拓展。然而,平臺很快洞察到以PGC為基礎(chǔ)的商業(yè)模式的新弊端:專業(yè)生產(chǎn)機構(gòu)的數(shù)量和內(nèi)容產(chǎn)量有限,無法面向平臺海量、多層次的用戶開展內(nèi)容定制;同時,版權(quán)購買成本高,這極大地壓縮了平臺盈利的空間。在此階段,平臺已經(jīng)著手挖掘用戶行為和消費數(shù)據(jù),并開發(fā)出一系列用于內(nèi)容變現(xiàn)的算法程序和營銷工具。鼓勵用戶對算法后臺和營銷工具的創(chuàng)新性使用,培養(yǎng)平臺原生的消費主義倡導者成為平臺的重要目標。
在此過程中,一批平臺原生的內(nèi)容創(chuàng)作者開始涌現(xiàn),并逐漸成為網(wǎng)絡影響力版圖中不可忽視的力量。他們既包括專注于新聞資訊和知識生產(chǎn)的自媒體內(nèi)容創(chuàng)作者,也包括面向各個商業(yè)垂直領(lǐng)域的消費主義倡導者。為了提高網(wǎng)絡內(nèi)容的變現(xiàn)效率,平臺開始積極促進AI輔助內(nèi)容生產(chǎn)的推廣和擴散。這一階段,算法在平臺內(nèi)容經(jīng)濟中的角色主要可以概括為三個方面:一是內(nèi)容需求分析,算法后臺工具用于分析目標受眾數(shù)據(jù)并提供內(nèi)容定制的方向性建議;二是內(nèi)容精準推送,通過推送算法使內(nèi)容抵達目標受眾并提升用戶黏性和消費欲望;三是內(nèi)容營銷變現(xiàn),為內(nèi)容生產(chǎn)者和用戶提供專門的后臺算法工具,用于匹配相應的廣告和營銷需求。至此階段,除了少數(shù)新聞機構(gòu)和組織開始嘗試規(guī)范性文本的機器輔助撰寫(如體育新聞稿、實時地震資訊發(fā)布等)外,AI輔助內(nèi)容生產(chǎn)主要體現(xiàn)在算法對用戶數(shù)據(jù)和分發(fā)渠道的挖掘,并未進入創(chuàng)造性內(nèi)容生產(chǎn)的層面。
在以上過程中,算法對內(nèi)容貨幣化的支持作用日趨顯著,平臺內(nèi)容經(jīng)濟的規(guī)模出現(xiàn)了爆發(fā)式增長,并產(chǎn)生了流量分成、打賞機制、版權(quán)轉(zhuǎn)化、網(wǎng)絡直播等新穎的盈利模式。不過,以上所有的算法仍然不具備創(chuàng)造性內(nèi)容的產(chǎn)出能力,且均屬于傳統(tǒng)意義上的分析式算法(Analytical AI),即利用機器學習分析數(shù)據(jù)的分布特征,從而開展樣本分類、預測等任務。與其相比,新近的生成性人工智能(Generative AI)的運行邏輯與分析式算法則顯然不同。生成性AI不僅分析數(shù)據(jù)本身,更能夠?qū)W習數(shù)據(jù)的產(chǎn)生模式(如語言模型),因而能夠根據(jù)所學模型創(chuàng)作數(shù)據(jù)中并不存在的內(nèi)容。例如,AIGC不僅能形成由原始素材拼湊而成的抽取式文本摘要,還能輸出生成性文本摘要,即在對文本形成抽象認識的基礎(chǔ)上創(chuàng)造新詞并靈活概括。
AIGC的出現(xiàn)是平臺大量資本投入和技術(shù)研發(fā)的結(jié)果,同時也是平臺內(nèi)容經(jīng)濟運行邏輯的必然產(chǎn)物。從UGC到AI輔助生產(chǎn),算法雖然已經(jīng)成為內(nèi)容生產(chǎn)的基礎(chǔ)設(shè)施,但平臺對內(nèi)容生產(chǎn)的主導性仍未能完全確立。這與平臺內(nèi)容經(jīng)濟希望全面占有信息資本生產(chǎn)要素(如數(shù)據(jù)、內(nèi)容)的訴求產(chǎn)生了矛盾;與此同時,人工內(nèi)容生產(chǎn)的相對低效和不穩(wěn)定性,也限制了平臺對內(nèi)容生產(chǎn)規(guī)?;淖非蟆U窃谶@些問題的驅(qū)動下,大型互聯(lián)網(wǎng)企業(yè)開始全面發(fā)力生成性人工智能。除了以微軟為代表的百億美元企業(yè)投資,風險投資也成為AIGC的主要資本來源。知名跨國投資機構(gòu)紅杉資本近年來共投資50余家AIGC初創(chuàng)企業(yè),僅文本生產(chǎn)領(lǐng)域就有20余家。在國內(nèi),百度、阿里、字節(jié)跳動等平臺持續(xù)押注AIGC,而美團對人工智能企業(yè)光年之外的21億元并購,更是成為迄今國內(nèi)最大的AIGC投資。
隨著AIGC技術(shù)的不斷迭代,加之資本強勢介入所產(chǎn)生的收益訴求,網(wǎng)絡內(nèi)容市場的盈利機制也會出現(xiàn)更新與調(diào)整:與AIGC直接相關(guān)的創(chuàng)作型內(nèi)容產(chǎn)業(yè)會成為平臺重點投資的領(lǐng)域,其中的典型領(lǐng)域如學術(shù)出版產(chǎn)業(yè)將受到直接的沖擊和影響。
當然,這一趨勢并非平臺向?qū)W術(shù)出版領(lǐng)域的單向運動。事實上,學術(shù)出版業(yè)對平臺規(guī)則的主動適應已經(jīng)成為顯著的趨勢。近年來,數(shù)字化轉(zhuǎn)型、平臺化轉(zhuǎn)型和知識服務功能轉(zhuǎn)型成為學術(shù)出版領(lǐng)域的突出表現(xiàn),主要包括對數(shù)據(jù)畫像、內(nèi)容評級等算法手段的引入(2)季丹:《數(shù)字時代國際出版業(yè)的平臺型商業(yè)模式研究》,《出版發(fā)行研究》2022年第3期。,以及對出版內(nèi)容公眾接受度評價的重視(3)陳銘:《知識生產(chǎn)視域下的科學數(shù)據(jù)出版實踐——兼論學術(shù)出版商的角色定位與功能分析》,《科技與出版》2022年第12期。。這些探索與平臺內(nèi)容經(jīng)濟的運行邏輯有著內(nèi)在一致性:在內(nèi)容組織上,以平臺化方式重組信息,并希望借助智能算法介入內(nèi)容傳播過程;在內(nèi)容生產(chǎn)上,弱化對生產(chǎn)端專業(yè)主義價值的突出強調(diào),強化對知識服務和受眾需求端的滿足;在內(nèi)容評價上,要求提升信息更新的頻率,并引入對內(nèi)容推廣的量化考核體系。
可以說,在AIGC出現(xiàn)之前,平臺內(nèi)容經(jīng)濟的一整套組織、生產(chǎn)和評價體系已經(jīng)在持續(xù)影響和塑造著學術(shù)出版產(chǎn)業(yè)。而AIGC的出現(xiàn)無疑成為持續(xù)加速這一過程的催化劑。因此,對AIGC的思考不應局限于技術(shù)的倫理思辨或文化價值的悲情哀惋,更應該將其背后的平臺內(nèi)容經(jīng)濟納入分析視野。換言之,AIGC不僅僅是技術(shù)創(chuàng)新和產(chǎn)業(yè)融合問題,更是一個平臺內(nèi)容經(jīng)濟跨越其技術(shù)壁壘,邁入創(chuàng)造性勞動領(lǐng)域的重大轉(zhuǎn)折,由此帶來的知識生產(chǎn)和傳播的政治經(jīng)濟問題值得深入討論。
自互聯(lián)網(wǎng)誕生以來,資本始終在尋求一種穩(wěn)定、高質(zhì)量的內(nèi)容輸出能力:UGC不穩(wěn)定的數(shù)量和參差不齊的質(zhì)量、PGC的高成本和數(shù)量限制、早期Al輔助生產(chǎn)內(nèi)容的低自動化、低智能化及其對人工監(jiān)督的依賴等,都難以滿足資本對兼具數(shù)量、質(zhì)量、效率的商業(yè)內(nèi)容的迫切訴求。而在AIGC領(lǐng)域,技術(shù)和資本再次找到了一個兼具技術(shù)想象力和市場吸引力的結(jié)合點??梢哉f,AIGC技術(shù)的應運而生是全球互聯(lián)網(wǎng)資本面向其長期訴求開展大規(guī)模資源配置的結(jié)果。與此同時,平臺已經(jīng)建構(gòu)起一整套內(nèi)容經(jīng)濟的成熟的規(guī)則體系和運行機制(包括所有權(quán)屬界定、用戶積累方式、內(nèi)容供給調(diào)節(jié)等)。隨著AIGC在創(chuàng)造性內(nèi)容領(lǐng)域為平臺打開新的技術(shù)可能性,平臺將利用其規(guī)則建構(gòu)和技術(shù)優(yōu)勢,重塑學術(shù)生產(chǎn)和出版的運行邏輯。具體而言,其主要包括以下方面:
按照大型互聯(lián)網(wǎng)平臺的現(xiàn)有注冊協(xié)議,用戶在平臺注冊的賬號、發(fā)布的內(nèi)容,其所有權(quán)、著作權(quán)、使用權(quán)均歸屬平臺所有,因此平臺有權(quán)對內(nèi)容開展商業(yè)利用,對用戶開展算法測試,并有權(quán)對內(nèi)容和賬號開展限流、屏蔽、封禁等一系列的操作。換言之,平臺作為網(wǎng)絡應用這一基礎(chǔ)設(shè)施的提供者,對在此應用上所生產(chǎn)的內(nèi)容具有完全法律權(quán)限。這是平臺內(nèi)容經(jīng)濟得以運行和發(fā)展的基礎(chǔ)性優(yōu)勢,也是信息資本現(xiàn)有運行機制中的關(guān)鍵一環(huán)。
按照此邏輯,如果用戶注冊平臺的賬號并使用平臺提供的AIGC工具進行內(nèi)容生產(chǎn),那么平臺就可以通過用戶協(xié)議獲得對這一內(nèi)容的所有權(quán)、使用權(quán)和收益權(quán)。然而,這一訴求與傳統(tǒng)學術(shù)出版中對著作權(quán)主體(人類作者)的保護產(chǎn)生了顯著的權(quán)屬爭議和沖突?;谄脚_及其AIGC工具所產(chǎn)出的內(nèi)容,究竟應該歸屬個體創(chuàng)作者所有還是平臺投資者所有?這一問題已經(jīng)引發(fā)諸多爭論。
部分學者依據(jù)現(xiàn)有著作權(quán)的定義,對AIGC的“獨創(chuàng)性”持有堅決的否定論。這些學者認為,人工智能缺少直覺、靈感等思維要素(4)李俊:《論人工智能生成內(nèi)容的著作權(quán)保護》,《甘肅政法學院學報》2019年第4期。,沒有作為精神與意識活動的創(chuàng)作過程、認知能力、主體性意識和內(nèi)在人格基礎(chǔ),因而不具備獨創(chuàng)性。讀者獲得的知識、思想和情感僅僅是人工智能工具運用算法規(guī)則進行模板化輸出和模仿的結(jié)果。(5)王遷:《論人工智能生成的內(nèi)容在著作權(quán)法中的定性》,《法律科學(西北政法大學學報)》2017年第5期。此外,人工智能生成成果是依托文字、色彩、線條和符號等公共性資源生成的非稀缺性、非競爭性成果,為避免通過強力計算獲得大量數(shù)據(jù)并要求版權(quán)保護的“數(shù)據(jù)圈地”行為,AIGC成果不應受《著作權(quán)法》保護。(6)宋紅松:《純粹“人工智能創(chuàng)作”的知識產(chǎn)權(quán)法定位》,《蘇州大學學報(哲學社會科學版)》2018年第6期。
與之相對,有相當一部分學者倡議給予AIGC成果以著作權(quán)。這些學者認為,AIGC內(nèi)容已經(jīng)具有了與人類創(chuàng)作作品的“不可識別性”(7)吳雨輝:《人工智能創(chuàng)造物著作權(quán)保護:問題、爭議及其未來可能》,《現(xiàn)代出版》2020年第6期。和不依賴人類寫作的實踐過程,因而應對其著作權(quán)予以認定。有學者進一步建議按照分類保護的治理進路,對人工智能創(chuàng)作作品與傳統(tǒng)版權(quán)作品開展區(qū)分。該思路建議按照“老人老辦法,新人新辦法”的現(xiàn)實問題導向,為AIGC作品設(shè)置與傳統(tǒng)版權(quán)領(lǐng)域不同的判斷標準,以便在短期內(nèi)達成維持傳統(tǒng)版權(quán)利益格局與保護新興產(chǎn)業(yè)利益的雙重目的,之后逐漸探索基于平臺參與的“特別許可市場”,從而實現(xiàn)著作權(quán)屬從“創(chuàng)作者所有”向“投資者所有”的轉(zhuǎn)變。(8)郭萬明:《人工智能生成成果的法律性質(zhì)及著作權(quán)保護》,《出版發(fā)行研究》2022年第5期。
倡導對AIGC著作權(quán)以及投資者權(quán)利的認定,是在嘗試回應技術(shù)發(fā)展帶來的新變化。然而值得注意的是,這里所論及的“投資者”和“開發(fā)者”無疑主要集中在以大型平臺為代表的商業(yè)巨頭。因而,這些主張的本質(zhì)是從數(shù)據(jù)財產(chǎn)保護的正當性視角來闡釋平臺占有AIGC成果的法律邏輯,進而為平臺AIGC成果確權(quán)。
然而,與確權(quán)傾向伴隨的是問責機制的嚴重滯后。一方面,AIGC并非自然人或法人,其無法對算法生成的成果承擔相應責任。如《科學》(Science)和《自然》(Nature)等頂級期刊仍然拒絕接受生成性工具產(chǎn)出的成果,其原因就在于智能工具無法承擔成果的真實性、準確性等一系列責任。另一方面,如何界定作為數(shù)據(jù)搜集者、算法開發(fā)者、算法所有者的大型互聯(lián)網(wǎng)平臺在生成性內(nèi)容中所具有的社會責任,仍是一個懸而未決的問題。大型互聯(lián)網(wǎng)平臺兼具資本優(yōu)勢和技術(shù)優(yōu)勢。如果他們獲得對生成性內(nèi)容的法律權(quán)力,也就獲得了相關(guān)資源配置和盈利模式的絕對主導權(quán)。相對來說,學術(shù)出版機構(gòu)與個體作者的議價能力可能會被削弱,這與學術(shù)出版對創(chuàng)造性勞動保護的初衷背道而馳。
平臺內(nèi)容經(jīng)濟的核心邏輯是以用戶吸引和用戶積累為基礎(chǔ),進而提高網(wǎng)絡內(nèi)容的變現(xiàn)效率。如果平臺介入學術(shù)生產(chǎn)和出版,該領(lǐng)域?qū)⒖赡墚a(chǎn)生平臺算法工具下的一場關(guān)于技術(shù)開發(fā)能力和經(jīng)濟投入的軍備競賽。
一方面,平臺會通過推廣AIGC工具迅速吸引一大批學術(shù)生產(chǎn)領(lǐng)域的用戶和使用者,從而沖擊高校和科研機構(gòu)的現(xiàn)有運行規(guī)則。按照內(nèi)容市場的一般運行機制,平臺希望通過用戶和數(shù)據(jù)量級的提升激發(fā)爆發(fā)式的飛輪效應,以便進一步提升模型準確性。飛輪效應指的是隨著用戶的增加,更多的數(shù)據(jù)能用于訓練更好的模型,而更好的模型能吸引更多用戶,如此循環(huán)往復。事實上,ChatGPT僅用了2個月就達到了1億用戶,而TikTok和Instagram達到該數(shù)量分別用9個月和2.5年。而ChatGPT的現(xiàn)有用戶中,很大比例來自于高校和科研機構(gòu),大量國內(nèi)科研人員也已經(jīng)下載并正在使用AIGC工具。
另一方面,平臺對AIGC的免費或低價推廣會迅速占領(lǐng)以高校學生為代表的學術(shù)預備群體,從而在人才培養(yǎng)和知識代際的層面弱化科研出版的價值。通過學術(shù)閱讀補充課程教育,從而完成自身的研究任務(如學術(shù)論文),是高校學生購買和閱讀學術(shù)出版物的直接原因。如今,AIGC帶來了科研投機的便利。美國北密歇根大學的教授在學生作業(yè)中發(fā)現(xiàn)了一篇關(guān)于世界宗教的“完美論文”,其語法幾乎無可挑剔,而這篇論文最終證明是由ChatGPT撰寫的。盡管不少高校已經(jīng)明令禁止使用ChatGPT完成作業(yè),但也有諸多高校正在將ChatGPT引入圖書館的工具庫中??觳褪降膶W術(shù)撰寫一旦成為合法化的常態(tài),作為專業(yè)主義場域的學術(shù)生產(chǎn)便面臨著祛魅,其作為知識傳承和人文鏈接的價值也因此被消解,而基于此所形成的學術(shù)出版產(chǎn)業(yè)也必然面臨萎縮的可能。
一方面,規(guī)?;a(chǎn)可能會弱化學術(shù)成果的專業(yè)性和權(quán)威性。在低注意力持續(xù)時間和閱讀量大幅減少的趨勢下,AIGC所提供的高效的、淺表性的專業(yè)知識生成越來越與平臺倡導的信息服務邏輯趨于一致,以用戶信息定制和品味迎合為基礎(chǔ)的平臺信息服務與專業(yè)知識生產(chǎn)之間的界限進一步變得模糊。如今,社交媒體文章已經(jīng)成為學術(shù)發(fā)表的重要引用來源之一。如果AIGC在自媒體內(nèi)容生產(chǎn)中得到普及,那么按需定制的信息服務就可以以專業(yè)知識生產(chǎn)的面貌實現(xiàn)規(guī)模化的生產(chǎn)。不難想見,AIGC撰寫的文章之間還可以實現(xiàn)相互引用和對話。在此意義上,AIGC不僅會帶來剽竊民主化的風險,同時更會構(gòu)成對學術(shù)知識獲取方式和知識理念的沖擊。在學術(shù)研究壁壘相對較低的學科,科研人員的智識積累將被迫與平臺的算法訓練成果開展比較,甚至陷入“專家不如AI”的輿論處境中。
另一方面,規(guī)?;a(chǎn)的便捷性會放大訓練數(shù)據(jù)中已有的社會偏見。人工智能所依賴的訓練數(shù)據(jù)缺乏公開性和社會監(jiān)督,其不僅體現(xiàn)著開發(fā)者的價值觀念,也承載著數(shù)據(jù)本身的社會偏見。使用AIGC進行研究資料收集和撰寫,不僅直接受制于訓練數(shù)據(jù)集的選擇范圍,同時也會復制訓練過程中的偏見和歧視。這都會損害學術(shù)研究的客觀性和嚴謹性,降低學術(shù)成果的說服力。此類成果偏見一旦經(jīng)過大眾傳媒的二次傳播和意義再生產(chǎn),將會帶來大規(guī)模的社會關(guān)注、討論甚至網(wǎng)絡暴力。例如,曾有人用1.35億條仇恨言論信息訓練AIGC,隨后該AIGC模型在不到24小時內(nèi)發(fā)布了超過1.5萬條網(wǎng)絡暴力網(wǎng)文,且在最初沒有人識別出這些內(nèi)容來自AI。算法黑箱中的社會偏見一旦被學術(shù)成果引用并得以傳播,會天然獲得權(quán)威性和專業(yè)性的“背書”,因而也會對社會規(guī)范和倫理道德帶來更加深刻的危害和沖擊。
學術(shù)性內(nèi)容是平臺一直以來試圖開發(fā)的垂直內(nèi)容領(lǐng)域,平臺樂于使用“專家”的概念來獲取公眾的關(guān)注。學術(shù)背景和專家身份意味著信息的權(quán)威性,同時也是從內(nèi)容權(quán)威到消費主義權(quán)威轉(zhuǎn)型的關(guān)鍵文化資本。各大平臺都注重推送專家在經(jīng)濟政策解讀、金融知識普及、熱點知識科普等領(lǐng)域的內(nèi)容,因為這些領(lǐng)域背后都對應著明確的受眾群體和消費趨向;而知乎平臺的興起以及嗶哩嗶哩網(wǎng)站大量學習型內(nèi)容的爆發(fā),同樣是對此類學術(shù)內(nèi)容開發(fā)的結(jié)果。
AIGC垂直訓練是指在現(xiàn)有訓練的基礎(chǔ)上對任一學科領(lǐng)域開展強化訓練,對基礎(chǔ)模型和用戶體驗加以微調(diào),從而產(chǎn)出面向特定受眾群體的垂直寫作助手,進而影響學術(shù)生產(chǎn)的供給結(jié)構(gòu)。例如,近期已有國外學者使用ChatGPT完成專著或論文,并與AI聯(lián)合署名。(9)該書書名為“Impromptu:Amplifying Our Humanity Through AI”(《即興表演:通過人工智能放大我們的人性》)。該書共計223頁,分為10個章節(jié)。作者Reid Hoffman與ChatGPT聯(lián)合署名。又如,谷歌訓練的醫(yī)學語言模型Med-PaLM 2已經(jīng)通過美國醫(yī)學執(zhí)照考試,且在85%的情況下給出醫(yī)學專家級回答。(10)Michael DePeau-Wilson, Google AI Performs at ’Expert’ Level on U.S. Medical Licensing Exam, Retrieved from https://www.medpagetoday.com/special-reports/exclusives/103522, March 14, 2023.事實上,在對馬克思、法農(nóng)、葛蘭西等人的著作進行簡單學習后,ChatGPT很快便習得有關(guān)資本主義和工人運動的批評話語,并在回答中“呼喚一場反對帝國主義控制的革命”(11)Mohamad Ali Nasser, How this AI became a communist,Retrieved from https://towardsdatascience.com/how-this-a-i-became-a-communist-ddf9146bc147, March 27, 2020.。
以往學術(shù)熱點的生成和學術(shù)議程的設(shè)置,往往是學術(shù)共同體驅(qū)動下政策助推、市場需求和研究路徑依賴所共同塑造的結(jié)果。(12)李二斌:《學術(shù)熱點的生成機制及應對策略研究——基于期刊的視角》,《出版發(fā)行研究》2022年第8期。這是一個需要耗費時間、并開展充分協(xié)商的過程。未來,如果大型互聯(lián)網(wǎng)平臺針對學術(shù)群體開發(fā)出AIGC寫作模型,并以開放獲取方式為這些AIGC成果提供網(wǎng)絡傳播渠道,學術(shù)內(nèi)容供給結(jié)構(gòu)和學術(shù)熱點生成機制的改變將不可避免,這也將進一步?jīng)_擊傳統(tǒng)學術(shù)出版所擁有的渠道價值和壟斷優(yōu)勢。當然,平臺的熱點制造邏輯絕非出于科研潛力和社會價值,而往往是基于內(nèi)容炒作的經(jīng)濟價值和變現(xiàn)價值:病毒性傳播價值和“熱搜潛質(zhì)”將成為平臺在制造和炒作學術(shù)論點時的重要判斷標準。
基于以上分析可以看到,平臺內(nèi)容經(jīng)濟已經(jīng)形成了一套基于所有權(quán)屬界定、用戶吸納積累和內(nèi)容供給調(diào)節(jié)的商業(yè)運行邏輯。通過用戶協(xié)議、免費推廣和技術(shù)工具開發(fā),這套運行機制能夠迅速被植入相關(guān)的內(nèi)容產(chǎn)業(yè)中。傳統(tǒng)的學術(shù)出版通?;趯?nèi)容創(chuàng)作者權(quán)屬和個體積極性的保護,強調(diào)對學術(shù)共同體的建構(gòu)而弱化對大眾用戶的吸引,強調(diào)特定領(lǐng)域的專業(yè)主義培養(yǎng)而非對速成內(nèi)容生成的追求。然而,隨著AIGC工具的完善,平臺將會迅速推進以工具理性所驅(qū)動的內(nèi)容盈利目標,以便加速生成性內(nèi)容的商業(yè)化。技術(shù)的迭代、加之資本的強勢介入和收益訴求,可能在學術(shù)出版市場引發(fā)劣幣驅(qū)除良幣的溢出效應,并加劇和催生更多的學術(shù)黑灰產(chǎn)業(yè)。
首先,一批以AIGC為工具的寫手會迅速進入學術(shù)生產(chǎn)場域,挑戰(zhàn)研究者以長年學歷教育和學術(shù)訓練建構(gòu)起來的文化資本。學術(shù)成果交易可能會成為更大規(guī)模的市場。在傳統(tǒng)學術(shù)出版中,“槍手”代筆一直是難以根除的行業(yè)痼疾。以往,由于受限于“槍手”的學術(shù)水平、人工寫作速度相對有限以及國家對代筆產(chǎn)業(yè)的打擊,這一灰色產(chǎn)業(yè)面臨著顯著的質(zhì)量挑戰(zhàn)和法律風險。AIGC的出現(xiàn)將可能帶來一批隱藏在算法黑箱背后的“槍手”,而在屏幕背后發(fā)送指令的他們難以被現(xiàn)行法規(guī)所限制,也難以被學術(shù)編輯所察覺和識別。生成性人工智能在創(chuàng)作型內(nèi)容方面的顯著提升,無疑也給學術(shù)黑灰產(chǎn)業(yè)帶來了技術(shù)迭代的可能。
其次是學術(shù)“造假”和“洗稿”的風險大大增加。學術(shù)投機的便捷性將會弱化科研工作的創(chuàng)新動力,引發(fā)學術(shù)不良競爭,并直接挑戰(zhàn)現(xiàn)行的學術(shù)把關(guān)和出版機制。“洗稿”指的是通過對文本用語的技術(shù)性改寫,復制原文的觀點,規(guī)避以原文重合度為基礎(chǔ)的抄襲侵權(quán)風險。在社交媒體上,“洗稿”而成的論文甚至比原文獲得的影響力和關(guān)注度要大得多?,F(xiàn)有AIGC技術(shù)已經(jīng)具備文本“洗稿”的絕對能力,甚至可以實現(xiàn)實時“竊取”學術(shù)觀點并謀求發(fā)布。對原創(chuàng)者而言,論證自身成果的原創(chuàng)性、首發(fā)性和“洗稿”成果的侵權(quán)性十分困難。此外,AIGC能夠基于專有語料庫的模型微調(diào),完成對人類作者寫作風格的復制,甚至能根據(jù)觀點需要生成深度假文本(如以假亂真的假引文和假參考文獻(13)Day T, “A preliminary investigation of fake peer-reviewed citations and references generated by ChatGPT”, The Professional Geographer, 2023, pp.1-4.)。不僅如此,AIGC還可以尋找邏輯漏洞,按照作者的意圖進行遞歸循環(huán)(反復修改),從而最終收斂至人類滿意的輸出結(jié)果。而人類在此過程中僅需要承擔指令發(fā)送和文本潤色等輔助性功能。換言之,在無須通過大量閱讀占有研究資料的情況下,僅憑對算法工具的利用,人類作者即可收獲一篇內(nèi)容尚佳的論文。而人類編輯卻很難通過人工方式甄別其作者構(gòu)成的狀況。算法工具的投機性一旦被高效濫用,獨立思考和深度研究的性價比會大大降低,科研積累和科研創(chuàng)新的環(huán)境也會因此惡化。長遠來看,這不僅會打擊科研人員的學術(shù)積極性,也會傷及學術(shù)生產(chǎn)和學術(shù)出版賴以生存的倫理追求。
盡管互聯(lián)網(wǎng)平臺的興起曾長期引發(fā)對傳統(tǒng)媒體至暗時刻的討論,但就學術(shù)出版而言,其內(nèi)容創(chuàng)造性和發(fā)表渠道的壟斷性使其自身保持著相對獨立的文化場域,并為學術(shù)研究保留了較為充分的探索空間和產(chǎn)出時間。在過去相當長的時間內(nèi),學術(shù)生產(chǎn)、審核和出版發(fā)表遵循著專業(yè)主義的范疇。發(fā)表主體一般須為經(jīng)過高等教育并經(jīng)過專門學術(shù)訓練的研究者,他們在一定程度上壟斷或優(yōu)先享有學術(shù)發(fā)表的渠道。渠道的相對壟斷和發(fā)表主體的身份門檻設(shè)定使學術(shù)發(fā)表保持了一定的獨立性,而學術(shù)生產(chǎn)和文章刊發(fā)的相對長周期也緩解了研究者的產(chǎn)量焦慮。這一運行模式給知識分子的批判性思維和創(chuàng)作過程以相對充分的空間。
然而,平臺內(nèi)容經(jīng)濟的擴張與AIGC工具的興起,即時的、大篇幅的、媲比人類表達的文本生產(chǎn)將成為可能,這些功能將被嵌入文本的規(guī)劃、起草、修改、發(fā)表、傳播之中,以極致化的工具理性沖擊知識分子的價值理性和文化資本。這將使研究者開始面臨行動和理念的猶疑:知識生產(chǎn)是一種沉淀于時間的厚積薄發(fā)和價值理性,還是立足于前沿技術(shù)的高效產(chǎn)出和工具理性?更為重要的是,平臺對創(chuàng)造性知識成果的占有訴求、強大的用戶吸納能力、高效的算法工具開發(fā)能力,及其對量化評價和盈利效率的強調(diào),都會通過其產(chǎn)業(yè)布局及算法工具介入學術(shù)出版產(chǎn)業(yè)中,對學術(shù)寫作、發(fā)表和出版這一傳統(tǒng)創(chuàng)造性活動及其運行規(guī)則形成顯著的挑戰(zhàn)。
面對工業(yè)和科技的巨大進步,馬克思曾在1856年《人民報》創(chuàng)刊紀念會上談到,“我們的所有發(fā)明和進步,似乎都賦予物質(zhì)力量以智慧,而使人類的生命鈍化為物質(zhì)力量”,這種技術(shù)的巨大進步和社會頹廢的征兆正同時發(fā)生并構(gòu)成了19世紀的特點和“偉大事實”。(14)Karl Marx, Speech at Anniversary of the People’s Paper, 1856, Marx/Engels Selected Works, Vol.1, Moscow: Progress Publishers, 1969, p.500.面對無孔不入的人工智能對社會的系統(tǒng)性影響,馬克思的話語尤為振聾發(fā)聵。近期,已有多所高校學生在校園網(wǎng)發(fā)起倡議,要求學校圖書館引進生成性智能技術(shù)。AIGC越是被如此迅速地接受和使用,其可能帶來的文化價值風險越是迫切需要警惕和分析。
在以往的研究中,平臺作為內(nèi)容經(jīng)濟主體和AIGC產(chǎn)業(yè)鏈上游的角色尚未得到充分討論,使得現(xiàn)有治理思路集中于產(chǎn)業(yè)鏈的下游而缺乏全面性。作為典型的文化產(chǎn)業(yè),學術(shù)出版需要直面平臺內(nèi)容經(jīng)濟邏輯通過AIGC向自身領(lǐng)域滲透的現(xiàn)實。這一過程絕不僅是出版業(yè)主動謀求數(shù)字轉(zhuǎn)型和媒體融合的過程,而可能是來自平臺的釜底抽薪式的反噬;著作權(quán)也絕不僅是通過分類治理的權(quán)宜之計就能化解的權(quán)屬問題,而必然是平臺資本、傳統(tǒng)學術(shù)出版業(yè)、科研群體、政府公共力量等利益相關(guān)方博弈和角力的場域。因此,對AIGC介入學術(shù)出版產(chǎn)業(yè)的治理,既要將平臺作為關(guān)鍵主體納入考慮,也要重視以多主體協(xié)同、技術(shù)性應對、全球性合作、法律-道德雙重監(jiān)督的思路開展應對。
首先,只有從平臺的內(nèi)部機制和商業(yè)邏輯入手,算法的解碼才具有可能性。人工智能算法并非一成不變、觸不可及的黑箱。盡管其具有隱蔽性、動態(tài)性及不可回溯性,但平臺為算法所制定的績效評價體系和預期商業(yè)目標卻有著高度的可見性、連續(xù)性和穩(wěn)定性,并直接體現(xiàn)為平臺產(chǎn)品的某種功能。即便監(jiān)管者無法窺見黑箱內(nèi)部的結(jié)構(gòu),仍然可以通過考察其用戶協(xié)議和商業(yè)模式的合法性來解碼其運行機理和價值導向。(15)胡凌:《人工智能視閾下的網(wǎng)絡法核心問題》,《中國法律評論》2018年第2期。面對可能的學術(shù)剽竊和技術(shù)濫用,AIGC的開發(fā)平臺需要秉持基本的社會責任,推動算法的開源和透明,使AIGC對自身產(chǎn)出的成果給出權(quán)威性的來源說明。在學術(shù)出版等對知識產(chǎn)權(quán)保護要求嚴格的領(lǐng)域,應該嘗試推行AIGC內(nèi)容的唯一識別碼。
其次,要以著作權(quán)界定為核心,盡快推進AIGC的權(quán)責界定研究和法律體系建設(shè)。著作權(quán)是出版業(yè)的核心資產(chǎn)和行業(yè)基石,無法對著作權(quán)進行清晰、準確、高效的界定將直接影響學術(shù)出版業(yè)的運行。其一,要推進AIGC著作權(quán)界定的跨專業(yè)研討和分析。AIGC著作權(quán)界定涉及計算機科學、法學、編輯出版學等諸多學科。各學科專家需要以協(xié)同科研的方式開展研判,借鑒各國前沿的人工智能治理方案,推進界定的合法性、合理性和可行性。其二,要以AIGC著作權(quán)案例的司法實踐為基礎(chǔ),增加AIGC指導性案例的效力和數(shù)量。(16)方卿、丁靖佳:《人工智能生成內(nèi)容(AIGC)的三個出版學議題》,《出版科學》2023年第2期。這既需要在AIGC著作權(quán)案例中審慎處置,構(gòu)建可行的判決標準,也需要以相關(guān)判例為基礎(chǔ),盡快建立可推廣性的判決經(jīng)驗和案例指導。其三,在著作權(quán)界定過程中,要從數(shù)據(jù)權(quán)屬和內(nèi)容經(jīng)濟的運行機制出發(fā),對人類作者、網(wǎng)絡平臺、出版機構(gòu)等主體的權(quán)力和義務進行明確區(qū)分和界定。
再次,學術(shù)出版機構(gòu)應積極作為,開展以技術(shù)駕馭技術(shù)的必要應對。一方面,學術(shù)出版機構(gòu)應嘗試綜合國內(nèi)外經(jīng)驗,對AI工具的使用規(guī)范加以明確,通過行業(yè)協(xié)會的形式發(fā)布相關(guān)倡議;另一方面,開發(fā)和引進公共性的、第三方的AIGC甄別工具同樣重要。目前,國外的GPTZero、Plagibot等工具已經(jīng)能夠?qū)θ斯ぶ悄苌蓛?nèi)容進行一定程度的甄別,但相關(guān)工具主要集中在英文內(nèi)容領(lǐng)域,且均為私有資本所持有。毋庸置疑,類似檢測技術(shù)的發(fā)展迫切需要公共力量的扶持和關(guān)注。公共力量通過與學術(shù)出版機構(gòu)的密切協(xié)作實現(xiàn)技術(shù)突破,有助于建立服務于公共利益的技術(shù)防范體系,防止AIGC甄別技術(shù)長期落后于商業(yè)AI的開發(fā)過程。
復次,要以AIGC為契機,建立作者、學術(shù)出版機構(gòu)、高??蒲性核餐瑓⑴c的AIGC誠信共識和問責機制。一是倡導作者的誠實披露。學術(shù)成果的發(fā)表者必須明確表明自身使用何種工具、使用了哪些生成性內(nèi)容,以及這些內(nèi)容所依托的原始引用來源。對引用來源的基本尊重是學術(shù)規(guī)范性的基礎(chǔ)。二是建立AI濫用的問責和懲罰機制。由于AI工具的易獲得性,對工具的禁絕缺乏現(xiàn)實可行性,因而對濫用者的規(guī)則威懾顯得尤為重要?;谛袠I(yè)基本共識和道德要求,有必要建立“一處失信、處處受限”的科研負面清單。對于拒絕披露、刻意隱瞞、內(nèi)容剽竊、學術(shù)洗稿等行為,要建立針對性、分層次的學術(shù)準入限制,以及期刊發(fā)文限制、同行風險預警等失信懲罰機制。三是高校和科研院所應積極開展有關(guān)AIGC的倫理科普、宣傳和教育。針對科研人員與高校學生的具體使用場景,從日常教學、人才培養(yǎng)、科研管理、成果評價等多方面制定針對性的使用規(guī)范,以便建立從學術(shù)生產(chǎn)、學術(shù)管理、學術(shù)把關(guān)到學術(shù)出版全流程的倫理倡議和行為約束。四是依托跨國合作建設(shè)倫理規(guī)范和監(jiān)管機制。聯(lián)合國教科文組織發(fā)布的《人工智能倫理問題建議書》(Recommendation on Ethics of AI)和中共中央辦公廳、國務院辦公廳印發(fā)的《關(guān)于加強科技倫理治理的意見》已經(jīng)給出了宏觀方向的人工智能技術(shù)指引。但具體到學術(shù)出版業(yè),還需要在共性框架下制定具體的開發(fā)倫理、行動指南、應用場景、監(jiān)管機制和懲罰舉措,以警惕AIGC技術(shù)邏輯和資本邏輯對出版文化建構(gòu)邏輯的“蠶食”。(17)方卿、丁靖佳:《人工智能生成內(nèi)容(AIGC)的三個出版學議題》,《出版科學》2023年第2期。
最后,AIGC產(chǎn)業(yè)同時也是一個平臺參與下的學術(shù)出版國際競爭場域。與之相伴隨的學術(shù)話語權(quán)爭奪、科技創(chuàng)新能力與創(chuàng)新機制、以及更為深入的意識形態(tài)和文化安全問題,迫切需要得到關(guān)注和重視。以往,推特、臉書等平臺在篩選和推送涉華內(nèi)容時,往往通過算法優(yōu)先曝光涉華負面內(nèi)容,這種意識形態(tài)滲透已經(jīng)成為西方大型互聯(lián)網(wǎng)企業(yè)的常規(guī)操作。當前,以微軟、谷歌為代表的企業(yè)在AIGC開發(fā)中具有顯著的壟斷性和先發(fā)優(yōu)勢,其訓練數(shù)據(jù)則主要取自代表西方主流意識形態(tài)的內(nèi)容。由于算法的隱蔽性,這種訓練過程和意識形態(tài)偏見并不為使用者所知,其產(chǎn)出內(nèi)容中所帶有的價值偏向也因而被掩蓋了。這給我國出版業(yè)的文化安全和把關(guān)責任帶來了新的挑戰(zhàn)和風險。打破西方企業(yè)在英文AIGC領(lǐng)域的壟斷性局面,培育具有國際領(lǐng)先水平的中文AIGC生成工具,并將中國文化和中國理念納入相關(guān)語言學習模型中,避免國外平臺的AIGC工具所帶來的系統(tǒng)性偏見、文化刻板印象和意識形態(tài)歧視,這是構(gòu)建以我為主的人工智能產(chǎn)業(yè)所需要面對的問題。
從UGC到AIGC的發(fā)展過程可以看到,AIGC并非科技力量的突變和驟然創(chuàng)造,而是內(nèi)生于平臺內(nèi)容經(jīng)濟發(fā)展軌跡的必然產(chǎn)物。而平臺及其AIGC正試圖以其內(nèi)容經(jīng)濟運行規(guī)則挑戰(zhàn)和塑造以學術(shù)出版為代表的創(chuàng)造性內(nèi)容領(lǐng)域。因此,探索其治理邏輯,需要回歸平臺內(nèi)容經(jīng)濟的運行規(guī)則和具體過程,從技術(shù)演進和經(jīng)濟邏輯中探尋思路。與此同時,這一復雜議題既需要研究主體的跨學科合作和各利益相關(guān)方的深度協(xié)同,也需要超越國界的全球視野和治理努力。只有這樣,才能避免資本主義追求無限商業(yè)變現(xiàn)的動力將AI帶向與社會文化福祉背道而馳的方向。