摘 要 敘事作為信息傳遞的重要載體,是出版物內(nèi)容的關(guān)鍵組成部分。對(duì)敘事特征和規(guī)律及其影響的深入挖掘和闡釋,已逐漸成為出版學(xué)領(lǐng)域的重要研究方向。近年來(lái),自然語(yǔ)言處理和文本挖掘的發(fā)展為敘事的量化分析提供了有力的技術(shù)支持,理解和應(yīng)用計(jì)算敘事成為推動(dòng)出版業(yè)持續(xù)發(fā)展的關(guān)鍵因素。文章從敘事學(xué)理論出發(fā),系統(tǒng)介紹計(jì)算敘事的基本理念,梳理并論述現(xiàn)有研究中對(duì)敘事語(yǔ)言、敘事結(jié)構(gòu)和敘事情感的量化方法及計(jì)算敘事的具體應(yīng)用,探討計(jì)算敘事方法在數(shù)字出版中的潛在應(yīng)用場(chǎng)景,為出版內(nèi)容的優(yōu)化和出版業(yè)的轉(zhuǎn)型提供了新的視角。
關(guān)鍵詞 敘事;計(jì)算敘事;計(jì)算方法;數(shù)字出版
數(shù)字出版是指利用數(shù)字技術(shù)對(duì)知識(shí)性產(chǎn)品進(jìn)行加工制作并向公眾傳播的過(guò)程,其客體是內(nèi)容,面向的對(duì)象是公眾,因此,理解內(nèi)容對(duì)公眾的影響機(jī)制應(yīng)當(dāng)是出版學(xué)研究中重要的議題。敘事是承載信息、傳播內(nèi)容、促進(jìn)交流的關(guān)鍵載體,是構(gòu)成出版物內(nèi)容的重要屬性之一。理解敘事現(xiàn)象、挖掘敘事規(guī)律并探究敘事與受眾間的關(guān)系也應(yīng)當(dāng)是出版學(xué)研究需要關(guān)注的重要研究課題。
近年來(lái),敘事逐漸成為出版學(xué)研究的重要領(lǐng)域與研究方向并進(jìn)行了較為深入的理解?,F(xiàn)有研究多從案例分析出發(fā),結(jié)合敘事學(xué)理論與新興媒介技術(shù)探究不同出版物的敘事模式[1-2]。此外,也有研究對(duì)敘事進(jìn)行語(yǔ)義建模、規(guī)范化表征與組織[3]并嘗試實(shí)現(xiàn)敘事文本的機(jī)器理解、結(jié)構(gòu)解析、自動(dòng)生成等[4–6]。這些研究是對(duì)經(jīng)典敘事學(xué)理論的進(jìn)一步應(yīng)用與模擬,是對(duì)敘事學(xué)理論的繼承與發(fā)展。
隨著自然語(yǔ)言處理、深度學(xué)習(xí)等技術(shù)的發(fā)展,利用文本挖掘、數(shù)據(jù)分析探究敘事特征與規(guī)律成為諸多領(lǐng)域研究嘗試的新興方向,形成量化敘事現(xiàn)象的技術(shù)、方法與指標(biāo)并在大量實(shí)證分析中得到應(yīng)用與嘗試,這些量化方法也形成“計(jì)算敘事”的基本理念和實(shí)施路徑。作為一種新興的方法體系,深入理解計(jì)算敘事,有助于拓寬出版學(xué)研究的視野,并且也能夠?yàn)槌霭鏄I(yè)的發(fā)展提供量化證據(jù)和決策依據(jù)。
基于此,本文從敘事學(xué)理論出發(fā),結(jié)合現(xiàn)有研究,系統(tǒng)論述計(jì)算敘事的基本理念、核心方法、關(guān)鍵指標(biāo)與計(jì)算方式并對(duì)計(jì)算敘事的實(shí)際應(yīng)用和與出版業(yè)的關(guān)系進(jìn)行討論。
1 敘事學(xué)理論
敘事學(xué)作為一種研究敘事的學(xué)科,起源于20世紀(jì)初期。弗拉基米爾·普羅普(Vladimir Propp)的《故事形態(tài)學(xué)》(Morphology of the Folktale)中分析俄羅斯民間故事的結(jié)構(gòu),提出31個(gè)敘事功能和7個(gè)角色類型的概念,奠定現(xiàn)代敘事學(xué)基礎(chǔ)[7]。敘事學(xué)發(fā)展經(jīng)歷經(jīng)典敘事學(xué)和后經(jīng)典敘事學(xué)兩個(gè)階段,是文學(xué)理論的重要分支。
20世紀(jì)60—70年代,受到結(jié)構(gòu)主義尤其是法國(guó)結(jié)構(gòu)主義的影響,敘事學(xué)興起,羅蘭·巴特(Roland Barthes),阿爾吉達(dá)斯·格雷馬斯(Algirdas Julien Greimas)和熱拉爾·熱奈特(Gérard Genette)是重要的理論貢獻(xiàn)者。羅蘭·巴特在《敘事作品結(jié)構(gòu)分析導(dǎo)論》(An Introduction to the Structural Analysis of Narrative)中,進(jìn)一步拓展敘事學(xué)的研究范圍,劃分出敘事作品的3個(gè)描寫層次:功能層、行動(dòng)層和敘述層[8]。格雷馬斯通過(guò)語(yǔ)義學(xué)的視角,在《結(jié)構(gòu)語(yǔ)義學(xué)》[9]和《論意義》[10]中分別詳細(xì)闡述“行動(dòng)元模型”和“符號(hào)矩陣”等理論。熱奈特則在《敘事話語(yǔ)》(Narrative Discourse)中,探討故事時(shí)間與敘事時(shí)間的關(guān)系以及敘事語(yǔ)式與語(yǔ)態(tài),提出“敘述層”“敘述聚焦”等重要概念[11]。
后經(jīng)典敘事學(xué)階段,敘事學(xué)超越經(jīng)典敘事學(xué)的文學(xué)、文字范疇,還吸收了心理學(xué)、社會(huì)學(xué)和認(rèn)知科學(xué)等學(xué)科的理論成果,產(chǎn)生多樣的敘事理論體系,逐漸形成多學(xué)科交叉研究的趨勢(shì)。例如,基于數(shù)字媒介的數(shù)字?jǐn)⑹聦W(xué),探討智能設(shè)備與技術(shù)下調(diào)和敘事性與互動(dòng)性的問(wèn)題。這些理論不僅豐富了敘事學(xué)的研究?jī)?nèi)容,也為現(xiàn)代計(jì)算敘事的研究奠定了堅(jiān)實(shí)的基礎(chǔ)。
總體而言,敘事學(xué)理論建構(gòu)在對(duì)經(jīng)典個(gè)案(例如:戲劇、民間故事、小說(shuō)等)的闡釋基礎(chǔ)上,通過(guò)對(duì)不同故事及其結(jié)構(gòu)的理解,進(jìn)而歸納出敘事的結(jié)構(gòu)、組成要素等。這些對(duì)敘事特點(diǎn)的闡釋與解析會(huì)形成特定的分析框架,進(jìn)而用來(lái)解釋更為豐富的敘事現(xiàn)象,從而誕生諸如交互敘事、非線性敘事、非自然敘事等特殊形式的敘事理論體系以及對(duì)特定體裁文本敘事方式的理解。
2 敘事的計(jì)算與量化方法
敘事理論的發(fā)展為多維度量化分析敘事提供了堅(jiān)實(shí)基礎(chǔ)。通過(guò)與計(jì)算機(jī)科學(xué)和數(shù)據(jù)科學(xué)方法的結(jié)合,大量研究從語(yǔ)言、結(jié)構(gòu)、情感等角度設(shè)計(jì)并驗(yàn)證表征敘事特征的測(cè)度方式,不僅豐富和拓展傳統(tǒng)敘事學(xué)理論,同時(shí)在對(duì)不同文化產(chǎn)品的實(shí)證分析中,進(jìn)一步揭示敘事特點(diǎn)及其影響。
2.1 計(jì)算敘事基本理念
計(jì)算敘事是一個(gè)新興的跨學(xué)科研究方法體系,結(jié)合敘事學(xué)基礎(chǔ)理論和計(jì)算方法,通過(guò)量化分析手段來(lái)研究敘事現(xiàn)象及其規(guī)律,進(jìn)一步探究敘事對(duì)受眾認(rèn)知的影響。計(jì)算敘事的核心思想在于利用計(jì)算機(jī)科學(xué)和數(shù)據(jù)科學(xué)的方法來(lái)系統(tǒng)化和量化地研究敘事文本。通過(guò)自然語(yǔ)言處理(NLP)和文本挖掘技術(shù),計(jì)算敘事能夠處理和分析大規(guī)模的文本數(shù)據(jù),從而揭示隱藏在敘事中的模式和規(guī)律。
敘事是一種高維度、富語(yǔ)義、高度情境化的復(fù)雜文本對(duì)象。為了有效地分析這種復(fù)雜文本對(duì)象,就需要對(duì)敘事進(jìn)行降維和解構(gòu),從不同層次入手,突出敘事中最重要的特征并將敘事分解為更易于分析的基本單元,以揭示特定敘事特征的規(guī)律。按照結(jié)構(gòu)主義敘事學(xué)的理念,敘事的構(gòu)成包括敘事內(nèi)容(講述的故事)、敘述話語(yǔ)(故事的視角、語(yǔ)言或語(yǔ)句等)、敘述動(dòng)作、敘述視角等。因此,量化分析敘事可分為3個(gè)層次。①敘事語(yǔ)言:分析敘事文本中的語(yǔ)言使用,包括詞匯、句法和修辭手法,理解語(yǔ)言如何塑造敘事的效果和意義。②敘事結(jié)構(gòu):研究敘事的整體結(jié)構(gòu),例如情節(jié)的安排、時(shí)間線的構(gòu)建、敘述視角的選擇等,探討這些結(jié)構(gòu)如何影響讀者的理解和體驗(yàn)。③敘事情感:通過(guò)情感分析技術(shù),探討敘事文本中的情感表達(dá)和情感走向,理解敘事如何引發(fā)和調(diào)控讀者的情感反應(yīng)。
計(jì)算敘事的關(guān)鍵在于從理論出發(fā),結(jié)合量化分析方法,形成對(duì)敘事文本理解的新視角。這一過(guò)程不僅驗(yàn)證和拓展了傳統(tǒng)敘事學(xué)的理論,還揭示了新的敘事現(xiàn)象和規(guī)律。通過(guò)計(jì)算方法和技術(shù),計(jì)算敘事能夠深入研究敘事文本的結(jié)構(gòu)、語(yǔ)義和情感特征,揭示敘事對(duì)認(rèn)知和情感的影響。與傳統(tǒng)出版學(xué)領(lǐng)域的敘事研究不同,計(jì)算敘事可以實(shí)現(xiàn)由經(jīng)典個(gè)案闡釋向共性規(guī)律挖掘的轉(zhuǎn)變,能夠在更大尺度數(shù)據(jù)集上探究敘事現(xiàn)象的規(guī)律與模式,進(jìn)而可以有效分析敘事對(duì)受眾的影響,從而為出版物的內(nèi)容生產(chǎn)、設(shè)計(jì)、傳播流通等提供決策參考。
近年來(lái),對(duì)敘事語(yǔ)言、敘事結(jié)構(gòu)以及敘事情感的量化得到管理學(xué)、營(yíng)銷學(xué)等領(lǐng)域的關(guān)注并從不同角度出發(fā),在對(duì)敘事外在及內(nèi)涵特征理解的基礎(chǔ)上,設(shè)計(jì)了多種量化指標(biāo),進(jìn)行了較為豐富的實(shí)證探索。對(duì)這些研究進(jìn)行歸納總結(jié),有助于為出版學(xué)研究發(fā)展提供參考思路,也有助于為出版行業(yè)發(fā)展提供借鑒。
2.2 敘事語(yǔ)言
敘事語(yǔ)言是敘事的外在表現(xiàn),敘事需要借助特定的語(yǔ)言加以表達(dá),與此同時(shí),語(yǔ)言也是受眾處理、交流、理解信息與內(nèi)容的首要方式。因此,語(yǔ)言在敘事中也扮演著重要角色。敘事語(yǔ)言會(huì)根據(jù)文本體裁、敘述者、敘事對(duì)象等的差異而具備特殊的語(yǔ)言現(xiàn)象(修辭、語(yǔ)法、句法、詞匯使用、語(yǔ)義等),從而形成獨(dú)特的敘事語(yǔ)言風(fēng)格,進(jìn)而影響受眾對(duì)敘事的認(rèn)知與理解,帶來(lái)不同的行為及反饋。因此,量化敘事語(yǔ)言特征、歸納敘事語(yǔ)言風(fēng)格、探索語(yǔ)言風(fēng)格與受眾的關(guān)系逐漸成為消費(fèi)者行為學(xué)、圖書情報(bào)等領(lǐng)域關(guān)注的新興話題[12]。
一方面,有研究通過(guò)對(duì)敘事文本中字、詞、段落的語(yǔ)法特征、詞性結(jié)構(gòu)等語(yǔ)言現(xiàn)象進(jìn)行分析,實(shí)現(xiàn)對(duì)內(nèi)容表達(dá)方式、寫作風(fēng)格的規(guī)律發(fā)現(xiàn)與挖掘并探究其對(duì)內(nèi)容傳播、營(yíng)銷等方面的影響。例如,Packard等[13]通過(guò)一系列實(shí)證分析揭示動(dòng)詞時(shí)態(tài)對(duì)消費(fèi)者行為的說(shuō)服效果;Cascio Rizzo等[14]研究感官語(yǔ)言(Sensory Language)對(duì)意見(jiàn)領(lǐng)袖在網(wǎng)絡(luò)營(yíng)銷等方面的積極作用;Boghrati等[15]從語(yǔ)言風(fēng)格的角度出發(fā),探究科學(xué)論文功能詞匯與引用數(shù)量間的關(guān)系,并對(duì)語(yǔ)言風(fēng)格如何影響思想市場(chǎng)(marketplace of ideas)的成功進(jìn)行解釋;Chen等[16]從詞匯、語(yǔ)法等對(duì)科學(xué)論文寫作風(fēng)格進(jìn)行理解,并探討其在科學(xué)傳播兩種方式(知識(shí)利用與在線關(guān)注)中的具體作用。這些研究借助自然語(yǔ)言處理技術(shù),通過(guò)計(jì)算特殊的句法結(jié)構(gòu)、詞匯分布等語(yǔ)言使用現(xiàn)象以量化敘事語(yǔ)言的特點(diǎn),歸納不同體裁文本的寫作風(fēng)格特點(diǎn)與規(guī)律,進(jìn)一步理解了敘事語(yǔ)言的實(shí)際作用。
另一方面,有研究聚焦敘事文本中的主題、情感、情緒等語(yǔ)義特征。例如,龔詩(shī)陽(yáng)等[17]以晉江文學(xué)網(wǎng)為研究對(duì)象,利用Guided-LDA主題模型提取積極心理主題并探究網(wǎng)絡(luò)小說(shuō)積極心理主題多樣性、積極心理強(qiáng)度對(duì)受眾關(guān)注等的影響,進(jìn)而解釋文化產(chǎn)品流行與作品風(fēng)格的影響。
2.3 敘事結(jié)構(gòu)
根據(jù)敘事學(xué)理論,敘事結(jié)構(gòu)是指故事的組織方式,包括情節(jié)、時(shí)間順序和事件的排列與組合,是具有特定語(yǔ)義特征及功能特點(diǎn)的文本塊按照一定邏輯順序進(jìn)行關(guān)聯(lián)組織的具體方式。因此,對(duì)敘事結(jié)構(gòu)進(jìn)行量化與計(jì)算需要兼顧敘事的外在特點(diǎn)及內(nèi)在語(yǔ)義特征。
關(guān)于敘事結(jié)構(gòu)的計(jì)算方法,以Jonah Berger、Olivier Toubia等人的研究最具代表性。Berger等人[18-19]系統(tǒng)探索量化敘事結(jié)構(gòu)特征的方法并進(jìn)行大量的實(shí)證探究,一方面驗(yàn)證敘事結(jié)構(gòu)計(jì)算的有效性,另一方面也為探索計(jì)算敘事的實(shí)際意義和研究?jī)r(jià)值提供了思路。其基本理念是將不同體裁、類型的文本理解為一組由文本塊構(gòu)成的序列,進(jìn)而利用文本向量化的思想,使用詞嵌入技術(shù)實(shí)現(xiàn)文本的向量化處理,將每個(gè)文本塊表示為一個(gè)潛在語(yǔ)義空間(latent semantic space)中的向量,從而將文本轉(zhuǎn)化為語(yǔ)義空間中點(diǎn)的序列。隨后,通過(guò)對(duì)相鄰文本塊距離、相似度等的計(jì)算以及諸多指標(biāo)的設(shè)計(jì)來(lái)表征敘事結(jié)構(gòu)的特征,完成對(duì)敘事結(jié)構(gòu)的量化計(jì)算。這種基本理念,一方面符合敘事結(jié)構(gòu)的外在特點(diǎn),即敘事結(jié)構(gòu)是由多個(gè)相鄰文本塊構(gòu)成,另一方面也較為符合敘事結(jié)構(gòu)的內(nèi)在語(yǔ)義特征,即可以通過(guò)相鄰文本塊的相似性或差異性來(lái)體現(xiàn)文本塊在內(nèi)容表達(dá)方面的差異,實(shí)現(xiàn)對(duì)敘事結(jié)構(gòu)特點(diǎn)的刻畫。
其計(jì)算過(guò)程如下:首先,清洗后的文本按照固定長(zhǎng)度被拆分為一組連續(xù)的文本塊;隨后,使用Word2vec模型對(duì)文本塊進(jìn)行向量化處理,將文本塊表示為一個(gè)N維語(yǔ)義空間中的一個(gè)點(diǎn),即每個(gè)文本塊t可以由一個(gè)N維的向量xt表示,該向量捕捉了對(duì)應(yīng)文本塊在語(yǔ)義空間中的位置。因此,每個(gè)文本都由語(yǔ)義空間中的一個(gè)路徑來(lái)表示,即一連串的點(diǎn){x1,x2 …xT},其中每個(gè)點(diǎn)xt反映一個(gè)文本塊的位置,而T是路徑中所有點(diǎn)的數(shù)量。隨后,Berger等人[18-19]基于文本向量設(shè)計(jì)如下3個(gè)指標(biāo)來(lái)進(jìn)一步測(cè)度和表征敘事結(jié)構(gòu)的特征。
(1)敘事速度(Speed)。相鄰文本塊在語(yǔ)義空間中的平均歐氏距離(Euclidean distance),其中,平均距離越小,意味著兩個(gè)相鄰文本塊的語(yǔ)義相似度越接近,敘事速度越慢,其計(jì)算方式如下:
distance(t)= ‖xt+1- xt‖
敘事速度一方面可以用來(lái)表征敘事的快慢與跳躍性,較高的敘事速度意味著較快且更加跳躍的敘事節(jié)奏,另一方面也可以理解為敘事的邏輯連貫性以及文本內(nèi)容的關(guān)聯(lián)方式。較低的敘事速度意味著一個(gè)文本序列中兩個(gè)相鄰文本塊在語(yǔ)義上更加相近,體現(xiàn)文本內(nèi)容的語(yǔ)義組織方式。從受眾的視角來(lái)看,敘事速度還可以被解釋為受眾覆蓋文本間的敘事距離所需的努力。通常情況下,跳躍性越強(qiáng)、連貫性越弱的文本尤其需要受眾付出更多的認(rèn)知負(fù)荷去理解文章內(nèi)容。
(2)敘事體積(Volume)。敘事體積通過(guò)包含文本i點(diǎn)序列{x1,x2 …xT}的最小體積橢球體估算,借由最小體積封閉橢球體可以得到定義這個(gè)橢球體的正定矩陣的特征值,由特征值平方根的倒數(shù)可以得到橢球體軸線的長(zhǎng)度。最終最小體積橢球體的體積等于單位球體的體積與軸線長(zhǎng)度的幾何平均值的乘積。
與敘事速度的不同之處在于,敘事體積這一指標(biāo)側(cè)重衡量?jī)?nèi)容及敘事的整體特征,因此更多從內(nèi)容集合而非內(nèi)容序列的角度實(shí)現(xiàn)對(duì)敘事整體結(jié)構(gòu)的表征。與此同時(shí),敘事體積這一指標(biāo)也反映思想、觀點(diǎn)的生成方式,尤其適用于表征多種不同主題的組合以及關(guān)聯(lián)程度,刻畫文本及敘事所覆蓋的內(nèi)容范圍。此外,敘事體積也能夠在一定程度上反映文本或敘事中所包含的信息量。通常情況下,敘事覆蓋的內(nèi)容范圍越廣則敘事中包括的信息量越大,因此,敘事體積也為文本信息量的計(jì)算提供了思路。
(3)敘事曲折性(Circuitousness)。給定文本i中的第一個(gè)點(diǎn)x1和最后一個(gè)點(diǎn)xT以及需要經(jīng)過(guò)的另一組點(diǎn)序列{x2,…xT-1},通過(guò)優(yōu)化旅行商問(wèn)題得到x1和xT之間的最短距離,同時(shí)計(jì)算經(jīng)過(guò)所有點(diǎn)的實(shí)際距離 distance(t),進(jìn)而通過(guò)量化實(shí)際序列{x1,…xT-1}的偏離值,即可得到敘事的曲折性,敘事曲折性的計(jì)算公式:
敘事距離與曲折性也是反映敘事的整體結(jié)構(gòu)特征,但與敘事體積不同的是,距離與曲折性更好地反映文本塊是如何被覆蓋的,是從全局視角對(duì)文本整體敘事跳躍性、連貫性的衡量。此外,Piper等[20]使用曲折性指標(biāo)對(duì)非線性小說(shuō)文本的非線性程度進(jìn)行測(cè)度。該研究認(rèn)為,文本整體的曲折性越高意味著文本具有較強(qiáng)的跳躍性,會(huì)在整體上呈現(xiàn)出非線性的特點(diǎn)。
除了敘事結(jié)構(gòu)是由一系列相鄰文本塊組成的特點(diǎn)之外,值得注意的是,敘事也是對(duì)特定對(duì)象的描述,諸如具體的人物、地點(diǎn)、突出事件等,而這些特定對(duì)象也是推進(jìn)敘事發(fā)展、形成敘事結(jié)構(gòu)的關(guān)鍵點(diǎn),是構(gòu)成敘事的主要元素。借助敘事要素的變化來(lái)反映敘事結(jié)構(gòu)的特征也是測(cè)度敘事結(jié)構(gòu)的思路之一。
Sap等人[21]以敘事中的事件為對(duì)象,設(shè)計(jì)順序性(sequentiality)測(cè)度指標(biāo)及計(jì)算方式,用來(lái)表征敘事的流動(dòng)(Narrative flow)。此外,O-Joun Lee等[22]設(shè)計(jì)基于動(dòng)態(tài)交互網(wǎng)絡(luò)的敘事流暢度(Narrative Fluency)測(cè)度方式。首先,借助自然語(yǔ)言處理技術(shù),對(duì)文本段落內(nèi)的名詞與代詞實(shí)體進(jìn)行識(shí)別與抽??;隨后,圍繞同一文本段落或語(yǔ)句內(nèi)出現(xiàn)的實(shí)體,利用實(shí)體間的共現(xiàn)關(guān)系,構(gòu)建敘事實(shí)體網(wǎng)絡(luò)。在此基礎(chǔ)上,該研究設(shè)計(jì)了敘事的連續(xù)性(Narrative Consistency)和敘事發(fā)展的速度(rapidity of narrative development)兩類指標(biāo)實(shí)現(xiàn)對(duì)敘事流暢度進(jìn)行測(cè)量。其中,敘事的連續(xù)性是通過(guò)計(jì)算不同文本中關(guān)鍵實(shí)體的一致性來(lái)表征。研究首先計(jì)算了實(shí)體網(wǎng)絡(luò)中的3種中心性(度中心性、接近中心性、中介中心性)并對(duì)其進(jìn)行標(biāo)準(zhǔn)化處理;同時(shí)使用熵刻畫關(guān)鍵實(shí)體的離散程度,進(jìn)一步明確文本中的關(guān)鍵實(shí)體;隨后使用Jaccard系數(shù)計(jì)算文本內(nèi)實(shí)體與標(biāo)題中實(shí)體的距離,從而實(shí)現(xiàn)對(duì)一致性的測(cè)量,進(jìn)而表征敘事的連續(xù)性。敘事發(fā)展的速度則是借助敘事實(shí)體的網(wǎng)絡(luò)變化率來(lái)表征。相較于Word2vec模型,該研究使用了Graph2vec模型,將敘事網(wǎng)絡(luò)的結(jié)構(gòu)特征而非節(jié)點(diǎn)或邊屬性進(jìn)行向量化處理,隨后通過(guò)計(jì)算網(wǎng)絡(luò)結(jié)構(gòu)向量的歐式距離反映在不同段落里敘事網(wǎng)絡(luò)的結(jié)構(gòu)變化快慢,從而表征敘事的發(fā)展速度。
因此,聚焦敘事要素,測(cè)度敘事結(jié)構(gòu)就有了更加復(fù)雜且更具有針對(duì)性的計(jì)算方式。以此為基礎(chǔ),敘事實(shí)體網(wǎng)絡(luò)也是對(duì)敘事結(jié)構(gòu)的刻畫,與Berger等人[19]提出的想法不同,敘事結(jié)構(gòu)不再是由文本序列以及其向量化后所形成的點(diǎn)序列組成,而是聚焦敘事描述的特定實(shí)體形成的具體的敘事網(wǎng)絡(luò),其結(jié)構(gòu)特點(diǎn)更加豐富。但這種計(jì)算方式也忽略了文本塊內(nèi)部所表達(dá)的語(yǔ)義。例如,同樣描述一個(gè)實(shí)體,不同的文本、文本組織方式都會(huì)帶來(lái)敘事上的變化,僅聚焦于實(shí)體勢(shì)必會(huì)給敘事特征的表征帶來(lái)偏差。
2.4 敘事情感
敘事中的情感變化也是敘事的重要特征,有研究指出連續(xù)的場(chǎng)景切換,積極或消極場(chǎng)景的串聯(lián)能夠使得故事更富有吸引力[23]。為此,Berger等人[24]提出情緒波動(dòng)性(Sentiment Volatility)的指標(biāo),用來(lái)表示敘事過(guò)程中情緒的波動(dòng)及變化。其具體的計(jì)算方式是將文本分割成文本塊并且使用情感分析方法計(jì)算文本塊的情感值,進(jìn)而使用相鄰文本塊情感差異的標(biāo)準(zhǔn)差來(lái)表示情緒波動(dòng)性。此外,也有研究使用諸如情感方向變化次數(shù)來(lái)衡量情感變化[25]。
3 計(jì)算敘事的應(yīng)用場(chǎng)景與具體應(yīng)用
隨著數(shù)字技術(shù)的不斷發(fā)展,信息傳播的方式逐漸多元,要促進(jìn)數(shù)字出版行業(yè)的不斷發(fā)展,就必須著力于內(nèi)容生產(chǎn)環(huán)節(jié),依托更符合受眾閱讀方式、價(jià)值需求、行為特征的內(nèi)容及作品,實(shí)現(xiàn)出版業(yè)整體競(jìng)爭(zhēng)力的提升。因此,需要在內(nèi)容生產(chǎn)環(huán)節(jié)引入以數(shù)據(jù)分析、規(guī)律挖掘?yàn)榛A(chǔ)的科學(xué)決策方式,輔助內(nèi)容生產(chǎn)方進(jìn)行優(yōu)質(zhì)內(nèi)容的策劃、加工與生產(chǎn)。
3.1 應(yīng)用場(chǎng)景
計(jì)算敘事方法通過(guò)對(duì)文本敘事結(jié)構(gòu)和情感特征的量化分析,能夠在復(fù)雜的內(nèi)容環(huán)境下,實(shí)現(xiàn)對(duì)文本高維度敘事特征的規(guī)律挖掘,因此可以為內(nèi)容策劃、設(shè)計(jì)、傳播和優(yōu)化提供科學(xué)依據(jù)和技術(shù)支持。
通過(guò)優(yōu)化不同的敘事表現(xiàn)方式、結(jié)構(gòu)特點(diǎn)等,出版人可以設(shè)計(jì)出更符合市場(chǎng)特征、用戶行為習(xí)慣的內(nèi)容產(chǎn)品,提升數(shù)字出版物的吸引力和傳播效果,獲得更多的受眾注意力資源,從而實(shí)現(xiàn)高效發(fā)展。隨著自然語(yǔ)言處理和文本挖掘技術(shù)的不斷發(fā)展,計(jì)算敘事的思想和理念將在數(shù)字出版中發(fā)揮越來(lái)越重要的作用,為出版行業(yè)的持續(xù)發(fā)展提供強(qiáng)大的動(dòng)力。出版人應(yīng)充分利用計(jì)算敘事方法,優(yōu)化內(nèi)容策劃和傳播策略,提升出版物的質(zhì)量和市場(chǎng)競(jìng)爭(zhēng)力,為出版業(yè)的轉(zhuǎn)型發(fā)展提供參考與借鑒。
(1)內(nèi)容策劃與設(shè)計(jì)
在出版行業(yè),內(nèi)容策劃與設(shè)計(jì)是確保出版物成功的關(guān)鍵環(huán)節(jié)。計(jì)算敘事方法通過(guò)對(duì)敘事文本的結(jié)構(gòu)化分析與優(yōu)化,挖掘出內(nèi)容中存在的敘事特征與模式,能夠?yàn)閮?nèi)容策劃提供科學(xué)依據(jù)和創(chuàng)新手段。具體而言,利用自然語(yǔ)言處理(NLP)和文本挖掘技術(shù),可以對(duì)大量文本進(jìn)行降維和解構(gòu),提取出特定的敘事特征,從而指導(dǎo)內(nèi)容策劃。例如,通過(guò)分析敘事速度、敘事體積和敘事曲折性等指標(biāo),可以評(píng)估不同文本的敘事節(jié)奏、內(nèi)容覆蓋范圍及連貫性,為內(nèi)容策劃提供數(shù)據(jù)支持。
出版人可以利用這些分析結(jié)果優(yōu)化文本結(jié)構(gòu),提高敘事的連貫性和吸引力,進(jìn)而提升讀者的閱讀體驗(yàn)。例如,在策劃小說(shuō)或紀(jì)實(shí)文學(xué)時(shí),可以通過(guò)分析成功作品的敘事特征,設(shè)計(jì)出符合作品體裁特征且更加引人入勝的內(nèi)容結(jié)構(gòu)。此外,計(jì)算敘事技術(shù)還可以幫助識(shí)別那些在情感表達(dá)和情緒轉(zhuǎn)折方面具有獨(dú)特優(yōu)勢(shì)的文本特征,從而在內(nèi)容策劃中加以應(yīng)用,增強(qiáng)讀者的情感共鳴。
計(jì)算敘事方法也可以用于分析和優(yōu)化作者的敘事風(fēng)格,幫助作者提高寫作水平和作品質(zhì)量。通過(guò)對(duì)成功作品的敘事結(jié)構(gòu)和情感特征進(jìn)行分析,可以提取不同類型作品的共性特征和最佳實(shí)踐,為作者提供參考和指導(dǎo)。例如,通過(guò)分析敘事速度、敘事體積和敘事曲折性等指標(biāo),可以識(shí)別最受讀者歡迎的敘事結(jié)構(gòu),從而在創(chuàng)作中加以應(yīng)用。
此外,計(jì)算敘事技術(shù)還可以幫助作者實(shí)時(shí)監(jiān)測(cè)和優(yōu)化自己的寫作。例如,作者可以在寫作過(guò)程中使用計(jì)算敘事工具對(duì)文本進(jìn)行分析,及時(shí)發(fā)現(xiàn)并解決敘事結(jié)構(gòu)和情感表達(dá)中的問(wèn)題,優(yōu)化文本結(jié)構(gòu)和情感表達(dá),提高作品的吸引力和質(zhì)量。這種敘事風(fēng)格分析與優(yōu)化工具不僅可以幫助作者提高寫作水平,還可以提升出版物的整體質(zhì)量和市場(chǎng)競(jìng)爭(zhēng)力。
(2)個(gè)性化推薦
在數(shù)字出版時(shí)代,個(gè)性化推薦系統(tǒng)成為吸引和留住讀者的重要工具。計(jì)算敘事的思想和方法可以結(jié)合讀者閱讀行為和偏好的分析,為實(shí)現(xiàn)更加精準(zhǔn)的個(gè)性化推薦提供基礎(chǔ)。例如,通過(guò)對(duì)讀者閱讀歷史中的敘事結(jié)構(gòu)和情感特征進(jìn)行分析,可以識(shí)別讀者偏好的敘事類型和情感風(fēng)格。基于這些分析結(jié)果,出版人可以為每位讀者推薦符合其偏好的書籍和文章,提升閱讀體驗(yàn)和滿意度。
此外,借助計(jì)算敘事方法與細(xì)粒度讀者閱讀行為分析,可以實(shí)現(xiàn)出版物及內(nèi)容的動(dòng)態(tài)推薦。例如,當(dāng)讀者在閱讀過(guò)程中表現(xiàn)出對(duì)某種敘事風(fēng)格的特別興趣時(shí),系統(tǒng)可以及時(shí)推薦更多類似風(fēng)格的內(nèi)容,增強(qiáng)讀者的黏性和忠誠(chéng)度。這種個(gè)性化推薦系統(tǒng)不僅可以提高讀者的閱讀體驗(yàn),還可以幫助出版人更好地了解讀者需求,優(yōu)化內(nèi)容策劃和營(yíng)銷策略。
(3)敘事內(nèi)容自動(dòng)化生產(chǎn)與監(jiān)管
本文提及的計(jì)算敘事方法目前還多以文本為分析對(duì)象,未來(lái)還可以借助多模態(tài)分析與自然語(yǔ)言處理技術(shù),將計(jì)算敘事的理念和方法運(yùn)用到文本、音頻、視頻等多種媒體形式的敘事結(jié)構(gòu)的分析上,生成具有高度一致性和情感共鳴的多媒體敘事內(nèi)容。例如,通過(guò)對(duì)文本內(nèi)容的情感分析,可以生成與文本情感一致的背景音樂(lè)和音效,增強(qiáng)讀者的情感體驗(yàn)。
與此同時(shí),這些敘事結(jié)構(gòu)方面的指標(biāo)也可以成為AIGC的評(píng)判依據(jù),用來(lái)指導(dǎo)敘事內(nèi)容的自動(dòng)化生產(chǎn)。利用敘事體積和敘事曲折性等指標(biāo),可以生成具有多樣性和復(fù)雜性的故事情節(jié),滿足不同讀者的需求。計(jì)算敘事技術(shù)不僅可以提高故事生成的效率,還可以提升故事的質(zhì)量和吸引力,為出版行業(yè)帶來(lái)新的發(fā)展機(jī)遇。
此外,計(jì)算敘事的思想還可以幫助出版人設(shè)計(jì)和生成富有創(chuàng)意和吸引力的多媒體敘事內(nèi)容。例如,通過(guò)對(duì)成功多媒體作品的敘事結(jié)構(gòu)和情感特征進(jìn)行分析,可以提取多媒體敘事的最佳實(shí)踐和創(chuàng)新思路,為出版人提供參考和指導(dǎo),并為受眾提供更加豐富和多樣化的閱讀體驗(yàn)。
3.2 具體應(yīng)用
除了設(shè)計(jì)出表征敘事特點(diǎn)的測(cè)度方式外,這些研究還在不同場(chǎng)景下,分析不同文化產(chǎn)品的敘事特點(diǎn),以及其影響。本文對(duì)這些研究進(jìn)行歸納與總結(jié),見(jiàn)表1。
綜合以上研究可以發(fā)現(xiàn),計(jì)算敘事的具體研究存在以下特點(diǎn)。
(1)以多元的文化產(chǎn)品為研究對(duì)象。研究對(duì)象包括小說(shuō)、電影、電視劇、傳記、新聞報(bào)道、科學(xué)論文等,這些不同體裁、樣式、模態(tài)的文化產(chǎn)品在敘事方面的差異也進(jìn)一步說(shuō)明,使用量化的方式能夠揭示不同特點(diǎn)的敘事模式。
(2)敘事的多維度量化分析。這些研究均使用十分豐富的指標(biāo)對(duì)敘事特點(diǎn)進(jìn)行量化測(cè)度與分析,但仍然具有較為明顯的層次性特點(diǎn),會(huì)聚焦于語(yǔ)言、結(jié)構(gòu)、情感等層次。此外,這些敘事指標(biāo)也較為符合敘事理論的理解,是由理論闡釋結(jié)合實(shí)際情況進(jìn)行的指標(biāo)設(shè)計(jì),具有一定的普遍性,也為理解出版物內(nèi)容特點(diǎn)提供了參考。
(3)豐富的機(jī)制檢驗(yàn)。這些研究著重探討敘事與文化產(chǎn)品流行性、參與度、吸引性的問(wèn)題,一方面會(huì)對(duì)比不同體裁文化產(chǎn)品的共性與差異,另一方面會(huì)從用戶認(rèn)知的視角出發(fā),設(shè)計(jì)多組用戶實(shí)驗(yàn)深入探討敘事對(duì)文化產(chǎn)品的影響。這種混合式的研究范式融合了數(shù)據(jù)驅(qū)動(dòng)、模型驅(qū)動(dòng)的研究范式,對(duì)于現(xiàn)象及規(guī)律發(fā)現(xiàn)的因果性解釋具有重要意義。
4 討論與總結(jié)
計(jì)算敘事通過(guò)自然語(yǔ)言處理和文本挖掘以及諸多量化分析方法,系統(tǒng)化地研究敘事文本,揭示其內(nèi)在規(guī)律和影響。這一領(lǐng)域的研究不僅豐富了敘事學(xué)的理論體系,還為出版學(xué)研究提供新的工具和視角。
現(xiàn)階段,計(jì)算敘事的方法和思路仍然存在一定局限。①計(jì)算敘事存在語(yǔ)義理解的偏差。敘事文本是一種富語(yǔ)義文本,敘事特征高度依賴語(yǔ)境信息。計(jì)算方法在處理特殊語(yǔ)言與敘事現(xiàn)象時(shí),仍然存在困難。②計(jì)算模型存在一定的局限性。諸如深度學(xué)習(xí)帶來(lái)的“黑箱”問(wèn)題,導(dǎo)致難以解釋其內(nèi)部工作原理,對(duì)理解和驗(yàn)證結(jié)果帶來(lái)困難。③敘事特征捕捉的不完備性。計(jì)算方法可能難以捕捉敘事中的細(xì)微特征,如敘述者的語(yǔ)氣、隱含的文化背景和細(xì)膩的情感變化。此外,敘事文本的復(fù)雜結(jié)構(gòu),如非線性敘事、嵌套故事等,可能難以通過(guò)簡(jiǎn)單的計(jì)算模型進(jìn)行有效解析。
總體而言,為了實(shí)現(xiàn)共性規(guī)律的挖掘與識(shí)別,特定的語(yǔ)境信息會(huì)被過(guò)濾和遺漏,使得對(duì)更加具體敘事現(xiàn)象的分析存在偏差。因此,如何融合經(jīng)典個(gè)案闡釋與共性規(guī)律挖掘,進(jìn)而實(shí)現(xiàn)對(duì)敘事現(xiàn)象更加精準(zhǔn)的表征與刻畫,將是未來(lái)出版學(xué)研究的重點(diǎn)。
(責(zé)任編輯:郭劍)
參考文獻(xiàn)
[1] 徐麗芳,曾李.數(shù)字?jǐn)⑹屡c互動(dòng)數(shù)字?jǐn)⑹耓J].出版科學(xué),2016,24(3):96.
[2] 蔡凌菲,徐麗芳.Nosy Crow童書應(yīng)用:敘事與游戲的融合臺(tái)[J].出版參考,2017(11):24-26.
[3] 宋寧遠(yuǎn),王曉光.基于情節(jié)本體的敘事性文本語(yǔ)義結(jié)構(gòu)化表示方法研究[J].中國(guó)圖書館學(xué)報(bào),2020, 46(2):96-113.
[4] PIPER A,SO R J,BAMMAN D.Narrative theory for computational narrative understanding[C/OL]//Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing.2021:298-311[2024-08-15].https://aclanthology.org/2021.emnlp-main.26.
[5] GERVáS P.Computational approaches to storytelling and creativity[J].AI Magazine, 2009, 30(3):49-49.
[6] AKIMOTO T.Computational modeling of narrative structure:A hierarchical graph model for multidimensional narrative structure[J].International Journal of Computational Linguistics Research,2017,8(3):92-108.
[7] PROPP V.Morphology of the Folktale[J].U of Texas P,1968.
[8] BARTHES R,DUISIT L.An introduction to the structural analysis of narrative[J].New literary history,1975,6(2):237-272.
[9] 格雷馬斯.結(jié)構(gòu)語(yǔ)義學(xué):研究方法[M].吳泓渺,譯.生活·讀書·新知三聯(lián)書店,1999.
[10] 格雷馬斯.論意義:符號(hào)學(xué)論文集[M].吳泓渺,馮學(xué)俊,譯.天津:百花文藝出版社,2011.
[11] GENETTE G.Narrative Discourse:An Essay in Method[M].Ithaca:Cornell University Press,1980.
[12] PACKARD G,BERGER J.The emergence and evolution of consumer language research[J].Journal of Consumer Research,2024,51(1):42-51.
[13] PACKARD G,BERGER J,BOGHRATI R.How verb tense shapes persuasion[J].Journal of Consumer Research,2023,50(3):645-660.
[14] CASCIO RIZZO G L,BERGER J,DE ANGELIS M,et al.How sensory language shapes influencer’s impact[J].Journal of Consumer Research,2023, 50(4):810-825.
[15] BOGHRATI R,BERGER J,PACKARD G.Style, content and the success of ideas[J/OL].Journal of Consumer Psychology,2023,33(4):688-700.
[16] CHEN K,SONG N,ZHAO Y,et al.Online attention versus knowledge utilization:Exploring how linguistic features of scientific papers influence knowledge diffusion[J].Information Processing amp; Management,2024,61(3):103691.
[17] 龔詩(shī)陽(yáng),楊偉超,宋元明,等.數(shù)字文化產(chǎn)品為何流行?基于積極心理理論的大規(guī)模文本分析[J].南開(kāi)管理評(píng)論:1-34.
[18] TOUBIA O,BERGER J,ELIASHBERG J.How quantifying the shape of stories predicts their success[J/OL].Proceedings of the National Academy of Sciences,2021,118(26):e2011695118.
[19] BERGER J,TOUBIA O.The topography of thought[J].PNAS nexus,2024,3(5):163.
[20] PIPER A,TOUBIA O.A quantitative study of non-linearity in storytelling[J].Poetics,2023, 98:101793.
[21] SAP M,JAFARPOUR A,CHOI Y,et al.Quantifying the narrative flow of imagined versus autobiographical stories[J/OL].Proceedings of the National Academy of Sciences,2022,119(45):e2211715119.
[22] LEE O J,KIM J T.Measuring Narrative Fluency by Analyzing Dynamic Interaction Networks in Textual Narratives.[C/OL]//Text2Story@ ECIR.2020:15-22[2024-08-15].https://ceur-ws.org/Vol-2593/paper2.pdf.
[23] GERGEN K J,GERGEN M M.Narrative and the self as relationship[M/OL]//Advances in experimental social psychology(21):.Elsevier,1988:17-56[2024-08-15].https://www.sciencedirect.com/science/article/pii/S0065260108602233.
[24] BERGER J,KIM Y D,MEYER R.What makes content engaging? How emotional dynamics shape success[J].Journal of Consumer Research, 2021,48(2):235-250.
[25] PHAM M T,COHEN J B,PRACEJUS J W,et al.Affect monitoring and the primacy of feelings in judgment[J].Journal of consumer research, 2001,28(2):167-188.
[26] PACKARD G,BERGER J.How Language Shapes Word of Mouth’s Impact[J/OL].Journal of Marketing Research,2017,54(4):572-588.
[27] LAURINO DOS SANTOS H,BERGER J.The speed of stories:Semantic progression and narrative success[J].Journal of Experimental Psychology: General,2022,151(8):1833.
Quantification and Applications of Narratives in Digital Publishing
Ningyuan Song1 Junyi Shi1 Di Wang2 Yao Zhang3
1.School of Information Management, Nanjing University,Nanjing 210023,China;2.School of Liberal Arts, Nanjing University,Nanjing 210023,China;3.School of Journalism and New Media, Xi’an Jiaotong University,Xi’an 710049, China
Abstract As a crucial medium for information dissemination, narrative constitutes a key component of publication content. The in-depth exploration and elucidation of narrative characteristics, patterns, and their impacts have increasingly become a significant research focus within the field of publishing studies. Recent advancements in natural language processing and text mining have provided robust technical support for the quantitative analysis of narratives, making the understanding and application of computational narratives a pivotal factor in driving the sustainable development of the publishing industry. This paper systematically introduces the fundamental concepts of computational narratives from the perspective of narratology theory. It reviews and discusses the quantitative methods for narrative language, narrative structure, and narrative sentiment in existing research and the specific applications of computational narratives. Additionally, this paper explores the potential application scenarios of computational narrative methods in digital publishing, offering new perspectives for the optimization of publication content and the transformation of the publishing industry.
Keywords Narrative; Computational narrative; Computational methods; Digital publishing