劉朕君
(北京師范大學(xué)-香港浸會(huì)大學(xué)聯(lián)合國(guó)際學(xué)院,廣東 珠海 519000)
中文文學(xué)作品中的社會(huì)網(wǎng)絡(luò)抽取與研究
劉朕君
(北京師范大學(xué)-香港浸會(huì)大學(xué)聯(lián)合國(guó)際學(xué)院,廣東 珠海 519000)
文學(xué)一直以來都是人類思想的主要載體,文學(xué)作品由一個(gè)個(gè)文字組成,通過分析這些文字在作品中的意義,可以理解作品中的人物形象,明確文本的思想觀念表達(dá)。現(xiàn)階段,隨著電子信息技術(shù)的發(fā)展,對(duì)文學(xué)作品的社會(huì)網(wǎng)絡(luò)抽取已經(jīng)成為了新的研究熱點(diǎn)。文章主要研究中文文學(xué)作品中的社會(huì)網(wǎng)絡(luò)抽取與研究。
中文文學(xué);社會(huì)網(wǎng)絡(luò)抽??;語言
在人類歷史的長(zhǎng)河中,人類的精神文明通過文學(xué)得以傳承,我國(guó)作為一個(gè)傳承幾千年的古老大國(guó),具有著豐富的文學(xué)底蘊(yùn)。隨著信息技術(shù)的發(fā)展,大量的文學(xué)作品被電子化。如果從這些作品中抽取出有價(jià)值的資料,利用自然語言處理以及計(jì)算機(jī)技術(shù),是否能夠?qū)ψ髌分械纳鐣?huì)現(xiàn)實(shí)信息進(jìn)行再現(xiàn)與還原,這一問題值得深思。
在信息化不斷深入的今天,計(jì)算機(jī)網(wǎng)絡(luò)已經(jīng)深入的影響到了人們生活的方方面面。在文學(xué)作品領(lǐng)域,電子信息化的文學(xué)早已成為了人們文化生活的常態(tài)。從最基礎(chǔ)的電子圖書,到作品翻譯,相關(guān)信息檢索,數(shù)據(jù)結(jié)構(gòu)分析等,目前的信息水平,已經(jīng)具備了智能處理分析文學(xué)作品的基本條件。自然語言處理是現(xiàn)階段進(jìn)行文學(xué)作品處理的主要手段,其分析過程主要包括三個(gè)方面:①語言研究,例如對(duì)文學(xué)作品中的文章。詞匯使用狀態(tài)進(jìn)行分析;②篇章分析,即對(duì)文本篇章中語言、結(jié)構(gòu)、理論的分析;③綜合分析,這一技術(shù)還只是一種概念分析方法,目前還處于研究階段。
社會(huì)網(wǎng)絡(luò)是行動(dòng)節(jié)點(diǎn)與行動(dòng)節(jié)點(diǎn)之間構(gòu)成的互相連接關(guān)系。網(wǎng)絡(luò)中的接點(diǎn)可以是單獨(dú)的個(gè)體,也可以是共同的集合體。從理論方面來理解,社會(huì)網(wǎng)絡(luò)可以是親緣網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)、信息網(wǎng)絡(luò)、拓?fù)浣Y(jié)構(gòu)等等,其中最常見的要數(shù)社交網(wǎng)絡(luò)。社會(huì)網(wǎng)絡(luò)抽取分析,就是通過矩陣以及圖對(duì)社會(huì)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行分析。這一理論最早起源于上世紀(jì)30年代,是一種人類學(xué)以及心理學(xué)的概念,經(jīng)過長(zhǎng)時(shí)間的實(shí)踐發(fā)展,它才最終成為了一種跨學(xué)科的分析研究方法。
現(xiàn)階段,已經(jīng)有一部分語言學(xué)專家、文學(xué)理論專家利用非計(jì)算模型對(duì)文學(xué)作品的結(jié)構(gòu)進(jìn)行展示。例如:社會(huì)關(guān)系圖、文本映射圖等。通過對(duì)文學(xué)招聘中的社會(huì)網(wǎng)絡(luò)進(jìn)行抽取并分析,能夠幫助人們更好的對(duì)作品的人物、背景、環(huán)境進(jìn)行分析。例如,在英國(guó)有一項(xiàng)研究,將作品中的人物對(duì)話進(jìn)行標(biāo)記,并將這些標(biāo)記進(jìn)行按角色分配,以此組織作品中人物的社會(huì)量化指標(biāo),形成社會(huì)網(wǎng)絡(luò),以此為基礎(chǔ)對(duì)作品中的社會(huì)網(wǎng)絡(luò)進(jìn)行研究。這是一種對(duì)作品中社會(huì)人物進(jìn)行抽取的研究方法,其對(duì)現(xiàn)階段的文學(xué)作品社會(huì)網(wǎng)絡(luò)抽取與研究具有非常重要的參考以及指導(dǎo)意義。
從具象的角度理解,社會(huì)網(wǎng)絡(luò)是一種多節(jié)點(diǎn)組成的網(wǎng)絡(luò)結(jié)構(gòu)圖,為了對(duì)文學(xué)作品中的社會(huì)網(wǎng)絡(luò)進(jìn)行抽取并分析,必須要從作品中抽取一定的有價(jià)值片段,生成節(jié)點(diǎn),以此來構(gòu)建社會(huì)網(wǎng)絡(luò)結(jié)構(gòu)。對(duì)于文本中的文字、主題、或片段,可以進(jìn)行分區(qū)處理,將每一個(gè)區(qū)域看做是一個(gè)獨(dú)立的個(gè)體。以《三國(guó)演義》為例,這是一部章回體的小說著作。因此,在進(jìn)行社會(huì)網(wǎng)絡(luò)抽取的過程中,可以將同一章節(jié)中的共現(xiàn)情況作為人物之間的關(guān)系紐帶。在人物識(shí)別方面,可以利用web與統(tǒng)計(jì)方法建立人物列表。首先,可以利用文字處理技術(shù),對(duì)作品中的詞性成分進(jìn)行分析,一次來對(duì)文本中的人文進(jìn)行確定。例如,《三國(guó)演義》中共出現(xiàn)1191人。這種對(duì)小說中人物角色進(jìn)行抽取的方式雖然比較直觀,但準(zhǔn)確度相對(duì)較低。像《三國(guó)演義》《水滸傳》這一類的長(zhǎng)篇小說,涉及大量的綽號(hào)、別名、字,以及省略稱呼的情況,這是在進(jìn)行人物抽取過程中比較困難的部分。對(duì)此,可以采用多層次篩選的方式進(jìn)行選取,先篩選名詞,再篩選角色,最后篩選語法語義。在抽取了作品人文之后,再利用章回矩陣,可以初步建立一定的社會(huì)網(wǎng)絡(luò),以此作為分析的基礎(chǔ)。
(1)頻數(shù)分析。文學(xué)作品一般都是由人物、環(huán)境、時(shí)間、事件等因素構(gòu)成,而人物是作品的核心,因此,在進(jìn)行作品的社會(huì)網(wǎng)絡(luò)分析時(shí)可以將人物的出現(xiàn)頻數(shù)作為分析的指標(biāo)。例如,在小說《西游記》中,可以對(duì)其在的人文頻次進(jìn)行分析。通過對(duì)人物頻次的分析,能夠研究所分析人物在作品中的性格、特質(zhì),以及人文本身所代表的思想觀念。
(2)中心分析。對(duì)于網(wǎng)絡(luò)中心的分析,也就是對(duì)網(wǎng)絡(luò)中各節(jié)點(diǎn)在文本中心的程度。通過中心分析,可以客觀的得出在社會(huì)網(wǎng)絡(luò)中,該節(jié)點(diǎn)與主角的社會(huì)關(guān)系,以此探究作品中的重要角色。一般來說,在文本中出現(xiàn)的頻次越高,其中心程度也就越高。這些角色往往是作品的核心,是作品分析的重點(diǎn)。例如:《西游記》中出現(xiàn)頻次最高的是唐僧、孫悟空、豬八戒、沙僧,這也就凸顯了這幾個(gè)角色的中心程度。像龍王、二郎神這一類的角色出現(xiàn)的頻次低,說明其是文本中的邊緣角色,主要對(duì)作品內(nèi)容起到輔助的作用。
(3)子群分析。子群即社會(huì)網(wǎng)絡(luò)中存在的強(qiáng)烈、穩(wěn)定、直接的關(guān)系節(jié)點(diǎn)的集合。在進(jìn)行社會(huì)網(wǎng)絡(luò)分析的過程中,分析子群,就是對(duì)統(tǒng)一子群集體之間關(guān)系特點(diǎn)的分析。例如:在《三國(guó)演義》中,就可以分為六個(gè)主要的子群,其中通過分析每個(gè)子群之間的領(lǐng)導(dǎo)者,可以分析出作品中人物的對(duì)文本表達(dá)思想的重要意義。
隨著文學(xué)作品的信息化,對(duì)文學(xué)作品的智能化分析已經(jīng)成為了一種必然的研究趨勢(shì)。通過對(duì)文學(xué)作品中社會(huì)網(wǎng)絡(luò)的抽取以及研究,能夠?qū)崿F(xiàn)對(duì)文本人物、結(jié)構(gòu)、思想、理論等多方面的解讀。雖然,我國(guó)現(xiàn)階段的研究還處于不成熟的發(fā)展階段,但是,隨著科技的進(jìn)步,社會(huì)網(wǎng)絡(luò)分析,必然會(huì)成為一種文學(xué)研究方向。
[1]趙京勝,張麗,朱巧明,等.中文文學(xué)作品中的社會(huì)網(wǎng)絡(luò)抽取與分析[J].中文信息學(xué)報(bào),2017,31(2):99-106+116.
[2]肖永賀,謝亞軍.中文文學(xué)作品中人物命名的文化內(nèi)涵解讀[N].內(nèi)蒙古農(nóng)業(yè)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版 ),2016,(6):386-387.
作 者:
劉朕君(1996-),男,山東濟(jì)南人,本科在讀,研究方向:漢語言文學(xué)。I2
A
1009-5071(2017)10-0096-02