摘" 要:基于哈爾濱工業(yè)大學(xué)LTP語(yǔ)言云系統(tǒng)的依存句法樹庫(kù),從依存關(guān)系類型、依存距離、依存方向百分比三個(gè)方面,對(duì)彈幕語(yǔ)言的句法特征進(jìn)行探究。研究發(fā)現(xiàn),彈幕語(yǔ)言的依存類型以狀中關(guān)系、主謂關(guān)系、右附加關(guān)系、定中關(guān)系、動(dòng)賓關(guān)系為主。彈幕語(yǔ)言的句長(zhǎng)較短,以簡(jiǎn)單句為主,復(fù)句為輔;單句的句長(zhǎng)集中在1—5個(gè)詞語(yǔ)之內(nèi),復(fù)句的句長(zhǎng)集中在10—15個(gè)詞語(yǔ)之內(nèi)。彈幕語(yǔ)言單、復(fù)句的平均依存距離隨著句長(zhǎng)的增加而緩慢增長(zhǎng),二者具有顯著相關(guān)性。彈幕語(yǔ)言的依存方向主要表現(xiàn)為支配詞在后。
關(guān)鍵詞:彈幕語(yǔ)言;依存樹庫(kù);依存關(guān)系類型;依存距離;依存方向;句法特征
一、引言
“彈幕”一詞發(fā)源于日本,是在日本的網(wǎng)絡(luò)文化中產(chǎn)生的,2006年12月由Niconico網(wǎng)站推出,其功能是即時(shí)留言字幕。2007年,國(guó)內(nèi)首家彈幕視頻網(wǎng)站AcFun(以下簡(jiǎn)稱“A站”)成立,彈幕文化逐漸在國(guó)內(nèi)興起。之后,在bilibili網(wǎng)站(以下簡(jiǎn)稱“B站”)手中進(jìn)一步發(fā)展壯大,目前,B站作為國(guó)內(nèi)彈幕文化的代表,已成為深受當(dāng)代青年喜愛的文化社區(qū)和視頻網(wǎng)站。隨著彈幕文化的風(fēng)行,彈幕語(yǔ)言自然而然進(jìn)入學(xué)術(shù)界和大眾的視野,基于其獨(dú)特的功能屬性,彈幕語(yǔ)言呈現(xiàn)出短小精煉、簡(jiǎn)潔明了、主觀性強(qiáng)等特點(diǎn)。
國(guó)內(nèi)學(xué)者對(duì)彈幕的研究主要是從社會(huì)互動(dòng)機(jī)制和文化動(dòng)因的角度進(jìn)行的,涉及以下兩個(gè)方面:第一,對(duì)彈幕評(píng)論行為的驅(qū)動(dòng)因素進(jìn)行研究,主要是通過(guò)彈幕內(nèi)容來(lái)分析彈幕用戶的行為動(dòng)機(jī)。馮鈺茹、鄧小昭從統(tǒng)計(jì)學(xué)的角度出發(fā),驗(yàn)證了自我效能感和信任這兩個(gè)指標(biāo)對(duì)彈幕評(píng)論行為具有顯著的正向影響[1]。陳憶金等對(duì)視頻彈幕的交互模式進(jìn)行了探究,分析某一類視頻彈幕發(fā)送的時(shí)間以及彈幕內(nèi)容的從眾性[2]。張寧等則以數(shù)字人文視頻為例,闡述了用戶彈幕評(píng)論行為的生成路徑:情境—認(rèn)知情感單元—行為[3]。第二,對(duì)彈幕評(píng)論的情感分析,即通過(guò)彈幕內(nèi)容來(lái)探究其背后的文化因素、情感表達(dá)和思想傾向。曾一果論述了青年群體熱衷于彈幕文化的背后所體現(xiàn)出的情感需要和價(jià)值訴求,折射出青年人在數(shù)字媒介時(shí)代所處的“群體性孤獨(dú)”境況[4]。董天策、楊龍夢(mèng)玨則探討了青年群體在觀看視頻《中國(guó)歷代疆域變化》時(shí)如何共同分享國(guó)族的幻想,民眾在這一空間共享歷史的輝煌和面臨苦難的拼搏,并建構(gòu)國(guó)族認(rèn)同,形塑國(guó)族身份[5]。在傳統(tǒng)質(zhì)性分析的基礎(chǔ)上,也有學(xué)者基于數(shù)字化手段進(jìn)行情感分析研究。邱全磊等專門構(gòu)建了一種新的基于表情和語(yǔ)氣的情感詞典,用于彈幕情感分析[6]。曾誠(chéng)等利用機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)的情感分析模型,進(jìn)行彈幕語(yǔ)言的情感分析,以解決傳統(tǒng)方法無(wú)法區(qū)分同一個(gè)詞在具體語(yǔ)境中含義不同等問(wèn)題[7]。
總的來(lái)看,國(guó)內(nèi)學(xué)界關(guān)于彈幕語(yǔ)言的研究,主要集中在由彈幕內(nèi)容衍生出來(lái)的情感表達(dá)或行為機(jī)制方面,而對(duì)于彈幕語(yǔ)言本體特征的分析則較少關(guān)注。近些年來(lái),僅有幾位學(xué)者從詞匯、文字形式、語(yǔ)體等角度入手,闡述了彈幕語(yǔ)言的特點(diǎn)[8]-[11]。有鑒于此,本文在依存語(yǔ)法理論的指導(dǎo)下,構(gòu)建彈幕語(yǔ)言小型依存樹庫(kù),采用計(jì)量語(yǔ)言學(xué)的研究方法,分析彈幕語(yǔ)言的句法依存關(guān)系。
二、彈幕語(yǔ)言的功能特點(diǎn)
彈幕文化是一種新興的網(wǎng)絡(luò)亞文化,它反映的是青年群體日趨多樣化的情感訴求和價(jià)值立場(chǎng),具有即時(shí)性、互動(dòng)性、參與性和娛樂性等特征。作為一種即時(shí)評(píng)論技術(shù),彈幕語(yǔ)言為青年群體搭建了一個(gè)社會(huì)交往、情感交流的平臺(tái),這既體現(xiàn)在其鮮明的表達(dá)特點(diǎn)上,也體現(xiàn)在強(qiáng)烈的交互主觀性上。
(一)彈幕語(yǔ)言的表達(dá)特點(diǎn)
彈幕語(yǔ)言首先產(chǎn)生于發(fā)起者在網(wǎng)絡(luò)語(yǔ)言特區(qū)中的即興表達(dá),因此,該類語(yǔ)言并不遵照傳統(tǒng)語(yǔ)言學(xué)的語(yǔ)法規(guī)則造句,而是呈現(xiàn)出多元化、碎片化、個(gè)性化的特點(diǎn)。
1.語(yǔ)言構(gòu)成多元化
彈幕語(yǔ)言的構(gòu)成具有多樣性、多元化的特點(diǎn)。首先,表現(xiàn)在它的語(yǔ)言構(gòu)成不僅限于漢語(yǔ)、英語(yǔ)、日語(yǔ)等不同國(guó)家或民族的語(yǔ)言;其次,表現(xiàn)在網(wǎng)絡(luò)語(yǔ)言及數(shù)字化、口語(yǔ)化語(yǔ)言,如“天選之人”“前方高能”“hhhhhh”“666”等;再次,還表現(xiàn)在各種語(yǔ)言形式的雜糅。因此,彈幕語(yǔ)言作為近些年新興的媒體語(yǔ)言形式,語(yǔ)言構(gòu)成豐富多樣,具有極強(qiáng)的靈活性。
2.語(yǔ)言形式碎片化
碎片化的表達(dá)方式是彈幕語(yǔ)言的基本特征之一。彈幕語(yǔ)言具有句式短小精煉的特征,其碎片化的表達(dá)顯然是符合語(yǔ)言的經(jīng)濟(jì)原則的。同時(shí),這一特點(diǎn)也是由彈幕語(yǔ)言的即時(shí)性所決定的。如本文所收集的語(yǔ)料“好嚇人”,這一句子即使是省略了主語(yǔ),但是共同觀看《河西走廊》紀(jì)錄片的觀眾們,仍然能夠很好地理解該語(yǔ)言所表達(dá)的意義,在該紀(jì)錄片中,它指的是壁畫中人物的舌頭好嚇人。
3.語(yǔ)言表現(xiàn)個(gè)性化
由于彈幕具有即時(shí)性以及隱蔽性,受眾所表達(dá)的語(yǔ)言往往是他們產(chǎn)生的第一感受。這些感受不僅與視頻的主旨內(nèi)容和價(jià)值導(dǎo)向有關(guān),還和個(gè)人的文化背景、道德觀念、現(xiàn)場(chǎng)情緒等因素緊密相關(guān)。因此,彈幕語(yǔ)言往往帶有濃厚的個(gè)人色彩,同時(shí),彈幕的內(nèi)容也往往表現(xiàn)出強(qiáng)烈的認(rèn)同或強(qiáng)烈的反對(duì)立場(chǎng)。就此而言,個(gè)人的主觀認(rèn)識(shí)、情感傾向在彈幕語(yǔ)言中占據(jù)顯著地位。
(二)彈幕語(yǔ)言的交互主觀性
沈家煊指出,主觀性是指語(yǔ)言的一種特性,即在話語(yǔ)中多多少少總是含有說(shuō)話人“自我”的表現(xiàn)成分。在各種語(yǔ)言中,對(duì)話語(yǔ)標(biāo)記的選擇和使用,往往是在說(shuō)話者元語(yǔ)用意識(shí)監(jiān)控下完成的,具有強(qiáng)烈的主觀色彩,表達(dá)說(shuō)話者豐富的情感[12]。彈幕語(yǔ)言的“交互主觀性”是指由于彈幕具有互動(dòng)功能,受眾們可以共同表達(dá)對(duì)所觀看內(nèi)容的感受和看法。因此,每一條彈幕語(yǔ)言的形成都會(huì)受到之前彈幕的影響,并對(duì)之后的彈幕產(chǎn)生影響,具有交流互動(dòng)性質(zhì),能夠讓觀眾對(duì)視頻內(nèi)容進(jìn)行及時(shí)反饋、產(chǎn)生情感共鳴,并在共同的主題下維持話題的延續(xù)。
1.即時(shí)反饋
彈幕語(yǔ)言的交互主觀性首先基于其即時(shí)反饋的運(yùn)作機(jī)制,即時(shí)的反饋功能為觀眾之間的互動(dòng)提供了基本條件。觀眾作為第一視角,對(duì)視頻發(fā)表的看法、表達(dá)的情感,都能在第一時(shí)間反映在彈幕中。其他觀眾不僅擁有第一視角,可以對(duì)視頻發(fā)表自己的見解,同時(shí),他還擁有第三視角的功能,可以對(duì)先前觀眾所發(fā)表的看法予以評(píng)價(jià)。因此,觀眾們所發(fā)表的彈幕內(nèi)容,既包括對(duì)視頻本身的看法,也包括對(duì)之前彈幕的看法。尤其值得注意的是,由第三視角得到的彈幕反饋,對(duì)于第一視角的看法具有促進(jìn)或反對(duì)的作用。
2.情感共鳴
通過(guò)我們所收集的語(yǔ)料信息,可以發(fā)現(xiàn),每一條彈幕都具有極強(qiáng)的觀眾互動(dòng)性,即發(fā)彈幕的人始終試圖在與其他受眾之間建立一種精神上的聯(lián)系,并通過(guò)不同語(yǔ)言形式的表達(dá),力圖引起大家的情感共鳴。如彈幕語(yǔ)料中的“我不信?!焙汀疤珟浟税?!”這樣的評(píng)論,既傳遞了發(fā)言者本人的即時(shí)情感反應(yīng),也揭示了一種潛在的期待:他們希望自己的看法能夠得到其他觀眾的認(rèn)同或回應(yīng)。此時(shí),發(fā)彈幕的觀眾并不是在獨(dú)自發(fā)表看法,而是企圖與他人發(fā)生情感的共鳴。
3.話題延續(xù)
話題延續(xù)的交互主觀性主要體現(xiàn)在,當(dāng)一條彈幕開始引發(fā)共鳴時(shí),其他觀眾可能會(huì)采用更多的彈幕來(lái)回應(yīng)這一原始評(píng)論,或者是表達(dá)同意、反駁,或者是進(jìn)一步的思考,并借此來(lái)延展話題。比如,語(yǔ)料“我的家鄉(xiāng)武威”之后,又出現(xiàn)了“我去過(guò)武威”“想家”等話題,從而構(gòu)成了一組話題集群??梢?,受眾通過(guò)某一條即時(shí)評(píng)論,在產(chǎn)生情感共鳴的基礎(chǔ)上,從不同視角進(jìn)行話題互動(dòng)。
三、研究理論與語(yǔ)料收集
現(xiàn)代依存語(yǔ)法的創(chuàng)始人,一般認(rèn)為是法國(guó)語(yǔ)言學(xué)家呂西安·泰尼埃(Lucien Tesnière)。他在1959年出版的《結(jié)構(gòu)句法基礎(chǔ)》(Eléments de Syntaxe Structurale)[13]一書中,集中闡述了依存語(yǔ)法的主要觀念體系。依存語(yǔ)法又稱為“從屬關(guān)系語(yǔ)法”,主要用于描述句子中支配詞與從屬詞之間的二元依存關(guān)系。其中,帶箭頭的弧線具備有向性,從支配詞指向從屬詞,并將動(dòng)詞作為依存關(guān)系樹的根節(jié)點(diǎn)。
這里以“我愛我的祖國(guó)”為例,對(duì)依存句法關(guān)系加以說(shuō)明。在該例句中,動(dòng)詞“愛”作為句子的根節(jié)點(diǎn),支配人稱代詞“我”,形成主謂依存關(guān)系(SBV);支配名詞“祖國(guó)”,形成動(dòng)賓依存關(guān)系(VOB)。同時(shí),名詞“祖國(guó)”與人稱代詞“我”形成定中依存關(guān)系(ATT),“我”和助詞“的”之間形成右附加依存關(guān)系(RAD)。“我愛我的祖國(guó)”的句法依存關(guān)系,具體如圖1所示:
圖1" “我愛我的祖國(guó)”句法依存關(guān)系圖示
通過(guò)上述依存關(guān)系,可以更加直觀地了解該句子的句法、語(yǔ)義結(jié)構(gòu)。同時(shí),依存距離(DD)和依存方向也是依存語(yǔ)法理論研究的兩個(gè)重要指標(biāo)?!耙来婢嚯x”一詞由Hudson于1995年引入,他將依存距離定義為支配詞和從屬詞之間所隔詞語(yǔ)的數(shù)量。劉海濤則將依存距離定義為支配詞序號(hào)減從屬詞序號(hào)的差[14](P252-258)。如“我愛我的祖國(guó)”中,“我—愛”之間的依存距離為:2-1=1,“愛—祖國(guó)”之間的依存距離為:2-5=-3。同時(shí),利用依存距離的絕對(duì)值可以計(jì)算某句話依存距離的均值,依存距離均值的結(jié)果與句子的句法復(fù)雜度密切相關(guān),其計(jì)算公式為:
這里的“依存方向”是指支配詞與從屬詞之間的位置關(guān)系。由上述依存距離的結(jié)果,可以獲知依存距離具有方向性:如果支配詞在從屬詞之后,則方向?yàn)檎?;如果支配詞在從屬詞之前,則方向?yàn)樨?fù)。劉海濤提出了計(jì)算句子依存方向百分比的公式[14](P259-265):
支配詞置后依存關(guān)系百分比=支配詞置后依存關(guān)系個(gè)數(shù)/所有依存關(guān)系個(gè)數(shù)*100;
支配詞居前依存關(guān)系百分比=支配詞居前依存關(guān)系個(gè)數(shù)/所有依存關(guān)系個(gè)數(shù)*100。
基于上述依存語(yǔ)法理論,本文將依存關(guān)系比例、依存距離、依存方向作為指標(biāo),探究彈幕語(yǔ)言的句法依存特點(diǎn)。
就語(yǔ)料收集來(lái)說(shuō),首先利用Python爬蟲技術(shù),爬取了B站《河西走廊》紀(jì)錄片相關(guān)彈幕內(nèi)容1022條,共計(jì)10829字。然后通過(guò)正則表達(dá)式進(jìn)行語(yǔ)料清洗,并利用Python第三方j(luò)ieba庫(kù)分詞,去除停用詞,得到1663個(gè)詞語(yǔ)。最后,借助哈爾濱工業(yè)大學(xué)LTP依存句法分析樹庫(kù),對(duì)彈幕語(yǔ)料進(jìn)行依存分析。
四、結(jié)果與討論
基于依存語(yǔ)法研究相關(guān)理論成果,我們對(duì)所收集的彈幕語(yǔ)料進(jìn)行了依存句法計(jì)算,在此基礎(chǔ)上,對(duì)彈幕語(yǔ)言的依存關(guān)系進(jìn)行深入分析。
(一)彈幕語(yǔ)言依存關(guān)系類型占比分析
基于哈工大LTP句法分析器對(duì)彈幕語(yǔ)料的分析,可以得到彈幕語(yǔ)料所具有的依存關(guān)系類型共有12種,它們分別是:核心關(guān)系(HED)、主謂關(guān)系(SBV)、狀中關(guān)系(ADV)、定中關(guān)系(ATT)、動(dòng)賓關(guān)系(VOB)、動(dòng)補(bǔ)關(guān)系(CMP)、介賓關(guān)系(POB)、兼語(yǔ)關(guān)系(DBL)、左附加關(guān)系(LAD)、右附加關(guān)系(RAD)、前置賓語(yǔ)關(guān)系(FOB)、并列關(guān)系(COO)。除去必有的核心關(guān)系(HED)之外,其余11種依存關(guān)系類型的出現(xiàn)頻次和百分比,具體如表1所示:
從表1可以看出,在彈幕語(yǔ)言的依存關(guān)系類型中,狀中關(guān)系(ADV)的占比最高;主謂關(guān)系(SBV)、右附加關(guān)系(RAD)、定中關(guān)系(ATT)、動(dòng)賓關(guān)系(VOB)次之;左附加關(guān)系(LAD)、兼語(yǔ)關(guān)系(DBL)、前置賓語(yǔ)關(guān)系(FOB)則占比很低。
狀中短語(yǔ)是由狀語(yǔ)和中心語(yǔ)組成的短語(yǔ),狀語(yǔ)起修飾、限制作用,中心語(yǔ)即狀語(yǔ)所修飾的動(dòng)詞或形容詞。在彈幕語(yǔ)料中,狀中關(guān)系的出現(xiàn)頻次最高,表明動(dòng)詞和形容詞占有更重要的地位。由于彈幕語(yǔ)言具有即時(shí)性特點(diǎn),其內(nèi)容更多地是反映觀眾當(dāng)下的感受和狀態(tài),而動(dòng)詞和形容詞最適合表達(dá)觀眾當(dāng)下的情狀,因此,狀中短語(yǔ)使用頻次相對(duì)較高,共出現(xiàn)638次。如“這舌頭好嚇人”中的“好嚇人”,即為副詞修飾形容詞的狀中關(guān)系,這類短語(yǔ)在彈幕語(yǔ)言中比比皆是。
主謂短語(yǔ)是由主語(yǔ)名詞和謂語(yǔ)構(gòu)成的短語(yǔ),它們之間為陳述與被陳述的關(guān)系。在彈幕語(yǔ)料中,此類關(guān)系位列第二,共出現(xiàn)616次。主謂短語(yǔ)往往用來(lái)表示觀眾對(duì)視頻內(nèi)容的陳述或見解,如“嘴型像尊龍”中的“嘴型像”即為主謂關(guān)系,全句表達(dá)觀眾對(duì)視頻的實(shí)時(shí)看法。
右附加關(guān)系是附屬詞語(yǔ)對(duì)名詞等成分的補(bǔ)充說(shuō)明,使要表達(dá)的意思更加完整。在彈幕語(yǔ)料中,此類關(guān)系位列第三,共出現(xiàn)579次。右附加式關(guān)系主要包括“……的”的組合句式,如“手撕面包的是魔鬼嗎?”“這可是央視的”句中的“手撕面包的”“央視
的”,即為右附加式關(guān)系。同時(shí),以“了”結(jié)尾的彈幕語(yǔ)句,也是彈幕語(yǔ)言的主要句式之一,如“我悟了”“老神棍了”,這些句式以名詞后附加助詞補(bǔ)充說(shuō)明的形式,陳述對(duì)視頻的實(shí)時(shí)觀點(diǎn)。
同狀中關(guān)系一樣,定中關(guān)系也是由修飾語(yǔ)和中心語(yǔ)構(gòu)成的依存關(guān)系類型,兩者的區(qū)別在于定中關(guān)系的中心語(yǔ)由體詞性成分充當(dāng)。在彈幕語(yǔ)料中,此類關(guān)系位列第四,共出現(xiàn)566次。如“滑稽臉”“混血美男”,就是由形容詞修飾名詞的定中短語(yǔ)。由于彈幕語(yǔ)言與視頻具有實(shí)時(shí)關(guān)系,定中短語(yǔ)能夠以最短的句長(zhǎng)形式,在觀眾之間表達(dá)最直接的語(yǔ)義信息,符合省力原則下自然語(yǔ)言的最短距離化傾向的特點(diǎn),因此,它在彈幕語(yǔ)言中使用頻次較高。
動(dòng)賓關(guān)系是人類語(yǔ)言中最常見的關(guān)系類型之一,在彈幕語(yǔ)料中位列第五,共出現(xiàn)558次。如“悲傷淹沒了你”“智者不入愛河”,表達(dá)的是一種支配與被支配的關(guān)系。
通過(guò)上文的分析,可以發(fā)現(xiàn),彈幕語(yǔ)言的依存類型特點(diǎn)與漢語(yǔ)自然語(yǔ)言略有不同。在漢語(yǔ)自然語(yǔ)言對(duì)話中,主謂、動(dòng)賓關(guān)系的使用頻次更高;在彈幕語(yǔ)言中,則是狀中關(guān)系的使用頻次最多,右附加關(guān)系也占有很大比重。
(二)彈幕語(yǔ)言的句長(zhǎng)及依存距離分析
如前所述,短小精煉是彈幕語(yǔ)言的顯著特點(diǎn),因此,彈幕語(yǔ)言的句長(zhǎng)總體較短,以單句為主。與此同時(shí),彈幕語(yǔ)言的靈活性較大,也存在不少?gòu)?fù)句。筆者對(duì)所收集的1022個(gè)彈幕語(yǔ)料的單句、復(fù)句的句長(zhǎng)、依存距離進(jìn)行了分類統(tǒng)計(jì),以探求彈幕語(yǔ)言的句長(zhǎng)規(guī)律,并對(duì)句長(zhǎng)與依存距離的關(guān)系進(jìn)行分析。
1.彈幕語(yǔ)料句長(zhǎng)分析
基于哈工大LTP句法分析器對(duì)彈幕語(yǔ)料的分析,可以得到1022個(gè)彈幕語(yǔ)料中單句和復(fù)句句子的句長(zhǎng),并求出平均句長(zhǎng)。具體如表2所示:
從表2可以看出,彈幕語(yǔ)言以單句為主,共計(jì)761條,是復(fù)句數(shù)量的三倍以上。其中,句長(zhǎng)為1—5單位的彈幕語(yǔ)言數(shù)量最多,共計(jì)530條,主要是單句;句長(zhǎng)為6—10單位的彈幕語(yǔ)言次之,共計(jì)347條,復(fù)句占了很大的比重。單句、復(fù)句的占比分別是74.5%、25.5%,比例約為3:1。
2.彈幕語(yǔ)料平均依存距離分析
依存距離是反映句子句法復(fù)雜度的重要指標(biāo)之一,我們?cè)谏衔囊呀?jīng)列出了依存距離的計(jì)算公式。在哈爾濱工業(yè)大學(xué)所提供的句法依存樹庫(kù)的基礎(chǔ)上,筆者采用了劉海濤提出的依存距離計(jì)算方法,來(lái)計(jì)算彈幕語(yǔ)言的平均依存距離(MDD)。此處以彈幕語(yǔ)料“歷史真的很神奇”為例,對(duì)此加以說(shuō)明。該例句的依存關(guān)系有向圖,可如圖2所示:
該例句的平均依存距離是:
MDD=(|4-3|+|4-2|+|4-1|)/4=1.5
在彈幕語(yǔ)料中,不僅有很多簡(jiǎn)單句,還存在一些復(fù)句。筆者根據(jù)簡(jiǎn)單句平均依存距離的計(jì)算方法,對(duì)復(fù)句的平均依存距離進(jìn)行計(jì)算。其方法是先算出各個(gè)分句的平均依存距離,然后相加,再除以分句個(gè)數(shù)。這里以彈幕語(yǔ)料“真用心了,演員找的真好”為例,對(duì)此加以說(shuō)明。該例句的依存關(guān)系有向圖,可如圖3所示:
1" " 2" " 3" " 4" " 5" "6" "7" "8
該例句的平均依存距離是:
MDD=[(|2-1|+|2-3|)/3+(|5-4|+|5-6|+|8-7|+|5-8|)/5]/2=0.93
運(yùn)用以上計(jì)算方法,我們可以得到1022個(gè)彈幕語(yǔ)料的平均依存距離以及其與句長(zhǎng)的關(guān)系。具體如表3所示:
如表3所示,筆者對(duì)彈幕語(yǔ)料句長(zhǎng)為1—20的單復(fù)句的平均依存距離進(jìn)行了計(jì)算??梢钥闯?,隨著句長(zhǎng)的增加,單句和復(fù)句的平均依存距離也在緩慢增加,二者呈正相關(guān)關(guān)系。這也符合劉海濤的結(jié)論:依存距離越小,句法復(fù)雜度越低[14](P253)。
我們還將表3中的句長(zhǎng)與總MDD導(dǎo)入SPSS,進(jìn)行斯皮爾曼相關(guān)性分析。具體如表4所示:
表4中,斯皮爾曼的顯著性分析<0.01,因此,句長(zhǎng)和平均依存距離(MDD)具有顯著相關(guān)性。從表3還可看出,在句長(zhǎng)一致的情況下,復(fù)句的平均依存距離要明顯小于單句的平均依存距離。一般來(lái)說(shuō),復(fù)句應(yīng)比單句更為復(fù)雜,這似乎與上述結(jié)論不符。那么,應(yīng)該如何解釋這一現(xiàn)象呢?我們認(rèn)為,復(fù)句的依存距離是在各分句的基礎(chǔ)上進(jìn)行計(jì)算的,也就是說(shuō),產(chǎn)生差異的主要原因是:構(gòu)成復(fù)句的各個(gè)分句的內(nèi)部句法結(jié)構(gòu),要比一個(gè)獨(dú)立的單句的句法結(jié)構(gòu)簡(jiǎn)單。這也與人們的認(rèn)知結(jié)構(gòu)相關(guān),要表達(dá)同一種含義,相對(duì)于一個(gè)單句來(lái)說(shuō),使用包含幾個(gè)分句的復(fù)句來(lái)表達(dá),大腦進(jìn)行語(yǔ)言組織的復(fù)雜度更低。這同樣可以解釋,為什么兒童在語(yǔ)言表達(dá)時(shí),更擅長(zhǎng)使用多個(gè)分句來(lái)表示意義。因此,單、復(fù)句平均依存距離的差異,往往與人的大腦和認(rèn)知相關(guān)。該現(xiàn)象是在劉海濤所得結(jié)論基礎(chǔ)上的補(bǔ)充,進(jìn)一步探究了單、復(fù)句平均依存距離的差異與認(rèn)知的關(guān)系。
(三)彈幕語(yǔ)言的依存方向百分比
作為語(yǔ)言類型學(xué)的重要指標(biāo)之一,依存方向主要是探究支配詞與從屬詞的前置與后置關(guān)系。劉海濤曾對(duì)漢語(yǔ)的句法進(jìn)行了計(jì)量研究,認(rèn)為漢語(yǔ)是一種支配詞居后的語(yǔ)言類型[14](P259-265)。本文利用依存方向百分比計(jì)算公式,對(duì)彈幕語(yǔ)言依存方向的確定進(jìn)行計(jì)算,結(jié)果如表5所示:
從表5可以看出,彈幕語(yǔ)言支配詞在后的依存類型比例明顯高于支配詞在前的依存類型比例。
五、結(jié)語(yǔ)
基于哈爾濱工業(yè)大學(xué)LTP語(yǔ)言云系統(tǒng)的依存句法樹庫(kù),本文從依存關(guān)系類型、依存距離、依存方向百分比三個(gè)方面,對(duì)彈幕語(yǔ)言的依存句法特征進(jìn)行了探究。研究顯示,彈幕語(yǔ)言的依存句法特征表現(xiàn)在四個(gè)方面。第一,彈幕語(yǔ)言的依存類型以狀中關(guān)系、主謂關(guān)系、右附加關(guān)系、定中關(guān)系、動(dòng)賓關(guān)系為主。第二,彈幕語(yǔ)言的句長(zhǎng)較短,以簡(jiǎn)單句為主,復(fù)句為輔。單句的句長(zhǎng)集中在1—5個(gè)詞語(yǔ)之內(nèi),復(fù)句的句長(zhǎng)集中在10—15個(gè)詞語(yǔ)之內(nèi)。第三,彈幕語(yǔ)言單、復(fù)句的平均依存距離隨著句長(zhǎng)的增加而緩慢增長(zhǎng),二者具有顯著相關(guān)性。第四,彈幕語(yǔ)言的依存方向主要表現(xiàn)為支配詞在后??梢?,彈幕語(yǔ)言的語(yǔ)言學(xué)結(jié)構(gòu)具有顯著特征。
需要指出的是,本文的研究雖然是基于Python爬取的彈幕語(yǔ)言的真實(shí)語(yǔ)料,但語(yǔ)料的數(shù)量較少,并且語(yǔ)料來(lái)源僅是紀(jì)錄片的彈幕,而未涉及綜藝、動(dòng)漫等其他視頻形式的彈幕語(yǔ)料,因此,研究結(jié)果具有一定局限性。同時(shí),在單句、復(fù)句依存距離的計(jì)算過(guò)程中,并未考慮到一些復(fù)句中各分句之間的語(yǔ)義依存關(guān)系。因此,本文所得出的結(jié)論,是否適用于所有的彈幕語(yǔ)言的依存類型、依存距離和依存方向,尚需進(jìn)一步探究。
參考文獻(xiàn):
[1]馮鈺茹,鄧小昭.彈幕視頻網(wǎng)站用戶彈幕評(píng)論行為的影響因素研究——以Bilibili彈幕視頻網(wǎng)站為例[J].圖書情報(bào)工作,2021,(17).
[2]陳憶金,卓林鍇,趙一鳴.學(xué)習(xí)類視頻彈幕用戶的交互行為研究[J].圖書館論壇,2021,(9).
[3]張寧,段小宣,袁勤儉.數(shù)字人文視頻的用戶彈幕評(píng)論行為生成機(jī)制[J].圖書館論壇,2022,(8).
[4]曾一果.彈幕背后青年群體的情感需要與價(jià)值訴求[J].人民論壇,2021,(10).
[5]董天策,楊龍夢(mèng)玨.國(guó)族的想象:作為修辭實(shí)踐的網(wǎng)絡(luò)民族主義——對(duì)B站《中國(guó)歷代疆域變化》彈幕的幻想主題分析[J].國(guó)際新聞界,2021,(4).
[6]邱全磊,崔宗敏,喻靜.基于表情和語(yǔ)氣的情感詞典用于彈幕情感分析[J].計(jì)算機(jī)技術(shù)與發(fā)展,2020,(8).
[7]曾誠(chéng),溫超東,孫瑜敏,潘列,何鵬.基于ALBERT-CRNN的彈幕文本情感分析[J].鄭州大學(xué)學(xué)報(bào)(理學(xué)版),2021,(3).
[8]王文博.試析彈幕語(yǔ)言在詞匯、漢字上的創(chuàng)新機(jī)制——基于嗶哩嗶哩彈幕網(wǎng)的分析[J].漢字文化,2022,(1).
[9]洪曉旭.認(rèn)知語(yǔ)言學(xué)視角下B站彈幕的名詞活用現(xiàn)象考察[J].科技傳播,2022,(19).
[10]趙雪.一種新的網(wǎng)絡(luò)評(píng)論語(yǔ)體:彈幕語(yǔ)體[J].天津外國(guó)語(yǔ)大學(xué)學(xué)報(bào),2022,(2).
[11]馮韶丹.彈幕視頻語(yǔ)言的四大特征[J].傳媒,2018,(11).
[12]沈家煊.語(yǔ)言的“主觀性”和“主觀化”[J].外語(yǔ)教學(xué)與研究,2001,(4).
[13]Tesnière,L.Eléments de Syntaxe Structurale[M].Paris:Klincksieck,1959.
[14]劉海濤.依存語(yǔ)法的理論與實(shí)踐[M].北京:科學(xué)出版社,2009.
Research on the Syntactic Features of Bullet Screen Language Based on Dependency Tree Library
Wang Ziyue,Aziguli Xalifu
(School of Chinese Language and Literature, Xinjiang University, Urumqi 830002, China)
Abstract:Based on the dependency syntax tree library of LTP language Cloud system of Harbin Institute of Technology, this paper explores the syntactic features of bullet screen language from three aspects: dependency type, dependency distance and dependency direction percentage. It is found that the dependency types of bullet screen language are mainly in the form of the relationship, the subject-predicate relationship, the right attachment relationship, the fixed middle relationship and the verb-object relationship. The sentences of bullet screen language are short, mainly simple sentences, supplemented by complex sentences; The sentence length of a single sentence is concentrated within 1—5 words, and the sentence length of a complex sentence is concentrated within 10—15 words. The average dependency distance of single complex sentences in bullet screen language increases slowly with the increase of sentence length, and there is a significant correlation between them. The dependent direction of bullet screen language is mainly manifested as the dominant word after.
Key words:bullet screen language;dependency tree library;dependency type;dependency distance;dependency direction;syntactic feature