楊欣月
(四川大學(xué)文學(xué)與新聞學(xué)院,四川成都 610000)
彈幕指的是在網(wǎng)絡(luò)上觀看視頻時(shí)彈出的評(píng)論性字幕?!皬椖弧币辉~最初的意思指炮火射擊過于密集,以至于像一塊幕布一樣,為軍事術(shù)語(yǔ),也經(jīng)常被用在彈幕射擊游戲中。大量吐槽評(píng)論從屏幕飄過時(shí)效果看上去像是飛行射擊游戲里的彈幕,所以網(wǎng)民將這種有大量的吐槽評(píng)論出現(xiàn)時(shí)的效果叫做彈幕。在中國(guó),本來只有大量評(píng)論同時(shí)出現(xiàn)才能叫彈幕,但是隨著誤用單條評(píng)論也能叫彈幕了。
彈幕最早起源于日本的視頻分享網(wǎng)站——Niconico 動(dòng)畫,其基本功能與You-Tube 等影片共享網(wǎng)站相似。2007年,Niconico 動(dòng)畫新增留言板功能,為用戶提供可在影片上留言的功能,而留言會(huì)以彈幕的形式出現(xiàn)在影片上。后來國(guó)內(nèi)某些視頻網(wǎng)站例如A 站(AcFun)和B 站(Blilibili)陸續(xù)引入這種形式。在日本,這種評(píng)論(也就是我們通常所說的“彈幕”)被稱為コメント(comment,注釋、評(píng)論),只有國(guó)內(nèi)的彈幕網(wǎng)站會(huì)將評(píng)論稱之為彈幕。彈幕塑造一種與眾不同的“圍觀”體驗(yàn),排解一個(gè)人對(duì)著電腦屏幕而產(chǎn)生的孤獨(dú)感,同時(shí)獲得自我和群體認(rèn)同,這種強(qiáng)社交屬性使之迅速流行起來。
然而彈幕這種評(píng)論形式卻沒有在歐美國(guó)家的視頻網(wǎng)站上掀起潮流。事實(shí)上,海外媒體也有關(guān)于彈幕網(wǎng)站為何流行不起來的討論,但少有針對(duì)語(yǔ)言本身進(jìn)行分析;雖然社會(huì)文化等各種因素有一定的影響,但該文認(rèn)為語(yǔ)言文字的特點(diǎn)才是英文彈幕無(wú)法流行的主要原因。
視讀是一種通過大面積掃視文字,主要以大腦形象記憶及形象思維來對(duì)信息進(jìn)行集群處理的閱讀方式。與傳統(tǒng)電子文本的閱讀相同,視讀也是一項(xiàng)多個(gè)神經(jīng)中樞參與的復(fù)雜過程,包括視覺中樞、聽覺中樞、語(yǔ)言中樞、記憶中樞等。
同時(shí),彈幕視讀也是一種包含多種認(rèn)知行為的活動(dòng),通過視讀產(chǎn)生知覺需要現(xiàn)實(shí)刺激及過去的經(jīng)驗(yàn)等?,F(xiàn)實(shí)刺激指的是文字信息對(duì)眼睛產(chǎn)生光學(xué)刺激,而人們能夠理解這些文字的意思則是由于認(rèn)知中的過去經(jīng)驗(yàn)起了作用。因彈幕文本的特殊性,如實(shí)時(shí)性、時(shí)限性等特點(diǎn),人們需要在短時(shí)間內(nèi)掃視大量以一定速度運(yùn)動(dòng)的文本,大腦需要將這些文字符號(hào)進(jìn)行快速的加工處理并轉(zhuǎn)化為能夠理解的信息,而在這個(gè)過程中經(jīng)驗(yàn)信息尤為重要。
2.1.1 英語(yǔ)表音漢語(yǔ)表意
與拼音文字不同,漢字兼有文字與圖形的雙重特征,是一種獨(dú)特的圖形文字。人們?cè)陂喿x漢字的時(shí)候會(huì)同時(shí)刺激左腦的語(yǔ)言區(qū)和右腦的圖像區(qū),提取經(jīng)驗(yàn)中的文字和圖像信息進(jìn)行快速的加工整合,在此過程中圖像信息不需要經(jīng)過類似文字轉(zhuǎn)語(yǔ)音的過程便能刺激大腦形成思維。漢字屬于具有一定表音功能的表意文字,表意文字的語(yǔ)言書寫符號(hào)表達(dá)的是意義,用字形直接表達(dá)語(yǔ)意,雖然在文字結(jié)構(gòu)上也有表音成分,但字音服從于字形,是間接表音。而絕大多數(shù)印歐語(yǔ)系的文字都是表音文字,從記錄語(yǔ)音入手,用文字符號(hào)直接表示語(yǔ)音,字形服從于字音,不直接表示意義,即間接表示語(yǔ)意。這就意味著在觀看彈幕的時(shí)候,我們一看到漢字就能想到其表達(dá)的意思(文字→意義),而看到英文的時(shí)候要先把它拼讀出來然后才能明白它的含義 (文字→讀音→意義),在文字信息的閱讀理解過程中多了一個(gè)步驟,所以對(duì)于英語(yǔ)國(guó)家的人而言,聽視頻里的語(yǔ)言(發(fā)音→含義)比閱讀視頻里面的文字(文字→發(fā)音→含義)更容易更輕松(見圖1)。
圖1 文字傳輸進(jìn)腦途徑
在提取漢語(yǔ)經(jīng)驗(yàn)與英文經(jīng)驗(yàn)的過程中也存在一些差別;漢語(yǔ)的文本中雙音節(jié)詞匯占比最多,還有大量的固定短語(yǔ)如四字成語(yǔ)、諺語(yǔ)、歇后語(yǔ)等,閱讀中我們一般將其視作一個(gè)整體理解其意義,因?yàn)橥ㄟ^過去大量的閱讀實(shí)踐,我們對(duì)其表現(xiàn)形式及意義都非常熟悉,形與意在腦中已融為一體。而英語(yǔ)文本是26 個(gè)字母的排列組合,單詞長(zhǎng)短不一,組合眾多,很難輕松地推斷出某一字母前后的字母,只能從詞根、詞綴、整個(gè)英文單詞的程度上整體把握,另外英語(yǔ)單詞之間的空格使得英語(yǔ)文本的結(jié)構(gòu)較中文本更加松散。在彈幕視頻中,彈幕文本以一定的速度從屏幕上成片飄過,在同樣的情況下若只改變文字的形式,比起中文彈幕英文彈幕的掃讀難度更大、視讀效率較低。
雖然日語(yǔ)也是表音文字,但與英語(yǔ)不同的是日語(yǔ)是由音符直接表示音節(jié)的音節(jié)文字,而英文是由音符表示音素的音素文字。音節(jié)是由音素構(gòu)成的語(yǔ)音片段,是聽話時(shí)自然感到的最小語(yǔ)音單位,所以在閱讀英文時(shí)需要先將音素組合成音節(jié),閱讀日語(yǔ)則不需要此步驟。另一方面日本處于漢字文化圈,受中國(guó)文化影響,日語(yǔ)中也大量使用漢字。由此可見,日語(yǔ)彈幕的視讀效率也必然高于英文彈幕。
2.1.2 閱讀知覺廣度
眼睛的生理結(jié)構(gòu)給閱讀行為施加了很多限制。人的視網(wǎng)膜并不是一個(gè)勻質(zhì)的感受器,只有視野中占大約15 度視角的中央凹才是視網(wǎng)膜中唯一真正可以用來閱讀的區(qū)域。文字要進(jìn)入中央凹才能進(jìn)行閱讀,所以在閱讀的時(shí)候眼球需要不斷地移動(dòng),這種注視點(diǎn)的移動(dòng)稱為眼跳。在閱讀文本的時(shí)候,眼球會(huì)做著每秒鐘4~5 次的跳動(dòng),即每秒鐘4~5 次注視,每次注視都會(huì)新有的信息進(jìn)入中央凹。
閱讀知覺廣度通常指閱讀者在閱讀文本過程中在每次注視內(nèi)能獲取有用視覺信息的范圍。Rayner[1-3]等人采用眼動(dòng)追蹤技術(shù)中的移動(dòng)窗口范式對(duì)英語(yǔ)文本知覺廣度的研究取得了較一致的結(jié)論,即注視點(diǎn)左側(cè)3~4 個(gè)字母空間到注視點(diǎn)右側(cè)12~15 字母空間,即每次注視20 個(gè)字母左右。Inhoff[4]等人的研究采用移動(dòng)窗口范式探討了漢語(yǔ)讀者的閱讀知覺廣度,實(shí)驗(yàn)結(jié)果顯示漢字被注視的字符左側(cè)延伸1 個(gè)字符,向右延伸3 個(gè)字符,即每次注視5 個(gè)漢字左右。
在電腦屏幕上,文字是以字符串的形式顯示出來的,我們沒有辦法直接在電腦里面存入字符,如“彈幕文化” 這4 個(gè)字是沒有辦法將其進(jìn)行存儲(chǔ)的?,F(xiàn)行的方案是將字符編碼成0 和1 的數(shù)字串形式,建立兩者之間的映射關(guān)系,我們把這種方案叫作“字符集”。目前最常用的字符集是UTF-8 (8-bit Unicode Trans- formation Format),它是一種針對(duì)Unicode 字符集的可變長(zhǎng)度字符編碼規(guī)則,又稱萬(wàn)國(guó)碼;UTF-8 用1 到4 個(gè)字節(jié)編碼Unicode 字符;用在網(wǎng)頁(yè)上可以統(tǒng)一頁(yè)面顯示各種語(yǔ)言。
在UTF-8 字符集下,一個(gè)中文字符占用3 個(gè)字節(jié),一個(gè)英文字符占用1 個(gè)字節(jié)。前面提到,英文的閱讀知覺廣度為每次20 個(gè)字母左右,漢字為每次5個(gè)字左右,所以在顯示屏上對(duì)于漢字的每次注視只需15 個(gè)字節(jié)左右,英文則需要20 個(gè)字節(jié),比中文多5 個(gè)字節(jié),每次注視停留的時(shí)間也會(huì)稍長(zhǎng)。另一方面,英文文本都有詞間空格,而漢語(yǔ)和日語(yǔ)中都沒有詞間空格;一般情況下彈幕的文本長(zhǎng)度都比較短,也不需要借助標(biāo)點(diǎn)符號(hào)將其隔開。在播放同樣視頻的情況下,在相同文本長(zhǎng)度,相同閱讀者視力、智力,相同熟練度的條件下,中文的視讀效率就比英文的視讀效率高。
美國(guó)數(shù)學(xué)家、信息論的創(chuàng)始人香農(nóng)(Shannon)在1948年發(fā)表的文章 《通信的數(shù)學(xué)理論”(A Mathematical Theory of Communication)》一文中提出了“信息熵”的概念,用于度量信息的不確定程度。一個(gè)信源發(fā)送出什么符號(hào)是不確定的;在信源中,考慮的不是某一單個(gè)符號(hào)發(fā)生的不確定性,而是要考慮這個(gè)信源所有可能發(fā)生情況的平均不確定性,不確定性越大,熵也就越大,把它搞清楚所需要的信息量也就越大。在自然語(yǔ)言處理中,信息熵表示語(yǔ)言的每個(gè)字符所含平均信息量的大小,度量語(yǔ)言符號(hào)這個(gè)隨機(jī)變量的不確定性程度[5]。
公式里的pi 是指某種符號(hào)系統(tǒng)中,某個(gè)符號(hào)出現(xiàn)的頻率,熵的單位為比特(bit)。影響信息熵的因素有兩個(gè): 一個(gè)是符號(hào)的數(shù)量n,一個(gè)是符號(hào)的頻率pi。固定其中一個(gè)變量,看另一個(gè)變量對(duì)信息熵的影響,可以得出的結(jié)論為:符號(hào)越多,信息熵越大;符號(hào)的頻率分布越均勻,信息熵越大。
馮志偉[6]用逐漸擴(kuò)大漢字容量的辦法,計(jì)算出包含在一個(gè)漢字中的熵為9.65 比特,并與其他印歐語(yǔ)字符熵值進(jìn)行了統(tǒng)計(jì)對(duì)比(見表1)。
表1 各語(yǔ)言字符的熵
通過對(duì)比可以觀察到漢字的熵最大,也就是說其輸出的信息量也最多。國(guó)外對(duì)英語(yǔ)字母的熵做了許多研究,到了21 世紀(jì),Cleary[7]運(yùn)用基于PPM(Prediction by Partial Matching) 的模型處理文本得到了更精確的結(jié)果為1.46 比特/字符。關(guān)于漢字的研究,吳軍[8]等人通過大量的統(tǒng)計(jì),給出漢語(yǔ)信息熵的上界為5.17 比特/漢字;孫帆等人基于詞的語(yǔ)言模型估計(jì)方法得到漢字的熵值為5.31 比特。可以看出漢字的熵值仍然更大,在表示相同意思的情況下所需要的英文字符比漢字字符更多,播放視頻時(shí)彈幕文本快速?gòu)娘@示屏上飄過,要在不錯(cuò)過視頻內(nèi)容的情況下視讀完英文彈幕并理解其意思必定比視讀中文彈幕更加困難。
2.3.1 漢語(yǔ)意合英語(yǔ)形合
意合性是漢語(yǔ)有別于其他語(yǔ)言的一個(gè)顯著特點(diǎn),所謂的“意合”,指的是語(yǔ)言單位與語(yǔ)言單位組合時(shí)語(yǔ)義上的聯(lián)系。由于漢語(yǔ)是缺乏形態(tài)變化的語(yǔ)言,語(yǔ)言單位之間的組合注重的是語(yǔ)義之間的關(guān)系,所以相關(guān)語(yǔ)言成分之間往往包含著較復(fù)雜的語(yǔ)義關(guān)系,但在結(jié)構(gòu)關(guān)系上并沒有標(biāo)志顯示。句子或詞語(yǔ)之間沒有連接詞,句子中沒有介詞和介詞短語(yǔ),句子缺失主語(yǔ),語(yǔ)義是依靠詞語(yǔ)之間的邏輯關(guān)系來顯現(xiàn)的,凸顯出意合特征,這也符合了漢語(yǔ)的意合特征。
漢語(yǔ)的意合主要靠意義來組合,而不像英語(yǔ)那樣主要靠形合手段來組合。漢語(yǔ)句子中省略和緊縮的現(xiàn)象非常常見,省略主謂語(yǔ)、省略賓語(yǔ)、省略代詞等,句內(nèi)沒有語(yǔ)音停頓,各部分緊密結(jié)合,以邏輯表達(dá)條件、因果、轉(zhuǎn)折、讓步等語(yǔ)義關(guān)系。對(duì)讀者來說這些縮略不會(huì)影響文章理解,往往通過上下文就能揣測(cè)部分省略。但很講究形式的英語(yǔ)句子中,主謂部分是必不可少的,而且句式結(jié)構(gòu)的附屬部分和修飾部分英文比中文復(fù)雜得多;動(dòng)詞不定式、介賓短語(yǔ)、主從關(guān)系、時(shí)態(tài)等,這些都是英文里重的要部分,不能輕易省略。
我們看彈幕網(wǎng)站的彈幕不是一條一條看,而是一片一片掃讀的,提取出關(guān)鍵字詞就能直覺反映出這一片彈幕是在說什么。當(dāng)我們掃讀一片一片的英文彈幕時(shí),雖然也能提取出關(guān)鍵字,但是關(guān)鍵字關(guān)聯(lián)復(fù)雜,不能瞬間明白這一堆英文彈幕的意義到底是什么。
2.3.2 彈幕中的緊縮現(xiàn)象
在彈幕中詞匯和短語(yǔ)的省略緊縮現(xiàn)象更加頻繁,彈幕因其及時(shí)性強(qiáng)、停留時(shí)間短暫等特點(diǎn)催生了大量網(wǎng)絡(luò)縮略詞及縮略短語(yǔ)。中國(guó)目前最大的彈幕網(wǎng)站嗶哩嗶哩在2020年發(fā)布的年度最熱5 條彈幕中,除了“武漢加油”,其余4 條彈幕“有內(nèi)味了”“雙廚狂喜”“禁止套娃”和“爺青回”都有語(yǔ)言的緊縮現(xiàn)象。比如占據(jù)榜首的“爺青回”就是“爺?shù)那啻河只貋砹恕钡目s寫。隨著彈幕文化的流行,一種新的壓縮詞也大量出現(xiàn),將每個(gè)字的拼音首字母組合代表一個(gè)詞或一個(gè)短語(yǔ),如“yyds(永遠(yuǎn)的神)、nsdd(你說的對(duì))、xswl(笑死我了)、zqsg(真情實(shí)感)”等,這些縮略詞也向來是彈幕中出現(xiàn)的高頻詞匯,它們不僅能快速發(fā)送到顯示屏上,也讓觀眾能在短時(shí)間內(nèi)更快速地瀏覽大量彈幕。
其實(shí)在英語(yǔ)中也存在這樣的現(xiàn)象,為了有效溝通,西方人在聊天中也會(huì)使用縮寫、替代等形式;如“GOAT(the greatest of all time)、AFAIK(as far as Iknow)、BFF(best friends forever)”等。但中英文中這種形式類似的“緊縮”其時(shí)間成本和效率又如何呢,如“yyds(永遠(yuǎn)的神)”一詞成為共識(shí)性的縮寫是需要一段時(shí)間的,是否漢語(yǔ)中的緊縮結(jié)構(gòu)會(huì)更有利于理解,而英文縮寫需要更多壓縮和解壓的過程呢?
哈佛大學(xué)的F.Behr[9-12]等人運(yùn)用PPMD、PPMZ、BZIP2、GZIP 等算法壓縮了不同語(yǔ)言版本的圣經(jīng),對(duì)比壓縮前后文件的大小與英文文件的比例。去除文本中的冗余信息,用接近最優(yōu)編碼方式對(duì)文件進(jìn)行編碼,理想條件下若翻譯壓縮等過程沒有信息損失,壓縮后其他語(yǔ)言文件大小與英文文件大小的比率值應(yīng)該等于1。通過實(shí)驗(yàn),得到結(jié)果如表2 所示。
表2 各種語(yǔ)言版本的圣經(jīng)壓縮后比率
通過對(duì)比發(fā)現(xiàn),4 種算法下得到的中英文壓縮后比率都是最小的,雖然這個(gè)實(shí)驗(yàn)有所局限,但是也能提供一些證據(jù);在英語(yǔ)、西班牙語(yǔ)、法語(yǔ)等八大主流語(yǔ)言中,中文是壓縮效率最低的語(yǔ)言。
如今很多人喜歡看劇、看視頻不僅是為了內(nèi)容,而是喜歡參與彈幕討論,但在歐美國(guó)家彈幕卻始終流行不起來。在地理環(huán)境、歷史、民族、文化背景等因素的影響下,中西方語(yǔ)言有很多顯著的差異,不同的思維方式也體現(xiàn)在了語(yǔ)言模式中。中英文不同的句子結(jié)構(gòu)和表現(xiàn)方式也反映了相異的文化內(nèi)涵,體現(xiàn)了不同民族的價(jià)值觀念:漢民族則有著重形象、重悟性的思維模式,在語(yǔ)言上注重隱性連貫,邏輯事理,言簡(jiǎn)意賅。英語(yǔ)民族有著重理性、重分析、重形式的思維習(xí)慣,在語(yǔ)言上以形顯意,注重嚴(yán)謹(jǐn)規(guī)范,形式分析。英文文字的特征局限了其在彈幕文化中的表現(xiàn)力,也因此彈幕文化難以在歐美國(guó)家中流行起來。