唐佳梅,何子杰
(廣東外語(yǔ)外貿(mào)大學(xué) 新聞與傳播學(xué)院,廣東 廣州510006)
長(zhǎng)期以來(lái),語(yǔ)料庫(kù)方法作為語(yǔ)言學(xué)重要方法論之一,豐富了語(yǔ)言學(xué)的研究?jī)?nèi)容,為其提供了新的研究視角。世界上第一個(gè)機(jī)讀英語(yǔ)語(yǔ)料庫(kù)(布朗語(yǔ)料庫(kù),Brown Corpus)誕生于20世紀(jì)60年代初期的美國(guó)布朗大學(xué)。隨后美國(guó)和英國(guó)學(xué)者分別在70年代建立了美國(guó)英語(yǔ)書面語(yǔ)語(yǔ)料庫(kù)BROWN(Brown University Standard Corpus of Present—Day American English)和英國(guó)英語(yǔ)書面語(yǔ)語(yǔ)料庫(kù)LOB(The Lancaster-Oslo/Bergen Corpus of British English)。BROWN 和LOB語(yǔ)料庫(kù)的建立有助于將美國(guó)英語(yǔ)和英國(guó)英語(yǔ)進(jìn)行系統(tǒng)的比較研究[1]。但作為一種研究性工具,語(yǔ)料庫(kù)在新聞傳播研究領(lǐng)域出現(xiàn)的時(shí)間較晚。直到20世紀(jì)90年代,有學(xué)者在充分認(rèn)識(shí)到互聯(lián)網(wǎng)時(shí)代下的新聞?wù)Z言之后,依據(jù)語(yǔ)言學(xué)理論、統(tǒng)計(jì)學(xué)理論以及新聞學(xué)理論等對(duì)新聞?lì)愓Z(yǔ)言進(jìn)行了廣泛研究,并建立新聞?lì)愓Z(yǔ)言語(yǔ)料庫(kù)[2]。由此,語(yǔ)料庫(kù)方法在新聞傳播研究領(lǐng)域的應(yīng)用逐步開(kāi)展起來(lái)。
在中國(guó)知網(wǎng)上搜索“語(yǔ)料庫(kù)”,有6 252篇文獻(xiàn),其中大部分集中在外國(guó)語(yǔ)言文學(xué)、中國(guó)語(yǔ)言文學(xué)以及計(jì)算機(jī)軟件與計(jì)算機(jī)應(yīng)用這三個(gè)學(xué)科方面。通過(guò)關(guān)鍵詞搜索“語(yǔ)料庫(kù)”并選擇“新聞與傳媒學(xué)科”,僅得文獻(xiàn)67篇,表明語(yǔ)料庫(kù)研究方法在本學(xué)科的研究基礎(chǔ)薄弱。
喻國(guó)明和李慧娟在《大數(shù)據(jù)時(shí)代傳播研究中語(yǔ)料庫(kù)分析方法的價(jià)值》中指出:大數(shù)據(jù)思維對(duì)當(dāng)下新聞與傳播研究造成強(qiáng)烈的沖擊,傳統(tǒng)的文本分析手段拘泥于有限的文本數(shù)量和定性研究的窠臼,無(wú)法滿足大數(shù)據(jù)時(shí)代對(duì)內(nèi)容深度和廣度的挖掘需求。在這種情況下,來(lái)源于應(yīng)用語(yǔ)言學(xué)的語(yǔ)料庫(kù)研究方法對(duì)于文本數(shù)據(jù)庫(kù)的建立成為一種可能[3]。筆者在上述67篇文獻(xiàn)中,剔除4篇與語(yǔ)料庫(kù)研究相關(guān)度不高的文獻(xiàn),將剩余的63篇文獻(xiàn)通過(guò)分析歸類,得出以下幾種類型:
第一,語(yǔ)料庫(kù)在應(yīng)用傳播研究領(lǐng)域的運(yùn)用。應(yīng)用傳播包括國(guó)家形象或城市區(qū)域形象傳播、健康傳播以及公共傳播等。齊佩在研究美國(guó)媒體對(duì)中國(guó)經(jīng)濟(jì)形象的構(gòu)建時(shí),通過(guò)選取2008年 9月 18日 至2010年12月 31日期間的美國(guó)三大報(bào)紙對(duì)中國(guó)經(jīng)濟(jì)報(bào)道的文本,自建有關(guān)中國(guó)經(jīng)濟(jì)形象的專用語(yǔ)料庫(kù),從關(guān)鍵字索引、搭配和詞簇等方面入手,分析美國(guó)各大報(bào)的報(bào)道框架并進(jìn)一步研究外媒報(bào)道框架對(duì)中國(guó)經(jīng)濟(jì)形象的構(gòu)建及其影響[4]。除了通過(guò)媒介報(bào)道來(lái)呈現(xiàn)國(guó)家或區(qū)域城市形象外,趙凌則通過(guò)語(yǔ)料庫(kù)工具,挖掘個(gè)體傳播和國(guó)家形象傳播的互動(dòng)關(guān)系,另辟蹊徑研究國(guó)家形象傳播[5]。
健康傳播是近20-30年來(lái)在中國(guó)逐漸興起的一項(xiàng)有關(guān)健康的傳播學(xué)科,但運(yùn)用語(yǔ)料庫(kù)作為健康傳播研究工具的文獻(xiàn)匱乏。中國(guó)知網(wǎng)論文數(shù)據(jù)庫(kù)僅有3篇健康傳播的文獻(xiàn)與語(yǔ)料庫(kù)有關(guān)聯(lián)性,且研究對(duì)象集中在太極拳以及中醫(yī)藥兩個(gè)方面。這三篇文獻(xiàn)通過(guò)運(yùn)用語(yǔ)料庫(kù)相關(guān)功能來(lái)分析太極拳和中醫(yī)藥在國(guó)外的傳播現(xiàn)狀及特點(diǎn),進(jìn)而得出我國(guó)該如何運(yùn)用民族文化精髓來(lái)提高對(duì)外傳播能力的結(jié)論。
公共傳播的研究主要涉及民生問(wèn)題、公共基礎(chǔ)建設(shè)以及公益事業(yè)等。廖衛(wèi)民在“浙江省民生新聞傳播與社會(huì)幸福感評(píng)估”這一課題研究中就引入語(yǔ)料庫(kù)研究方法,從新視角(即媒體對(duì)民生新聞的報(bào)道反映人民的幸福指數(shù))切入分析[6]。該研究以《杭州日?qǐng)?bào)》民生新聞報(bào)道作為語(yǔ)料庫(kù)來(lái)源,利用頻率詞分析媒介報(bào)道文本的呈現(xiàn)與人民幸福感的關(guān)系,指出民生新聞的不足與缺陷。谷羽在其博士論文《微博客平臺(tái)的企業(yè)公益?zhèn)鞑ァ分刑岬剑哼\(yùn)用語(yǔ)料庫(kù)分析軟件的統(tǒng)計(jì)功能對(duì)具體詞語(yǔ)的使用頻率,詞語(yǔ)搭配結(jié)構(gòu)等語(yǔ)言學(xué)特征進(jìn)行統(tǒng)計(jì),以此為基礎(chǔ)運(yùn)用詮釋型內(nèi)容分析法,通過(guò)精讀、理解并解釋文本內(nèi)容,從整體和更高層次上把握文本內(nèi)容的復(fù)雜背景和思想結(jié)構(gòu)[7]。由此可見(jiàn),在新聞傳播學(xué)領(lǐng)域,語(yǔ)料庫(kù)作為一種具有定性研究方法特點(diǎn)的工具,其重要性越來(lái)越顯著。
第二,語(yǔ)料庫(kù)在新聞理論和實(shí)踐研究領(lǐng)域的應(yīng)用。新聞理論與新聞實(shí)踐隨著社會(huì)發(fā)展而不斷發(fā)展,但研究方法卻沒(méi)有取得突破性的創(chuàng)新。同質(zhì)化、低水平的研究泛濫,嚴(yán)重阻礙新聞與傳播學(xué)科的發(fā)展,而語(yǔ)料庫(kù)作為應(yīng)用語(yǔ)言學(xué)的研究工具,與新聞學(xué)研究中的內(nèi)容分析法有異曲同工之處。
值得一提的是,在基于語(yǔ)料庫(kù)對(duì)新聞理論和實(shí)踐研究的文獻(xiàn)中,多數(shù)研究者以外國(guó)語(yǔ)言學(xué)相關(guān)背景為主,運(yùn)用語(yǔ)料庫(kù)方法對(duì)外媒報(bào)道中國(guó)的文本進(jìn)行研究,進(jìn)而得出相關(guān)結(jié)論。當(dāng)然,也有少數(shù)新聞傳播領(lǐng)域里的學(xué)者在研究新聞實(shí)務(wù)的過(guò)程中引入語(yǔ)料庫(kù)研究方法,如喻國(guó)明運(yùn)用語(yǔ)料庫(kù)主題詞檢索的分析方法,預(yù)測(cè)互聯(lián)網(wǎng)時(shí)代數(shù)字報(bào)紙的發(fā)展前景及人民對(duì)其發(fā)展的信心度[8]。體育新聞寫作研究中也逐漸呈現(xiàn)引入語(yǔ)料庫(kù)這一研究工具的趨勢(shì)。鄭麗杰在分析網(wǎng)絡(luò)體育新聞標(biāo)題時(shí)指出:基于語(yǔ)料庫(kù)的體育新聞標(biāo)題研究能夠運(yùn)用計(jì)算機(jī)技術(shù)對(duì)大量文本進(jìn)行定量統(tǒng)計(jì)和定性描述,讓語(yǔ)言分析朝著更加縱深的方向發(fā)展[1]。該研究通過(guò)統(tǒng)計(jì)標(biāo)題中出現(xiàn)的主題詞頻率以及主題詞的搭配方式等,全面系統(tǒng)地剖析標(biāo)題的感情色彩以及標(biāo)題結(jié)構(gòu),為網(wǎng)絡(luò)標(biāo)題寫作研究提供理論層面的支撐。
第三,基于語(yǔ)料庫(kù)的輿論輿情研究?;ヂ?lián)網(wǎng)的廣泛使用促使輿情的不斷變化,大數(shù)據(jù)時(shí)代對(duì)輿情的研究不斷增長(zhǎng),語(yǔ)料庫(kù)方法作為一種能夠大規(guī)模運(yùn)作、分析以及統(tǒng)計(jì)文本詞條的研究方法,無(wú)疑與輿情研究有著天然的契合點(diǎn)。喻國(guó)明就語(yǔ)料庫(kù)對(duì)輿論研究的作用指出:通過(guò)語(yǔ)料庫(kù)研究方法可以檢測(cè)輿情的動(dòng)態(tài)情況以及輿論熱詞的分析處理,通過(guò)建立相關(guān)的數(shù)據(jù)庫(kù)可以更好發(fā)現(xiàn)和建立輿論應(yīng)對(duì)模型,以預(yù)防和應(yīng)對(duì)輿論的發(fā)生。在一項(xiàng)對(duì)2011-2013年全國(guó)兩會(huì)輿情中心詞和關(guān)聯(lián)詞的分析中,他將語(yǔ)料庫(kù)和大數(shù)據(jù)選擇的研究方法相結(jié)合,將輿論熱詞切分成兩個(gè)維度進(jìn)行探索,為輿情研究提供了一種新思路[3]。
20世紀(jì)90年代,國(guó)外學(xué)者開(kāi)始運(yùn)用語(yǔ)料庫(kù)對(duì)新聞實(shí)踐展開(kāi)研究,其中路透社語(yǔ)料庫(kù)(Reuters Corpus)(第1版)在2000年已開(kāi)發(fā)完成,收錄了路透社從1996年8月20日至1997年8月19日發(fā)布的新聞?wù)Z篇樣本 806 791篇,詞匯量達(dá)2億次[2],為英國(guó)通訊社語(yǔ)言的研究提供了重要的參考作用。此外,國(guó)外對(duì)語(yǔ)料庫(kù)的使用不局限于根據(jù)不同研究目的建立不同語(yǔ)料庫(kù),而且對(duì)語(yǔ)料庫(kù)的實(shí)踐運(yùn)用,在方法論要求上具有不同特點(diǎn)。
第一,基于語(yǔ)料庫(kù)的研究對(duì)象廣泛。其一,在新聞報(bào)道文本的研究上,學(xué)者根據(jù)不同的研究目的而使用語(yǔ)料庫(kù)方法從不同方面對(duì)文本進(jìn)行解構(gòu),最終發(fā)現(xiàn)某種共性,進(jìn)而得出相應(yīng)的結(jié)論。這類研究以英國(guó)曼徹斯特大學(xué)學(xué)者Kyung Hye Kim關(guān)于美國(guó)媒體對(duì)韓國(guó)的報(bào)道研究為代表,通過(guò)研究新聞文本的詞頻、詞語(yǔ)感情色彩以及報(bào)道框架來(lái)分析媒體報(bào)道的相關(guān)特點(diǎn)[9]。這類研究以應(yīng)用型研究為主,通過(guò)探索研究對(duì)象在媒體上的呈現(xiàn)來(lái)評(píng)價(jià)其實(shí)際作用、傳播策略或傳播效果等。其二,對(duì)政府或企業(yè)的報(bào)告文本進(jìn)行研究。社會(huì)的激烈競(jìng)爭(zhēng)使得人們?cè)絹?lái)越重視發(fā)展戰(zhàn)略的研究,語(yǔ)料庫(kù)作為一種文本分析工具也被大量引入到相關(guān)公文和報(bào)告的研究中。加拿大學(xué)者Francis Cornut等人就政府公共部門在發(fā)展戰(zhàn)略上的相關(guān)公文進(jìn)行了一系列研究,運(yùn)用語(yǔ)料庫(kù)分析方法對(duì)相關(guān)文本的類型、戰(zhàn)略關(guān)鍵詞的頻率以及戰(zhàn)略目標(biāo)的特點(diǎn)來(lái)進(jìn)行分析并評(píng)估預(yù)期的效果[10]。也有學(xué)者運(yùn)用語(yǔ)料庫(kù)研究方法通過(guò)企業(yè)發(fā)展報(bào)告來(lái)研究其商業(yè)傳播價(jià)值,如學(xué)者Brian A和Rutherford關(guān)于企業(yè)年度報(bào)告的體裁分析,等等。不管是政府或者是企業(yè),對(duì)這些文本的研究目的大多數(shù)在于完善傳播戰(zhàn)略,更好地促進(jìn)發(fā)展并進(jìn)行前景預(yù)測(cè)。其三,運(yùn)用語(yǔ)料庫(kù)方法分析特定語(yǔ)境下短信息以及書面話語(yǔ)的作用及特點(diǎn)。1999年至2017年的國(guó)外文獻(xiàn)中,關(guān)于語(yǔ)料庫(kù)在新聞傳播領(lǐng)域的研究對(duì)象呈現(xiàn)從文本—語(yǔ)段—詞條的趨勢(shì),研究發(fā)展趨勢(shì)不局限于書面文本,維系人們?nèi)粘I畹目谡Z(yǔ)以及短信息逐漸進(jìn)入學(xué)者的視野當(dāng)中。學(xué)者Brian P.Jenssen等在網(wǎng)絡(luò)時(shí)代對(duì)青少年影響的一項(xiàng)研究中,采用SNS網(wǎng)頁(yè)留言板的記錄作為語(yǔ)料基礎(chǔ)。SNS網(wǎng)站是一個(gè)以青少年為目標(biāo)受眾的網(wǎng)絡(luò)社區(qū),青少年可在該社區(qū)上分享信息以及互動(dòng)對(duì)話。研究者通過(guò)收集346名參與者瀏覽網(wǎng)站并互動(dòng)所產(chǎn)生的147 432個(gè)單詞作為文本語(yǔ)料庫(kù),以詞頻和關(guān)鍵詞關(guān)聯(lián)的方法來(lái)研究該網(wǎng)絡(luò)社區(qū)對(duì)青少年的影響[11]。
綜合國(guó)外對(duì)語(yǔ)料庫(kù)的使用情況來(lái)看,研究對(duì)象從以往的長(zhǎng)篇文本逐漸發(fā)展到對(duì)某個(gè)核心詞的分析,研究不斷深入。在研究成果方面,國(guó)外的語(yǔ)料庫(kù)一般偏向應(yīng)用研究,通過(guò)對(duì)某一對(duì)象存在的問(wèn)題進(jìn)行分析,發(fā)現(xiàn)問(wèn)題的本質(zhì)并提出建議或者預(yù)測(cè)發(fā)展前景。
第二,將語(yǔ)料庫(kù)方法和批評(píng)性話語(yǔ)分析理論相結(jié)合。批評(píng)性話語(yǔ)分析通過(guò)分析言語(yǔ)特征及其生成的文化背景來(lái)挖掘出隱含于語(yǔ)言中的意識(shí)形態(tài),進(jìn)而揭示語(yǔ)言、權(quán)力以及意識(shí)形態(tài)之間的復(fù)雜關(guān)系。換而言之,批評(píng)性話語(yǔ)的基礎(chǔ)是文本,對(duì)文本的篩選、統(tǒng)計(jì)、解析和驗(yàn)證是批評(píng)性話語(yǔ)分析法的第一步。語(yǔ)料庫(kù)方法與批評(píng)性話語(yǔ)分析相結(jié)合的運(yùn)用使研究得出的數(shù)據(jù)和結(jié)論更為客觀、權(quán)威更具有深度。除了與批評(píng)性話語(yǔ)分析理論相結(jié)合外,國(guó)外的研究也開(kāi)始嘗試將語(yǔ)料庫(kù)研究方法與其他分析理論結(jié)合起來(lái),如馬丁的“評(píng)價(jià)理論”等。
從語(yǔ)料庫(kù)方法在國(guó)內(nèi)外新聞傳播領(lǐng)域內(nèi)的應(yīng)用來(lái)看,作為語(yǔ)言學(xué)的一種重要研究工具,語(yǔ)料庫(kù)已逐漸進(jìn)入新聞傳播的研究視野,拓寬了該領(lǐng)域的研究范圍創(chuàng)新了研究方法,但在使用語(yǔ)料庫(kù)作為研究方法和研究工具上仍存在一些局限。
一是國(guó)內(nèi)相關(guān)研究主要把語(yǔ)料庫(kù)作為大數(shù)據(jù)時(shí)代下一個(gè)大規(guī)模的文本分析工具,作為一個(gè)抓取關(guān)鍵詞以及頻率詞的統(tǒng)計(jì)工具,卻在詞匯詞性、短語(yǔ)結(jié)構(gòu)、詞語(yǔ)背后的感情色彩、詞語(yǔ)的隱喻等方面涉及較少。國(guó)內(nèi)新聞傳播學(xué)領(lǐng)域里仍有為使用語(yǔ)料庫(kù)研究而研究的現(xiàn)象,未能把語(yǔ)料庫(kù)研究方法與本學(xué)科的方法與理論相契合,因此,今后亟需深挖語(yǔ)料庫(kù)功能,對(duì)其應(yīng)用方法方式進(jìn)行突破創(chuàng)新。
二是有關(guān)新聞傳播領(lǐng)域大規(guī)模、權(quán)威型語(yǔ)料庫(kù)需要不斷構(gòu)建。我國(guó)第一個(gè)大型的基于新聞的現(xiàn)代漢語(yǔ)標(biāo)注語(yǔ)料庫(kù)是由北京大學(xué)計(jì)算語(yǔ)言學(xué)研究所和日本富士通公司合作完成的《人民日?qǐng)?bào)》標(biāo)注語(yǔ)料庫(kù)[2]。相比國(guó)外的語(yǔ)料庫(kù)建設(shè),我國(guó)在新聞傳播學(xué)領(lǐng)域創(chuàng)建語(yǔ)料庫(kù)的時(shí)間較晚,選擇樣本的歷時(shí)較短。當(dāng)前運(yùn)用語(yǔ)料庫(kù)分析方法的前提是自行建立研究對(duì)象相關(guān)的語(yǔ)料庫(kù),缺乏可以參照和對(duì)比的同類型權(quán)威語(yǔ)料庫(kù),分析結(jié)果也局限于研究者自身抽樣的范圍,缺乏一個(gè)更系統(tǒng)規(guī)范的檢驗(yàn)標(biāo)準(zhǔn)。此外,在相關(guān)抽樣過(guò)程中的主觀性也是影響最終分析結(jié)果的一個(gè)重要因素,如何為自建語(yǔ)料庫(kù)抽樣提供更加客觀完善的標(biāo)準(zhǔn)?值得我們繼續(xù)思考。
三是在新聞傳播學(xué)領(lǐng)域內(nèi),語(yǔ)料庫(kù)的語(yǔ)料基礎(chǔ)比語(yǔ)言學(xué)領(lǐng)域更薄弱。對(duì)新聞傳播研究自建相關(guān)的語(yǔ)料庫(kù),一般是選取一家或者幾家報(bào)紙的報(bào)道文本來(lái)作為樣本容量,雖然符合語(yǔ)料庫(kù)研究樣本數(shù)量的規(guī)定,但是由于新聞報(bào)道的偏向性。因此,報(bào)紙的立場(chǎng)或研究者自身的經(jīng)驗(yàn)等因素也會(huì)影響文本詞匯的使用,而且抽取的樣本歷時(shí)性局限也難以系統(tǒng)而全面地分析文本,得出的結(jié)果只能是某個(gè)階段的發(fā)現(xiàn),難以形成一個(gè)完整的研究體系。
本文對(duì)語(yǔ)料庫(kù)方法在國(guó)內(nèi)外新聞傳播研究領(lǐng)域中的應(yīng)用進(jìn)行了初步探索。通過(guò)對(duì)國(guó)內(nèi)和國(guó)外的相關(guān)應(yīng)用情況進(jìn)行分析和歸納總結(jié),發(fā)現(xiàn)語(yǔ)料庫(kù)作為研究工具在國(guó)內(nèi)國(guó)外新聞傳播領(lǐng)域的應(yīng)用中存在差異。大數(shù)據(jù)時(shí)代下,傳統(tǒng)定性定量研究方法已難以滿足新聞傳播學(xué)發(fā)展的需求,語(yǔ)料庫(kù)方法的應(yīng)用為該領(lǐng)域提供了一種全新的跨學(xué)科研究方法及路徑。國(guó)內(nèi)外的相關(guān)研究顯示語(yǔ)料庫(kù)方法在新聞傳播領(lǐng)域里未能充分發(fā)揮其應(yīng)有的作用,研究程度還不夠深入。進(jìn)一步探索語(yǔ)料庫(kù)的相關(guān)功能,構(gòu)建更多的新聞傳播類語(yǔ)料庫(kù),拓寬其在新聞傳播研究領(lǐng)域內(nèi)的應(yīng)用范圍,結(jié)合語(yǔ)言學(xué)的視野進(jìn)行跨學(xué)科的研究,將是今后研究中亟待解決的問(wèn)題。
[1]鄭麗杰.基于語(yǔ)料庫(kù)的網(wǎng)絡(luò)體育新聞標(biāo)題研究[D].北京:北京體育大學(xué),2009.
[2]黃艷軍.基于語(yǔ)料庫(kù)的國(guó)內(nèi)外主要新聞?wù)Z料庫(kù)綜述[J].讀與寫,2011(5):89-90.
[3]喻國(guó)明,李慧娟.大數(shù)據(jù)時(shí)代傳播研究中語(yǔ)料庫(kù)分析方法的價(jià)值[J].傳媒,2014(2):64-65.
[4]齊佩.從關(guān)系過(guò)程看美國(guó)大報(bào)中的中國(guó)經(jīng)濟(jì)形象[D].石家莊:河北師范大學(xué),2011.
[5]趙凌.個(gè)體傳播與國(guó)家形象傳播互動(dòng)路徑探究——以姚明個(gè)體傳播為個(gè)案[J].當(dāng)代傳播.2012(6):49-52.
[6]廖衛(wèi)民.民生新聞傳播與社會(huì)幸福感評(píng)估——基于浙江省媒體語(yǔ)料庫(kù)的實(shí)證分析[J].當(dāng)代傳播,2012(3):21-25.
[7]谷羽.微博客平臺(tái)的企業(yè)公益?zhèn)鞑ィ跠].武漢:華中科技大學(xué),2013.
[8]喻國(guó)明,李慧娟.從“付費(fèi)門”到“付費(fèi)墻 2.0”:數(shù)字報(bào)紙盈利模式的景氣度研究[J].當(dāng)代傳播,2014(4):21-22.
[9]Kyung H K.Examining US news media discourses about North Korea:A corpus-based critical discourse analysis [J].Discourse&Society,2014(2):221-223.
[10]Francis C,Hélène G,Ann L.The strategic plan as a genre[J].Discourse&Communication,2012(1):21-24.
[11]Yoshiko O.A case study of US deaf teens’ text messaging:Their innovations and adoption of textisms[J].New Media&Society,2013(8):1224-1240.