徐 翔
·文學(xué)與文化研究·
國(guó)際社交媒體傳播的中國(guó)文化及其類(lèi)型特征
——基于網(wǎng)絡(luò)文本挖掘的實(shí)證研究
徐 翔
(同濟(jì)大學(xué)藝術(shù)與傳媒學(xué)院,上海201804)
全球社交媒體的強(qiáng)勢(shì)崛起,給國(guó)際文化傳播和中國(guó)文化“走出去”提供了新的空間和契機(jī),也帶來(lái)了新的轉(zhuǎn)變與挑戰(zhàn)。使用爬蟲(chóng)軟件以及ROST、VBA等輔助軟件和研究手段,對(duì)國(guó)際性的社交媒體進(jìn)行數(shù)萬(wàn)條、5000余萬(wàn)字符的網(wǎng)絡(luò)文本抽樣和數(shù)據(jù)抓取、清洗、分析,從共詞和聚類(lèi)分析等定量挖掘的角度,分析當(dāng)前中國(guó)文化在國(guó)際社交媒體傳播中的內(nèi)容構(gòu)成,以及不同類(lèi)型內(nèi)容在呈現(xiàn)規(guī)模、呈現(xiàn)強(qiáng)度和關(guān)聯(lián)強(qiáng)度方面的水平和特征。在此基礎(chǔ)上,為加強(qiáng)新語(yǔ)境下的中國(guó)文化國(guó)際社交媒體傳播提供實(shí)證基礎(chǔ)和對(duì)策參考。
社交媒體;中國(guó)文化;國(guó)際傳播;共詞聚類(lèi)
社交媒體在全球強(qiáng)勢(shì)崛起和不斷發(fā)展,給國(guó)際傳播的格局和特征帶來(lái)深刻沖擊和挑戰(zhàn)。也給當(dāng)前新語(yǔ)境下的國(guó)家對(duì)外傳播和文化“走出去”提供了一個(gè)新的契機(jī)。在廣泛的受眾參與下,國(guó)際社交媒體成為中國(guó)文化擴(kuò)散和傳播的又一重要平臺(tái)。本文針對(duì)的核心問(wèn)題是:(1)當(dāng)前中國(guó)文化在國(guó)際社交媒體中的傳播具有怎樣的內(nèi)容構(gòu)成;(2)不同類(lèi)型的中國(guó)文化內(nèi)容在國(guó)際社交媒體中具有怎樣的呈現(xiàn)程度及特征。
關(guān)于文化的分類(lèi),學(xué)者們從理論角度進(jìn)行了多維探討。例如,從二分法分為物質(zhì)文化(有形文化)與精神文化(無(wú)形文化);從三分法則加上行為文化;從四分法則再加上制度文化[1]。著名文化研究學(xué)者鐘敬文在物質(zhì)文化、精神文化等分類(lèi)方式的基礎(chǔ)上認(rèn)為,“凡人類(lèi)(具體點(diǎn)說(shuō),是各民族、各部落乃至于各氏族)在經(jīng)營(yíng)社會(huì)生活過(guò)程中,為了生存或發(fā)展的需要,人為地創(chuàng)造、傳承和享用的東西,大都屬于文化范圍。它既有物質(zhì)的東西(如衣、食、住、工具及一切器物),也有精神的東西(如語(yǔ)言、文學(xué)、藝術(shù)、道德、哲學(xué)、宗教、風(fēng)俗等),當(dāng)然還有那些為取得生活物質(zhì)的活動(dòng)(如打獵、農(nóng)耕、匠作等)和為延續(xù)人種而存在的家庭結(jié)構(gòu)以及其他各種社會(huì)組織?!保?]傳播學(xué)者吳瑛在國(guó)際文化傳播的研究中認(rèn)為,“將‘文化’分為物質(zhì)文化、行為文化、精神文化則是比較清晰可操作的角度,也是跨文化傳播學(xué)者傾向使用的分層方式?!保?]關(guān)于這種三分法的具體內(nèi)涵,吳瑛指出,“物質(zhì)文化包括中國(guó)概況、物質(zhì)遺產(chǎn)、物質(zhì)非遺產(chǎn);行為文化包括日常行為習(xí)慣、傳統(tǒng)民俗;精神文化……既包括文學(xué)藝術(shù),也包括孝、儉、禮、勤、恭、慎、謙等價(jià)值觀?!保?]
有的學(xué)者從文化反映的事物的性質(zhì)出發(fā),將人類(lèi)所創(chuàng)造的文化分為以下六類(lèi):倫理道德文化,科學(xué)技術(shù)文化,管理文化,思想哲學(xué)文化,歷史文化和藝術(shù)文化及體育文化。芬妮氏在《教育的社會(huì)哲學(xué)》一書(shū)里,分文化為兩大類(lèi):一為社會(huì)生活的知識(shí)的淵源,一為社會(huì)的制度。從這兩大類(lèi)里,又可分為下列各項(xiàng):(一)社會(huì)生活的知識(shí)的淵源:(1)交通方法;(2)工業(yè)技術(shù);(3)游戲技術(shù);(4)科學(xué);(5)美術(shù);(6)公共信仰;(7)流行觀念;(8)民俗;(9)民型。(二)社會(huì)的制度:(1)家庭;(2)地方團(tuán)體;(3)國(guó)家;(4)工業(yè);(5)教會(huì);(6)學(xué)校;(7)報(bào)紙;(8)生活程度;(9)常規(guī)的娛樂(lè);(10)康樂(lè)保存的活動(dòng);(11)雜項(xiàng)[5]。
劉雪對(duì)公開(kāi)文化和隱藏文化進(jìn)行了細(xì)分。公開(kāi)的文化,即肉眼可見(jiàn)的表象化的文化形式,它包括物質(zhì)文化、事實(shí)文化、風(fēng)俗文化和制度文化。其中物質(zhì)文化是指滿足人類(lèi)基本物質(zhì)生活的吃、穿、住、用、行五方面;具體說(shuō)來(lái),飲食、服飾、建筑和交通都屬于物質(zhì)文化。事實(shí)文化的范疇較廣泛,它包括文化存在和發(fā)展所依托的客觀自然環(huán)境和歷史背景以及由人類(lèi)智慧創(chuàng)造的一切可見(jiàn)的文化形式,因此,可以把地理、歷史、名勝古跡、語(yǔ)言文字、科技成就和各類(lèi)藝術(shù)形式都?xì)w為事實(shí)文化的范疇。而風(fēng)俗文化,是流行于民間的,沒(méi)有強(qiáng)制規(guī)定的,由習(xí)慣養(yǎng)成并被一代一代傳承下來(lái)的文化形式。如節(jié)日、風(fēng)俗習(xí)慣、民間文化,等等。與風(fēng)俗文化相反,制度文化是由國(guó)家或統(tǒng)治者為維護(hù)其階級(jí)統(tǒng)治及社會(huì)制度而規(guī)定或制定的國(guó)家機(jī)構(gòu)、社會(huì)體制和典章制度等。此外,屬于精神文化范疇的價(jià)值系統(tǒng),包括哲學(xué)思想、宗教信仰、人權(quán)觀、道德觀、婚姻觀等價(jià)值觀念都應(yīng)歸入隱藏文化之列[6]。
側(cè)重于文化傳播和狹義文化的要素,學(xué)者們也對(duì)其進(jìn)行了各種劃分。李樹(shù)榕認(rèn)為,文化資源大致可分為三個(gè)基本類(lèi)別:一是物質(zhì)實(shí)證性文化資源;二是文字與影像記載性文化資源;三是行為傳承性文化資源[7]。王文杰“從文化本身的屬性出發(fā)將文化從三個(gè)層面進(jìn)行概括,即意識(shí)形態(tài)層面的文化、歷史遺產(chǎn)層面的文化和生活方式層面的文化。”[8]2王文杰結(jié)合文化的不同層面探討了中國(guó)文化走出去的主要形式,例如飲食文化、服飾文化、中醫(yī)藥文化、茶文化、武術(shù)文化、書(shū)畫(huà)文化、器樂(lè)文化、傳統(tǒng)節(jié)日、特殊的中國(guó)文化符號(hào)(熊貓)[8]11-32。烏丙安等人則側(cè)重于中國(guó)民間文化的分類(lèi),指出其包含的如下類(lèi)型:一、生產(chǎn)貿(mào)易民俗,二、衣食住行民俗,三、社會(huì)家庭民俗,四、人生儀禮民俗,五、生態(tài)、科技民俗,六、信仰民俗,七、歲時(shí)節(jié)令民俗,八、語(yǔ)言文學(xué)民俗,九、民間游樂(lè)民俗,十、民間藝術(shù)[9]。
依據(jù)不同的標(biāo)準(zhǔn),文化及其所傳播的內(nèi)容可以劃分為諸多不同的類(lèi)型。例如“依據(jù)所處理的關(guān)系的不同,可劃分為科學(xué)與人文;根據(jù)與行為的關(guān)系不同,可分為知識(shí)、觀念和技術(shù);依據(jù)產(chǎn)生和流行的人群差別,可分為精英文化和大眾文化;依據(jù)政治地位的不同,可分為官方文化和民間文化;依據(jù)產(chǎn)生和流行的地域不同,可分為本地文化、外地文化和外來(lái)文化;依據(jù)與現(xiàn)時(shí)代關(guān)系的不同可分為古代文化、近代文化、現(xiàn)代文化和未來(lái)文化?!保?0]總體上看,這些分類(lèi)多是理論性、帶有“先驗(yàn)”性的研究。本文從定量研究的角度,結(jié)合文本挖掘手段和聚類(lèi)等數(shù)據(jù)分析方法,對(duì)國(guó)際社交媒體中的中國(guó)文化內(nèi)容的類(lèi)型進(jìn)行實(shí)踐考察。
本文選取具有重要性和典型性的若干國(guó)際社交媒體,對(duì)其中與中國(guó)文化有關(guān)的帖子進(jìn)行自動(dòng)抓取,在此基礎(chǔ)上進(jìn)行基于定量手段的類(lèi)型分析。
(一)媒體來(lái)源確定
本文選取七種重要而特點(diǎn)不同的社交媒體,分別是twitter、youtube、facebook、google+、tumblr、flickr、reddit。其中,twitter是微博類(lèi)型,youtube是視頻媒體,flickr是圖片媒體,google+是綜合性的社交網(wǎng)絡(luò)平臺(tái),facebook是最大規(guī)模的社交網(wǎng)站,tumblr是“輕博客”,flickr是圖片型的社交媒體,reddit則是新聞?lì)惖纳鐣?huì)媒體。它們都具有很大的規(guī)模與流量,在其專(zhuān)門(mén)的細(xì)分領(lǐng)域內(nèi)也有重大的影響力和競(jìng)爭(zhēng)力。在2015年2月21日的Al?exa全球網(wǎng)站排名數(shù)據(jù)中,F(xiàn)acebook、YouTube、Twitter三大社交媒體巨頭分別居于全球網(wǎng)站的第2、3、8位,其他媒體也都具有全球數(shù)十位或一百多位的排名。
(二)樣本采集與匯總
對(duì)這其中媒體中的內(nèi)容,都以“china”和“cul?ture”為復(fù)合關(guān)鍵詞進(jìn)行帖子的檢索,通過(guò)“八爪魚(yú)”爬取軟件自動(dòng)抓取、存檔內(nèi)容。Google+采集的帖子,發(fā)布時(shí)間為2014年10月21日至2015年10月20日,得到4947條,刪除內(nèi)容完全重復(fù)的帖子后,剩余2673條。Twitter采集的內(nèi)容,其發(fā)布時(shí)間為2014年10月11日到2015年10月10日,抽樣采集得到13471條,刪除重復(fù)內(nèi)容后剩下11141條。Youtube的帖子,其發(fā)布時(shí)間為2014年11月16日到2015年11月15日的帖子,抽樣得到2486條,刪除標(biāo)題及正文都重復(fù)的帖子后剩下2329條。Tumblr的帖子每晚23點(diǎn)自動(dòng)采集20條,采集的帖子發(fā)布的時(shí)間段為2014年11月1日至2015年10月31日,抽樣采集得到3103條,去除標(biāo)題和正文都重復(fù)的帖子后剩2796條。Flikcr采集的是2014年11月4日到2015年11月3日按時(shí)間更新排序的照片,共得16692條,刪除標(biāo)題和正文都重復(fù)的內(nèi)容及空白內(nèi)容后剩余10490條。Reddit采集的是發(fā)布于2014年11月1日至2015年10月31日的所有帖子,刪除標(biāo)題與正文都重復(fù)的內(nèi)容后得到2442條。Facebook采集的是2015年6月14到2015年11月15子間,名為“china culture”或“chinese culture”的三個(gè)大規(guī)模群組的所有帖子,①這三個(gè)群組分別名為“China culture”(https://www.facebook.com/groups/impressionchina/?ref=br_rs)、“chinese culture”(https://www.facebook.com/groups/AllChineseCulture/?ref=br_rs)、“chinese culture”(https://www.facebook.com/groups/AllChineseCulture/?ref=br_rs)。截至2015年8月5日,這三個(gè)群組擁有的成員數(shù)依次為18380、6116、3452。得到5248條,經(jīng)刪除重復(fù)及空白的內(nèi)容后剩3059條。
分析的內(nèi)容是這些帖子的標(biāo)題、正文、標(biāo)簽的文字部分。若無(wú)標(biāo)題或標(biāo)簽,則不予分析。其中,Youtube分析的內(nèi)容包括標(biāo)題和正文;Tumblr分析的為標(biāo)題和正文、標(biāo)簽詞;Flikcr分析的是照片的標(biāo)題及其說(shuō)明的正文;Reddit分析的是標(biāo)題和內(nèi)容正文;Facebook分析的是帖子正文的內(nèi)容,如是轉(zhuǎn)貼則還包括被轉(zhuǎn)內(nèi)容顯示的正文。上述所有內(nèi)容匯總到一個(gè)txt文件中進(jìn)行處理。該txt文件的每一行為一條帖子的內(nèi)容。匯總后的txt文件大小為49.3MB,總字符數(shù)為5117.88萬(wàn)。
(三)文本處理
對(duì)于采集所得的文本集進(jìn)行清洗。去除#號(hào)、@號(hào)、以http開(kāi)頭的網(wǎng)址字符串等無(wú)實(shí)際語(yǔ)義的字詞;去除無(wú)意義的字符串,例如cts等;去除帖子在網(wǎng)頁(yè)的顯示中本身所含的格式詞,例如“轉(zhuǎn)推了”、“查看翻譯”等詞;去除一些在語(yǔ)義分析過(guò)程中無(wú)明顯語(yǔ)義的虛詞、助詞、連詞等。對(duì)于最終的文本,通過(guò)ROST CM軟件進(jìn)行中英文的分詞、詞頻統(tǒng)計(jì)以及共詞分析、語(yǔ)義網(wǎng)絡(luò)的分析呈現(xiàn),并結(jié)合SPSS軟件和VBA編程進(jìn)行定量處理。通過(guò)VBA對(duì)統(tǒng)計(jì)所得的高頻詞及其共詞網(wǎng)絡(luò)、共現(xiàn)詞頻進(jìn)行整理和轉(zhuǎn)換,通過(guò)SPSS對(duì)所采選的關(guān)鍵詞進(jìn)行聚類(lèi)分析。最終,通過(guò)將文本集中高頻出現(xiàn)和具有區(qū)分度的450個(gè)關(guān)鍵詞,通過(guò)其相互間的共現(xiàn)程度得到聚類(lèi)結(jié)果,從而將中國(guó)文化內(nèi)容進(jìn)行類(lèi)型的劃分。在此基礎(chǔ)上,進(jìn)一步結(jié)合不同的類(lèi)所含關(guān)鍵詞與其他類(lèi)的關(guān)聯(lián)強(qiáng)度,考察各個(gè)類(lèi)在中國(guó)文化的國(guó)際社交媒體呈現(xiàn)中所具有的地位和作用差異。
(一)高頻詞的篩選
對(duì)采集和匯總所得的文本進(jìn)行分詞和詞頻統(tǒng)計(jì),得到不同的詞202634個(gè)。其中詞頻最高者為44918次,詞頻大于或等于80次的詞共7964個(gè),詞頻為1詞的共有104632個(gè)。根據(jù)Donohue于1973年提出的高頻詞和低頻詞的界分公式:T=,計(jì)算要選取的高頻詞的臨界值[11]。其中,I1是詞頻為1的詞的個(gè)數(shù),T為高頻詞中的最低詞頻數(shù),也即區(qū)分選取高頻詞的臨界值。本研究中,I1=104623,計(jì)算得出T≈456.9。將詞頻大于或等于457的高頻詞提取出來(lái),得到高頻詞共1771個(gè)。
從所得的高頻詞中,由于檢索詞的關(guān)系,在檢索結(jié)果中,刪掉China、culture以及chinese、cultur?al、中國(guó)、文化這幾個(gè)直接相關(guān)的詞。事實(shí)上,本研究中,China出現(xiàn)的頻次是最高的,達(dá)44918次;但有24362條帖子的特征詞中都包含它,其出現(xiàn)的分布廣度也是最多的。特征詞含Culture的帖子數(shù)量居第二,達(dá)19805條,而其詞頻也很高,達(dá)29357詞。Chinese的詞頻及特征詞帖子數(shù)分別為26238和9654。從這些也能看出,與檢索詞直接相關(guān)的這幾個(gè)關(guān)鍵詞,盡管出現(xiàn)頻次很高,但區(qū)分度不大,因此可不采選至分析范圍中。氣候,從所得的高頻詞中,進(jìn)一步清理掉一些意義不大的詞,包括一部分副詞、狀語(yǔ)以及特點(diǎn)不明顯的動(dòng)詞、形容詞等,例如October、week、ago、past等。
(二)對(duì)作為分析對(duì)象的450個(gè)高頻詞的選取
另外,為了提高所選詞的區(qū)分度,本研究以出現(xiàn)詞頻達(dá)到457次及以上的1771個(gè)高頻詞,通過(guò)ROST CM軟件對(duì)匯總后的文本進(jìn)行特證詞的提取與統(tǒng)計(jì)。每一行文本(對(duì)應(yīng)于每一條帖子)所提取的特征詞,都在這1771個(gè)高頻詞的范圍之內(nèi)。由于一條帖子中的特征詞不重復(fù)出現(xiàn),因此詞語(yǔ)在特征詞表中的出現(xiàn)詞頻代表著它在所有帖子中分布的廣泛度。若某詞出現(xiàn)頻次很高,但是其特征詞的廣布廣度也很高,那并不一定代表它具有很好的語(yǔ)義區(qū)分度;在出現(xiàn)頻次一定的情況下,若特征詞的分布廣度越低,也即在越少的帖子中出現(xiàn),那么它就越具有高區(qū)分度。設(shè)某詞在所有帖子匯總后的文本集中的出現(xiàn)頻次為X,作為特征詞出現(xiàn)的頻次為Y,那么X/Y的值越大,這個(gè)詞的區(qū)分意義就越高。
綜合考慮詞頻以及詞的區(qū)分度,為了選取既有盡可能高的出現(xiàn)頻次、也有盡可能大的區(qū)分度的詞,以詞頻以及X/Y這兩個(gè)值作為等權(quán)的指標(biāo)并進(jìn)行無(wú)量綱化處理,對(duì)所得的1771個(gè)高頻詞進(jìn)行處理和排序,得到綜合排序前450位的詞。對(duì)這最終所得的450個(gè)詞進(jìn)行共詞聚類(lèi)分析,建立其450?450的共現(xiàn)矩陣,其中第i行、第j列的元素表示第i和第j的關(guān)鍵詞的共現(xiàn)頻次。
(三)共詞矩陣的構(gòu)建
將得到的共現(xiàn)詞頻矩陣中的量進(jìn)行轉(zhuǎn)換。為了消除頻次懸殊帶來(lái)的影響,用Ochiia系數(shù)把上述共詞矩陣轉(zhuǎn)換為450?450相似矩陣。方法是將共詞矩陣中的每個(gè)數(shù)都除以其涉及到的兩個(gè)高頻詞的總頻次開(kāi)方的乘積,表示詞與詞之間的關(guān)聯(lián)程度。A、B兩詞的Ochiia系數(shù)=A、B兩詞共現(xiàn)頻次/其中,矩陣對(duì)角線的數(shù)據(jù)表示某詞與自身的相關(guān)聯(lián)程度,均為1。用1減去相似矩陣中的每個(gè)數(shù),得到表示兩詞間相異程度的相異矩陣。在相異矩陣中,對(duì)角線的元素值均為0,因關(guān)鍵詞和它自身的相異程度為0。截選這些關(guān)鍵詞的局部10?10的相異矩陣,如下表(表1)所示:
表1 所選450個(gè)關(guān)鍵詞之間的相異矩陣(局部截選)
把該450?450的相異矩陣導(dǎo)入到spss中進(jìn)行聚類(lèi)分析,聚類(lèi)方法使用組間平均距離的系統(tǒng)聚類(lèi),距離采用平方Euclidean距離。
根據(jù)spss計(jì)算所得的聚類(lèi)結(jié)果,將包含450個(gè)關(guān)鍵詞的對(duì)象分為23類(lèi)。既對(duì)一些特定領(lǐng)域的詞群具有足夠的區(qū)分度,同時(shí)也不至于太過(guò)瑣碎。其中,每一類(lèi)包含的關(guān)鍵詞從1個(gè)至上百個(gè)不等。
同時(shí),對(duì)于聚類(lèi)所得的每一個(gè)類(lèi),計(jì)算該類(lèi)內(nèi)部不同的詞的粘合力,以反映該類(lèi)最居于中心地位的詞。類(lèi)團(tuán)內(nèi)部關(guān)鍵詞的粘合力“用以衡量類(lèi)團(tuán)內(nèi)各主題詞對(duì)聚類(lèi)成團(tuán)的貢獻(xiàn)程度,表達(dá)每個(gè)主題在類(lèi)團(tuán)的聚集過(guò)程中所起作用的程度?!保?2]就詞語(yǔ)的粘合力而言,“某一詞與類(lèi)團(tuán)內(nèi)其他主題詞在同篇文獻(xiàn)分別共現(xiàn)頻率的平均值即為該詞的粘合力。平均值越大,該詞在類(lèi)團(tuán)中的地位越突出?!保?3]粘合力的計(jì)算方法為:在有N個(gè)關(guān)鍵詞的類(lèi)中,關(guān)鍵詞A與類(lèi)中其他關(guān)鍵詞組成共詞對(duì),統(tǒng)計(jì)這些詞對(duì)出現(xiàn)的頻率的總和C,那么關(guān)鍵詞A在其所屬的類(lèi)中的粘合力N(A)=C/(N-1)[13]。本文對(duì)粘合力表達(dá)方式做必要的調(diào)整,以詞之間的Ochiia系數(shù)作為衡量一對(duì)共現(xiàn)詞之間的共現(xiàn)程度的量值,也即A、B兩詞共現(xiàn)頻次/設(shè)每個(gè)詞對(duì)間的Ochiia系數(shù)為Xn,則上式中的C=∑Xn。
聚類(lèi)結(jié)果中,每一類(lèi)所包含的詞根據(jù)該詞的粘合力由高到底排序。在這23個(gè)類(lèi)中,包含的關(guān)鍵詞小于或等于2個(gè)的類(lèi)共有8種。由于關(guān)鍵詞過(guò)少,在呈現(xiàn)和提煉主題上存在一定的困難,為處理和論述的方便將這八種小類(lèi)歸到同一個(gè)“其他”類(lèi)中,同時(shí)其關(guān)鍵詞也不依照詞的粘合力排序。具體的結(jié)果如下:
類(lèi)中所含詞(各類(lèi)都按詞的粘合力由高到低排序,“其他”類(lèi)除外)類(lèi)主題特征1 p u r a n a;g a n a p a t i;g a n e s h a;d e i t y 佛教神祇2 s h a n g h a i;k o r e a;b o r a;p o l y n e s i a;b e i j i n g;h o n g k o n g;r e s o r t;j a p a n;j a p a n e s e中國(guó)大城市及韓、日3 e n t r y v i e w;v i e w e r a b o u t;r e a d a b i l i t y;c o l o r a t i o n;i l l u s t r a t i o n s;s p o n s o r;r e s e m b l e;p e r f e c t l y;a p?p e a r i n g;a u t h o r s;a p p e a r a n c e;l i b r a r y;c a t a l o g;t i t l e;o r i g i n a l;b o o k;l i b r a r y d i g i t i z i n g;w o r k;f l o w e r s;s e e d;n u r s e r y;p l a n t s;a g r i c u l t u r a l;a g r i c u l t u r e;c o l l e c t i o n s u b j e c t s;t r a d e;d e p a r t m e n t;l a r g e;w h i t e;c a t a l o g s p u b l i s h e r;s e e d s;p l a n t;v a r i e t y;f i n e;v a r i e t i e s;n a t i o n a l;c o l o r;y e l l o w;b e a u t i f u l;g a r d e n;r i c h;f l o w e r;v e g e t a b l e s;p i n k;r o s e;r e d;p u r e;d e e p;g r o w i n g;b r i g h t;f l o w?e r i n g;s t o c k;f e e t;g r o w t h;f o l i a g e;b l o o m;c r i m s o n;f r u i t;s c a r l e t;g r e e n;d a r k;g o o d;f i n e s t;g r e a t;w i n t e r;s o i l;n u r s e r i e s;s p r i n g;s m a l l;s e a s o n;d w a r f;f o r m;s p l e n d i d;s u m m e r;s t r o n g;b u l b s;f r e e;f r a g r a n t;s h a p e d;c o l o r s;o l d;h a b i t;c a t a l o g u e;s w e e t;b r i l l i a n t;p o t;p e t a l s;m i x e d;g o l d e n;o r a n g e;p u r p l e;g r o w s;o p e n;b e a u t y;e x c e l l e n t;p o p u l a r;l i t t l e;p l a n t e d;b l u e;p o t s;h o u s e;f l e s h;r o o t s;e a s y;r o s e s;p r e t t y;l a r g e r;c h o i c e;c e n t e r;c l e a r;c e n t s;s o r t;b u d s;w a t e r;y o u n g;t e a;c a l i f o r n i a;g e n e r a l l y;p o s t p a i d;s i m i l a r;p a c k e t;a i r;h e a d圖書(shū)與農(nóng)植4 p e o p l e;w o r l d;h i s t o r y;l i f e;p l a c e;w e s t e r n;c o u n t r y;w a r;m o d e r n;l i v e;e a s t;t h o u g h t;h u m a n;i n t e r n a t i o n a l;b e t t e r;p o w e r;p u b l i c;g o v e r n m e n t;l i v i n g;m a n;f a r;a s i a;f e e l;r e a l;u n d e r s t a n d;w e s t;e x a m p l e;l e f t;b e l i e v e;c o u r s e;n e w s;t r a v e l;m e n;w o m e n;p l a c e s;l e a s t;m e d i a;s t u d y;s u r e;s p a c e;l o c a l;c h i l d r e n;c h a n g e;e a r t h;n a t u r e;h a n d;m o n e y;e c o n o m i c;l i n e;e u r o p e a n;d u e;w o r d;m a i n;s t y l e;f o o d;b u i l d i n g;i n f o r m a t i o n;l o o k i n g;e a s t e r n;s u n;g o d;l e a r n;k i n d;f i l m;g a m e;s t r e e t;d e s i g n;l i s t;i s l a n d社會(huì)、政治與生活5 n d o r g a n i z a t i o n;d o r s o d u r o;c a s t e l l o;a r s e n a l e;g i a r d i n i;p a l a z z o;c a m p o;c u r a t o r s;d e l l a;m a r?c o;c u r a t o r;o p e r a;v e n u e;p a v i l i o n;d e p u t y;c o m m i s s i o n e r;t a i p e i;d r a g o n;n u o歐洲城市與文化場(chǎng)所6山水圖;黃賓虹;h u f a n;黃君璧;趙少昂;書(shū)法;畫(huà)家;w u g u a n z h o n g;古董;林風(fēng)眠;f e n g?m i a n;齊白石;q i b a i s h i;手卷;荷花;h a n d s c r o l l;彩山;徐悲鴻;x u b e i h o n g;吳冠中;張大千;i n s c r i b e d;b a m b o o s;j a d e;c a l l i g r a p h y;l o t u s;p a i n t i n g s;e l e p h a n t;a r t i s t s;t a i w a n;e x h i b i?t i o n;m a n d a r i n;m o u n t a i n;w o r k s;v i e w;a r t 7 b r i t a i n;a r b o r e t u m;s h r u b s;b o t;s p e c i e s;t r e e s;m i l l;l o n d o n;n a t i v e;l e a v e s;m a g;s h r u b;l a n d?s c a p e;m a n a g e m e n t;o r n a m e n t a l;f o r e i g n;h i s t o r i c a l;c u l t i v a t e d;t r e e;e n g l a n d;w a l l;a m e r;i n?d i e s;l e a v e d;r a r e;d e s i r a b l e;b a s e 8 w i n s t o n;s e d w i c k;c o m m e n c e m e n t;v e t e r a n s;s a l e m;d a v i s;s t u d e n t s;t e a c h i n g;s t u d e n t;l e a r n?i n g;s c h o o l;p r o g r a m;l a n g u a g e;c e r e m o n y;c o l l e g e;e d u c a t i o n;s o c i a l;m u s i c;a c t i v e;r e p u b l i c;e x p e r i e n c e;c a p i t a l;w o r k i n g;c o m m u n i t y;p o l i t i c a l;e n j o y;p a r t y;l a w;d e v e l o p m e n t;s c i e n c e;s t o r y;r e s e a r c h;c u l t u r e s;p o p u l a t i o n;m i l l i o n;l o s t;c o u n t r i e s;p r o v i n c e;m a j o r;f u t u r e;r e g i o n;m o t h e r;t r a d i t i o n a l;p r e s i d e n t;r u s s i a;h o m e;c i t y;b u s i n e s s;m i l i t a r y;m e m b e r;b o d y;f r i e n d s;l o v e;f a m i l y;m o n t h;s t a t e;a m e r i c a;e n g l i s h;u n i q u e;s p e c i a l;s o c i e t y;r i v e r;u n i v e r s i t y;w i d e;m a r c h;n o r t h;a m e r i c a n;e a r l i e r;f i e l d;s e a;c o m m o n;g e n e r a l;a r t s;b l a c k;s h o r t;c l a s s;q u a l i t y;q u i t e;a n n u a l;d i s t i n c t中國(guó)書(shū)畫(huà)林園種植教育、藝術(shù)、科技、軍事9 m a y a d e v i;l u m b i n i;u n e s c o;b u d d h a;t e m p l e;h i n d u;h o t e l s;s i t e s;b u d d h i s t;l o c a t e d;f e s t i v a l;h e r i t a g e;t o u r i s m;t r a d i t i o n;v i l l a g e;s i t e;c o m m i t t e e;f o u n d a t i o n;a n c i e n t;m u s e u m;n e p a l;c e n t u r y;e m p e r o r;p a r k;n o t e;p r e s e n t;n u m b e r;f o r m s;n a m e d印度、尼泊爾與佛教文化1 0 s u n d e e p k u l l u;h i m a c h a l;i n d i a;a f r i c a;w e d d i n g;e u r o p e;i n d i a n;c i t i e s;n a t u r a l;b r i t i s h國(guó)際1 1 g u i z h o u;p h o t o g r a p h y;m i a o;h m o n g;e t h n i c;s t a t e s;o f f i c i a l;a r e a;m e m b e r s;c o m m e r c i a l;m o u n t a i n s;d y n a s t y;f r a n c e;p h o t o;c o l l e c t i o n;p h o t o s;p e r i o d;a s i a n中國(guó)少數(shù)民族文化1 2 m a h a l;t a j;m a r b l e;t o m b;b a m b o o泰姬陵1 3 i n d u s t r y;c o m p a n y;m a r k e t經(jīng)濟(jì)1 4 b e e;h o n e y;b e e s蜜蜂1 5 t i b e t a n;t i b e t;l a n d西藏1 6 b a t i k;r i c k s h a w s;r i c k s h a w;f i r e w o r k s;t h e o p h i l u s;r a y n s f o r d;d r e e r;n e w y o r k;f r e n c h;p k t s;j o e;p o s t s其他
從聚類(lèi)的結(jié)果可以看到,國(guó)際社交媒體中的中國(guó)文化傳播,與通常的理論角度所做的劃分并不一致。在這里,中國(guó)的文化內(nèi)容并不表現(xiàn)為物質(zhì)文化、行為文化、精神文化等理論維度的差異,而是針對(duì)某些特定主題或相關(guān)聯(lián)的主題形成聚集,產(chǎn)生某些特定的類(lèi)型。其中,關(guān)鍵詞數(shù)量最多的包括圖書(shū)與農(nóng)植類(lèi),教育、藝術(shù)、科技、軍事等泛文化與軟文化類(lèi),社會(huì)、政治與生活等日常文化類(lèi)。此外,與周邊國(guó)家和地區(qū)的文化關(guān)系也是傳播的重要方面,例如韓日等東亞鄰國(guó),印度、尼泊爾、柬埔寨等南亞鄰國(guó)。我國(guó)邊陲與少數(shù)民族文化也是另一個(gè)不可忽視的主題,西藏、貴州、苗文化等都屬于這個(gè)方面。我國(guó)的傳統(tǒng)文化中,中國(guó)書(shū)畫(huà)得到較多討論,而傳統(tǒng)思想文化、功夫等典型意義上的中國(guó)傳統(tǒng)文化元素被傳播的程度和它的典型意義并不相匹配。
中國(guó)文化在國(guó)際社交媒體傳播內(nèi)容中的不同類(lèi)型,具有不同的地位、重要性和呈現(xiàn)程度??疾煲粋€(gè)類(lèi)的呈現(xiàn)規(guī)模,可以采用該類(lèi)所有詞的總詞頻、該類(lèi)詞作為行特征詞的總頻次作為指標(biāo);考察一個(gè)類(lèi)的呈現(xiàn)強(qiáng)度,可以采用該類(lèi)詞的平均詞頻(類(lèi)中所有詞的總詞頻/類(lèi)中詞的數(shù)量)、該類(lèi)詞作為行特征詞的平均頻次(該類(lèi)詞作為行特征詞的總頻次/類(lèi)中詞的數(shù)量);考察一個(gè)類(lèi)與其他類(lèi)的關(guān)聯(lián)強(qiáng)度,可用采用該類(lèi)中詞與其他類(lèi)中詞的平均共現(xiàn)頻次(該類(lèi)中詞與其他類(lèi)中詞的共現(xiàn)總頻次/該類(lèi)中詞的數(shù)量)作為指標(biāo)。對(duì)上文聚類(lèi)所得到的不同類(lèi)型,除了“其他”類(lèi)外,對(duì)另15類(lèi)都依據(jù)這里的六項(xiàng)指標(biāo)進(jìn)行計(jì)算,分析不同的類(lèi)所具有的呈現(xiàn)規(guī)模、呈現(xiàn)強(qiáng)度、關(guān)聯(lián)強(qiáng)度。如下表(表2)所示:
表2 不同類(lèi)型內(nèi)容的呈現(xiàn)程度
在呈現(xiàn)規(guī)模上,各類(lèi)由于類(lèi)中詞的數(shù)量的差別以及詞本身的詞頻的差異,從而表現(xiàn)出很大的差別。其中,第3類(lèi)(圖書(shū)與農(nóng)植)、第8類(lèi)(教育、藝術(shù)、科技、軍事)和第4類(lèi)(社會(huì)、政治與生活)具有明顯的優(yōu)勢(shì)。具體如圖1(見(jiàn)下頁(yè))所示。
去除類(lèi)中所有詞的總體規(guī)模因素,考慮類(lèi)中詞的平均化水平,這就關(guān)系到各類(lèi)的呈現(xiàn)強(qiáng)度(見(jiàn)下頁(yè)的圖2)。在類(lèi)中詞的平均詞頻以及作為特征詞的平均頻次上,各類(lèi)的差距要小一些。但是不同類(lèi)型之間依然存在著顯著的差異,類(lèi)中詞的平均詞頻、類(lèi)中詞作為行特征詞的平均頻次,兩者的卡方檢驗(yàn)顯示,前者的卡方量為3201.048,后者的卡方量為4638.363,自由度(df)都為14,漸進(jìn)顯著性都接近于0,不同類(lèi)之間存在著顯著性的差異。在類(lèi)中詞的平均詞頻方面,第3類(lèi)(圖書(shū)與農(nóng)植)、第4類(lèi)(社會(huì)、政治與生活)、第2類(lèi)(中國(guó)大城市及韓、日)居于前三位,第12類(lèi)(泰姬陵)的值為最低。在類(lèi)中詞作為行特征詞的平均頻次方面,第3類(lèi)(圖書(shū)與農(nóng)植)、第4類(lèi)(社會(huì)、政治與生活)、第8類(lèi)(教育、藝術(shù)、科技、軍事)居于前三位,第1類(lèi)(佛教神祇)和第12類(lèi)(泰姬陵)處于最低水平。
圖1 各類(lèi)在國(guó)際社交媒體中的呈現(xiàn)規(guī)模
圖2 各類(lèi)在國(guó)際社交媒體中的呈現(xiàn)強(qiáng)度
在關(guān)聯(lián)強(qiáng)度上,各類(lèi)差別很大(見(jiàn)下頁(yè)的圖3)。類(lèi)中詞與其他類(lèi)中詞的平均共現(xiàn)頻次反映著一個(gè)類(lèi)與其他類(lèi)的關(guān)聯(lián)緊密程度。從這個(gè)指標(biāo)上看,少部分類(lèi)處于中心地位,與其他類(lèi)關(guān)聯(lián)很緊密。例如:第3類(lèi)(圖書(shū)與農(nóng)植)處于突出的領(lǐng)先地位;第8(教育、藝術(shù)、科技、軍事)類(lèi)、第4類(lèi)(社會(huì)、政治與生活)、第7類(lèi)(林園種植)、第13類(lèi)(經(jīng)濟(jì))構(gòu)成第二梯隊(duì);第12類(lèi)(中國(guó)少數(shù)民族文化)、第1類(lèi)(佛教神祇)、第5類(lèi)(歐洲城市與文化場(chǎng)所)則是最為邊緣化的內(nèi)容類(lèi)型。對(duì)這些類(lèi)在反映其呈現(xiàn)規(guī)模、呈現(xiàn)強(qiáng)度、關(guān)聯(lián)強(qiáng)度的指標(biāo)的基礎(chǔ)上,通過(guò)多重對(duì)應(yīng)分析進(jìn)一步考察其類(lèi)型之間在地位與重要性上的相似性和差異性(見(jiàn)下頁(yè)的圖4)。其中,第3類(lèi)(圖書(shū)與農(nóng)植)與其他類(lèi)都具有很大的距離;第4(社會(huì)、政治與生活)、7(林園種植)、8(教育、藝術(shù)、科技、軍事)、第13(經(jīng)濟(jì))類(lèi)比較接近;第9(印度、尼泊爾與佛教文化)、10(國(guó)際)、11(中國(guó)少數(shù)民族文化)類(lèi)比較接近;第2(中國(guó)大城市及韓、日)、15(西藏)類(lèi)比較接近;第6(中國(guó)書(shū)畫(huà))、14(蜜蜂)類(lèi)高度接近;第1(佛教神祇)、5(歐洲城市與文化場(chǎng)所)、12(泰姬陵)類(lèi)高度相近。
圖3 各類(lèi)在國(guó)際社交媒體中的關(guān)聯(lián)強(qiáng)度
圖4 基于呈現(xiàn)程度對(duì)各類(lèi)型內(nèi)容的多重對(duì)應(yīng)分析
結(jié)合前文關(guān)于呈現(xiàn)程度各指標(biāo)數(shù)據(jù),中國(guó)文化內(nèi)容在國(guó)際社交媒體的傳播主要有以下六個(gè)特征類(lèi)型。
其一是高呈現(xiàn)規(guī)模、高呈現(xiàn)強(qiáng)度、高關(guān)聯(lián)強(qiáng)度的內(nèi)容,這以第3類(lèi)為代表,它具有很強(qiáng)的傳播綜合效能。
其二是高呈現(xiàn)強(qiáng)度、高關(guān)聯(lián)強(qiáng)度但其呈現(xiàn)規(guī)模未必都高的內(nèi)容,這包括第4、7、8、13類(lèi),它們具有強(qiáng)中心性和輻射力,也是顯著的文化“議程”,其內(nèi)容涉及教育、藝術(shù)、科技、軍事、經(jīng)濟(jì)、社會(huì)、政治、生活等廣泛的和重要的方面,可見(jiàn)中國(guó)文化的國(guó)際社交媒體傳播仍以這些“泛文化”與“大文化”內(nèi)容為主要議程。
其三是呈現(xiàn)強(qiáng)度中等、關(guān)聯(lián)強(qiáng)度居于中等的內(nèi)容,包括第9、10、11類(lèi),它們主要是和國(guó)際以及周邊國(guó)家相關(guān)的文化內(nèi)容,體現(xiàn)了中國(guó)文化與國(guó)際范圍內(nèi)的文化交往雖逐漸升溫,但仍有待繼續(xù)加強(qiáng)。
其四是呈現(xiàn)規(guī)模很低、呈現(xiàn)強(qiáng)度中等、有一定關(guān)聯(lián)強(qiáng)度的內(nèi)容,包括第2、15類(lèi),它們涉及韓、日等來(lái)往密切的近鄰以及我國(guó)邊疆地區(qū)。它們雖然在傳播規(guī)模上很弱,但是具有尚可的呈現(xiàn)強(qiáng)度,與其他類(lèi)的關(guān)聯(lián)強(qiáng)度處于中等偏低的水平但仍有一定的關(guān)聯(lián)度,特別是與自身的呈現(xiàn)規(guī)模相比,其輻射效能和影響力值得“防微杜漸”地關(guān)注。
其五是呈現(xiàn)規(guī)模、呈現(xiàn)強(qiáng)度、關(guān)聯(lián)強(qiáng)度都比較低但是詞的區(qū)分度高,包括第6和第14類(lèi),這些類(lèi)中的詞平均詞頻比較高,但是作為特征詞所在的行與之相比則處于懸殊的低位,也即在相對(duì)少數(shù)的帖子中密集出現(xiàn)。值得注意的是,屬于中國(guó)獨(dú)特的傳統(tǒng)文化的中國(guó)書(shū)畫(huà)類(lèi)內(nèi)容,盡管其內(nèi)容區(qū)分度較高,但是它的呈現(xiàn)規(guī)模、呈現(xiàn)強(qiáng)度以及關(guān)聯(lián)強(qiáng)度都比較低,這顯示出其影響力的欠缺,是我國(guó)在今后的文化戰(zhàn)略和文化“走出去”中需要加以改進(jìn)的。
其六是呈現(xiàn)規(guī)模、關(guān)聯(lián)強(qiáng)度都很低但是詞的區(qū)分度很高,包括第1、5、12類(lèi),它們?cè)谒杉乃刑游谋局谐霈F(xiàn)的很少,與其他類(lèi)的關(guān)聯(lián)很非常微弱,但是詞的平均出現(xiàn)頻次和作為行特征詞的頻次的比值很高,也即這些詞在少部分的帖子中高度密集地出現(xiàn),這部分涉及到佛教神祇、一些歐洲小城市與文化場(chǎng)所、泰姬陵等文化元素,具有鮮明的區(qū)域性和特色性。
圍繞論文開(kāi)頭提出的問(wèn)題,本研究通過(guò)社交媒體的文本挖掘以及聚類(lèi)等定量分析的手段進(jìn)行了分析。
在類(lèi)型的分布特征上,呈現(xiàn)規(guī)模最高的主要是圖書(shū)與農(nóng)植類(lèi)、教育、藝術(shù)、科技、軍事類(lèi)和社會(huì)、政治與生活類(lèi);呈現(xiàn)強(qiáng)度高的有圖書(shū)與農(nóng)植類(lèi)以及社會(huì)、政治與生活類(lèi)等;關(guān)聯(lián)強(qiáng)度高的有圖書(shū)與農(nóng)植類(lèi)、教育、藝術(shù)、科技、軍事類(lèi)、社會(huì)、政治與生活類(lèi)、經(jīng)濟(jì)類(lèi)等。對(duì)于我國(guó)文化通過(guò)社交媒體的“走出去”而言,需要強(qiáng)調(diào)和突出呈現(xiàn)強(qiáng)度和關(guān)聯(lián)強(qiáng)度高、具有高影響力和中心性的內(nèi)容,注重具有國(guó)際社交媒體議程效力的“泛文化”與“大文化”傳播,加大與周邊國(guó)家以及國(guó)際傳播范圍內(nèi)的文化交往和文化互動(dòng),及時(shí)防范和化解與跨文化語(yǔ)境中的文化誤解和偏誤形象,注重邊陲地區(qū)和少數(shù)民族文化在國(guó)際公共領(lǐng)域的影響,著力切實(shí)擴(kuò)大中國(guó)傳統(tǒng)和特色文化元素的呈現(xiàn)規(guī)模及其影響力,并注意打造與培育具有鮮明識(shí)別度的中國(guó)區(qū)域性文化內(nèi)容和文化符號(hào)。
[1]馮輝.關(guān)于文化的分類(lèi)[J].中州大學(xué)學(xué)報(bào),2005,(4):40-41.
[2]鐘敬文.關(guān)于文化建設(shè)問(wèn)題的一點(diǎn)意見(jiàn)[G]//鐘敬文,等.東西方文化研究:1987年第一輯.鄭州:河南人民出版社,1987:11.
[3]吳瑛.孔子學(xué)院與中國(guó)文化的國(guó)際傳播[M].杭州:浙江大學(xué)出版社,2013:20.
[4]吳瑛.中國(guó)文化對(duì)外傳播效果研究——對(duì)5國(guó)16所孔子學(xué)院的調(diào)查[J].浙江社會(huì)科學(xué),2012,(4):144-151.
[5]陳序經(jīng).文化學(xué)概觀[M].長(zhǎng)沙:岳麓書(shū)社,2009:280-281.
[6]劉雪.文化分類(lèi)問(wèn)題研究綜述[J].岱宗學(xué)刊,2006,(4):9-11.
[7]李樹(shù)榕.怎樣為文化資源分類(lèi)[J].內(nèi)蒙古大學(xué)藝術(shù)學(xué)院學(xué)報(bào),2014,(3):10-14.
[8]王文杰.文化走出去[M].北京:人民日?qǐng)?bào)出版社,2013.
[9]烏丙安,向云駒,潘魯生,趙屹.中國(guó)民間文化分類(lèi)[J].中國(guó)民族,2003,(5):21-22.
[10]杜獻(xiàn)寧,楊英法,李文華.文化分類(lèi)之我見(jiàn)[J].電影評(píng)介,2006,(18):104-105.
[11]DAUOHUE J C.Understanding Scientific Literatures:A Biblio Metric Approach[M].Cambridge:The MIT Press,1973:49-50.
[12]鐘偉金,李佳.共詞分析法研究(二)——類(lèi)團(tuán)分析[J].情報(bào)雜志,2008,(6):141-143.
[13]鐘偉金.共詞聚類(lèi)分析法的類(lèi)團(tuán)實(shí)例研究[J].中華醫(yī)學(xué)圖書(shū)情報(bào)雜志,2009,(2):48-53.
Chinese Culture in International Social Media and Its Characteristics of Types:An Empirical Study Based on Web Mining
XU Xiang
(College of Arts and Media,Tongji University,Shanghai 201804,China)
The rise of global social media provides new space and opportunities to the international cultur?al communication and Chinese cultural outgoing,and also brings new changes and challenges.This study used software and program including crawler and ROST,VBA,and sampled tens of posts which consisted of more than fifty million characters,by means of quantitative mining such as co-word and clustering analysis,to ana?lyze the composition of Chinese cultural content in international social media and its characteristics of scale,intensity and correlation intensity in spreading.On this basis,it attempts to provide empirical basis and coun?termeasures for enhancing the international communication of Chinese culture in the new context of global so?cial media.
social media;Chinese culture;international communication;co-word clustering
G206.3
:A
:1009-1971(2017)02-0059-09
[責(zé)任編輯:鄭紅翠]
2016-12-10
國(guó)家社科基金項(xiàng)目“中國(guó)文化對(duì)外社交媒體傳播機(jī)制研究”(13CXW050);上海市社科規(guī)劃項(xiàng)目“中國(guó)城市國(guó)際社交媒體傳播效果優(yōu)化研究”(2014FXW001)
徐翔(1983—),男,江西上饒人,副教授,博士,同濟(jì)大學(xué)全球城市文化傳播中心研究員,從事網(wǎng)絡(luò)傳播研究。