〔摘 要〕中國少數民族語言網絡輿情研究是網絡信息資源管理的重要內容。本文在介紹國內少數民族語言網絡輿情研究現狀和問題的基礎上,總結了少數民族語言網絡輿情研究的4個特征:政治性、交叉性、跨境性和超前性,分析了少數民族語言網絡輿情研究整體趨勢,指出語義分析、情感傾向分析、多語種分析等有待突破的研究方向。本文的研究結論對于中國少數民族語言網絡輿情監(jiān)測和分析體系的建立和少數民族語言網絡輿情科學研究的開展具有一定的參考價值。
〔關鍵詞〕少數民族語言;網絡輿情;民族信息學;述評
DOI:10.3969/j.issn.1008-0821.2014.02.034
〔中圖分類號〕C913.62 〔文獻標識碼〕A 〔文章編號〕1008-0821(2014)02-0168-04
西方國家輿情研究可以追溯到19世紀興起的民意調查。近年來,國內外各類政府組織都將網絡輿情作為民意的重要形式予以關注,網絡輿情分析與監(jiān)測已成為傳播學、情報學、社會學、公共管理等學多個學科共同關心的熱點問題。網絡輿情(Internet Public Opinion)是在特定的時間和社會空間內,個人和社會群體在以互聯網為媒介進行信息溝通和傳播的過程中所反映出來的對相關公共事務所持有的態(tài)度、情緒、意愿和行為傾向的集合[1]。網絡輿情的功能具有兩面性:一方面它是現實輿情民意在網絡空間直接體現,可以作為公共決策的重要依據;另一方面,網絡輿情可能帶有情緒宣泄的色彩,有可能成為重大公共危機的“導火索”,對社會的穩(wěn)定和發(fā)展構成嚴重影響。
1 中國少數民族語言網絡輿情研究的概況中國是統(tǒng)一的多民族國家,多民族、多語言、多文字是國情的基本特征。近年來,在國家通用語言文字網絡信息資源飛速增長的同時,以蒙古文、滿文、維吾爾文、哈薩克文、柯爾克孜文、藏文、朝鮮文、彝文、傣文等為代表的一大批少數民族文字網站也在互聯網上相繼亮相。國家語言資源監(jiān)測與研究中心少數民族語言分中心調查顯示,2011年我國大陸地區(qū)少數民族語言文字網站總量在389個左右,其中維吾爾文網站175個、藏文網站109個[2]。隨著支持少數民族文字的計算機軟件和移動通信設備應用范圍逐步擴大,越來越多的少數民族人口開始熟悉和掌握網絡應用的使用方法,互聯網成為我國民族地區(qū)人口表達意愿、交流信息和共享文化重要空間的趨勢已經開始顯現。采用科學的理論和方法進行少數民族語言網絡輿情的分析和研究,是政府在數字時代實現科學、民主決策的基本需要,也是民族地區(qū)社會穩(wěn)定和繁榮的重要保障。我國民族地區(qū)大多處在祖國的邊疆地帶,在國家穩(wěn)定和團結的整體格局中具有舉足輕重的地位,與少數民族事務相關的各類事件大多是國際國內各類機構所關注的焦點。隨著互聯網在民族地區(qū)的逐步普及,建立網絡輿情的分析和監(jiān)測體系已經成為民族地區(qū)公共管理體系創(chuàng)新的重要內容。少數民族語言網絡輿情分析與監(jiān)測具有重大的社會意義,主要有:第一,通過對少數民族語言網絡輿情的分析和監(jiān)測,可以傾聽廣大網民用少數民族語言文字所表達的心聲,了解民族地區(qū)廣大網民對公共事務的意見和建議,從而為科學決策和改進工作奠定基礎;第二,通過對少數民族語言網絡輿情的分析和監(jiān)測,可以及時發(fā)現可能導致嚴重公共危機的事件,提前進行預警和處置,將危機消滅在萌芽狀態(tài);第三,通過對少數民族語言網絡輿情的分析和監(jiān)測,可以掌握網絡輿情信息傳播的規(guī)律,采取必要措施合理干預,防止引發(fā)重大危機事件,引導網絡輿情朝積極、健康的方向發(fā)展。近年來,我國一些學者已經開始探索少數民族語言網絡輿情分析的理論與方法。例如,江濤等人設計了基于的藏文網頁輿情監(jiān)控系統(tǒng),討論了藏文網頁的判定算法、不同藏文編碼向國家標準擴A轉換的算法以及格助詞與藏文輿情分詞詞典相結合的自動分詞算法等[3];鄧競偉等根據復雜網絡理論的研究方法對藏文網絡輿情傳播規(guī)律進行實證分析,構建了基于藏文網絡的輿情傳播模型[4];阿布都瓦依提·尼亞孜研究了維吾爾文網站網絡輿情的引導和控制問題[5];盧修配等人探討了維吾爾文網絡輿情分析目前國內外的研究狀況和要解決的關鍵技術問題[6];王嘉梅等人以云南跨境民族語言彝文為例,對跨境多民族語種網絡輿情內容進行深入分析與理解,構造了基于人工免疫系統(tǒng)的網絡輿情信息智能濾取系統(tǒng)[7]。近年來,少數民族語言網絡輿情分析領域的研究基金課題逐漸增多,例如中央民族大學閆曉東主持的“藏、維文網絡敏感信息自動發(fā)現和預警技術研究”、新疆大學艾斯卡-艾木都拉爾主持的“新疆多民族語言網絡輿情監(jiān)測預警系統(tǒng)開發(fā)與應用”、新疆大學禹龍主持的“維吾爾語網絡輿情信息自動獲取與分析方法研究”等[8]。一些IT企業(yè)近年來也開始研發(fā)少數民族語言網絡輿情分析軟件,例如北京中科點擊公司研發(fā)的“軍犬網絡輿情監(jiān)控系統(tǒng)”[8]、山東魯網開發(fā)的“政府網絡輿情監(jiān)測系統(tǒng)”[9]據稱都可以實現藏文、維吾爾文、蒙古文、彝文、朝鮮文等少數民族文字網絡輿情的自動采集和分析功能。從已公開的資料來看,少數民族語言網絡輿情研究的重大意義已經得到普遍認同,國家相關機構在少數民族語言網絡輿情研究領域的投入呈現遞增趨勢。然而,受制于少數民族語言文字信息技術普及率不高、少數民族語言文字網絡信息資源的數量有限、少數民族語言文字信息深度處理所需的語言學基礎還不成熟等各類因素的綜合影響,目前我國的少數民族語言網絡輿情研究整體上還處于起步階段,研究成果總體數量不多,主題較為分散,還沒有形成相對完整的理論體系。其次,對涉及的各類深層次問題關注不夠,偏重于單一語種輿情分析系統(tǒng)的技術實現,對于各語種少數民族語言網絡輿情分析當中的共性需求關注不多。再次,目前少數民族語言網絡輿情分析領域的研究目標過于單一,大多強調從公共安全視角進行的網絡輿情監(jiān)測與控制,從網絡問政角度進行網絡輿情民意分析的成果相對較少。上述問題的出現是對目前我國民族地區(qū)信息化發(fā)展現狀的直接反映,客觀地說具有一定的必然性,需要來自民族學、情報學、傳播學、公共管理學、社會學等領域的學者共同探討,基于對少數民族語言網絡輿情管理特殊需求的思考,推動少數民族語言網絡輿情管理理論體系的構建和系列重大問題研究的開展,為民族地區(qū)網絡輿情管理體制的完善提供理論支持。endprint
2 中國少數民族語言網絡輿情研究的特征中國少數民族語言網絡輿情研究是一項具有高度綜合性和復雜性的任務,涉及網站、博客、微博、論壇等多樣化的信息來源,網頁、圖形、圖片、視頻、音頻、文本、數據等多種信息類型,藏語、蒙古語、維吾爾語、哈薩克語、柯爾克孜語、彝語、傣語、朝鮮語等多種少數民族語言文字。由于和民族問題緊密相關,少數民族語言網絡輿情研究除了具有國家通用語言網絡輿情研究的基本特征之外,還有一些具有自身特色的需求特征,主要體現在以下方面:
2.1 少數民族語言網絡輿情研究的政治性少數民族語言網絡輿情研究是以少數民族語言文字的廣泛應用為前提的,從側面顯示了國家保護少數民族語言文字和少數民族文化的政治立場。目前,我國的《憲法》《國家通用語言文字法》和各少數民族自治地方的語言文字工作條例當中都明確規(guī)定:國家尊重和保護少數民族人口使用和發(fā)展本民族語言文字的權力。在西藏、新疆、內蒙古等省區(qū),特定語種的少數民族語言文字和國家通用語言文字同為官方語言,使用少數民族文字的法律文書與使用國家通用語言文字的法律文書具有同等效力。從網絡問政的角度來看,少數民族語言網絡輿情研究又是政府傾聽少數民族群眾意見和建議的一種方式。從維護社會管理秩序的角度來看,少數民族語言網絡輿情監(jiān)測的目的在于是及時識別不利于民族團結和社會穩(wěn)定的負面信息并采取措施進行干預和引導,從而主動化解社會危機。因此,少數民族語言網絡輿情并不是單純的網絡信息分析問題,它始終與我國多民族國家的政治整合和社會穩(wěn)定緊密聯系在一起。
2.2 少數民族語言網絡輿情研究的交叉性網絡輿情研究是傳播學、情報學、社會學、公共管理學等學科相互交叉形成的新的學科領域。少數民族語言網絡輿情在這些學科的基礎上,又融合了民族學、語言學的知識,使這一問題變得更加復雜。少數民族語言網絡輿情研究當中的大多數難題主要是源于語言學基礎支持程度不夠。例如,目前輿情分析當中普遍使用的敏感關鍵詞檢索和追蹤技術,這項技術必須以成熟的自然語言分詞技術為基礎,否則檢索結果的準確度會受到很大影響。網絡輿情研究當中的網絡信息資源情感傾向分析技術同樣必須以典型情感用語詞庫為基礎才可以進行計算和判斷。在實踐中,要實現語音信息、圖像信息等多媒體網絡輿情的內容分析時,還必須將多媒體信息轉換為文本信息后再信息分析,因而又需要語音識別、圖像文字識別等領域專業(yè)知識的支持。從民族學角度來看,少數民族語言網絡輿情也是少數民族文化的一種表現形式,其形成和傳播有其特殊的規(guī)律性,例如與國家通用語言網絡輿情的共生和關聯規(guī)律等??傊?,少數民族語言網絡輿情研究是一個高度交叉性的研究領域,需要對多個學科的專業(yè)知識進行綜合集成。
2.3 少數民族語言網絡輿情研究的跨境性中國56個民族中,有28個民族的語言是跨境的,如蒙古、藏、維吾爾、朝鮮、哈薩克、苗、瑤、壯、傣、哈尼、景頗、怒、獨龍、佤、京等民族的語言[10]。這些跨境語言是在長期歷史演進過程中形成的,目前正在被我國特定地區(qū)的少數民族人口和境外其他國家相同民族人口所共同使用,例如蒙古語是我國內蒙古自治區(qū)的蒙古族人口與境外的蒙古國共同使用,朝鮮語是我國的延邊朝鮮族自治州的朝鮮族人口與境外的朝鮮、韓國共同使用,哈薩克語是我國新疆自治區(qū)的哈薩克族人口與境外的哈薩克斯坦國共同使用。這些跨境語言的存在,在一定程度上會對少數民族人口的國家認同產生影響,因而互聯網發(fā)展之初,一直就是我國政府與境外相關國家爭奪文化自主權,保衛(wèi)邊疆民族地區(qū)文化安全的重要陣地。此外,境外一些敵對勢利也企圖利用互聯網的跨時空傳播特性,專門在互聯網上建立少數民族網站,制造和傳播對民族團結和國家穩(wěn)定有害的言論。因此,少數民族語言網絡輿情研究除了分析我國少數民族人口所形成的網絡信息資源之外,也要關注境外相關國家和社會組織所建立的特定語種的網絡信息資源。
2.4 少數民族語言網絡輿情研究的超前性由于少數民族語言網絡信息資源整體數量較少,目前各民族地區(qū)進行少數民族語言網絡輿情監(jiān)測主要還是依賴人工方式,而一些開通博客、微博等服務功能的少數民族語言網站則按照“先審核、再發(fā)布”模式進行信息發(fā)布[2]。例如,人民網的輿情監(jiān)測室所提供蒙古、藏、維吾爾、哈薩克、朝鮮等少數民族語言輿情報告全部是采用人工分析方式完成的。以人工方式進行網絡輿情管理具有簡單易行的優(yōu)勢,但是由于人認知能力的局限性,往往更注重表層信息的理解,對于各類數據之間的深層次關聯關系很難把握,不容易發(fā)現輿情信息背后所隱含的規(guī)律性,對于處在醞釀期的網絡輿情危機事件往往難以識別。此外,人工方式費時費力,工作效果受到分析人員狀態(tài)的影響而呈現出波動性特征,目前之所以沒有自動分析系統(tǒng)的輔助,主要還是相關領域技術和方法的還不夠成熟,無法滿足網絡輿情分析的精確度要求。未來隨著少數民族語言網絡信息資源數量的持續(xù)增加,這種模式肯定會難以為繼。從推進民族地區(qū)民主管理和社會穩(wěn)定的長遠需求來看,盡管現階段我國少數民族語言網絡輿情信息數量不多,進行少數民族語言網絡輿情領域的理論研究,開發(fā)具有智能分析功能的輿情監(jiān)測系統(tǒng),探索人工與自動相結合的少數民族語言網絡輿情分析模式,對維護民族地區(qū)社會的繁榮和穩(wěn)定具有非常重要的現實意義??傊?,少數民族語言網絡輿情研究要以民族學、語言學知識為支撐,通過人工分析與自動分析相結合的方式,實現傳播學、情報學、社會學、公共管理學等多個學科知識的集成與融合,共同服務于少數民族文化保護、民族地區(qū)民意獲取、邊疆地區(qū)公共安全保障等國家大局。
3 中國少數民族語言網絡輿情研究的展望少數民族語言網絡輿情研究必須以少數民族語言網絡信息資源為基礎,其發(fā)展必然受到少數民族語言信息處理技術的發(fā)展水平和普及程度的制約。目前,藏語、蒙古語、維吾爾語等影響較大的幾種少數民族語言文字的文本編輯排版和網頁制作技術已經成熟,在互聯網上使用少數民族語言文字的人口數量正在持續(xù)增長。以藏語信息技術為例,網絡的普及正在改變藏族民眾的生活方式,據報道,一些藏傳佛教寺廟里的佛學院也為修行的學僧開設了計算機課程,學習打字、排版和網頁設計等內容,并將推出自己的網站[2]。可以預見,未來從事少數民族語言網絡輿情研究者也會隨之增多,除了中央民族大學和西北民族大學之外,越來越多的學者和研究機構會開始關注這一領域。伴隨著這一趨勢,研究內容也會隨之出現變化,主要體現在:第一,少數民族語言網絡輿情研究所關注的語種由藏語和維吾爾語擴展到多個語種的少數民族語言,例如朝鮮語、彝語、傣語等語種網絡輿情的分析方法也會受到關注;第二,少數民族語言網絡輿情研究的深度會繼續(xù)增加,由目前基于維護社會穩(wěn)定的單一目的向著網絡問政、危機預警、社會治理等綜合型目標體系轉型;第三,少數民族語言網絡輿情分析的方法由目前的人工定性分析為主,向著基于網絡輿情自動分析系統(tǒng)加人工輔助判斷的復合型分析模式轉型;第四,從事少數民族語言網絡輿情研究人員的學科背景將會更加多元化,從傳播學、社會學、公共管理學等角度研究少數民族語言網絡輿情的研究成果會不斷增多。在少數民族語言網絡輿情研究持續(xù)推進的同時,以下3個重要的研究方向值得特別關注:endprint
3.1 基于本體的少數民族語言網絡輿情語義分析技術 目前的少數民族網絡輿情自動分析主要依賴基于關鍵詞檢索的話題發(fā)現和跟蹤技術,進行文本的簡單比對和匹配,不能結合上下文語境和用戶需求進行智能檢索。按照語義網(Semantic Web)的發(fā)展趨勢,未來的網絡信息資源將會根據領域知識本體(Ontology)模型進行語義標注,檢索時可以結合本體進行邏輯推理,從而增加檢索的查全率和查準率,更好地滿足少數民族語言網絡輿情分析的深層次需求。少數民族語言網絡輿情語義分析的關鍵是構建各語種的知識本體詞網模型,這是一項非常復雜和艱巨的任務,必須在參考WorldNet,How Net等通用詞網的基礎上,結合對各語種敘詞邏輯關系的分析,建立各語種敘詞本體詞網模型,作為語義標注和智能檢索的參照體系。
3.2 少數民族語言網絡輿情信息情感傾向自動分析技術 目前基于關鍵詞的網絡輿情分析技術還無法處理不包括敏感詞但是內容卻具有一定社會危害的網絡信息。少數民族語言網絡輿情的深度分析,必須在敏感詞檢索的基礎上,通過傾向性分析可以明確網絡傳播者所蘊含的感情、態(tài)度、觀點、立場、意圖等信息,從而提高網絡輿情分析的準確性。少數民族語言網絡信息情感傾向分析是具有挑戰(zhàn)性的研究任務,需要建立對應語種的情感傾向詞語料庫,通過比對和計算對網絡信息資源的情感傾向做出判斷。
3.3 以國家通用語言為中介的多語種少數民族語言網絡輿情分析技術 民族信息學(Minzu Informatics)是研究信息化背景下多民族語言信息共享規(guī)律的科學領域[11]。按照民族信息學觀點,為了便于實現多民族語言信息資源共享,少數民族語言網絡信息資源在發(fā)布時應當遵循“雙語原則”,也就是同時提交少數民族語言和國家通用語言文字兩者版本。該信息在網絡當中顯示可以根據需要進行雙語對照顯示或者隱藏國家通用語言文字版本,將其作為語義元數據進行嵌入式保存。按照民族信息學原則進行網絡信息資源發(fā)布后,少數民族語言網絡輿情分析可以借助發(fā)展較為成熟的國家通用語言文字網絡輿情分析技術進行,而且可以非常方便地進行不同語種輿情信息之間的比較研究。當然,這種方法以高質量的少數民族語言網絡輿情信息為基礎,必須以嚴格的管理制度為保障。
4 研究總結中國少數民族語言網絡輿情研究是隨著民族地區(qū)信息化建設的推進而受到關注的重要研究領域,與政治問題緊密聯系,需要綜合多學科的專業(yè)知識對境內外使用我國少數民族語言文字產生的網絡信息進行監(jiān)測和分析,滿足民意分析、危機預警、公共治理等多方面的社會需求。目前,我國少數民族語言網絡信息資源數量整體不多,少數民族語言網絡輿情分析還處在起步階段,未來需要結合民族地區(qū)社會發(fā)展進一步完善,建立少數民族語言網絡輿情分析的基礎理論和方法體系,并爭取在語義分析、情感分析、多語種分析等研究方向取得突破。
參考文獻
[1]劉毅.網絡輿情研究概論[M].天津:天津社會科學院出版社,2003.5.
[2]李光,鐘雅瓊.大陸研擬藏維文網絡輿情監(jiān)測系統(tǒng),監(jiān)控分裂風險[N].鳳凰周刊,2012-06-25.
[3]江濤,于宏志,李剛.基于藏文網頁的網絡輿情監(jiān)控系統(tǒng)研究[C].上海:全國第23屆計算機安全學術交流會論文集,2008.10.
[4]鄧競偉,鄧凱英,李永生,等.基于藏文網絡的輿情傳播模型[J].計算機系統(tǒng)應用,2013,(3):209-211.
[5]阿布都瓦依提·尼亞孜.淺析維吾爾文網站網絡輿情的引導和控制[J].新聞世界,2010,(7):204-205.
[6]盧修配,齊向偉,艾斯卡爾.維吾爾文網絡輿情研究現狀及幾個關鍵問題[J].新疆師范大學學報:自然科學版,2012,(2):86-88.
[7]王嘉梅,張建營,趙繼勇.云南跨境多民族語言復雜網絡輿情內容分析[J].信息與電腦:理論版,2013,(6).
[8]中科點擊,軍犬網絡輿情監(jiān)控系統(tǒng)實現多民族語言監(jiān)控功能[EB/OL].http:∥www.54zk.com/contents/152/1988.html,2013-10-05.
[9]魯網輿情頻道,魯網政府網絡輿情監(jiān)測系統(tǒng)——少數民族語言網絡輿情監(jiān)測[EB/OL].http:∥service.sdnews.com.cn/yuqing/#3dtx,2013-10-05.
[10]戴慶廈.跨境語言研究[M].北京:中央民族學院出版社,1993.12.
[11]趙生輝.民族信息學的學科定位與理論體系初探[J].圖書情報工作,2012,(5):56-61.
(本文責任編輯:馬 卓)endprint