萬(wàn)麗雯
(武漢理工大學(xué)管理學(xué)院,湖北 武漢 430000)
方付建定義企業(yè)網(wǎng)絡(luò)輿情是指一些企業(yè)突發(fā)事件經(jīng)過(guò)網(wǎng)絡(luò)傳播形成強(qiáng)大的“井噴型”輿情,噴涌的網(wǎng)絡(luò)輿情直接影響到企業(yè)發(fā)展和存續(xù)。本文定義企業(yè)網(wǎng)絡(luò)輿情是指在各種事件的刺激下,群眾對(duì)在網(wǎng)絡(luò)上傳播的企業(yè)事件所有認(rèn)知、態(tài)度、情感傾向等的集合。
1.2.1 主體因素
主體是指輿情事件的參與者,包括網(wǎng)民和當(dāng)事主體。網(wǎng)民的情感傾向、關(guān)注度,企業(yè)的類(lèi)型、參與度、回應(yīng)的及時(shí)性等都對(duì)企業(yè)輿情事件的發(fā)展和變化有著巨大的影響。例如2020年的“華為剝離榮耀業(yè)務(wù)”,在網(wǎng)絡(luò)情緒的表達(dá)方面,基于華為品牌的認(rèn)知度,很多人仍然支持華為的決定,積極態(tài)度占87%。因此對(duì)企業(yè)并未造成危機(jī)。在企業(yè)輿情危機(jī)事件中,一些事件由于相關(guān)企業(yè)的參與和及時(shí)響應(yīng),輿情才平息下來(lái)。因此本文認(rèn)為主體因素主要包含網(wǎng)民情感傾向、網(wǎng)民的關(guān)注度以及企業(yè)的參與度三個(gè)方面。
1.2.2 客體因素
客體是指輿情事件本身,是客觀存在的屬性。引發(fā)輿論危機(jī)的常見(jiàn)敏感因素包括產(chǎn)品或服務(wù)質(zhì)量、消費(fèi)者權(quán)益等類(lèi)型。如“上汽大眾4S店破壞好零件再修理”“三只松鼠薯片致癌物”等事件排名前十。這些輿情事件大多與企業(yè)潛在或存在的侵犯消費(fèi)者權(quán)益行為有關(guān),也是社會(huì)輿論的敏感點(diǎn),群眾的關(guān)注焦點(diǎn)也聚集在這些事件上,容易引發(fā)負(fù)面的公眾情緒,加劇輿論糾紛。輿情真實(shí)度主要是因?yàn)樵诰W(wǎng)絡(luò)空間里,大多數(shù)言論都難以分辨真假,虛假的言論極易導(dǎo)致與該企業(yè)相關(guān)的輿情事件危機(jī)的發(fā)生。本文認(rèn)為客體因素包含輿情的真實(shí)度和敏感度兩個(gè)方面。
1.2.3 媒體因素
媒體,是網(wǎng)絡(luò)輿情傳播的渠道和手段,主要表示的是事件傳播與擴(kuò)散的態(tài)勢(shì)。網(wǎng)絡(luò)輿情媒體關(guān)注度與網(wǎng)民關(guān)注度的含義類(lèi)似,媒體關(guān)注度指的是媒體參與企業(yè)網(wǎng)絡(luò)輿情的程度。媒體在網(wǎng)絡(luò)環(huán)境中也是一個(gè)重要因素,李綱認(rèn)為輿情在進(jìn)入爆發(fā)期之后,會(huì)受到媒體相關(guān)因素的進(jìn)一步放大。信息化時(shí)代,許多輿情話(huà)題首先由媒體曝光出來(lái)的提供給網(wǎng)民,并且輿情的演化也往往隨著以媒體的信息披露而發(fā)展的。本文認(rèn)為媒體因素主要是媒體的關(guān)注度。
1.2.4 本體因素
本體指的是與企業(yè)相關(guān)網(wǎng)絡(luò)輿情事件的信息,包括輿情事件在網(wǎng)絡(luò)中傳播的文字、圖片、視頻等?;ヂ?lián)網(wǎng)時(shí)代,輿情事件以多種多樣的形式傳播,和單調(diào)的文字描述相比,以圖片和視頻為主的傳播形式讓信息變得更為直觀,更具有煽動(dòng)性。例如2018年,被某位網(wǎng)友曝光的一段拍攝了近20家五星級(jí)酒店衛(wèi)生混亂的視頻,直接影響了該行業(yè)的整個(gè)聲譽(yù)。網(wǎng)絡(luò)輿情本體作為輿情傳播的一種形式,對(duì)輿情事件危機(jī)等級(jí)的影響程度較大。本文認(rèn)為本體因素主要是輿情的傳播形式。
2.1.1 網(wǎng)絡(luò)輿情主體
網(wǎng)絡(luò)輿情主體對(duì)輿論的發(fā)展有著關(guān)鍵性的作用,通過(guò)網(wǎng)民情感傾向、關(guān)注度,企業(yè)參與度來(lái)進(jìn)行衡量。
(1)網(wǎng)民的情感傾向。
網(wǎng)民的情感傾向是指網(wǎng)民對(duì)輿情事件的態(tài)度,如贊成、中立、反對(duì)。這一指標(biāo)主要用負(fù)面微博占所有微博的比例來(lái)表示。比例越大,企業(yè)網(wǎng)絡(luò)輿情危機(jī)發(fā)生的可能性越大。
(2)網(wǎng)民的關(guān)注度。
關(guān)注度表示網(wǎng)民對(duì)某個(gè)輿情事件的關(guān)注程度,用輿情熱度來(lái)表示。網(wǎng)絡(luò)輿情熱度越高,就表明網(wǎng)民的關(guān)注度越強(qiáng)。本文采用原創(chuàng)微博發(fā)布量(O)、轉(zhuǎn)發(fā)量(A)、評(píng)論量(B)、點(diǎn)贊量(C)這4個(gè)指標(biāo)對(duì)輿情熱度進(jìn)行描述。
(3)企業(yè)參與度。
企業(yè)參與度就是企業(yè)相關(guān)人員在輿情事件發(fā)生后參與處理的程度。用來(lái)評(píng)判企業(yè)參與面廣不廣、程度深不深,采用專(zhuān)家打分法進(jìn)行賦值。企業(yè)參與程度越高,發(fā)生輿情危機(jī)的可能性就越小。
2.1.2 網(wǎng)絡(luò)輿情客體
網(wǎng)絡(luò)輿情的客體是觸發(fā)網(wǎng)絡(luò)輿情的刺激因素和網(wǎng)絡(luò)輿情的對(duì)象,直接導(dǎo)致了網(wǎng)絡(luò)輿情的發(fā)生和傳播。可以通過(guò)輿情信息的真實(shí)度和敏感度來(lái)進(jìn)行衡量。
(1)輿情真實(shí)度。
輿情真實(shí)度指的是與企業(yè)有關(guān)的輿情事件的真實(shí)程度,本文在該指標(biāo)的選取上采用定量分析的方法,主要通過(guò)某件企業(yè)輿情事件中微博認(rèn)證用戶(hù)占全部微博用戶(hù)的比率來(lái)確定。比率越大,說(shuō)明輿情信息的真實(shí)性越高。
(2)輿情敏感度。
輿情的敏感度可以直接影響輿情的未來(lái)發(fā)展。企業(yè)相關(guān)的網(wǎng)絡(luò)信息能夠引起網(wǎng)絡(luò)輿情的產(chǎn)生,輿情涉及敏感因素的程度作為輿情敏感度來(lái)衡量網(wǎng)絡(luò)輿情的可能發(fā)展情況。本文通過(guò)定性分析的方式來(lái)確定,輿情信息的敏感性越高,造成的危害越大,企業(yè)網(wǎng)絡(luò)輿情危機(jī)發(fā)生的可能性就越大。
2.1.3 網(wǎng)絡(luò)輿情媒體
和普通網(wǎng)民用戶(hù)傳遞的輿情信息質(zhì)量較低的特點(diǎn)相比,媒體的參與減弱了輿情信息的不確定性,從而使得企業(yè)產(chǎn)生輿情危機(jī)的可能性增強(qiáng),媒體的關(guān)注度通過(guò)媒體發(fā)布微博量來(lái)確定。
2.1.4 網(wǎng)絡(luò)輿情本體
本體是指網(wǎng)絡(luò)輿情在互聯(lián)網(wǎng)上傳播的圖片、文字和視頻。本體作為在網(wǎng)絡(luò)上傳播和發(fā)酵的一種輿情事件形式,對(duì)輿情事件的危機(jī)程度有較大的影響。網(wǎng)絡(luò)輿情本體表現(xiàn)為輿論傳播的形式,本文借鑒輿情熱度的計(jì)算公式來(lái)確定傳播形式的表達(dá)式。
前文對(duì)企業(yè)網(wǎng)絡(luò)輿情危機(jī)的影響因素進(jìn)行分析和量化處理,盡可能地以最少指標(biāo)達(dá)最優(yōu)預(yù)測(cè)目標(biāo)的準(zhǔn)則來(lái)選取,并進(jìn)行量化處理,構(gòu)建企業(yè)網(wǎng)絡(luò)輿情預(yù)警指標(biāo)體系見(jiàn)表1。
表1 企業(yè)網(wǎng)絡(luò)輿情預(yù)警指標(biāo)性質(zhì)和量化方法
2.3.1 基于K-均值聚類(lèi)的分級(jí)過(guò)程
K-均值聚類(lèi)算法屬于聚類(lèi)方法中的基于劃分的方法,是聚類(lèi)方法中最常用的方法之一。本文選擇K-means方法對(duì)企業(yè)網(wǎng)絡(luò)輿情事件危機(jī)等級(jí)分類(lèi)和分級(jí)。采用事件危機(jī)程度值為聚類(lèi)指標(biāo),通過(guò)信息熵計(jì)算各指標(biāo)權(quán)重,累加即得各個(gè)時(shí)間點(diǎn)的危機(jī)程度值。依據(jù)聚類(lèi)中心把各時(shí)刻輿情事件進(jìn)行歸類(lèi)、分級(jí)。
2.3.2 企業(yè)網(wǎng)絡(luò)輿情預(yù)警模型
本文采用支持向量機(jī)進(jìn)行企業(yè)網(wǎng)絡(luò)輿情危機(jī)預(yù)警模型的構(gòu)建。對(duì)于多分類(lèi)問(wèn)題,傳統(tǒng)的一對(duì)一算法將不能完成,可以間接的利用一對(duì)一,即采取一對(duì)多的算法(ovr),其主要原理是利用最大輸出法將多個(gè)SVM分類(lèi)器的輸出進(jìn)行組合,實(shí)現(xiàn)多類(lèi)分類(lèi)。SVM關(guān)鍵是選取核函數(shù)的類(lèi)型,主要有線(xiàn)性核函數(shù)、多項(xiàng)式核函數(shù)、RBF核和sigmoid核。
本文通過(guò)爬蟲(chóng)軟件、爬取微博平臺(tái)企業(yè)輿情事件數(shù)據(jù)。將“網(wǎng)易裁員”事件按照網(wǎng)絡(luò)監(jiān)測(cè)情況選取35個(gè)時(shí)間點(diǎn)的測(cè)試指標(biāo)數(shù)據(jù)作為樣本,起始時(shí)間為2019年11月23日,到12月5日基本平息。本文通過(guò)K-means方法評(píng)價(jià)輿情事件的預(yù)警等級(jí),最后通過(guò)比較不同核函數(shù)SVM來(lái)確定最優(yōu)的預(yù)警模型。對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理后,選取75%的樣本組合成訓(xùn)練集,25%組成測(cè)試集,以此驗(yàn)證支持向量機(jī)模型對(duì)網(wǎng)絡(luò)輿情預(yù)警識(shí)別的可行性。
由于不同指標(biāo),是通過(guò)對(duì)不同的數(shù)據(jù)進(jìn)行量化處理得到的,所以經(jīng)常會(huì)造成數(shù)據(jù)量綱差異較大,本文采用min-max變換對(duì)原始數(shù)據(jù)進(jìn)行無(wú)量綱化處理。
將數(shù)據(jù)集作為信息熵計(jì)算中的評(píng)價(jià)對(duì)象,原創(chuàng)微博量、轉(zhuǎn)發(fā)量、評(píng)論量和點(diǎn)贊量作為指標(biāo),進(jìn)行權(quán)重計(jì)算得到輿情熱度中權(quán)重分別為0.1417、0.2897、0.2695和0.2991。同理,計(jì)算得輿情傳播形式中含圖片微博數(shù)量占比和含視頻微博數(shù)量占比的權(quán)重為0.4311和0.568。
本文通過(guò)SPSS23.0完成K-均值聚類(lèi),得到該輿情事件不同時(shí)間段的分類(lèi)情況和與聚類(lèi)中心的距離情況。將“網(wǎng)易裁員”事件按照不同時(shí)間點(diǎn)的事件危機(jī)程度值分為安全、一般、警告、嚴(yán)重。通過(guò)K-means方法最終得到四個(gè)聚類(lèi)中心,安全的事件取值范圍為[0,0.09723],一般級(jí)別取值范圍[0.09723,0.22417],警告級(jí)別取值范圍[0.22417,0.59187],嚴(yán)重級(jí)別取值范圍[0.59187,1]。
本文采用python3.0中的LIBSVM工具箱建立企業(yè)網(wǎng)絡(luò)輿情危機(jī)預(yù)警模型。SVM模型類(lèi)型選用C-SVM,采用Grid Search調(diào)參來(lái)提高SVM預(yù)測(cè)的準(zhǔn)確度,在最優(yōu)參數(shù)的選擇中,K折交叉驗(yàn)證采用5折交叉驗(yàn)證法。
在未調(diào)參情況下,評(píng)分非常低,測(cè)試集精確度只有42.86%,調(diào)參后最佳C值為3,但是測(cè)試集精確度只有71.43%,說(shuō)明數(shù)據(jù)是線(xiàn)性不可分的,需要嘗試其它非線(xiàn)性核函數(shù),本文選擇應(yīng)用最廣泛的RBF核函數(shù)。在未調(diào)參的情況下,模型測(cè)試集的精確度是42.86%,調(diào)參后最佳C值為3,此時(shí)測(cè)試集的精確度達(dá)到100%。根據(jù)精確度可以看出,支持向量機(jī)在企業(yè)輿情預(yù)警方面比較適用,RBF核函數(shù)在企業(yè)輿情事件預(yù)警識(shí)別上效果更為理想。