臧振春, 李潔璐, 王美琦, 王娜娜
(1.周口師范學院 數(shù)學與統(tǒng)計學院,河南 周口 466001; 2.河南財經(jīng)政法大學 計算機與信息工程學院,河南 鄭州 450046; 3.河南財經(jīng)政法大學 河南經(jīng)濟研究中心,河南 鄭州 450046)
當前,網(wǎng)絡正能量在中國特色社會主義社會建設中逐漸被重視。何家華[1]將“網(wǎng)絡正能量”定義為通過互聯(lián)網(wǎng)工具和媒介所傳播的積極向上、富有正義、樂觀進取、感恩奉獻等具有感染力和號召力的精神和力量。胡江偉[2]指出有效傳播網(wǎng)絡正能量是主流媒體展示黨和政府執(zhí)政能力的一種途徑,也是媒體凝心聚力實現(xiàn)中國夢的重要方略。趙可金等[3]將正能量傳播與中美關系聯(lián)系在一起分析正能量對國家與外交的影響。孫莉等[4]通過分析正能量文字總結和諧語言類型,研究正確話語類型對網(wǎng)絡正能量傳播的意義。
針對猶豫模糊相似和推薦,學者們已有若干相關的研究成果。猶豫模糊相似的研究中,王森[5]等人將基于模糊評分的項目相似度與基于標簽隸屬度的項目相似度融合在一起形成新的項目相似度用于推薦。郭耿[6]提出一種基于改進模糊相似度的輿情演化規(guī)則,實驗得出模糊觀點的類型對輿情演化的周期與規(guī)模有影響的結論。胡悅[7]通過模糊神經(jīng)網(wǎng)絡和改進的粒子群優(yōu)化算法對模糊神經(jīng)網(wǎng)絡的參數(shù)進行優(yōu)化。Zhan等[8]使用一個向量來基于項目的特征在多個維度上測量用戶相似度,提高了推薦系統(tǒng)的預測精度。Qian[9]提出了一種基于二分網(wǎng)絡投影的概率猶豫模糊推薦決策方法。崔春生[10]從推薦系統(tǒng)中的推薦對象角度出發(fā)分析了用戶的興趣度指標及其取值方法。
本文針對網(wǎng)絡正能量的語言與傳統(tǒng)猶豫模糊評價性特點,結合這兩種屬性的評價因素,分別對不同屬性的評價因素的算子特點計算其熵值從而得到因素權值,再結合不同距離公式與評價專家組對網(wǎng)絡正能量的評價理想值計算備選網(wǎng)絡正能量推薦組與其的距離,從而得到兩者相似度,并根據(jù)不同相似值分級對備選事件進行推薦相關決策。在數(shù)值實驗中也表明了該方法具有良好的推薦效果。
定義1[11]定義A={
定義2[12]定義下標對稱的語言術語集為S={sp|p=-τ,…,-1,0,1,…,τ}。其中,τ為正整數(shù),s0表示中間性評估,其余的對稱分布在s0兩邊。s-τ和sτ為語言變量的上下界。則S滿足以下條件:
(1)如果α>β,則sα>sβ;
(2)存在否算子neg(sα)=s-α,特別地,neg(s0)=s0。
(1)EF(AS)=0,當且僅當?c∈C,r(hs(c))={0}或者r(hs(c))={1};
(2)EF(AS)=1,當且僅當?c∈C,r(hs(c))={0.5};
稱EF(AS)為語言猶豫模糊集AS的模糊熵。
g(s(l-a+1)(cg)))]
(1)
其中zg為正實數(shù),令fa:[0,1]×[0,1]→[0,1]滿足:
(1)?x,y∈[0,1],fa(1-x,1-y)=fa(y,x);
(2)fa(0,0)=0;
(1)E(h)=0當且僅當h={0}或h={1};
(2)E(h)=1,即h模糊性最高,當且僅當h={1/2};
(3)E(h)=E(hc);
定義5[18]假設A1和A2為同一屬性集的兩猶豫模糊集,A1和A2的距離測度記為d(A1,A2),則其滿足以下性質(zhì):
(1)0≤d(A1,A2)≤1;
(2)d(A1,A2)=0當且僅當A1=A2;
(3)d(A1,A2)=d(A2,A1);
由定義可知,
(2)
經(jīng)典的距離公式有Hamming距離和Euclidean距離,在此基礎上,又發(fā)展出了猶豫模糊Hausdorff距離公式,設wj為cj對應的權重:
(3)
猶豫模糊Hausdorff距離能夠較準確的對比兩兩猶豫模糊集的距離。
設待評價網(wǎng)絡事件集為A={a1,a2,…,ai,…,am},網(wǎng)絡正能量的猶豫模糊綜合評價屬性集為C={c1,c2,…,cj,…,cn},且集合中存在n1(n1 S={s-3=最低,s-2=一般低,s-1=稍低, s0=中,s1=稍高,s2=一般高,s3=最高} (4) 事件ai的各屬性歸屬猶豫模糊集可綜合記為Ai: (5) 在已有的關于數(shù)值猶豫模糊數(shù)據(jù)標準化的研究中,大多應用樂觀法則和悲觀法則兩種方法[18]。由于要推薦的用戶所要看的是網(wǎng)絡正能量的新聞,可認為此用戶為樂觀型用戶,本文中我們通過樂觀法則對數(shù)據(jù)進行標準化。 令初始猶豫模糊評價矩陣為H: (6) hS={s(1),s(2),…,s(l)} (7) 其語言猶豫模糊評價集為HS;再令Ai″,i=1,…,m中所有猶豫模糊元的最大長度為lmax,分別在滿足l hA*={γl(1),γl(2),…,γl(max)} (8) 其數(shù)值猶豫模糊評價集為HA″。 標準化后的評價矩陣記作M: (9) 設hS(cg)為語言猶豫模糊評價集中任一標準化后的猶豫模糊元,s(a)為語言猶豫模糊評價集hS中的語言術語元素,令語言猶豫模糊評價熵為: (10) 通過熵最小化原則,定義語言猶豫模糊評價屬性的熵權計算公式: (11) 設hA″(ct)為數(shù)值猶豫模糊評價集中任一標準化后的猶豫模糊元,γl(a)為數(shù)值猶豫模糊元hA″中的第a小的元素,經(jīng)定義4驗證,數(shù)值猶豫模糊評價熵公式為: [γl(a)e(1-γl(a))+(1-γl(a))eγl(a)-1] (12) 同理,數(shù)值猶豫模糊評價屬性熵權公式定義為: (13) 設語言猶豫模糊評價屬性權重集為: (14) 數(shù)值猶豫模糊評價屬性權重集為: W″={w″n1+1,…,wn″} (15) 則最終綜合屬性權重集為: W={w1,…,wn1,wn1+1,…,wn} (16) 其中,ɑ+β=1。一般地,ɑ=β=0.5。 首先通過Python獲取網(wǎng)絡正能量事件各屬性的猶豫模糊理想值,記作: (17) (18) 則相似度公式可定義為: (19) 設置相似度的分段標準E: E={<[0,0.4],不推薦>,<(0.4,0.8], 一般推薦>,<(0.8,1],優(yōu)先推薦>} (20) 易知,事件網(wǎng)絡正能量相關性排序為: 優(yōu)先推薦事件?一般推薦事件?不推薦事件 (21) 推薦算法綜合實現(xiàn)步驟如下: 步驟1經(jīng)咨詢專家和調(diào)研結果得到猶豫模糊語言評價集和數(shù)值評價集,規(guī)范語言術語集S形式并整合為初始猶豫模糊評價矩陣H,并分別標準化語言猶豫模糊集和數(shù)值猶豫模糊集得HS和HA″,規(guī)范化后的評價矩陣M; 步驟2分別計算語言猶豫模糊元的熵Eig(HS)和數(shù)值猶豫模糊元的熵Eit(HA″),依次計算不同屬性集的分權重集W′和W″; 步驟3計算屬性集的綜合權重集W; 步驟5定義各事件與理想值的相似度分段標準E,根據(jù)推薦閾值做不推薦,一般推薦或優(yōu)先推薦決策。 在日常生活中,人們生活中在手機中獲取的信息數(shù)不勝數(shù),由于人們對信息不敏感,所以如何在人們得到信息之前對信息進行篩選就成了首要問題,本文根據(jù)網(wǎng)絡正能量的特征將篩選網(wǎng)絡正能量的影響因素分為6點:c1:敏感煽動性,c2:政府可控性,c3:傳播途徑廣泛率,c4:評論互動率,c5:積極/消極的關鍵詞率,c6:涉及不同范圍詞率。其中,c1和c2為語言評價集,分別描述事件的傳播速率和政府管控程度,c3,c4,c5,c6為數(shù)值評價集,分別從傳播途徑效率,大眾關注度,直觀描述的正向性和關注人群分散度出發(fā)來對事件進行評價。在本節(jié)應用中,我們首先根據(jù)近期不同時段新聞選取八個熱點事件作為推薦備選方案,并由專家組分別對不同影響因素做出評價:事件A1:我國絕對貧困人口全部脫貧;事件A2:離婚冷靜期提議通過; 事件A3:民法典的誕生;事件A4:我國首支火星探測器“天問一號”抵達火星;事件A5:中印沖突;事件A6:中央督察組到地方車牌泄露;事件A7:“熟雞蛋返生”論文被下架;事件A8:嚴查偷稅漏稅。 步驟1經(jīng)調(diào)研與專家組評價集整合得初始猶豫模糊評價矩陣為: 利用公式(7)和(8)分別對語言猶豫模糊評價集和數(shù)據(jù)猶豫模糊評價集進行標準化,得到公式(9)形式的評價矩陣為: 步驟2根據(jù)公式(10)計算出語言猶豫模糊元的熵為: 同理,Ei2=1.99。 根據(jù)公式(12)計算出數(shù)值猶豫模糊元的熵為: 同理可求得其余猶豫模糊元熵值,E23=0.92,E33=0.82,E43=0.82等。 數(shù)值型猶豫模糊元的熵集可整合為: 根據(jù)公式(11)計算語言猶豫模糊集的不同屬性的分權重集 步驟3根據(jù)公式(16)可得綜合權重集W=0.5W′∪0.5W″={0.25,0.25,0.11,01.3,0.18,0.08}。 步驟4通過Python對熱點新聞進行整合處理,選出其中10個正能量新聞,收集專家對每個屬性的評分,得到標準化后的猶豫模糊集如表1所示。 表1 標準化的猶豫模糊評價集 選取正理想解作為正能量的猶豫模糊標準值,則: 用公式(18)計算出事件A1與專家評價網(wǎng)絡正能量理想值的距離為: =(0.25×02+0.25×0.22+0.11×0.042+0.13×0.22+0.18×0.152+0.08×0.282)=0.16 同理得: d(A,A8)=0.22 步驟5由公式(20)可知 優(yōu)先推薦事件為:A1 一般推薦事件為:A8,A3,A4,A7,A2,A5,A6 由公式(21)綜合相似度值,可以得出推薦順序為A1?{A8,A3}?A4?A7?A2?A5?A6 文章通過計算交叉熵確定屬性權重,根據(jù)距離確定每個事件的相似度來明確網(wǎng)絡正能量進行推薦,最后通過實例驗證及結果分析證明了模型有效性,即其存在良好的應用前景。但在模型建立過程中,評價因素僅考慮到了語言術語隸屬度和數(shù)值隸屬度,沒有考慮到存在其他數(shù)據(jù)集的情況,也缺少推薦對象的個體性分析,在未來研究中,將著重研究網(wǎng)絡正能量推薦中存在的多種數(shù)據(jù)集形式,并拓展研究適用于更多數(shù)據(jù)集的推薦算法。2.2 權重的確定
2.3 相似度計算
3 網(wǎng)絡正能量推薦實例
3.1 網(wǎng)絡正能量實例描述
3.2 推薦算法應用
4 結論與展望