• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于邏輯回歸的中文在線評(píng)論有效性檢測(cè)模型

    2015-06-09 20:18:34吳含前朱云杰
    關(guān)鍵詞:評(píng)論者主題詞分類

    吳含前 朱云杰 謝 玨

    (1東南大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院, 南京 210018)(2東南大學(xué)-蒙納士大學(xué)蘇州聯(lián)合研究生院, 蘇州 215123)

    ?

    基于邏輯回歸的中文在線評(píng)論有效性檢測(cè)模型

    吳含前1朱云杰1謝 玨2

    (1東南大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院, 南京 210018)(2東南大學(xué)-蒙納士大學(xué)蘇州聯(lián)合研究生院, 蘇州 215123)

    為了實(shí)現(xiàn)電子商務(wù)和社交網(wǎng)絡(luò)中文在線評(píng)論有效性的自動(dòng)化檢測(cè),提出了一種單一主題環(huán)境下基于邏輯回歸的垃圾評(píng)論檢測(cè)模型.中文在線評(píng)論有效性的檢測(cè)可以歸結(jié)為分類問題,結(jié)合中文在線評(píng)論的特點(diǎn)提取了9個(gè)特征以構(gòu)建分類模型;為獲取核心特征主題的相關(guān)度,采用基于關(guān)聯(lián)規(guī)則的評(píng)論名詞模式優(yōu)化了ICTCLAS中文分詞系統(tǒng)的主題識(shí)別,進(jìn)而利用交叉語言模型獲取在線評(píng)論主題相關(guān)度.實(shí)驗(yàn)中采取了人為標(biāo)定的1 000條評(píng)論作為樣本,把支持向量機(jī)分類模型作為對(duì)比進(jìn)行試驗(yàn),利用數(shù)據(jù)挖掘工具Weka進(jìn)行計(jì)算.結(jié)果表明,采用優(yōu)化評(píng)論名詞模式下基于邏輯回歸的垃圾評(píng)論檢測(cè)模型結(jié)果的準(zhǔn)確率達(dá)到83.54%,比支持向量機(jī)分類模型計(jì)算得到的準(zhǔn)確率高2.10%.

    在線評(píng)論有效性;邏輯回歸;關(guān)聯(lián)規(guī)則

    電子商務(wù)領(lǐng)域中,在線評(píng)論對(duì)網(wǎng)購用戶購買決策起著關(guān)鍵的影響作用.2013年中國(guó)網(wǎng)絡(luò)購物市場(chǎng)研究報(bào)告指出:直至2013年12月,國(guó)內(nèi)網(wǎng)購用戶達(dá)到3.02×109人,37.5%的用戶在購買不熟悉產(chǎn)品時(shí)主要考慮的是用戶評(píng)價(jià),其次為網(wǎng)站知名度和口碑[1].由于在線評(píng)論的好壞直接影響產(chǎn)品的銷售[2-3],電子商務(wù)網(wǎng)站中出現(xiàn)了大量誤導(dǎo)網(wǎng)購用戶的、具有惡意目的的評(píng)論;同時(shí),由于網(wǎng)購用戶規(guī)模巨大,在線評(píng)論數(shù)量的爆炸式遞增,增加了網(wǎng)購用戶識(shí)別評(píng)論有效性的難度.因此,如何實(shí)現(xiàn)在線評(píng)論有效性的自動(dòng)化識(shí)別成為了當(dāng)前學(xué)術(shù)界和工業(yè)界的研究熱點(diǎn).

    結(jié)合評(píng)論內(nèi)容及其評(píng)論發(fā)布者,研究者們從以下2個(gè)方面對(duì)評(píng)論的有效性展開研究:① 評(píng)論者異常行為的檢測(cè)[4-6],即通過研究評(píng)論者制造無效評(píng)論的方式和目的來發(fā)現(xiàn)無效評(píng)論者,從而識(shí)別無效評(píng)論;② 評(píng)論內(nèi)容的檢測(cè)[7-9],將評(píng)論有效性識(shí)別歸結(jié)為基于監(jiān)督學(xué)習(xí)的文本分類問題,通過構(gòu)建分類模型識(shí)別無效評(píng)論.針對(duì)基于評(píng)論者異常行為的檢測(cè),通常采取的方法包括:① 建立無效評(píng)論者檢測(cè)模型并對(duì)其打分[4],識(shí)別出無效評(píng)論制造者;② 采用關(guān)聯(lián)規(guī)則[5]發(fā)現(xiàn)異常評(píng)論模式并識(shí)別產(chǎn)生無效性評(píng)論行為,發(fā)現(xiàn)無效評(píng)論制造者.由于網(wǎng)站十分重視對(duì)評(píng)論者信息資源的保護(hù),在實(shí)際研究中難以完整獲取評(píng)論者的行為信息,故對(duì)實(shí)際評(píng)論者行為檢測(cè)的研究較為困難.基于評(píng)論內(nèi)容有效性的檢測(cè)是目前的研究重點(diǎn),最初工作可以追溯到Jindal等[7]對(duì)亞馬遜網(wǎng)站2.14×106位用戶編寫的5.8×106條英文評(píng)論中無效評(píng)論檢測(cè)的研究,給出了無效評(píng)論的定義,從評(píng)論內(nèi)容出發(fā)把無效評(píng)論劃分為不真實(shí)評(píng)論、僅針對(duì)品牌的評(píng)論以及無關(guān)評(píng)論3種類型,通過重復(fù)評(píng)論的檢測(cè)來識(shí)別不真實(shí)評(píng)論,并建立分類模型用于判別僅針對(duì)品牌的評(píng)論及無關(guān)評(píng)論.由于語言的差異性,這種基于英文評(píng)論的有效性檢測(cè)結(jié)果難以適用于在線中文評(píng)論的處理.

    本文研究了單一主題環(huán)境下中文在線評(píng)論有效性的檢測(cè)問題.首先,結(jié)合中文評(píng)論特點(diǎn),提取9個(gè)特征構(gòu)建了分類模型;然后,針對(duì)ICTCLAS中文分詞系統(tǒng)內(nèi)置名稱模式在單一主題中文評(píng)論環(huán)境下識(shí)別主題詞準(zhǔn)確度不高的問題,提出了一種具有更高精度的基于關(guān)聯(lián)規(guī)則的評(píng)論名詞模式,并采用交叉語言模型來判斷評(píng)論名詞與主題的相關(guān)度;最后,利用邏輯回歸分類模型來檢測(cè)中文在線評(píng)論的有效性.實(shí)驗(yàn)結(jié)果表明,該模型在中文在線評(píng)論的有效性檢測(cè)中能夠得到較高的檢測(cè)準(zhǔn)確率.

    1 評(píng)論有效性檢測(cè)分類模型

    1.1 邏輯回歸分類模型

    評(píng)論有效性檢測(cè)是一種典型的二值分類問題,通常利用分類模型進(jìn)行研究.分類模型是通過對(duì)已知類別數(shù)據(jù)集進(jìn)行學(xué)習(xí),構(gòu)造分類器來預(yù)測(cè)新數(shù)據(jù)的類別.數(shù)據(jù)集由特征值和類別組成,單條數(shù)據(jù)格式的表達(dá)式為{f1,f2,…,fn;y},其中,fj為特征值,y為類別.分類器可以采用邏輯回歸分類模型或者支持向量機(jī)分類模型來構(gòu)造.

    邏輯回歸分類模型可以描述為

    (1)

    式中,hθ(x)為預(yù)測(cè)值;x為分類模型特征向量;θ為特征向量系數(shù).

    邏輯回歸分類模型是基于最大似然估計(jì)來計(jì)算對(duì)應(yīng)特征向量系數(shù)的,即

    (2)

    (3)

    由式(2)和(3)可得

    (4)

    最大似然估計(jì)為

    (5)

    基于邏輯回歸分類模型求解的關(guān)鍵是確定特征向量系數(shù).因此,針對(duì)中文在線評(píng)論有效的檢測(cè)需要結(jié)合中文評(píng)論內(nèi)容的特點(diǎn)來提取相應(yīng)的特征向量.

    1.2 評(píng)論內(nèi)容特征提取

    Jindal等[7]在關(guān)于英文在線評(píng)論有效性的研究中,基于評(píng)論、評(píng)論者和評(píng)論對(duì)象提取了36個(gè)評(píng)論特征,其中包括了針對(duì)評(píng)論文本內(nèi)容的7個(gè)特征,即評(píng)論正向情感詞、評(píng)論負(fù)向情感詞、評(píng)論與產(chǎn)品特性的相似度、品牌名個(gè)數(shù)、數(shù)字個(gè)數(shù)、大寫個(gè)數(shù)和由大寫構(gòu)成的單詞個(gè)數(shù).由于語言的差異性,上述7個(gè)特征只有評(píng)論正向情感詞和評(píng)論負(fù)向情感詞適用于中文評(píng)論.評(píng)論具有主觀性,應(yīng)包含評(píng)論者的情緒;如果評(píng)論中沒有情感特征,則為客觀表述,應(yīng)被判別為無效評(píng)論.針對(duì)中文在線評(píng)論,本文通過獲取評(píng)論中的顯式情感詞[10]與中文情感詞庫[11]來判別評(píng)論的情感特征,從而獲取評(píng)論正向情感度和評(píng)論負(fù)向情感度,即評(píng)論中包含贊揚(yáng)產(chǎn)品的形容詞個(gè)數(shù)與貶低產(chǎn)品的形容詞個(gè)數(shù).

    本文將評(píng)論主題相關(guān)度作為評(píng)論特征,以量化中文在線評(píng)論與評(píng)論主題之間的相關(guān)程度.

    常規(guī)評(píng)論由評(píng)論對(duì)象和評(píng)論者態(tài)度構(gòu)成,應(yīng)具備一定的長(zhǎng)度.而現(xiàn)實(shí)的在線評(píng)論網(wǎng)站上,評(píng)論中往往只具備評(píng)論者態(tài)度而無評(píng)論對(duì)象.無效評(píng)論制造者為吸引人們的注意力,往往會(huì)編寫較長(zhǎng)的評(píng)論.因此,本文采用評(píng)論文本長(zhǎng)度作為評(píng)論特征向量之一,評(píng)論文本長(zhǎng)度即中文在線評(píng)論文本包含的字?jǐn)?shù).

    基于對(duì)實(shí)際評(píng)論的觀察和研究發(fā)現(xiàn),中文文本注重采用整齊的、排比的句型,多采用短句,評(píng)論者在編寫評(píng)論時(shí),必定會(huì)合理使用標(biāo)點(diǎn)符號(hào).而垃圾評(píng)論制造者在編寫沒有主題的評(píng)論時(shí),為快速表達(dá)出自己的想法和意愿,會(huì)產(chǎn)生不使用或?yàn)E用標(biāo)點(diǎn)符號(hào)的情況.因此,本文采用評(píng)論標(biāo)點(diǎn)數(shù)量和評(píng)論標(biāo)點(diǎn)符號(hào)差異數(shù)量作為評(píng)論特征向量,其中評(píng)論標(biāo)點(diǎn)數(shù)量是指評(píng)論中標(biāo)點(diǎn)符號(hào)的總個(gè)數(shù),評(píng)論標(biāo)點(diǎn)符號(hào)差異數(shù)量是指評(píng)論中標(biāo)點(diǎn)符號(hào)類型的個(gè)數(shù).

    同時(shí),本文還引入了Bhattarai等[12]檢測(cè)博客空間中垃圾評(píng)論使用的3個(gè)特征向量:評(píng)論詞重復(fù)率(即中文在線評(píng)論中重復(fù)的中文字出現(xiàn)的比例)、評(píng)論名詞率(即評(píng)論詞性標(biāo)注之后名詞所占的比例)和評(píng)論句子數(shù)量(即在線評(píng)論文本中句子的個(gè)數(shù)).

    基于上述分析,針對(duì)中文在線垃圾評(píng)論檢測(cè),本文共提取了9個(gè)評(píng)論內(nèi)容特征:評(píng)論正向情感度、評(píng)論負(fù)向情感度、評(píng)論主題相關(guān)度、評(píng)論文本長(zhǎng)度、評(píng)論標(biāo)點(diǎn)數(shù)量、評(píng)論標(biāo)點(diǎn)符號(hào)差異數(shù)量、評(píng)論詞重復(fù)率、評(píng)論名詞率以及評(píng)論句子數(shù)量.其中,評(píng)論主題相關(guān)度的處理最為關(guān)鍵和復(fù)雜.

    2 評(píng)論主題相關(guān)度

    2.1 評(píng)論主題詞的提取

    評(píng)論主題詞往往采用名詞來表示.目前,評(píng)論主題詞獲取的常用方式是通過中文分詞系統(tǒng)對(duì)評(píng)論進(jìn)行分詞、詞性標(biāo)注處理,然后提取分詞系統(tǒng)中內(nèi)置名詞模式標(biāo)示的名詞.ICTCLAS是我國(guó)最具代表性的中文分詞系統(tǒng),其包含中文分詞和詞性標(biāo)注的功能,分詞準(zhǔn)確率達(dá)到98.45%.ICTCLAS考慮了文本的通用性,沒有針對(duì)評(píng)論的特殊處理方式,因此很多評(píng)論主題詞無法被ICTCLAS內(nèi)置名詞模式標(biāo)示.

    以電影《速度與激情6》影評(píng)中的一條評(píng)論為例:“這個(gè)系列的任何一部,一點(diǎn)劇情都記不住.”該評(píng)論中出現(xiàn)的主題詞包括 “系列”、“一部”和“劇情”.通過ICTCLAS處理之后,評(píng)論顯示為:“這個(gè)/rz系列/n的/ude1 任何/rz一/m部/q,/wd一點(diǎn)/m劇情/n都/d記/v不/d住/vi./wj”.在這條評(píng)論中,評(píng)論主題詞 “一部”沒有被標(biāo)示出.考慮到相鄰2個(gè)詞性標(biāo)注的組合關(guān)系可以歸結(jié)為有序關(guān)聯(lián)規(guī)則問題,因此,本文采用一種改進(jìn)的Apriori算法以獲取評(píng)論名詞模式,從而在實(shí)際中提高中文評(píng)論主題詞的獲取精度.

    本文采用關(guān)聯(lián)規(guī)則[13]來尋找具有最小支持度的評(píng)論名詞模式.通過關(guān)聯(lián)規(guī)則可從大量數(shù)據(jù)中發(fā)現(xiàn)數(shù)據(jù)項(xiàng)之間的相關(guān)關(guān)系,其規(guī)則形式可以表示為

    X→Y

    式中,X,Y為數(shù)據(jù)集中的非空子集.支持度是關(guān)聯(lián)規(guī)則計(jì)算中的一個(gè)主要指標(biāo),即所計(jì)算的關(guān)聯(lián)規(guī)則模式必須滿足預(yù)先設(shè)置的最小支持度.最小支持度計(jì)算數(shù)學(xué)表達(dá)式為

    (6)

    式中,c為非空子集X和Y同時(shí)出現(xiàn)的次數(shù);n為數(shù)據(jù)集中記錄總數(shù).

    評(píng)論名詞模式是一種通過相鄰詞性標(biāo)注組合關(guān)系得到的名詞模式.本文首先采用ICTCLAS中文分詞系統(tǒng)對(duì)評(píng)論集進(jìn)行詞性標(biāo)注,然后采用Apriori算法獲取評(píng)論名詞模式.在Apriori算法中,主要采用以下步驟尋找關(guān)聯(lián)規(guī)則:① 生成任意2個(gè)非空子集(如X和Y)的并集,若其在所有數(shù)據(jù)集空間中出現(xiàn)的次數(shù)超過用戶預(yù)先指定的值,則把該并集歸類到頻繁集中;② 根據(jù)頻繁集生成關(guān)聯(lián)規(guī)則.由于評(píng)論名詞模式主要尋找相鄰詞性標(biāo)注的組合關(guān)系,采用Apriori算法在頻繁集生成過程中會(huì)產(chǎn)生大量的組合,這將導(dǎo)致Apriori算法性能下降.為此,本文對(duì)Apriori算法進(jìn)行了如下修改:① 將數(shù)據(jù)集合中各詞性標(biāo)注實(shí)現(xiàn)有序排列;② 頻繁集由相鄰詞性標(biāo)注構(gòu)成.由此便可有效降低頻繁集生成規(guī)模,從而提高Apriori算法效率.

    2.2 評(píng)論主題相關(guān)識(shí)別

    獲取評(píng)論主題詞后,需要判斷這些主題詞與評(píng)論主題的相關(guān)度,可用Zhai等[14]提出的交叉語言模型來判斷名詞與主題之間的關(guān)系.該模型假定一個(gè)文檔是由一個(gè)目標(biāo)短語向量和一個(gè)資料庫短語向量構(gòu)成的,即

    θ1=αθcorpus+βθquery

    (7)

    式中,θ1為從評(píng)論集合中獲取的名詞向量;θcorpus為資料庫名詞向量;θquery為與主題相關(guān)的名詞向量;α,β分別為對(duì)應(yīng)于θcorpus,θquery的系數(shù),且α+β=1.

    Zhang等[15]利用時(shí)間復(fù)雜度為O(klog(k))的算法來獲取交叉語言模型中的θ.交叉語言模型的簡(jiǎn)單表述為

    r=αp+βq

    (8)

    式中,r,p和q均為多維向量.

    為計(jì)算q,先假設(shè)fi,pi分別為r,p中第i個(gè)詞出現(xiàn)的頻度.計(jì)算步驟如下:

    ① 計(jì)算pi/fi,按照從大到小的方式排列,結(jié)果為f1/p1>f2/p3>…>fk/pk.

    ③ 計(jì)算得到

    將計(jì)算結(jié)果大于0的qi組成θquery,評(píng)論主題相關(guān)度可以通過計(jì)算單條評(píng)論中評(píng)論主題詞在θquery中的個(gè)數(shù)獲得.

    3 實(shí)驗(yàn)結(jié)果與分析

    本文以電影《速度與激情6》的影評(píng)為目標(biāo)評(píng)論對(duì)象進(jìn)行實(shí)驗(yàn).首先,選取1 000條影評(píng),讓5位研究生(編號(hào)為S1~S5)對(duì)其進(jìn)行人工標(biāo)示,將無效評(píng)論記為1,有效評(píng)論記為0;然后,將標(biāo)示結(jié)果求和后取平均值,當(dāng)平均值大于0.5時(shí)視為無效評(píng)論,反之則為有效評(píng)論.5位研究生對(duì)1 000條影評(píng)做出的有效評(píng)論和無效評(píng)論統(tǒng)計(jì)數(shù)量結(jié)果見表1.

    表1 評(píng)論樣本人工標(biāo)示的統(tǒng)計(jì)數(shù)量結(jié)果

    為了獲取評(píng)論主題相關(guān)度和評(píng)論情感分析,在將評(píng)論文本轉(zhuǎn)換為評(píng)論文本特征向量的過程中需要對(duì)評(píng)論進(jìn)行預(yù)處理.首先,構(gòu)建中文情感詞庫,根據(jù)該詞庫來判斷評(píng)論文本中形容詞的詞性.然后,利用時(shí)間復(fù)雜度為O(klog(k))的算法來建立評(píng)論主題詞庫,從而獲取評(píng)論主題相關(guān)度.除評(píng)論主題相關(guān)度和評(píng)論情感分析外,其他特征向量值都能直接從評(píng)論文本中獲取.

    本文采用支持向量機(jī)分類模型作為對(duì)比,驗(yàn)證基于邏輯回歸垃圾評(píng)論檢測(cè)模型的有效性.同時(shí),為了驗(yàn)證評(píng)論名詞模式在垃圾評(píng)論檢測(cè)中的效果,將ICTCLAS中文分詞系統(tǒng)的內(nèi)置名詞模式作為對(duì)比進(jìn)行實(shí)驗(yàn).實(shí)驗(yàn)共分5次進(jìn)行,每次對(duì)1 000條樣本評(píng)論進(jìn)行隨機(jī)排列,計(jì)算時(shí)采用開源的數(shù)據(jù)挖掘工具Weka,并利用基于十折交叉驗(yàn)證法來獲取垃圾評(píng)論檢測(cè)模型的準(zhǔn)確性.給定樣本評(píng)論的有效性檢測(cè)準(zhǔn)確率結(jié)果見表2.

    表2 樣本評(píng)論的有效性檢測(cè)準(zhǔn)確率 %

    由表2可知,采用本文提出的評(píng)論名詞模式較采用ICTCLAS中文分詞系統(tǒng)的內(nèi)置名詞模式在計(jì)算垃圾評(píng)論檢測(cè)模型時(shí)具有更高的準(zhǔn)確率.在4種情況的對(duì)比試驗(yàn)中,采用評(píng)論名詞模式下基于邏輯回歸的垃圾評(píng)論檢測(cè)模型準(zhǔn)確率(83.54%)最高,比支持向量機(jī)分類模型計(jì)算得到的準(zhǔn)確率高2.10%.

    4 結(jié)語

    目前國(guó)外學(xué)術(shù)界關(guān)于在線評(píng)論有效性的研究對(duì)象大都采用英文評(píng)論,由于語言的差異性,相關(guān)英文在線評(píng)論有效性檢測(cè)的研究成果難以推廣到中文評(píng)論的有效性檢測(cè)中.本文研究了單一主題環(huán)境下中文在線評(píng)論有效性的檢測(cè)問題.結(jié)合中文評(píng)論特點(diǎn),從評(píng)論文本內(nèi)容中提取9個(gè)特征向量來構(gòu)建邏輯回歸分類模型;針對(duì)核心特征向量評(píng)論主題相關(guān)度的研究過程中,利用一種改進(jìn)的Apriori算法來獲取評(píng)論名詞模式,從而提高了中文評(píng)論主題詞的識(shí)別精度,并基于交叉語言模型計(jì)算評(píng)論名詞與主題的相關(guān)度.實(shí)驗(yàn)結(jié)果表明,基于邏輯回歸的中文在線評(píng)論有效性檢測(cè)模型在評(píng)論有效性檢測(cè)中表現(xiàn)出較高的檢測(cè)準(zhǔn)確率.

    References)

    [1]中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心. 2013年中國(guó)網(wǎng)絡(luò)購物市場(chǎng)研究報(bào)告[EB/OL]. (2014-04-21)[2014-10-20]. http://www.cnnic.cn/hlwfzyj/hlwxzbg/dzswbg/201404/t20140421_46598.htm.

    [2]Karkare V Y, Gupta S R. A survey on product evaluation using opinion mining [J].InternationalJournalofComputerScienceandApplications, 2013, 6(2): 306-312.

    [3]Sheibani A A. Opinion mining and opinion spam: a literature review focusing on product reviews[C]//2012SixthInternationalSymposiumonTelecommunications(IST). Tehran, Iran, 2012: 1109-1113.

    [4]Lim E P, Nguyen V A, Jindal N, et al. Detecting product review spammers using rating behaviors[C]//Proceedingsofthe19thACMInternationalConferenceonInformationandKnowledgeManagement. New York, USA, 2010: 939-948.

    [5]Jindal N, Liu B, Lim E P. Finding unusual review patterns using unexpected rules[C]//Proceedingsofthe19thACMInternationalConferenceonInformationandKnowledgeManagement. New York, USA, 2010: 1549-1552.

    [6]Mukherjee A, Kumar A, Liu B, et al. Spotting opinion spammers using behavioral footprints[C]//Proceedingsofthe19thACMSIGKDDInternationalConferenceonKnowledgeDiscoveryandDataMining. New York, USA, 2013: 632-640.

    [7]Jindal N, Liu B. Opinion spam and analysis[C]//Proceedingsofthe2008InternationalConferenceonWebSearchandDataMining. New York, USA, 2008: 219-230.

    [8]Ott M, Cardie C, Hancock J T. Negative deceptive opinion spam[C]//NorthAmericanChapteroftheAssociationforComputationalLinguistics-HumanLanguageTechnologies. Atlanta, Georgia, 2013: 497-501.

    [9]Lin Y, Zhu T, Wang X, et al. Towards online review spam detection[C]//ProceedingsoftheCompanionPublicationofthe23rdInternationalConferenceonWorldWideWebCompanion. New York, USA, 2014: 341-342.

    [10]Liu B. Sentiment analysis and opinion mining [J].SynthesisLecturesonHumanLanguageTechnologies, 2012, 5(1): 1-167.

    [11]徐琳宏,林鴻飛,潘宇,等.情感詞匯本體的構(gòu)造[J].情報(bào)學(xué)報(bào),2008,27(2):180-185. Xu Linhong, Lin Hongfei, Pan Yu, et al. Constructing the affective lexicon ontology [J].JournaloftheChinaSocietyforScientificandTechnicalInformation, 2008, 27(2): 180-185. (in Chinese)

    [12]Bhattarai A, Rus V, Dasgupta D. Characterizing comment spam in the blogosphere through content analysis[C]//2009IEEESymposiumonComputationalIntelligenceinCyberSecurity. Nashville, TN, USA, 2009: 37-44.

    [13]AL-Zawaidah F H, Jbara Y H, Abu-Zanona M A. An improved algorithm for mining association rules in large databases [J].WorldofComputerScienceandInformationTechnology, 2011, 1(7): 311-316.

    [14]Zhai C, Lafferty J. Model-based feedback in the language modeling approach to information retrieval[C]//ProceedingsoftheTenthInternationalConferenceonInformationandKnowledgeManagement. New York, USA, 2001: 403-410.

    [15]Zhang Y, Xu W. Fast exact maximum likelihood estimation for mixture of language model[J].InformationProcessing&Management, 2008, 44(3): 1076-1085.

    Detection model of effectiveness of Chinese online reviews based on logistic regression

    Wu Hanqian1Zhu Yunjie1Xie Jue2

    (1School of Computer Science and Engineering, Southeast University, Nanjing 210018, China) (2Southeast University-Monash University Joint Graduate School, Suzhou 215123, China)

    In order to realize automated detection of the effectiveness of Chinese online reviews in the context of e-commerce and social networks, a spam detection model based on logistic regression to solve single topic classification problem is proposed. The detection of effectiveness of Chinese online reviews can be regarded as a classification problem. According to the characteristics of Chinese online reviews, nine features are extracted to build the classification model. In order to extract the core feature-topic relevance, an association rule based review term mode is utilized to optimize the topics identification in ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System). The cross language model is then used to retrieve relevancy between online review topics. In the experiment, a sample of 1 000 human-labeled reviews is used, and the support vector machine (SVM) classification model is adopted as a comparison. The calculation results of the data mining tool Weka demonstrate that the accuracy rate of the proposed logistic regression classification model based on the optimized review term classification mode is 83.54%, which is 2.10% higher than that of the SVM classification model.

    effectiveness of online review; logistic regression; association rule

    10.3969/j.issn.1001-0505.2015.03.004

    2014-12-05. 作者簡(jiǎn)介: 吳含前(1972—),男,博士,副教授,hanqian@seu.edu.cn.

    國(guó)家自然科學(xué)基金資助項(xiàng)目(60803057)、國(guó)家高技術(shù)研究發(fā)展計(jì)劃(863計(jì)劃)資助項(xiàng)目(2015AA015904).

    吳含前,朱云杰,謝玨.基于邏輯回歸的中文在線評(píng)論有效性檢測(cè)模型[J].東南大學(xué)學(xué)報(bào):自然科學(xué)版,2015,45(3):433-437.

    10.3969/j.issn.1001-0505.2015.03.004

    P315.69

    A

    1001-0505(2015)03-0433-05

    猜你喜歡
    評(píng)論者主題詞分類
    智珠2則
    分類算一算
    分類討論求坐標(biāo)
    基于D-S證據(jù)理論的電子商務(wù)虛假評(píng)論者檢測(cè)
    數(shù)據(jù)分析中的分類討論
    教你一招:數(shù)的分類
    基于情感特征和用戶關(guān)系的虛假評(píng)論者的識(shí)別
    基于評(píng)論關(guān)系圖的垃圾評(píng)論者檢測(cè)研究
    我校學(xué)報(bào)第32卷第5期(2014年10月)平均每篇有3.04個(gè)21世紀(jì)的Ei主題詞
    我校學(xué)報(bào)第32卷第6期(2014年12月)平均每篇有3.00個(gè)21世紀(jì)的Ei主題詞
    亚洲成人久久爱视频| 国产精品一区二区精品视频观看| 看片在线看免费视频| 色播亚洲综合网| 少妇裸体淫交视频免费看高清| 久久久国产精品麻豆| 长腿黑丝高跟| 久久中文字幕一级| 少妇裸体淫交视频免费看高清| 啪啪无遮挡十八禁网站| cao死你这个sao货| 欧美黑人巨大hd| 免费观看的影片在线观看| 午夜精品久久久久久毛片777| 三级毛片av免费| 色av中文字幕| 国内精品一区二区在线观看| 欧美日韩综合久久久久久 | 在线观看免费视频日本深夜| 亚洲色图av天堂| 国语自产精品视频在线第100页| 国产99白浆流出| 人人妻,人人澡人人爽秒播| 91字幕亚洲| 国产精品综合久久久久久久免费| 日本免费一区二区三区高清不卡| 国内精品美女久久久久久| 嫩草影视91久久| 日本与韩国留学比较| 午夜福利免费观看在线| 国产麻豆成人av免费视频| 久久人妻av系列| 国产亚洲av高清不卡| 国产主播在线观看一区二区| 最近最新中文字幕大全免费视频| 亚洲精品456在线播放app | 黄色日韩在线| 国产亚洲av嫩草精品影院| 中亚洲国语对白在线视频| 久久天躁狠狠躁夜夜2o2o| 性色avwww在线观看| 黄色片一级片一级黄色片| aaaaa片日本免费| 免费看日本二区| 亚洲欧洲精品一区二区精品久久久| 中文字幕最新亚洲高清| 国产 一区 欧美 日韩| 啦啦啦观看免费观看视频高清| 久久久精品大字幕| 真人做人爱边吃奶动态| 久久精品亚洲精品国产色婷小说| 亚洲欧美日韩东京热| 日韩中文字幕欧美一区二区| 国产一级毛片七仙女欲春2| 色在线成人网| 天堂√8在线中文| 99久久无色码亚洲精品果冻| 男插女下体视频免费在线播放| 精品一区二区三区四区五区乱码| av片东京热男人的天堂| 99久久综合精品五月天人人| xxx96com| 欧美乱色亚洲激情| 国产午夜福利久久久久久| 18禁黄网站禁片免费观看直播| 欧美黄色片欧美黄色片| 1024手机看黄色片| 丁香六月欧美| 国产精品影院久久| 制服丝袜大香蕉在线| 国产69精品久久久久777片 | 久久久国产精品麻豆| 国产成人av教育| 午夜日韩欧美国产| 午夜免费成人在线视频| 国内毛片毛片毛片毛片毛片| 国产v大片淫在线免费观看| 两性午夜刺激爽爽歪歪视频在线观看| 久久人人精品亚洲av| 久久中文字幕一级| 婷婷丁香在线五月| 黄色成人免费大全| 亚洲18禁久久av| 国产高清有码在线观看视频| 午夜福利视频1000在线观看| 首页视频小说图片口味搜索| 首页视频小说图片口味搜索| 久久久水蜜桃国产精品网| 亚洲中文av在线| 欧美zozozo另类| 午夜免费激情av| 久久久久国内视频| 99精品久久久久人妻精品| 欧美日韩福利视频一区二区| 97超级碰碰碰精品色视频在线观看| 亚洲人与动物交配视频| av片东京热男人的天堂| 精品久久蜜臀av无| 精品国产乱子伦一区二区三区| 久久久久免费精品人妻一区二区| 在线观看66精品国产| 日本五十路高清| 亚洲国产欧洲综合997久久,| 69av精品久久久久久| 毛片女人毛片| 成人性生交大片免费视频hd| 1024手机看黄色片| 久久这里只有精品19| 麻豆成人午夜福利视频| 在线观看日韩欧美| 成人鲁丝片一二三区免费| 亚洲男人的天堂狠狠| 天堂av国产一区二区熟女人妻| 岛国在线观看网站| 一个人看的www免费观看视频| 亚洲午夜理论影院| 天堂影院成人在线观看| 精品国内亚洲2022精品成人| 成人永久免费在线观看视频| 一区二区三区激情视频| 女人高潮潮喷娇喘18禁视频| 亚洲片人在线观看| 日本免费a在线| 两性夫妻黄色片| 美女 人体艺术 gogo| 久99久视频精品免费| 国产真实乱freesex| 国产单亲对白刺激| 99热这里只有精品一区 | 国产成人一区二区三区免费视频网站| 亚洲成人精品中文字幕电影| 男人舔奶头视频| 搡老岳熟女国产| 色综合亚洲欧美另类图片| 国产精品av久久久久免费| 老司机午夜十八禁免费视频| 国产伦在线观看视频一区| 亚洲乱码一区二区免费版| 国产黄色小视频在线观看| 中出人妻视频一区二区| 成人国产综合亚洲| 色综合亚洲欧美另类图片| 嫁个100分男人电影在线观看| 国产 一区 欧美 日韩| 动漫黄色视频在线观看| 十八禁网站免费在线| 精品一区二区三区视频在线 | 日韩欧美在线二视频| 在线观看66精品国产| 黄片小视频在线播放| 欧美乱妇无乱码| 两个人看的免费小视频| 午夜视频精品福利| 成在线人永久免费视频| 成人三级做爰电影| 欧美激情久久久久久爽电影| 日韩欧美一区二区三区在线观看| 亚洲精华国产精华精| 日本三级黄在线观看| 色综合站精品国产| 久久国产精品影院| 麻豆久久精品国产亚洲av| 亚洲精品美女久久久久99蜜臀| 成人午夜高清在线视频| 亚洲国产精品久久男人天堂| 国产精品一区二区精品视频观看| 少妇人妻一区二区三区视频| 久久中文字幕一级| 国内精品久久久久久久电影| 人人妻人人看人人澡| 日韩欧美 国产精品| 99精品欧美一区二区三区四区| 99久久无色码亚洲精品果冻| 熟女人妻精品中文字幕| 亚洲avbb在线观看| 欧美丝袜亚洲另类 | 小蜜桃在线观看免费完整版高清| 人人妻,人人澡人人爽秒播| 亚洲欧美一区二区三区黑人| 国产成人av激情在线播放| 最好的美女福利视频网| 十八禁人妻一区二区| 久久久久久久久中文| www日本黄色视频网| 日本一二三区视频观看| 欧美绝顶高潮抽搐喷水| 中文字幕人妻丝袜一区二区| 久久草成人影院| 精品国产亚洲在线| 国内毛片毛片毛片毛片毛片| 色视频www国产| 国产午夜精品论理片| 午夜免费成人在线视频| 成在线人永久免费视频| a级毛片在线看网站| 天堂√8在线中文| 母亲3免费完整高清在线观看| 国产精品美女特级片免费视频播放器 | 黄频高清免费视频| 午夜久久久久精精品| www.自偷自拍.com| a级毛片在线看网站| 波多野结衣巨乳人妻| avwww免费| 麻豆国产av国片精品| 在线十欧美十亚洲十日本专区| 色吧在线观看| 免费在线观看亚洲国产| 国产精品久久久久久久电影 | 三级毛片av免费| 网址你懂的国产日韩在线| 亚洲中文av在线| 欧洲精品卡2卡3卡4卡5卡区| 国产av在哪里看| 一边摸一边抽搐一进一小说| 国产亚洲精品一区二区www| 他把我摸到了高潮在线观看| 欧美色欧美亚洲另类二区| 婷婷亚洲欧美| 久久精品综合一区二区三区| www.熟女人妻精品国产| 在线视频色国产色| 亚洲国产色片| 国产视频一区二区在线看| 成在线人永久免费视频| 精品久久久久久久久久免费视频| 国产又色又爽无遮挡免费看| 国产成人一区二区三区免费视频网站| 国语自产精品视频在线第100页| 国产黄a三级三级三级人| 亚洲男人的天堂狠狠| 国产乱人视频| 免费看十八禁软件| 亚洲最大成人中文| 国产黄a三级三级三级人| 蜜桃久久精品国产亚洲av| 午夜福利高清视频| 丝袜人妻中文字幕| 天天一区二区日本电影三级| 90打野战视频偷拍视频| 最近最新中文字幕大全电影3| av中文乱码字幕在线| 丝袜人妻中文字幕| 成人高潮视频无遮挡免费网站| 一二三四社区在线视频社区8| 久久精品国产99精品国产亚洲性色| 三级男女做爰猛烈吃奶摸视频| 午夜福利免费观看在线| 亚洲欧美日韩高清在线视频| 九九久久精品国产亚洲av麻豆 | 亚洲电影在线观看av| 国产黄色小视频在线观看| 日日夜夜操网爽| 精品国产三级普通话版| e午夜精品久久久久久久| 不卡一级毛片| 亚洲国产精品成人综合色| 亚洲欧洲精品一区二区精品久久久| 午夜福利成人在线免费观看| 午夜精品久久久久久毛片777| 制服人妻中文乱码| 国产精品久久久久久久电影 | 国产精品98久久久久久宅男小说| 亚洲av美国av| 麻豆国产av国片精品| 亚洲一区高清亚洲精品| 老司机深夜福利视频在线观看| 亚洲自拍偷在线| 男人的好看免费观看在线视频| 国产1区2区3区精品| 国产三级中文精品| 香蕉av资源在线| 这个男人来自地球电影免费观看| 在线看三级毛片| 久久久精品大字幕| 我的老师免费观看完整版| 中文字幕人妻丝袜一区二区| 国产麻豆成人av免费视频| 久久久久免费精品人妻一区二区| 久久久国产欧美日韩av| cao死你这个sao货| 国产av一区在线观看免费| 嫩草影视91久久| 亚洲成av人片免费观看| 国产视频一区二区在线看| 岛国在线免费视频观看| 欧美大码av| 国产精品综合久久久久久久免费| 岛国视频午夜一区免费看| 亚洲 国产 在线| 性色av乱码一区二区三区2| 色av中文字幕| cao死你这个sao货| 狂野欧美激情性xxxx| 成年版毛片免费区| 久久久水蜜桃国产精品网| 久久精品国产99精品国产亚洲性色| 曰老女人黄片| 国产成人福利小说| 人妻久久中文字幕网| 身体一侧抽搐| 精品免费久久久久久久清纯| 一本精品99久久精品77| 伊人久久大香线蕉亚洲五| 99久久无色码亚洲精品果冻| 窝窝影院91人妻| www日本黄色视频网| 最近最新免费中文字幕在线| 小蜜桃在线观看免费完整版高清| 亚洲成人精品中文字幕电影| 这个男人来自地球电影免费观看| 天堂网av新在线| 久久精品人妻少妇| 免费大片18禁| 精品日产1卡2卡| 亚洲国产高清在线一区二区三| 波多野结衣高清作品| 美女 人体艺术 gogo| 免费看光身美女| 欧美午夜高清在线| 成人av在线播放网站| 欧美日本视频| 国产不卡一卡二| 桃红色精品国产亚洲av| 美女被艹到高潮喷水动态| 日韩欧美精品v在线| 一个人观看的视频www高清免费观看 | 男女床上黄色一级片免费看| 国产美女午夜福利| 国产午夜精品论理片| 婷婷六月久久综合丁香| 久久午夜亚洲精品久久| 国产亚洲精品综合一区在线观看| 无遮挡黄片免费观看| 精品久久久久久久末码| 一级毛片女人18水好多| av中文乱码字幕在线| 午夜免费激情av| 亚洲专区字幕在线| 亚洲18禁久久av| 日本黄色片子视频| 熟女电影av网| 国内毛片毛片毛片毛片毛片| 欧洲精品卡2卡3卡4卡5卡区| 成人av一区二区三区在线看| 日日干狠狠操夜夜爽| 一本精品99久久精品77| 国产精品影院久久| 嫩草影院入口| 日日摸夜夜添夜夜添小说| 一a级毛片在线观看| 久99久视频精品免费| 亚洲av五月六月丁香网| 床上黄色一级片| 久久伊人香网站| 国产一区二区在线观看日韩 | 国产精品久久电影中文字幕| 久久精品aⅴ一区二区三区四区| 欧美中文日本在线观看视频| av国产免费在线观看| 久久草成人影院| 天天躁狠狠躁夜夜躁狠狠躁| 国产成人欧美在线观看| 中文字幕人成人乱码亚洲影| 亚洲国产精品久久男人天堂| 国产精品久久久久久精品电影| svipshipincom国产片| 美女午夜性视频免费| 性欧美人与动物交配| 久久国产乱子伦精品免费另类| 国产日本99.免费观看| 人人妻,人人澡人人爽秒播| 99热6这里只有精品| 97碰自拍视频| 桃色一区二区三区在线观看| 丁香欧美五月| 日本三级黄在线观看| 男女做爰动态图高潮gif福利片| 精品午夜福利视频在线观看一区| 五月伊人婷婷丁香| 亚洲国产精品久久男人天堂| 18禁国产床啪视频网站| 亚洲在线自拍视频| 亚洲熟妇熟女久久| 日韩欧美在线乱码| 午夜亚洲福利在线播放| 亚洲色图av天堂| 亚洲国产欧美一区二区综合| 在线a可以看的网站| 国产精品久久视频播放| 精品国产超薄肉色丝袜足j| 午夜精品在线福利| 亚洲专区中文字幕在线| av片东京热男人的天堂| 啦啦啦免费观看视频1| 亚洲av电影不卡..在线观看| 国产蜜桃级精品一区二区三区| 亚洲第一电影网av| 97超视频在线观看视频| 精品国内亚洲2022精品成人| or卡值多少钱| 日本熟妇午夜| 中亚洲国语对白在线视频| 国产亚洲av高清不卡| 青草久久国产| 老熟妇仑乱视频hdxx| 熟女人妻精品中文字幕| 欧美日本亚洲视频在线播放| 欧美日韩亚洲国产一区二区在线观看| 色噜噜av男人的天堂激情| 亚洲精品乱码久久久v下载方式 | 这个男人来自地球电影免费观看| 亚洲精品在线美女| 在线观看日韩欧美| 2021天堂中文幕一二区在线观| 国产97色在线日韩免费| av欧美777| 丰满人妻熟妇乱又伦精品不卡| 亚洲激情在线av| 久久人妻av系列| 一二三四社区在线视频社区8| 啦啦啦韩国在线观看视频| 琪琪午夜伦伦电影理论片6080| 午夜日韩欧美国产| 国产高清有码在线观看视频| 99视频精品全部免费 在线 | 美女大奶头视频| 国产激情久久老熟女| 亚洲激情在线av| 怎么达到女性高潮| 天天添夜夜摸| 国产精品一区二区三区四区免费观看 | 99国产综合亚洲精品| 老司机深夜福利视频在线观看| 国产精品精品国产色婷婷| 国产激情欧美一区二区| 男女午夜视频在线观看| 欧美+亚洲+日韩+国产| 男女之事视频高清在线观看| 日韩大尺度精品在线看网址| 日韩成人在线观看一区二区三区| 国产精品自产拍在线观看55亚洲| 国产aⅴ精品一区二区三区波| 午夜福利18| 欧美色视频一区免费| 国产亚洲精品久久久久久毛片| av视频在线观看入口| 欧美乱码精品一区二区三区| 韩国av一区二区三区四区| 亚洲精品粉嫩美女一区| 特级一级黄色大片| 成人无遮挡网站| 老汉色∧v一级毛片| 欧美黄色淫秽网站| 日韩 欧美 亚洲 中文字幕| 级片在线观看| 久久久久久久午夜电影| 又黄又粗又硬又大视频| 在线观看午夜福利视频| 国产一级毛片七仙女欲春2| 美女 人体艺术 gogo| 一级a爱片免费观看的视频| 黄色丝袜av网址大全| АⅤ资源中文在线天堂| 国产精品99久久久久久久久| 一边摸一边抽搐一进一小说| 午夜视频精品福利| www国产在线视频色| 国产蜜桃级精品一区二区三区| 亚洲在线观看片| 中文字幕熟女人妻在线| 国产乱人伦免费视频| 欧美乱妇无乱码| 午夜免费成人在线视频| 久久伊人香网站| 99在线人妻在线中文字幕| 香蕉久久夜色| 这个男人来自地球电影免费观看| 一进一出抽搐gif免费好疼| 成人鲁丝片一二三区免费| 婷婷六月久久综合丁香| 成人欧美大片| 最近最新中文字幕大全免费视频| 精品国产亚洲在线| 熟女人妻精品中文字幕| 美女大奶头视频| 国产 一区 欧美 日韩| 九九热线精品视视频播放| 国内精品一区二区在线观看| 久久午夜亚洲精品久久| 亚洲成人精品中文字幕电影| 国产又黄又爽又无遮挡在线| 久久久精品欧美日韩精品| 欧美日韩精品网址| 精品一区二区三区视频在线 | 丰满的人妻完整版| 精品久久久久久久人妻蜜臀av| 亚洲av第一区精品v没综合| 国产视频一区二区在线看| 一进一出抽搐动态| 在线观看一区二区三区| 国产激情欧美一区二区| 最近最新中文字幕大全免费视频| 成年女人看的毛片在线观看| 国产97色在线日韩免费| 丰满人妻一区二区三区视频av | 色老头精品视频在线观看| a在线观看视频网站| 波多野结衣高清无吗| 国产成人啪精品午夜网站| 99在线人妻在线中文字幕| 免费在线观看视频国产中文字幕亚洲| 亚洲精品久久国产高清桃花| 国产精品久久久久久亚洲av鲁大| 亚洲av电影不卡..在线观看| 99在线人妻在线中文字幕| 亚洲va日本ⅴa欧美va伊人久久| 丝袜人妻中文字幕| 午夜免费成人在线视频| 日韩欧美国产在线观看| 最近视频中文字幕2019在线8| 国产精品1区2区在线观看.| 亚洲人成电影免费在线| 少妇丰满av| 成人一区二区视频在线观看| 精品免费久久久久久久清纯| 日本黄大片高清| 免费看日本二区| 五月玫瑰六月丁香| 搞女人的毛片| 好男人在线观看高清免费视频| 欧美av亚洲av综合av国产av| 国产高清三级在线| 亚洲九九香蕉| 亚洲成人免费电影在线观看| 最新在线观看一区二区三区| 在线免费观看的www视频| 欧美日韩国产亚洲二区| 久久性视频一级片| 精品久久久久久,| 亚洲av成人精品一区久久| 午夜亚洲福利在线播放| 老汉色∧v一级毛片| 精品午夜福利视频在线观看一区| АⅤ资源中文在线天堂| 曰老女人黄片| 国产成人一区二区三区免费视频网站| 精品国产三级普通话版| 看黄色毛片网站| 一边摸一边抽搐一进一小说| 最好的美女福利视频网| 国产在线精品亚洲第一网站| 亚洲欧美一区二区三区黑人| 成人av一区二区三区在线看| 蜜桃久久精品国产亚洲av| 成人特级av手机在线观看| 免费av不卡在线播放| 国内精品久久久久久久电影| 宅男免费午夜| 两性午夜刺激爽爽歪歪视频在线观看| 两性夫妻黄色片| 巨乳人妻的诱惑在线观看| 美女被艹到高潮喷水动态| 亚洲国产欧美一区二区综合| 人人妻,人人澡人人爽秒播| 最新美女视频免费是黄的| 在线观看美女被高潮喷水网站 | 久久国产精品人妻蜜桃| 91av网站免费观看| 我的老师免费观看完整版| 精品99又大又爽又粗少妇毛片 | 天天一区二区日本电影三级| 别揉我奶头~嗯~啊~动态视频| 午夜福利欧美成人| 成人精品一区二区免费| 又大又爽又粗| 少妇人妻一区二区三区视频| 国产激情欧美一区二区| 麻豆av在线久日| 亚洲乱码一区二区免费版| 午夜精品一区二区三区免费看| 亚洲欧美日韩卡通动漫| www.自偷自拍.com| 久久国产精品人妻蜜桃| 欧美成人性av电影在线观看| 亚洲专区中文字幕在线| 午夜久久久久精精品| 性色av乱码一区二区三区2| 久久久久久人人人人人| 国产av一区在线观看免费| 精品国产乱码久久久久久男人| 一区二区三区激情视频| 色综合欧美亚洲国产小说| 麻豆国产97在线/欧美| 麻豆成人av在线观看| 夜夜夜夜夜久久久久| 久久精品影院6| 黄色成人免费大全| 欧美3d第一页| 日韩欧美一区二区三区在线观看| 高潮久久久久久久久久久不卡| 18禁国产床啪视频网站| 岛国在线免费视频观看| 激情在线观看视频在线高清| 麻豆av在线久日| 国产高潮美女av| 无人区码免费观看不卡| 欧美日本亚洲视频在线播放| 99久国产av精品| 久久精品国产清高在天天线| 日韩大尺度精品在线看网址| 综合色av麻豆| 少妇熟女aⅴ在线视频| 日本一二三区视频观看| 此物有八面人人有两片|