• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      中文在線評論中產品特征抽取研究

      2014-12-25 08:58:37胡龍茂
      電腦知識與技術 2014年33期
      關鍵詞:在線評論

      胡龍茂

      摘要:在線評論中特征抽取是產品意見挖掘的基礎,直接影響到最終挖掘結果的準確性。針對現(xiàn)有特征抽取方法的準確率和召回率偏低問題,該文通過設計詞性序列模板產生候選特征集,利用PMI-IR方法進行篩選,最終獲得產品特征集。實驗結果表明,該方法取得較好效果。

      關鍵詞:在線評論;特征抽?。恍蛄心0?;PMI

      中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2014)33-8076-03

      Abstract: As a foundation of further analysis in in Chinese Online comments, features extraction influences the precision of the opinion mining results. Aiming at solving problems of relatively low precision, rate of coverage when using existing product features method, this paper designs part of speech sequence templates to obtain product features candidates, then utilizes PMI-IR method to filter product features candidates and obtain product features set. Experimental results show that this method is effective.

      Key words: online comments; feature extraction; sequence template; PMI

      1 概述

      隨著電子商務的興起,越來越多的用戶從網上購買商品并發(fā)表購后評論。與此同時,用戶在購買商品之前,也都會查看其他用戶對所購商品的評論,試圖發(fā)現(xiàn)其他用戶對商品的總體意見及各屬性的意見,從而決定其購買行為。由此, 近年來許多學者對在線評論展開了研究, 意見挖掘就是這類研究的熱點之一, 其目標是從海量的在線評論中分析每個用戶對于商品的態(tài)度?,F(xiàn)有的評論挖掘研究主要包含四個任務:產品特征抽?。辉u論觀點抽??;評論觀點的極性以及強度判斷;評論挖掘結果的匯總以及按用戶觀點排序[1]。特征抽取是整個意見挖掘的基礎,只有全面準確地抽取出用戶評論中所涉及的產品特征,之后的分析才能有的放矢。因此, 本文將嘗試探討中文在線評論中產品特征抽取研究。

      2 相關研究

      目前,已有不少學者針對英文產品評論中特征詞抽取方法進行研究。文獻[2-3]首先對評論語料進行詞性標注, 提取出所有的名詞和名詞短語構成事務文件, 然后利用Apriori關聯(lián)規(guī)則抽取高頻的特征詞, 最后通過修剪規(guī)則提高準確率和覆蓋率。文獻[4]提出了一種雙向傳播方法(DP, DoublePropagation), 根據(jù)詞匯依賴關系, 并考慮了代詞和否定詞的影響, 進行特征詞和感情詞的抽取。文獻[5]引入句法特征使用基于條件隨機場模型的監(jiān)督學習方法實現(xiàn)評價對象抽取,明顯提高了評價對象的抽取召回率。國內也有不少學者對中文產品評論屬性詞抽取方法進行研究。文獻[6]抓取大量介紹產品的網頁,從中手工整理構建屬性詞表。文獻[7]首先應用中文分詞工具對網絡評論信息進行分詞和詞性標注,得到最初的產品特征名詞集合,然后采用潛在狄利特雷分布文本訓練模型篩選出候選產品特征詞集合,進而通過同義詞詞林拓展和過濾規(guī)則得到最終的產品特征集合,通過實驗對比分析驗證了所提方法的有效性。

      因為現(xiàn)有產品特征抽取方法的準確率和召回率都不太高,所以有必要進行深入研究,該文主要工作如下:(1)設計詞性序列模板產生候選特征集,詞性序列模板不僅包含了名詞和名詞短語,還包括字符串、非及物動詞和動詞短語模板。(2)利用PMI-IR方法篩選候選特征集,構建產品特征集。

      5 總結

      本文嘗試了新的方法對中文在線評論進行產品特征抽取, 取得了較好的效果, 今后將結合特征詞-評價詞對的抽取方法,提高產品特征抽取的準確率。

      參考文獻:

      [1] Popescu A M,Etzioni O.Extracting product features and opinions from review[C].Proceedings of the Human Language Technology Conference and the Conference on Empirical Methods in Natural Language Processing,Stroudsburg,USA :Association for Computational Linguistics,005:339-346.

      [2] Hu Minjing,Liu Bing.Mining Opinion Features in Customer Reviews[C].Proceedings of the 19th National Conference on Artifical Intelligence,ACM Press,2004.

      [3] Hu Minjing,Liu Bing.Mining and Summarizing Customer Reviews[C].Proceedings of the ACM SIGKDD Conference on Knowledge Discovery and Data Mining,ACM Press,2004:168-177.

      [4] Qiu G, Liu B, Bu J, Chen C. Expanding domain sentiment lexicon through double propagation[C].Proc. of the 21st International Joint Conference on Artificial Intelligences,2009:1199?1204.

      [5] 呂品,鐘珞,蔡敦波,等.基于CRF的中文評論有效性挖掘產品特征[J].計算機工程與科學,2014,36(2):359-366.

      [6] 張孟,彭一凡.中文傾向性分析的研究[C].第1屆中文傾向性分析評測研討會論文集,2008:38-45.

      [7] 馬柏樟,顏志軍.基于潛在狄利特雷分布模型的網絡評論產品特征抽取方法[J].計算機集成制造系統(tǒng),2014,20(1):96-103.

      猜你喜歡
      在線評論
      消費者個體特征對在線評論有效性的影響研究
      在線評論情感屬性的動態(tài)變化
      預測(2016年5期)2016-12-26 17:16:57
      在線評論對電子商務商品銷量的影響研究
      中文信息(2016年10期)2016-12-12 11:01:20
      在線評論對消費者購買意圖的影響研究
      商(2016年10期)2016-04-25 10:03:58
      基于情感傾向的在線評論對購買決策的影響
      基于復雜網絡構建面向主題的在線評論挖掘模型
      軟科學(2015年10期)2015-10-28 03:17:30
      在線商品評論的類型研究
      在線評論與消費者行為的研究進展與趨勢展望
      軟科學(2015年6期)2015-07-10 02:32:49
      在線評論對大學生網絡購物決策的影響研究
      在線評論信息挖掘分析的數(shù)據(jù)來源可靠性研究
      軟科學(2015年4期)2015-04-20 02:03:26
      安新县| 遂宁市| 社旗县| 盐山县| 丰原市| 正定县| 拉孜县| 太原市| 阿拉善左旗| 曲周县| 呼伦贝尔市| 松溪县| 岢岚县| 沽源县| 五寨县| 包头市| 翁牛特旗| 红桥区| 金塔县| 自贡市| 淳化县| 都江堰市| 巧家县| 合川市| 宜都市| 漳平市| 油尖旺区| 九龙坡区| 许昌市| 太和县| 湘西| 偃师市| 鄂尔多斯市| 台南县| 呼伦贝尔市| 汝城县| 涞源县| 鹤山市| 剑河县| 鹿邑县| 牡丹江市|