譚翠萍
情感分析又名意見(jiàn)挖掘[1],主要研究如何從文本中發(fā)現(xiàn)或挖掘人們對(duì)于某種事物、產(chǎn)品或服務(wù)所表達(dá)出的情感、意見(jiàn)或情緒[2]。情感分析結(jié)果為主觀態(tài)度,一般分為三類(lèi):積極的、消極的和中立的。隨著大數(shù)據(jù)時(shí)代的到來(lái),情感分析已經(jīng)成為一個(gè)活躍的研究領(lǐng)域,目前在產(chǎn)品評(píng)論、社交媒體和在線博客等領(lǐng)域均有一定應(yīng)用[3]。從分析的粒度層次來(lái)看,文本情感分析可分為粗粒度和細(xì)粒度層次分析,粗粒度層次分析有篇章級(jí)(文檔級(jí))和句子級(jí)情感分析,細(xì)粒度層次情感分析則是基于評(píng)價(jià)對(duì)象及其屬性的分析[4]。由于實(shí)際應(yīng)用場(chǎng)景中,人們不光要識(shí)別一篇文檔或者一個(gè)句子中包含的觀點(diǎn),還需要識(shí)別觀點(diǎn)或情感所表達(dá)或評(píng)價(jià)的對(duì)象,以及針對(duì)這些對(duì)象所具體表達(dá)的觀點(diǎn)傾向[5]。在這種情況下,學(xué)者們逐步深入細(xì)粒度情感分析領(lǐng)域,研究基于方面、屬性或主題、實(shí)體的情感抽取、分類(lèi)[6-9]。
為了深入研究細(xì)粒度情感分析方法,歸納現(xiàn)有成果、存在問(wèn)題與面臨挑戰(zhàn),本文以“細(xì)粒度情感分析”[4,10]、“方面級(jí)情感分析”[4,10]、“屬性級(jí)情感分析”[4]、“實(shí)體級(jí)情感分析”[4]、“意見(jiàn)挖掘”[10];“Fine Grained Sentiment Analysis”[4,10]、“Aspect Level Sentiment Analysis”[4,10]、“Attribute Level Sentiment Analysis”[4]、“Entity Level Sentiment Analysis”[4]、“Opinion Mining”[10]為關(guān)鍵詞在CNKI平臺(tái)、Web of Science核心合集檢索近十年細(xì)粒度情感分析研究文獻(xiàn),發(fā)現(xiàn)2017年至今該領(lǐng)域發(fā)展較快(見(jiàn)圖1),值得深入研究與總結(jié);其中:Web of Science 2017—2021年相關(guān)文獻(xiàn)932篇,CNKI2017—2021年相關(guān)文獻(xiàn)166篇。筆者結(jié)合文獻(xiàn)相關(guān)度、引用情況、最新發(fā)表情況,對(duì)重點(diǎn)文獻(xiàn)向前追溯、向后追蹤,精讀有代表性研究87篇,發(fā)現(xiàn)隨著細(xì)粒度情感分析研究的深化,不同層次粒度的情感分析研究也得到了推動(dòng)與發(fā)展。
圖1 2012—2021年細(xì)粒度情感分析研究文獻(xiàn)數(shù)量
經(jīng)研究,筆者發(fā)現(xiàn)細(xì)粒度情感分析在社交媒體、在線評(píng)論、商業(yè)投資等領(lǐng)域有了一定應(yīng)用[11]。實(shí)際的應(yīng)用需求不斷倒逼領(lǐng)域研究發(fā)現(xiàn)新問(wèn)題,產(chǎn)生新任務(wù),創(chuàng)造新方法。本文利用Citespace工具,采用基于研究主題數(shù)量變化的定量分析與基于代表性文獻(xiàn)調(diào)研的定性分析相結(jié)合的方法,從細(xì)粒度情感分析領(lǐng)域年度研究主題變化(如圖2),發(fā)現(xiàn)現(xiàn)階段細(xì)粒度文本情感分析研究的新任務(wù)及新技術(shù);同時(shí)結(jié)合文獻(xiàn)精讀,對(duì)該領(lǐng)域最新任務(wù)、最新技術(shù)的研究進(jìn)展進(jìn)行總結(jié)。
圖2 2017—2021年細(xì)粒度情感分析研究文獻(xiàn)主題變化圖
從最新任務(wù)角度,筆者欣喜地發(fā)現(xiàn)方面級(jí)情感分析三元組、多粒度情感分析、隱式情感分析、情感依賴(lài)關(guān)系抽取等任務(wù)不僅引起國(guó)外學(xué)者們的關(guān)注,成為領(lǐng)域研究熱點(diǎn),同時(shí)也取得了一定的實(shí)質(zhì)性進(jìn)展。尤其是方面級(jí)情感分析三元組任務(wù)研究成果,可以一次性給出方面術(shù)語(yǔ)、觀點(diǎn)詞與情感極性的解決方案,可使細(xì)粒度情感分析向?qū)嶋H應(yīng)用更進(jìn)一步。從最新技術(shù)角度,筆者發(fā)現(xiàn)機(jī)器學(xué)習(xí)、情感詞典、遷移學(xué)習(xí)為細(xì)粒度情感分析的主要技術(shù),其中圖卷積神經(jīng)網(wǎng)絡(luò)GCN等深度學(xué)習(xí)方法在處理情感依賴(lài)關(guān)系抽取方面表現(xiàn)優(yōu)異,而遷移學(xué)習(xí)技術(shù)在解決跨語(yǔ)言、跨領(lǐng)域的情感分析方面潛力巨大。具體研究框架如圖3所示。
圖3 本文研究框架
篇章級(jí)情感分析(Document-Level Sentiment Analysis,DLSA)是對(duì)整個(gè)篇章(文檔)進(jìn)行情感極性分類(lèi)的任務(wù),一般分為積極或消極[5]。這一層次的分析是假設(shè)該文檔表達(dá)了對(duì)單個(gè)實(shí)體的意見(jiàn),因此它不適用于評(píng)估或比較多個(gè)實(shí)體的文檔[9]。文檔級(jí)情感分析一般采用基于監(jiān)督的情感分類(lèi)方法,比如SVM、樸素貝葉斯等機(jī)器學(xué)習(xí)算法;或采用基于詞典的無(wú)監(jiān)督情感分類(lèi)方法,比如SentiWordNet等[10]。雖然文檔級(jí)情感分析研究早期是特征工程與機(jī)器學(xué)習(xí)算法在實(shí)際中的直接應(yīng)用,但隨著細(xì)粒度情感分析研究的深入,該領(lǐng)域研究也由粗及細(xì),由細(xì)補(bǔ)粗,成為多粒度相互結(jié)合的應(yīng)用場(chǎng)景[12-14]。郝飛(Hao F)等從細(xì)粒度情感分析中得到啟發(fā),嘗試首先了解文檔背后潛在的目標(biāo)意見(jiàn)分布,然后利用這些細(xì)粒度的先驗(yàn)知識(shí)進(jìn)行分類(lèi)[12]。吳正浩(Wu Z H)等針對(duì)現(xiàn)有的基于方面的情感分類(lèi)主要是從短文本(少于100字)中獲取情感極性,幾乎沒(méi)有分析長(zhǎng)文檔(超過(guò)500字),提出了面向方面的長(zhǎng)文檔分層框架[13]。魏凌偉(Wei L W)等提出了一種層次交互網(wǎng)絡(luò)(Hierarchical Interactions Networks,HIN),用于探索摘要和文檔之間在多粒度上的雙向交互學(xué)習(xí),以提高情感分類(lèi)性能[14]。
從以上篇章級(jí)情感分析研究可以看出,隨著細(xì)粒度情感分析方法的研究深入,粗粒度情感分析也得到了改進(jìn)與提升。
相較于篇章,句子較短,包含的情感信息也更少,因此句子級(jí)情感分析(Sentence-Level Sentiment Analysis,SLSA)較篇章級(jí)情感分析更難。句子級(jí)情感分析假設(shè)一個(gè)句子只表達(dá)一個(gè)觀點(diǎn),即一種情感[5]。無(wú)法使用劉冰(Liu B)的五元組(ej; ajk; soijkl; hi; tl) 對(duì)其定義,因?yàn)榫渥蛹?jí)情感分析不關(guān)注觀點(diǎn)評(píng)價(jià)對(duì)象ej、觀點(diǎn)持有者h(yuǎn)i和觀點(diǎn)發(fā)布時(shí)間tl等信息的抽取與識(shí)別[15]。句子級(jí)情感分析與篇章級(jí)情感分析的技術(shù)方法相似,但解決的重點(diǎn)問(wèn)題不同。(1)該項(xiàng)任務(wù)的第一步為主客觀分類(lèi),即是對(duì)含觀點(diǎn)和不含觀點(diǎn)的句子進(jìn)行劃分[16]。針對(duì)這一問(wèn)題,桑吉塔(Sangeetha K)等利用雙積分條件隨機(jī)場(chǎng)(Bi-Integrated Conditional Random Fields,Bi-CRF)來(lái)尋找給定句子的目標(biāo),取得了很好的效果[17]。(2)每個(gè)句子在一篇文檔中,不是單獨(dú)存在的,需要理解上下文信息。針對(duì)這一問(wèn)題,亞達(dá)夫(Yadav A)等提出了一種基于深度語(yǔ)言無(wú)關(guān)的多級(jí)注意的卷積雙門(mén)控網(wǎng)絡(luò)(A Deep Language-independent Multilevel Attention-based Conv-BiGRU Network,MACBiG-Net),通過(guò)關(guān)注文本的局部特征以及上下文信息,來(lái)捕捉文檔中句子情感分類(lèi)線索[18]。(3)原有句子級(jí)情感分析往往忽略每個(gè)句子對(duì)整個(gè)文本重要性的差異。針對(duì)這一問(wèn)題,王平(Wang P)等提出一種多頭自我注意的句對(duì)句注意網(wǎng)絡(luò)(A Sentence-To-Sentence Attention Network,S2SAN)[19],取得較好的效果。
盡管篇章級(jí)、句子級(jí)情感分析已較為成熟,但它們都是假定一段文本表達(dá)的情感是統(tǒng)一的、一致的,這在現(xiàn)實(shí)中往往不成立,如“這是一個(gè)超薄、時(shí)尚、好看的計(jì)算機(jī),但是觸摸板非常令人沮喪!”在這個(gè)描述中,“計(jì)算機(jī)”有三個(gè)正向觀點(diǎn):“超薄”“時(shí)尚”“好看”,“觸摸屏”有一個(gè)負(fù)向觀點(diǎn):“令人沮喪”;無(wú)法簡(jiǎn)單將句子歸結(jié)成統(tǒng)一情感,因此篇章級(jí)、句子級(jí)情感分析方法無(wú)法滿(mǎn)足更細(xì)粒度的情感分析需求[4,20-21]。
細(xì)粒度情感分析,主要包括方面級(jí)情感分析(Aspect-Level Sentiment Analysis,ALSA;或Aspect-based Sentiment Analysis,ABSA),旨在明確特定方面相關(guān)的情感,一般包括三個(gè)要素[22]:方面術(shù)語(yǔ)(Aspect Term )、觀點(diǎn)詞(Opinion Term)和情感極性(SP,Sentiment Polarity)。如圖4所示:
圖4 方面級(jí)情感分析的三要素關(guān)系示例
句子中“meat”“bread”為方面術(shù)語(yǔ),情感極性都為正向,“delicious”“very good”為觀點(diǎn)詞。圍繞這三個(gè)要素,共有7項(xiàng)任務(wù)[23],如表1所示。
表1 細(xì)粒度情感分析的子任務(wù)
方面提取(Aspect Term Extraction,ATE):從句子中提取所有方面術(shù)語(yǔ)。觀點(diǎn)提取(Opinion Term Extraction,OTE):從句子中提取所有觀點(diǎn)詞。方面級(jí)情感分類(lèi)(Aspect-level Sentiment Classification,ALSC):預(yù)測(cè)句子中每個(gè)給定方面術(shù)語(yǔ)的情感極性。面向方面的觀點(diǎn)抽取(Aspect-oriented
Opinion Extraction,AOE):為句子中的每個(gè)給定方面抽取成對(duì)的觀點(diǎn)詞。方面提取和情感分類(lèi)(Aspect Term Extraction and Sentiment Classification,AESC):同時(shí)提取方面術(shù)語(yǔ)以及相應(yīng)的情感極性。關(guān)聯(lián)對(duì)抽取(Pair Extraction,Pair):同時(shí)抽取方面術(shù)語(yǔ)和相應(yīng)的觀點(diǎn)詞。三元組抽取(Aspect Sentiment Triplet Extraction,ASTE):同時(shí)抽取方面術(shù)語(yǔ)、相應(yīng)的觀點(diǎn)詞和情感極性。
其中,方面級(jí)情感三元組抽取(Aspect Sentiment Triplet Extraction,ASTE)是方面級(jí)情感分析領(lǐng)域最新的子任務(wù)[24],在本文第3章會(huì)重點(diǎn)闡述。
為清晰反映現(xiàn)階段細(xì)粒度文本情感分析領(lǐng)域的研究熱點(diǎn),發(fā)現(xiàn)領(lǐng)域最新研究任務(wù)與研究方法,筆者將2020—2021年的細(xì)粒度情感分析數(shù)據(jù)導(dǎo)入Citespace工具,通過(guò)Keyword聚類(lèi),對(duì)比各個(gè)年度關(guān)鍵詞分布,發(fā)現(xiàn)方面提取(對(duì)應(yīng)圖5中aspect extration、aspect level、aspect category detection、aspect weight、aspect term extraction等關(guān)鍵詞)、方面級(jí)情感分類(lèi)(對(duì)應(yīng)圖5中emotion recognition、feature extraction等關(guān)鍵詞)等傳統(tǒng)子任務(wù)仍為研究熱點(diǎn),同時(shí)也發(fā)現(xiàn)了一些新的研究任務(wù)與技術(shù)方法(詳見(jiàn)第3、4節(jié))。
圖5 2020—2021年方面級(jí)情感分析的研究熱點(diǎn)
細(xì)粒度情感分析領(lǐng)域的研究是循序漸進(jìn)的,新任務(wù)的發(fā)展離不開(kāi)傳統(tǒng)子任務(wù)的成果積淀。傳統(tǒng)子任務(wù)主要解決的是顯性方面、觀點(diǎn)的提取與情感分類(lèi),并取得了一定成果,如拉馬斯瓦米(Ramaswamy S L)等人在Rest16測(cè)試集上的方面級(jí)情感分析F1值達(dá)到93.77%[25]。而伴隨著細(xì)粒度情感分析方法的深入應(yīng)用,方面級(jí)情感分析研究由單項(xiàng)任務(wù)到組合任務(wù),方面提取研究也從顯式走向隱式,相繼產(chǎn)生了一些新的任務(wù)。
筆者通過(guò)分年度對(duì)比細(xì)粒度情感分析最新任務(wù)(圖4紅色框標(biāo)注部分),結(jié)合文獻(xiàn)精讀,總結(jié)出近兩年細(xì)粒度文本情感分析的最新任務(wù)為方面級(jí)情感分析三元組、多粒度情感分析、隱式情感分析、依賴(lài)關(guān)系抽取。
方面級(jí)情感三元組抽取(Aspect Sentiment Triplet Extraction,ASTE)是方面級(jí)情感分析領(lǐng)域最新的子任務(wù)[24],包括方面術(shù)語(yǔ)、觀點(diǎn)詞、情感極性,即:
表2 ASTE研究對(duì)比表
現(xiàn)有針對(duì)ASTE任務(wù)的解決方法可分為基于分層、機(jī)器閱讀理解、文本生成、端到端的三元組抽取方法。
(1)分層/分階段的ASTE方法
彭海云(Peng H Y)等人構(gòu)建了雙層LSTM神經(jīng)結(jié)構(gòu),用于方面抽取、方面情感分類(lèi)和觀點(diǎn)詞抽取,并使用圖卷積網(wǎng)絡(luò)組件捕獲依賴(lài)信息,一次性回答了方面術(shù)語(yǔ)是什么(What)、其情感極性如何(How)以及為什么是這樣的情感極性(Why)[24]。該方法第一階段通過(guò)聯(lián)合標(biāo)記抽取候選方面術(shù)語(yǔ)、情感極性及觀點(diǎn)詞。第二階段將候選方面術(shù)語(yǔ)和觀點(diǎn)詞結(jié)合起來(lái),確定它們之間的成對(duì)情感關(guān)系。該方法無(wú)需特定領(lǐng)域或三元組的訓(xùn)練數(shù)據(jù),通過(guò)距離來(lái)獲取方面術(shù)語(yǔ)與觀點(diǎn)詞之間的關(guān)系,該研究在14Rest數(shù)據(jù)集上ASTE任務(wù)的F1值達(dá)到51.89,成為ASTE領(lǐng)域的重要基線。
經(jīng)過(guò)后面的研究(詳見(jiàn)表2),發(fā)現(xiàn)該方法存在一定的不足,主要是方面情感往往由方面上表達(dá)的觀點(diǎn)詞所決定,這種分階段的方法打破了三元組結(jié)構(gòu)中的相互作用。此外,流水線方法通常會(huì)遇到錯(cuò)誤傳播問(wèn)題。這在后面的研究中得到了改進(jìn),從而提升了性能。
簡(jiǎn)(Jian S Y B)等(2021)采用分層強(qiáng)化學(xué)習(xí)方法,將ASTE任務(wù)分解為面向方面的情感分類(lèi)、觀點(diǎn)詞抽取、方面術(shù)語(yǔ)抽取等3個(gè)子任務(wù),并將其分為兩個(gè)層級(jí)[26]。首先通過(guò)高層級(jí)的情緒掃描,識(shí)別并標(biāo)記某個(gè)方面數(shù)據(jù)表達(dá)的情感極性;然后在低層級(jí)開(kāi)展觀點(diǎn)詞和方面術(shù)語(yǔ)抽取,并將抽取結(jié)果作為情緒的參數(shù)進(jìn)行序列標(biāo)注;從低層級(jí)處理完后返回高層級(jí)情感掃描,直至完成。該模型中加入了多輪機(jī)器閱讀理解方法,以進(jìn)一步改進(jìn)子任務(wù)間的交互。經(jīng)實(shí)驗(yàn),ASTE任務(wù)在14Rest數(shù)據(jù)集的F1值為69.61%。
徐璐(Xu L)等提出了一種雙通道span剪枝策略,該策略結(jié)合了來(lái)自方面術(shù)語(yǔ)抽取(ATE)和觀點(diǎn)詞抽取(OTE)任務(wù)的監(jiān)督[28]。該策略不僅提高了計(jì)算效率,而且能更準(zhǔn)確地區(qū)分觀點(diǎn)和目標(biāo)范圍。該模型使用BiLSTM、BERT編碼器在4個(gè)基準(zhǔn)數(shù)據(jù)集上進(jìn)行了驗(yàn)證,其中14Rest數(shù)據(jù)集的F1值為71.85%。
(2)基于端到端的ASTE方法
嚴(yán)航(Yan H)等將包含方面級(jí)情感三元組抽取等7個(gè)子任務(wù)目標(biāo)重新定義為由指針?biāo)饕颓楦蓄?lèi)索引混合的序列,而后將所有子任務(wù)轉(zhuǎn)換為統(tǒng)一的生成公式[23]。在統(tǒng)一公式的基礎(chǔ)上,利用BART預(yù)訓(xùn)練模型在端到端框架中求解所有子任務(wù)。經(jīng)實(shí)驗(yàn)證明,該框架性能優(yōu)異,基于14Rest數(shù)據(jù)集的ASTE任務(wù)F1值為65.25%。
(3)基于文本生成的ASTE方法
基于彭海云(Peng H Y)的研究[24],張文軒(Zhang W X)等提出基于生成方面的情感分析(the Generative Aspect-based Sentiment analysis,GAS),為此定制了兩種范式,即注釋樣式和提取樣式建模[27]。在注釋風(fēng)格范例中,為了指出方面和觀點(diǎn)術(shù)語(yǔ)之間的關(guān)系,以[aspect | opinion | sentiment polarity]的形式將相關(guān)的觀點(diǎn)修飾符附加到每個(gè)方面術(shù)語(yǔ),以構(gòu)建目標(biāo)句子;在提取樣式建模中,將所需的方面(包括隱式方面)三元組(aspect1,opinion1,sentiment polarity1);(aspect2,opinion2,sentiment polarity2)串聯(lián)起來(lái)作為目標(biāo)輸出?;谏鲜鯣AS統(tǒng)一框架,張文軒(Zhang W X)等對(duì)包含ASTE在內(nèi)的4種方面級(jí)情感分析任務(wù)進(jìn)行了對(duì)比實(shí)驗(yàn),經(jīng)實(shí)驗(yàn)驗(yàn)證,該框架在14Rest數(shù)據(jù)集上ASTE任務(wù)的F1值達(dá)到72.16[27]。該研究是將ABSA任務(wù)轉(zhuǎn)化為文本生成問(wèn)題的初步嘗試。
(4)基于機(jī)器閱讀理解框架的ASTE方法
機(jī)器閱讀理解MRC方法是基于給定的上下文來(lái)回答特定的問(wèn)題。基于BERT的MRC一般會(huì)把問(wèn)題和上下文進(jìn)行拼接,送入BERT中得到隱藏層表示。陳少偉(Chen S W)等將ASTE任務(wù)轉(zhuǎn)化為多輪機(jī)器閱讀理解(Multi-turn Machine Reading Transform, MTMRC)任務(wù),并提出了一個(gè)雙向機(jī)器閱讀理解框架,設(shè)計(jì)了三種類(lèi)型的查詢(xún),包括非限制性抽取查詢(xún)、限制性抽取查詢(xún)和情感分類(lèi)查詢(xún),以建立不同子任務(wù)之間的關(guān)聯(lián)[29]。此外,考慮到一個(gè)方面情感三元組可以來(lái)自一個(gè)方面或一個(gè)觀點(diǎn)表達(dá),設(shè)計(jì)了一個(gè)雙向機(jī)器閱讀理解結(jié)構(gòu)。一個(gè)方向依次識(shí)別方面、觀點(diǎn)和情感極性以獲得三元組,而另一個(gè)方向首先識(shí)別觀點(diǎn),然后識(shí)別方面,最后識(shí)別情感極性。這兩個(gè)方向相互補(bǔ)充,可以更全面地識(shí)別方面情感三元組。經(jīng)實(shí)驗(yàn)驗(yàn)證,該研究在14Rest數(shù)據(jù)集上ASTE任務(wù)的F1值達(dá)到70.69。
經(jīng)過(guò)以上研究,相較于最初彭海云(Peng H Y)的研究結(jié)果[24],ASTE任務(wù)在4個(gè)基準(zhǔn)數(shù)據(jù)集的F1值增長(zhǎng)超過(guò)10個(gè)百分點(diǎn),總體而言,針對(duì)句子中單個(gè)方面的情感分析三元組方面抽取有了很大進(jìn)步,但在多重三元組抽取方面仍不夠理想,是未來(lái)努力的方向。
多粒度情感分析(Multi-grained Sentiment Analysis)是根據(jù)表達(dá)情感信息量的多少來(lái)區(qū)分粒度層次[30],并對(duì)不同粒度層次的內(nèi)容進(jìn)行情感分析。在線評(píng)論的細(xì)粒度情感分析在許多應(yīng)用中發(fā)揮著越來(lái)越重要的作用,這里的關(guān)鍵技術(shù)是如何有效地提取多粒度方面,識(shí)別相關(guān)的觀點(diǎn),并對(duì)情感極性進(jìn)行分類(lèi),如圖6所示。
圖6 多粒度情感分析元素關(guān)系示例
在這個(gè)描述中,需提取多個(gè)方面,即一個(gè)是一般方面“computer”和一個(gè)特殊方面“touch pad”。其中有三個(gè)具體意見(jiàn)“slim”“fashion”“good-looking”,以及一個(gè)總體意見(jiàn)“frustrating”。最后,對(duì)提取的方面進(jìn)行分類(lèi)和匯總?!癱omputer”上的“slim”“fashion”“good-looking”是積極的觀點(diǎn),而“touch pad”上的“frustrating”是消極的觀點(diǎn)。
由此可見(jiàn),多粒度情感分析對(duì)于分析復(fù)雜語(yǔ)境、明確多重方面的總體觀點(diǎn)具有實(shí)際的研究意義,具有代表性的方案有:
在粒度的區(qū)分方面,一些研究者通過(guò)粗細(xì)粒度分類(lèi)器或變換器,以獲得上下文的短語(yǔ)級(jí)表示,取得了一些進(jìn)展[31-32]。唐飛龍(Tang F L)等提出了一種聯(lián)合的基于方面的情感主題模型(Joint Aspect-Based Sentiment Topic,JABST),用于識(shí)別方面和觀點(diǎn)粒度的方法,該模型對(duì)方面、觀點(diǎn)、情感極性和粒度聯(lián)合建模,以提取多粒度的方面和觀點(diǎn)[33]。在這項(xiàng)工作中,方面和觀點(diǎn)粒度分為一般和特定粒度。一般方面和觀點(diǎn)指的是大多數(shù)評(píng)論中包含的基本觀點(diǎn)或背景詞,而特定方面和觀點(diǎn)則用于捕捉一些細(xì)粒度的特征,因此特定方面的觀點(diǎn)可以在評(píng)論中捕捉到比單粒度情緒分析更準(zhǔn)確的信息。最后,對(duì)提取的方面進(jìn)行分類(lèi)和匯總。此外,通過(guò)監(jiān)督學(xué)習(xí),提出了基于最大熵的JABST模型(MaxEnt-JABST),以提高觀點(diǎn)和方面提取的準(zhǔn)確性和性能。該模型通過(guò)對(duì)電子設(shè)備和餐廳的評(píng)論實(shí)驗(yàn)結(jié)果表明,所提出的模型優(yōu)于基線,可以較好地識(shí)別細(xì)粒度的方面和觀點(diǎn)。
注意力機(jī)制被廣泛應(yīng)用于多粒度情感分析領(lǐng)域[34-36]。其中,甘陳泉(Gan C Q)等提出了一種用于多實(shí)體情緒分析的基于自注意的分層擴(kuò)張卷積神經(jīng)網(wǎng)絡(luò)(SA-HDCNN,Self-Attention based Hierarchical Dilated Convolutional Neural Network),該網(wǎng)絡(luò)將任務(wù)直接轉(zhuǎn)化為避免分解的序列標(biāo)記問(wèn)題,并適用于并行計(jì)算[35]。具體來(lái)說(shuō),SA-HDCNN主要由編碼、特征提取和解碼模塊組成。編碼模塊將輸入句子映射到一個(gè)包含語(yǔ)義和情感信息的單詞嵌入矩陣中。接下來(lái),由特征提取模塊分別通過(guò)HDCNN結(jié)構(gòu)和自我注意機(jī)制學(xué)習(xí)編碼句子的多尺度局部特征和詞間全局相關(guān)性。然后,解碼模塊輸出標(biāo)簽序列,從而完成對(duì)多個(gè)目標(biāo)實(shí)體及其對(duì)應(yīng)情感極性的自動(dòng)識(shí)別。該模型在Review(F1:63.33%)和Twitter(F1:73.04%)多方面數(shù)據(jù)集上進(jìn)行了驗(yàn)證,既不限制目標(biāo)實(shí)體的數(shù)量,也不依賴(lài)任何特定領(lǐng)域的信息或優(yōu)先功能,表明該方法具有很好的適用性。
在提升多粒度預(yù)訓(xùn)練任務(wù)方面,陳越澤(ChenY Z)等提出了基于ALBERT的多粒度注意力表示方法(MGAR-ALBERT),它可以學(xué)習(xí)句子和多個(gè)方面的相關(guān)信息表示,同時(shí)將其集成到多粒度的句子建模過(guò)程中,最終得到全面的句子表示;同時(shí)在n-gram中引入噪聲線性余弦衰減方法,以避免預(yù)訓(xùn)練中對(duì)方面遮掩的影響,優(yōu)化預(yù)訓(xùn)練任務(wù)[36]。該方法基于Rest14數(shù)據(jù)集得到的F1值為77.68%。
國(guó)內(nèi)也有一些研究者利用序貫三支決策方法來(lái)構(gòu)建多層粒結(jié)構(gòu),從最粗粒度層級(jí)到最細(xì)粒度層級(jí)進(jìn)行一系列的多階段三支決策,在每步?jīng)Q策時(shí)對(duì)信息不充分的對(duì)象采取延遲決策的策略[30,37-39]。三支情感分類(lèi)決策分別是正向決策、負(fù)向決策和延遲決策。在每一粒層,當(dāng)現(xiàn)有信息充分時(shí),可以直接作出接受或拒絕的判斷;而對(duì)當(dāng)前信息不能支持其作出決策時(shí),可以將對(duì)象劃分到邊界域中,并在更細(xì)粒層下獲取更充分的信息后對(duì)其進(jìn)行劃分,依此類(lèi)推,直到邊界域中的對(duì)象被逐漸劃分到正域或負(fù)域中。楊新等在原有的基礎(chǔ)上,提出了基于時(shí)空多粒度的序貫三支情感分析方法,利用隨時(shí)間增加的數(shù)據(jù)和擬合度較高的特征空間,構(gòu)造具有時(shí)空特性的多層粒結(jié)構(gòu),平衡誤分類(lèi)代價(jià)和訓(xùn)練代價(jià)[39]。
總體而言,多粒度情感分析復(fù)雜度較高,目前在分層或分類(lèi)決策、注意力機(jī)制等方面開(kāi)展了一些研究,但其性能、準(zhǔn)確度仍有待進(jìn)一步提高。
隱式情感分析(Implicit Sentiment Analysis)的核心任務(wù)是對(duì)隱式方面的提取。在方面級(jí)情感分析過(guò)程中,特征提取是一個(gè)關(guān)鍵過(guò)程,它可以是隱式的,也可以是顯式的[40]。已有研究多數(shù)都是針對(duì)顯式方面進(jìn)行抽取,而較少對(duì)隱式方面進(jìn)行深入研究。圖比沙(Tubishat M)等、甘甘沃(Ganganwar V)等對(duì)2005年至2018年間的隱式方面情感分析文獻(xiàn)進(jìn)行調(diào)研,發(fā)現(xiàn)以往研究主要是基于無(wú)監(jiān)督和半監(jiān)督的方法提取句子中的隱性特征[40-41]。筆者重點(diǎn)對(duì)2020年以來(lái)的隱式方面抽取進(jìn)行了研究,發(fā)現(xiàn)研究主要通過(guò)詞共現(xiàn)、屬性聚類(lèi)、依賴(lài)關(guān)系分析等方法提高隱式方面抽取效果(見(jiàn)表3)。
表3 隱式方面抽取研究對(duì)比表
拉納(Rana T A)等提出了一種使用共現(xiàn)和基于相似性技術(shù)來(lái)識(shí)別隱含方面的多層次方法[44]。該模型不僅使用了觀點(diǎn)詞共現(xiàn),而且還利用了顯式方面和領(lǐng)域相關(guān)的觀點(diǎn)詞(概念)來(lái)正確識(shí)別用戶(hù)意見(jiàn)的隱含方面。該研究的重點(diǎn)是提取用戶(hù)意見(jiàn)的隱式方面線索(Implicit Aspect Clues,IACs),并借助隱式方面線索識(shí)別用戶(hù)意見(jiàn)的真實(shí)目標(biāo)。具體方法分為兩步: 第一步是制定句子中隱式方面線索的識(shí)別規(guī)則;第二步是將提取出來(lái)的線索分配給句子中的方面。該模型不僅可以提取與意見(jiàn)詞相關(guān)的隱式方面線索,還可以將線索分配給未識(shí)別出關(guān)聯(lián)的觀點(diǎn)詞。該方法基于SemEval 2014、數(shù)碼產(chǎn)品用戶(hù)評(píng)論數(shù)據(jù)集進(jìn)行了實(shí)驗(yàn),結(jié)果優(yōu)于Importance Score(IS)、Context-based(CB)、Context-Weight(CW)等3種隱式方面識(shí)別基線方法。許倩楠(Xu Q N)等提出了一種基于非負(fù)矩陣分解(NMF)的隱式方面識(shí)別方法[45]。該方法基于方面和觀點(diǎn)詞之間的相互關(guān)系對(duì)方面進(jìn)行聚類(lèi),并利用方面集合和觀點(diǎn)集合之間的內(nèi)在關(guān)系來(lái)提高聚類(lèi)性能;同時(shí)構(gòu)造了一個(gè)分類(lèi)器來(lái)識(shí)別和預(yù)測(cè)目標(biāo)隱含方面。該研究在CR和ABSA15數(shù)據(jù)集上得到了驗(yàn)證,F(xiàn)1值為0.722,取得了很好的性能,尤其適合在大型數(shù)據(jù)集上的隱式方面識(shí)別。
現(xiàn)有的隱式方面識(shí)別研究大多是針對(duì)特定方面的產(chǎn)品評(píng)論,而忽略了句子的依賴(lài)性。針對(duì)這一問(wèn)題,米爾(Mir J)等提出了一種多層次的電影隱式方面識(shí)別知識(shí)工程方法[42]。第一步是使用BiLSTM-CRF來(lái)識(shí)別顯式方面,而后將識(shí)別出的顯式方面作為方面映射算法的輸入來(lái)推斷隱式方面。它可以從獨(dú)立句和三種依賴(lài)句中識(shí)別隱式方面。這項(xiàng)研究基于5萬(wàn)條大型電影評(píng)論數(shù)據(jù)集進(jìn)行了實(shí)驗(yàn)。結(jié)果表明,隱式方面提取的F1值為0.76,優(yōu)于NMFIAD和ML-KB+模型。
為了識(shí)別隱藏在在線評(píng)論中的評(píng)價(jià)屬性,張晶(Zhang J)等提出了一種結(jié)合詞嵌入、共現(xiàn)信息和依賴(lài)性分析的方法,該方法可以幫助以無(wú)監(jiān)督方式獲取詞義信息和依賴(lài)關(guān)系,并能有效地發(fā)現(xiàn)隱藏的屬性[43]。該研究定義了一個(gè)情緒三元組(名詞、形容詞和副詞)來(lái)表示在線評(píng)論中包含的情緒元素,并使用依賴(lài)關(guān)系解析技術(shù)來(lái)識(shí)別情緒元素之間的依賴(lài)關(guān)系,有效地提高了評(píng)價(jià)屬性及其情感值的識(shí)別性能。該方法基于攜程網(wǎng)在線酒店評(píng)論數(shù)據(jù)進(jìn)行了驗(yàn)證,F(xiàn)1值為0.73。結(jié)果表明,這種結(jié)合詞嵌入、共現(xiàn)信息和依賴(lài)性分析的隱式方面提取方法優(yōu)于單一方法。
多個(gè)方面的情感極性之間的潛在相關(guān)性,即為情感依賴(lài)(Sentiment Dependency),情感依賴(lài)問(wèn)題是方面級(jí)情感分析需要解決的問(wèn)題[46-50]。目前主要是基于句法結(jié)構(gòu)的情感依賴(lài)關(guān)系抽取。
(1)基于句法結(jié)構(gòu)樹(shù)的情感依賴(lài)建模
雖然情感依賴(lài)和句法依賴(lài)不是嚴(yán)格等價(jià),但研究人員試圖基于句法依賴(lài)樹(shù)建立情感依賴(lài)模型,并取得了一些進(jìn)展。孫凱(Sun K)等提出了基于獨(dú)立樹(shù)的情感依賴(lài)關(guān)系抽取模型,并獲得了很好的性能[46]。徐寬弘(Xu K H)等和張晨(Zhang C)等, 使用帶有注意機(jī)制的GCN(Graph Convolutional Network)來(lái)學(xué)習(xí)依賴(lài)樹(shù),依賴(lài)樹(shù)可以縮短語(yǔ)法相關(guān)單詞之間的距離,可以有效地從圖形結(jié)構(gòu)數(shù)據(jù)中提取信息,以獲得預(yù)期效果[47-48]。
(2)基于情感模式的情感依賴(lài)建模
楊航(Yang H)等發(fā)現(xiàn)大多數(shù)情感依賴(lài)發(fā)生在相鄰的方面之間,并將具有相同情緒的連續(xù)方面定義為情緒簇[49]?;诖耍撗芯刻岢隽死们榫w模式(Sentiment Patterns)來(lái)指導(dǎo)模型的依賴(lài)關(guān)系學(xué)習(xí)。該情緒模式包括情緒集群(Sentiment Cluster)、情緒一致性(Sentiment Coherency)兩種,情緒集群是指用戶(hù)傾向于根據(jù)情感極性類(lèi)別對(duì)方面進(jìn)行聚類(lèi);情緒一致性,是指在啟發(fā)式思維的情況下,用戶(hù)可能會(huì)在任何思維暫停時(shí),提出一個(gè)與預(yù)先評(píng)論的方面具有相同極性的方面。情緒一致性模式分為全局一致性和局部一致性。
該研究引入局部情緒聚合(LSA)機(jī)制,重點(diǎn)學(xué)習(xí)情緒聚類(lèi)中的情緒依賴(lài)性;同時(shí)提出了聚合窗口構(gòu)建的差異權(quán)重來(lái)衡量情緒依賴(lài)的重要性,并在Lap14(F1:78.35%)、Rest14(F1:81.04%)、Rest15(F1:72.22%)、Rest16(F1:79.50%)等四個(gè)公共數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),實(shí)現(xiàn)了很好的性能。由于沒(méi)有額外的依賴(lài)矩陣構(gòu)造和建模,該方法比原有基于依賴(lài)樹(shù)的模型更有效。
基于原有研究成果[4,6,11,50-55],筆者通過(guò)分年度對(duì)比細(xì)粒度情感分析最新技術(shù)情況(見(jiàn)前文圖2、圖5),發(fā)現(xiàn)目前細(xì)粒度文本情感方法仍為基于機(jī)器學(xué)習(xí)的方法、基于情感詞典的方法,其中在機(jī)器學(xué)習(xí)方法中,深度學(xué)習(xí)方法被廣泛應(yīng)用?,F(xiàn)階段使用最多的技術(shù)方法依次為CNN、DNN、GCN、SVM、LSTM/BiLSTM、RNN、Ontology、LDA、lexicon等,如前文圖5藍(lán)色框標(biāo)注部分所示。
細(xì)粒度情感分析是一個(gè)活躍而蓬勃發(fā)展的研究領(lǐng)域,具有很強(qiáng)的實(shí)際應(yīng)用價(jià)值。在該領(lǐng)域,研究人員不斷提出、評(píng)估和比較不同的方法,目的是提高細(xì)粒度情感分析的性能,找到可以解決該領(lǐng)域挑戰(zhàn)的方法。本節(jié)的目的是對(duì)細(xì)粒度情感分析的近期常用方法進(jìn)行概述。
深度學(xué)習(xí)方法優(yōu)于傳統(tǒng)機(jī)器學(xué)習(xí)方法,目前已被廣泛應(yīng)用于細(xì)粒度情感分析領(lǐng)域,主要包括圖形卷積網(wǎng)絡(luò)GCN、深度神經(jīng)網(wǎng)絡(luò)DNN、卷積神經(jīng)網(wǎng)絡(luò)CNN、遞歸神經(jīng)網(wǎng)絡(luò)RNN等,相關(guān)理論方法已在相關(guān)研究中有所闡述[51-52],本節(jié)重點(diǎn)總結(jié)現(xiàn)階段細(xì)粒度情感分析領(lǐng)域的深度學(xué)習(xí)技術(shù)特點(diǎn)、基線,具體見(jiàn)表4。
表4 深度學(xué)習(xí)方法對(duì)比表
利用情感詞典和語(yǔ)言規(guī)則的方式解決方面級(jí)情感分析任務(wù),更接近于傳統(tǒng)情感分析方法利用情感詞典的解決思路,需要使用標(biāo)注好的情感詞典或語(yǔ)言規(guī)則來(lái)判別情感極性[63]。隨著網(wǎng)上一些新詞匯的大量出現(xiàn),基于情感詞典的方法在這些新的語(yǔ)料上表現(xiàn)不佳,甚至出現(xiàn)錯(cuò)誤[64]。目前SentiWordNet在細(xì)粒度情感分析領(lǐng)域使用最為廣泛[52],如:伊曼(Aboelela E M )等將SentiWordnet應(yīng)用于方面術(shù)語(yǔ)提取,構(gòu)建了基于語(yǔ)義關(guān)系的方面術(shù)語(yǔ)提取(SALOM)模型,該模型在M-phone數(shù)據(jù)集上的F1值達(dá)到97.7,效果很好[65]。經(jīng)歸納,筆者認(rèn)為基于詞典的情感分析研究呈現(xiàn)以下趨勢(shì)。
(1)情感詞典逐漸不再獨(dú)立使用,而是與深度學(xué)習(xí)算法相結(jié)合,通過(guò)知識(shí)增強(qiáng)[66],提升細(xì)粒度情感分析的性能。如:梁斌(Liang B)等將SenticNet與GCN相結(jié)合,構(gòu)建圖神經(jīng)網(wǎng)絡(luò),以增強(qiáng)句子的依賴(lài)圖,取得了很好的效果[56]。詹恩(Jain P K)等將SenticNet納入BERT-DCNN模型,使其能夠?qū)崿F(xiàn)概念層面的情感分析[67]。
(2)MPQA、How net、NTUSD、情感詞匯本體庫(kù)等傳統(tǒng)情感詞典逐漸成為種子詞典,成為特定領(lǐng)域情感詞典構(gòu)建的基礎(chǔ)組件[68-71]。
本節(jié)對(duì)常用的情感詞典進(jìn)行了梳理,并總結(jié)了相應(yīng)特點(diǎn)與最新利用情況,具體見(jiàn)表5。
表5 常見(jiàn)的詞典
遷移學(xué)習(xí)(Transfer Learning,TL)是一種利用數(shù)據(jù)、數(shù)據(jù)分布、模型任務(wù)等的相似性,將一個(gè)領(lǐng)域中已經(jīng)學(xué)習(xí)到的知識(shí)應(yīng)用到新領(lǐng)域的方法[77]。方面級(jí)情感分析是針對(duì)一個(gè)評(píng)論中涉及多種方面類(lèi)別時(shí)的情感分析,現(xiàn)有方法通常利用方面級(jí)數(shù)據(jù)集在神經(jīng)網(wǎng)絡(luò)模型上直接進(jìn)行訓(xùn)練,但已標(biāo)注的方面級(jí)訓(xùn)練數(shù)據(jù)規(guī)模較小,導(dǎo)致模型不能充分學(xué)習(xí)而性能受限[44]。遷移學(xué)習(xí)非常有用,可用于將獲得的情感分類(lèi)能力從一個(gè)領(lǐng)域轉(zhuǎn)移到另一個(gè)領(lǐng)域,快速構(gòu)建方面級(jí)數(shù)據(jù)集[78-79]。孫佳慧等通過(guò)目標(biāo)函數(shù)及注意力融合方法,將文檔級(jí)情感分析模型中的注意力權(quán)重融合到方面級(jí)情感分析模型中,從而使方面級(jí)文本情感分析性能得到提升[78]。
原有遷移學(xué)習(xí)模型輸出層使用的softmax功能僅支持單標(biāo)簽分類(lèi)任務(wù),故原有遷移學(xué)習(xí)模型并不支持多標(biāo)簽分類(lèi)[77-79];針對(duì)這一問(wèn)題,陶杰(Tao J)等設(shè)計(jì)了一種多標(biāo)簽的語(yǔ)義分析方法,并在Yelp 數(shù)據(jù)集上做了驗(yàn)證,效果超過(guò)基線[80]。另外在跨語(yǔ)言學(xué)習(xí)方面,苯索坦(Bensoltane R)等提出一種面向阿拉伯語(yǔ)的方面級(jí)情感分析遷移學(xué)習(xí)模型,該模型在方面術(shù)語(yǔ)提取、方面類(lèi)別檢測(cè)任務(wù)的總體增強(qiáng)率分別超過(guò)基線6%和19%[81]。
近年來(lái)細(xì)粒度情感分析研究熱度很高,對(duì)于方面和觀點(diǎn)抽取、情感分類(lèi)等基礎(chǔ)任務(wù)已經(jīng)有了很多研究與闡述[4,11,15,51-55],本文重點(diǎn)聚焦該領(lǐng)域的新近問(wèn)題,探討細(xì)粒度情感分析的最新任務(wù)、關(guān)鍵技術(shù)與發(fā)展趨勢(shì)。
本文基于Citespace對(duì)文本細(xì)粒度情感分析領(lǐng)域文獻(xiàn)進(jìn)行了主題變化研究,研究發(fā)現(xiàn),方面級(jí)情感三元組抽取、多粒度情感分析、隱式情感分析、情感依賴(lài)關(guān)系抽取為本領(lǐng)域最新任務(wù),且取得了明顯的研究進(jìn)展。筆者認(rèn)為,隨著深度學(xué)習(xí)、遷移學(xué)習(xí)等技術(shù)在該領(lǐng)域的不斷深化,以上任務(wù)有望取得更大進(jìn)步。
盡管細(xì)粒度情感分析領(lǐng)域發(fā)展整體走勢(shì)良好,但長(zhǎng)期以來(lái)一直橫亙于該領(lǐng)域科學(xué)研究與實(shí)際應(yīng)用之間的難點(diǎn)仍然存在,主要包括諷刺識(shí)別、復(fù)指與共指消解、語(yǔ)義消歧、跨語(yǔ)言情感分析等,這些難點(diǎn)不僅屬于文本細(xì)粒度情感分析領(lǐng)域,更是自然語(yǔ)言處理范疇需要解決的難題。
(1)諷刺識(shí)別
由于諷刺表達(dá)在我們?nèi)粘I钪斜粡V泛使用,而諷刺的復(fù)雜性和模糊性使得諷刺識(shí)別成為一項(xiàng)極具挑戰(zhàn)性的工作[82]。雖然一些研究者已經(jīng)開(kāi)展了這方面的研究[82-84],其中:任路(Ren L)等采用基于BERT的方面級(jí)情感分析方法提取上下文關(guān)系,并確定其是否具有諷刺性,該模型在Reddit數(shù)據(jù)集上的F1值為73.4%[84]。但目前諷刺對(duì)象的精準(zhǔn)識(shí)別仍是難點(diǎn),因?yàn)榧幢忝鎸?duì)同一句話,不同的人對(duì)諷刺目標(biāo)的識(shí)別也可能會(huì)有很大差異[72]。
(2)復(fù)指與共指消解
復(fù)指與共指都是語(yǔ)言術(shù)語(yǔ)之間的相互參照關(guān)系[73]。在情感分析中,尤其是基于方面的分析中,識(shí)別代詞在句子中指代的具體內(nèi)容非常有用,有助于提取給定實(shí)體的所有方面。然而,現(xiàn)有的研究處理中,代詞通常被忽略或刪除。雖然已有一些學(xué)者研究了復(fù)指與共指算法[85-86],但該領(lǐng)域仍需深入研究與不斷改進(jìn)。
(3)詞義消歧
詞義消歧是在特定語(yǔ)境下正確識(shí)別詞義的過(guò)程。不同語(yǔ)境下,單詞的含義不同,這對(duì)細(xì)粒度情感分析非常重要。一些研究利用WordNet與深度學(xué)習(xí)方法相結(jié)合[72-73,87],來(lái)進(jìn)行詞義消歧,取得了一定進(jìn)展。如:阿布達(dá)拉噶(Abdalgader K)等提出了一種基于圖的語(yǔ)義消歧方法,該方法通過(guò)WordNet獲得所有可用語(yǔ)義信息,以增加圖形語(yǔ)義連接性,從而識(shí)別給定上下文中單詞的預(yù)期含義[73]。與現(xiàn)有的無(wú)監(jiān)督語(yǔ)義消歧方法相比,取得了優(yōu)異的性能,在SemEval-15基準(zhǔn)數(shù)據(jù)集上的ACC值達(dá)到83.9%。
(4)跨語(yǔ)言情感分析
在現(xiàn)有細(xì)粒度情感分析領(lǐng)域,大多數(shù)研究集中在英語(yǔ)[56]。由于不同語(yǔ)種的句法、語(yǔ)法都有較大差異,往往在英語(yǔ)基準(zhǔn)數(shù)據(jù)集上驗(yàn)證可行的技術(shù)方法,移植到其他語(yǔ)種數(shù)據(jù)集上就不能適用。而對(duì)于非英語(yǔ)的情感分析研究而言,最大的問(wèn)題是缺少足夠可用的語(yǔ)料庫(kù),而構(gòu)建適合不同用途的語(yǔ)料庫(kù)往往需要很長(zhǎng)時(shí)間,且花費(fèi)大量人力,遷移學(xué)習(xí)為快速構(gòu)建相近領(lǐng)域的語(yǔ)料庫(kù)提供了一種方法[78-81],但從長(zhǎng)期看,構(gòu)建多語(yǔ)言語(yǔ)料庫(kù)仍是一件非?;A(chǔ)且非常重要的工作。
從以上難點(diǎn)來(lái)看,筆者認(rèn)為解決跨語(yǔ)言情感分析問(wèn)題雖工程浩大,但從長(zhǎng)期來(lái)看,已有英語(yǔ)語(yǔ)種的情感分析經(jīng)驗(yàn)可以借鑒,遷移學(xué)習(xí)技術(shù)也日漸成熟,只要研究者們不斷付諸努力,仍然有望攻克此難題。詞典的運(yùn)用可以從一定程度上輔助詞義消歧,但要想完全消除詞語(yǔ)歧義是不可能的,未來(lái)可結(jié)合GCN等深度學(xué)習(xí)技術(shù),提高詞義消歧效果。另外,諷刺識(shí)別、復(fù)指與共指消解這兩個(gè)難點(diǎn)需要在自然語(yǔ)言處理技術(shù)整體提高后,才有望解決。
文本細(xì)粒度情感分析的發(fā)展帶動(dòng)著情感分析領(lǐng)域的整體發(fā)展,隨著新技術(shù)的不斷深化,領(lǐng)域難點(diǎn)將逐漸轉(zhuǎn)化為新任務(wù),各項(xiàng)任務(wù)的解決也推動(dòng)著領(lǐng)域的不斷應(yīng)用與發(fā)展,未來(lái)該領(lǐng)域還將遇到新的機(jī)遇與挑戰(zhàn)。