劉禹辰 王偉
摘? ?要:在當(dāng)今的大數(shù)據(jù)時代, 隱私挖掘和用戶畫像已經(jīng)成為分析目標(biāo)特征的一項重要技術(shù)。文章通過對傳統(tǒng)情緒智力模型進行改進,提出了一種情緒智力水平的量化方法。該方法對目標(biāo)用戶在不同社交網(wǎng)絡(luò)下產(chǎn)生的自然數(shù)據(jù)進行提取、分詞和情感分析后,使用模型內(nèi)各指數(shù)的生成規(guī)則量化目標(biāo)用戶的情緒智力,構(gòu)建情緒智力模型并生成情緒智力值。最后分析了模型量化結(jié)果的具體案例和群體得分分布,并證明了通過隱私信息挖掘量化目標(biāo)用戶情緒智力方法的可行性、可量化、可解釋等特點。
關(guān)鍵詞:情緒智力;隱私挖掘;用戶畫像;情感分析
中圖分類號:TP391.1? ? ? ? ? 文獻標(biāo)識碼:A
Privacy mining and emotional intelligence portrait in social networks
Liu Yuchen, Wang Wei
(Beijing Key Laboratory of Security and Privacy in Intelligent Transportation, Beijing Jiaotong University, Beijing, 100044)
Abstract: Privacy mining and user portraits have already become an important technology for target feature analysis in the big data era. This paper improves the traditional emotional intelligence model and proposes a quantitative method for the level of emotional intelligence. This method extracts, segments and emotional analyzes the natural data generated by the target users in different social networks, and then quantitates the target users' emotional intelligence ability by generating rules of indices in the model, constructs emotional intelligence model and generates the emotional intelligence number. Finally, this paper analyses the specific cases of quantitative results and the distribution of group scores, and proves that the method of quantifying the emotional intelligence of target users through privacy information mining is measurable and feasible.
Key words: emotional intelligence; privacy mining; user portrait; emotional analysis
1 引言
隨著互聯(lián)網(wǎng)的飛速發(fā)展,人們越來越依靠網(wǎng)絡(luò)進行日?;顒樱@些行為在網(wǎng)絡(luò)上留下的痕跡經(jīng)過數(shù)據(jù)挖掘就可以生成用戶畫像。雖然該技術(shù)已經(jīng)有了較為成熟的理論和商業(yè)應(yīng)用,但大多局限于生成目標(biāo)在某個特征上的畫像,很少有涉及其本身性質(zhì)的。為了能夠通過目標(biāo)用戶在社交網(wǎng)絡(luò)中產(chǎn)生的自然數(shù)據(jù)獲取其人性方面的畫像,本文以傳統(tǒng)的情緒智力模型為基礎(chǔ),提出了一個構(gòu)建用戶情緒智力畫像的方法,以反映目標(biāo)的情緒控制能力、壓力應(yīng)對能力、人際關(guān)系能力等多種內(nèi)在特質(zhì)。
2 隱私數(shù)據(jù)挖掘
數(shù)據(jù)挖掘[1]作為一種通過相關(guān)算法在大量的數(shù)據(jù)中搜索并找出隱藏信息的技術(shù),已被廣泛應(yīng)用到科學(xué)、醫(yī)學(xué)和商業(yè)領(lǐng)域[2]。隨著信息安全與數(shù)據(jù)挖掘的融合,對含有用戶隱私信息的數(shù)據(jù)進行隱私挖掘變得備受青睞。該技術(shù)將目標(biāo)用戶的隱私數(shù)據(jù)進行適當(dāng)?shù)淖匀徽Z言處理后,通過某些特定的算法和規(guī)則生成其在某些特質(zhì)方面的畫像,從而分析并獲得目標(biāo)用戶的個人隱私。
社交網(wǎng)絡(luò)上的數(shù)據(jù)可以按照數(shù)據(jù)的公開性分為媒體數(shù)據(jù)和聊天數(shù)據(jù)。本文使用網(wǎng)絡(luò)爬蟲采集了微博、豆瓣和美團點評三個分別在各自領(lǐng)域具有代表性的網(wǎng)絡(luò)社交媒體數(shù)據(jù)。這類數(shù)據(jù)獲取方便、數(shù)據(jù)量足夠大,但由于社交平臺是公開的,目標(biāo)在發(fā)表言論時勢必有所保留,這會導(dǎo)致在后續(xù)分析過程中存在一定偏差。
網(wǎng)絡(luò)社交聊天數(shù)據(jù)能夠更準(zhǔn)確地分析目標(biāo)的內(nèi)在特質(zhì),本文通過手機聊天軟件獲取用戶的聊天數(shù)據(jù)。微信是人們當(dāng)前使用最廣的一款即時通訊軟件,含有足夠的隱私數(shù)據(jù)。由于微信的聊天記錄都是儲存在本地的,因此只要掌握數(shù)據(jù)庫密碼的生成算法,就可以很方便地采集到用戶的聊天數(shù)據(jù)。
3 中文分詞與情感分析
3.1 中文文本分詞
在獲取到足夠的數(shù)據(jù)后,就需要進行自然語言處理,本文采用基于統(tǒng)計的分詞方法進行中文文本分詞[3]。該方法與傳統(tǒng)的基于詞典的分詞方法相比,能夠很好地處理歧義問題和未登錄詞識別問題[4]。
首先使用全切分法[5]對文本進行所有形式的切分,然后從右向左依次計算各分詞的出現(xiàn)頻率,最終得到該情況下整句的出現(xiàn)頻率,而所有情況中句頻最大的情況即為近似最優(yōu)解。對于未登錄詞的處理則使用隱馬爾科夫模型[6],將一個句子以“BEMS”組成的序列串作為輸出,通過調(diào)用維特比算法計算出這個句子關(guān)于“BEMS”狀態(tài)的最大可能輸出序列,從而完成整個句子的分詞。
3.2 中文情感分析
情感分析是對帶有情感色彩的主觀性文本進行分析處理的過程[7]。本文采用一種基于詞典和統(tǒng)計相結(jié)合的方法進行情感分析,對于詞典中收錄的詞使用查詢的方法計算情感值,對于未登錄詞通過相似度匹配算法判斷其是否為情感詞,并計算近似情感值。
3.2.1 情感詞的情感值
情感詞典是對情感詞進行極性分類、情感分類和強度分析的詞典,本文選取大連理工大學(xué)信息檢索研究室的情感詞匯本體庫[8]作為情感詞典。該庫將情感分為樂、怒、哀、懼等七個大類,每個情感詞具有強度和極性兩個屬性。
對于一個存在于情感詞典中的詞語,設(shè)為該詞的情感值得分,為情感詞強度,為修正后的情感詞極性,則其情感值為。當(dāng)該詞的情感屬性與極性相同時,;相反時,;當(dāng)該詞的情感極性為中性或褒貶兼有時,。
3.2.2 未登錄詞的情感值
對于情感詞典中未收錄的詞語,首先要進行情感詞的判斷。判斷方法為選取一些情感詞作為詞原,然后計算該詞與詞原的相似度,若相似度足夠大則判斷其為情感詞并計算情感值。
知網(wǎng)提供的語義層次樹是當(dāng)前覆蓋范圍最廣的中文語義關(guān)系網(wǎng)絡(luò)[9],可以用于相似度的計算。由于該網(wǎng)絡(luò)以詞義為單元,故需將詞原分解為更小的義原。對于詞語和詞原,其詞語相似度即為各義原相似度的最大值,義原間的相似度為:
其中,為兩個義原在語義層次樹中的距離,為可調(diào)節(jié)參數(shù),取[10]。
將情感詞典中所有詞語作為詞原,計算未登錄詞與所有詞原的相似度,相似度最大的即為未登錄詞的近似詞原。設(shè)近似度閾值,為近似詞原的情感值,則該詞的最終情感值為:
3.2.3 副詞的情感值修正
除情感詞外,副詞也會很大程度上影響句子的情感值。本文綜合了知網(wǎng)的程度和否定副詞表,使用影響因子來量化影響程度,如表1所示。
對于被副詞修飾的情感詞,其情感值修正為原情感值依次乘以所有修飾副詞的影響因子。此外,當(dāng)否定詞在程度副詞之前時會降低修飾程度,此時修正其影響因子為原來的一半。
3.2.4 句子的情感值
將全句中所有情感詞依次相加,即可得到該句的情感值 ,然后通過引入反正切函數(shù)保證其在低分?jǐn)?shù)段區(qū)分度放大且整體收斂。此外,若句中存在遞進或轉(zhuǎn)折關(guān)聯(lián)詞,則做出如下修正。
(1)遞進,即后句擁有比前句更強的情感。設(shè)前句情感值為e1,后句為e2,則e=e1+1.5e2。
(2)轉(zhuǎn)折,即后句擁有與前句完全相反的情感,此時e=-e1+e2。
4 構(gòu)建情緒智力畫像
4.1 情緒智力
情商[11]這一概念由以色列心理學(xué)家巴昂首創(chuàng),美國心理學(xué)家薩羅維首次提出情緒智力這一概念,定義為“監(jiān)控自己和他人的情感和情緒,對其加以識別并用這些信息指導(dǎo)自己的思維和行為的能力”[12]。此后,巴昂聯(lián)合多名學(xué)者出版了《情緒智力手冊》,提出了標(biāo)準(zhǔn)的情緒智力測量方法,即巴昂情緒智力模型。該模型是當(dāng)今最受認可的情緒智力模型,包括個體內(nèi)部、人際、適應(yīng)性、壓力管理和一般心境五個指數(shù)[13]。
然而隨著這一模型的普及,其在量化過程中存在的問題也暴露出來[14]。一是情緒智力的善變性,即與接受測試時相比,目標(biāo)的情緒智力水平會發(fā)生改變。二是測試結(jié)果的真實性,即目標(biāo)在受測時的積極程度和主動性。若目標(biāo)的心情是快樂,就會下意識地作出樂觀的判斷,導(dǎo)致整體結(jié)果偏向于高分,反之亦然。此外,目標(biāo)是否主動配合測試也影響結(jié)果的真實性,目標(biāo)或許會對于某些方面的問題避而不談,甚至弄虛作假,導(dǎo)致最終結(jié)果不準(zhǔn)確。
4.2 模型改進
隨著隱私挖掘技術(shù)的介入,上述兩個問題都得到了很好的解決。傳統(tǒng)的巴昂情緒智力模型試圖用一般心境指數(shù)來修正目標(biāo)受測時的積極程度,但由于人為干預(yù)的可能性無法排除,因此仍存在很大的偏差。隱私挖掘方法能夠在目標(biāo)不知情的情況下獲取數(shù)據(jù),具有很高的真實性。對于量化過程中的另一個缺陷,由于獲取的是用戶在所有時間段的社交數(shù)據(jù),便可以從整體上計算用戶的情緒智力能力,無需拘泥于某一時刻的改變。
為使傳統(tǒng)的情緒智力模型能更好地反映目標(biāo)的情緒智力水平,本文在不影響原模型結(jié)構(gòu)的前提下做出了一些改進。首先,取消了一般心境指數(shù),因為在當(dāng)前技術(shù)背景下已無需對數(shù)據(jù)的真實性進行修正。其次,將個體內(nèi)部指數(shù)分為認知和管理兩個指數(shù),以便從宏觀和微觀分別量化目標(biāo)的情緒控制能力。改進后模型的結(jié)構(gòu)如下。
(1)認知指數(shù),衡量目標(biāo)是否能在大多數(shù)情況下,擁有對情緒的自我意識。
(2)管理指數(shù),衡量目標(biāo)是否能在各種情況下,維持情緒狀態(tài)穩(wěn)定不變。
(3)壓力指數(shù),衡量目標(biāo)是否能在情緒因突發(fā)事件而受到巨大影響時,迅速調(diào)整其回到常態(tài)。
(4)感染指數(shù),衡量目標(biāo)能否快速理解他人情緒,并使得自我情緒被帶入。
(5)人際指數(shù),衡量目標(biāo)在日常人際交往過程中受到的認可程度和接納程度。
4.3 模型量化
將情感值與情緒智力模型聯(lián)系起來,就可以通過句子情感值來量化各指數(shù)的大小,從而計算總情緒智力值。首先,使用窗口將文本數(shù)據(jù)進行分塊,規(guī)定若窗口值為,則每個窗口內(nèi)含有個被測目標(biāo)的句子。此時在各窗口內(nèi)被測目標(biāo)的情感值為該窗口下各句的平均情感值,方差為各句情感值得分的方差,情緒變化值為前后兩窗口平均情感值的差。此外,由于部分文本中含有對話,故數(shù)據(jù)中還存在與被測目標(biāo)交流的陪測目標(biāo),陪測目標(biāo)擁有與被測目標(biāo)類似的平均情感值、方差和情緒變化值。
在選擇了合適的窗口大小后,通過每次后移一個句子的方式可計算每個窗口內(nèi)的數(shù)據(jù)值,然后根據(jù)模型要求進行判斷和計算。下面分別給出情緒智力模型中五個指數(shù)的量化方法。
4.3.1 認知指數(shù)
認知指數(shù)評價目標(biāo)對自我情緒的認知能力,主要體現(xiàn)在各窗口情感值的方差上,即認為擁有低方差值的目標(biāo)能夠維持一個較為穩(wěn)定的平均情感值,擁有較強的情感認知能力。此外,該指數(shù)也受文本的總情感值影響。若目標(biāo)數(shù)據(jù)文本的總句數(shù)為,總窗口數(shù),則其認知指數(shù)為。
4.3.2 管理指數(shù)
管理指數(shù)評價目標(biāo)的情緒管理能力,判斷規(guī)則:當(dāng)某窗口內(nèi)目標(biāo)的情感值方差超過0.1時,說明此時其情感值發(fā)生了較大波動,標(biāo)記該窗口為波動窗口。然后評估目標(biāo)到情緒穩(wěn)定且情感值為正值所需的時間,即出現(xiàn)一個方差值不超過0.1且平均情感值為正值的窗口所需的時間。
設(shè)波動窗口出現(xiàn)后,下一個滿足條件的窗口首句與波動窗口首句間相差個句子,則該窗口的管理指數(shù)為。目標(biāo)的管理指數(shù)為所有波動窗口管理指數(shù)的平均值。
4.3.3 壓力指數(shù)
壓力指數(shù)評價目標(biāo)在壓力下調(diào)整自我情緒的能力。首先規(guī)定當(dāng)某窗口內(nèi)目標(biāo)的平均情感值小于0時,為目標(biāo)受壓情況,標(biāo)記該窗口為受壓窗口,然后評估目標(biāo)在受壓后將情感值首次調(diào)整為正值所需的時間。
設(shè)受壓窗口出現(xiàn)后,下一個平均情感值為正值的窗口首句與受壓窗口首句間相差個句子,則該窗口的壓力指數(shù)為。目標(biāo)的壓力指數(shù)為所有受壓窗口壓力指數(shù)的平均值。
4.3.4 感染指數(shù)
感染指數(shù)評價目標(biāo)情緒受他人影響的程度,判斷規(guī)則:當(dāng)某窗口內(nèi)陪測目標(biāo)的情感值方差超過0.1時,說明陪測目標(biāo)的情感值發(fā)生了較大波動,標(biāo)記該窗口為被感染窗口。在該類窗口內(nèi),被測目標(biāo)的情感值方差和情緒變化值為計算感染指數(shù)的重要指標(biāo)。同時,用相似參數(shù)表示該窗口內(nèi)被測目標(biāo)與陪測目標(biāo)平均情感值的相似程度,取。則該窗口的感染指數(shù)為,目標(biāo)的感染指數(shù)為所有被感染窗口感染指數(shù)的平均值。
4.3.5 人際指數(shù)
人際指數(shù)評價目標(biāo)影響他人情緒的能力,與感染指數(shù)的量化方式大致相同。當(dāng)某窗口內(nèi)被測目標(biāo)的情感值方差超過0.1時,說明被測目標(biāo)的情感值發(fā)生了較大波動,標(biāo)記該窗口為影響性窗口。則該窗口的人際指數(shù)為,目標(biāo)的人際指數(shù)為所有影響性窗口人際指數(shù)的平均值。
5 情緒智力量化結(jié)果與分析
5.1 結(jié)果分析
5.1.1 目標(biāo)量化結(jié)果分析
根據(jù)上述量化方法,將獲取到的用戶數(shù)據(jù)先后通過文本分詞、情感分析和模型構(gòu)建處理,就可以量化出目標(biāo)用戶的各項指數(shù)及最終情緒智力值。
現(xiàn)任選幾組目標(biāo)數(shù)據(jù)進行實驗,首先進行數(shù)據(jù)清理和文本分詞,分詞結(jié)果如圖1所示。
分詞結(jié)果中,詞語使用單斜線分隔,句子使用雙斜線分隔。在分詞完成之后,就通過情感分析,計算每個句子的情感值,計算結(jié)果如圖2所示。
根據(jù)上文中的情緒智力量化方法,通過句子情感值計算出五個指數(shù)的具體數(shù)值。由于各指數(shù)間的量化方法是相互獨立的,故在生成目標(biāo)用戶的總情緒智力值時需要對各指數(shù)分別進行加權(quán),保證各級指數(shù)的評分模式處于同一水平下,然后將各加權(quán)后的指數(shù)得分取平均值,即為用戶的總情緒智力值,結(jié)果如表2所示。
其中,第1、3、5組為點評數(shù)據(jù),第2、4、6組為影評數(shù)據(jù),第7、8組為聊天數(shù)據(jù),表中選取的均為在相應(yīng)方面內(nèi)比較有代表性的數(shù)據(jù)結(jié)果。由各組的數(shù)據(jù)得分可以看出, 社交網(wǎng)絡(luò)數(shù)據(jù)的分?jǐn)?shù)與用戶的手動評分級別基本成正相關(guān)趨勢,隱私聊天數(shù)據(jù)由于其對話信息較為密集,故其人際指數(shù)得分普遍較高。
表中的各項指數(shù)代表著目標(biāo)用戶在該項上的具體能力水平,分值越高表明其在該項上的能力越強。例如,第2組數(shù)據(jù)的各項指數(shù)均較高,說明該目標(biāo)的各項情緒智力能力都很優(yōu)秀,而觀察上圖中的用戶文本也可以發(fā)現(xiàn),該目標(biāo)的確做出了積極的評價,情感分析結(jié)果中的句子情感值也基本保持正值,且部分句子情感值得分較高;而第3組數(shù)據(jù)中的管理指數(shù)得分較低,說明該目標(biāo)在情緒控制方面的能力較差,而觀察其用戶文本發(fā)現(xiàn),該目標(biāo)的確在評價中對于其不喜愛的方面給予了較低的評價,且在后文中持續(xù)對這些方面進行評論和抱怨;第7組數(shù)據(jù)中的壓力指數(shù)較低,說明該目標(biāo)的壓力應(yīng)對能力較差,這也在其用戶文本中得到了體現(xiàn)。
5.1.2 群體分布情況分析
將所有數(shù)據(jù)集的量化結(jié)果按一定的各分?jǐn)?shù)段進行數(shù)量統(tǒng)計,通過各分?jǐn)?shù)段的用戶頻數(shù)值,就可以生成目標(biāo)群體在各指數(shù)下的得分分布情況及其回歸曲線,具體分布結(jié)果如圖3和圖4所示。
圖3和圖4分別為對80萬條社交網(wǎng)絡(luò)數(shù)據(jù)和100組微信聊天記錄數(shù)據(jù)進行量化,得到的認知和管理指數(shù)得分分布圖和回歸曲線。由圖中數(shù)據(jù)可以看出,大多數(shù)用戶的得分都處在一個中等的分?jǐn)?shù)段內(nèi),只有少數(shù)用戶的得分極高或極低。將五個指數(shù)以相應(yīng)的權(quán)重加和,得到目標(biāo)用戶的總情緒智力值分布圖,如圖5所示。
由上述結(jié)果可以看出,在本情緒智力模型中,大多數(shù)目標(biāo)的情緒智力值集中在80~130分范圍內(nèi),占總數(shù)的65.28%,屬于正常情緒智力水平;低于80分的占21.96%,為較低情緒智力水平;高于130分的占12.76%,為較高情緒智力水平。各指數(shù)結(jié)果和總體結(jié)果趨于正態(tài)分布,符合基本的統(tǒng)計規(guī)律,也符合人們?nèi)粘τ谇榫w智力值的理解和認知。
此外,在社交網(wǎng)絡(luò)數(shù)據(jù)中存在著一些具有評分屬性的點評類數(shù)據(jù),這些數(shù)據(jù)本身就包含目標(biāo)的情感信息,能夠?qū)η榫w智力值的準(zhǔn)確性起到驗證作用。圖6為所有點評數(shù)據(jù)中,各級評分的人數(shù)和該評分群體所有目標(biāo)用戶的平均情緒智力值。
由圖6的結(jié)果可以看出,評分低的用戶群體其平均情緒智力值也較低,反之亦然。而各評分用戶的分布走勢也與情緒智力值分布結(jié)果大致相同。
5.2 窗口值選取
窗口寬度值會很大程度上影響情緒智力模型的量化結(jié)果。當(dāng)窗口值較小時,會導(dǎo)致用方差進行窗口判斷的管理、感染和人際指數(shù)出現(xiàn)漏報情況,使量化結(jié)果整體偏小;當(dāng)窗口值較大時,由于目標(biāo)用戶很少會長時間保持較低情感,故會導(dǎo)致受壓窗口的漏報,使結(jié)果整體偏大。窗口值為三種不同情況時,目標(biāo)群體的情緒智力得分分布如圖7、圖8和圖9所示。
由上述結(jié)果可以看出,過小的窗口值會嚴(yán)重影響最終結(jié)果,而過大則會使得情緒智力值結(jié)果的區(qū)分度不夠明顯。因此,選取最合適的窗口值就需要在保證窗口能夠完整反映大多數(shù)負向情感的前提下,使窗口值盡量大。建議在選取窗口值時優(yōu)先選取一個中等大小的數(shù)值范圍,然后分別以該范圍內(nèi)所有整數(shù)為窗口值對數(shù)據(jù)進行模型構(gòu)建,最終選取能夠使量化結(jié)果區(qū)分度較大的數(shù)值作為窗口值。按照這一規(guī)則選取的窗口值既能確保受壓窗口的判斷不受影響,又能夠使其他指數(shù)的結(jié)果更加準(zhǔn)確可靠。
5.3 結(jié)論
通過以上隱私數(shù)據(jù)分析和情緒智力畫像方法,可得到四個結(jié)論。
(1)本文的方法能夠通過目標(biāo)用戶在社交網(wǎng)絡(luò)上留下的行為數(shù)據(jù),分析得到屬于個人隱私的情緒智力能力,包括目標(biāo)的自我認知、情緒管理、壓力應(yīng)對、社交感染和人際交往能力,以及總的情緒智力值。這些結(jié)果反映出目標(biāo)所具有的各項能力水平,并且能夠在其社交文本內(nèi)容上得到很好的解釋和印證。
(2)由目標(biāo)用戶群體量化結(jié)果可以看出,各項指數(shù)的得分分布基本都呈現(xiàn)“中間多,兩端少”的狀態(tài),與正態(tài)回歸曲線有著較高的契合度;同時,各級評分的用戶平均情緒智力值折線走勢也與總情緒智力值得分分布大體相同。這些現(xiàn)象證明了本文提出的情緒智力模型量化方法的確能夠在一定程度上區(qū)分不同目標(biāo)用戶的情緒智力水平,在情緒智力能力方面也能夠給出較為準(zhǔn)確的評價。
(3)本文所有實驗數(shù)據(jù)全部來自社交網(wǎng)絡(luò),實驗結(jié)果也均為目標(biāo)用戶在社交網(wǎng)絡(luò)下的情緒智力畫像結(jié)果。由于本文是通過用戶的文本數(shù)據(jù)進行分析的,因此對于任何能夠提供用戶文本信息的數(shù)據(jù)源,均可使用本文的方法進行情緒智力量化,即該方法在一定程度上具有普適性。
(4)本文的情緒智力模型的五項指數(shù)經(jīng)巴昂傳統(tǒng)情緒智力定義,受窗口值等參數(shù)影響,由文本分詞、情感分析情況和模型量化方式共同決定最終結(jié)果。因此,只要準(zhǔn)確應(yīng)用本文的情緒智力模型量化方法,任何能夠完成文本分詞且能夠分析并計算出句子情感值的方法都可被用于情緒智力模型的量化與構(gòu)建。
6 結(jié)束語
本文從數(shù)據(jù)挖掘和用戶畫像的角度出發(fā),通過用戶在社交網(wǎng)絡(luò)下的行為數(shù)據(jù),分析其情緒智力能力。在通過網(wǎng)絡(luò)爬蟲、密碼破譯、文本分詞等手段采集并處理數(shù)據(jù)后,使用基于詞典和統(tǒng)計的中文情感分析方法計算情感值。該方法通過情感詞典查詢和相似度比對分別對不同的詞語進行情感值計算,并從詞語極性、強度、修飾、關(guān)聯(lián)詞等方面進行修正,降低了語法規(guī)則造成的誤差,提高了最終結(jié)果的精確性。
為使情感值能夠反映目標(biāo)的情緒智力水平,本文分析了巴昂情緒智力模型的各項重要指標(biāo),提出了一個包含認知、管理、壓力、感染、人際五項指數(shù)的改進型模型,并給出了量化規(guī)則。該規(guī)則以窗口為基本單位,通過特定數(shù)值情況判斷特殊窗口,計算目標(biāo)在各情況下的情感變化程度與情緒智力能力,并生成情緒智力值。隨著人工智能的不斷普及,情緒智力分析在對人性探索方面有著越來越重要的意義,在對目標(biāo)進行分析和預(yù)測上也發(fā)揮著越來越重要的作用。
基金項目
1.國家重點研發(fā)計劃重點專項(項目編號:2017YFB0802805);
2.國家自然科學(xué)基金(項目編號:U1736114)。
參考文獻
[1] 吳超超,李偉春.基于隱私保護的數(shù)據(jù)挖掘技術(shù)與研究[J].科技資訊, 2015(15): 20.
[2] 張海濤,黃慧慧,徐亮,高莎莎.隱私保護數(shù)據(jù)挖掘研究進展[J].計算機應(yīng)用研究, 2013,12(15):3529-3535.
[3] 吳熠瀟.中文分詞相關(guān)算法研究[J].科技經(jīng)濟導(dǎo)刊, 2017(27):122-123.
[4] 陳開昌.自然語言處理技術(shù)中的中文分詞研究[J].信息與電腦(理論版), 2016(19):61-63.
[5] 常朝穩(wěn),魏進.基于全切分算法的歧義識別與處理[J].計算機工程與應(yīng)用, 2008,44(15): 145-147.
[6] 岑詠華,韓哲,季培培.基于隱馬爾科夫模型的中文術(shù)語識別研究[J].現(xiàn)代圖書情報技術(shù), 2008(12):54-58.
[7] Liu B. Sentiment analysis and subjectivity[A]. N. Indurkhya, F. J. Damerau. Handbook of Natural Language Processing[M]. Second Edition, Florida:CRC Press, 2010,627-661.
[8] 徐琳宏,林鴻飛,潘宇.情感詞匯本體的構(gòu)造[J].情報學(xué)報,2008,27(2):180-185.
[9] 閆紅,李付學(xué),周云.基于HowNet句子相似度的計算[J].計算機技術(shù)與發(fā)展, 2015(11):53-57.
[10] 劉群,李素建.基于《知網(wǎng)》的詞匯語義相似度計算[J].中文計算語言學(xué), 2002,7(2): 59-76.
[11] Bar-On R. BarOn Emotional Quotient Inventory:Technical Manaual[M]. Toronto: Multi-Health Systems Ins, 1997,1-8.
[12] Mayer JD, Salovey P. The Intelligence of Emotional Intelligence[J]. Intelligence, 1993,17(4):433-442.
[13] Bar-On R. The Handbook of Emotional Intelligence[M]. San Francisco: Jossey-Bass, 2000,1-10.
[14] Bar-On R. BarOn Emotional Quotient Inventory: Youth Version Technical Manaual[M]. Toronto:Multi-Health Systems Ins, 2000,6-7.