王一溢 占繼爾 陳澤龍 田淵明
摘要:心理測量是利用標準化的測量工具對人的行為加以數(shù)量化的描述,來推測其個體心理過程和特征的技術(shù)。機器學習是讓計算機在大量數(shù)據(jù)的基礎(chǔ)上建立模型以獲得自主識別與學習新知識能力的方法?,F(xiàn)在心理學研究者們將機器學習與心理測量相結(jié)合,在醫(yī)療、心理咨詢、用戶分析等相關(guān)領(lǐng)域的運用進行了探索,且其獨特的優(yōu)勢正受到越來越多的學者的關(guān)注。該文綜述了當前機器學習在心理測量中應用現(xiàn)狀,并探究了其相應的社會價值和未來趨勢。
關(guān)鍵詞:人工智能;機器學習;心理測量
中圖分類號:TP3? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2021)03-0204-03
1 引言
心理測量是利用標準化的測量工具對人的行為加以數(shù)量化的描述,來推測個體心理過程和特征的技術(shù)[1]。心理學的傳統(tǒng)研究方法主要有觀察法、實驗法和問卷法等,這些方法中的樣本規(guī)模較小,無法滿足日益增長的代表性需求。具體來講,觀察法雖然能較好地保持生態(tài)性和客觀性,但是難以重復驗證和精確分析。實驗法具有可重復性,可得出因果關(guān)系,但人為性較高,易使被試出現(xiàn)迎合特征,出現(xiàn)社會贊許效應。在數(shù)據(jù)爆炸的時代,由于樣本量激增,問卷的制作、篩選和后期分析的工作量不斷增加。上述傳統(tǒng)的方法在心理現(xiàn)象的歷史文化及主觀能動性等特征的研究中已然存在缺陷[2]。在傳統(tǒng)推論統(tǒng)計方法下,心理學還面臨著“可重復危機”的挑戰(zhàn),機器學習正成為更優(yōu)良的驗證方法[3]。機器學習是一門多學科交叉專業(yè),涵蓋概率論知識,統(tǒng)計學知識,近似理論知識和復雜算法知識,使用計算機作為工具致力于真實實時的模擬人類學習方式, 并將現(xiàn)有內(nèi)容進行知識結(jié)構(gòu)劃分來有效提高學習效率的方法[4]。機器學習包括強化學習、監(jiān)督學習和深度學習,該方法可基于被試的語音、表情、文本等數(shù)據(jù),對被試的心理狀態(tài)進行判斷。
除了對驗證方法的更新,研究者在心理測量工具上也進行了人工智能領(lǐng)域的探索。心理學者們不斷嘗試通過問卷、量表等工具對人的心理特征進行測量,這類對心理潛在特質(zhì)的間接測量方法本質(zhì)上即一種可采用支持向量機進行建模的軟測量[5]。然而在傳統(tǒng)的心理測量工具的編制中,研究者往往采用因素分析法;在信效度檢驗方面,則多采用多元回歸的方法。上述方法仍停留于統(tǒng)計學的范疇,要求數(shù)據(jù)必須是等距變量、呈線性相關(guān),且總體須為正態(tài)[6]。然而在數(shù)據(jù)量呈幾何級數(shù)增長的今天,傳統(tǒng)的統(tǒng)計方法已難以適用,其結(jié)論信效度也會受到影響[7]。將人工智能領(lǐng)域中的粗糙集和神經(jīng)網(wǎng)絡與傳統(tǒng)測量方法進行對比分析發(fā)現(xiàn),粗糙集在離散化數(shù)據(jù)與決策表中約簡能力更高,神經(jīng)網(wǎng)絡則可以解決變量的非線性問題。運用該方法對員工勝任力的實踐研究進行處理,最終得到的正確分類率的均值為82.92%,顯著高于未使用該兩種處理的分類率均值[6]。因此在研究對象存在不確定性時,使用粗糙集的方法可以無須對數(shù)據(jù)集合外進行先驗假設(shè),讓結(jié)論更客觀。
2016年,AlphaGo戰(zhàn)敗李世石,其技術(shù)核心即采用策略網(wǎng)絡和蒙特卡洛模擬縮小搜索廣度和深度,結(jié)合在線搜索與深度學習,評估勝算和走法[8]。然而,AlphaGo是基于大規(guī)模的強化與深度學習產(chǎn)生的,如何在少樣本的情況下進行精度學習是機器學習應用于心理測量的必要過程。解決方法有三:產(chǎn)生式計算模型——可以通過少數(shù)樣本的學習獲得抽象概念;逆向推理技術(shù)——以貝葉斯網(wǎng)絡為代表推測最大概率導致目前結(jié)果的原因;深度學習——將抽象問題分解為多個層次加以學習,提高神經(jīng)網(wǎng)絡的計算效率。其目的是讓人工智能在有限資源下高效運行,使得機器在圖像、主題、語句的識別與分類中獲得更加高效的發(fā)展[8]。心理測量的本質(zhì)是結(jié)構(gòu)化的理論和數(shù)據(jù)模型,而人工智能的基礎(chǔ)是數(shù)據(jù)和算法?;诨ヂ?lián)網(wǎng)的特點,將機器學習與之相聯(lián)系不僅能提高診斷的時空效率,還能擴大診斷的范圍,甚至降低診斷費用,彌補了傳統(tǒng)方法的不足。
隨著互聯(lián)網(wǎng)的不斷發(fā)展,數(shù)據(jù)海量擴充,信息碎片化嚴重。為了更準確地診斷患者健康狀態(tài)、把握使用者的個性偏好、提高企業(yè)的服務質(zhì)量、輔助政府預測輿論風向,基于機器學習的用戶測量正逐漸成為醫(yī)療、市場、政務等領(lǐng)域關(guān)注的熱點。
2 機器學習在心理測量領(lǐng)域中的應用
2.1 身體測量
機器學習在醫(yī)療領(lǐng)域上的應用提高了診斷準確率。傳統(tǒng)的兒童心理障礙診斷主要以他人提供病史、精神心理創(chuàng)傷測量結(jié)果等為依據(jù),面對不同的兒童需進行多次人工診斷,耗時、效率低下。然而利用人工神經(jīng)網(wǎng)絡開發(fā)的診斷系統(tǒng)則彌補了這一缺陷[9]。研究者利用關(guān)系數(shù)據(jù)庫oracle設(shè)計用戶的癥狀輸入模塊,將收集的臨床資料建立資料庫作為神經(jīng)網(wǎng)絡學習的模板,使得系統(tǒng)可基于動態(tài)響應來處理外部輸入信息。對該系統(tǒng)進行測驗,同一病例在雙盲條件下,醫(yī)生對患者進行臨床診斷后,通過神經(jīng)網(wǎng)絡對輸入病癥進行判斷,在共查對的195對病例中人機診斷均完全符合,并未發(fā)現(xiàn)錯診漏診的情況。且該系統(tǒng)具有高度自學習性,自組織性,自適應性,具有很強的容錯能力對未見過的輸入數(shù)據(jù)組具有綜合推理能力。大大節(jié)省了時間及人工成本。
2.2 行為測量
隨著機器人在人類生活中重要性的增強,人們開始探究人類共情如何走向智能體共情[10]。人類的共情是個體基于與他人進行交互而不斷發(fā)展的。通過計算建模的方法對人類語音、圖像進行識別,可以提供人機和諧的基礎(chǔ),借助深度學習使機器在交互的過程進行自我學習,以發(fā)展和人類相似的共情系統(tǒng)即機器人識別對象的外部特征、分析篩選出與其相一致的情緒,通過對情緒類型與場景間的相關(guān)性計算給予適當?shù)男袨榉答仭_@樣的智能體共情系統(tǒng)已被運用到以下兩個方面:醫(yī)護場景——當一個人表示痛苦時,機器人就會對該個體釋放的信息進行識別分析并產(chǎn)生一系列接近與理解的行為;硬件調(diào)控系統(tǒng)——通過生物指標將情緒體驗所產(chǎn)生的體溫變化轉(zhuǎn)化為機器的電量水平及硬件運轉(zhuǎn)溫度。當機器人產(chǎn)生共情時,其電量水平會下降,硬件的運轉(zhuǎn)溫度會升高,為使機體恢復到正常狀態(tài)而反饋適當行為。通過共情反饋不僅給予患者情緒支持,還支持了醫(yī)療人員診斷。在南加州大學的simsensei心理健康研究中,研究者創(chuàng)建了一個交互式環(huán)境,用戶在放松的交談中機器將自動檢測和分析其行為。虛擬人采用了多義感框架結(jié)構(gòu),對用戶微笑強度、三維頭部位置、面部表情等非語言行為信號進行分析處理,以回饋用戶適當?shù)男袨椤Mㄟ^該環(huán)境還能夠讓用戶在與虛擬人交流過程中表露更多信息,提高診斷準確率[11]。
除醫(yī)療領(lǐng)域外,機器學習還有效地促進了用戶的個性化檢索。用戶偏好檢索是在給定查詢條件的基礎(chǔ)上,通過分析用戶行為特征挖掘用戶偏好從而為用戶提供個性化檢索結(jié)果,避免檢索結(jié)果超載的技術(shù)[12]。當前高校圖書館用戶偏好檢索方法主要以問卷調(diào)查、動態(tài)統(tǒng)計、查詢限制、半監(jiān)督機器學習等方法為主,這樣以“關(guān)鍵詞匹配”為主要運算方式的計算機檢索無法準確實時提取用戶偏好特征,檢索耗時長、多樣化檢索能力低、用戶滿意度不高。為了改善這樣的檢索缺陷,重慶大學試用了基于機器學習的用戶檢索系統(tǒng)——使用在線監(jiān)督學習讀者用戶偏好的技術(shù)框架,提取用戶檢索的文獻特征,監(jiān)督機器學習用戶偏好檢索模型,實時在線更新偏好檢索引擎,最終生成與用戶偏好變化保持一致的檢索結(jié)果排序[12]。這項改進為讀者提供了快捷準確的檢索方式,有利于高校圖書資源的充分利用,除圖書檢索行為,人類的很多行為特征亦可用機器學習的方法進行研究和預測,進而促進個性化服務的發(fā)展。
2.3 異常心理觀測
機器學習在心理咨詢領(lǐng)域的應用提高了把握用戶情緒傾向的準確率,對預測其相應行為提供了幫助。人們常用心理測量描述人的潛在心理特征,但心理測量所得數(shù)據(jù)通常是不完整的,結(jié)合計算智能在數(shù)據(jù)挖掘、目標預測等方面的功能,從測量數(shù)據(jù)中可挖掘出有關(guān)規(guī)則,得出更多信息[13]。近年使用機器學習進行心理健康測量的研究越來越多,一般方法大致歸納為三個步驟:獲取數(shù)據(jù)——借助網(wǎng)絡平臺收集用戶行為特征,借助問卷收集對應用戶的狀態(tài);清洗數(shù)據(jù)以提取相關(guān)特征;進行情感分析,建立機器模型。為了預測與干預抑郁癥的發(fā)生發(fā)展,研究者擺脫單一滯后的傳統(tǒng)心理問卷方法,借助機器學習分析用戶數(shù)據(jù)預測抑郁患者。國外在facebook和twitter上都做了相關(guān)的研究,運用LIWC 對摘取的文本進行自然語言處理,基于facebook發(fā)帖的內(nèi)容、時間頻率、長度建模,通過用戶的情緒表達、人際關(guān)系和自我認知來診斷抑郁,發(fā)現(xiàn)抑郁患者多使用第一人稱[14];運用支持向量機從twitter用戶活動中獲得的特征預測用戶的抑郁,準確率為69%[15]。通常自殺者會經(jīng)歷三個階段――自殺意念、自殺嘗試與自殺死亡。為區(qū)別無自殺意念者與自殺死亡者的特征差異,爬取兩者的微博活動數(shù)據(jù)并進行差異分析[16]。得出自殺死亡組的社交活躍度與工作詞匯的使用顯著低于無自殺意念組,而自我關(guān)注度與消極詞匯的使用則高于無自殺意念組。這一研究為鑒別估測抑郁患者提供了有效的借鑒方法。此外區(qū)別于Twitter等外國社交平臺,研究者借助新浪微博探究出在漢語自然語言中抑郁患者更趨近于使用第二人稱、死亡相關(guān)詞匯的使用與自殺可能性無關(guān)等本土化特點[17]。
當前研究者們已利用深度學習、機器學習等數(shù)據(jù)分析方法,進行自殺風險預測、抑郁癥識別、壓力感知等方面的研究。在自殺風險預測方面,可以通過人工神經(jīng)網(wǎng)絡對微博文本進行自動分類,展開基于深度學習的微博用戶自殺風險預測。將采集的數(shù)據(jù)進行篩選,分類出有自殺意愿和無自殺意愿兩類數(shù)據(jù),并使用卡方檢驗對其進行特征值提取。除人工神經(jīng)網(wǎng)絡技術(shù)外,采用Python深度學習庫Theano進行感知器的自組織自學習建模。最后用隨機數(shù)據(jù)進行模型檢驗并統(tǒng)計分析,得出模型的準確率達94%[18]。在抑郁預測方面,通過語言問答、文本朗讀、圖片描述的任務對被試進行正性、中性、負性三類情緒狀態(tài)的測量,基于實驗數(shù)據(jù)建立的語音抑郁識別模型精度可以達到82.9%[19];而基于機器學習的預測模型除輔助篩查抑郁患者外,還可有效分析抑郁癥的發(fā)生及預后影響因素、指導治療決策[20]。除預測異常心理和自殺等極端行為外,機器學習還可以預測正常人群的壓力感知,通過微博數(shù)據(jù)對用戶的壓力特征建模得出各壓力類別的平均檢測F-measure 達到70%,輔以網(wǎng)購行為數(shù)據(jù)最終實現(xiàn)80%的二分類檢測準確度,提升了測量準確性[21]。綜上,越來越多的學者從不同的行為特征對不同的人群進行抑郁的研究,大大助力了抑郁模型的本土化構(gòu)建。
2.4 情緒測量
網(wǎng)絡的快捷數(shù)次催生輿論風暴,及時把握輿論風向探究民情,有助于相關(guān)部門做出正確的決策以穩(wěn)定民心。網(wǎng)絡輿情系統(tǒng)主要用于識別熱點話題,通過機器學習自動確定作者在文本中的情緒傾向。例如國外的Goonie互聯(lián)網(wǎng)輿情監(jiān)測系統(tǒng)和Autonomy網(wǎng)絡輿情聚成系統(tǒng),國內(nèi)的TRS網(wǎng)絡輿情監(jiān)測系統(tǒng)、“軍犬輿情監(jiān)控系統(tǒng)”等。
大學生是最活躍的社會群體,由于三觀還為完全確立,常常被稱為“憤青”。因此高校進行校園網(wǎng)絡輿情分析是及時把握意見領(lǐng)袖與安撫學生偏激情緒的關(guān)鍵。以校園網(wǎng)絡論壇(BBS)為例,首先通過轉(zhuǎn)發(fā)評論的網(wǎng)絡行為權(quán)量用戶網(wǎng)絡威信及影響力,篩選出校園意見領(lǐng)袖。再爬取其論壇文本進行人工情緒特征詞匯的標注、完成文本建模,最后通過機器學習的分類器探測文本情感傾向性。在以南大為例的實驗當中,成功通過網(wǎng)絡影響力的指標篩選出意見領(lǐng)袖前50名,并分析比較出文本中正面情緒與負面情緒的差異[22]。但由于機器學習中分類器對反諷詞匯的誤判造成了負面情緒分類準確性高于正面情緒,而正面情緒分類召回率更高的數(shù)據(jù)結(jié)果。
文本模型構(gòu)建是輿情分析的首要任務,當前大部分方法是先人工標注特征詞,再借助“and”,“but”等連接詞辨析詞與詞之間關(guān)系。但這會破壞文檔的內(nèi)部結(jié)構(gòu),此外詞匯庫中還缺少了文章相關(guān)的專業(yè)詞匯,造成無法準確識別的結(jié)果。有研究者提出基于Wasserstein GAN的文檔表示模型WADM,直接對文檔進行嵌入表示[23]。在與多種方法的比較實驗中,對18786條文本進行分析得出精確度為58.25%,有較好的詞序表示性。將它運用在食品安全的網(wǎng)絡輿情分析上,對新聞、微博文本進行抓取,分析出5類話題,采用情感分析出4類情緒類別,得出情感話題分布圖,總結(jié)出網(wǎng)民對于幾類食品安全的關(guān)注程度及情緒特征。得出更多的人對添加劑超標食品安全問題表現(xiàn)出“悲哀”態(tài)度,相比其他話題有更多的人關(guān)心食品添加劑超標問題的結(jié)論。
在社會輿情分析中機器學習輔助管理者捕捉輿論動向,同時在企業(yè)用戶分析中,可以快速識別用戶關(guān)注的問題,分析出用戶情感狀態(tài)助力于企業(yè)決策。在對訪問用戶進行情緒分析輔助開展微博運營工作中,借助深度學習與自然語言處理技術(shù)相較于傳統(tǒng)設(shè)立運營專員的模式,極大程度上提升了工作效率、降低了人工成本。以Twitter文本為例,通過情感分析出三類數(shù)據(jù)集——消極的、積極的和介于兩者之間的。對數(shù)據(jù)集中的有意義形容詞做特征向量并進行機器學習,后進行語義分析確定同義詞以給予決策者極性情感反饋,數(shù)據(jù)證明該方法使準確率由88.2%提升至89.9%[24]。在分析電信用戶微博研究中處理文本數(shù)據(jù)時采用word2vec模型將每個詞映射成向量,通過詞與詞之間的距離來判斷它們之間的語義相似度。區(qū)別于傳統(tǒng)的RNN這類深度神經(jīng)網(wǎng)絡,LSTM可以長期保存輸入,有效解決了存儲遠距離上下文時對當前時刻輸出的影響。結(jié)合詞向量詞嵌入與 LSTM 深度學習模型的文本分類方法,對于電信官微用戶情緒分析效果十分有效[25]。在有高質(zhì)量訓練樣本標注的前提下,該方法可以很容易地延伸到其他 NLP 文本分類應用場景中,如客服投訴文本分類、客服服務質(zhì)量評價等。例如在股市風向的預測研究中,通過對抓取的股評數(shù)據(jù)進行語義標注分析出用戶正面和負面情感傾向,借助卷積神經(jīng)網(wǎng)絡分類器構(gòu)建CNN-Word2Vec 訓練模型在情感傾向分類方面比傳統(tǒng)樸素貝葉斯分析準確率更高,達到83.09% [26]。
3 總結(jié)與展望
無論是在人機交互的醫(yī)療場景中,還是在心理咨詢或用戶分析中,機器通過深度學習能對非語言行為進行反饋,對文本信息進行分類,并進行自學習自組織的分析處理。在醫(yī)療輔助與市場用戶回饋方面機器學習極大程度地提高了工作效率和準確性;在心理咨詢和輿情分析方面更是把握了用戶的情緒傾向?qū)︻A測其相應行為提供了幫助。但是不可否認,機器學習在心理測量上的應用存在不足之處,在對本土化的語法等自然語言處理中仍有待提高。綜上,由此類文章發(fā)表數(shù)量的上升趨勢可見,人工智能在心理學方向的研究將持續(xù)成為社會探究熱點。
參考文獻:
[1] 陳國鵬.心理測量的原理和應用[J].診斷學理論與實踐,2005,4(3):261-265,276.
[2] 陳晶.現(xiàn)代心理學研究方法整合之路——質(zhì)性與量化之整合[J].科技資訊,2007,5(17):184-185.
[3] 吳凡,顧全,施壯華,等.跳出傳統(tǒng)假設(shè)檢驗方法的陷阱——貝葉斯因子在心理學研究領(lǐng)域的應用[J].應用心理學,2018,24(3):195-202.
[4] 李昊朋.基于機器學習方法的智能機器人探究[J].通訊世界,2019(4):241-242.
[5] 余嘉元.心理軟計算的理論和應用[J].心理科學,2016,39(4):770-776.
[6] 余嘉元.粗糙集和神經(jīng)網(wǎng)絡在心理測量中的應用[J].心理學報,2008,40(8):939-946.
[7] 胡傳鵬,王非,過繼成思,等.心理學研究中的可重復性問題:從危機到契機[J].心理科學進展,2016,24(9):1504-1518.
[8] 周吉帆,徐昊骙,唐寧,等.“強認知”的心理學研究:來自AlphaGo的啟示[J].應用心理學,2016,22(1):3-11.
[9] 陳冰梅,李雪榮,蘇林雁,等.利用人工神經(jīng)網(wǎng)絡開發(fā)兒童心理障礙標準化診斷系統(tǒng)[J].電腦與信息技術(shù),1995,3(6):8-10.
[10] 顏志強,蘇金龍,蘇彥捷.從人類共情走向智能體共情[J].心理科學,2019,42(2):299-306.
[11] Morency L, Stratou G, DeVault D, et al. SimSensei Demonstration: A Perceptive Virtual Human Interviewer for Healthcare Applications: AAAI Publications[C].Twenty-Ninth AAAI Conference on Artificial Intelligence, 2015
[12] 沈敏,楊新涯,王楷.基于機器學習的高校圖書館用戶偏好檢索系統(tǒng)研究[J].圖書情報工作,2015,59(11):143-148.
[13] 余嘉元,田金亭,朱強忠.計算智能在心理學中的應用[J].山東大學學報(工學版),2009,39(1):1-5.
[14] Eichstaedt J C, Smith R J, Merchant R M, et al. Facebook language predicts depression in medical records[J]. Proc Natl Acad Sci U S A, 2018(44):11203-11208.
[15] Coppersmith G, Dredze M, Harman C. Quantifying Mental Health Signals in Twitter: Proceedings of the Workshop on Computational Linguistics and Clinical Psychology: From Linguistic Signal to Clinical Reality[C], 2014.
[16] 管理, 郝碧波, 程綺瑾, 等. 不同自殺可能性微博用戶行為和語言特征差異解釋性研究[J].中國公共衛(wèi)生, 2015(3):349-352.
[17] Cheng Q, Li T M, Kwok C L, et al. Assessing Suicide Risk and Emotional Distress in Chinese Social Media: A Text Mining and Machine Learning Study[J]. J Med Internet Res, 2017(7):e243.
[18] 田瑋,朱廷劭.基于深度學習的微博用戶自殺風險預測[J].中國科學院大學學報,2018,35(1):131-136.
[19] 潘瑋,汪靜瑩,劉天俐,等.基于語音的抑郁癥識別[J].科學通報,2018,63(20):2081-2092.
[20] 董健宇,韋文棋,吳珂,等.機器學習在抑郁癥領(lǐng)域的應用[J].心理科學進展,2020,28(2):266-274.
[21] 趙靚. 基于微博和網(wǎng)購行為的用戶心理壓力感知[D]. 清華大學, 2016.
[22] 羅晶. 校園輿情分析中的意見挖掘技術(shù)研究[D]. 東南大學, 2015.
[23] 李亞軍. 基于深度學習的食品安全網(wǎng)絡輿情分析[D]. 天津科技大學, 2018.
[24] Gautam G, Yadav D. Sentiment analysis of twitter data using machine learning approaches and semantic analysis: 2014 Seventh International Conference on Contemporary Computing (IC3), 2014[C]. IEEE.
[25] 蔡鑫, 婁京生. 基于LSTM深度學習模型的中國電信官方微博用戶情緒分析[J]. 電信科學, 2017(12):136-141.
[26] 張翰垠. 股市輿情數(shù)據(jù)的挖掘與分析研究[D]. 蘭州理工大學, 2019.
【通聯(lián)編輯:代影】