林 媛
(華南農(nóng)業(yè)大學(xué),廣東 廣州 510642)
隨著人們生活壓力的不斷增加,一分部人可能存在一定的心理疾病,而心理障礙是一種常見的心理疾病,輕微的心理障礙可以通過自身調(diào)節(jié)進(jìn)行治愈,而嚴(yán)重的心理障礙問題就需要進(jìn)行相應(yīng)的治療,因此心理障礙問題已經(jīng)成為困擾人們生活健康的一個(gè)重要難題[1?3]。心理障礙的發(fā)生過程是一個(gè)長時(shí)間積累的過程,對心理障礙發(fā)展程度進(jìn)行預(yù)測,可以幫助人們提前了解心理障礙將來的狀態(tài),盡可能早地制定一些調(diào)節(jié)和治療措施,降低心理障礙發(fā)生的機(jī)率。因此心理障礙預(yù)測研究成為當(dāng)前心理數(shù)據(jù)挖掘中的一個(gè)熱點(diǎn)方向[4?6]。
針對心理障礙預(yù)測問題,近10 多年人們進(jìn)行了深入的探討,并取得了一些不錯的成果,提出許多有效的心理障礙預(yù)測模型。將心理障礙預(yù)測模型可以劃分為兩大類,一類是傳統(tǒng)心理障礙預(yù)測模型,另一類為現(xiàn)代心理障礙預(yù)測模型。傳統(tǒng)心理障礙預(yù)測模型采用傳統(tǒng)數(shù)學(xué)建模方法進(jìn)行,如多元線性回歸,對心理障礙歷史數(shù)據(jù)進(jìn)行分析,找到相應(yīng)的多元線性回歸系數(shù),建立相應(yīng)的心理障礙預(yù)測模型,并對將來一段時(shí)間的心理障礙進(jìn)行估計(jì)預(yù)測,對心理障礙問題進(jìn)行了簡化。因此心理障礙預(yù)測結(jié)果不太可靠,無法適應(yīng)現(xiàn)代心理障礙預(yù)測建模的要求?,F(xiàn)代心理障礙預(yù)測模型主要包括人工智能技術(shù)、非線性控制技術(shù)、自動化技術(shù),當(dāng)前主要有各種人工神經(jīng)網(wǎng)絡(luò)的心理障礙預(yù)測模型、灰色理論的心理障礙預(yù)測模型,它們通常具有智能化學(xué)習(xí)功能,根據(jù)心理障礙歷史數(shù)據(jù)擬合心理障礙的變化規(guī)律,預(yù)測結(jié)果要優(yōu)于傳統(tǒng)心理障礙預(yù)測模型。在心理障礙實(shí)際預(yù)測中,目前還有許多問題有待解決,如:人工神經(jīng)網(wǎng)絡(luò)的收斂速度慢,心理障礙預(yù)測結(jié)果出現(xiàn)過擬合的概率相當(dāng)高,心理障礙預(yù)測的泛化能力差,而且人工神經(jīng)網(wǎng)絡(luò)相關(guān)參數(shù)直接影響心理障礙預(yù)測結(jié)果,而當(dāng)前人工神經(jīng)網(wǎng)絡(luò)參數(shù)優(yōu)化方法主要采用人工方式憑經(jīng)驗(yàn)確定人工神經(jīng)網(wǎng)絡(luò)的參數(shù),使得心理障礙預(yù)測精度并非達(dá)到最優(yōu),因此心理障礙預(yù)測面臨巨大的挑戰(zhàn)。
為了解決當(dāng)前心理障礙預(yù)測模型存在的誤差,預(yù)測結(jié)果可信度低等不足,以提高心理障礙預(yù)測精度為目標(biāo),提出了數(shù)據(jù)挖掘技術(shù)的心理障礙預(yù)測模型,并在Matlab 2019 平臺進(jìn)行了心理障礙預(yù)測的仿真模擬實(shí)驗(yàn),結(jié)果表明,本文模型是一種效果好、速度快的心理障礙預(yù)測模型,預(yù)測效果要明顯優(yōu)于當(dāng)前其他心理障礙預(yù)測模型。
在進(jìn)行心理障礙預(yù)測時(shí),首先要對心理障礙相關(guān)的信號進(jìn)行采集,由于一個(gè)人的心理出現(xiàn)了障礙,其語言會發(fā)生相應(yīng)的變化,如焦慮、急躁,因此本文采集心理障礙者的語言信號進(jìn)行心理障礙預(yù)測,通過TMS320C6713 實(shí)現(xiàn)語音信號的采集,采集到的語音信號為模擬信號。由于心理障礙預(yù)測是通過計(jì)算機(jī)來實(shí)現(xiàn),因此要將模擬信號通過數(shù)模轉(zhuǎn)換裝置產(chǎn)生數(shù)字信號。采集信號可以用圖1 進(jìn)行描述。
圖1 采集的心理障礙信號
在心理障礙信號的采集過程中,難免出會出現(xiàn)一些噪聲,這些噪聲會對心理障礙信號的后續(xù)處理產(chǎn)生不利影響,因此本文引入小波變換對心理障礙信號進(jìn)行預(yù)處理。設(shè)ψ(t)為可積函數(shù),那么其傅里葉變換滿足式(1)條件,則稱ψ(t)為小波母函數(shù)。
ψ(t)在正負(fù)交替具有波動性,均值滿足如下條件:
對ψ(t)進(jìn)行平移、伸縮操作可以得到:
對于心理障礙信號f(t),其連續(xù)小波為:
式(4)是心理障礙信號f(t)在ψa,b(t)的多尺度平移信號的投影,f(t)的小波變換為wf1(a,b)和wf2(a,b),那么可以得到:
本文采用小波閾值算法對心理障礙信號進(jìn)行去噪,基本原理為:對含噪的心理障礙信號進(jìn)行小波變換,得到許多小波系數(shù),這樣小波系數(shù)可以劃分為干凈心理障礙信號的小波系數(shù)和噪聲的小波系數(shù),然后選擇最優(yōu)閾值與所有小波系數(shù)進(jìn)行比較,如果小波系數(shù)小于最優(yōu)閾值,表示是噪聲,那么將該小波系數(shù)設(shè)置為0,最后通過小波逆變換對小波系數(shù)進(jìn)行重構(gòu),得到干凈的心理障礙信號。
當(dāng)人的心理狀態(tài)發(fā)生變化后,心理信號也會發(fā)生相應(yīng)的改變,因此一旦出現(xiàn)心理障礙,那么其特征就會發(fā)生改變,本文采用4 種特征進(jìn)行心理障礙識別。
1)短時(shí)能量。設(shè)心理障礙信號為f(t),對其進(jìn)行分幀處理,第i幀心理障礙信號可以表示為:
式中:w(n)表示心理障礙信號的窗函數(shù);inc 表示心理障礙信號的幀移。
第i幀心理障礙信號的短時(shí)能量計(jì)算公式為:
式中:L表示心理障礙信號的幀長;m表示心理障礙信號分幀后的總幀數(shù)。
2)短時(shí)過零率。短時(shí)過零率用于描述心理障礙信號波形穿過橫軸的次數(shù),具體計(jì)算公式為:
式中sgn[·]表示符號函數(shù),具體如下:
支持向量機(jī)是一種新型的數(shù)據(jù)挖掘技術(shù),主要針對一些復(fù)雜的問題進(jìn)行建模,具有一定的智能決策能力。對一個(gè)問題的數(shù)據(jù)集{(x1,y1),(x2,y2),…,(xi,yi),…,(xn,yn)},n為樣本數(shù),采用映射函數(shù)?(?)對數(shù)據(jù)集進(jìn)行映射,然后建立最優(yōu)分類超平面,具體如下:
基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化學(xué)習(xí)原理,分類超平面可以滿足如下條件:
引入松弛變量ξi弱化分類誤差,提升分類精度,這樣分類超平面可以轉(zhuǎn)化為如下優(yōu)化問題:
式中C為懲罰參數(shù)。
采用Lagrange 算法得到式(12)的對偶形式,具體為:
采用核函數(shù)代替內(nèi)積操作:k(xi,xj)=?(xi)?(xj),可以得到:
最優(yōu)分離超平面可以表示為:
本文選擇的核函數(shù)為:
數(shù)據(jù)挖掘技術(shù)的心理障礙預(yù)測步驟如下:
Step1:通過TMS320C6713 采集語音信號,并通過數(shù)模轉(zhuǎn)換裝置產(chǎn)生數(shù)字信號。
Step2:通過小波變換對原始語音信號進(jìn)行預(yù)處理,去除其中的噪聲,得到干凈的語音數(shù)字信號。
Step3:從去噪后的語音信號中提取短時(shí)能量和短時(shí)過零率,將它們作為心理障礙預(yù)測特征向量。由于它們的單位不一樣,因此對它們進(jìn)行預(yù)處理,即:
式中fmax和fmin表示心理障礙預(yù)測特征的最大值和最小值。
Step4:將心理障礙值和特征向量組合在一起,得到心理障礙預(yù)測的學(xué)習(xí)樣本。
Step5:設(shè)置支持向量機(jī)參數(shù),如懲罰參數(shù)和核函數(shù)參數(shù)。
Step6:采用支持向量機(jī)對心理障礙學(xué)習(xí)樣本進(jìn)行訓(xùn)練,建立心理障礙預(yù)測模型,具體流程如圖2 所示。
圖2 數(shù)據(jù)挖掘技術(shù)的心理障礙預(yù)測流程
為了測試數(shù)據(jù)挖掘技術(shù)的心理障礙預(yù)測模型的性能,對其進(jìn)行仿真實(shí)驗(yàn),具體測試環(huán)境如表1 所示。
表1 心理障礙預(yù)測實(shí)驗(yàn)的測試環(huán)境
選擇BP 神經(jīng)網(wǎng)絡(luò)的心理障礙預(yù)測模型進(jìn)行對比測試,選擇心理障礙預(yù)測精度和建模時(shí)間作為心理障礙預(yù)測仿真實(shí)驗(yàn)結(jié)果的評價(jià)指標(biāo)。
為了使心理障礙仿真實(shí)驗(yàn)結(jié)果具有較強(qiáng)的說服力,選擇5 個(gè)測試數(shù)據(jù)集進(jìn)行仿真實(shí)驗(yàn),每一個(gè)測試數(shù)據(jù)集包含的心理障礙樣本數(shù)量如表2 所示。
表2 心理障礙仿真實(shí)驗(yàn)的測試數(shù)據(jù)集
將表2 的心理障礙仿真實(shí)驗(yàn)的測試數(shù)據(jù)集劃為兩部分:一部分為訓(xùn)練集,用于建立心理障礙預(yù)測模型,測試心理障礙預(yù)測的擬合能力;另一部分為測試集,用于分析心理障礙預(yù)測模型的泛化能力。它們的比例為3∶1。
2.3.1 心理障礙訓(xùn)練精度分析
兩種心理障礙訓(xùn)練精度如圖3 所示。
圖3 兩種方法的心理障礙訓(xùn)練精度比較
對圖3 進(jìn)行分析可以發(fā)現(xiàn):
1)BP 神經(jīng)網(wǎng)絡(luò)的心理障礙訓(xùn)練精度平均值為81.49%,心理障礙訓(xùn)練誤差的平均值為18.51%,心理障礙訓(xùn)練精度要低于實(shí)際應(yīng)用的要求,這主要是因?yàn)锽P神經(jīng)網(wǎng)絡(luò)雖然學(xué)習(xí)能力強(qiáng),但是經(jīng)常出現(xiàn)一些擬合錯誤偏大的點(diǎn),出現(xiàn)了過擬合心理障礙的預(yù)測結(jié)果。
2)本文方法的心理障礙訓(xùn)練精度平均值為93.34%,心理障礙訓(xùn)練誤差的平均值為6.66%,心理障礙訓(xùn)練精度遠(yuǎn)遠(yuǎn)高于實(shí)際應(yīng)用要求的85%,心理障礙訓(xùn)練精度要高于BP 神經(jīng)網(wǎng)絡(luò),這表明本文方法克服了BP神經(jīng)網(wǎng)絡(luò)存在的缺陷,可以更好地描述心理障礙變化特點(diǎn),心理障礙預(yù)測結(jié)果的擬合效果更優(yōu)。
2.3.2 心理障礙預(yù)測的測試精度分析
兩種心理障礙預(yù)測結(jié)果的測試精度如圖4 所示。對圖4 測試精度分析可知:兩種方法心理障礙預(yù)測的測試精度要低于訓(xùn)練精度,這是正?,F(xiàn)象,但是本文方法的心理障礙預(yù)測測試精度要高于BP 神經(jīng)網(wǎng)絡(luò),這是因?yàn)楸疚姆椒ㄊ且环N更加有效的數(shù)據(jù)挖掘技術(shù),能夠更加深層次、全面地描述心理障礙變化態(tài)勢,獲得了理想的心理障礙預(yù)測結(jié)果。
圖4 兩種方法的心理障礙測試集的測試精度比較
2.3.3 心理障礙預(yù)測建模效率分析
兩種方法的心理障礙建模訓(xùn)練時(shí)間和測試時(shí)間如圖5 所示。從圖5 可以發(fā)現(xiàn),心理障礙建模訓(xùn)練時(shí)間要遠(yuǎn)遠(yuǎn)長于測試時(shí)間,因?yàn)橥ㄟ^訓(xùn)練過程找到心理障礙預(yù)測模型的最優(yōu)參數(shù),耗費(fèi)時(shí)間比較長。對于相同的數(shù)據(jù)集,本文方法的心理障礙建模訓(xùn)練時(shí)間要少于BP 神經(jīng)網(wǎng)絡(luò),加快了心理障礙建模效率,測試時(shí)間相差不大,因此本文方法的心理障礙建??倳r(shí)間要明顯短于BP 神經(jīng)網(wǎng)絡(luò),提高了心理障礙預(yù)測建模的效率。
圖5 兩種方法的心理障礙訓(xùn)練和測試時(shí)間比較
心理障礙是當(dāng)前社會關(guān)注的一個(gè)焦點(diǎn)問題。當(dāng)前心理障礙預(yù)測模型存在精度低、預(yù)測效率低等弊端,難以滿足心理障礙分析的實(shí)際要求,為了獲得理想的心理障礙預(yù)測結(jié)果,本文提出了數(shù)據(jù)挖掘技術(shù)的心理障礙預(yù)測模型。測試結(jié)果表明,本文模型的心理障礙預(yù)測效果要明顯優(yōu)于當(dāng)前其他心理障礙預(yù)測模型,而且心理障礙預(yù)測建模效率得以大幅度改善,具有十分廣泛的應(yīng)用前景。