王小紅
(陜西省委黨校,文化與科技教研部, 陜西,西安 710061)
無手機(jī)恐懼癥(Nomophobia)2008年在英國(guó)首次出現(xiàn),其實(shí)質(zhì)是害怕失去與手機(jī)的聯(lián)系,當(dāng)人們無法使用手機(jī)或無法利用這些設(shè)備提供的功能時(shí),會(huì)感到不適或焦慮。這種恐懼癥是隨著通訊技術(shù)的發(fā)展而出現(xiàn)的。無手機(jī)恐懼癥是由于智能手機(jī)所提供的即時(shí)通訊和滿足感而形成的一種心理障礙,并表現(xiàn)為一種強(qiáng)迫性和成癮行為。目前,對(duì)于手機(jī)危害性研究大多以心理研究和社會(huì)行為研究為主[1-4],而以智能算法為工具的數(shù)據(jù)分析方法很少。再者,由于調(diào)查數(shù)據(jù)龐大,數(shù)據(jù)特征不明晰,如果利用現(xiàn)有智能算法去進(jìn)行研究,肯定會(huì)影響數(shù)據(jù)分析的結(jié)論與對(duì)策。因此,本文以多變量方差模糊聚類算法為理論依據(jù),利用模糊聚類理論去分析數(shù)據(jù)之間內(nèi)外的關(guān)聯(lián),利用方差去衡量聚類精度,進(jìn)而,提高對(duì)調(diào)查問卷數(shù)據(jù)分析的準(zhǔn)確度與客觀性。
多變量方差分析是一種基于多元方差分析方法,它不僅能夠分析多個(gè)觀測(cè)數(shù)據(jù)(控制變量)對(duì)其它被觀測(cè)數(shù)據(jù)的獨(dú)立干擾與影響,而且還可以根據(jù)多個(gè)觀測(cè)數(shù)據(jù)(控制變量)的變化與交互,來監(jiān)控被測(cè)數(shù)據(jù)的變化,并通過優(yōu)化迭代最終找到適合分析的最優(yōu)觀測(cè)數(shù)據(jù)組合。在多變量方差分析中,觀測(cè)數(shù)據(jù)(觀測(cè)量)的變化取決于以下三個(gè)因素:一是觀測(cè)數(shù)據(jù)獨(dú)立作用的影響;二是觀測(cè)數(shù)據(jù)相互搭配后對(duì)被觀測(cè)變量產(chǎn)生的影響;三是抽樣誤差影響。因此,基于多變量方差分析可以定義為[5]
ST=SA+SB+SAB+SSE
(1)
其中,SA、SB分別表示由觀測(cè)數(shù)據(jù)A、B獨(dú)立作用引起的差變,SAB為控制變量A、B兩兩交互作用引起的變差,SSE為隨機(jī)因素引起的變差。通常稱SA+SB+SAB為主效應(yīng),SAB為N向(N-WAY)交互效應(yīng),ST表示為總觀測(cè)數(shù)據(jù),它可以用下式來表示:
(2)
(3)
(4)
對(duì)測(cè)試數(shù)據(jù)進(jìn)行處理過程中,外界隨機(jī)因素引起的變差SSE可以通過下式來表示:
(5)
SAB=SST-SA-SB-SSE
(6)
根據(jù)式(6)可以發(fā)現(xiàn),在測(cè)試數(shù)據(jù)交互作用中的變差式中,當(dāng)變差式SA的值在式中的比例較大時(shí),則說明測(cè)量控制數(shù)據(jù)A是引起觀測(cè)數(shù)據(jù)變量變化的主要因素,因此,被觀測(cè)數(shù)據(jù)變化趨勢(shì)可以擬由控制測(cè)試數(shù)據(jù)變量A來決定;相反,如果變差式SA的值所占比例較小,則說明測(cè)量控制數(shù)據(jù)A不是引起觀測(cè)變量變動(dòng)的主要因素,則觀測(cè)變量的變化趨勢(shì)無法用控制測(cè)量數(shù)據(jù)變量A來解釋。因此,在多變量方差分析中,可以預(yù)先將控制變量(測(cè)試數(shù)據(jù))劃分為固定測(cè)試變量和隨機(jī)測(cè)試變量。在隨機(jī)測(cè)試變量模型中,應(yīng)首先對(duì)A、B的交互作用進(jìn)行推斷,然后再分別依次對(duì)A、B的效應(yīng)進(jìn)行檢驗(yàn)[9]。在多變量測(cè)試數(shù)據(jù)方差分析中,對(duì)于不同測(cè)試數(shù)據(jù)統(tǒng)計(jì)量的檢驗(yàn)計(jì)算如下式:
(7)
(8)
(9)
在上式中,對(duì)不同測(cè)試數(shù)據(jù)進(jìn)行統(tǒng)計(jì)量檢驗(yàn)計(jì)算均采用F校驗(yàn)。為了確保測(cè)試數(shù)據(jù)分析的正確性,在對(duì)調(diào)查問卷數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘分析過程中,本文采用數(shù)理統(tǒng)計(jì)多元分析模糊聚類法,在多變量方差數(shù)據(jù)分析的基礎(chǔ)上,對(duì)測(cè)試數(shù)據(jù)進(jìn)行聚類,從而客觀的對(duì)測(cè)試數(shù)據(jù)進(jìn)行評(píng)價(jià)與分析。
本文引入模糊聚類算法,將調(diào)查數(shù)據(jù)按一定要求對(duì)其進(jìn)行數(shù)理統(tǒng)計(jì),科學(xué)地評(píng)判調(diào)查問卷測(cè)試樣本數(shù)據(jù)之間的邏輯關(guān)系,從而客觀地對(duì)問卷情況進(jìn)行類型劃分。為后續(xù)調(diào)查問卷數(shù)據(jù)的NMP-Q量表分析奠定基礎(chǔ),模糊聚類通常采用如下的公式:
S={xi(k)|xi(k)∈x(k)}
(10)
其中,S為調(diào)查問卷某項(xiàng)數(shù)據(jù)集合,k為數(shù)據(jù)集合中數(shù)據(jù)序列,i表示調(diào)查問卷數(shù)據(jù)的項(xiàng),x(k)表示調(diào)查問卷中某項(xiàng)數(shù)據(jù)集合中的樣本向量,其含義與式(2)中的x相同。
為進(jìn)一步衡量調(diào)查數(shù)據(jù)分析的準(zhǔn)確性,現(xiàn)定義如下的性能指標(biāo)函數(shù),來確定調(diào)查問卷中同一類數(shù)據(jù)之間的聚類精度。
(11)
其中,Ci為定義的聚類中心,它是隨著測(cè)量數(shù)據(jù)分析過程進(jìn)行變化的。為了限制調(diào)查問卷數(shù)據(jù)分析過程中聚類中心變化的越界,特定義如下的聚類中心變化函數(shù)來對(duì)其進(jìn)行約束:
(12)
其中,u(xi(k))為測(cè)試數(shù)據(jù)分析過程中模糊聚類隸屬度函數(shù)。
將由式(10)~式(12)所得到的測(cè)量數(shù)據(jù)xi帶入式(1)~式(5),則可以得到調(diào)查問卷數(shù)據(jù)的多變量方差分析模糊聚類分析數(shù)據(jù),再通過采用NMP-Q量表對(duì)其進(jìn)行大數(shù)據(jù)分析,對(duì)中國(guó)大學(xué)生無手機(jī)恐懼癥現(xiàn)狀進(jìn)行客觀評(píng)價(jià)。
采用NMP-Q量表為原型設(shè)計(jì)調(diào)查問卷,問卷中量表的四個(gè)維度20個(gè)問題(見圖1),每個(gè)問題答案都使用李克特7分制評(píng)分,問卷包含與人口統(tǒng)計(jì)相關(guān)的問題,如性別、年齡、擁有手機(jī)的年限、幾年級(jí)學(xué)生、每天使用手機(jī)時(shí)間長(zhǎng)短等。問卷數(shù)據(jù)分別來自陜西、山西、青海、貴州、湖南地區(qū)的高等院校學(xué)生。
圖1 改進(jìn)HS算法流程圖
本次調(diào)研總共收集到1 627條數(shù)據(jù),由于本次問卷調(diào)查是采用網(wǎng)絡(luò)宣傳采集數(shù)據(jù),有些人沒有看清楚調(diào)查對(duì)象,有已畢業(yè)的對(duì)象也填了本次問卷,所以去除已畢業(yè)的130條數(shù)據(jù),剩下1 497個(gè)有效樣本,性別統(tǒng)計(jì):女生占65.7%(984人),男生占34.3%(513人)。學(xué)生所在年級(jí)統(tǒng)計(jì):大一學(xué)生占39.8%(596人),大二學(xué)生占40.3%(604人),大三學(xué)生占15.8%(237),大四及研究生學(xué)生占4.0%(62人)。擁有智能手機(jī)的年限統(tǒng)計(jì):1年以下的占3.9%(58人),1年-2年之間的占13.2%(197人),3年-4年之間的占34.1%(510人),5年-6年之間的占34.1%(511人),7年-8年之間的占9.8%(146人),8年以上的占5.0%(75人)。學(xué)生所在院校統(tǒng)計(jì):大中專院校占74.5%(1 116人),本科院校占25.5%(381人)。智能手機(jī)用戶的平均年齡為20.06歲(SD=1.95),大部分是大一、大二和大三學(xué)生。使用智能手機(jī)的平均時(shí)間為4.96年(SD=2.59)。每天使用手機(jī)的平均時(shí)間為3.72小時(shí)(SD=2.50)。
在進(jìn)行多變量方差分析(MANOVA)測(cè)試之前,通過使用模糊聚類方法將數(shù)據(jù)中的年齡、使用手機(jī)的年限和每天使用手機(jī)的時(shí)間等變量分成了幾類。然后,采用式(1)~式(9)對(duì)測(cè)試數(shù)據(jù)進(jìn)行檢驗(yàn)和獨(dú)立樣本T檢驗(yàn),研究大學(xué)生的無手機(jī)恐懼行為在性別、年齡、每天手機(jī)使用時(shí)間等方面是否存在差異。其次,通過計(jì)算問題負(fù)荷對(duì)NMP-Q各因子的平均得分,來構(gòu)建樣本的NMP-Q因子得分,探究大學(xué)生的無手機(jī)恐懼癥行為,分析結(jié)果如表1。
表1 NMP-Q量表項(xiàng)分析
表2中,與其他因素相比,大學(xué)生對(duì)無法溝通(M=4.81,SD=1.464)和失去聯(lián)系(M=4.76,SD=1.540)的恐懼程度更高。情緒因手機(jī)或功能不能使用而惱火(M=3.97,SD=1.602)得分最低。
在假設(shè)F=6.923,相伴概率p=0.009<0.05,T統(tǒng)計(jì)量的相伴概率p=0.024<0.05。進(jìn)而,男性和女性在量表總分的平均值上存在顯著性差異。此外,對(duì)四個(gè)維度平均值的比較顯示,女性的無手機(jī)恐懼癥得分高于男性(見表2)。
表2 無手機(jī)恐懼癥性別統(tǒng)計(jì)得分的均值和標(biāo)準(zhǔn)差
采用式(7)~式(10)對(duì)被測(cè)數(shù)據(jù)的方差進(jìn)行檢驗(yàn),顯著性值為0.111>0.05,說明本次分析結(jié)果可信。對(duì)各年級(jí)學(xué)生的問卷總得分進(jìn)行方差檢驗(yàn),F(xiàn)=3.507,相伴概率p=0.015<0.05,說明學(xué)生所在年級(jí)在無手機(jī)恐懼癥行為上有統(tǒng)計(jì)學(xué)上顯著差異。結(jié)果是在維度1無法訪問信息上無顯著性差異,在維度2失去聯(lián)系、維度3無法溝通和維度4帶來不方便上顯著性差。大一和大二學(xué)生在維度2、3和4上有明顯差異,并且大二學(xué)生得分高于大一學(xué)生(見表3)。
表3 無手機(jī)恐懼癥學(xué)生年級(jí)統(tǒng)計(jì)得分的均值和標(biāo)準(zhǔn)差
而且,根據(jù)分析可以發(fā)現(xiàn),每天使用手機(jī)時(shí)間越長(zhǎng)的樣本問卷得分越高,患無手機(jī)恐懼癥的可能性越大(見圖2),而院校類型對(duì)問卷得分的高低無顯著性差異。
圖2 每天使用手機(jī)時(shí)間長(zhǎng)短和問卷得分的關(guān)系
本論文設(shè)計(jì)了一種模糊聚類多變量方差大數(shù)據(jù)分析方法,完成了大學(xué)生手機(jī)依賴癥調(diào)查數(shù)據(jù)的分析,客觀評(píng)價(jià)了無手機(jī)恐懼癥行為對(duì)大學(xué)生群體的影響。結(jié)果顯示擁有手機(jī)年限和每天使用手機(jī)時(shí)間長(zhǎng)短對(duì)年輕人的無手機(jī)恐懼癥有影響。由于手機(jī)的功能不斷在增強(qiáng),年輕人對(duì)“無手機(jī)恐懼癥”可能變得更加嚴(yán)重。在網(wǎng)絡(luò)調(diào)查中,由于調(diào)研數(shù)據(jù)采集院校劃分不明晰。因此,在后續(xù)研究中有待拓寬更廣泛的年齡群體,以便調(diào)查數(shù)據(jù)分析更為客觀。