• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于K-means聚類的調(diào)查問卷動態(tài)賦權(quán)統(tǒng)計方法

    2018-12-21 07:14:20李曉英周大濤
    統(tǒng)計與決策 2018年23期
    關(guān)鍵詞:賦權(quán)聚類動態(tài)

    李曉英,周大濤

    (湖北工業(yè)大學(xué) 工業(yè)設(shè)計學(xué)院,武漢 430068)

    0 引言

    隨著調(diào)查研究理論的深化,各種調(diào)查方法、技術(shù)和工具等也獲得不斷發(fā)展[1]。而調(diào)查問卷作為獲取統(tǒng)計資料的重要手段,既可以收集性別、年齡等簡單的人口統(tǒng)計信息,也可以獲得體驗、行為、情感等復(fù)雜信息,并且通過科學(xué)抽樣,就可以從少量樣本數(shù)據(jù)的研究得到一般性推論,其在企事業(yè)單位、大眾媒體和學(xué)術(shù)研究等部門得到了廣泛應(yīng)用。因此,針對調(diào)查問卷進行的方法理論研究具有重要的實用價值。

    文獻研究發(fā)現(xiàn):現(xiàn)階段的研究成果多是關(guān)注于問卷的內(nèi)容設(shè)計[2]、樣本選擇、實施過程[3]及問卷的效度、信度檢驗方法[4]等方面,對調(diào)查問卷結(jié)果的統(tǒng)計方法研究卻很少提及;現(xiàn)行的結(jié)果統(tǒng)計多采用平均賦權(quán)算法,由于未能充分考慮主體人(調(diào)查對象)對客體物(調(diào)查目標、內(nèi)容)在不同層次或角度上的認知差異水平,稍有偏差就會導(dǎo)致結(jié)果出現(xiàn)不可靠性、誤導(dǎo)性等問題。針對這個問題,提出基于K-means聚類的調(diào)查問卷動態(tài)賦權(quán)統(tǒng)計方法,結(jié)合某高校圖書館服務(wù)質(zhì)量滿意度調(diào)查的實證研究,驗證其可行性、有效性及優(yōu)越性。

    1 問題的提出

    由于客觀事物的復(fù)雜性、不確定性,在調(diào)查問卷中往往需要對個體或事物的屬性特征做綜合、全面的調(diào)查分析。例如,產(chǎn)品市場需求調(diào)查中,就會涉及到產(chǎn)品的功能、結(jié)構(gòu)、造型、材料以及經(jīng)濟價值、社會環(huán)境影響等多方面的因素調(diào)查,這就要求主體人對產(chǎn)品的各個因素有清晰、全面的認識。但由于主體人的經(jīng)驗、專業(yè)、文化背景及需求、偏好的不同,缺乏對事物屬性特征的全面了解,這在一定程度上導(dǎo)致同一主體對同一客體不同方面的認知程度上趨于不一致而非一致,即被調(diào)查者對待不同問題評分結(jié)果的可信度或權(quán)重是不同的。這一點往往會被調(diào)查問卷的設(shè)計者所忽略,僅采用傳統(tǒng)的平均賦權(quán)方法對調(diào)查問卷的樣本數(shù)據(jù)進行統(tǒng)計分析,使由調(diào)查問卷樣本數(shù)據(jù)獲得的理論值和由表征客體屬性特征的真實值之間出現(xiàn)一定程度的誤差,導(dǎo)致研究結(jié)果缺乏可靠性。

    2 動態(tài)賦權(quán)方法的構(gòu)建

    針對上述問題,為了保證調(diào)查問卷統(tǒng)計結(jié)果的可靠性,在綜合考慮主體人對客體物認知差異程度的基礎(chǔ)上,提出基于K-means聚類算法的調(diào)查問卷動態(tài)賦權(quán)統(tǒng)計方法,具體的應(yīng)用流程如圖1所示。

    圖1 基于K-means聚類的調(diào)查問卷動態(tài)統(tǒng)計方法流程圖

    首先,為便于客觀、真實地表征主體人對客體物在不同層次上的認知差異,需預(yù)先編制調(diào)查問卷層次量表,即圍繞調(diào)查問卷評估的總體目標要求,將個體或事物的屬性特征分解為若干不同的方面。如表1所示,調(diào)查問卷層次量表的總體目標(Z)由一級層次(A)和二級層次(B)的屬性特征組成,下一次層次的屬性特征是對上一層次屬性的不同角度或?qū)用娴拿枋觥?/p>

    其次,采用K-means聚類算法演繹出不同層次下樣本數(shù)據(jù)的歸類分布情況:

    定義1:設(shè)有n個樣本的p維調(diào)查樣本數(shù)據(jù)為:

    每個樣本可以看作p維空間的一個點,則任意兩個空間點xi和xj之間的Euclid距離為d(xi,xj):

    表1 圖書館服務(wù)質(zhì)量滿意度調(diào)查問卷層次量表

    其中,當(dāng)P=2或3時,d(xi,xj)為二維或三維空間中的兩點之間的距離。

    定義2:設(shè)n個樣本需要分成k類,則第k個初始聚類點的集合為:

    由公式(1)可記:

    將n個樣本聚成了k類,得到了一個初始分類集合C0:

    從初始聚類C0開始計算新的聚類點集合為H1,計算:

    其中,ni為類C0集合中的樣本數(shù)量,得到一個新的集合:

    從H1開始再進行分類,并迭代上述步驟m次,得:

    其中Cm=Cm+1時,則迭代計算結(jié)束,獲得最終聚類集合Cm。

    定義3:由上述K-means聚類算法將n個樣本聚成了k類,進一步假設(shè)第i個樣本屬于第t類Ct(顯然1≤t≤k),類別Ct中包含的樣本個數(shù)Ft(Ft可稱為類容量)與樣本總數(shù)n的比值,稱為樣本i的置信因子Ti,則:

    顯然,同一類別中的樣本具有相同的置信因子,也即同一類中樣本所表達的信息可以認為是相似的。其中,F(xiàn)t較大的類中樣本所表達的信息符合多數(shù)調(diào)查對象的意見,應(yīng)該被賦予較大的權(quán)重,由此有以下權(quán)重系數(shù)βk的確定原則:

    其中:

    求解方程組(2)有:

    由于屬于同一類別的樣本具有相同的置信因子,所以:

    由式(3)和式(4)得,樣本權(quán)重系數(shù)βk:

    最后,通過動態(tài)賦權(quán)計算某個層次的得分匯總,實現(xiàn)對客體物特定特征的評估,進一步地通過各個層次的得分再加,獲得最終的綜合評估結(jié)果。

    3 實證分析

    圖書館作為社會的服務(wù)性行業(yè)之一,與其他服務(wù)行業(yè)評估在理論、方法模式方面具有通用性。因此,本文以某高校圖書館服務(wù)質(zhì)量的滿意度調(diào)查為實踐案例,進一步闡述和驗證該方法的可行性、有效性。

    3.1 圖書館調(diào)查問卷的層次量表編制

    現(xiàn)有的圖書館服務(wù)質(zhì)量滿意度調(diào)查量表有多種形式,結(jié)合某高校的實際情況,在參考美國研究圖書館協(xié)會(ARL)的LibQUAL+TM體系的基礎(chǔ)上。依據(jù)上述層次量表編制要求,繪制了如表1所示的調(diào)查問卷層次量表,以開展圖書館服務(wù)質(zhì)量滿意度調(diào)查工作。

    依據(jù)心理學(xué)中的情感梯度理論[5]確定該層次量表的打分準則,分為7個等級:很不滿意、不滿意、不太滿意、一般、比較滿意、滿意、很滿意,分別對應(yīng)1分、2分、3分、4分、5分、6分、7分。

    3.2 圖書館調(diào)查問卷的效度與信度檢驗

    在本次調(diào)查中,共發(fā)放問卷250份,回收225份,其中有效問卷212份,有效率為94.2%。限于篇幅本文僅給出有形性層次下的部分評分數(shù)據(jù),如表2所示。

    采用內(nèi)部一致性系數(shù)(Cronbach α系數(shù))檢驗問卷信度,采用KMO檢驗和Bartlet球形檢驗進行因子分析的適用性檢驗[6],以確定問卷的結(jié)構(gòu)效度,具體檢驗結(jié)果如表3所示。

    表2 圖書館服務(wù)質(zhì)量滿意度調(diào)查結(jié)果評分表(部分)

    表3 圖書館服務(wù)質(zhì)量滿意度調(diào)查問卷效度、信度檢驗結(jié)果

    由表3可知:Cronbach α系數(shù)在0.8以上,說明問卷調(diào)查結(jié)果具有較高的一致性和穩(wěn)定性,信度較高;除了關(guān)懷性的KMO值(0.587)尚可外,其余層次的KMO值都在0.6以上,效度較高;Bartlet球形檢驗中的顯著性水平p<0.05,表明變量之間具有明顯的結(jié)構(gòu)性和相關(guān)性,效度較高。

    3.3 圖書館調(diào)查問卷的動態(tài)賦權(quán)統(tǒng)計

    為了便于計算、描述和說明該方法的可行性、有效性,需進行兩個方面的假設(shè):一是認為調(diào)查對象對二級層次下的屬性特征無認知差異,僅對一級層次下屬性特征的認知差異進行考慮;二是采用由樣本數(shù)據(jù)的方差和均值所組成的二維數(shù)據(jù)演繹歸類分布情況。結(jié)合定義3中K-means聚類算法的步驟,在Matlab軟件中演繹出一級層次下樣本數(shù)據(jù)的歸類分布情況。限于篇幅,本文僅說明有形性層次下的歸類情況,結(jié)果如圖2所示。

    圖2 有形性層次下的樣本歸類分布情況

    由圖2可知,212個樣本被清晰、明確地聚成了7個類別,證明了K-means聚類算法的可行性。進一步地可以確定各個類別的類容量Ft的大小,有:

    Ft={13,19,42,46,11,49,32}

    由式(5)可以計算各調(diào)查對象的權(quán)重系數(shù)βk,有:

    其中,為有形性層次下各樣本類的權(quán)重系數(shù)。進一步的重復(fù)此步驟可以獲得其他層次下的樣本類權(quán)重系數(shù):

    為了進一步說明動態(tài)賦權(quán)統(tǒng)計的概念,進行隨機抽樣獲得4個樣本(20號、56號、135號、205號)在不同層次下的權(quán)重系數(shù)分布情況,結(jié)果如圖3所示:與平均賦權(quán)的水平直線相比,4個樣本的權(quán)重系數(shù)則是動態(tài)變化的曲線,會隨著各層次屬性特征的改變而變化,能夠真實地表征主體人對客體物不同方面的認知差異,證明了該方法的有效性。

    圖3 動態(tài)賦權(quán)與平均賦權(quán)的權(quán)重系數(shù)對比圖

    3.4 圖書館調(diào)查問卷的賦權(quán)方法對比

    為了進一步證明該方法的有效性、可靠性及優(yōu)越性,進行平均賦權(quán)方法與動態(tài)賦權(quán)方法下獲得的調(diào)查問卷綜合評分結(jié)果的對比分析,具體結(jié)果如圖4所示。

    圖4 動態(tài)賦權(quán)與平均賦權(quán)的綜合評分結(jié)果對比圖

    由圖4可知,兩種賦權(quán)方法下獲得的評分結(jié)果存在明顯差異:一方面,在某些屬性特征上,動態(tài)賦權(quán)獲得的滿意度評分較高于平均賦權(quán),尤其在有形性層次下的差異表現(xiàn)最為顯著;另一方面,兩種方法獲得的綜合排序結(jié)果差異較大。通過數(shù)據(jù)對比分析發(fā)現(xiàn),導(dǎo)致這種差異的原因是兩種賦權(quán)方法在調(diào)查對象權(quán)重大小的確定上存在明顯區(qū)別,例如,在針對B13(電子資源豐富,數(shù)據(jù)庫全面)的評分數(shù)據(jù)上,平均賦權(quán)對評分較低(3分以下)的31號、43號、104號等14個樣本數(shù)據(jù)賦予了較大的權(quán)重(0.0047),而動態(tài)賦權(quán)對其賦予較小權(quán)重(0.0014)。通過回訪調(diào)查發(fā)現(xiàn),這14位被調(diào)查者使用圖書館電子資源的情況不多,甚至從未使用過圖書館電子資源,其評分結(jié)果明顯不可信。但平均賦權(quán)方法下卻對其賦予了較高權(quán)重,顯然該賦權(quán)方法下的評分結(jié)果缺乏可靠性。相比之下,動態(tài)賦權(quán)方法獲得的評分結(jié)果更符合實際情況。

    使用同樣的方法對其他差異點進行回訪調(diào)查,結(jié)果表明:平均賦權(quán)方法未能夠識別出調(diào)查對象的實際認知情況,導(dǎo)致綜合評分結(jié)果出現(xiàn)偏差;基于K-means聚類的動態(tài)賦權(quán)統(tǒng)計方法能夠綜合考慮主體人的認知水平差異,并減小其對綜合評分結(jié)果造成的影響,增強了調(diào)查問卷結(jié)果的可靠性,減少誤導(dǎo)。對比結(jié)果表明調(diào)查問卷的動態(tài)賦權(quán)統(tǒng)計方法在有效性、可靠性等方面較平均賦權(quán)方法具有優(yōu)越性。

    4 結(jié)論

    針對主體人對客體物的認知差異導(dǎo)致調(diào)查問卷綜合統(tǒng)計結(jié)果出現(xiàn)偏差的問題,提出基于K-means聚類算法的調(diào)查問卷動態(tài)賦權(quán)統(tǒng)計方法。通過圖書館服務(wù)質(zhì)量滿意度調(diào)查的實證研究,對比不同賦權(quán)方法下的評分結(jié)果,驗證了該方法的可行性、有效性。但K-means聚類算法需要預(yù)先指定類別數(shù)目,且多數(shù)情況下樣本數(shù)據(jù)的類別數(shù)目及最優(yōu)類別數(shù)目是無法預(yù)知的。因此,下一步的工作重點將圍繞樣本數(shù)據(jù)最優(yōu)類別數(shù)目的確定方法而展開,以進一步保證調(diào)查結(jié)果的可靠性。

    猜你喜歡
    賦權(quán)聚類動態(tài)
    國內(nèi)動態(tài)
    國內(nèi)動態(tài)
    論鄉(xiāng)村治理的有效賦權(quán)——以A縣扶貧項目為例
    中國西部(2022年2期)2022-05-23 13:28:20
    國內(nèi)動態(tài)
    企業(yè)數(shù)據(jù)賦權(quán)保護的反思與求解
    動態(tài)
    試論新媒體賦權(quán)
    活力(2019年15期)2019-09-25 07:22:12
    基于改進AHP熵博弈賦權(quán)的輸變電工程評價
    基于DBSACN聚類算法的XML文檔聚類
    電子測試(2017年15期)2017-12-18 07:19:27
    基于改進的遺傳算法的模糊聚類算法
    安福县| 贵南县| 峡江县| 平武县| 顺义区| 普格县| 古蔺县| 攀枝花市| 罗甸县| 金塔县| 栾城县| 新邵县| 南溪县| 甘洛县| 新密市| 白银市| 保靖县| 米脂县| 梅州市| 凯里市| 江达县| 广汉市| 河北区| 镇坪县| 梁平县| 白城市| 通州市| 德清县| 临桂县| 赤城县| 石城县| 瑞金市| 保亭| 玛沁县| 股票| 阜康市| 丰顺县| 全州县| 林口县| 泰来县| 定南县|