江澤豪,伊德景,朱光宇
(福州大學(xué) 機(jī)械工程及自動(dòng)化學(xué)院,福建 福州 350116)
隨著云制造平臺(tái)的快速發(fā)展,吸引了大量云用戶和制造商,云池中的云服務(wù)急劇增多,但質(zhì)量水準(zhǔn)參次不齊,其中不乏一些虛假的制造云服務(wù),惡意競(jìng)爭(zhēng)的制造商通過(guò)發(fā)布虛假信息、提供虛假的服務(wù)評(píng)論和供應(yīng)廠商來(lái)迷惑云用戶,不但傷害了云用戶的利益,而且危害了其他制造商的權(quán)益。因此,制造云服務(wù)的可信度評(píng)估、虛假云服務(wù)剔除及在此基礎(chǔ)上的制造云服務(wù)優(yōu)選成為本領(lǐng)域研究的焦點(diǎn)。
馬文龍等[1]提出一種基于服務(wù)質(zhì)量感知的云服務(wù)選擇模型,通過(guò)評(píng)判不誠(chéng)實(shí)評(píng)價(jià)信息來(lái)評(píng)價(jià)服務(wù)質(zhì)量,為用戶選擇最佳云服務(wù);陶飛等[2]對(duì)制造云服務(wù)進(jìn)行可信評(píng)估,并對(duì)服務(wù)進(jìn)行組合搭配;魏樂(lè)等[3]選擇5個(gè)因素衡量云服務(wù)的可信度,并采用加權(quán)平均的方法計(jì)算制造云服務(wù)的可信值;馬華等[4]定義了云服務(wù)的個(gè)性化特征,利用相似度函數(shù)識(shí)別特征共同體,通過(guò)個(gè)性化特征加權(quán)值來(lái)評(píng)估可信度;李超[5]建立了一個(gè)多指標(biāo)評(píng)價(jià)模型對(duì)云服務(wù)的可信度進(jìn)行評(píng)估;劉鉆石等[6]通過(guò)選取6個(gè)制造云服務(wù)指標(biāo)作為可信特征集,提出基于D-S(Dempster-Shafer)理論的云服務(wù)評(píng)價(jià)方法;Chiregi等[7-8]利用拓?fù)浜饬糠椒ㄍ瓿稍品?wù)綜合可信評(píng)估;Singh等[9]搭建了多維信任評(píng)估系統(tǒng)對(duì)云服務(wù)進(jìn)行選擇。
云制造環(huán)境下,針對(duì)制造云服務(wù)有效性和綜合質(zhì)量評(píng)估的研究是建立在云平臺(tái)上存在大量可靠且真實(shí)的制造云服務(wù),而實(shí)際上有些制造云服務(wù)存在虛假行為,通過(guò)文獻(xiàn)分析可知,現(xiàn)有文獻(xiàn)對(duì)剔除或識(shí)別虛假云服務(wù)的研究較少,或者對(duì)虛假云服務(wù)的識(shí)別程度較小甚至并未識(shí)別虛假云服務(wù),有關(guān)虛假云服務(wù)的識(shí)別僅依賴于用戶的反饋。
本文以商業(yè)化運(yùn)營(yíng)的工程機(jī)械交易云平臺(tái)“鐵臂商城”作為數(shù)據(jù)源,采用3個(gè)步驟進(jìn)行基于虛假云服務(wù)剔除的制造云服務(wù)優(yōu)選:①基于蒙特卡洛模擬估計(jì)超體積的虛假云服務(wù)剔除;②建立基于遺傳算法(Genetic Algorithm, GA)的模糊c均值聚類算法(Fuzzyc-Means algorithm, FCM)進(jìn)行制造云服務(wù)可信度評(píng)估,結(jié)合層次分析法(Analytic Hierarchy Process, AHP)和熵值法提出云服務(wù)組合賦權(quán)綜合評(píng)價(jià)模型來(lái)計(jì)算云服務(wù)綜合評(píng)價(jià)值;③將云服務(wù)的可信度等級(jí)與綜合評(píng)價(jià)值結(jié)合,對(duì)云服務(wù)進(jìn)行優(yōu)選排序,得到最佳制造云服務(wù)。
“鐵臂商城”是行業(yè)內(nèi)首家網(wǎng)上購(gòu)置工程機(jī)械的交易平臺(tái),聚集了國(guó)內(nèi)外工程機(jī)械大小品牌的各種型號(hào),其種類豐富、型號(hào)齊全,經(jīng)過(guò)多年運(yùn)營(yíng),積累了龐大的客戶交易量。
為了獲取平臺(tái)上不同數(shù)據(jù)類型的云服務(wù)信息,本文針對(duì)該平臺(tái)開(kāi)發(fā)了一個(gè)網(wǎng)頁(yè)爬蟲(chóng),通過(guò)網(wǎng)頁(yè)爬蟲(chóng)爬取特定位置所需的云服務(wù)信息。分析平臺(tái)上影響云服務(wù)可信度評(píng)估和質(zhì)量綜合評(píng)價(jià)的因素,確定爬取每個(gè)云服務(wù)的10項(xiàng)信息,將10項(xiàng)信息歸類為云服務(wù)ID和5項(xiàng)評(píng)價(jià)指標(biāo)。品牌和型號(hào)為云服務(wù)ID,5項(xiàng)評(píng)價(jià)指標(biāo)分為兩級(jí),一級(jí)指標(biāo)分別為云服務(wù)的完備性、可靠性、交互性,二級(jí)指標(biāo)包括云服務(wù)性能描述、云服務(wù)參數(shù)配置、服務(wù)提供者的實(shí)物操作圖或視頻描述,供應(yīng)商信息,詢價(jià)和交易評(píng)分信息。圖1所示為評(píng)價(jià)指標(biāo)和綜合評(píng)價(jià)層次分析結(jié)構(gòu)圖。
上述信息需要采用不同的處理方式轉(zhuǎn)化為定量指標(biāo)才能用于后續(xù)云服務(wù)的識(shí)別、評(píng)價(jià)和優(yōu)選。不同指標(biāo)的量化方式如下:
(1)性能描述信息 平臺(tái)上對(duì)每一個(gè)云服務(wù)性能的描述差異較大,因此本文以性能描述的詳細(xì)程度對(duì)其進(jìn)行量化。描述云服務(wù)的字?jǐn)?shù)越多,詳細(xì)程度越高。例如針對(duì)挖掘機(jī),隨機(jī)抽取爬取數(shù)據(jù)的50個(gè)樣本,計(jì)算描述性能的字?jǐn)?shù),通過(guò)主觀評(píng)判將性能描述信息量化為0~100之間的數(shù),并分為五段數(shù)值。量化公式為:
z1(w)=
(1)
式中:z1為云服務(wù)性能描述信息量化的數(shù)值;w為性能描述的字?jǐn)?shù)。5個(gè)分段區(qū)間臨界值通過(guò)計(jì)算取樣值得到。
(2)參數(shù)配置信息 對(duì)參數(shù)的項(xiàng)數(shù)進(jìn)行量化。由于工程機(jī)械自身的性能參數(shù)較多,云服務(wù)的參數(shù)項(xiàng)數(shù)越多,對(duì)云服務(wù)描述得越詳細(xì),云服務(wù)的綜合質(zhì)量越好。將參數(shù)配置項(xiàng)數(shù)量化為0~100之間的數(shù)。量化公式為
(2)
式中:z2為參數(shù)配置信息量化的數(shù)值;e為某云服務(wù)參數(shù)的項(xiàng)數(shù);emax和emin分別為某類工程機(jī)械在云平臺(tái)上參數(shù)項(xiàng)數(shù)的最大值和最小值。
(3)實(shí)物操作圖或視頻描述信息 以提供的實(shí)物操作圖(視頻)的多少作為量化依據(jù),將操作圖(視頻)數(shù)量從0~5(含>5)張(個(gè))對(duì)應(yīng)不同量化值,對(duì)應(yīng)的量化數(shù)值z(mì)3=0,20,40,60,80,100。
(4)供應(yīng)商信息 供應(yīng)商對(duì)云服務(wù)能否達(dá)成交易起重要作用。將云服務(wù)的供應(yīng)商數(shù)量化為0~100之間的數(shù),量化公式為
(3)
式中:z4為品牌供應(yīng)商信息量化的數(shù)值;A為某云服務(wù)供應(yīng)商的數(shù)量;Amax和Amin分別為某工程機(jī)械云服務(wù)供應(yīng)商數(shù)量的最大值和最小值。
(5)詢價(jià)和交易評(píng)分信息 該項(xiàng)信息包括詢價(jià)數(shù)量、評(píng)價(jià)總?cè)藬?shù)、交易的平均評(píng)分、有效評(píng)價(jià)個(gè)數(shù)和平均詢價(jià)時(shí)間。平臺(tái)上的這些信息為量化數(shù)據(jù),可借鑒式(2)將其量化到0~100之間,取平均值作為詢價(jià)和交易評(píng)分的數(shù)值z(mì)5。
通過(guò)分析平臺(tái)數(shù)據(jù)總結(jié)歸納認(rèn)為,虛假制造云服務(wù)信息分化嚴(yán)重,特點(diǎn)有:①制造云服務(wù)提供的基礎(chǔ)信息(包括性能屬性、參數(shù)配置和實(shí)物操作圖)不全或無(wú)相關(guān)信息內(nèi)容。例如,在無(wú)基礎(chǔ)信息的情況下,擁有比較高的平均評(píng)分、較多的詢價(jià)數(shù)量,且評(píng)論都是一邊倒的好評(píng)。②基礎(chǔ)信息完備,但無(wú)交易人數(shù)和交易評(píng)分,而且沒(méi)有供應(yīng)商信息等。由于虛假制造云服務(wù)涉及多個(gè)評(píng)價(jià)指標(biāo),評(píng)判虛假制造云服務(wù)需要綜合考慮多個(gè)指標(biāo)因素。
選用超體積(hypervolume)作為衡量多個(gè)因素的綜合指標(biāo),計(jì)算每個(gè)云服務(wù)多維指標(biāo)的超體積值,根據(jù)超體積值識(shí)別虛假制造云服務(wù),并將其剔除。計(jì)算過(guò)程中超體積方法考慮了解集的收斂性、均勻性和廣泛性[10],因此特性優(yōu)良。
本文所建的云服務(wù)評(píng)價(jià)指標(biāo)體系為高維數(shù)據(jù),包括5個(gè)指標(biāo)(5維數(shù)據(jù)),而且每個(gè)云服務(wù)的多維數(shù)據(jù)必然存在超體積值。通過(guò)比較其云服務(wù)的超體積值與選定的標(biāo)準(zhǔn)超體積來(lái)判斷云服務(wù)的數(shù)據(jù)是否達(dá)到標(biāo)準(zhǔn),以此識(shí)別云服務(wù)的真實(shí)性。超體積算法不但可以綜合分析多個(gè)指標(biāo)屬性,而且能夠通過(guò)異常結(jié)果發(fā)現(xiàn)兩極分化現(xiàn)象[11]。
由于超體積算法在高維空間中的計(jì)算時(shí)間太長(zhǎng)[12],本文選擇基于蒙特卡洛模擬估計(jì)的超體積算法計(jì)算云服務(wù)評(píng)價(jià)指標(biāo)的超體積值,蒙特卡洛模擬估計(jì)能夠從已知概率分布抽樣建立各種估計(jì)量。文獻(xiàn)[13]證明,該算法設(shè)定的采樣點(diǎn)越多,計(jì)算的估計(jì)值越接近準(zhǔn)確值,而且用時(shí)較少。
采用基于蒙特卡洛模擬估計(jì)計(jì)算云服務(wù)評(píng)價(jià)指標(biāo)的超體積過(guò)程如下:
P={P1,P2,…,Pk,…,Pn}為包含任意n個(gè)制造云服務(wù)的集合,S∶{(z1,z2,…,zj,…,zM)∈P|?1≤j≤M,lj≤zj≤uj}為云服務(wù)的評(píng)價(jià)指標(biāo),其中:M為云服務(wù)評(píng)價(jià)指標(biāo)的個(gè)數(shù)(維數(shù)),zj為指標(biāo)值,uj和lj分別為指標(biāo)的上下限。所有指標(biāo)形成的多維空間最大體積
(4)
定義1a為某云服務(wù)指標(biāo)在評(píng)價(jià)指標(biāo)多維空間中代表的一個(gè)點(diǎn),P為云服務(wù)集合,R為參考點(diǎn)。將P中所有云服務(wù)評(píng)價(jià)指標(biāo)投影到二維平面,表現(xiàn)為點(diǎn),如圖2中的點(diǎn)a,b,c,d所示,a點(diǎn)與參考點(diǎn)R形成的矩形與其他點(diǎn)形成的矩形有交集,用H(a,P,R)表示a與參考點(diǎn)R所圍成矩形區(qū)域,Hh(a,P,R)表示a與參考點(diǎn)R所圍成矩形的第h個(gè)區(qū)域。圖1中,H(a,P,R)是所有陰影構(gòu)成的矩形,由H1(a,P,R),H2(a,P,R),H3(a,P,R),H4(a,P,R)組成。
超體積算法需預(yù)先設(shè)定參考點(diǎn)R,則云服務(wù)集合P與參考點(diǎn)R構(gòu)成一個(gè)評(píng)價(jià)指標(biāo)多維空間,n個(gè)云服務(wù)點(diǎn)P1,P2,…,Pn隨機(jī)分布在多維空間中。運(yùn)用蒙特卡洛思想,計(jì)算n個(gè)云服務(wù)在各區(qū)域中的分布數(shù)量占總云服務(wù)數(shù)量的比值,用該比值和總體積計(jì)算各區(qū)域所占的體積。判斷云服務(wù)評(píng)價(jià)指標(biāo)點(diǎn)Pk是否在區(qū)域Hh(a,P,R)(1≤h≤q,a∈P,q為區(qū)域的數(shù)量)中的兩個(gè)依據(jù)為:①在多維空間中,確認(rèn)Pk是在參考點(diǎn)R的“下方”,即R的各維數(shù)據(jù)均大于Pk,使得Pk被參考點(diǎn)R支配;②確認(rèn)點(diǎn)Pk支配的云服務(wù)點(diǎn)的集合Y不是空集。如果兩個(gè)條件滿足,則點(diǎn)Pk在區(qū)域Hh(a,P,R)中,有h=|Y|,且a∈Y,說(shuō)明a在第h部分區(qū)域。如圖2所示,H2(a,P,R)兩塊區(qū)域中的點(diǎn)分別支配集合Y=(a,c)和Y′=(a,b)的云服務(wù)點(diǎn),故h=|Y|=2。如果上面兩個(gè)條件有一個(gè)不滿足,則Pk不在區(qū)域Hh(a,P,R)中。
定義2用于統(tǒng)計(jì)h區(qū)域中采樣點(diǎn)的數(shù)量。
通過(guò)上面的定義及說(shuō)明,計(jì)算對(duì)應(yīng)部分的體積估計(jì)值:
(5)
由大數(shù)定理可知,適當(dāng)增加n可以逼近對(duì)應(yīng)超體積的真實(shí)值。因?yàn)槎鄠€(gè)不同的云服務(wù)點(diǎn)和共同的參考點(diǎn)分別圍成的區(qū)域間可能重疊,所以設(shè)置共享權(quán)重系數(shù)
(6)
則a對(duì)應(yīng)的蒙特卡洛估計(jì)超體積值
(7)
由于虛假云服務(wù)的特點(diǎn),采用蒙特卡洛估計(jì)超體積法計(jì)算得到的這類云服務(wù)評(píng)價(jià)指標(biāo)蒙特卡洛估計(jì)超體積值較大,通過(guò)設(shè)定超體積最低標(biāo)準(zhǔn)值,判別云服務(wù)是否為虛假或惡意云服務(wù)。
由超體積算法以及設(shè)定的最低標(biāo)準(zhǔn)值云服務(wù)點(diǎn)可知,任意云服務(wù)與最低標(biāo)準(zhǔn)值云服務(wù)點(diǎn)(以下稱為標(biāo)準(zhǔn)點(diǎn))存在3種關(guān)系:
(1)支配標(biāo)準(zhǔn)點(diǎn) 這類云服務(wù)的各維數(shù)值大于標(biāo)準(zhǔn)點(diǎn),其超體積值小于標(biāo)準(zhǔn)點(diǎn)的超體積值,這類云服務(wù)被認(rèn)定為非虛假或非惡意的云服務(wù),可以全部保留。
(2)被標(biāo)準(zhǔn)點(diǎn)支配 這類云服務(wù)的各維數(shù)值小于標(biāo)準(zhǔn)點(diǎn)數(shù)值,認(rèn)定為虛假云服務(wù)點(diǎn),其超體積值大于標(biāo)準(zhǔn)點(diǎn)的超體積值,這類云服務(wù)能夠完全剔除。
(3)與標(biāo)準(zhǔn)點(diǎn)互不支配 這類差異性表現(xiàn)在云服務(wù)某些維度的屬性值小于標(biāo)準(zhǔn)點(diǎn)數(shù)值,甚至極小,根據(jù)超體積算法綜合考慮各個(gè)維度,剔除其中超體積值大于標(biāo)準(zhǔn)點(diǎn)超體積值的云服務(wù),即將這類云服務(wù)認(rèn)定為虛假云服務(wù)。
超體積算法處理這部分云服務(wù)時(shí),可能會(huì)保留一些質(zhì)量不好的云服務(wù),但是通過(guò)后續(xù)的聚類算法能夠保證不將這類虛假云服務(wù)推薦給用戶。
為了給用戶推薦優(yōu)秀的云服務(wù)或云服務(wù)集合,并使被推薦的云服務(wù)各維數(shù)值相差不懸殊,本文綜合考慮各維度屬性,利用聚類算法評(píng)價(jià)云服務(wù)的可信度等級(jí),該方法能夠明確兩個(gè)不同集合云服務(wù)的差異,并保證不選擇未能識(shí)別的虛假云服務(wù),而且后續(xù)操作只需考慮優(yōu)秀的云服務(wù)集合,從而減少數(shù)據(jù)處理量。
分析現(xiàn)有文獻(xiàn)可知,本文將模糊聚類應(yīng)用于云服務(wù)可信度評(píng)估,能夠通過(guò)改進(jìn)的模糊聚類方法劃分云服務(wù)可信度等級(jí),將可信度等級(jí)最高的云服務(wù)聚類集推薦給云用戶。本文采用聚類算法將所有云服務(wù)歸為A(好),B(良好),C(較好),D(一般),E(差)5個(gè)可信度等級(jí)集合。
定義3P={P1,P2,…,Pk,…,Pn}?ΩM是制造云服務(wù)空間ΩM中的一個(gè)有限數(shù)據(jù)集合,M為云服務(wù)評(píng)價(jià)指標(biāo)的維數(shù),n為云服務(wù)的個(gè)數(shù),則對(duì)P的c(2≤c≤n)個(gè)模糊聚類劃分是一個(gè)c×n矩陣U=(uik)cn∈Ωc×n,模糊分類矩陣U滿足如下條件:
0≤uik≤1,1≤i≤c,1≤k≤n;
式中uik為第k個(gè)云服務(wù)屬于第i類的隸屬度值。
基于上述定義,F(xiàn)CM描述為求(U,V)使下式最小化:
(8)
式(8)是一個(gè)關(guān)于(U,V)的約束優(yōu)化問(wèn)題,利用極值點(diǎn)的K-T(Kuhn-Tucker)必要條件,得到如下迭代公式:
i=1,2,…,c,k=1,2,…,n。
(9)
i=1,2,…,c,j=1,2,…,M。
(10)
FCM流程為:①設(shè)定聚類個(gè)數(shù)c和模糊系數(shù)m,初始化聚類中心V0和收斂精度ε,令迭代次數(shù)t=1;②用式(9)計(jì)算Ut+1;③用式(10)計(jì)算Vt+1,令t=t+1;④若‖Vt+1-Vt‖<ε或達(dá)到最大迭代數(shù)tmax,則輸出Vt+1,否則返回步驟②繼續(xù)迭代。
由于FCM在聚類過(guò)程中容易因初始值不佳陷入局部收斂點(diǎn),有學(xué)者將FCM與不同群體智能算法結(jié)合[14-16]。如果與GA結(jié)合,則可將GA算法的染色體設(shè)置為隸屬度矩陣或聚類中心,染色體若為隸屬度矩陣,則迭代搜索和尋優(yōu)性能較低,不能滿足算法需要。本文提出面向云服務(wù)可信度評(píng)估的基于GA的FCM采用聚類中心為GA的染色體。
3.2.1 初始聚類中心的選取
設(shè)聚類數(shù)為c,初始聚類中心V0=[v1,v2,…,vi,…,vc]T,有vi=[vi1,vi2,…,vij,…,viM],則
vij=rand×(max(zij)-min(zij))。
(11)
式中:rand∈(0,1);max(zij)和min(zij)分別為n個(gè)云服務(wù)中第j維數(shù)據(jù)的最大值和最小值。
3.2.2 算法步驟
面向云服務(wù)可信度評(píng)估的基于GA的FCM操作包括編碼、生成初始群體、選擇、交叉、變異。
(1)編碼 基于制造云服務(wù)的數(shù)據(jù)集特點(diǎn),本文采用元胞數(shù)組對(duì)聚類中心進(jìn)行編碼,每個(gè)染色體,即每個(gè)元胞對(duì)應(yīng)一個(gè)聚類中心,為c×M矩陣,染色體V=(vij)cM∈Rc×M。
(2)生成初始群體 利用式(11)生成Num個(gè)初始聚類中心V0,即為初始群體Po。
(3)選擇操作 計(jì)算當(dāng)代群體中每一個(gè)個(gè)體(聚類中心)的適應(yīng)度,按適應(yīng)度大小用輪盤選擇法選擇用于交叉的父本。
將每個(gè)分類集到各自聚類中心的歐式距離之和最小化作為聚類準(zhǔn)則,建立適應(yīng)度函數(shù)
(12)
i=1,2,…,c,j=1,2,…,M。
(13)
基于以上方法,面向云服務(wù)可信度評(píng)估的基于GA的FCM的步驟為:
(1)設(shè)置參數(shù)模糊指數(shù)m、模糊聚類數(shù)c、種群規(guī)模Num、外部檔案?jìng)€(gè)數(shù)Enum、交叉概率Pc、變異概率Pm、最大迭代次數(shù)tmax。
(2)獲取初始聚類中心,得到初始聚類中心種群Po,t=0。
(3)用式(12)計(jì)算適應(yīng)度值,為保留父代個(gè)體的優(yōu)越性,建立外部檔案,選取適應(yīng)度值大的個(gè)體放入外部檔案。
(4)基于FCM計(jì)算模糊分類矩陣U,更新聚類中心種群為Po′。
(5)利用遺傳算子對(duì)Po′進(jìn)行選擇、交叉、變異操作,得到種群Po″。
(6)計(jì)算3個(gè)種群Po,Po′,Po″中個(gè)體的適應(yīng)度值,更新外部檔案。
(7)判斷是否滿足終止條件,不滿足則t=t+1,返回(4);滿足則輸出外部檔案中適應(yīng)值最小的基因?yàn)榫垲愔行腣t。
對(duì)3.2節(jié)得到的云服務(wù)聚類中心Vt,按照下式判斷可信度評(píng)價(jià)等級(jí):
(14)
式中VGi表示第i個(gè)聚類中心M維數(shù)據(jù)值的乘積,按乘積大小決定可信度等級(jí),乘積越大,可信度等級(jí)越高,分級(jí)按照A,B等依次類推。
為了驗(yàn)證算法的有效性,同時(shí)考慮聚類效果的可視性,實(shí)驗(yàn)選擇對(duì)5項(xiàng)評(píng)價(jià)指標(biāo)進(jìn)行主成分分析,確定用于測(cè)試的3項(xiàng)指標(biāo)。對(duì)第1章云服務(wù)信息中5項(xiàng)評(píng)價(jià)指標(biāo)(性能描述、參數(shù)配置、實(shí)物圖或視頻、供應(yīng)商、詢價(jià)評(píng)分)中的3項(xiàng)開(kāi)展測(cè)試,結(jié)果如表1所示。從表1中選取方差百分比大的3個(gè)指標(biāo)值,即性能描述、云服務(wù)參數(shù)配置、服務(wù)提供者的實(shí)物操作圖或視頻描述,用本章聚類算法對(duì)云服務(wù)進(jìn)行聚類。
表1 主成分分析總方差
聚類算法參數(shù)為:模糊指數(shù)m=2,模糊聚類數(shù)c=5,種群規(guī)模Num=50,外部檔案?jìng)€(gè)數(shù)Enum=10,交叉概率Pc=0.8,變異概率Pm=0.2,最大迭代次數(shù)tmax=150。聚類結(jié)果如圖4所示。圖中3個(gè)坐標(biāo)為主成分分析后選定的3個(gè)指標(biāo),x1軸代表性能描述,x2軸代表參數(shù)配置,x3軸代表實(shí)物圖或視頻供應(yīng)。
從圖中看出基于GA的FCM精準(zhǔn)地將云服務(wù)集分為5個(gè)聚類,A類云服務(wù)聚類明顯,B與A或C類的交界處存在一些模糊狀態(tài),分界線不明顯,一些點(diǎn)在聚類時(shí)出現(xiàn)偏差。總體上,面向云服務(wù)可信度評(píng)估的基于GA的FCM對(duì)云服務(wù)的聚類比較理想,滿足實(shí)驗(yàn)要求。
由于各指標(biāo)對(duì)云服務(wù)質(zhì)量的影響程度不同,從主觀和客觀的角度考慮,在“好”、“良好”集合中選擇云服務(wù)進(jìn)行評(píng)價(jià),并按照評(píng)價(jià)分?jǐn)?shù)從高到低優(yōu)先推薦給使用者參考,從而確保與標(biāo)準(zhǔn)點(diǎn)互不支配的未被剔除的虛假云服務(wù)點(diǎn)不被選擇。建立如圖1所示的指標(biāo)層次分析結(jié)構(gòu),通過(guò)層次分析法和熵值法分別計(jì)算指標(biāo)權(quán)重和組合權(quán)重,然后進(jìn)行綜合評(píng)價(jià),得到各云服務(wù)的評(píng)價(jià)值。
為克服AHP層次分析法主觀性較強(qiáng)、不依賴數(shù)據(jù),熵值法數(shù)據(jù)之間缺少橫向比較、過(guò)于依賴數(shù)據(jù)的缺點(diǎn),本文將兩種方法結(jié)合,形成組合賦權(quán)評(píng)價(jià)法。按照層次分析結(jié)構(gòu),對(duì)云服務(wù)評(píng)價(jià)指標(biāo)構(gòu)造一級(jí)指標(biāo)層判斷矩陣F和二級(jí)指標(biāo)層判斷矩陣GF1,GF2,GF3,完成矩陣一致性檢驗(yàn)(計(jì)算矩陣最大特征值λmax、一致性指標(biāo)CI、一致性比率CR)、層次單排序和層次總排序,確定每項(xiàng)指標(biāo)的權(quán)重αj,即主觀權(quán)重。AHP法的詳細(xì)流程請(qǐng)參見(jiàn)文獻(xiàn)[17]。熵值法中,經(jīng)過(guò)5個(gè)步驟計(jì)算云服務(wù)二級(jí)指標(biāo)層的5項(xiàng)指標(biāo),即構(gòu)造判斷矩陣,進(jìn)行歸一化處理,計(jì)算每項(xiàng)指標(biāo)熵值ej、指標(biāo)差異系數(shù)εj和每項(xiàng)指標(biāo)熵值權(quán)重βj(即客觀權(quán)重)。具體流程請(qǐng)參考文獻(xiàn)[18],AHP法與熵值法的綜合評(píng)價(jià)流程請(qǐng)參考文獻(xiàn)[19-23]。
上述兩種評(píng)估方法不同,得到的權(quán)重也不同,為了避免兩個(gè)權(quán)重之間差異較大,對(duì)所得權(quán)重進(jìn)行一致性檢驗(yàn),公式為
(15)
式中d(αβ)為距離,表示兩種方法確定權(quán)重的一致性程度,當(dāng)0≤d(αβ)≤1時(shí),賦權(quán)結(jié)果通過(guò)一致性檢驗(yàn)。
對(duì)一致性檢驗(yàn)后的權(quán)重進(jìn)行組合賦權(quán),步驟如下:
j=1,2,…,M。
(16)
(2)為使得到的兩權(quán)重差異最小,以組合賦權(quán)法的權(quán)重與主客觀權(quán)重之間的誤差平方和最小為目標(biāo):
(17)
wj=0.5αj+0.5βj。
(18)
(4)采用式(18)得到每個(gè)云服務(wù)的組合賦權(quán)權(quán)重,以此計(jì)算某個(gè)制造云服務(wù)的綜合評(píng)價(jià)值
(19)
基于可信度和組合賦權(quán)綜合評(píng)價(jià)值的制造云服務(wù)優(yōu)選過(guò)程如下,優(yōu)選過(guò)程中設(shè)定可信度評(píng)價(jià)等級(jí)的優(yōu)先級(jí)別高于綜合評(píng)價(jià)值:
(1)當(dāng)云服務(wù)評(píng)價(jià)等級(jí)相同時(shí),根據(jù)綜合評(píng)價(jià)值VCS的高低進(jìn)行優(yōu)選。
(2)當(dāng)云服務(wù)評(píng)價(jià)等級(jí)不同時(shí)分為兩類:①云服務(wù)i的評(píng)價(jià)等級(jí)優(yōu)于云服務(wù)j,且VCS,高于云服務(wù)j,則選擇云服務(wù)i;②云服務(wù)i的評(píng)價(jià)等級(jí)優(yōu)于云服務(wù)j,但VCS低于云服務(wù)j,若評(píng)價(jià)等級(jí)相鄰,且VCS在允許誤差δ(δ<10)范圍內(nèi),則選擇云服務(wù)i,否則選擇云服務(wù)j;若評(píng)價(jià)等級(jí)相差至少兩個(gè)級(jí)別,則優(yōu)先選擇可信度級(jí)別高的云服務(wù)。
某用戶采購(gòu)中大型挖掘機(jī),希望推薦10個(gè)云服務(wù)優(yōu)選方案。通過(guò)網(wǎng)頁(yè)爬蟲(chóng)技術(shù)獲取“鐵臂商城”平臺(tái)上300個(gè)挖掘機(jī)云服務(wù),爬取包括ID在內(nèi)的3 000條云服務(wù)信息,對(duì)得到的數(shù)據(jù)進(jìn)行量化處理。
設(shè)超體積參考點(diǎn)R=[101,101,101,101,101],每一云服務(wù)的評(píng)價(jià)指標(biāo)都對(duì)應(yīng)一個(gè)超體積值,設(shè)定最低標(biāo)準(zhǔn)值,計(jì)算最低標(biāo)準(zhǔn)值對(duì)應(yīng)的超體積值,作為超體積大小的衡量標(biāo)準(zhǔn)。如果云服務(wù)超體積大于最低標(biāo)準(zhǔn)值對(duì)應(yīng)的超體積差值,則判定該云服務(wù)為虛假云服務(wù),反之判定為真。
表2 虛假云服務(wù)剔除結(jié)果
利用基于GA的FCM對(duì)剔除虛假云服務(wù)后含260個(gè)云服務(wù)數(shù)據(jù)的數(shù)據(jù)集進(jìn)行可信度等級(jí)評(píng)估,算法參數(shù)與3.4節(jié)一致。經(jīng)算法優(yōu)化后,可信度聚類中心為
上述矩陣從上到下分別對(duì)應(yīng)云服務(wù)可信度的5個(gè)等級(jí)A,B,C,D,E,如表3所示。
表3 可信度等級(jí)分類統(tǒng)計(jì)表
建立一級(jí)指標(biāo)判斷矩陣及權(quán)重如表4所示。
表4 一級(jí)指標(biāo)判段矩陣及權(quán)重
由表可得λmax=3.038 5,一致性指標(biāo)CI=0.019 3,隨機(jī)一致性指標(biāo)RI=0.58,一致性比率CR=0.033 2<0.1,判斷矩陣符合一致性要求。
建立二級(jí)指標(biāo)判斷矩陣及權(quán)重,如表5~表7所示。
表5 服務(wù)完備性的二級(jí)指標(biāo)判段矩陣及權(quán)重
表6 可靠性的二級(jí)指標(biāo)判段矩陣及權(quán)重
表7 交互性的二級(jí)指標(biāo)判段矩陣及權(quán)重
由表可得λmax=4.138 7,CI=0.046 2,RI=0.90,CR=0.051 4<0.1,判斷矩陣符合一致性要求,是滿意一致性矩陣。
由表可得λmax=1.866 0,因?yàn)榕袛嗑仃嚍槎A矩陣,RI=0,所以判斷矩陣符合一致性要求,是滿意一致性矩陣。因?yàn)楸?數(shù)據(jù)與表6相同,所以也是滿意一致性矩陣。
通過(guò)層次總排序得AHP法各指標(biāo)的總權(quán)重,如表8所示。
表8 AHP法各指標(biāo)的總權(quán)重
利用熵值法求得5項(xiàng)指標(biāo)的熵權(quán)重,如表9所示。
表9 每項(xiàng)指標(biāo)熵值權(quán)重
采用式(15)對(duì)AHP法和熵值法得到的權(quán)重進(jìn)行一致性檢驗(yàn),得d(uv)=0.551 4<1,權(quán)重通過(guò)一致性檢驗(yàn)。
由式(19)得各指標(biāo)的組合權(quán)重,如表10所示。
表10 每項(xiàng)指標(biāo)的組合權(quán)重
由于可信度等級(jí)為A的云服務(wù)有54個(gè),不需要對(duì)其他等級(jí)云服務(wù)進(jìn)行賦權(quán)綜合評(píng)價(jià),將A集合中的云服務(wù)推薦給用戶,對(duì)挖掘機(jī)云服務(wù)進(jìn)行組合賦權(quán)綜合評(píng)價(jià),根據(jù)評(píng)價(jià)指標(biāo)選取綜合評(píng)價(jià)值前10個(gè)云服務(wù)作為用戶的優(yōu)先參考,其各項(xiàng)指標(biāo)如表11所示,基于可信度和綜合評(píng)價(jià)的結(jié)果如表12所示。
表11 選取的10個(gè)云服務(wù)指標(biāo)
表12 實(shí)驗(yàn)結(jié)果
按照第5章給出的基于可信度和綜合評(píng)價(jià)值的組合制造云服務(wù)優(yōu)選方案確定本實(shí)驗(yàn)推薦的優(yōu)秀云服務(wù)集合A,提供給用戶參考的優(yōu)先級(jí)較高的云服務(wù)按照挖掘機(jī)ID排序依次為ID7-ID8-ID1-ID5-ID4-ID2-ID10-ID9-ID3-ID6。
云制造服務(wù)模式的提出為全球制造業(yè)服務(wù)模式轉(zhuǎn)型奠定了堅(jiān)實(shí)的基礎(chǔ),而且這種新的制造服務(wù)模式對(duì)改善我國(guó)制造業(yè)發(fā)展現(xiàn)狀、促進(jìn)制造業(yè)服務(wù)水平升級(jí)具有積極作用,可以很好地滿足我國(guó)目前制造業(yè)發(fā)展市場(chǎng)的需求。制造云服務(wù)的虛假識(shí)別和云服務(wù)推薦優(yōu)選研究是云制造服務(wù)模式發(fā)展中的關(guān)鍵技術(shù)之一,本文提出一種基于超體積的算法來(lái)識(shí)別和剔除虛假云服務(wù),并根據(jù)可信度等級(jí)結(jié)合綜合評(píng)價(jià)值建立云服務(wù)優(yōu)化評(píng)估算法,對(duì)云服務(wù)進(jìn)行優(yōu)選。所提算法實(shí)現(xiàn)了虛假制造云服務(wù)識(shí)別和云服務(wù)最優(yōu)選擇,通過(guò)實(shí)例也驗(yàn)證了算法具有有效性和優(yōu)越性。