殷 巖,付曉東,2,劉 驪,岳 昆,劉利軍,馮 勇
1(昆明理工大學 信息工程與自動化學院,昆明 650500)
2(昆明理工大學 航空學院,昆明 650500)
3(云南大學 信息學院,昆明 650091)
隨著電子商務(wù)和電子服務(wù)的蓬勃發(fā)展,網(wǎng)上購物已在人們?nèi)粘I钪械玫綇V泛應(yīng)用.然而,由于互聯(lián)網(wǎng)的虛擬性、匿名性等特點,消費者在選擇合適的商品方面面臨諸多困難:首先,消費者在交易前無從查證商家的真實性、可靠性以及商家所售商品的優(yōu)劣性,只能通過搜索查看大量同款商品的評分評論來比較商品優(yōu)劣;其次,在實際交易過程中,會存在個別消費者獨裁現(xiàn)象,獨裁者給出高評分或低評分,影響商品最終的群體評價,導致群體消費者因獨裁者的反饋做出錯誤判斷;最后,由于利益牽引,存在不良商家雇傭大量消費者共謀評分,即通過給予其商品高分或給予對手商品低分評分,來引導該商品的群體評價,提升自身信譽或貶低競爭對手[1-3].為此,需要一個客觀的在線商品群體評價方法來幫助消費者選擇合適商品.而群體評價方法是通過集中群體中多數(shù)消費者對在線商品的偏好意見,形成群體對在線商品的偏好意見,得到最終的在線商品群體評價,為消費者提供正確的購買決策[4].
目前許多在線網(wǎng)站,如EBay,Amazon,Netflix等,借助第三方在線評分反饋機制來衡量在線商品的評價.其中最常用的評價方法就是SUM累加法和AVG均值法[5,6].累加法將消費者對商品的反饋評分分為好、中、差三種評級,在線商品的評價計算如下:每收到一條好評得+1分;每收到一條中評得0分;每收到一條差評得-1分[5].然后對得分進行累加,結(jié)果作為消費者對在線商品的群體評價的依據(jù);均值法將消費者對商品的所有反饋評分進行累加,然后除以評分次數(shù),記作消費者對在線商品的群體評價.然而這兩種方法都假設(shè)消費者對商品進行評分時評價標準一致,具有相同的主觀偏好[7].事實上,不同的消費者擁有不同的背景和消費心理,使得消費者的評價標準不一致.即使評價標準一致,在真實評價過程中,上述兩種方法也容易被不良商家通過雇傭消費者共謀評分,即通過給予其商品高分或給予對手商品低分評分,來引導該商品的群體評價,提升自身信譽或貶低競爭對手,為其他消費者提供錯誤的購買決策[1,2].
為此,本文提出利用Copeland社會選擇理論的在線商品群體評價[4,15].以社會選擇理論為基礎(chǔ),在不需要假設(shè)消費者偏好一致的情況下解決消費者評價標準不一致導致的在線商品評分不可比較,以及提升商品評價操縱復雜性的問題.
近年來,大量研究者致力于協(xié)助消費者購買在線商品時能夠做出正確的購買決策,為了達到較好的商品評價效果,已經(jīng)有一些文獻采取各種方法對在線商品評價問題進行了處理.
一些研究者基于在線商品評分進行評價[5-7].文獻[5][6]提出將累加法應(yīng)用于eBay這樣的電子商務(wù)網(wǎng)站上,得到在線商品評價;文獻[7]提出的在線評分反饋機制在進行在線商品評價時,假設(shè)消費者具有相同的主觀偏好和評價準則,然后進行在線商品評價.文獻[8]在累加法的基礎(chǔ)上提出了加權(quán)累加信用度計算模型,這種模型更能體現(xiàn)商家的信譽狀況,但依然沒有將商家的信用情況、合謀、 欺詐等其他因素添加到模型中.
目前,大多數(shù)電商網(wǎng)站對于在線商品評價的處理還處于初級階段,通常只是采用約束或激勵控制消費者給予公正的評分,以及允許消費者選擇評價的排序顯示方法,這些排序方法雖然簡單和直觀,但效果往往不夠理想.例如:按時間排序可能會導致消費者錯失很多公正的評分以及消費者容易受到虛假評分的誤導;按評分可靠性排序會存在不合理評分的問題等[9].為此,一些研究者提出根據(jù)不同的屬性對在線商品進行排序[10-12].文獻[10]根據(jù)消費者評論有用性,提出一個基于評論特征的商品排序系統(tǒng),使用文本分析技術(shù)從大量消費者評論信息中抽取商品特征,與同類商品作比較,最終創(chuàng)建一個統(tǒng)一的商品排序.文獻[11]提出了不確定性下的在線商品排序.不同于一般的只是基于預測的評級來排序商品,該方法將評分的不確定性和預測的可信性考慮在內(nèi)評估消費者信息搜尋的效益,有助于提高消費者的決策過程,并提高消費者選擇合適商品的滿意度,同時也節(jié)省了消費者的時間和精力.隨后,文獻[12]提出個性化商品排序,利用后驗等級分布和置信水平作為兩個關(guān)鍵因素預測不確定性,來提高個性化商品排序的準確性,使消費者能夠更準確地購買到合適的商品.
上述研究假設(shè)所有消費者的評價標準一致,如果這個假設(shè)成立,所有消費者對在線商品評分是可以比較的,那么結(jié)合消費者的評分對在線商品評價將不會有問題[16].然而,不同的消費者擁有不同的消費背景和消費心理,自然對在線商品的評價標準也不一致.此外,上述研究在進行在線商品評價時忽略了方法中的評分易被操縱的問題,導致不良商家雇傭虛假消費者,給出誤導性的商品評價.
考慮到以上研究中存在的評價標準不一致和操縱復雜度低的問題,提出利用Copeland社會選擇理論的在線商品群體評價.在不需要假設(shè)消費者評價標準一致的情況下,基于消費者歷史評分建立每個消費者對在線商品的偏好關(guān)系,分析個人偏好和集體選擇之間的關(guān)系[15].利用Copeland方法解決消費者評價標準不一致和操作復雜性低的問題,實現(xiàn)在線商品群體評價.最后,通過與已有的SUM和AVG法進行對比,來驗證本文方法的合理性、有效性.
為了解決消費者評價標準不一致和商品評價操縱復雜性低的在線商品群體評價問題,本文對在線商品群體評價問題描述如下:
定義1.消費者集合C={c1,c2,…,cm},m≥2,商品集合P={p1,p2,…,pn},n≥2.其中m為消費者個數(shù),n為商品個數(shù).
定義2.評分矩陣R=[ri,a]m×n.ri,a的取值表示消費者ci對商品pa的評分,ri,a=0時表示消費者ci未對商品pa評分.
定義3.在線商品群體評價p1,p2,…,pn.pn表示第n個商品的評價值.其中p1表示群體評價最高的最優(yōu)商品,pn表示群體評價最低的最差商品,pa>pb則表示商品pa優(yōu)于商品pb.
例1.假設(shè)給定5個消費者對4種商品進行評分,消費者集合為C={c1,c2,c3,c4,c5},商品集合為P={p1,p2,p3,p4},其中消費者-商品評分表示消費者對商品表現(xiàn)的偏好程度,采用電子商務(wù)評價機制中常用的5分制,rmn=[1,5]分別表示非常不偏好,不偏好,一般,偏好,特別偏好,0表示消費者未對在線商品進行評分.
表1 消費者-商品評分矩陣Table 1 Ratings matrix of consumer-product
由表1可知,消費者c1對商品p1不偏好,而消費者c2對商品p1特別偏好,然而不同的消費者有不同的消費者背景和消費心理,消費者的評價標準自然不一致,那么不同消費者對同一商品的評分不可比較,也就無法判斷商品p1的優(yōu)劣.而SUM和AVG法則是假設(shè)消費的評價標準一致,使評分具有可比較性,再得到商品的評價結(jié)果.
由表1可以看出,有超過一半以上的三個消費者c2,c3,c5認為商品p1優(yōu)于其他所有商品,同時只有一個消費者c4認為商品p4優(yōu)于商品p1,根據(jù)孔多賽原則,商品排序應(yīng)為p1>p4.
由表2可知,SUM和AVG法的評價結(jié)果為p4>p1,評價結(jié)果與大多消費者的偏好p1>p4不一致,違背了孔多塞原則,評價結(jié)果與獨裁者c4的偏好一致,違背了社會選擇理論中的非獨裁性,使評價結(jié)果不公平.
表2 商品評價表Table 2 Product evaluation
此外,當增加一個對商品p2給予5分好評,對其他商品不予評分的虛假消費者c6.SUM和AVG法的評價結(jié)果表明商品p2的排序由劣于商品p3上升到優(yōu)于商品p3,說明SUM和AVG法的操縱復雜性較低,容易被不良商家利用給出誤導性商品評價.
由于消費者的消費背景和消費心理不同,使消費者的評價標準不一致,從而導致不同消費者對同一商品的評分不可比較.消費者對商品的評分屬于個人效用,效用作為一種心理現(xiàn)象是無法計量的,也不能加總求和,所以集結(jié)不同消費者的基數(shù)評分不能用來衡量評價結(jié)果[15].為此,我們采用序數(shù)效用論通過順序或等級來研究不同消費者對同一商品的評價問題,即利用消費者偏好的高低來表示商品的優(yōu)劣排序[15].因此,我們需要得到同一消費者對不同商品的序數(shù)偏好關(guān)系.然而目前的評價系統(tǒng)為了方便消費者操作,采用簡單的評分形式,要改變評價系統(tǒng)得到消費者對購買商品的偏好次序需要付出太大的代價.同時,消費者必然不愿花費大量的時間、成本、隱私等方面問題提供復雜的偏好信息.
基于以上分析,我們提出先將每個消費者對不同商品的評分轉(zhuǎn)化為消費者對商品的偏好關(guān)系,解決不同消費者對同一商品的評分不可比較的問題.然后集結(jié)消費者對商品的偏好,兩兩比較得到對商品偏好的消費者總數(shù),最后利用Copeland社會選擇理論的在線商品群體評價實現(xiàn)在線商品的群體評價[4,13].此外,利用Copeland方法自身的操縱復雜性可增加商品評價的操縱復雜度,降低不良商家雇傭消費者給出誤導性評價的影響[4].
本文進行的群體評價需要一個公平合理的將個人偏好集結(jié)成群體偏好的方法.社會選擇理論作為現(xiàn)代經(jīng)濟學的重要發(fā)展成果之一,其研究的根本性問題即是通過集中群體中各位成員的偏好意見,形成集體意見,制定出符合成員利益的正確決策[4,16].其中的社會選擇函數(shù)與群體偏好相關(guān),它是與群體中成員的偏好有關(guān)的數(shù)量指標,能反映群體對各候選商品的群體評價[15].
社會選擇函數(shù)包含Condorcet方法、Borda方法、Copeland方法等多種方法[15].Copeland方法是由Ramon Llull于1299年在Ars Electionis上提出的排名方法,該方法利用成對比較的贏輸之差對候選人進行排名[19,20].相比其他方法,Copeland方法利用消費者有偏好的投票產(chǎn)生最優(yōu)商品,更易于理解,且處理靈活,并能夠快速確定最優(yōu)最差商品的排序[18].同時,Copeland方法具有操縱復雜性,該性質(zhì)可降低不良商家雇傭消費者給出誤導性評價的影響[4].
為了對在線商品進行群體評價,需要先從消費者的歷史評分數(shù)據(jù)中獲取每個消費者對在線商品的評分.但由于在線商品數(shù)量龐大,消費者共同評分過的商品數(shù)量過少,所以消費者對商品的評分矩陣一般是不完整的,而本文方法是基于消費者對商品偏好的兩兩比較,因此需要對不完整評分矩陣進行填充.目前,協(xié)同過濾方法[17]已被廣泛地用于推薦系統(tǒng),該方法通過尋找與自己評價指標最相似的消費者進行推薦[14].因此,本文使用協(xié)同過濾推薦方法填充不完整的消費者-商品矩陣.
首先利用消費者的共同評分數(shù)據(jù)Iij表示對商品偏好的相似程度,采用皮爾遜相關(guān)系數(shù)法度量消費者間相似性[15]:
(1)
其次,將相似度值超過閾值γ的消費者作為目標消費者的鄰居.在選擇消費者的共同評分Iij來計算消費者間的相似性時,若共同評分Iij數(shù)目較少時,說明消費者對商品偏好的相似度不高,那么需要根據(jù)數(shù)據(jù)實際情況,預先設(shè)定的閾值γ來加以設(shè)定調(diào)整,表示如下:
(2)
其中,γ(γ>0)為根據(jù)數(shù)據(jù)實際情況預先設(shè)定的閾值,min(Iij,γ)表示取Ii,j和γ中數(shù)值較小的一個.
最后,引入閾值K來限定消費者相似近鄰的選取,根據(jù)所求相似度Sim′(i,j),選擇當前消費者ci的前K個相似鄰居來預測消費者cj對商品pa的評分rj,a,表示如下:
(3)
由于消費者評分屬于個人效用不能加總求和,需要采用序數(shù)效用論來研究不同消費者對同一商品的評價問題,因此我們建立同一消費者對不同商品的序數(shù)偏好關(guān)系[15].
基于完整的消費者-商品評分矩陣R,計算每一個消費者ci∈C對商品pa,pb∈P(a,b=1,2,…,n且a≠b)的偏好矩陣CPi=[cpab]n×n,其中cpab=1表示相較于商品pa消費者ci更偏好商品pb;cpab=0表示消費者ci對商品pa和商品pb同樣偏好;cpab=-1表示相較于商品pb消費者ci更偏好商品pa.
(4)
進一步,根據(jù)每一個消費者對在線商品的偏好矩陣CPi統(tǒng)計m個消費者中cpab=1的人數(shù)為spab,即spab表示相較于商品pb更偏好商品pa的消費者ci的總數(shù),并將求出的所有商品被偏好的統(tǒng)計值spab表達為商品-商品偏好比較矩陣SPm=[spab]n×n:
(5)
根據(jù)上述步驟求出3.2中例1的商品-商品偏好比較矩陣如表3所示:
表3 商品-商品偏好比較矩陣表Table 3 Preference comparison matrix of product-product
其中,矩陣中p1p2=4表示在商品p1和商品p2比較中,偏好商品p1的消費者總數(shù)為4,即對應(yīng)表1中偏好商品p1的四個消費者c1,c2,c3,c5.
為了清楚地闡述本文提出的利用Copeland社會選擇理論的在線商品群體評價,首先引進兩個定義.
本文方法的核心思想是獲取商品pa和商品pb的Copeland評價值.而這里的Copeland評價值指的是消費者對商品pa和商品pb的偏好程度.所以我們用商品-商品偏好比較矩陣SPm=[spab]n×n來表示消費者對商品偏好情況,成對比較商品被偏好的次數(shù)后,將比較結(jié)果中商品pa贏輸?shù)拇螖?shù)分別累加,得到商品pa贏的次數(shù)Pw(pa)(即被偏好的次數(shù))與輸?shù)拇螖?shù)Pl(pa)(即不被偏好的次數(shù)),將贏輸次數(shù)作差得到商品pa的Copeland評價值Cs(pa).
定義4.商品-商品偏好比較矩陣SPm=[spab]n×n.spab的取值表示商品pa和pb的擇優(yōu)中,偏好商品pa的消費者總數(shù).
為了得到最終的在線商品群體評價,我們利用Copeland社會選擇理論將商品-商品偏好比較矩陣SPm=[spab]n×n中的商品偏好成對比較:pavspb即spabvsspba,表示在商品pa和商品pb的擇優(yōu)中,比較偏好商品pa的消費者總數(shù)spab和偏好商品pb的消費者總數(shù)spba,若spab>spba則表示消費者認為商品pa為最優(yōu)商品,記作pa贏一次,pb輸一次;若spab (6) 根據(jù)上述步驟求出3.2中的例1的商品-商品偏好比較結(jié)果如表4所示: 定義5.Copeland評價值Cs(pn).Cs(pn)的排序表示商品的優(yōu)劣情況p1,p2,…,pa,…,pn,其中p1為群體評價最高的最優(yōu)商品,而pn為群體評價最低的最差商品. 將擇優(yōu)偏好比較結(jié)果中商品pn贏輸?shù)拇螖?shù)分別累加,得到商品pn贏的次數(shù)Pw(pn)與輸?shù)拇螖?shù)Pl(pn),將贏輸差值作為商品pn的Copeland評價值Cs(pn)如下: Cs(pn)=Pw(pn)-Pl(pn) (7) 表4 商品-商品偏好比較結(jié)果表Table 4 Result of product-product preference comparison 對在線商品Copeland評價值Cs(pn)進行排序得到商品的優(yōu)劣情況p1,p2,…,pa,…,pn,從而實現(xiàn)在線商品的群體評價. 根據(jù)上述步驟求出3.2中的例1的在線商品群體評價如表5所示. 表5 在線商品群體評價表Table 5 Group evaluation of online product 由表5可知商品p1贏的次數(shù)Pw(p1)=3,商品p1輸?shù)拇螖?shù)Pl(p1)=0,則Copeland評價值Cs(p1)=3-0=3.其他商品以此類推,由此可實現(xiàn)在線商品的群體評價p1>p4>p3>p2,即商品p1為最優(yōu)商品.上述方法用算法描述如下. 4.4.1 算法描述及基本框架 算法:基于Copeland的在線商品群體評價算法 輸入:在線商品評分矩陣R=[ri,a]m×n 輸出:在線商品群體評價 1.computethecompleteRbycollaborativefilteringalgorithm; 2.fori=1 tomdo 3.compute thespabby (5); 4.endfor 5.Pw(pa):=0; 6.Pl(pa):=0; 7.fora=1tondo 8.forb=a+1tondo 9. if(a≠b)then 10. if(spab>spba)then 11.pn:=pa; 12.Pw(pa):=Pw(pa)+1; 13.Pl(pb):=Pl(pb)+1; 14. elsepn:=pb; 15.Pw(pb):=Pw(pb)+1; 16.Pl(pa):=Pl(pa)+1; 17.endfor 18.Cs(pn):=Pw(pn)-Pl(pn) 19.pn:=sort(Cs(pn)); 20.endfor 21.returnpn. 4.4.2 算法時間復雜度分析 從上面描述不難看出,算法中第7行的for循環(huán)表示逐一遍歷商品p1到pn的每種商品,即商品pa中a的取值范圍是a=1,2,…,n,其時間復雜度為O(n).算法中第8行的for循環(huán)表示逐一遍歷商品p2到pn的每種商品,即商品pb中b的取值范圍等于a+1的取值范圍,即b=2,…,n,其時間復雜度也為O(n).兩次for循環(huán)表示在商品pa=p1時,商品pb依次等于p2到pn,以此類推,pa循環(huán)一次,pb遍歷所有商品一次,則算法總的時間復雜度為O(n2). 為了通過驗證本文方法的合理性和有效性,下面對利用Copeland社會選擇理論的在線商品群體評價的對孔多賽原則、非獨裁性、一致性和操縱復雜性進行理論分析. 定理1.孔多賽原則:若存在商品pa,使得有一半以上的消費者ck(k>m/2)認為pa>pb,則商品pa是孔多賽候選商品. 證明:因為對任意的b={1,2,…,n|b≠a}都有偏好商品pa的消費者總數(shù)spab>spba,則Pw(pa)>Pl(pa),Pw(pb) 由3.2例1可知,SUM和AVG法的評價結(jié)果p4>p1>p3>p2均不滿足孔多塞原則.本文方法的評價結(jié)果為p1>p4>p3>p2,商品p1為最優(yōu)商品,滿足多數(shù)消費者的偏好,評價結(jié)果符合孔多賽原則. 定理2.非獨裁性:當且僅當只有一個獨裁者ci認為商品pa>pb,而其他所有消費者ck(k={1,2,…,m|k≠i})均持相反態(tài)度,評價結(jié)果中商品pb的評價結(jié)果不會低于商品pa. 證明:假設(shè)存在獨裁者ci認為pa>pb,而所有其他消費者認為pb>pa(b={1,2,…,n|b≠a}),當n>2時,spba=n-1>spab=1,則商品pb的Pw(pa) 由3.2例1可知,當只有一個消費者c4認為p4>p1商品,其他所有消費者均持相反的偏好時,SUM和AVG法的評價結(jié)果與獨裁者c4的偏好一致.而本文方法的評價結(jié)果未受獨裁者c4的偏好影響,說明本文方法具有非獨裁性,使評價結(jié)果更具公平性. 定理3.一致性:對任意商品pa,pb,若所有消費者都認為pa>pb時,有Cs(pa)>Cs(pb),則商品pa一定是群體評 1http://www.grouplens.org/node/73 價最高的最優(yōu)商品. 證明:假設(shè)所有消費者都認為pa>pb時,即對任意的b={1,2,…,n}都有偏好統(tǒng)計總數(shù)spab=n,spba=0,所以Pw(pa)=n,Pl(pa)=0,Pw(pb)=0,Pl(pb)=n,則Copeland評價值Cs(pa)=n,Cs(pb)=-n.那么Cs(pa)>Cs(pb)恒成立,評價結(jié)果與假設(shè)一致,商品pa是群體評價最高的最優(yōu)商品.說明本文方法具有一致性.反之亦成立. 定理4.操縱復雜性:對任意商品pa,增加對商品pa給予高評分的虛假消費者數(shù)量,而不改變其對其他商品pb的評分,評價結(jié)果不變. 證明:假設(shè)存在商品pb>pa,增加m個只對商品pa給予高分而對其他商品pb未進行評分的消費者,根據(jù)本文方法需要先根據(jù)公式(1)(2)(3)對未評分數(shù)據(jù)進行填充,填充后的數(shù)據(jù)與m個消費者對商品pa評分相同,則偏好商品pa和pb的消費者總數(shù)spba,spab值是同步增加的,因此Copeland評價值Cs(pb)>Cs(pa)保持不變,則評價結(jié)果與假設(shè)一致,表明本文方法的操縱更加復雜. 由3.2例1可知,相較于SUM和AVG方法的評價結(jié)果明顯向著操縱方向發(fā)生改變,本文方法的評價結(jié)果幾乎不變,說明本文方法的操縱復雜性更高. 為了驗證本文提出的利用Copeland社會選擇理論的在線商品群體評價的有效性,實驗數(shù)據(jù)采用具有真實評分的電影數(shù)據(jù)集MovieLens1來模擬在線商品的數(shù)據(jù).該數(shù)據(jù)集1682部電影模擬為在線商品數(shù),943名消費者模擬為消費者數(shù)量,10萬條左右的評分模擬為消費者對在線商品的評分.為了更明顯的呈現(xiàn)實驗結(jié)果,本實驗分別篩選出前1/32,1/16,1/8,1/4,1/2的商品五組實驗數(shù)據(jù).實驗環(huán)境為PC機,Windows 8系統(tǒng),Corei3處理器,4 GB內(nèi)存,Sublime Text為開發(fā)工具,Python為開發(fā)語言對五組數(shù)據(jù)進行調(diào)用,并記錄運行時間(單位:s). 為了進一步驗證在線商品群體評價模型的有效性,我們使用目前比較流行的兩種在線商品反饋機制:EBay的SUM累加法和Amazon的AVG均值法作為對比方法,分別對孔多塞原則、一致性和操作復雜性進行如下實驗驗證. 若本文方法的群體評價中的最優(yōu)商品與孔多賽候選商品一致,則本文方法滿足孔多賽原則.為了便于查看結(jié)果,本實驗特選取其中數(shù)據(jù)量最小的一組1/32,即943名消費者對52種商品的評價結(jié)果.利用孔多賽方法集結(jié)所有消費者的偏好,挑選出有一半以上的消費者認為該商品優(yōu)于其他所有商品的孔多賽候選商品#8商品. 圖1 孔多賽原則驗證Fig.1 Condorcet verification 進一步,由圖1可知,Copeland評價值最高的是#8商品,該商品為所選最優(yōu)商品;Copeland評價值最低的是#52商品,該商品為最差商品.本文方法得到的評價結(jié)果與孔多賽候選商品一致,所以本文方法結(jié)果滿足孔多賽原則. 對五組實驗數(shù)據(jù)進行驗證,本文方法的孔多賽商品命中率達到100%,而AVG均值法和SUM累加法為0. 所有消費者都認為商品pa>pb,則商品pa一定是群體評價最高的最優(yōu)商品.若本文方法的評價結(jié)果中最優(yōu)商品為pa,說明本文方法具有一致性.為了驗證本文方法的一致性,并能夠清晰展現(xiàn)評價結(jié)果,特選取1/32組的前20個消費者對前20種在線商品的評分,查看數(shù)據(jù)集發(fā)現(xiàn),所有消費者對#3商品評分均高于其他所有商品的評分.分別利用SUM法、AVG法和本文方法進行測試,測試結(jié)果如圖2所示. 圖2 三種算法的一致性對比Fig.2 Comparison of Consistency of Three Algorithms 由圖2可知,本文方法的評價結(jié)果區(qū)分明顯,更加直觀,SUM和AVG法的評價結(jié)果均在橫坐標上方,比較起來區(qū)分不明顯.本文方法最終的評價值是通過贏輸之差(被偏好次數(shù)減去不被偏好的次數(shù))得到的,Copeland評價值分布在橫坐標上下兩部分.排在橫坐標上方的Copeland評價值為正,評價值越高,對應(yīng)商品排序越靠前;排在坐標軸下方的Copeland評價值為負,評價值越高,對應(yīng)商品排序越靠后,因此根據(jù)本文方法可快速找到橫坐標上方評價值最高的最優(yōu)商品是#3號商品,橫坐標下方評價值最高的最差商品#18商品.最終的評價結(jié)果驗證了本文方法的一致性,也體現(xiàn)了Copeland方法的快速排序的優(yōu)點. 影響商品評價的一個重要問題就是不良商家和消費者共謀評分.共謀評分是指不良商家雇傭消費者對其商品給予高分或給予對手商品低分評分,來引導該商品的群體評價,提升自身信譽或貶低競爭對手[1-3].這種方式嚴重影響了消費者的購買決策,為此,本文利用Copeland方法的操縱復雜性來降低不良商家和消費者的共謀評分.為了驗證本文方法的操縱復雜性,并清晰查看效果,特選取數(shù)據(jù)最少的一組52種在線商品的評價情況為例.隨機抽取該組在線商品#6商品,然后隨機找出5個對#6商品評分為0的消費者,將該消費者對#6商品的評分逐次提升為1分,2分,3分,4分,5分后,記錄對應(yīng)三種算法的群體評價值如圖(a)所示.最后,逐次增加10個對排序最低的#52商品給予5分好評,對其他商品給予1分差評的虛假消費者,共增加6次,記錄對應(yīng)三種算法的群體評價值如圖(b)所示. 由圖3可知,無論是逐次提升#6商品的評分,還是逐次增加對#52商品好評的虛假消費者數(shù)量,本文方法的評價結(jié)果均未有明顯的變化.而根據(jù)SUM和AVG法得到的評價結(jié)果均有明顯地提升或降低.因為SUM和AVG法均是采用基數(shù)效應(yīng)論的思想直接基于評分進行評價,更容易被操縱,而本文方法采用序數(shù)效用論的思想,將評分轉(zhuǎn)化為偏好關(guān)系,并利用Copeland方法對偏好總數(shù)兩兩比較實現(xiàn)在線商品的群體評價,增加了評價的操縱復雜性.由此實驗結(jié)果可見,本文的方法的操縱復雜性得以驗證. 圖3 操縱復雜性驗證Fig.3 Complexity of manipulation verification 利用三種算法分別測試五組數(shù)據(jù),在不同在線商品數(shù)據(jù)集下,三種算法的性能不同.當消費者的數(shù)量固定,依次增加在線商品的數(shù)量,記錄下三種算法的運行時間(單位:s). 圖4 三種算法的性能比較情況Fig.4 Comparison of the performance of the three algorithms 由圖4可知,隨著在線商品的數(shù)量增加,每種算法的運行時間基本都成線性速度增長,由趨勢線可知,本文方法的運行時間隨著在線商品數(shù)量的增多快速增長,其他兩種算法的增速則呈放緩趨勢.本文方法的運行時間雖然增長過快,但在操縱復雜性上占優(yōu),相較于SUM和AVG法,本文方法更不易被不良商家操縱,更能為消費者提供可靠、真實的在線商品群體評價. 本文提出利用Copeland社會選擇理論的在線商品群體評價,基于消費者歷史評分進行群體評價,為消費者做出正確的購買決策提供參考.本文方法首先利用協(xié)同過濾算法對已有的消費者不完整評分數(shù)據(jù)集進行填充,并建立每個消費者對在線商品的偏好關(guān)系;然后通過社會選擇理論中的Copeland社會選擇函數(shù)兩兩比較消費者對在線商品的偏好,最終得到在線商品的群體評價.理論分析和實驗驗證了該方法滿足孔多賽原則、非獨裁性、一致性和操縱復雜性等性質(zhì),從而該方法對在線商品群體評價的有效性. 由于無法采集到新消費者的歷史評分記錄,不能準確地推斷新消費者的偏好.因此,因此下一步我們將繼續(xù)研究新消費者冷啟動問題. : [1] Wang G,Xie S,Liu B,et al.Review graph based online store review spammer detection[C].Proceedings of the 2011 IEEE 11thInternational Conference on Data Mining.IEEE Computer Society,2011:1242-1247. [2] Pan W,Xiang E W,Yang Q.Transfer learning in collaborative filtering with uncertain ratings[C].Proceedings of the Twenty-Sixth AAAI Conference on Artificial Intelligence,AAAI Press,2012:662-668. [3] Zhang Y,Bian J,Zhu W.Trust fraud:a crucial challenge for China′s e-commerce market[J].Electronic Commerce Research and Applications,2013,12(5):299-308. [4] Endriss U.Social choice theory as a foundation for multiagent systems[C].German Conference on Multiagent System Technologies,Springer International Publishing,2014:1-6. [5] Pinyol I,Sabater-Mir J.Computational trust and reputation models for open multi-agent systems:a review[J].Artificial Intelligence Review,2013,40(1):1-25. [6] Wu Y,Yan C G,Ding Z,et al.A novel method for calculating service reputation[J].IEEE Transactions on Automation Science and Engineering,2013,10(3):634-642. [7] J?sang A,Guo G,Pini M S,et al.Combining recommender and reputation systems to produce better online advice[M].Modeling Decisions for Artificial Intelligence,Springer Berlin Heidelberg,2013:126-138. [8] Ji Shu-xian,Hu Pei,Cheng Fei.Research on credit calculation model in online reputation management system [J].Forecast,2008,27(4):59-64. [9] Lin Yu-ming,Wang Xiao-ling,Zhu Tao,et al.Survey on quality evaluation and control of online reviews[J].Journal of Software,2014,25(3):506-527. [10] Najmi E,Hashmi K,Malik Z,et al.CAPRA:a comprehensive approach to product ranking using customer reviews[J].Computing,2015,97(8):843-867. [11] Zhang M,Guo X,Chen G,et al.Predicting consumer information search benefits for personalized online product ranking:a confidence-based approach[C]. Pacific Asia Conference on Information Systems,Pacis,2014:375-388. [12] Zhang M,Guo X,Chen G.Prediction uncertainty in collaborative filtering:Enhancing personalized online product ranking[J].Decision Support Systems,2016,83:10-21. [13] Nápoles G,Dikopoulou Z,Papageorgiou E,et al.Aggregation of partial rankings-an approach based on the Kemeny ranking problem[C].International Work-Conference on Artificial Neural Networks,Springer International Publishing,2015:343-355. [14] Sun Hui,Ma Yue,Yang Hai-bo,et al.Collaborative filtering recommendation algorithm by optimizing similarity and clustering users[J].Journal of Chinese Computer Systems,2014,35(9):1967-1970. [15] Yue Chao-yuan.Decision theory and method [M].Beijing:Science Press,2003. [16] Fu X,Yue K,Liu L,et al.Aggregating ordinal user preferences for effective reputation computation of online services[C].IEEE International Conference on Web Services.IEEE,2016:554-561. [17] Breese J S,Heckerman D,Kadie C.Empirical analysis of predictive algorithms for collaborative filtering[J].New Page,2013,7(7):43-52. [18] Alsharrah G.Ranking using the copeland score:a comparison with the Hasse diagram[J].Journal of Chemical Information & Modeling,2010,50(5):785. [19] Leake C.Multicriterion decision in management:principles and practice[J].Journal of the Operational Research Society,2001,52(5):603-603. [20] Colomer J M.Ramon Llull:from′Ars electionis′to social choice theory[J].Social Choice and Welfare,2013,40(2):317-328. [21] Moulin H.Handbook of computational social choice[M].Cambridge University Press,2016. 附中文參考文獻: [8] 紀淑嫻,胡 佩,程 飛.在線信譽管理系統(tǒng)中信用度計算模型研究[J].預測,2008,27(4):59-65. [9] 林煜明,王曉玲,朱 濤,等.消費者評論的質(zhì)量檢測與控制研究綜述[J].軟件學報,2014,25(3):506-527. [14] 孫 輝,馬 躍,楊海波,等.一種相似度改進的用戶聚類協(xié)同過濾推薦算法[J].小型微型計算機系統(tǒng),2014,35(9):1967-1970. [15] 岳超源.決策理論與方法[M].北京:科學出版社,2003.4.5 評價模型理論分析
5 實驗評估
5.1 孔多賽原則
5.2 一致性
5.3 操縱復雜性
5.4 算法性能測試
6 結(jié) 語