林燁婷,陳忠輝,馮心欣,鄭海峰
(福州大學(xué) 物理與信息工程學(xué)院,福建 福州 350116)
移動(dòng)群智感知是一種新的感知模式,它將普通用戶的移動(dòng)設(shè)備作為基本感知單元,利用網(wǎng)絡(luò)媒介,通 過有意識(shí)或無意識(shí)的協(xié)作,實(shí)現(xiàn)感知任務(wù)的分發(fā)以及感知數(shù)據(jù)的收集,完成大規(guī)模的、復(fù)雜的社會(huì)感知任務(wù)[1]。受限于感知任務(wù)參與者數(shù)量不足和提供數(shù)據(jù)質(zhì)量不高,群智感知的發(fā)展受到了嚴(yán)重的影響,因此需要設(shè)計(jì)任務(wù)分配機(jī)制和激勵(lì)機(jī)制[2]。而在實(shí)際的激勵(lì)機(jī)制選擇中,云平臺(tái)遇到了新的問題?,F(xiàn)實(shí)生活中參與群智感知的用戶類型和能力存在差異,例如出租車與公交車,其日常行駛路線有很大不同,前者行駛路線分散,且熱門地點(diǎn)出現(xiàn)的頻率高,后者行駛路線跨度大,且僅在幾條固定的路線行駛。于是在收集數(shù)據(jù)時(shí),兩種類型的車輛上傳的數(shù)據(jù)有很大的特征差異。在設(shè)計(jì)激勵(lì)機(jī)制時(shí),要考慮到用戶類型差異,才能使用戶利用率提高,云平臺(tái)收益最大化。激勵(lì)機(jī)制的設(shè)計(jì)是群智感知研究的關(guān)鍵,可以利用如博弈、拍賣、契約理論等方法來設(shè)計(jì)激勵(lì)機(jī)制[3]。
信息采集過程依據(jù)一種群智感知模式,如圖1所示。具體步驟如下。
(1)在信息傳輸采集系統(tǒng)中,由一個(gè)云平臺(tái)公布若干采集任務(wù)。介紹任務(wù)內(nèi)容并公布不同任務(wù)相對(duì)應(yīng)的報(bào)酬給若干個(gè)手機(jī)用戶。
(2)有一些手機(jī)用戶,例如手機(jī)用戶1、3、5響應(yīng),表示對(duì)其有興趣,之后手機(jī)用戶會(huì)使用自己的手機(jī)采集信息并將收集到的信息上傳至云平臺(tái)。而手機(jī)用戶2、4由于某些約束則不參加任務(wù)。
(3)手機(jī)用戶完成任務(wù)后,會(huì)得到步驟(1)所宣稱的報(bào)酬,用于彌補(bǔ)完成任務(wù)的損耗和獎(jiǎng)賞上傳信息的貢獻(xiàn)。該報(bào)酬實(shí)際上是與手機(jī)用戶遞交的結(jié)果相關(guān)的。
圖1 傳感過程圖
用戶遞交的結(jié)果好壞實(shí)際上取決于步驟(2)中用戶傳輸數(shù)據(jù)的信息傳輸速率,表達(dá)式如下:
(1)
其中B為帶寬,N為高斯噪聲的功率,S為用戶移動(dòng)設(shè)備的傳輸功率,S∈{SH,SL},云平臺(tái)公布的采集任務(wù)包含使用高功率SH傳輸?shù)娜蝿?wù)和使用低功率SL傳輸?shù)娜蝿?wù)兩種,命名為SH任務(wù)和SL任務(wù)。用戶可根據(jù)選擇的任務(wù)類型來選擇發(fā)射功率。由于信息采集過程受云平臺(tái)處理速度限制,信息傳輸速率并不是越快越好,考慮如圖2所示的信息傳輸速率密度圖,本文設(shè)置一閾值Xd,并定義兩種結(jié)果,將大于Xd的Xi定義為好結(jié)果,將大于Xd的Xi統(tǒng)計(jì)平均值X1定義為其帶來的收益;將小于Xd的Xi定義為壞結(jié)果,將小于Xd的Xi的統(tǒng)計(jì)平均值X0定義為其帶來的收益,于是X1>X0,X={X0,X1},Xi∈X,i∈{0,1}。
圖2 數(shù)據(jù)傳輸速率密度分布圖
利用契約理論,將群智感知轉(zhuǎn)換為契約關(guān)系,則云平臺(tái)為委托人,手機(jī)用戶為代理人[4]。委托人的任務(wù)是設(shè)計(jì)出一個(gè)獲取代理人私人信息的有效合同。
該數(shù)據(jù)采集過程中存在1個(gè)委托人和n個(gè)異構(gòu)化代理人,將其根據(jù)成本函數(shù)的不同(下面會(huì)進(jìn)行說明)劃分為好類型代理人與壞類型代理人。好類型代理人的比例為θG,壞類型代理人的比例為θB,且θG+θB=1。收益函數(shù)定義為收入減去成本,代理人的收益函數(shù)如下[5]:
EV=u(w(t))-C(t,S)
(2)
其中w(t),t∈{G,B}為代理人的報(bào)酬,與其類型相關(guān)。u(w(t))為代理人的收益,u(·)為效用函數(shù),代理人為風(fēng)險(xiǎn)規(guī)避型用戶,其效用函數(shù)為凹性,效用隨貨幣收益增加而增加,但增加率遞減,即其二階導(dǎo)數(shù)小于零。其反函數(shù)為w(t)=u-1。C(t,S)為代理人成本函數(shù),根據(jù)代理人類型分為兩種C(G,S)=v(S),C(B,S)=cv(S),如圖3所示,不失一般性,將函數(shù)定義為線性的,其中c>1。v(S)為行動(dòng)成本函數(shù),與其實(shí)際傳輸功率相關(guān)。如圖定義SH>SL,所以v(SH)>v(SL)。對(duì)于相同的行動(dòng)成本,壞類型代理人需要更多成本,這也是壞類型代理人命名的原因。
圖3 代理人成本函數(shù)圖
風(fēng)險(xiǎn)中性委托人的收益函數(shù)如下:
(3)
通過式(2)和式(3)的對(duì)比,發(fā)現(xiàn)委托人和代理人之間存在利益沖突,為了最大化委托人的效益,并讓代理人按照契約執(zhí)行,本文需要設(shè)計(jì)一個(gè)契約。其策略是對(duì)于t類型代理人,令其完成S任務(wù),并給與其報(bào)酬w(t),另一類型代理人則完成另一種任務(wù)。將所提出的這樣一組(任務(wù),報(bào)酬)組合稱為契約,記為{(S,w(t))|?t∈G,B,S∈SH,SL}。最優(yōu)契約需要達(dá)到的目標(biāo)是令委托人的效益最大化,可表示為:
(4)
該目標(biāo)同時(shí)要滿足兩個(gè)條件:
(5)
(2)某類型的代理人會(huì)對(duì)應(yīng)選擇委托人為其類型提出的報(bào)酬而非其他類型的報(bào)酬,則最優(yōu)契約還需要滿足激勵(lì)相容約束(IC約束),這意味著,某類型代理人選擇為其設(shè)計(jì)的契約方案和選擇另一個(gè)契約方案,對(duì)其收益進(jìn)行比較,若前者較大則不會(huì)偽裝,否則該類型會(huì)偽裝為另一類型,可表示為:對(duì)于任何類型代理人,有
u(w(t))-C(t,S)≥u(w(t′))-C(t,S′)
?t≠t′,S≠S′
(6)
S′為t類型代理人完成t′類型代理人任務(wù)時(shí)的功率。
于是可將最優(yōu)契約求解問題構(gòu)造成一個(gè)帶有約束的最大化問題。契約按兩種方案討論,方案1:好類型代理人完成SH任務(wù),壞類型代理人完成SL任務(wù)。方案2:好類型代理人完成SL任務(wù),壞類型代理人完成SH任務(wù)。首先,以方案1為例進(jìn)行求解分析。
在對(duì)稱信息場(chǎng)景中,委托人可觀測(cè)到代理人的類型,代理人會(huì)如實(shí)上報(bào)自身類型信息,于是契約可由以下帶有約束的最大化問題求解。
(7)
s.t.
(8)
(9)
當(dāng)設(shè)計(jì)方案2契約時(shí),參照方案1的推導(dǎo)。
在對(duì)稱信息場(chǎng)景下,委托人應(yīng)按方案1還是方案2發(fā)布契約實(shí)際上取決于其收益,方案1中委托人收益為:
EU1=θG(π(SH)-w(G))+θB(π(SL)-w(B))=
方案2中委托人收益為:
EU2=θG(π(SL)-w(G))+θB(π(SH)-w(B))=
在不對(duì)稱信息場(chǎng)景中,由于信息的非對(duì)稱性,委托人在簽訂合同時(shí)不能觀測(cè)到代理人的類型,但知道代理人類型的統(tǒng)計(jì)信息。代理人為了提升個(gè)人利益,存在隱瞞真實(shí)信息的行為。為了解決該問題,委托人需激勵(lì)代理人披露其特征,這一機(jī)制也被稱為顯示原理。可由以下最大化問題求解:
(10)
s.t.
(11)
(12)
u(w(G))-v(SH)≥u(w(B))-v(SL)
(13)
u(w(B))-cv(SL)≥u(w(G))-cv(SH)
(14)
(15)
v(SH)-v(SL)≤u(w(G))-u(w(B))≤c(v(SH)
-v(SL))
(16)
由于收入不變,為了最大化委托人的收益,應(yīng)壓制兩種報(bào)酬到最大程度,于是壞類型IR約束(16)為緊約束,約束(16)中取較小的緊約束,即為:v(SH)-v(SL)=u(w(G))-u(w(B)),于是好類型契約即為以下方程組的解。
求解得:
當(dāng)設(shè)計(jì)方案2契約時(shí),參照方案1的推導(dǎo)。在激勵(lì)好類型代理人完成SL任務(wù)時(shí),無法同時(shí)激勵(lì)壞類型代理人完成SH任務(wù),即兩種類型的IC約束是矛盾的,于是該方案在該場(chǎng)景下無解。
結(jié)論2:在不對(duì)稱信息場(chǎng)景下,方案1最優(yōu)契約為:
在不對(duì)稱信息場(chǎng)景中,若發(fā)布結(jié)論1中方案1契約,好壞類型代理人均會(huì)選擇壞類型代理人對(duì)應(yīng)契約,這導(dǎo)致委托人的收益減小并且無法分辨用戶類型。于是需要激勵(lì)好類型用戶,提高給其的報(bào)酬,但提高的程度需要讓好壞類型代理人收入差控制在v(SH)-v(SL)與c(v(SH)-v(SL))之間,避免矯枉過正而讓壞類型代理人因此而隱瞞真實(shí)信息。多支付的報(bào)酬作為委托人獲取代理人私人信息承擔(dān)的信息租金。效率更高的好類型代理人收益增加了(c-1)v(SL)。
如圖4所示,當(dāng)好類型用戶比例θG不變時(shí),隨著噪聲N增大,委托人收益EU遞減。在N<0.152時(shí),當(dāng)噪聲功率N不變時(shí),好類型用戶比例θG遞增,委托人收益EU遞增,好類型用戶雇傭得越多,委托人收益越大。在N>0.152時(shí),則相反。
圖4 噪聲對(duì)委托人收益的影響
結(jié)合實(shí)際情況分析,在環(huán)境安靜、噪聲較小的情況下,好類型代理人有更大的概率得到清晰圖片,能給委托人帶去更多貢獻(xiàn)。雇傭越多好類型用戶,委托人收益越大。但在雨天等噪聲較大情況下,由于雷聲和雨衰,信道條件差、信噪比小,代理人均難以得到優(yōu)秀質(zhì)量圖片,由于好類型代理人需要更高的報(bào)酬,雇傭越少好類型用戶,委托人收益越大。
如圖5所示,當(dāng)好類型用戶比例θG不變時(shí),隨著代理人成本v(SH)增大,委托人收益EU遞減。在v(SH)<10時(shí),如果噪聲功率v(SH)不變,則好類型用戶比例θG遞增,委托人收益EU遞增。好類型用戶雇傭得越多,委托人收益越大。在v(SH)>10時(shí),則相反。
圖5 代理人成本對(duì)委托人收益的影響
結(jié)合實(shí)際情況分析,當(dāng)好類型代理人使用包月流量套餐傳輸數(shù)據(jù)時(shí),所付出的成本較低,其最優(yōu)契約報(bào)酬即委托人支出也較低,雇傭越多好類型用戶,委托人收益越大。當(dāng)好類型代理人使用按流量計(jì)費(fèi)模式傳輸數(shù)據(jù)時(shí),相較于包月流量套餐,所付出的成本較高,其最優(yōu)契約報(bào)酬也較高,雇傭越少好類型用戶,委托人收益越大。
如圖6所示,當(dāng)好類型用戶比例θG不變時(shí),隨著好壞結(jié)果分界線Xd增大,委托人收益EU先增大后減小,在Xd=5.3×107處達(dá)到最大值。在4.65×107 圖6 好壞結(jié)果分界線對(duì)委托人收益的影響 結(jié)合實(shí)際情況分析,分界線可理解為委托人的要求,當(dāng)要求在一個(gè)較低的范圍時(shí),隨著要求的逐漸提高,好壞結(jié)果的對(duì)應(yīng)收入增大,委托人得到的收益增大。當(dāng)要求在一個(gè)較高的范圍時(shí),隨著要求的逐漸提高,代理人越來越難以達(dá)到好結(jié)果。委托人得到的收益減小。對(duì)于離線服務(wù),如路線信息采集服務(wù),委托人對(duì)及時(shí)性和信息采集速率要求不高,好壞類型代理人均能遞交好結(jié)果。由于好類型報(bào)酬更高,雇傭越少好類型代理人,委托人收益越大。但對(duì)于在線服務(wù),如實(shí)時(shí)交通流采集服務(wù),委托人對(duì)及時(shí)性和信息采集速率要求較高,好類型遞交好結(jié)果的優(yōu)勢(shì)明顯,雇傭越多好類型代理人,委托人收益越大。最后,對(duì)于極高的質(zhì)量要求,好壞類型代理人都難以達(dá)到,雇傭越少好類型代理人,委托人收益越大。 本文利用契約理論提出了應(yīng)用于群智感知的激勵(lì)機(jī)制,有效解決了在不對(duì)稱信息場(chǎng)景下,委托人無法觀測(cè)到代理人類型信息而產(chǎn)生的問題。并結(jié)合仿真與實(shí)際情況分析了外界因素對(duì)委托人收益的影響,仿真結(jié)果表明本文的方法是可行、合理且與實(shí)際相符的。在下一步的研究中,將結(jié)合群智感知中存在的其他問題優(yōu)化契約。 [1] 劉魯濱, 朱燕民. 基于群智感知的噪音收集展示系統(tǒng)[J]. 計(jì)算機(jī)工程, 2015, 41(10):160-164. [2] 吳垚,曾菊儒,彭輝,等.群智感知激勵(lì)機(jī)制研究綜述[J].軟件學(xué)報(bào), 2016, 27(8): 2025-2047. [3] 袁桂霞, 周先春. 移動(dòng)群智感知網(wǎng)絡(luò)中基于QoS感知與協(xié)作競(jìng)爭(zhēng)的機(jī)會(huì)傳輸機(jī)制[J]. 計(jì)算機(jī)工程, 2016, 42(8): 73-79. [4] Li Yuqing, Zhang Jinbei, Gan Xiaoying, et al. A contract-based incentive mechanism for delayed traffic offloading in cellular networks[J]. IEEE Transactions on Wireless Communications, 2016, 15(8): 5314-5327. [5] Zhang Yanru, Song Lingyang, Pan Miao, et al. Non-cash auction for spectrum trading in cognitive radio networks: contract theoretical model with joint adverse selection and moral hazard[J]. IEEE Journal on Selected Areas in Communications, 2017, 35(3): 643-653.4 結(jié)論