申 帥,樊 娜,鄒小敏,李思瑞
(長安大學(xué) 信息工程學(xué)院,陜西 西安 710064)
車聯(lián)網(wǎng)是一種新型的車-路-網(wǎng)協(xié)同的智能化交通網(wǎng)絡(luò),在現(xiàn)代化交通系統(tǒng)中發(fā)揮著至關(guān)重要的作用。近年來,車聯(lián)網(wǎng)得到了大量專家學(xué)者的關(guān)注[1,2],國家也頒布了相關(guān)方案,將車聯(lián)網(wǎng)提到國家創(chuàng)新戰(zhàn)略層次。然而,隨著車聯(lián)網(wǎng)的高速發(fā)展,其存在的問題也越來越不可忽視,尤其是車輛通信安全存在的隱患。
由于車聯(lián)網(wǎng)是開放性的、分布式的框架結(jié)構(gòu),車聯(lián)網(wǎng)中存在車輛節(jié)點(diǎn)間通信受有限資源限制而產(chǎn)生自私行為的問題,例如拒絕轉(zhuǎn)發(fā)數(shù)據(jù)包等自私行為。車輛自私行為對(duì)車聯(lián)網(wǎng)環(huán)境下通信安全傳輸帶來極大的挑戰(zhàn)。目前,車聯(lián)網(wǎng)中自私節(jié)點(diǎn)的研究主要有兩種方法:(1)屏蔽式方法,通過對(duì)車聯(lián)網(wǎng)中節(jié)點(diǎn)的監(jiān)測,識(shí)別出車聯(lián)網(wǎng)中的自私節(jié)點(diǎn),并將自私節(jié)點(diǎn)屏蔽在車聯(lián)網(wǎng)之外。(2)抑制式方法,對(duì)車輛節(jié)點(diǎn)設(shè)置信譽(yù)值屬性,通過對(duì)車聯(lián)網(wǎng)中節(jié)點(diǎn)的信譽(yù)值進(jìn)行監(jiān)測評(píng)估,識(shí)別出自私節(jié)點(diǎn),然后對(duì)自私節(jié)點(diǎn)的行為進(jìn)行抑制。相關(guān)學(xué)者多以上述方法加以改進(jìn),在一定程度上消除了自私節(jié)點(diǎn)對(duì)車輛通信安全的影響,但是,隨著自私節(jié)點(diǎn)的增多,網(wǎng)絡(luò)通信安全和性能仍然受到較大影響。
筆者基于演化博弈論,提出一種基于區(qū)塊鏈的車聯(lián)網(wǎng)行為博弈策略。該模型能夠促使自私節(jié)點(diǎn)向正常節(jié)點(diǎn)學(xué)習(xí),進(jìn)而遏制車輛節(jié)點(diǎn)的自私行為,提高車輛節(jié)點(diǎn)通信的成功率。
相比于集中式存儲(chǔ)方式,區(qū)塊鏈?zhǔn)且环N新型的分布式存儲(chǔ)方式,其存儲(chǔ)過程依賴共識(shí)機(jī)制、加密算法,數(shù)據(jù)存儲(chǔ)更具安全性[3-5]。區(qū)塊鏈的特點(diǎn)主要有去中心化、不可篡改性等,為緩解車聯(lián)網(wǎng)通信所面臨的安全問題提供有利條件。因此,本文提出基于區(qū)塊鏈的車聯(lián)網(wǎng)系統(tǒng)架構(gòu),如圖1所示。
圖1 區(qū)塊鏈的車聯(lián)網(wǎng)系統(tǒng)架構(gòu)
?注冊認(rèn)證機(jī)構(gòu)(Registered certification body,RCB):負(fù)責(zé)車輛的注冊和入網(wǎng)的認(rèn)證等,存儲(chǔ)車輛節(jié)點(diǎn)的身份信息。
?交通信息應(yīng)急中心(Traffic information emergency center,TIEC):負(fù)責(zé)發(fā)布公共信息和突發(fā)信息等,如突發(fā)天氣災(zāi)害信息、道路突發(fā)事故信息等。
?路邊單元(Road side unit,RSU):分布在城市交通場景下的道路及其交叉路口兩側(cè);城市中全部的RSU組成一條區(qū)塊鏈,以共識(shí)機(jī)制來共同維護(hù);RSU存儲(chǔ)車聯(lián)網(wǎng)中的事務(wù)賬本,提供車輛接入、身份驗(yàn)證、節(jié)點(diǎn)信譽(yù)計(jì)算、博弈策略存儲(chǔ)及更新等相關(guān)服務(wù)。
?車輛(Vehicle):車聯(lián)網(wǎng)中每個(gè)車輛節(jié)點(diǎn)搭載負(fù)責(zé)通信的車載單元,負(fù)責(zé)V2V通信或V2R通信。車與車組成一條區(qū)塊鏈,負(fù)責(zé)存儲(chǔ)車輛間的非重要信息的通信,如娛樂信息等。
在提出架構(gòu)中,區(qū)塊鏈由眾多區(qū)塊組成,區(qū)塊與區(qū)塊以鏈?zhǔn)絾蜗蜻B接,每個(gè)區(qū)塊由兩部分組成,分別是區(qū)塊頭與區(qū)塊體,如圖2所示。區(qū)塊頭包含前塊哈希、本塊哈希、時(shí)間戳、Merkle根和區(qū)塊高度、版本號(hào)等數(shù)據(jù)信息。前塊哈希是本塊連接前一區(qū)塊的唯一標(biāo)識(shí),本塊哈希是該塊的唯一標(biāo)識(shí),時(shí)間戳記錄該區(qū)塊生成的時(shí)間,用于區(qū)塊間按順序來連接,Merkle根用于驗(yàn)證消息數(shù)據(jù)的完整性和正確性,區(qū)塊高度反映區(qū)塊的大小,版本號(hào)標(biāo)識(shí)交易數(shù)據(jù)結(jié)構(gòu)的版本號(hào)。區(qū)塊體中主要包含完整的Merkle樹。
區(qū)塊體中的Merkle樹是一種二叉樹,其結(jié)構(gòu)如圖3所示,最底層的葉子節(jié)點(diǎn)通過哈希函數(shù)進(jìn)行映射消息數(shù)據(jù),生成哈希值Hash,該哈希值具有唯一性。在Merkle樹中,最底層的葉子節(jié)點(diǎn)的父節(jié)點(diǎn)哈希值是其兩個(gè)子節(jié)點(diǎn)的哈希值通過哈希函數(shù)生成的。同理,最終生成具有唯一性的Merkle根哈希值。由于每個(gè)父哈希值都與其子哈希值相關(guān),當(dāng)葉子中任何節(jié)點(diǎn)被篡改時(shí),其父節(jié)點(diǎn)中的哈希值都會(huì)發(fā)生改變,直至Merkle根節(jié)點(diǎn)的哈希值也都會(huì)發(fā)生改變,RSU將判定該葉子節(jié)點(diǎn)消息為非法篡改。
圖3 Merkle樹結(jié)構(gòu)
1973年演化博弈論被首次提出,該理論最初在生物遺傳學(xué)領(lǐng)域應(yīng)用,隨后在經(jīng)濟(jì)學(xué)、計(jì)算機(jī)應(yīng)用、深度學(xué)習(xí)、無線通信安全等多個(gè)領(lǐng)域受到廣泛關(guān)注[6,7]。本文根據(jù)演化博弈原理建立動(dòng)態(tài)模型,以期激勵(lì)車輛節(jié)點(diǎn)采取合作的行為,如主動(dòng)發(fā)布信息、積極轉(zhuǎn)發(fā)信息等。車輛節(jié)點(diǎn)采取合作行為將給予該節(jié)點(diǎn)更多的收益,借此鼓勵(lì)車輛節(jié)點(diǎn)積極參與通信交互,抑制惡意節(jié)點(diǎn)自私行為。
面向車聯(lián)網(wǎng)的演化動(dòng)態(tài)博弈的基本要素描述如下。
參與者:基于區(qū)塊鏈的車聯(lián)網(wǎng)中所有車輛節(jié)點(diǎn)Vi=(V1,V2,…,VN)。
車輛節(jié)點(diǎn)分類:車聯(lián)網(wǎng)中車輛節(jié)點(diǎn)Vi劃分成兩個(gè)群體,群體A和群體B。群體A中為積極參與節(jié)點(diǎn),群體B中為自私節(jié)點(diǎn)。在群體A與B中的節(jié)點(diǎn)數(shù)量是非靜態(tài)的。隨著博弈策略的變更,車輛節(jié)點(diǎn)Vi能夠從原本的群體移向另一個(gè)群體。
車輛通信行為劃分:(1)主動(dòng)通信行為(Active communication Behavior,AC-Behavior),是指車聯(lián)網(wǎng)中車輛節(jié)點(diǎn)Vi通過對(duì)外界的感知和分析,然后發(fā)送信息給其他節(jié)點(diǎn)的行為;(2)被動(dòng)通信行為(Passive communication Behavior,PC-Behavior),是指車聯(lián)網(wǎng)中車輛節(jié)點(diǎn)Vi轉(zhuǎn)發(fā)來自其他節(jié)點(diǎn)信息的行為;(3)拒絕通信行為(Refusal of communication Behavior,RC-Behavior),是指車聯(lián)網(wǎng)中車輛節(jié)點(diǎn)Vi拒絕轉(zhuǎn)發(fā)來自其他節(jié)點(diǎn)信息的行為。
策略集:在通信傳輸?shù)难莼┺倪^程中,不同群體具有不同的策略空間。
群體A的策略空間表示為F1={C1,C2}, 其中C1表示車聯(lián)網(wǎng)中車輛節(jié)點(diǎn)Vi通過對(duì)外界的感知和分析,然后發(fā)送信息給其他節(jié)點(diǎn)的行為;C2表示車聯(lián)網(wǎng)中車輛節(jié)點(diǎn)Vi轉(zhuǎn)發(fā)來自其他節(jié)點(diǎn)信息的行為。
群體B的策略空間表示為F2={C1,C2,D1}, 其中D1表示車聯(lián)網(wǎng)中車輛節(jié)點(diǎn)Vi拒絕轉(zhuǎn)發(fā)來自其他節(jié)點(diǎn)信息的行為。
假設(shè)車聯(lián)網(wǎng)中任意節(jié)點(diǎn)Vi采取主動(dòng)通信行為,車輛節(jié)點(diǎn)Vi將消耗資源S1,收到的回報(bào)為R1。車輛節(jié)點(diǎn)Vi采取被動(dòng)通信行為,車輛節(jié)點(diǎn)Vi將消耗資源S2,收到的回報(bào)為R2,且滿足0 (1) 其中,X表示概率因子。 若群體A中的節(jié)點(diǎn)分別選擇策略C1,C2,則對(duì)應(yīng)的收益為GA1,GA2,即 GA1=(R1-S1)P (2) GA2=(R2-S2)P (3) 群體A的平均收益如下: (4) 其中,x為車輛節(jié)點(diǎn)選擇策略C1的概率,1-x為車輛節(jié)點(diǎn)選擇策略C2的概率。 若群體B中的節(jié)點(diǎn)分別選擇策略C1,C2,D1,則對(duì)應(yīng)的收益為GB1,GB2,GB3,即 GB1=(R1-S1)P (5) GB2=(R2-S2)P (6) GB3=(R3-S3)P (7) 群體B的平均收益如下所示: (8) 其中,y,z,1-y-z分別表示車輛節(jié)點(diǎn)選擇策略C1,C2,D1的概率。 2.3.1 定義對(duì)象集 為了改善自私節(jié)點(diǎn)的通信行為,使其在網(wǎng)絡(luò)中積極地參與通信,本模型中建立節(jié)點(diǎn)行為的對(duì)象集L1和L2作為自私節(jié)點(diǎn)的學(xué)習(xí)對(duì)象集。 對(duì)象集L1:計(jì)算在單位時(shí)間T內(nèi),某一車輛節(jié)點(diǎn)采取AC-Behavior的概率,具體過程如下: (9) 其中NAC,NPC,NRC分別表示在單位時(shí)間T內(nèi),AC-Behavior,PC-Behavior,RC-Behavior出現(xiàn)的次數(shù)。當(dāng)PL1>α?xí)r,該節(jié)點(diǎn)主要以AC-Behavior為主,將該車輛節(jié)點(diǎn)放入對(duì)象集L1中,作為自私節(jié)點(diǎn)的候選學(xué)習(xí)對(duì)象。α根據(jù)不同的車聯(lián)網(wǎng)環(huán)境進(jìn)行調(diào)節(jié),以擴(kuò)展其適應(yīng)性。 對(duì)象集L2:收集在單位時(shí)間T內(nèi),某一車輛節(jié)點(diǎn)采取PC-Behavior的概率PL2為: (10) 其中NAC,NPC,NRC分別表示在單位時(shí)間T內(nèi)AC-Behavior,PC-Behavior,RC-Behavior出現(xiàn)的次數(shù)。當(dāng)PL2>β時(shí),收集在對(duì)象集L2中。該節(jié)點(diǎn)主要以PC-Behavior為主,將該車輛節(jié)點(diǎn)放入對(duì)象集L2中,作為自私節(jié)點(diǎn)的候選學(xué)習(xí)對(duì)象。β根據(jù)不同的車聯(lián)網(wǎng)環(huán)境進(jìn)行調(diào)節(jié),以擴(kuò)展其適應(yīng)性。 2.3.2 篩選對(duì)象集 當(dāng)車輛節(jié)點(diǎn)Vi需要變更自身策略時(shí),RSU將篩選兩個(gè)策略學(xué)習(xí)的對(duì)象集L1和L2。對(duì)象集L1和L2滿足以下兩個(gè)條件: (1)對(duì)象集L1或L2中任意車輛節(jié)點(diǎn)Vk的歷史收益Uk大于車聯(lián)網(wǎng)中車輛節(jié)點(diǎn)的歷史平均收益UALL,即 Uk≥UALL (11) (12) 其中,Rm表示對(duì)應(yīng)車輛節(jié)點(diǎn)Vm的歷史收益,m=1,2,...,n。 (2)對(duì)象集L1或L2中同一車輛節(jié)點(diǎn)Vk最近兩次通信后變更策略的概率沒有增加,即 (13) 2.3.3 變更博弈策略 車輛節(jié)點(diǎn)博弈策略的變更與歷史收益有關(guān),計(jì)算車輛節(jié)點(diǎn)Vi的變更通信行為博弈策略的概率用pi表示, (14) (15) 在本文系統(tǒng)架構(gòu)下,車輛節(jié)點(diǎn)會(huì)根據(jù)不同的收益進(jìn)行策略的變更,通過變更,收益較高的策略被保留,收益較低的策略被丟棄。隨著演化博弈的不斷進(jìn)行,車聯(lián)網(wǎng)中的節(jié)點(diǎn)收益向著積極方向發(fā)展并趨于穩(wěn)定。 提出一種基于區(qū)塊鏈的車聯(lián)網(wǎng)的行為博弈策略。根據(jù)區(qū)塊鏈的特性,設(shè)計(jì)基于區(qū)塊鏈的車聯(lián)網(wǎng)系統(tǒng)架構(gòu),保障車聯(lián)網(wǎng)的通信數(shù)據(jù)的安全。通過建立演化博弈模型,計(jì)算節(jié)點(diǎn)收益和變更行為博弈策略,使車聯(lián)網(wǎng)中的節(jié)點(diǎn)收益向著積極方向發(fā)展并趨于穩(wěn)定。通過多次通信行為策略博弈,有效抑制了自私節(jié)點(diǎn)的自私行為,提高網(wǎng)絡(luò)的傳輸安全和效率。2.3 行為博弈策略的變更
2.4 策略分析
3 結(jié)束語