馬 冀 ,劉 超 ,林尚靜 ,田 錦
(1.北京郵電大學(xué)網(wǎng)絡(luò)空間安全學(xué)院,北京 100876;2.中國電子科技集團(tuán)公司第五十八研究所,江蘇 無錫 214000;3.北京郵電大學(xué)電子工程學(xué)院,北京 100876;4.金陵科技學(xué)院網(wǎng)絡(luò)與通信工程學(xué)院,江蘇 南京 211169)
伴隨著移動互聯(lián)網(wǎng)的迅猛發(fā)展,移動終端數(shù)量的持續(xù)增長,以及高清視頻、文件下載等數(shù)字多媒體業(yè)務(wù)的飛速普及,移動數(shù)據(jù)業(yè)務(wù)呈現(xiàn)爆發(fā)式增長。大量移動用戶經(jīng)過核心網(wǎng)對相同熱門內(nèi)容的冗余性下載行為將耗費(fèi)大量寶貴的回程鏈路資源,并相應(yīng)增加網(wǎng)絡(luò)的擁塞概率,進(jìn)而對業(yè)務(wù)時(shí)延性能造成顯著影響。邊緣緩存技術(shù)秉承以“存儲換帶寬”的思路,通過將業(yè)務(wù)內(nèi)容預(yù)先性地由核心網(wǎng)云端向邊緣網(wǎng)絡(luò)進(jìn)行“下沉”至由蜂窩基站或者小蜂窩基站組成的邊緣網(wǎng)絡(luò),以便用戶實(shí)際發(fā)起內(nèi)容請求時(shí)能夠直接從蜂窩基站獲取內(nèi)容信息[1]。一方面,邊緣緩存技術(shù)可以有效緩解業(yè)務(wù)忙時(shí)的網(wǎng)絡(luò)擁塞,縮短用戶的獲取信息內(nèi)容的時(shí)延,另一方面,邊緣緩存技術(shù)可以減少網(wǎng)絡(luò)中冗余數(shù)據(jù)的重復(fù)傳輸,減輕骨干網(wǎng)的傳輸壓力。
目前,大數(shù)據(jù)與無線網(wǎng)絡(luò)融合的趨勢日益顯著,為邊緣緩存策略的智能化設(shè)計(jì)提供了可能性。本文提出了一種大數(shù)據(jù)賦能的移動邊緣緩存技術(shù)。首先,本文通過數(shù)據(jù)爬蟲技術(shù)收集用戶社交關(guān)系大數(shù)據(jù),建立用戶的社交網(wǎng)絡(luò)拓?fù)鋱D。其次,基于社交網(wǎng)絡(luò)拓?fù)鋱D,構(gòu)建內(nèi)容流行度的演化微分方程,通過求解演化微分方程的穩(wěn)定解,預(yù)測業(yè)務(wù)內(nèi)容流行度。
蜂窩基站在具體實(shí)施邊緣緩存的過程中包含兩個階段:在實(shí)際用戶業(yè)務(wù)請求到達(dá)前,基于所采用的緩存策略進(jìn)行內(nèi)容緩存的階段,以及在用戶發(fā)出請求后對緩存內(nèi)容進(jìn)行傳輸?shù)碾A段。按照緩存策略的異同,采用邊緣緩存技術(shù)的蜂窩基站又進(jìn)一步分為,主動緩存基站和被動緩存基站。
被動式緩存指,蜂窩基站只在用戶發(fā)出業(yè)務(wù)請求后才進(jìn)行有條件的內(nèi)容緩存。典型的被動緩存策略有最近最少使用(Least Recently Used,LRU)策略。采用LRU策略的蜂窩基站,將緩存所有用戶請求過內(nèi)容。對于每一個新到達(dá)的用戶請求,如果自身沒有緩存該業(yè)務(wù)內(nèi)容,則通過回傳鏈路把該業(yè)務(wù)內(nèi)容下載到本地緩存空間中;如果蜂窩基站的本地緩存空間已滿,則先刪除最不常用(在最長的時(shí)間內(nèi)未被請求)的業(yè)務(wù)內(nèi)容,再緩存所服務(wù)用戶最新請求的業(yè)務(wù)內(nèi)容。
主動式緩存指,蜂窩基站預(yù)測業(yè)務(wù)內(nèi)容的流行度提前將熱門的內(nèi)容進(jìn)行本地緩存并且推送到用戶端。這種蜂窩基站主動式緩存并提前推送方式可以降低用戶的平均時(shí)延,還可以提高無線網(wǎng)絡(luò)的吞吐量。在現(xiàn)有移動邊緣緩存研究中,通常直接借鑒互聯(lián)網(wǎng)服務(wù)器的文件請求模型,即假設(shè)用戶對文件的請求數(shù)服從Zipf分布[2-4],這并不適用于移動邊緣緩存場景。這是因?yàn)?,隨著移動客戶端的崛起,移動用戶獲取內(nèi)容信息的方式已經(jīng)從搜索引擎和門戶網(wǎng)站(即Web1.0)轉(zhuǎn)向從移動社交網(wǎng)絡(luò)(即Web2.0),微博,朋友圈,今日頭條的崛起即是證明,而文件請求模型無法適應(yīng)依托移動社交網(wǎng)絡(luò)進(jìn)行的信息傳播過程。
伴隨著頻譜的拓寬、用戶與基站密度的增加以及業(yè)務(wù)的多樣化(例如,物聯(lián)網(wǎng),車聯(lián)網(wǎng),移動互聯(lián)網(wǎng)),當(dāng)前移動通信具有大數(shù)據(jù)的顯著特性。依據(jù)數(shù)據(jù)的來源,移動大數(shù)據(jù)可以分為傳輸層大數(shù)據(jù)、網(wǎng)絡(luò)層大數(shù)據(jù)以及應(yīng)用層大數(shù)據(jù)。傳輸層大數(shù)據(jù):包括信道大數(shù)據(jù),頻譜大數(shù)據(jù)以及緩存計(jì)算資源大數(shù)據(jù),例如信道鏈路增益數(shù)據(jù),寬頻譜各條鏈路增益數(shù)據(jù),海量用戶的鏈路增益數(shù)據(jù)以及基站的緩存空間大數(shù)據(jù)等。網(wǎng)絡(luò)層大數(shù)據(jù):包括網(wǎng)絡(luò)負(fù)載數(shù)據(jù),信令流程數(shù)據(jù),信令交互數(shù)據(jù)以及用戶軌跡數(shù)據(jù)等。應(yīng)用層大數(shù)據(jù):包括社交網(wǎng)絡(luò)數(shù)據(jù),語音通話數(shù)據(jù),日常生活數(shù)據(jù)等。
如圖1所示,從外界注入社交網(wǎng)絡(luò)(微信,微博,今日頭條)的信息內(nèi)容,或者由社交網(wǎng)絡(luò)內(nèi)部產(chǎn)生信息內(nèi)容,沿著用戶之間所結(jié)成的各種形態(tài)的社會關(guān)聯(lián),依托用戶之間交互行為(分享、轉(zhuǎn)發(fā)、推薦)在線上社交網(wǎng)絡(luò)上形成傳播擴(kuò)散;緊接著,線上社交網(wǎng)絡(luò)上的用戶對信息執(zhí)行動作行為,即采納行為,通過移動用戶所攜帶的智能終端滲透到線下通信網(wǎng)中形成移動用戶的業(yè)務(wù)需求,并伴隨著用戶在地理空間范圍的移動,轉(zhuǎn)化成移動用戶對其服務(wù)基站的業(yè)務(wù)請求,最后,蜂窩基站根據(jù)所服務(wù)區(qū)內(nèi)的所有移動用戶的業(yè)務(wù)請求,進(jìn)行緩存區(qū)間的動態(tài)分配和緩存內(nèi)容動態(tài)更新。
由此可見,為了實(shí)現(xiàn)智能化邊緣緩存技術(shù),涉及到應(yīng)用層大數(shù)據(jù)(即社交網(wǎng)絡(luò)用戶行為數(shù)據(jù))和傳輸層大數(shù)據(jù)(即緩存資源數(shù)據(jù))的關(guān)聯(lián)分析和挖掘。
圖1 移動大數(shù)據(jù)賦能的移動邊緣緩存技術(shù)
移動社交網(wǎng)絡(luò)不僅描述了用戶之間的關(guān)系結(jié)構(gòu),同時(shí)也反映了用戶共享興趣內(nèi)容的意愿和發(fā)生相似行為的同質(zhì)性。用戶對一項(xiàng)內(nèi)容信息的偏好,極大程度上取決于與其具有社交關(guān)聯(lián)用戶對此項(xiàng)內(nèi)容信息的興趣和推薦程度。
通過大數(shù)據(jù)爬蟲技術(shù)分析用戶的移動社交網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)發(fā)現(xiàn),移動社交網(wǎng)絡(luò)呈現(xiàn)出的無標(biāo)度特性。無標(biāo)度指移動用戶之間的連接狀況(度數(shù))具有嚴(yán)重的非均勻特性。少數(shù)移動用戶具有極多的連接(圖2中深色節(jié)點(diǎn)),而大多數(shù)移動用戶只有很少量的連接(圖2中淺色節(jié)點(diǎn))。無標(biāo)度特性又稱冪律分布特性,網(wǎng)絡(luò)中任意一個節(jié)點(diǎn)的節(jié)點(diǎn)度為k的概率為P(k)=k-α,α的取值由具體的移動社交網(wǎng)絡(luò)決定。
基于前述分析,移動社交網(wǎng)絡(luò)被證實(shí)為是一個無標(biāo)度網(wǎng)絡(luò)。本文基于無標(biāo)度網(wǎng)絡(luò)上傳播動力學(xué)理論的“易感染-感染-易感染”(Susceptible Infected Susceptible,SIS)模型對某一內(nèi)容的流行度演變過程進(jìn)行建模分析。在SIS傳染模型中,將移動社交網(wǎng)絡(luò)中任意用戶對某一業(yè)務(wù)內(nèi)容的興趣以下兩個狀態(tài)進(jìn)行描述:感染狀態(tài)(I),易感染狀態(tài)(S)。感染狀態(tài)I表示用戶具有業(yè)務(wù)興趣。一個處于感染狀態(tài)的用戶依據(jù)一個事先被設(shè)定痊愈概率μ恢復(fù)為易感染用戶;易感染狀態(tài)S表示用戶不具有業(yè)務(wù)興趣。一個處于易感染狀態(tài)的用戶和一個處于感染狀態(tài)的鄰居用戶接觸,則以概率λ被感染成為感染用戶。μ和λ的大小由該業(yè)務(wù)內(nèi)容需求實(shí)際傳播場景反饋估計(jì)決定。
圖2 移動社交網(wǎng)絡(luò)的無標(biāo)度特性
將時(shí)刻t節(jié)點(diǎn)度k的感染用戶占據(jù)總用戶的比例定義為相對感染節(jié)點(diǎn)密度ρk(t)。依據(jù)平均場理論(具有相同度相同狀態(tài)的節(jié)點(diǎn)在網(wǎng)絡(luò)中的分布是均勻的),ρk(t)滿足如下微分方程[5]:
在式(1)中,由節(jié)點(diǎn)從感染狀態(tài)向易感染狀態(tài)的轉(zhuǎn)移概率μ以及相對感染節(jié)點(diǎn)密度ρk(t)的乘積組成,等式右邊第二項(xiàng)表示產(chǎn)生項(xiàng),由節(jié)點(diǎn)從易感染狀態(tài)向感染狀態(tài)的轉(zhuǎn)移概率εk(t)以及相對易感染節(jié)點(diǎn)密度 [1-ρk(t)]的乘積組成。
節(jié)點(diǎn)從易感染狀態(tài)向感染狀態(tài)的轉(zhuǎn)移概率εk(t)可以進(jìn)一步寫為 εk(t)=λkΘ(t)[5],其中,Θ(t)為時(shí)刻 t易感染節(jié)點(diǎn)與感染節(jié)點(diǎn)的連接概率。Θ(t)不依賴于邊的起始點(diǎn)(也就是易感染節(jié)點(diǎn))的節(jié)點(diǎn)度,但是卻與邊的終止點(diǎn)(也就是鄰居節(jié)點(diǎn))的節(jié)點(diǎn)度有關(guān)。這是因?yàn)?,鄰居?jié)點(diǎn)是一個感染節(jié)點(diǎn)的概率,與時(shí)刻 t該鄰居節(jié)點(diǎn)的節(jié)點(diǎn)度 k′相關(guān) εk′(t)。因此,Θ(t)可以由給定節(jié)點(diǎn)度為k的易感染節(jié)點(diǎn)的一條邊,這條邊所指向的鄰居節(jié)點(diǎn)的節(jié)點(diǎn)度為k′的概率P(k′|k)以及在時(shí)刻t節(jié)點(diǎn)度為k′的鄰居節(jié)點(diǎn)是一個感染節(jié)點(diǎn) 的 概 率 εk′(t)聯(lián) 合 計(jì) 算 而 得, 即 是為該移動社交網(wǎng)絡(luò)的最大節(jié)點(diǎn)度,P(k)是所構(gòu)建的移動社交網(wǎng)的節(jié)點(diǎn)度k,k∈(0,n)分布概率,〈k〉是社交網(wǎng)絡(luò)的平均節(jié)點(diǎn)度。忽略移動社交網(wǎng)絡(luò)的節(jié)點(diǎn)度的關(guān)聯(lián)性,即進(jìn)一步可以解釋為。更進(jìn)一步,依據(jù)平均場理論,鄰居節(jié)點(diǎn)的感染概率可以由與鄰居節(jié)點(diǎn)具有相同節(jié)點(diǎn)度的所有節(jié)點(diǎn)的平均情況代替,因此,
在湮滅項(xiàng)和產(chǎn)生項(xiàng)的共同作用之下,當(dāng)微分方程達(dá)到穩(wěn)態(tài)平衡時(shí)(即令),可以得到穩(wěn)態(tài)相對感染用戶密度。將帶入,可以得到關(guān)于ρ的自洽方程。k某一項(xiàng)內(nèi)容信息在移動社交網(wǎng)絡(luò)中的流行度的ρ=P (k)ρ即是穩(wěn)定感染節(jié)點(diǎn)密度k。從上述推導(dǎo)過程可以看出,某一項(xiàng)內(nèi)容信息的流行度由該內(nèi)容信息的傳播載體-體移動社交網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)度分布P(k),內(nèi)容信息對用戶的吸引程度-感染概率λ,以及用戶的業(yè)務(wù)習(xí)慣-痊愈概率μ共同決定。
圖3顯示了基于SIS傳播模型的用戶業(yè)務(wù)興趣傳播過程的初期、中期、中后期和尾期各個階段,感染用戶的概率分布以及累計(jì)概率分布。
首先,移動大數(shù)據(jù)平臺通過爬蟲技術(shù)構(gòu)建用戶社交關(guān)系拓?fù)鋱D,并依據(jù)3.1節(jié)信息傳播模型分析用戶對內(nèi)容信息的偏好,自動形成熱門內(nèi)容推薦。其次,假如用戶的運(yùn)動軌跡和網(wǎng)絡(luò)資源的平均使用情況可預(yù)測,那么,移動大數(shù)據(jù)平臺可以為用戶制定一個傳輸計(jì)劃,即何時(shí)何地以及用多少資源向用戶推送什么內(nèi)容,并將傳輸計(jì)劃發(fā)送 給該用戶運(yùn)動軌跡經(jīng)過的蜂窩基站。再次,當(dāng)移動用戶發(fā)出獲取信息請求時(shí),用戶終端首先在本地存儲器內(nèi)搜索,對于預(yù)先已推送至用戶終端的信息則直接調(diào)用已存儲的數(shù)據(jù),對于未推送的信息,則通過蜂窩網(wǎng)絡(luò)的單播數(shù)據(jù)傳輸通道完成數(shù)據(jù)傳輸。最后,移動用戶終端對終端存儲器內(nèi)的預(yù)先推送的數(shù)據(jù)進(jìn)行智能管理,定期刪除用戶未使用的過期數(shù)據(jù),更新接收新的推送數(shù)據(jù),并更新用戶的信息定制需求。
圖3 基于SIS傳播模型的用戶業(yè)務(wù)興趣傳播過程各個階段感染用戶的概率分布以及累計(jì)概率分布
海量移動大數(shù)據(jù)蘊(yùn)藏著巨大的價(jià)值,并結(jié)合行業(yè)大數(shù)據(jù)構(gòu)建新的價(jià)值鏈,實(shí)現(xiàn)大數(shù)據(jù)下的價(jià)值變現(xiàn)。本文的研究對深化5G異構(gòu)網(wǎng)絡(luò)分布式存儲的“存儲換通信”能力、提升無線通信網(wǎng)絡(luò)效能具有一定的理論價(jià)值。