曹陽(yáng)
摘要:在P2P對(duì)等網(wǎng)絡(luò)中,由于數(shù)據(jù)來(lái)源眾多,因此常見(jiàn)數(shù)據(jù)類型不統(tǒng)一、數(shù)據(jù)兼容性差等情況,這對(duì)網(wǎng)絡(luò)通信帶來(lái)了很大的障礙,嚴(yán)重時(shí)還會(huì)導(dǎo)致數(shù)據(jù)的大量沖突,造成數(shù)據(jù)壞死等現(xiàn)象,網(wǎng)絡(luò)資源被大量的浪費(fèi)在解決這些問(wèn)題的過(guò)程中,且導(dǎo)致了網(wǎng)絡(luò)時(shí)延過(guò)大,降低了用戶的體驗(yàn)度。該文針對(duì)這種情況,提出了改進(jìn)優(yōu)化方案,采用糾錯(cuò)融合算法來(lái)應(yīng)對(duì)大量差異數(shù)據(jù)間的通信問(wèn)題,有效保障了差異數(shù)據(jù)的融合性,提高了P2P網(wǎng)絡(luò)的通信效率,具有一定的推廣價(jià)值。
關(guān)鍵詞:P2P網(wǎng)絡(luò);差異數(shù)據(jù);糾錯(cuò)融合算法
中圖分類號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)16-0038-02
1 概述
目前,P2P網(wǎng)絡(luò)的用戶數(shù)量呈現(xiàn)急劇上升趨勢(shì),由于其快捷的通信、自由的組網(wǎng)模式和分布式的數(shù)據(jù)交換方法都給用戶帶來(lái)了與傳統(tǒng)網(wǎng)絡(luò)通信截然不同的體驗(yàn)。網(wǎng)絡(luò)中的用戶不在僅僅是被動(dòng)的數(shù)據(jù)接收者,同樣也成為數(shù)據(jù)的提供者,這對(duì)于提高網(wǎng)絡(luò)通信速率和安全性都是非常有幫助的。但隨著用戶群的快速增大,原有的通信能力也承受了更多的壓力,同時(shí)網(wǎng)絡(luò)中的數(shù)據(jù)種類隨著多樣化軟件的發(fā)展而變得愈發(fā)的繁雜,所以必須選取最優(yōu)的數(shù)據(jù)通信方式,有效的控制網(wǎng)絡(luò)通信時(shí)延,提高通信效率。
傳統(tǒng)P2P對(duì)等網(wǎng)采用大規(guī)模復(fù)制策略來(lái)完成通信工作,從某個(gè)初始節(jié)點(diǎn)開(kāi)始,按路徑的規(guī)律,遍歷所有能夠連接上的節(jié)點(diǎn)。這種方式會(huì)導(dǎo)致數(shù)據(jù)在大量的節(jié)點(diǎn)中不斷復(fù)制和讀取,而一旦出現(xiàn)數(shù)據(jù)量大、數(shù)據(jù)差異大的情況,則可能導(dǎo)致數(shù)據(jù)出現(xiàn)大規(guī)模沖突和損毀,系統(tǒng)為了解決丟失的數(shù)據(jù),又需要花費(fèi)額外的資源,形成了惡性循環(huán),必須加以改進(jìn)。
本文提出一種基于海量差異數(shù)據(jù)通信的糾錯(cuò)融合算法,并將其應(yīng)用到P2P網(wǎng)絡(luò)數(shù)據(jù)通信領(lǐng)域,當(dāng)網(wǎng)絡(luò)中出現(xiàn)大量數(shù)據(jù)出錯(cuò)損毀情況時(shí),可采用此算法對(duì)其進(jìn)行糾錯(cuò)處理,同時(shí)采用數(shù)據(jù)融合方法,盡可能地提高了差異數(shù)據(jù)間的融合性。
2 P2P網(wǎng)絡(luò)通信原理
所謂的對(duì)等網(wǎng)絡(luò)是指處于該網(wǎng)絡(luò)中的節(jié)點(diǎn)權(quán)限相等,并不存在單純的服務(wù)提供方或服務(wù)接受方,各個(gè)節(jié)點(diǎn)之間也不存在主從關(guān)系,所有的計(jì)算機(jī)在該網(wǎng)絡(luò)中同時(shí)接受和共享數(shù)據(jù),因此不用設(shè)置專門(mén)的服務(wù)器。對(duì)等網(wǎng)絡(luò)是小型局域網(wǎng)常用的組網(wǎng)方式。隨著Internet中越來(lái)越多的站點(diǎn)開(kāi)啟了P2P服務(wù),使得P2P網(wǎng)絡(luò)成為了當(dāng)前發(fā)展最快的應(yīng)用型網(wǎng)絡(luò)之一,其通信效率的高低受到了廣泛的關(guān)注。在通信優(yōu)化領(lǐng)域,目前使用方法大多為大規(guī)模復(fù)制的通信算法,從源節(jié)點(diǎn)依次遍歷網(wǎng)絡(luò)中所有有效節(jié)點(diǎn),同時(shí)將數(shù)據(jù)依次復(fù)制到這些節(jié)點(diǎn)中。節(jié)點(diǎn)的存儲(chǔ)系數(shù)為:
式(2)中,H(xi)為有效數(shù)據(jù)量,n為節(jié)點(diǎn)數(shù)量,M當(dāng)前網(wǎng)絡(luò)中有效節(jié)點(diǎn)的存儲(chǔ)容量的比例系數(shù)。由式(1)可得,通信系數(shù)和隨著網(wǎng)絡(luò)中有效數(shù)據(jù)量的增大而增大;式(2)則給出了通信效率和有效數(shù)據(jù)以及有效節(jié)點(diǎn)之間的關(guān)聯(lián),顯然隨著網(wǎng)絡(luò)資源的不斷下降以及負(fù)載的不斷上升,網(wǎng)絡(luò)通信質(zhì)量也會(huì)受到影響。這也解釋了為什么當(dāng)網(wǎng)絡(luò)中傳輸?shù)臄?shù)據(jù)量較大時(shí),傳統(tǒng)的大規(guī)模復(fù)制策略會(huì)導(dǎo)致大量的數(shù)據(jù)出錯(cuò)。從公式中分析,由于H(xi)的快速增大,同時(shí)M變小,導(dǎo)致了作為通信質(zhì)量指標(biāo)的S值的下降。要解決這一現(xiàn)象,最關(guān)鍵的問(wèn)題就是如何對(duì)差異數(shù)據(jù)進(jìn)行融合,以減少數(shù)據(jù)沖突概率,與此同時(shí),還要采取行之有效的糾錯(cuò)策略,因此,本文提出了差異數(shù)據(jù)糾錯(cuò)融合算法。
3 基于海量數(shù)據(jù)通信的糾錯(cuò)融合算法
大規(guī)模復(fù)制的通信策略最大的特點(diǎn)在于每次通信時(shí)需要檢測(cè)當(dāng)前網(wǎng)絡(luò)中所有有效節(jié)點(diǎn)的可用容量,而每個(gè)節(jié)點(diǎn)的通信容量顯然受到本身數(shù)據(jù)容量和當(dāng)前網(wǎng)絡(luò)通信量的約束,而呈現(xiàn)出出多樣化的特點(diǎn)。上文中公式(2)中的M即為計(jì)算得到的每個(gè)節(jié)點(diǎn)的有效數(shù)據(jù)容量,再加上權(quán)值的分配,即公式(1)中的節(jié)點(diǎn)存儲(chǔ)系數(shù)Mi,以此為依據(jù),對(duì)網(wǎng)絡(luò)中的所有節(jié)點(diǎn)進(jìn)行計(jì)算。
3.1 海量數(shù)據(jù)通信糾錯(cuò)方法
在得到所有節(jié)點(diǎn)的存儲(chǔ)系數(shù)后,可依此進(jìn)行節(jié)點(diǎn)之間的通信,并合理的安排節(jié)點(diǎn)之間的數(shù)據(jù)流量,此策略在網(wǎng)絡(luò)通信負(fù)荷不大的前提下可正常工作,但隨著數(shù)據(jù)量的大幅增加,尤其在某些較短的時(shí)間段內(nèi)迅速達(dá)到峰值,則很容易引發(fā)數(shù)據(jù)錯(cuò)誤,而一旦發(fā)生錯(cuò)誤,會(huì)產(chǎn)生連鎖反應(yīng),造成數(shù)據(jù)在多個(gè)節(jié)點(diǎn)的持續(xù)沖突。
現(xiàn)假設(shè)某節(jié)點(diǎn)在接收數(shù)據(jù)時(shí)發(fā)生溢出性錯(cuò)誤,并不考慮其他節(jié)點(diǎn)在同一時(shí)刻向該節(jié)點(diǎn)傳輸數(shù)據(jù)的情況,如果需要通信數(shù)據(jù)節(jié)點(diǎn)vi與相鄰的節(jié)點(diǎn)vj之間建立直接的通信連接關(guān)系,可以計(jì)算兩者之間的通信數(shù)據(jù)錯(cuò)誤互斥權(quán)值,記為W(vi,vj);若vi和vj沒(méi)有建立直接的聯(lián)系,則數(shù)據(jù)出錯(cuò)相關(guān)性也不為0。因此可以看出,通信節(jié)點(diǎn)之間的數(shù)據(jù)容量決定了糾錯(cuò)算法能否有效的運(yùn)行。。
1)公式(3)給出了兩個(gè)通信節(jié)點(diǎn)之間數(shù)據(jù)的錯(cuò)誤概率信息:
上式中,c為經(jīng)驗(yàn)系數(shù),可在對(duì)網(wǎng)絡(luò)進(jìn)行長(zhǎng)時(shí)間監(jiān)控之后,由加權(quán)平均算法得出,其代表了節(jié)點(diǎn)之間通信的成功率。
2)在得到網(wǎng)絡(luò)中所有節(jié)點(diǎn)的信息之后,可以建立統(tǒng)一的網(wǎng)絡(luò)通信節(jié)點(diǎn)拓?fù)鋱D,以準(zhǔn)確描述網(wǎng)絡(luò)中所有節(jié)點(diǎn)所具有的通信資源,并對(duì)每一對(duì)對(duì)等結(jié)點(diǎn)(xi,xj) 計(jì)算通信錯(cuò)誤計(jì)算權(quán)值I(vi,ej|c)。
3)在網(wǎng)絡(luò)中,隨機(jī)選擇一個(gè)節(jié)點(diǎn)作為源點(diǎn),由此出發(fā)將所有的無(wú)向邊轉(zhuǎn)化為指向其鄰居結(jié)點(diǎn)的有向邊,并為每條邊加上相應(yīng)的權(quán)值,權(quán)值的計(jì)算顯然需要依賴之前得到的經(jīng)驗(yàn)系數(shù)c,形成了樹(shù)狀拓?fù)浣Y(jié)構(gòu)。
4)在樹(shù)狀拓?fù)浣Y(jié)構(gòu)中加入類節(jié)點(diǎn)G,并將其作為所有屬性節(jié)點(diǎn)的父節(jié)點(diǎn)。
5)在步驟(4)的拓?fù)浣Y(jié)果中確認(rèn)每個(gè)節(jié)點(diǎn)的通信錯(cuò)誤概率,并根據(jù)閥值進(jìn)行調(diào)節(jié),最終將出錯(cuò)概率控制在最小值水平上,完成糾錯(cuò)的工作。
通過(guò)以上步驟,可以較為有效的計(jì)算出網(wǎng)絡(luò)中所有節(jié)點(diǎn)之間通信的出錯(cuò)概率,以此為依據(jù)來(lái)合理安排數(shù)據(jù)傳輸?shù)穆窂胶蛿?shù)據(jù)量,在保障數(shù)據(jù)通信效率的基礎(chǔ)上,盡可能降低了數(shù)據(jù)沖突出現(xiàn)的可能性,即實(shí)現(xiàn)了精確通信這一目標(biāo);整個(gè)網(wǎng)絡(luò)的拓?fù)涑尸F(xiàn)出樹(shù)狀形態(tài),極大提高了相關(guān)優(yōu)化算法和路由查找的運(yùn)算效率,耗費(fèi)的處理時(shí)延被較好的控制在合理水平以內(nèi),同時(shí),各個(gè)屬性變量之間存在的樹(shù)形依賴關(guān)系也更加符合網(wǎng)絡(luò)節(jié)點(diǎn)的實(shí)際情況。
3.2 差異數(shù)據(jù)的融合通信
如上文所述,再大規(guī)模數(shù)據(jù)通信時(shí),由于數(shù)據(jù)差異造成的沖突現(xiàn)象非常常見(jiàn),且隨著數(shù)據(jù)量的增大和數(shù)據(jù)種類差異的增多而呈正比上升,從而影響了信道的有效利用率。利用數(shù)據(jù)融合技術(shù)進(jìn)行數(shù)據(jù)的有效分類,并按其類型特點(diǎn)采用不同的方式進(jìn)行數(shù)據(jù)融合,可極大的降低數(shù)據(jù)沖突的概率,提高有效數(shù)據(jù)的通信成功率。融合后待通信數(shù)據(jù)中包括的有效信息分布在一定的區(qū)域內(nèi),區(qū)域的劃分可采用多種方式,如可依照數(shù)據(jù)頻率為標(biāo)準(zhǔn),數(shù)據(jù)差異可用方差進(jìn)行區(qū)分,融合后數(shù)據(jù)的可溶性可以由公式(4)給出:
式中,j,k,p表示相關(guān)的概率,表示q屬于的信息聚類,就表示的是網(wǎng)絡(luò)中信息的融合系數(shù)。
通過(guò)以上方式,可實(shí)現(xiàn)對(duì)差異數(shù)據(jù)的有效融合,從而實(shí)現(xiàn)對(duì)沖突數(shù)據(jù)進(jìn)行最大概率的修補(bǔ)這一目標(biāo),最終提高了整個(gè)P2P網(wǎng)絡(luò)的通信效率。
4 算法設(shè)計(jì)及實(shí)驗(yàn)結(jié)果分析
本文提出的優(yōu)化算法流程如圖1所示。
根據(jù)上述算法進(jìn)行仿真實(shí)驗(yàn),并同傳統(tǒng)的基于大規(guī)模文本復(fù)制的優(yōu)化策略進(jìn)行對(duì)比分析,得到圖2中的兩條曲線,其中曲線(1)為本文提出的差異數(shù)據(jù)糾錯(cuò)融合算法;曲線(2)為傳統(tǒng)大規(guī)模復(fù)制優(yōu)化策略;圖中縱軸為通信成功率,橫軸為通信數(shù)據(jù)的數(shù)量級(jí)。
從上圖中的兩條曲線對(duì)比可以看出,基于傳統(tǒng)方法的優(yōu)化策略并不能保障網(wǎng)絡(luò)在處理大規(guī)模數(shù)據(jù)通信時(shí)的成功率,且算法復(fù)雜度高,執(zhí)行效率較差,耗費(fèi)了大量的網(wǎng)絡(luò)資源,并導(dǎo)致通信時(shí)延的增加;基于差異數(shù)據(jù)糾錯(cuò)融合算法的新型優(yōu)化策略則明顯要優(yōu)于傳統(tǒng)方法,無(wú)論從通信成功率方面,還是在算法執(zhí)行效率方面都有較好的表現(xiàn),據(jù)此證明了本文提出的優(yōu)化策略的有效性。
參考文獻(xiàn):
[1] 陳娟,劉繼承,孔維華.P2P網(wǎng)絡(luò)構(gòu)架下路徑查找的優(yōu)化算法[J].計(jì)算機(jī)與數(shù)字工程,2008,36(10):27-29.
[2] 魏星.一種基于推薦的P2P 網(wǎng)絡(luò)信任管理模型[J].計(jì)算機(jī)仿真,2010,27(12): 102-105.