姜廣坤,裴洲奇
(大連海洋大學(xué)應(yīng)用技術(shù)學(xué)院,遼寧 大連 116300)
復(fù)雜網(wǎng)絡(luò)是描述復(fù)雜系統(tǒng)的重要工具,對(duì)研究復(fù)雜系統(tǒng)具有較大的推動(dòng)作用[1-2]。通過復(fù)雜網(wǎng)絡(luò)的研究,人類可以更好地掌握和了解互聯(lián)網(wǎng)的發(fā)展特點(diǎn)。21世紀(jì)是信息時(shí)代,互聯(lián)網(wǎng)對(duì)國家的經(jīng)濟(jì)發(fā)展和國防建設(shè)等方面都產(chǎn)生了巨大的影響,更是與人類的生活密不可分。
現(xiàn)階段,復(fù)雜網(wǎng)絡(luò)的構(gòu)建成為當(dāng)前的研究熱點(diǎn),但是仍然存在很多問題需要相關(guān)專家進(jìn)一步進(jìn)行探索,例如加權(quán)復(fù)雜網(wǎng)絡(luò)聚類結(jié)果不準(zhǔn)確以及運(yùn)行速度較慢等。為此,國內(nèi)相關(guān)專家進(jìn)行了大量研究,同時(shí)給出了一些較好的研究成果,例如郭圣等人[3]在深度自編碼器中加入空間聚類的“自我表示”特性以及加權(quán)稀疏表示,進(jìn)而實(shí)現(xiàn)空間聚類。段佳勇等人[4]通過自適應(yīng)算法組建無標(biāo)度網(wǎng)絡(luò)改進(jìn)模型,根據(jù)計(jì)算獲取關(guān)聯(lián)度的最優(yōu)值和網(wǎng)絡(luò)參數(shù)取值,進(jìn)而獲取理想的網(wǎng)絡(luò)模型。同時(shí)進(jìn)一步對(duì)自適應(yīng)算法中的關(guān)聯(lián)度進(jìn)行數(shù)據(jù)學(xué)分析,進(jìn)而實(shí)現(xiàn)網(wǎng)絡(luò)模型聚類。在以上兩種模型的基礎(chǔ)上,提出一種基于空間關(guān)聯(lián)性的加權(quán)復(fù)雜網(wǎng)絡(luò)聚類模型。經(jīng)實(shí)驗(yàn)測(cè)試結(jié)果表明,所提模型不僅可以有效提升聚類質(zhì)量和聚類精度,同時(shí)還可以提升聚類速度。
針對(duì)不規(guī)則的網(wǎng)絡(luò)構(gòu)建投影高度圖,建立局部三維坐標(biāo)系,將鄰域點(diǎn)集投影至坐標(biāo)系中,進(jìn)而獲取投影高度。同時(shí),對(duì)復(fù)雜網(wǎng)絡(luò)的幾何特征進(jìn)行編碼,獲取較好的去噪效果[5-6]。
針對(duì)加權(quán)復(fù)雜網(wǎng)絡(luò)中隨機(jī)一個(gè)節(jié)點(diǎn)i而言,需要優(yōu)先對(duì)三維空間的局部領(lǐng)域進(jìn)行檢索,使用K近鄰檢索,根據(jù)點(diǎn)的初始法向計(jì)算法向張量投票矩陣U(q(i)),如公式(1)所示:
(1)
上式中,Xn代表標(biāo)準(zhǔn)差;oi和oj分別代表節(jié)點(diǎn)i和節(jié)點(diǎn)j的高斯權(quán)重系數(shù);q(i)代表節(jié)點(diǎn)i的法向信息;N(i)代表特征值。
通過公式(1)對(duì)加權(quán)復(fù)雜網(wǎng)絡(luò)的特征進(jìn)行分解,獲取對(duì)應(yīng)的特征值,將全部特征向量進(jìn)行兩兩相交。
當(dāng)建立好局部坐標(biāo)系之后,需要將鄰域點(diǎn)投影到平面xy上,同時(shí)計(jì)算各個(gè)節(jié)點(diǎn)i的投影高度以及投影坐標(biāo)。為了有效避免投影高度出現(xiàn)負(fù)值的情況,需要將節(jié)點(diǎn)i和節(jié)點(diǎn)j的最大距離作為偏差加到高度值上。所以,采用公式(2)和公式(3)表示投影高度I(j)以及投影點(diǎn)坐標(biāo)q(i,j):
(2)
(3)
當(dāng)?shù)玫洁徲蛑腥奎c(diǎn)的投影高度之后,需要形成規(guī)則的高度圖像,優(yōu)先設(shè)定高度圖像的長和寬,同時(shí)將圖像放置到坐標(biāo)系中,進(jìn)而獲取坐標(biāo)系原點(diǎn)的三維坐標(biāo)qc,如公式(4)所示:
(4)
當(dāng)?shù)玫较袼攸c(diǎn)的三維坐標(biāo)以及投影點(diǎn)的三維坐標(biāo)之后,需要采用高斯插值來計(jì)算高度圖像中各個(gè)像素的強(qiáng)度值I(c),如公式(5)所示:
(5)
上式中,β代表距離像素點(diǎn)。
將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用到加權(quán)復(fù)雜網(wǎng)絡(luò)數(shù)據(jù)的噪聲濾除中[7-8],主要采用基于法向?yàn)V波的卷積神經(jīng)網(wǎng)絡(luò),優(yōu)先將組建的高度圖作為網(wǎng)絡(luò)的輸入,高度圖對(duì)應(yīng)的節(jié)點(diǎn)即為輸出。卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)是通過高度圖獲取法向映射,進(jìn)而輸出濾波后的方向,使用L2損失對(duì)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化,具體的計(jì)算式如下:
loss=(O(p)-O(g))2
(6)
上式中,O(p)代表原始網(wǎng)絡(luò)數(shù)據(jù)中包含的噪聲;O(g)代表噪聲數(shù)據(jù)的法向。
(7)
上式中,α代表固定的權(quán)重系數(shù);(xa,xb)代表原始坐標(biāo)位置。
另外,在網(wǎng)絡(luò)訓(xùn)練的過程中,需要對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行預(yù)處理操作。同時(shí)為了避免空間坐標(biāo)產(chǎn)生的影響,需要將全部網(wǎng)格都平移到以質(zhì)心坐標(biāo)為原點(diǎn),同時(shí)對(duì)全部坐標(biāo)進(jìn)行標(biāo)準(zhǔn)化處理,將網(wǎng)格的平均邊長設(shè)定為單位長度,有效降低坐標(biāo)尺度之間的差異性。
將加權(quán)復(fù)雜網(wǎng)絡(luò)中數(shù)據(jù)的空間相關(guān)性關(guān)系進(jìn)行數(shù)字化描述,同時(shí)采用相關(guān)節(jié)點(diǎn)代表網(wǎng)絡(luò)中傳感器節(jié)點(diǎn)所在的坐標(biāo),通過相關(guān)系數(shù)描述不同感知數(shù)據(jù)之間的相關(guān)度,進(jìn)而獲取加權(quán)復(fù)雜網(wǎng)絡(luò)中的空間相關(guān)性:
(8)
上式中,θi,j代表數(shù)據(jù)的空間相關(guān)性;cov(di,dj)代表傳感器節(jié)點(diǎn)坐標(biāo)。
通過上述分析,需要對(duì)卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行分析,獲取對(duì)應(yīng)的編碼局部幾何結(jié)構(gòu),同時(shí)通過加權(quán)復(fù)雜網(wǎng)絡(luò)各個(gè)鄰居之間感知數(shù)據(jù)的關(guān)聯(lián)性進(jìn)行噪聲過濾,并且采用坐標(biāo)更新算法調(diào)整噪聲點(diǎn)位置,實(shí)現(xiàn)復(fù)雜網(wǎng)絡(luò)數(shù)據(jù)去噪[11-12],具體如公式(9)所示:
(9)
為了更好理解加權(quán)復(fù)雜網(wǎng)絡(luò),以下給出網(wǎng)絡(luò)中的相關(guān)參數(shù):
1)度分布:
通過網(wǎng)絡(luò)中節(jié)點(diǎn)的度來對(duì)各個(gè)節(jié)點(diǎn)之間的關(guān)聯(lián)關(guān)系進(jìn)行衡量,進(jìn)而獲取節(jié)點(diǎn)總數(shù);度分布用來描述網(wǎng)絡(luò)度的具體分布情況。
2)平均路徑長度:
平均路徑長度主要用來描述網(wǎng)絡(luò)中隨機(jī)一個(gè)節(jié)點(diǎn)到其他節(jié)點(diǎn)的平均距離,具體的計(jì)算式如下:
(10)
上式中,L代表平均路徑長度;n代表路徑總數(shù)。
平均路徑長度在加權(quán)復(fù)雜網(wǎng)絡(luò)連通的情況下有效,但是在大部分情況下網(wǎng)絡(luò)并不是連通的。為了有效應(yīng)對(duì)上述情況,以下采用一種全新的定義,具體如公式(11)所示:
(11)
上式中,F(xiàn)代表加權(quán)復(fù)雜網(wǎng)絡(luò)的全局效率;eij代表路徑上的邊集合。
3)聚類系數(shù):
聚類系數(shù)是用來描述加權(quán)復(fù)雜網(wǎng)絡(luò)中各個(gè)節(jié)點(diǎn)的聚集程度,其中節(jié)點(diǎn)i的聚類系數(shù)可以表示為公式(12)的形式:
(12)
上式中,D(i)代表聚類系數(shù);Ne(i)代表節(jié)點(diǎn)鄰居間的真實(shí)邊數(shù)。
4)度相關(guān)系數(shù):
代表度和度之間的相關(guān)性,主要用來描述節(jié)點(diǎn)之間的連接傾向,當(dāng)大度節(jié)點(diǎn)更加傾向于連接大度節(jié)點(diǎn),則說明網(wǎng)絡(luò)是正相關(guān)的;反之,則說明網(wǎng)絡(luò)是負(fù)相關(guān)的。其中,度相關(guān)系數(shù)對(duì)應(yīng)的計(jì)算式如下:
(13)
上式中,s代表度相關(guān)系數(shù);m代表加權(quán)復(fù)雜網(wǎng)絡(luò)的總邊數(shù)。
5)節(jié)點(diǎn)強(qiáng)度:
節(jié)點(diǎn)強(qiáng)度主要用來描述有權(quán)網(wǎng)絡(luò)中節(jié)點(diǎn)連通情況。其中,節(jié)點(diǎn)強(qiáng)度計(jì)算式為:
(14)
將加權(quán)復(fù)雜網(wǎng)絡(luò)中的數(shù)據(jù)從輸入空間非線性映射到特征空間,與線性子空間相比,一個(gè)特征子空間可以使用一組正交基向量表示,則特征值可以表示為公式(15)的形式:
(15)
上式中,G(I)代表特征值;〈xi,I〉代表網(wǎng)絡(luò)參數(shù)。
多維獨(dú)立成分分析屬于一種線性生成模型[13-14],因此可以將加權(quán)復(fù)雜網(wǎng)絡(luò)數(shù)據(jù)的對(duì)數(shù)最大似然函數(shù)log2L(It(x,y),t(i)(x,y))表示為以下形式:
log2L(It(x,y),t(i)(x,y))
(16)
上式中,p〈xi,t〉代表可觀測(cè)網(wǎng)絡(luò)參數(shù);det(i,j)代表概率密度。
在多維獨(dú)立成分分析過程中,可以認(rèn)為權(quán)值參數(shù)是正交的,所以需要選擇合適的概率密度構(gòu)建聚類模型,其中概率分布可以表示為公式(17)的形式:
(17)
當(dāng)獨(dú)立空間分析被應(yīng)用于加權(quán)復(fù)雜網(wǎng)絡(luò)中,同時(shí)將在子空間中投影的范數(shù)設(shè)定為網(wǎng)絡(luò)的輸出單元,其中網(wǎng)絡(luò)第一層神經(jīng)元的激活函數(shù)可以采用平方函數(shù);第二層神經(jīng)元的激活函數(shù)采用平方根函數(shù)。
近幾年,隨著高等教育、醫(yī)療衛(wèi)生、科學(xué)研究等事業(yè)的迅猛發(fā)展,國家和地方政府經(jīng)費(fèi)的投入逐年增加,大量的資金被用于資源性基礎(chǔ)條件建設(shè),通過購置、研制、改造等渠道,大型設(shè)備設(shè)施數(shù)量明顯上升。2018年5月,國家衛(wèi)生健康委員會(huì)、國家藥品監(jiān)督管理局印發(fā)了《大型醫(yī)用設(shè)備配置與使用管理辦法》,從配置、使用、監(jiān)督等方面,對(duì)促進(jìn)大型醫(yī)用設(shè)備合理配置和有效使用提出要求;財(cái)政部、教育部、科技部等部門也通過聯(lián)合評(píng)議、工作評(píng)比等形式,不斷推動(dòng)規(guī)范和加強(qiáng)大型設(shè)備的使用。大型設(shè)備都比較昂貴、緊缺,普及率低,如何在保證設(shè)備安全使用的前提下,加強(qiáng)大型設(shè)備使用績效管理,提高使用效率,是各單位共同關(guān)注的話題。
設(shè)定復(fù)雜網(wǎng)絡(luò)的隨機(jī)樣本輸入數(shù)據(jù)為Jt,則加權(quán)復(fù)雜網(wǎng)絡(luò)的帶權(quán)輸入可以表示為公式(18)的形式:
(18)
(19)
上式中,wij代表網(wǎng)絡(luò)參數(shù)權(quán)值。
通過多維獨(dú)立成分分析可以有效提取加權(quán)復(fù)雜網(wǎng)絡(luò)的特征,為了獲取更加滿意的性能,需要將原始網(wǎng)絡(luò)數(shù)據(jù)的先驗(yàn)子空間信息加入到網(wǎng)絡(luò)中,進(jìn)而獲取網(wǎng)絡(luò)數(shù)據(jù)的本質(zhì)特征。其中,加權(quán)復(fù)雜網(wǎng)絡(luò)對(duì)應(yīng)的損失函數(shù)可以表示為公式(19)的形式:
(20)
在對(duì)公式(20)進(jìn)行求解的過程中,需要優(yōu)先獲取加權(quán)復(fù)雜網(wǎng)絡(luò)的先驗(yàn)空間子信息。同時(shí)采用譜聚類算法構(gòu)建加權(quán)復(fù)雜網(wǎng)絡(luò)聚類模型,通過模型進(jìn)行聚類[15],詳細(xì)的操作步驟如圖1所示:
圖1 加權(quán)復(fù)雜網(wǎng)絡(luò)聚類模型建立流程圖
1)設(shè)定網(wǎng)絡(luò)參數(shù),同時(shí)將數(shù)據(jù)集輸入到加權(quán)復(fù)雜網(wǎng)絡(luò)中。
2)對(duì)網(wǎng)絡(luò)中的權(quán)值進(jìn)行初始化處理。
3)通過計(jì)算構(gòu)建先驗(yàn)信息矩陣。
4)將數(shù)據(jù)輸入到加權(quán)復(fù)雜網(wǎng)絡(luò)中。
5)計(jì)算網(wǎng)絡(luò)輸出和梯度,如公式(21)所示:
(21)
上式中,r(i)代表網(wǎng)絡(luò)輸出值;c(i)代表梯度值。
6)對(duì)梯度值進(jìn)行更新。
7)通過譜聚類算法構(gòu)建加權(quán)復(fù)雜網(wǎng)絡(luò)聚類模型。
8)采用隨機(jī)梯度下降法對(duì)加權(quán)復(fù)雜網(wǎng)絡(luò)聚類模型進(jìn)行訓(xùn)練,進(jìn)而輸出加權(quán)復(fù)雜網(wǎng)絡(luò)的聚類結(jié)果。
為了驗(yàn)證所提基于空間關(guān)聯(lián)性的加權(quán)復(fù)雜網(wǎng)絡(luò)聚類模型的有效性,需要進(jìn)行仿真實(shí)驗(yàn)測(cè)試。將文獻(xiàn)[3]模型和文獻(xiàn)[4]模型作為對(duì)比方法,將聚類精度作為測(cè)試指標(biāo),分析三種聚類模型在不同數(shù)據(jù)集上的聚類性能,詳細(xì)的實(shí)驗(yàn)測(cè)試結(jié)果如圖2所示:
分析圖2中的實(shí)驗(yàn)數(shù)據(jù)可知,與另外兩種聚類模型相比,所提模型可以獲取更高的聚類精度,主要是因?yàn)樗崮P蛯?duì)加權(quán)復(fù)雜網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行了去噪處理,有效濾除數(shù)據(jù)中的噪聲,使聚類精度得到有效增加。
為了進(jìn)一步驗(yàn)證不同聚類模型的性能,選取聚類實(shí)際運(yùn)行時(shí)間作為測(cè)試指標(biāo),詳細(xì)的實(shí)驗(yàn)測(cè)試結(jié)果如圖3所示:
圖3 實(shí)際運(yùn)行時(shí)間對(duì)比結(jié)果
分析圖3中的實(shí)驗(yàn)數(shù)據(jù)可知,隨著迭代次數(shù)的不斷增加,各個(gè)聚類模型的實(shí)際運(yùn)行時(shí)間也開始呈上升趨勢(shì)。但是與另外兩種模型相比,所提模型的實(shí)際運(yùn)行時(shí)間明顯更低,說明所提模型可以以更快的速度完成網(wǎng)絡(luò)聚類。
為了驗(yàn)證所提模型的收斂性能,選取聚類質(zhì)量(Q-value)作為測(cè)試指標(biāo),分析三種不同模型的聚類性能,詳細(xì)的實(shí)驗(yàn)測(cè)試結(jié)果如表1所示:
表1 不同模型Q值測(cè)試結(jié)果對(duì)比
通過對(duì)表1中的實(shí)驗(yàn)數(shù)據(jù)進(jìn)行分析可知,Q值會(huì)隨著迭代次數(shù)的增加而增加。所提模型的Q值明顯高于另外兩種模型,說明所提模型可以獲取較高的聚類質(zhì)量。
為了獲取更加滿意的聚類結(jié)果,提出一種基于空間關(guān)聯(lián)性的加權(quán)復(fù)雜網(wǎng)絡(luò)聚類模型。和已有模型相比,所提模型可以有效提升聚類結(jié)果的準(zhǔn)確性,同時(shí)還能夠減少聚類實(shí)際運(yùn)行時(shí)間,增強(qiáng)聚類質(zhì)量。
所提模型現(xiàn)階段已經(jīng)得到十分廣泛的應(yīng)用,但是仍然存在很多問題需要進(jìn)一步改進(jìn):
1)對(duì)先驗(yàn)信息矩陣維度進(jìn)行改進(jìn),全面提升計(jì)算結(jié)果的準(zhǔn)確性。
2)將其應(yīng)用到多視角的任務(wù)分析中,檢驗(yàn)是否可以獲取滿意的聚類結(jié)果。