鄔劍升,李玉珩
(1.浙江中煙工業(yè)有限責(zé)任公司,浙江 寧波 315504; 2.秦皇島煙草機械有限責(zé)任公司,河北 秦皇島 066004)
隨著社會網(wǎng)絡(luò)中信息量的迅速擴大,鏈路預(yù)測已成為推薦系統(tǒng)、決策和刑事偵查等領(lǐng)域的重要而問題[1]。鏈路預(yù)測涉及計算網(wǎng)絡(luò)中節(jié)點間丟失或未來鏈路的可能性[2-3]。為精確定義鏈路預(yù)測問題,假設(shè)復(fù)雜網(wǎng)絡(luò)為無向圖G=(V,E),其中V為一組節(jié)點,E表示節(jié)點對間的邊??紤]到在時間t處的網(wǎng)絡(luò)G的快照,鏈路預(yù)測問題涉及在時間t+Δ處形成的當(dāng)前快照中定義丟失的子集[4]。
現(xiàn)有的復(fù)雜網(wǎng)絡(luò)鏈路預(yù)測問題面臨兩大挑戰(zhàn):第一類是海量數(shù)據(jù),需要低復(fù)雜度的預(yù)測方法;第二個挑戰(zhàn)是預(yù)測方法涉及高預(yù)測精度。而傳統(tǒng)的數(shù)據(jù)挖掘方法忽略了實體間關(guān)系,無法有效地解決鏈路預(yù)測問題?,F(xiàn)有研究采用不同方法來處理鏈路預(yù)測問題,其中多數(shù)基于節(jié)點間的相似性實現(xiàn)計算[6]。在相似性計算技術(shù)中,相似節(jié)點間更容易形成鏈接。此外,有一些鏈路預(yù)測方法考慮了共享更多鄰居的節(jié)點[7]。
在上述方法中,為給網(wǎng)絡(luò)中的每對節(jié)點分配相似性分?jǐn)?shù),首先定義函數(shù)s(x,y),基于不同特征(如拓?fù)涮卣骱驮谙嗨贫仍u分)將網(wǎng)絡(luò)中的所有節(jié)點對按其得分的降序排列,并在丟失的鏈路列表中選擇具有最高等級的鏈路作為可預(yù)見鏈路?;谙嗨贫鹊逆溌奉A(yù)測方法根據(jù)計算相似度函數(shù)時所考慮的信息量可分為局部、全局和準(zhǔn)局部三類[8]。在局部技術(shù)中,更多關(guān)注直接的鄰居節(jié)點信息,常適用于大型復(fù)雜網(wǎng)絡(luò),與線性時間復(fù)雜度相比具有較高精度。利用整個網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的全局技術(shù)能夠計算每對節(jié)點間的相似度,而不局限于節(jié)點共鄰。而與局部方法相比,全局方法由于對噪聲的敏感性和較高的計算復(fù)雜度具有較低精度。而準(zhǔn)局部技術(shù)尋求利用局部和全局技術(shù)點,通過考慮鄰節(jié)點的鄰節(jié)點而不僅僅是直接鄰節(jié)點,并限制每對節(jié)點間的距離。
上述方法均可在考慮信息量和計算復(fù)雜度間找到平衡。鏈路預(yù)測范圍有兩個主要問題。第一個是引入一種低計算復(fù)雜度的鏈路預(yù)測方法,特別是在面對大規(guī)模數(shù)據(jù)集時;第二個是預(yù)測精度,故需高精度的鏈路預(yù)測方法。而鏈路預(yù)測的兩個主要挑戰(zhàn)是時間復(fù)雜度和準(zhǔn)確性。由于傳統(tǒng)的鏈路預(yù)測方法不能有效地解決這一問題,還沒有一種既能獲得低復(fù)雜度又能獲得高準(zhǔn)確度的方法被提出。本文提出了基于公共鄰域懲罰的相似度鏈路預(yù)測方法(similarity link prediction method for common neighborhood punishment, SLP-CNP),根據(jù)網(wǎng)絡(luò)拓?fù)涮卣?包括每兩個節(jié)點的公共鄰域)和平均聚類系數(shù)確定相似度,與其它同類算法的主要區(qū)別在于區(qū)分節(jié)點的公共鄰域,是一種同時兼顧局部和全局特征的準(zhǔn)局部相似方法。實驗結(jié)果表明,該方法在精度和計算復(fù)雜度方面優(yōu)于同類方法。
鏈路預(yù)測在鏈路分析、信息檢索和網(wǎng)絡(luò)演化等領(lǐng)域變得越來越重要。在社交網(wǎng)絡(luò)中,鏈路預(yù)測常被用于預(yù)測潛在的社交關(guān)系,并基于此為用戶推薦好友或信息。最經(jīng)典的相似度鏈路預(yù)測方法為公共鄰居(CN)[9]、Adamaic Adar(AA)[10]和資源分配(RA)[11]。公共鄰居對每對節(jié)點給出的相似度得分涉及到這些節(jié)點間共享鄰居的數(shù)量,且假設(shè)如兩個節(jié)點有多個共鄰,則其間形成邊的概率將增加。Adamaic Adar法根據(jù)其程度對每個共享鄰居進(jìn)行分組,并通過研究每個節(jié)點間的公共鄰居為節(jié)點分配相似性分?jǐn)?shù)。資源分配法考慮了兩個非連接節(jié)點間通過其鄰居的資源分配,使得每個鄰居節(jié)點接收到一些資源并在其鄰居之間平均分配。兩個節(jié)點間的相似性準(zhǔn)則可通過共享鄰居從一個節(jié)點從另一節(jié)點接收到的資源量表示。而Jaccard指數(shù)[12]、S0rensen指數(shù)[13]和Leicht-Holme-Newman指數(shù)[8]是鏈接預(yù)測中采用的其他基于相似性的度量。在鏈路預(yù)測范圍內(nèi),有幾種基于相似度的方法,其中兩個節(jié)點間的鏈路概率是根據(jù)其共享鄰居來確定。劉留等[14]提出了基于公共鄰居的動態(tài)社會網(wǎng)絡(luò)鏈路預(yù)測算法,使用3個特定度量為兩個節(jié)點間的所有邊分配權(quán)值,然后將其總和確定為所述節(jié)點間鏈接的概率。而Wu等[15]提出了節(jié)點耦合聚類系數(shù),將節(jié)點間的公共鄰域部分與聚類信息相結(jié)合,采用每個節(jié)點相同的公共鄰域聚類系數(shù)。Dong等[16]建立了結(jié)合鄰居和群體信息的復(fù)雜網(wǎng)絡(luò)鏈路預(yù)測模型,其考慮了稱為基序的網(wǎng)絡(luò)結(jié)構(gòu)單元,為確定每個公共鄰域的兩個節(jié)點間的相似度得分,將所有公共鄰域的結(jié)果匯總,并將結(jié)果劃分為這些公共鄰域的個數(shù),最終實現(xiàn)對節(jié)點進(jìn)行相似度評分。
而翟東升等[17]提出了合著網(wǎng)絡(luò)中鏈接預(yù)測概念和基于主題建模的鏈接預(yù)測算法,證明了經(jīng)典轉(zhuǎn)移相似度區(qū)間的范圍,用模糊系統(tǒng)理論來表示相似度。復(fù)雜網(wǎng)絡(luò)圖中頂點的兩階段選擇鏈接預(yù)測方法[18],旨在預(yù)測圖流中最有可能連接到目標(biāo)頂點的top-k頂點。黃璐等[19]引入了時間鏈路預(yù)測方法,利用復(fù)雜網(wǎng)絡(luò)局部和全局拓?fù)浣Y(jié)構(gòu),將科學(xué)家互引預(yù)測問題描述為引文網(wǎng)絡(luò)鏈接預(yù)測問題,其中鏈接預(yù)測方法通過使用時間鏈接預(yù)測度量來預(yù)測鏈接和鏈接權(quán)重。另外,有學(xué)者使用影響最大化算法從目標(biāo)的當(dāng)前影響用戶集合中確定一組可能的影響用戶[20]。而Bastami等[21]提出了基于無監(jiān)督鏈路預(yù)測方法,利用節(jié)點特征、社區(qū)信息和圖特征組合來提高局部和全局預(yù)測精度。Grover等[22]以半監(jiān)督方式使用這些信息進(jìn)行節(jié)點聚類,并使用不同的統(tǒng)計抽樣方法來生成網(wǎng)絡(luò)中的節(jié)點上下文,但有時統(tǒng)計抽樣方法也無法有效保持節(jié)點的高階拓?fù)潢P(guān)系。而Cao等[23]提出的GraRep算法依賴于奇異值分解(singular value decomposition, SVD)和矩陣乘法法進(jìn)行鏈路預(yù)測,但具有較高的時間復(fù)雜度。另外,Wang等[24]所提SEMAC法也是基于矩陣乘法進(jìn)行鏈路預(yù)測優(yōu)化,并應(yīng)用于每個節(jié)點對應(yīng)的子圖預(yù)測,Dharavath等[25]將鏈路預(yù)測定義為二分類問題,根據(jù)節(jié)點相似性選擇一組特征,而Aghabozorgi等[26]利用網(wǎng)絡(luò)圖作為監(jiān)督學(xué)習(xí)下的結(jié)構(gòu)特征來進(jìn)行鏈路預(yù)測。所以綜上所述,在預(yù)測社交網(wǎng)絡(luò)中的鏈接時,不完整是另一個嚴(yán)峻的挑戰(zhàn),這是由于幾乎所有的社交網(wǎng)絡(luò)數(shù)據(jù)都包含缺失值,這是出于匿名和隱私保護,通常只能收集部分?jǐn)?shù)據(jù),且當(dāng)網(wǎng)絡(luò)規(guī)模較小或缺少嚴(yán)重時,冷啟動問題尤為嚴(yán)重,而在處理耦合網(wǎng)絡(luò)時也會遇到這種情況。所以在網(wǎng)絡(luò)中完善和實施鏈路預(yù)測方法是現(xiàn)在復(fù)雜網(wǎng)絡(luò)研究的核心問題之一。
鏈路預(yù)測方法旨在根據(jù)不同域上不同結(jié)構(gòu)特征對網(wǎng)絡(luò)進(jìn)行準(zhǔn)確預(yù)測。自適應(yīng)度懲罰算法根據(jù)復(fù)雜網(wǎng)絡(luò)聚類系數(shù)對公共鄰域的度進(jìn)行懲罰,一般的相似度度量方法可定義為式(1)所示。
(1)
其中:α為常量,z為x和y間的公共鄰居,且Γz為z的度數(shù)。不同方法間的區(qū)別為α值。在自適應(yīng)度懲罰算法中,α值通過考慮節(jié)點間最短路徑和平均聚類系數(shù)得出節(jié)點間是否存在較強相關(guān)性及聚類系數(shù),作為兩個節(jié)點x和y間的鏈接概率可被表示如式(2)所示。
(2)
其中:C為平均聚類系數(shù),β為常量值。將聚類系數(shù)作為復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)屬性,對每對節(jié)點間共享鄰居的個數(shù)進(jìn)行分組。自適應(yīng)度懲罰算法可在多種網(wǎng)絡(luò)上進(jìn)行,并取得良好性能。網(wǎng)絡(luò)中有幾個結(jié)構(gòu)屬性,特征包括節(jié)點間最短路徑、節(jié)點間路徑的信息熵、網(wǎng)絡(luò)中最長最短路徑的網(wǎng)絡(luò)直徑及節(jié)點聚類系數(shù)。平均聚類系數(shù)是整個網(wǎng)絡(luò)的常數(shù),可通過計算網(wǎng)絡(luò)中每個節(jié)點的聚類系數(shù)得到。故可根據(jù)式(3)計算節(jié)點x的聚類系數(shù),且可得平均聚類系數(shù)如式(4)所示。
(3)
(4)
基于相似度的鏈路預(yù)測方法具有相同的框架,節(jié)點間相似度是不同方法間的唯一區(qū)別。其主要目的是提供更準(zhǔn)確的指標(biāo)來估計網(wǎng)絡(luò)中節(jié)點間鏈路存在的概率,是每對節(jié)點間的相似度得分。而每兩個節(jié)點間的鏈接概率取決于其間的公共鄰居數(shù)量?,F(xiàn)有方法多沒有將處罰程度與網(wǎng)絡(luò)特征和結(jié)構(gòu)進(jìn)行聯(lián)系,而自適應(yīng)度懲罰算法適當(dāng)利用相似性指數(shù)中的平均聚類系數(shù)來關(guān)注復(fù)雜網(wǎng)絡(luò)特征和網(wǎng)絡(luò)結(jié)構(gòu),但其缺乏對公共鄰域形式的關(guān)注。為克服這一挑戰(zhàn),本文提出了SLP-CNP法,從一個新的角度看待鄰域。通過區(qū)分公共鄰域?qū)ψ赃m應(yīng)度懲罰算法進(jìn)行改進(jìn)。如需計算節(jié)點x和y間的相似性得分,為提高鏈路預(yù)測的效率,在度量中考慮了這種差異。如節(jié)點x和y有已經(jīng)是互為鄰節(jié)點的節(jié)點對,則節(jié)點x和y將來成為好友的概率將比節(jié)點x和y有不屬于朋友的的概率要大。需要注意,當(dāng)公共鄰節(jié)點的數(shù)量增加時,鏈路預(yù)測方法的精度和效率提高。為此,所提方法以不同方式考慮共享鄰居,還可根據(jù)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行調(diào)整,具體如式(5)所示。
(5)
其中:z為兩個節(jié)點x和y的公共鄰居,|Cz|為鄰居數(shù)量,除節(jié)點x和y外還包括其公共鄰居。Γz為z的鄰域數(shù)量,C為平均聚類系數(shù)。本文所提SLP-CNP法的具體步驟如算法1所示。首先計算每個節(jié)點的平均聚類系數(shù),將網(wǎng)絡(luò)分成訓(xùn)練集和測試集(10%和90%),采用5次交叉驗證將原網(wǎng)絡(luò)的總邊劃分為5個等邊。計算每個邊的相似度得分按降序排列,然后將排列列表中的邊添加到序列列表中。在列車網(wǎng)絡(luò)圖的邊上添加與測試集完全相同的邊數(shù),并從主網(wǎng)絡(luò)中任意減去。這些添加的邊是預(yù)測邊。最后,確定真陽性(正確預(yù)測)和假陽性(錯誤預(yù)測)數(shù)量,并基于此計算精度。
算法1:本文所提SLP-CNP算法
輸入:復(fù)雜網(wǎng)絡(luò)圖G
輸出:平均精度與AUC
01:for每個節(jié)點ido
02: 對于節(jié)點i計算簇系數(shù)
03:endfor
04: 基于簇系數(shù)之和與簇數(shù)量的商計算平均簇系數(shù)
05: 將圖G按5-fold切分為訓(xùn)練網(wǎng)絡(luò)Gtrain與測試網(wǎng)絡(luò)Gtest
06:for訓(xùn)練網(wǎng)絡(luò)Gtrain中的每條邊(x,y)do
07: 對每條邊(x,y)計算相似性得分Sxy
08:endFor
09: 按降序排列所有相似性得分Sxy
10: 基于有序列表插入邊至訓(xùn)練網(wǎng)絡(luò)Gtrain
11: 基于式(6)和式(7)計算精度和AUC值
12: 基于上述精度和AUC值結(jié)果,并使用式(8)和式(9)計算平均精度和AUC值
(6)
(7)
其中:n′是錯誤鏈接分?jǐn)?shù)大于不存在鏈接分?jǐn)?shù)的次數(shù),n″為兩個分?jǐn)?shù)相等的次數(shù),n為比較總次數(shù)。如得分來自獨立分布,則AUC值預(yù)計為0.5,故如AUC值高于0.5表示性能優(yōu)于純隨機情況。為獲得預(yù)測精度,對不存在的鏈接分?jǐn)?shù)計算精度,并將得到值可按降序排序。然后,選擇得分最高的L條鏈接,得到l作為正確預(yù)測的鏈接數(shù)量。
(8)
(9)
為證明本研究所提SLP-CNP算法的有效性,本研究使用3個真實社交網(wǎng)絡(luò)數(shù)據(jù)集進(jìn)行數(shù)值模擬,以便觀察算法對現(xiàn)實情況的適應(yīng)度(實驗中使用的真實社交網(wǎng)絡(luò)數(shù)據(jù)集特征如表1所示)。其中,激活率根據(jù)網(wǎng)絡(luò)圖的稀疏性進(jìn)行設(shè)置,并基于社交網(wǎng)絡(luò)中節(jié)點度和二階度的平均值進(jìn)行計算。本文使用Python軟件以近期的熱點事件“HUAWEI event”和“華為事件”的30個熱點評論用戶節(jié)點作為初始節(jié)點,爬取了知乎、CSDN和新浪微博的社交網(wǎng)絡(luò)用戶數(shù)據(jù)集作為實驗仿真的基礎(chǔ)數(shù)據(jù)(爬取時間為2020年4月23日-2020年9月6日)。本研究將每個用戶作為一個節(jié)點,使用節(jié)點間的邊界表示用戶間關(guān)系。本研究選擇了10個具有較強影響力的用戶及其好友列表作為社交網(wǎng)絡(luò)初始節(jié)點,以此生成了簡單社交網(wǎng)絡(luò)。實驗在MATLAB 2017b環(huán)境下實施,并都是在Windows10操作系統(tǒng)的服務(wù)器(Intel Xeon處理器(34 GHz)和32 GB內(nèi)存)上進(jìn)行。首先隨機選擇10%的鏈接并從網(wǎng)絡(luò)中刪除。為了獲得更精確的結(jié)果并避免算法的隨機行為,此選擇將執(zhí)行五次。接下來,應(yīng)用5倍交叉驗證方法,將網(wǎng)絡(luò)劃分為5個相等的部分,每次將一個部分視為測試集或信用集。
表1 社交網(wǎng)絡(luò)數(shù)據(jù)集說明
為評估本文所提SLP-CNP鏈路預(yù)測算法的性能,將其結(jié)果與現(xiàn)有較為成熟的重要節(jié)點識別算法進(jìn)行比較。其中包括4種中心度算法:即度中心性法[15](degree centricity, DC)、k-shell法[27]、PageRank法[18]和介數(shù)中心性法[16](intermediate centrality, IC)。兩種啟發(fā)式算法:雙折扣法[16](double discount, DD)和啟發(fā)式聚類法[22](heuristic clustering, HC)。兩種元啟發(fā)式算法:度遞減搜索策略(degree descending search strategy, DDSE)[23]和自適應(yīng)度懲罰算法(ADP)[19]。由于實驗中SLP-CNP鏈路預(yù)測算法預(yù)測列表在每次運行時的結(jié)果都有可能不同,故設(shè)置評估結(jié)果為迭代100次運行后的平均值,運行的平均標(biāo)準(zhǔn)差為1.524。如前所述,β為一個常數(shù)參數(shù),該參數(shù)值影響兩個節(jié)點間存在鏈路的概率,而該參數(shù)在一定程度上決定了該方法的性能。故考慮到所提用于計算兩個節(jié)點間存在鏈路的可能性的指標(biāo),為每個節(jié)點設(shè)置不同的值。本文采用試錯法,首先評估標(biāo)準(zhǔn)的應(yīng)用基于參數(shù)γ為每個網(wǎng)絡(luò),然后最好的表現(xiàn)γ對于不同的網(wǎng)絡(luò)可獲得的多個γ∈[-1.0,1.5]范圍內(nèi),每個網(wǎng)絡(luò)的性能最好γ實現(xiàn)價值。然后在網(wǎng)絡(luò)的聚類系數(shù)和最佳性能γ值間進(jìn)行線性回歸以確定β數(shù)值,故對于精密測量而言β=1.74(合成網(wǎng)絡(luò)圖如圖1所示)。
圖1 合成網(wǎng)絡(luò)圖結(jié)果
首先隨機選擇10%的鏈接從網(wǎng)絡(luò)中刪除,為獲得更精確的結(jié)果并避免算法的隨機行為,并應(yīng)用5-fold交叉驗證法將網(wǎng)絡(luò)劃分為5個相等部分,為保證算法的正確性在圖1所示的合成網(wǎng)絡(luò)結(jié)構(gòu)中進(jìn)行。在網(wǎng)絡(luò)中提出的鏈路預(yù)測方法后,該算法將最相似的分?jǐn)?shù)賦予所提邊,實際上可被視為預(yù)測邊。在上述情況下精度值是1,作為正確的預(yù)測邊相對于預(yù)測邊數(shù)量的比率,這與邊的正確預(yù)測完全相同。此外AUC值為0.939,且根據(jù)精度和AUC值,并以該方法提供的邊作為結(jié)果,可知該方法能正確地預(yù)測丟失鏈路。
將本文所提SLP-CNP算法與現(xiàn)有算法進(jìn)行性能比較。用于比較的鏈路預(yù)測方法都是基于相似度的,由于本文所采用的數(shù)據(jù)集是無向的,故通過考慮已經(jīng)與邊相連的每對節(jié)點之間的兩個方向來施加測度,并將其結(jié)果與所提方法進(jìn)行比較。實驗結(jié)果表明,本研究所提度量方法較其他方法更為有效。表2通過選擇3個真實網(wǎng)絡(luò)中20%的邊來說明不同算法的性能。結(jié)果表明,本研究所提SLP-CNP算在所有狀態(tài)下的性能都最優(yōu)。表3報告了不同真實網(wǎng)絡(luò)的5-fold交叉驗證,展示了不同算法的性能,可知本文所提SLP-CNP算法較其他算法更優(yōu)。
如前所述,計算復(fù)雜度和執(zhí)行時間是鏈路預(yù)測方法的關(guān)鍵挑戰(zhàn),故當(dāng)一種方法能夠在基于評估標(biāo)準(zhǔn)的執(zhí)行時間和效率間取得良好平衡時更為優(yōu)越??偟膩碚f,所有基于鄰域的相似性度量都有相同過程,所有這些方法間的唯一區(qū)別是計算相似性的過程。在進(jìn)行SLP-CNP法計算時,對于節(jié)點x首先搜索x的所有鄰節(jié)點。遍歷節(jié)點鄰域的時間復(fù)雜度僅為k,而本文所提SLP-CNP法的時間復(fù)雜度為O(nk2),n表示節(jié)點數(shù)量,k表示平均度。除時間復(fù)雜度外,內(nèi)存空間是算法實現(xiàn)面臨的另一個限制。在進(jìn)行SLP-CNP法計算時,所需的內(nèi)存約為O(nk),顧所需內(nèi)存和CPU時間相對較少。表4報告了本文所提SLP-CNP法與其他方法的運行時間(以秒為單位)比較結(jié)果。由結(jié)果可知,本文為所提方法的時間復(fù)雜度較其他方法較優(yōu)。總的來說,本文所提方法的主要優(yōu)點是獲得了高性能,比基于相似性的方法更好,計算復(fù)雜度非常低,這大大減少了基準(zhǔn)數(shù)據(jù)集中的運行時間。
表2 不同真實復(fù)雜網(wǎng)絡(luò)中選擇10%邊的算法比較結(jié)果
表3 不同真實復(fù)雜網(wǎng)絡(luò)中通過5-fold的算法比較結(jié)果
表4 不同真實復(fù)雜網(wǎng)絡(luò)中算法時間復(fù)雜度比較結(jié)果
表5 不同算法的Friedman檢驗比較結(jié)果
本研究使用Friedman檢驗[27],分析了從不同相似性鏈路預(yù)測方法獲得的結(jié)果。Friedman檢驗是一種非參數(shù)統(tǒng)計檢驗,用于發(fā)現(xiàn)多種方法的行為差異。非參數(shù)(無分布)意味著測試不假設(shè)數(shù)據(jù)來自特定的分布。Friedman檢驗可用于評價N種不同方法對K個數(shù)據(jù)集的結(jié)果。在這個測試中,這些方法是根據(jù)它們的性能標(biāo)準(zhǔn)來排序的。本文以精密度和AUC為評價標(biāo)準(zhǔn),以高階方法的評價效果最好。表4報告了上述鏈路預(yù)測方法的排名。可知本文所提SLP-CNP法的分類精度和AUC分別為4.00和3.77,高于其他基于相似度的分類方法,且P值小于0.05。故可知上述結(jié)果通過統(tǒng)計性檢驗是顯著的。
本文提出了新的鏈路預(yù)測度量方法,將聚類系數(shù)作為網(wǎng)絡(luò)的結(jié)構(gòu)屬性加以考慮,該方法除考慮每對節(jié)點的共享鄰居,還考慮了共享鄰節(jié)點的鄰節(jié)點,故比其他類似鏈路預(yù)測方法具有更好性能。為驗證該方法的有效性,在多個真實網(wǎng)絡(luò)上進(jìn)行對比實驗。結(jié)合在知乎、CSDN與新浪微博等社交網(wǎng)絡(luò)環(huán)境中的實驗結(jié)果可知,本研究所提SLP-CNP法較其他算法具有更優(yōu)精度與效率。在未來的工作中,將嘗試提出新的系統(tǒng)化方法,提出并行算法顯著提高效率的方法來改進(jìn)所提出的方法。其次,還可嘗試本文所提方法在加權(quán)網(wǎng)絡(luò)、有向網(wǎng)絡(luò)和二部網(wǎng)絡(luò)中的適用性。再次,可嘗試使用不同的操作符,以有效提升鏈路預(yù)測算法的時間復(fù)雜度,以提升算法的運行效率。另外,可嘗試使用深度學(xué)習(xí)等先進(jìn)技術(shù)以提升復(fù)雜網(wǎng)絡(luò)鏈路方法的效率與精度。最后,可提出鏈路預(yù)測方法以確定適當(dāng)參數(shù)值,以優(yōu)化相似度方法。在應(yīng)用場景方面,可嘗試在如蛋白質(zhì)網(wǎng)絡(luò)、恐怖分子網(wǎng)絡(luò)、科研合作網(wǎng)絡(luò)、多層網(wǎng)絡(luò)等其他復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)中對本文所提算法的適用性進(jìn)行驗證。