張紅偉 陳玲 許萍
摘 要 針對(duì)個(gè)人數(shù)字圖書(shū)館可用性和可靠性低的問(wèn)題,提出一種基于P2P興趣簇的個(gè)人數(shù)字圖書(shū)館復(fù)本策略,為構(gòu)建個(gè)人數(shù)字圖書(shū)館共享系統(tǒng)提供參考。論文引入P2P興趣社區(qū)思想搭建個(gè)人數(shù)字圖書(shū)館共享模型,在該模型中,系統(tǒng)從文件訪問(wèn)次數(shù)和個(gè)人數(shù)字圖書(shū)館負(fù)載兩個(gè)層面檢測(cè)是否需要?jiǎng)?chuàng)建復(fù)本,一旦啟動(dòng)復(fù)本創(chuàng)建程序,系統(tǒng)將熱點(diǎn)文件復(fù)本創(chuàng)建在與該文件興趣相似度較大、綜合能力較強(qiáng)的個(gè)人數(shù)字圖書(shū)館中。仿真結(jié)果顯示,該策略能有效提高系統(tǒng)的搜索成功率,平衡系統(tǒng)負(fù)載,提高系統(tǒng)的可用性和可靠性。
關(guān)鍵詞 個(gè)人數(shù)字圖書(shū)館 P2P 復(fù)本 興趣簇 共享
分類(lèi)號(hào) G250.72
DOI 10.16810/j.cnki.1672-514X.2018.05.013
Abstract In view of the low availability and reliability of personal digital libraries, a duplicate strategy of personal digital libraries based on P2P interest clusters is proposed, which provides reference for constructing personal digital library sharing system. This paper introduces the idea of P2P interest community to build a personal digital library sharing model. In this model, the system checks whether there is a need to create duplicates from two aspects of the number of file accesses and the personal digital library load. Once the duplicate creation program is started, the system creates a duplicate of the hotspot file in a personal digital library with a similar affinity to the file and a comprehensive ability. Simulation results show that the strategy can effectively improve the search success rate, balance the system load and improve the availability and reliability of the system.
Keywords Personal digital libraries. P2P. Duplicates. Interest cluster. Sharing.
個(gè)人數(shù)字圖書(shū)館是公共數(shù)字圖書(shū)館服務(wù)的發(fā)展和延伸,個(gè)人數(shù)字圖書(shū)館不僅可以管理和使用個(gè)人信息資源,而且可以共享個(gè)人信息資源[1],促進(jìn)資源的有效利用和知識(shí)再生。針對(duì)個(gè)人數(shù)字圖書(shū)館共享問(wèn)題,很多學(xué)者做了大量研究[2-7],他們通過(guò)研究認(rèn)為傳統(tǒng)的C/S模式已經(jīng)不適用于個(gè)人數(shù)字圖書(shū)館,分布式的P2P技術(shù)即將成為個(gè)人數(shù)字圖書(shū)館新的技術(shù)支撐。但是P2P技術(shù)也給個(gè)人數(shù)字圖書(shū)館共享體系帶來(lái)了新的問(wèn)題,復(fù)本問(wèn)題就是其中之一。筆者就此問(wèn)題曾在《基于P2P技術(shù)的個(gè)人數(shù)字圖書(shū)館復(fù)本策略》 一文中提出一種基于P2P技術(shù)的復(fù)本策略[8],但是該策略沒(méi)有考慮到個(gè)人數(shù)字圖書(shū)館的負(fù)載,容易造成網(wǎng)絡(luò)擁塞。由此本文在前文的基礎(chǔ)上進(jìn)一步提出一種基于P2P興趣簇的個(gè)人數(shù)字圖書(shū)館復(fù)本策略,該策略將有助于提高系統(tǒng)的可靠性和可用性,有利于負(fù)載均衡和提高資源搜索成功率。
1 基于P2P興趣簇的個(gè)人數(shù)字圖書(shū)館模型
1.1 個(gè)人數(shù)字圖書(shū)館興趣模型
P2P網(wǎng)絡(luò)有4種典型的體系結(jié)構(gòu):集中式P2P網(wǎng)絡(luò)、全分布式非結(jié)構(gòu)化P2P網(wǎng)絡(luò)、全分布式結(jié)構(gòu)化P2P網(wǎng)絡(luò)和混合式P2P網(wǎng)絡(luò)。全分布式非結(jié)構(gòu)化P2P網(wǎng)絡(luò)是一種純粹的分布式網(wǎng)絡(luò),具有良好的容錯(cuò)性、可擴(kuò)展性和負(fù)載均衡,是四種體系結(jié)構(gòu)中最受歡迎的一種,應(yīng)用范圍最廣[9]。本文采用全分布式非結(jié)構(gòu)化P2P網(wǎng)絡(luò)構(gòu)建個(gè)人數(shù)字圖書(shū)館模型。
目前,常用的興趣模型表示方法主要有基于向量空間模型(Vector Space Model, VSM) 表示法[10]、主題表示法、關(guān)鍵詞表示法等,VSM模型使用簡(jiǎn)單、方便,是最常用的興趣模型[11]。本文采用經(jīng)典的向量空間模型作為個(gè)人數(shù)字圖書(shū)館(以下簡(jiǎn)稱(chēng)PDL)的興趣表示模型。PDL的興趣往往不止一個(gè),并且隨著時(shí)間的推進(jìn)而不斷發(fā)生變化,VSM模型將這些抽象的、動(dòng)態(tài)的興趣轉(zhuǎn)化為可以計(jì)算彼此相似度的向量,比如PDLi的興趣向量{PDLi1, PDLi2,…,PDLik,…, PDLin}表示PDLi共有n個(gè)興趣,其中PDLik是PDLi中第k(1≤k≤n)個(gè)興趣向量。VSM模型中,興趣相似度采用夾角余弦表示,興趣和興趣、興趣和PDL、PDL和PDL之間都可以計(jì)算興趣相似度,比如,興趣PDLik和興趣PDLjr之間的相似度如公式(1) 所示:
Sim(PDLik,PDLjr)越大,PDLik和PDLjr之間的興趣相似度越大,反之,PDLik和PDLjr之間的興趣相似度越小。PDLi的第k個(gè)興趣PDLik和PDLj之間的興趣相似度如公式(2)所示:
其中,Lj是PDLj的興趣數(shù)量,PDLik和PDLj的興趣逐一進(jìn)行相關(guān)度計(jì)算,其中最大值就是PDLik和PDLj的興趣相似度。
相應(yīng)地,一個(gè)文檔向量f與PDLi之間的興趣相似度如公式(3)所示:
1.2 個(gè)人數(shù)字圖書(shū)館興趣覆蓋網(wǎng)絡(luò)的構(gòu)建
每個(gè)PDLi要維護(hù)以下三方面的內(nèi)容。一是PDLi共享文檔集合;二是PDLi的興趣向量集合;三是簇內(nèi)鄰居列表Ni,針對(duì)每個(gè)興趣PDLik,PDLi維護(hù)一個(gè)鄰居列表Nik,Nik中存儲(chǔ)與興趣PDLik相似度較高的PDLs,簇內(nèi)鄰居信息包含一組(ip(PDLj), PDLjr) 信息,其中ip(PDLj)是PDLi簇內(nèi)鄰居PDLj的IP地址,PDLjr是與PDLi的第k個(gè)興趣。PDLi中含有多個(gè)興趣,針對(duì)每個(gè)興趣PDLik,大量興趣相近的PDLs聚集在PDLi周?chē)纬梢粋€(gè)興趣簇。
圖1是PDLi的興趣簇示意圖,其中左側(cè)是PDLi的n個(gè)興趣,每個(gè)興趣都鏈接一個(gè)簇內(nèi)鄰居列表,簇內(nèi)鄰居依據(jù)與PDLi相應(yīng)興趣相似度降序排列。例如,PDLi1鏈接簇內(nèi)鄰居列表Ni1,簇內(nèi)鄰居列表Ni1存儲(chǔ)與興趣PDLi1相似度較高的PDLs(包括PDLs的ip地址和相應(yīng)興趣),這些簇內(nèi)鄰居相應(yīng)興趣按照與PDLi1相似度降序排列,PDLi依據(jù)興趣PDLi1與簇內(nèi)鄰居列表Ni1中的PDLs結(jié)合在一起形成興趣簇,同樣,PDLi依據(jù)其他的每一個(gè)興趣與興趣相似的PDLs結(jié)合在一起形成興趣簇,大量的PDLs依據(jù)興趣結(jié)合在一起形成一個(gè)邏輯上的興趣覆蓋網(wǎng)。當(dāng)PDLi進(jìn)行資源搜索時(shí),路由轉(zhuǎn)發(fā)策略利用公式(3) 計(jì)算出查詢消息所攜帶的查詢向量與PDLi的相似度最高的興趣PDLik,查詢消息依次轉(zhuǎn)發(fā)到鄰居列表Nik中的PDLs,直到查詢到所需資源或遍歷完鄰居列表中的PDLs。
1.3 個(gè)人數(shù)字圖書(shū)館網(wǎng)絡(luò)拓?fù)渲貥?gòu)過(guò)程
在個(gè)人數(shù)字圖書(shū)館系統(tǒng)運(yùn)行過(guò)程中,個(gè)人數(shù)字圖書(shū)館的興趣可能發(fā)生改變,隨著時(shí)間的變化,原來(lái)興趣相似度較高的PDLs可能變得興趣相似度較低,原來(lái)興趣相似度較低的PDLs可能變得興趣相似度較高。為了適應(yīng)個(gè)人數(shù)字圖書(shū)館興趣的動(dòng)態(tài)變化,使興趣相似度較高的PDLs始終聚集在一起,每個(gè)PDL定期啟動(dòng)一個(gè)檢測(cè)程序,針對(duì)每個(gè)興趣PDLik,檢測(cè)程序計(jì)算聚合度Dik,如公式(4) 所示。
其中,PDLjr是PDLik的簇內(nèi)鄰居PDLj相對(duì)應(yīng)的興趣,n是PDLik對(duì)應(yīng)的簇內(nèi)鄰居數(shù)量。針對(duì)興趣PDLik,聚合度Dik的大小是PDLi與所有簇內(nèi)鄰居興趣相似度的平均值,如果Dik高于或等于某一臨界值η,說(shuō)明PDLi與簇內(nèi)鄰居興趣相似度較高,一些具有與興趣PDLik相似的PDLs聚集在PDLi周?chē)?,為了減少消息數(shù)量,提高系統(tǒng)效率,PDLi不需要搜尋新的簇內(nèi)鄰居;反之,如果Dik低于某一臨界值η,說(shuō)明PDLi與簇內(nèi)鄰居關(guān)于PDLik的興趣相似度較低。此時(shí),PDLi會(huì)產(chǎn)生一個(gè)查詢消息,該消息包含以下信息:PDLi的IP地址和興趣PDLik,該消息按照隨機(jī)漫步機(jī)制發(fā)送到P2P網(wǎng)絡(luò)中。當(dāng)網(wǎng)絡(luò)中的PDLj收到查詢消息時(shí),PDLj根據(jù)公式(2) 計(jì)算自己與PDLik的興趣相似度,并把計(jì)算結(jié)果以及相應(yīng)的PDLjr和PDLj的IP地址附加到消息中。當(dāng)TTL=0時(shí),該消息返回PDLi,PDLi將消息中附帶的PDLs信息按照興趣相似度降序的順序添加到鄰居列表Nik中,如果鄰居列表Nik過(guò)長(zhǎng),則將后面的PDLs信息刪除。
2 個(gè)人數(shù)字圖書(shū)館復(fù)本策略
相比紙本資源,個(gè)人數(shù)字圖書(shū)館的復(fù)本問(wèn)題更為復(fù)雜,其主要問(wèn)題主要集中在兩個(gè)方面。一是哪些資源需要?jiǎng)?chuàng)建復(fù)本。個(gè)人數(shù)字圖書(shū)館系統(tǒng)中存儲(chǔ)海量資源,系統(tǒng)不可能為所有資源都創(chuàng)建復(fù)本,只能有選擇性的對(duì)那些訪問(wèn)量較大、負(fù)載較重的文件創(chuàng)建復(fù)本,因此系統(tǒng)需要篩選出哪些資源創(chuàng)建復(fù)本。二是在哪里創(chuàng)建復(fù)本。在P2P領(lǐng)域,常用的創(chuàng)建復(fù)本的方法有兩種:一種是在下載該資源的PDL中創(chuàng)建復(fù)本,稱(chēng)為宿主復(fù)本策略;另一種是按照一定的概率隨機(jī)選取PDL創(chuàng)建復(fù)本,也稱(chēng)為隨機(jī)復(fù)本策略[12]。針對(duì)個(gè)人數(shù)字圖書(shū)館共享系統(tǒng)的特點(diǎn),筆者認(rèn)為復(fù)本應(yīng)起到分擔(dān)網(wǎng)絡(luò)負(fù)載、提高數(shù)據(jù)訪問(wèn)效率的作用,所以復(fù)本盡量要?jiǎng)?chuàng)建在資源請(qǐng)求者容易搜索到且綜合能力較好的PDLs中。
針對(duì)上述第一個(gè)問(wèn)題,可從文件訪問(wèn)次數(shù)和個(gè)人數(shù)字圖書(shū)館負(fù)載兩個(gè)維度來(lái)確定哪些文件需要?jiǎng)?chuàng)建復(fù)本。這兩種策略不是獨(dú)立排他的,而是可以相互配合,同時(shí)進(jìn)行的,兩種策略分別從單個(gè)文件和整個(gè)PDL兩方面的負(fù)載考量是否需要?jiǎng)?chuàng)建復(fù)本。
2.1 基于文件訪問(wèn)次數(shù)的復(fù)本策略
為了便于確定熱點(diǎn)文件,系統(tǒng)中每個(gè)PDL都將自己共享文件的訪問(wèn)量記錄下來(lái)。在一定時(shí)間段T內(nèi),文件的訪問(wèn)次數(shù)記為v。文件訪問(wèn)總次數(shù)應(yīng)突出時(shí)間因素,時(shí)間越近的訪問(wèn)次數(shù)所占權(quán)重較大,時(shí)間越久的訪問(wèn)次數(shù)所占權(quán)重越小,文件訪問(wèn)總次數(shù)計(jì)算方法如公式(5) 所示。
(5)
系統(tǒng)將最近n個(gè)時(shí)間段內(nèi)文件的訪問(wèn)次數(shù)加權(quán)之和作為文件的訪問(wèn)總次數(shù),其中0<<<…<<1,++…+=1。假設(shè)文件在時(shí)間段TK內(nèi)創(chuàng)建了一個(gè)復(fù)本,為了避免大量創(chuàng)建不必要的復(fù)本,訪問(wèn)總次數(shù)計(jì)算方法中將復(fù)本創(chuàng)建前的訪問(wèn)次數(shù)乘以一個(gè)衰減系數(shù)(0<<1),復(fù)本創(chuàng)建前的訪問(wèn)次數(shù)所占比重應(yīng)減小,復(fù)本創(chuàng)建后的訪問(wèn)次數(shù)比重應(yīng)增加,訪問(wèn)總次數(shù)計(jì)算方法如公式(6)所示,如果創(chuàng)建多個(gè)復(fù)本則將衰減系統(tǒng)嵌套使用。
針對(duì)上述第二個(gè)問(wèn)題,為了選擇文件F創(chuàng)建復(fù)本的PDL,定義PDL的綜合能力。PDL的綜合能力(CA)主要考慮以下因素: PDL與文件F的興趣相似度(S),PDL的在線時(shí)間(O),網(wǎng)絡(luò)帶寬(B) 以及磁盤(pán)容量(D)。PDL綜合能力的計(jì)算方法如公式7所示。
為了有效控制各個(gè)因素取值大小,采用類(lèi)似文獻(xiàn)[13]中的方法,使各個(gè)因素在[0,1]范圍內(nèi)取值。其中S利用公式(5) 計(jì)算。
PDL與文件F的興趣相似度越大,在線時(shí)間越長(zhǎng),帶寬和磁盤(pán)空間越大,PDL的綜合能力就越大,系統(tǒng)創(chuàng)建復(fù)本時(shí),選擇綜合能力最大的PDL創(chuàng)建。
當(dāng)系統(tǒng)中PDLi的某一文件F被訪問(wèn)時(shí),PDLi計(jì)算文件F的總訪問(wèn)量,如果F的總訪問(wèn)量超過(guò)閾值,系統(tǒng)將啟動(dòng)復(fù)本創(chuàng)建程序,復(fù)本創(chuàng)建過(guò)程如下。
(1) 初始化文件F的興趣向量f,利用公式(3) 計(jì)算出PDLi中與f相似度最高的興趣PDLik。
(2) 在與興趣PDLik相關(guān)聯(lián)的簇內(nèi)鄰居列表Nik中,根據(jù)公式(7) 計(jì)算出各PDLs的綜合能力,并按降序排列。
(3) 在PDLs綜合能力序列中取出第一個(gè)PDL,如果該P(yáng)DL中沒(méi)有文件F的復(fù)本,則選中該P(yáng)DL創(chuàng)建文件F的復(fù)本;否則,依次取出后面的PDL,直到PDL中沒(méi)有文件F的復(fù)本,則選中該P(yáng)DL創(chuàng)建文件F的復(fù)本(PDL的簇內(nèi)鄰居較多,不考慮所有簇內(nèi)鄰居都已創(chuàng)建復(fù)本的情況)。
(4) 在選中的PDL中創(chuàng)建復(fù)本。
2.2 基于個(gè)人數(shù)字圖書(shū)館負(fù)載均衡的復(fù)本創(chuàng)建策略
系統(tǒng)根據(jù)PDL的負(fù)載確定是否啟動(dòng)復(fù)本創(chuàng)建程序。PDL的當(dāng)前負(fù)載為CL,最大負(fù)載為。系統(tǒng)中每個(gè)PDL定期檢測(cè)自己的當(dāng)前負(fù)載,如果當(dāng)前負(fù)載與最大負(fù)載的比值pr大于一定比例γ(比如80%),說(shuō)明該P(yáng)DL負(fù)載過(guò)重,需要?jiǎng)?chuàng)建共享文件復(fù)本,從而分擔(dān)負(fù)載,該P(yáng)DL將選擇其共享文件中訪問(wèn)總次數(shù)最多的文件進(jìn)行創(chuàng)建復(fù)本。PDL利用公式(5) 或公式(6) 計(jì)算出訪問(wèn)總次數(shù)最多的共享文件F,系統(tǒng)將為文件F創(chuàng)建復(fù)本,復(fù)本創(chuàng)建過(guò)程與基于文件訪問(wèn)次數(shù)的復(fù)本策略一致,復(fù)本創(chuàng)建流程圖如圖2所示。
3 仿真實(shí)驗(yàn)及分析
3.1 實(shí)驗(yàn)設(shè)置
共享文件從中國(guó)知網(wǎng)期刊論文中選取,在“信息科技”“農(nóng)業(yè)科技”等中國(guó)知網(wǎng)10個(gè)頂層文獻(xiàn)分類(lèi)中選出100個(gè)等底層分類(lèi)(如“數(shù)字圖書(shū)館”等),在這些底層分類(lèi)中分別下載50篇興趣相似的期刊論文。文章選取PeerSim作為模擬工具,在PeerSim中實(shí)現(xiàn)基于P2P興趣簇的個(gè)人數(shù)字圖書(shū)館網(wǎng)絡(luò)模型。網(wǎng)絡(luò)中設(shè)置1000個(gè)PDLs,并將選中的5000個(gè)文檔散布在這些PDLs中,每個(gè)PDLs所涉及的文件興趣不超過(guò)3個(gè)。設(shè)置PDLs的離線率、帶寬和磁盤(pán)空間。主要實(shí)驗(yàn)參數(shù)如表1所示。
3.2 性能分析
為了驗(yàn)證本文復(fù)本策略的有效性,筆者將本文的復(fù)本策略與無(wú)復(fù)本策略、宿主復(fù)本策略和隨機(jī)復(fù)本策略進(jìn)行比較,分析4種策略下個(gè)人數(shù)字圖書(shū)館的搜索成功率、負(fù)載和平均搜索路徑長(zhǎng)度。
3.2.1 搜索成功率
系統(tǒng)開(kāi)始運(yùn)行后,PDLs間的興趣相似度較低,每個(gè)PDL都試圖尋找興趣相關(guān)度較高的PDLs,為了不在同一時(shí)刻啟動(dòng)檢測(cè)程序,避免系統(tǒng)中查詢消息爆炸式增長(zhǎng),所有PDL在一段時(shí)間內(nèi)隨機(jī)選擇某一時(shí)刻啟動(dòng)檢測(cè)程序。第一次啟動(dòng)檢測(cè)程序后,系統(tǒng)設(shè)定PDLs定期啟動(dòng)一次檢測(cè)程序,運(yùn)行10個(gè)周期,搜索成功率測(cè)試結(jié)果如圖3所示。
無(wú)復(fù)本策略中,雖然一些PDLs退出系統(tǒng)導(dǎo)致其存儲(chǔ)的資源無(wú)法獲取到,但是隨著大量興趣相似的PDLs聚集在一起形成興趣簇,搜索成功率依然有所增加。宿主復(fù)本策略和隨機(jī)復(fù)本策略中,由于對(duì)一些熱點(diǎn)文件熱點(diǎn)文件創(chuàng)建了復(fù)本,即使存儲(chǔ)這些熱點(diǎn)文件的PDLs退出系統(tǒng),其他PDLs依然能夠搜索到這些熱點(diǎn)文件的復(fù)本,相比無(wú)復(fù)本策略,這兩種策略的搜索成功率顯著提高。本文復(fù)本策略中,熱點(diǎn)文件復(fù)本創(chuàng)建在與源文件興趣相似度較高且綜合能力較強(qiáng)的PDLs中,這些PDLs往往與對(duì)該熱點(diǎn)文件感興趣的PDLs處于同一興趣簇,因此,當(dāng)PDLs對(duì)該文件發(fā)起搜索時(shí),很容易搜索到復(fù)本文件,相比其他三種復(fù)本策略,本文復(fù)本策略的搜索成功率顯著提高,滿足了個(gè)人數(shù)字圖書(shū)館系統(tǒng)最主要的需求,同時(shí)也提高了系統(tǒng)的可用性和可靠性。
3.2.2 負(fù)載
本文負(fù)載只統(tǒng)計(jì)資源請(qǐng)求數(shù)。為了測(cè)試PDLs負(fù)載情況,在系統(tǒng)中選中某一PDL及其存儲(chǔ)的共享文件F,系統(tǒng)持續(xù)不斷地發(fā)出對(duì)文件F的請(qǐng)求(70%的請(qǐng)求出自與文件F興趣相似度較高的PDLs),不同復(fù)本策略下的負(fù)載情況如圖4所示。
無(wú)復(fù)本策略下,系統(tǒng)中沒(méi)有創(chuàng)建文件F的復(fù)本,所有請(qǐng)求都發(fā)往存儲(chǔ)F的PDL。系統(tǒng)中產(chǎn)生的資源請(qǐng)求數(shù)一旦超過(guò)了PDL的處理能力,負(fù)載就會(huì)一直處于增加的狀態(tài),PDL在系統(tǒng)中就不會(huì)正常運(yùn)行。開(kāi)始階段,宿主復(fù)本策略、隨機(jī)復(fù)本策略和本文復(fù)本策略中,負(fù)載呈現(xiàn)增加的趨勢(shì),當(dāng)負(fù)載增加到一定程度時(shí),這三種策略都創(chuàng)建了復(fù)本,其中,根據(jù)系統(tǒng)檢測(cè)文件訪問(wèn)量和PDL負(fù)載負(fù)載兩個(gè)維度,一旦任何一個(gè)因素達(dá)到閾值即可啟動(dòng)復(fù)本創(chuàng)建程序。本文復(fù)本策略中,復(fù)本創(chuàng)建于興趣簇中,相比其他兩種復(fù)本策略,復(fù)本的位置更接近于資源請(qǐng)求者,資源請(qǐng)求者更容易搜索到復(fù)本,為源文件減輕負(fù)載,所以本文復(fù)本策略下,負(fù)載較低,整個(gè)系統(tǒng)的負(fù)載較為均衡,同時(shí)也提高了系統(tǒng)的可用性和可靠性。
4 結(jié)語(yǔ)
針對(duì)P2P技術(shù)帶來(lái)的復(fù)本問(wèn)題,本文提出了一種基于P2P興趣簇的個(gè)人數(shù)字圖書(shū)館復(fù)本策略,該策略在復(fù)本創(chuàng)建觸發(fā)條件方面,系統(tǒng)對(duì)文件訪問(wèn)次數(shù)和個(gè)人數(shù)字圖書(shū)館負(fù)載兩個(gè)方面同時(shí)進(jìn)行監(jiān)測(cè),其中任一因素滿足條件,系統(tǒng)立即啟動(dòng)復(fù)本創(chuàng)建程序。在復(fù)本創(chuàng)建位置方面,系統(tǒng)將熱點(diǎn)文件的復(fù)本創(chuàng)建在與該文件興趣相似度較高的個(gè)人數(shù)字圖書(shū)館中,即復(fù)本處于一個(gè)興趣簇中,一旦周?chē)鷤€(gè)人數(shù)字圖書(shū)館發(fā)起查詢,該復(fù)本很容易被其他興趣相近的個(gè)人數(shù)字圖書(shū)館搜索到,有利于提高系統(tǒng)搜索成功率、平衡系統(tǒng)負(fù)載,提高系統(tǒng)可靠性和可用性。
參考文獻(xiàn):
王小立.網(wǎng)站知識(shí)傳播系統(tǒng)動(dòng)力學(xué)建模與啟示:關(guān)于個(gè)人數(shù)字圖書(shū)館資源共享服務(wù)[J].圖書(shū)館雜志, 2016, 35(6):24-30.
王小立.百度"知道"知識(shí)傳播對(duì)個(gè)人數(shù)字圖書(shū)館資源共享的啟示:基于系統(tǒng)動(dòng)力學(xué)方法[J]. 圖書(shū)館, 2016(2):83-87.
張銀犬,朱慶華.網(wǎng)格環(huán)境下個(gè)人數(shù)字圖書(shū)館信息檢索策略[J].中國(guó)圖書(shū)館學(xué)報(bào), 2007,33(3):56-59.
張銀犬,朱慶華.國(guó)內(nèi)外個(gè)人數(shù)字圖書(shū)館研究述評(píng)[J]. 圖書(shū)與情報(bào),2008(3):18-21.
王春梅,張銀犬.基于P2P技術(shù)的個(gè)人數(shù)字圖書(shū)館資源共享策略[J]. 情報(bào)雜志, 2008,27(4):125-127.
Ge G Z ,WANG H.An Architecture Design and Prototype Client Implementation for a P2P Personal Digital Library[EB/OL].[2017-07-23].https://core.ac.uk/display/21630286.
XU Y.A P2P based personal digital library for community[C]//Sixth International Conference on Parallel and Distributed Computing Applications and Technologies (PDCAT'05). IEEE, 2005: 796-800.
張紅偉.基于P2P技術(shù)的個(gè)人數(shù)字圖書(shū)館復(fù)本策略[J]. 濟(jì)寧醫(yī)學(xué)院學(xué)報(bào), 2015(1):54-56.
何明.基于用戶需求的內(nèi)容分發(fā)P2P網(wǎng)絡(luò)資源定位搜索模型研究[D]. 北京:北京郵電大學(xué), 2015.
賈欣.基于用戶興趣模型的元搜索結(jié)果排序算法研究[D].武漢:華中科技大學(xué), 2012.
肖瑜.基于用戶興趣模型的個(gè)性化搜索算法研究[D]. 太原:太原科技大學(xué), 2013.
張永紅.無(wú)結(jié)構(gòu)P2P網(wǎng)絡(luò)文件副本自適應(yīng)分布研究[D].大連:大連理工大學(xué), 2013.
錢(qián)曄蕾,董健全.基于非結(jié)構(gòu)化P2P的副本技術(shù)的研究和應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2007,43(10):148-153.