• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    時(shí)態(tài)RDF數(shù)據(jù)的不一致性修復(fù)和預(yù)處理

    2019-01-07 05:21:56張燕超
    關(guān)鍵詞:三元組時(shí)態(tài)一致性

    張燕超

    (南京航空航天大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,江蘇南京210000)

    資源描述框架 RDF(resource description framework)是由萬(wàn)維網(wǎng)協(xié)會(huì)W3C提出的一個(gè)語(yǔ)義框架[1],被廣泛應(yīng)用在描述語(yǔ)義網(wǎng)[2]中的各類海量數(shù)據(jù),可以用三元組(主語(yǔ)、謂語(yǔ)、賓語(yǔ))的形式來描述語(yǔ)義網(wǎng)上的任何數(shù)據(jù)。

    隨著計(jì)算機(jī)技術(shù)和信息技術(shù)的深入發(fā)展,語(yǔ)義網(wǎng)中的時(shí)態(tài)RDF數(shù)據(jù)也在快速的累積中,RDF數(shù)據(jù)的涉及到各個(gè)領(lǐng)域。時(shí)態(tài)信息在信息系統(tǒng)中扮演著日益重要的角色,時(shí)態(tài)RDF數(shù)據(jù)的一致性檢測(cè)和恢復(fù)也有助于提高時(shí)態(tài)RDF數(shù)據(jù)庫(kù)系統(tǒng)的可靠性和高效性[3],特別是對(duì)電子商務(wù)、數(shù)據(jù)挖掘、決策支持系統(tǒng)等信息系統(tǒng)有著越來越重要的意義和保障[4-6]。

    國(guó)內(nèi)外學(xué)者提出了多種類型的時(shí)態(tài)數(shù)據(jù)庫(kù)模型,其中主要是基于關(guān)系模型的時(shí)態(tài)關(guān)系數(shù)據(jù)庫(kù)以及相應(yīng)的查詢語(yǔ)言[10]。除了關(guān)系模型,Chawathe首次提出了管理歷史的半結(jié)構(gòu)化數(shù)據(jù)[11],他擴(kuò)展了交換對(duì)象模型,使它可以表示更新,借助“增量(deltas)”來跟蹤它們。Claudio Gutierrez[12]首次提出了對(duì)于時(shí)態(tài)RDF數(shù)據(jù)模型的建立,添加時(shí)間標(biāo)簽來實(shí)現(xiàn)數(shù)據(jù)的時(shí)態(tài)性,如(s,p,o):[T],其中 T 就是時(shí)態(tài)信息。后續(xù)的時(shí)態(tài)RDF模型的研究都是在此時(shí)態(tài)RDF數(shù)據(jù)模型的基礎(chǔ)上進(jìn)行更多的語(yǔ)義和時(shí)間信息的表達(dá)上的擴(kuò)展[13,14],還有進(jìn)行雙時(shí)態(tài)擴(kuò)展,同時(shí)支持有效時(shí)間和事務(wù)時(shí)間。還有更多的時(shí)態(tài)和語(yǔ)義的邏輯分析與推理,基本都停留在理論上的分析。

    時(shí)態(tài)數(shù)據(jù)的一致性研究中文獻(xiàn)[7,8]是基于關(guān)系數(shù)據(jù)庫(kù)的多版本,文獻(xiàn)[7]需要追溯過去的版本中的所有的不一致性數(shù)據(jù),操作復(fù)雜耗時(shí)。因?yàn)橹С侄鄷r(shí)態(tài)多版本XML,恢復(fù)數(shù)據(jù)庫(kù)的一致性要通過糾正過去的所有錯(cuò)誤和不一致性。文獻(xiàn)[8]對(duì)于時(shí)態(tài)RDF數(shù)據(jù)提出了新的框架,確定一個(gè)子類的一階一致性約束,利用調(diào)度理論有效的映射到約束圖來解決問題。這個(gè)方法優(yōu)于普通的近似啟發(fā)式算法,但是是對(duì)一個(gè)子類做出的約束,并不能更好的包含所有時(shí)態(tài)RDF圖,應(yīng)該一步推廣一致性約束。這篇文獻(xiàn)是針對(duì)于查詢中出現(xiàn)不確定性的結(jié)果進(jìn)一步做一致性檢測(cè)和恢復(fù),存儲(chǔ)的數(shù)據(jù)還有不一致性和不正確性。文獻(xiàn)[9]提出了時(shí)態(tài)XML的一致性要求,并提出了環(huán)路檢測(cè)來檢測(cè)和修復(fù)不一致性,算法思路比較嚴(yán)謹(jǐn)。但是考慮數(shù)據(jù)不一致性不全面,分類太簡(jiǎn)單,現(xiàn)實(shí)生活中的數(shù)據(jù)一定會(huì)更復(fù)雜。因?yàn)镽DF的特殊性,并不適用于時(shí)態(tài)RDF數(shù)據(jù)的一致性分析。

    本文是針對(duì)添加有效時(shí)間標(biāo)簽來擴(kuò)展的時(shí)態(tài)RDF數(shù)據(jù)模型,根據(jù)有效時(shí)間的現(xiàn)實(shí)意義分析時(shí)態(tài)RDF數(shù)據(jù)存在的不一致性,并對(duì)每一類的不一致性提出了修復(fù)的方法,針對(duì)執(zhí)行變化操作時(shí)產(chǎn)生的不一致性,進(jìn)行了預(yù)處理的研究,以保護(hù)時(shí)態(tài)RDF數(shù)據(jù)的一致性,并通過實(shí)驗(yàn)驗(yàn)證了可行性。

    1 時(shí)態(tài)RDF數(shù)據(jù)的不一致性修復(fù)

    盡管現(xiàn)在從語(yǔ)義網(wǎng)上提取信息的技術(shù)有了很大的進(jìn)步,但是產(chǎn)生的RDF知識(shí)庫(kù)仍然存在大量的噪音和與事實(shí)不一致的問題,需要添加一些額外的一致性約束。本節(jié)就是根據(jù)擴(kuò)展的有效時(shí)間的現(xiàn)實(shí)意義,分析時(shí)態(tài)RDF數(shù)據(jù)存在的不一致性,根據(jù)不同情況進(jìn)行了分類,并對(duì)存在的所有類型的不一致性提出修復(fù)算法。

    1.1 有效時(shí)間的設(shè)定

    本文研究的時(shí)態(tài)RDF模型是用時(shí)間標(biāo)簽來標(biāo)記RDF數(shù)據(jù)三元組,且表示有效時(shí)間。以下就是時(shí)態(tài)RDF模型的基本定理。

    定義1一個(gè)時(shí)態(tài)RDF數(shù)據(jù)的組成分為兩部分,時(shí)間標(biāo)簽和 RDF 三元組,用符號(hào)表示(s,p,o):[t].(s,p,o):[t1,t2]表示{(s,p,o):[t]|t1≤t≤t2}。

    其中SPO代表RDF三元組中的主體、謂詞和客體。t是一個(gè)自然數(shù),用來代表時(shí)間,表示在t時(shí)刻s的p屬性值為o是有效的。

    定義 2 時(shí)間區(qū)間[start,end]中,start+1≤end,單位時(shí)間設(shè)為1;

    為了表示時(shí)間上的連續(xù),即使使用秒數(shù)作為單位時(shí)間在現(xiàn)實(shí)中時(shí)間也是不連續(xù)的,為了下文的使用方便和自然,將單位時(shí)間設(shè)為1,t和t+1兩個(gè)時(shí)刻就表示是時(shí)間上的連續(xù)。

    1.2 三元組重復(fù)的不一致性修復(fù)

    主體、屬性、客體都是相同的,即RDF三元組是一樣的,表示為(s,p,o)[T1]和(s,p,o)[T2],其中T1和T2只要有重合的部分就是存在三元組重復(fù)不一致性。

    對(duì)于T1和T2間斷,可以解釋為在T1和T2時(shí)間段內(nèi)s的p屬性值為o,但是在T1和T2間隔的時(shí)間內(nèi)這個(gè)信息失效了,所以不存在不一致性。

    修復(fù)重復(fù)三元組不一致性,用R代表(s,p,o)[start,end])是一條時(shí)態(tài)RDF數(shù)據(jù)記錄,Ri表示第i條記錄,Ri+1就是下一條記錄。首先在時(shí)態(tài)RDF數(shù)據(jù)庫(kù)中的記錄中匹配(s,p,o)三元組,找到三元組完全一樣的時(shí)態(tài)RDF數(shù)據(jù)記錄,通過比較兩個(gè)時(shí)間區(qū)間的起始時(shí)間點(diǎn)和結(jié)束時(shí)間點(diǎn),計(jì)算出修改時(shí)間區(qū)間,對(duì)一條記錄的兩個(gè)時(shí)間點(diǎn)進(jìn)行修改,再刪除另外一條記錄。

    算法1 修復(fù)三元組重復(fù)的不一致性

    FixSameRDF(){

    (1)Group by SPO;

    (2)Foreach R have same SPO

    (3)gathe of T[start,end]

    (4)If T have superposition;

    (5)//時(shí)間完全重合,就刪除記錄

    (6)Then{

    (7)if R1.T incloded R2.T delete R2

    (8)else{//修改時(shí)間點(diǎn),使時(shí)間連續(xù)

    (9)R.end=start+1;

    (10)or R.start=end-1;}}}//T變連續(xù)

    1.3 生命區(qū)間的不一致性修復(fù)

    定義3(節(jié)點(diǎn)的生命區(qū)間lifespan)節(jié)點(diǎn)的生命區(qū)間是這個(gè)節(jié)點(diǎn)的所有入邊和出邊的有效時(shí)間的并集的最大集合。在只有(s,p,o)[start,end]一條數(shù)據(jù)的情況下,lf[start,end]就是節(jié)點(diǎn)s和節(jié)點(diǎn)o的生命區(qū)間。

    計(jì)算節(jié)點(diǎn)的生命區(qū)間要包含節(jié)點(diǎn)的所有出邊和入邊的有效時(shí)間。通過遍歷并計(jì)算所有邊的有效時(shí)間的并集的最大集合,也就是找到最早的開始點(diǎn)和最晚的結(jié)束點(diǎn)。

    算法2 計(jì)算節(jié)點(diǎn)的生命區(qū)間

    輸入:節(jié)點(diǎn)的URI(唯一性)

    輸出:節(jié)點(diǎn)的生命區(qū)間lf[start,end]

    Lifespan(URI){

    (1)Initialize lf[start,end]lf.atart=null,lf.end=null;

    (2)for each(s,p,o)[start,end]{

    (3)if(URI==s||URI==o){

    (4)if(lf.start==null)lf[start,end];

    (5)//lf取范圍大的時(shí)間點(diǎn)

    (6)Else{lf.start=MIN(lf.start,start);

    (7)lf.end=MAX(lf.end,end);}}

    (8)Return lf;}

    記錄的有效時(shí)間T超過S和O的生命區(qū)間就是存在生命區(qū)間的不一致性。

    只有s和o有效存在,s的p屬性值為o的信息才會(huì)有意義,否則就是與事實(shí)不一致。

    對(duì)于生命區(qū)間的不一致性修復(fù),需要修復(fù)所有不一致性出入邊的有效時(shí)間,首先在記錄中匹配s,找到節(jié)點(diǎn)所有相關(guān)記錄,再通過比較兩個(gè)時(shí)間區(qū)間的起始時(shí)間點(diǎn)和結(jié)束時(shí)間點(diǎn),計(jì)算出保持一致性的有效時(shí)間區(qū)間,對(duì)邊的記錄的兩個(gè)時(shí)間點(diǎn)進(jìn)行修改,或直接刪除這條出邊信息的記錄。

    算法3 修復(fù)生命區(qū)間的的不一致性

    FixLifespan(){

    (1)For each node(URI)n do

    (2)lf=lifespan(URI);

    (3)group by R.O gathe of T[start,end]

    (4)foreach T

    (5)if(lf and T have superposition)

    (6)//縮小記錄的時(shí)間區(qū)間,包含于節(jié)點(diǎn)的lf

    (7)then{R.start=lf,start||R.end=lf.end}

    (8)if(lf and T have no superposition)

    (9)//沒有重合就刪除記錄

    (10)then deled R;}

    1.4 發(fā)散性屬性的不一致性修復(fù)

    主體和屬性相同,不同或相同的客體,表示為(s,p,o1)[T1]和(s,p,o2)[T2],其中 T1 和 T2 有效時(shí)間有重疊就存在發(fā)散性屬性不一致。例如一個(gè)人的體重屬性在同一時(shí)刻的體重值就是唯一的。

    發(fā)散性屬性的不一致性修復(fù),需要對(duì)具有發(fā)散性p屬性的記錄進(jìn)行分類,按照s分為不同的記錄子集,重復(fù)的有效時(shí)間就縮小有效時(shí)間區(qū)間。需要修復(fù)所有節(jié)點(diǎn)的p屬性不一致性出邊。

    算法4 修復(fù)發(fā)散性屬性的不一致性

    CheckDivergent(p){

    (1)collection of R.p=p,{R.s}is grouped by different R.s

    (2)foreach{R.s}gathe of T[start,end]

    (3)if(T1 and T2 have superposition)

    (4)//縮小時(shí)間區(qū)間,使得有效時(shí)間連續(xù)

    (5)then {R2.start =R2.end -1 or R1.end=R2.start-1}

    (6)if(T1 included T2)

    (7)//完全重合就刪除記錄

    (8)then deled R2;}

    1.5 收斂性屬性的不一致性修復(fù)

    主體不同或相同,但是屬性和客體相同,表示為(s1,p,o)[T1]和(s2,p,o)[T2],其中 T1 和 T2 有效時(shí)間有重疊就是存在收斂性屬性不一致。例如手術(shù)室O1在同一時(shí)刻只能有一個(gè)病人在做手術(shù)。

    收斂性屬性的不一致性修復(fù),將包含p屬性的記錄按照O分為不同的記錄子集,重復(fù)的有效時(shí)間就縮小有效時(shí)間區(qū)間。

    算法5 修復(fù)收斂性屬性的不一致性

    CheckDivergent(p){

    (9)collection of R.p=p,{R.o}is grouped by different R.o

    (10)foreach{R.o}gathe of T[start,end]

    (11)if(T1 and T2 have superposition)

    (12)//縮小時(shí)間區(qū)間,使得有效時(shí)間連續(xù)

    (13)then{R2.start=R2.end-1 or R1.end=R2.start-1}

    (14)if(T1 included T2)

    (15)//完全重合就刪除記錄

    (16)then deled R2;}

    2 變化操作的不一致性預(yù)處理

    對(duì)于時(shí)態(tài)RDF數(shù)據(jù)的添加、修改和刪除都可能會(huì)造成上文中提出的不一致性問題,因此需要對(duì)插入操作、刪除操作和更新操作的時(shí)態(tài)RDF數(shù)據(jù)首先進(jìn)行檢測(cè)與分析,是否會(huì)造成4種類型的不一致性,如果存在不一致性問題就要通過修改新的時(shí)態(tài)RDF數(shù)據(jù)來進(jìn)行修復(fù),使得操作后的數(shù)據(jù)庫(kù)中的時(shí)態(tài)RDF始終保持一致性。

    2.1 插入操作

    插入一條新的時(shí)態(tài) RDF 數(shù)據(jù) (s,p,o)[start,end],考慮存在的不一致性類型,對(duì)不存在的s、p、o,在操作執(zhí)行后還要建立新的URI,節(jié)點(diǎn)o和節(jié)點(diǎn)p的生命區(qū)間也要計(jì)算添加。

    第一步:當(dāng)s和o同時(shí)已經(jīng)在時(shí)態(tài)數(shù)據(jù)庫(kù)中存在,需要對(duì)兩個(gè)節(jié)點(diǎn)的生命區(qū)間的交集作為生命區(qū)間lf進(jìn)行生命區(qū)間的不一致性檢測(cè)和修復(fù);只有一個(gè)節(jié)點(diǎn)存在,對(duì)這個(gè)節(jié)點(diǎn)的生命區(qū)間進(jìn)行生命區(qū)間的不一致性檢測(cè),執(zhí)行操作,設(shè)置另一節(jié)點(diǎn)的生命區(qū)間為最終的有效時(shí)間;兩個(gè)節(jié)點(diǎn)都不存在,執(zhí)行操作,創(chuàng)建兩個(gè)節(jié)點(diǎn)的URI,并設(shè)置兩個(gè)節(jié)點(diǎn)的生命區(qū)間為[start,end]。

    圖1 生命區(qū)間和插入數(shù)據(jù)的有效時(shí)間關(guān)系

    如圖1所示,實(shí)現(xiàn)表示生命區(qū)間,虛線是插入數(shù)據(jù)的有效時(shí)間[start,end]。情況 1:在[start,lf.start-1]和[lf,end+1,end]的兩段時(shí)間,節(jié)點(diǎn)不存在,存在生命區(qū)間的不一致性,修改插入數(shù)據(jù)的有效時(shí)間為[lf.start,lf.end];2:[start,end]與 lf有間隔或連續(xù),不一致性的時(shí)間為[start,end],不執(zhí)行插入操作;3:生命區(qū)間一致性;4:[lf.end+1,end]時(shí)間內(nèi),存在不一致性,修改插入數(shù)據(jù)的有效時(shí)間為相交的時(shí)間[start,lf.end]。

    第二步,當(dāng)p和s存在且p是發(fā)散性屬性,需要檢測(cè)修復(fù)s的p發(fā)散性屬性不一致性,如果插入操作執(zhí)行,但是o不存在,o的生命區(qū)間為修改后的數(shù)據(jù)的有效時(shí)間。

    圖2 發(fā)散性屬性出邊的有效時(shí)間關(guān)系

    如圖2實(shí)線為s的p屬性的有效時(shí)間,虛線是要插入數(shù)據(jù)的有效時(shí)間。情況1:在[start,t2]和[t3,end]有兩個(gè)p屬性值,存在發(fā)散性屬性的不一致性,但[t2+1,t3+1]有間隔,將插入的數(shù)據(jù)的有效時(shí)間修改為[t2+1,t3+1];2:p 屬性一致性;3:在[start,end]內(nèi)s有兩個(gè)p屬性值,存在不一致性,不執(zhí)行插入操作。

    第三步,當(dāng)p和o存在且p是發(fā)散性屬性,需要對(duì)o進(jìn)行p屬性的收斂性屬性不一致性檢測(cè)和修復(fù),如果插入操作執(zhí)行,s不存在,s的生命區(qū)間為修改后數(shù)據(jù)的有效時(shí)間。

    找到p屬性值是o的所有記錄的有效時(shí)間,與圖2的情況相同,情況1:存在收斂性屬性不一致性,將插入的數(shù)據(jù)的有效時(shí)間修改為[t2+1,t3+1];2:p 屬性一致性;3:[start,end]內(nèi)都存在 p 屬性的不一致性,不執(zhí)行插入操作。

    第四步,當(dāng)spo都存在時(shí),進(jìn)行三元組重復(fù)的不一致性檢測(cè)與修復(fù)。

    圖3 (s,p,o)所有的有效時(shí)間關(guān)系

    如圖3 所示,實(shí)線是(s,p,o)的所有有效時(shí)間,虛線是插入的有效時(shí)間。情況1:時(shí)間的重疊存在三元組重復(fù)的不一致性,修改插入數(shù)據(jù)有效時(shí)間為[t1,t4],并刪除記錄(s,p,o)[t1,t2]和(s,p,o)[t3,t4];2:不存在三元組重復(fù)的不一致性;3:不一致性時(shí)間區(qū)間為[start,end],不執(zhí)行插入操作;4:[start,end]包含[t7,t8],只需刪除記錄(s,p,o)[t7,t8]。

    分情況按照上述的步驟進(jìn)行所有類型的不一致性檢測(cè)和修復(fù),如果執(zhí)行插入操作,就將spo中不存在的創(chuàng)建URI,并對(duì)節(jié)點(diǎn)添加生命區(qū)間。

    2.2 刪除操作

    刪除一條時(shí)態(tài) RDF 數(shù)據(jù)(s,p,o)[start,end],當(dāng)spo中的一個(gè)或多個(gè)不存在時(shí),就不執(zhí)行刪除操作。

    圖4 相同三元組的有效時(shí)間的關(guān)系

    如圖4 所示,實(shí)線是(s,p,o)的所有有效時(shí)間,虛線是要?jiǎng)h除數(shù)據(jù)的有效時(shí)間。情況1:[start,end]包含[t1,t2],或者相等,直接刪除(s,p,o)[t1,t2]記錄;2:(s,p,o)在[t1,start-1]的時(shí)間內(nèi)有效,修改記錄(s,p,o)有效時(shí)間為[t1,start-1];3:(s,p,o)在[start,end]的時(shí)間內(nèi)無效,刪除操作不用執(zhí)行;4:(s,p,o)在[t3,start-1]和[end+1,t4]時(shí)間內(nèi)是有效的,修改記錄(s,p,o)有效時(shí)間為[t3,start-1],再插入一條記錄(s,p,o)[end+1,t4]。

    (s,p,o)的有效時(shí)間的縮小并不會(huì)造成任何的不一致性,要對(duì)相應(yīng)的記錄做修改,而不是直接匹配一模一樣的數(shù)據(jù)記錄進(jìn)行刪除。

    2.3 更新操作

    更新操作可以分為兩部分,首先是刪除原有的數(shù)據(jù),再插入新的數(shù)據(jù)。

    更 新(s,p,o)[start,end]為(s’,p’,o’)[start’,end’]。首先找到(s,p,o)[start,end]所對(duì)應(yīng)的記錄。情況與圖4 一樣,情況 1:[start,end]包含[t1,t2],或者相等,最后要?jiǎng)h除的記錄就是(s,p,o)[t1,t2];2:修改記錄(s,p,o)[t1,t2]為[t1,start-1];3:不執(zhí)行更新操作;4:修改記錄(s,p,o)[t3,t4]為[t3,start-1],再插入一條記錄(s,p,o)[end+1,t4]。

    找到相應(yīng)的記錄后,插入(s’,p’,o’)[start’,end’],對(duì)這條新時(shí)態(tài)RDF數(shù)據(jù)也要進(jìn)行4種類型的不一致性的分析,如果不執(zhí)行插入操作,說明存在不一致性,不執(zhí)行更新操作,在之前找到相應(yīng)記錄的分析作廢,也就不用修改記錄了。

    3 實(shí)驗(yàn)結(jié)果

    本節(jié)是對(duì)上文中提出的時(shí)態(tài)RDF數(shù)據(jù)的不一致修復(fù)和變化操作的不一致性預(yù)處理進(jìn)行了實(shí)驗(yàn)驗(yàn)證。在LUBM(Lehigh University Benchmark)標(biāo)準(zhǔn)數(shù)據(jù)集的基礎(chǔ)上隨機(jī)生成有效時(shí)間添加時(shí)間標(biāo)簽,在對(duì)不同數(shù)量的數(shù)據(jù)集上分別進(jìn)行了實(shí)驗(yàn),并進(jìn)行對(duì)比和說明,實(shí)驗(yàn)環(huán)境如表1所示。

    表1 實(shí)驗(yàn)環(huán)境

    首先檢測(cè)500條時(shí)態(tài)RDF數(shù)據(jù)的不一致性,首次計(jì)算節(jié)點(diǎn)的生命區(qū)間。左邊就是存在不一致性數(shù)據(jù),右邊是修改后的一致性數(shù)據(jù)。

    圖5 時(shí)態(tài)RDF數(shù)據(jù)存在的不一致性

    下圖是逐漸增加數(shù)據(jù)且修改后產(chǎn)生的不一致性的折線圖:

    圖6 不同數(shù)量時(shí)態(tài)RDF數(shù)據(jù)存在的不一致

    每增加1000條時(shí)態(tài)RDF數(shù)據(jù),產(chǎn)生的每一種不一致性是在逐漸增加的。生命區(qū)間的不一致性產(chǎn)生的數(shù)量最多是因?yàn)楣?jié)點(diǎn)的生命區(qū)間是由500條時(shí)態(tài)數(shù)據(jù)產(chǎn)生,后續(xù)的有效時(shí)間隨機(jī)產(chǎn)生,超過生命區(qū)間可能性很高。

    對(duì)于變化操作的預(yù)處理實(shí)驗(yàn)采用5000條一致性的時(shí)態(tài)RDF數(shù)據(jù)的數(shù)據(jù)集。

    圖7是插入的500條數(shù)據(jù)中存在的不一致性分布情況,白色的柱狀圖表示可以修復(fù)的不一致性,插入修改后數(shù)據(jù);黑色的柱狀圖是無法修復(fù)的不一致性,只能放棄執(zhí)行插入。

    圖7 插入500條數(shù)據(jù)存在的不一致性

    圖8是刪除300條數(shù)據(jù)造成不一致性的修復(fù)情況,有213條數(shù)據(jù)不能直接刪除,有176條數(shù)據(jù)不一致性修復(fù)后刪除,有37條數(shù)據(jù)找不到對(duì)應(yīng)的記錄,不執(zhí)行刪除操作。

    圖9是更新150條數(shù)據(jù)存在不一致性的情況,沒有對(duì)應(yīng)刪除的數(shù)據(jù)有26條,不更新,有125條更新后的數(shù)據(jù)存在不一致性,白色的柱狀圖表示有90條數(shù)據(jù)修復(fù)后更新,35條數(shù)據(jù)不執(zhí)行插入操作。

    圖9 更新操作的不一致性情況

    4 結(jié)束語(yǔ)

    針對(duì)支持有效時(shí)間的時(shí)態(tài)RDF數(shù)據(jù)進(jìn)行了在有效時(shí)間上的不一致性研究和分析,分別是三元組重復(fù)的不一致性、生命區(qū)間的不一致性、發(fā)散性和收斂性屬性的不一致性,并對(duì)4種類型的不一致進(jìn)行了修復(fù),對(duì)于更新的時(shí)態(tài)RDF數(shù)據(jù),針對(duì)每種變化操作,即插入、刪除和更新,分析了每種操作的不一致性預(yù)處理方法。

    未來工作:1.時(shí)態(tài)RDF數(shù)據(jù)會(huì)時(shí)常更新,修復(fù)不一致性消耗太大,修性算法的效率還有待提高。2.對(duì)于支持有效時(shí)間的時(shí)態(tài)RDF數(shù)據(jù)之間的推理、蘊(yùn)含等內(nèi)置函數(shù)和數(shù)據(jù)間關(guān)系和結(jié)構(gòu)都沒有討論和研究。3.對(duì)有效時(shí)間的確定與驗(yàn)證沒有進(jìn)行討論,對(duì)于不確定時(shí)間的處理也需要另行研究。

    猜你喜歡
    三元組時(shí)態(tài)一致性
    基于語(yǔ)義增強(qiáng)雙編碼器的方面情感三元組提取
    軟件工程(2024年12期)2024-12-28 00:00:00
    基于帶噪聲數(shù)據(jù)集的強(qiáng)魯棒性隱含三元組質(zhì)檢算法*
    關(guān)注減污降碳協(xié)同的一致性和整體性
    公民與法治(2022年5期)2022-07-29 00:47:28
    注重教、學(xué)、評(píng)一致性 提高一輪復(fù)習(xí)效率
    IOl-master 700和Pentacam測(cè)量Kappa角一致性分析
    超高清的完成時(shí)態(tài)即將到來 探討8K超高清系統(tǒng)構(gòu)建難點(diǎn)
    過去完成時(shí)態(tài)的判定依據(jù)
    關(guān)于余撓三元組的periodic-模
    基于事件觸發(fā)的多智能體輸入飽和一致性控制
    三元組輻射場(chǎng)的建模與仿真
    沙洋县| 磴口县| 凤翔县| 阜新市| 特克斯县| 车致| 西乌珠穆沁旗| 上犹县| 潮安县| 保定市| 修文县| 策勒县| 西城区| 利辛县| 西华县| 亚东县| 九龙坡区| 东兴市| 南通市| 灵石县| 银川市| 个旧市| 资源县| 徐闻县| 鄂伦春自治旗| 化德县| 英山县| 抚宁县| 桂平市| 阿瓦提县| 白城市| 兴业县| 阜城县| 乐平市| 双流县| 连云港市| 凭祥市| 望都县| 太湖县| 河南省| 承德县|