張忠林,周曉俠
(蘭州交通大學(xué)電子與信息工程學(xué)院,甘肅蘭州730070)
時(shí)間序列挖掘是指挖掘同一個(gè)時(shí)間序列內(nèi)或者多個(gè)時(shí)間序列之間的依賴關(guān)系[1]。近年來(lái),挖掘價(jià)格時(shí)間序列將來(lái)的變化趨勢(shì)已經(jīng)成為熱點(diǎn)[2]。Agrawal等首次提出了關(guān)于時(shí)態(tài)關(guān)聯(lián)規(guī)則的挖掘,并給出了序列模式的概念[3]。為了描述在關(guān)聯(lián)規(guī)則中時(shí)間的變化特點(diǎn),榮剛等提出動(dòng)態(tài)關(guān)聯(lián)規(guī)則的定義[4];沈斌等對(duì)其進(jìn)行了改進(jìn)[5],能更好地反映規(guī)則隨時(shí)間變化的動(dòng)態(tài)信息。對(duì)時(shí)間序列進(jìn)行聚類能有效的提高挖掘關(guān)聯(lián)規(guī)則的效率[6,7],通過(guò)挖掘序列的趨勢(shì)變化,可挖掘出更加實(shí)用的規(guī)則[8]。本文目的是如何在一個(gè)時(shí)間序列內(nèi)發(fā)現(xiàn)類似“A發(fā)生后,B在時(shí)間T內(nèi)緊跟著發(fā)生”這樣的規(guī)則,或者是在多個(gè)時(shí)間序列中發(fā)現(xiàn)類似“A在時(shí)間序列S中發(fā)生后,B在時(shí)間序列Z中,在時(shí)間T內(nèi)緊跟著發(fā)生”這樣的規(guī)則,其中A,B是時(shí)間序列S或Z中的某種變化趨勢(shì)。例如,在一段時(shí)間內(nèi),移動(dòng)公司的通話撥入量達(dá)到高峰前,總會(huì)伴隨一個(gè)低谷的出現(xiàn)。與以往的算法[9]不同之處是:根據(jù)時(shí)間序列隨著時(shí)間的變化將呈現(xiàn)不同的變化趨勢(shì),且在特定時(shí)間段內(nèi)某種趨勢(shì)在時(shí)間序列中頻繁發(fā)生,挖掘時(shí)序關(guān)聯(lián)規(guī)則。
考慮時(shí)間序列的時(shí)間有序性,本文利用滑動(dòng)窗口機(jī)制對(duì)時(shí)間序列進(jìn)行初步離散。再利用聚類算法K-Means對(duì)離散得到的子序列進(jìn)行趨勢(shì)聚類。并對(duì)相關(guān)參數(shù)作分析。
假設(shè)存在時(shí)間序列S和寬度為w的滑動(dòng)窗口,S={x1,x2,x3,…,xn}?,F(xiàn)將S劃分為N個(gè)長(zhǎng)度為w的子序列Si,其中,N=n-w+1,Si={xi,…,xi+w-1}。每劃分得到一個(gè)子序列,滑動(dòng)窗口向前滑動(dòng)w個(gè)位置,則依次得到子序列S0,S1,S2,…,Sn-w。離散后得到的子序列集合記為W(S),W(S)={[ID,Si]|0≤ID<n-w+1,0≤i<n-w+1},其中ID表示子序列編號(hào)。
定義1 形狀:子序列的變化趨勢(shì)被看作子序列所具有的一種形狀。
例如:假設(shè)存在長(zhǎng)度為4的子序列Si和Sj,Si的形狀為先上升,再下降,后又上升,Sj的形狀為先上升,再下降,后又持平。
聚類分析是分析時(shí)間序列的一種常用方法,現(xiàn)有的聚類算法多是根據(jù)相似性對(duì)事物進(jìn)行聚類。最佳聚類結(jié)果應(yīng)該是類內(nèi)距小,內(nèi)間距大。
離散后的子序列Si具有不同或相同的形狀,因此可利用K-Means根據(jù)其形狀相似性將W(S)中的所有子序列分為k個(gè)類,將具有相同形狀的子序列分為一類,即C0,C1,C2,…,Ck-1。將聚類得到的k個(gè)類用k個(gè)布爾變量標(biāo)志,則可得到趨勢(shì)序列D(S),D(S)={[ID,ai]|0≤ID<nw+1,0≤i<k},其中,ID為子序列編號(hào),ai為布爾變量,即編號(hào)為ID的子序列屬于標(biāo)志名為ai的類。
在聚類的過(guò)程具有相同形狀的子序列Si和Sj,因其取值區(qū)間相差太大而被誤分在不同的類中。因此,在對(duì)子序列進(jìn)行聚類前需要對(duì)其進(jìn)行標(biāo)準(zhǔn)化,使得具有相同形狀的子序列處在近似的取值區(qū)間。存在子序列Si={xi,…,xi+w-1},可采用以下兩種方法對(duì)xi進(jìn)行標(biāo)準(zhǔn)化:
(1)均值標(biāo)準(zhǔn)化
(2)方差標(biāo)準(zhǔn)化
數(shù)據(jù)離散的過(guò)程中主要涉及到兩個(gè)參數(shù),即w(滑動(dòng)窗口的寬度)和k(聚類數(shù))。滑動(dòng)窗口寬度w值的選擇多是根據(jù)用戶需求以及預(yù)處理數(shù)據(jù)的條件,可采用多粒度時(shí)間進(jìn)行測(cè)試。聚類數(shù)k的值不能太大,否則將產(chǎn)生太多的形狀,從而生成過(guò)多的規(guī)則。k值也不能太小,否則一個(gè)形狀與另一個(gè)形狀相隔太遠(yuǎn)。可利用用戶對(duì)挖掘出的規(guī)則的興趣度進(jìn)一步確定w和k的值。
Apriori算法是基于事物數(shù)據(jù)庫(kù)進(jìn)行規(guī)則挖掘,每個(gè)事物中的元素按字典順序排列,這種排列破壞了最初的時(shí)態(tài)關(guān)系。因此,為了挖掘出更有效的規(guī)則,首先,在趨勢(shì)序列中尋找頻繁特征,其次,利用Apriori算法生成頻繁高項(xiàng)集,最后發(fā)現(xiàn)時(shí)序關(guān)聯(lián)規(guī)則。
存在趨勢(shì)序列D(S)={[ID,ai]|0≤ID<n-w+1,0≤i<k}。本文的目的是發(fā)現(xiàn)類似這樣的規(guī)則,即在一個(gè)時(shí)間序列S中,A發(fā)生后,在時(shí)間T內(nèi),B緊跟著發(fā)生,其中A,B∈D(S)。
在關(guān)聯(lián)規(guī)則的基礎(chǔ)上,對(duì)其相關(guān)定義進(jìn)行補(bǔ)充和重新定義,具體定義如下:
定義2 A的絕對(duì)支持度:A在趨勢(shì)序列D(S)中出現(xiàn)的次數(shù)F(A),即
定義3 A的相對(duì)支持度
其中,0≤i<|D(S)|-|AB|。
隨著時(shí)間序列數(shù)據(jù)庫(kù)的數(shù)據(jù)增多,D(S)的長(zhǎng)度變大,將會(huì)產(chǎn)生越來(lái)越多的關(guān)聯(lián)規(guī)則。恰當(dāng)?shù)淖钚≈С侄群妥钚≈眯哦葘⒛軌蛴行У販p少冗余規(guī)則的生成,但是仍然需要辦法將用戶感興趣的規(guī)則和不感興趣的規(guī)則進(jìn)行區(qū)分。因此本文采用Smyth提出的J-measure準(zhǔn)則對(duì)滿足支持度閾值和置信度閾值的規(guī)則按J值得大小進(jìn)行排序,J值較大的規(guī)則將是用戶更感興趣的規(guī)則。設(shè)規(guī)則的J值為J(BT;A)式中:P(A)——形狀A(yù)在D(S)中出現(xiàn)的概率。p(BT)——B在D(S)中出現(xiàn)的概率。p(BT|A)——在D(S)中A發(fā)生后,間隔小于T時(shí)間后B發(fā)生的概率。
特定時(shí)間內(nèi)的規(guī)則不僅可以存在一個(gè)時(shí)間序列中,也可以存在多個(gè)時(shí)間序列中,即時(shí)間序列S中A出現(xiàn)后,在時(shí)間T內(nèi),時(shí)間序列Z中B緊跟著出現(xiàn),該規(guī)則記為B(A∈D(S),B∈D(Z))?;蛘呤茿1,A2,A3,…,Ak在時(shí)間V內(nèi)發(fā)生,緊跟著B在時(shí)間T內(nèi)發(fā)生,該規(guī)則記為A1,A2,…,其中(A1,A2,A3,…,Ak∈D(S),B∈D(Z))。
根據(jù)時(shí)間序列的相關(guān)定義得到多時(shí)間序列中時(shí)序關(guān)聯(lián)規(guī)則的支持度和置信度的表現(xiàn)形式如下
推論1 A1,的絕對(duì)支持度
推論2 A1,的相對(duì)支持度
推論3 A1,的置信度
多個(gè)時(shí)間序列中挖掘特定時(shí)間內(nèi)的規(guī)則也可利用式(9)對(duì)規(guī)則進(jìn)行排序,從而得到用戶感興趣的規(guī)則。規(guī)則A1,的J值為
本文提出的基于滑動(dòng)窗口聚類的時(shí)序關(guān)聯(lián)規(guī)則挖掘方法可用于一個(gè)時(shí)間序列或多個(gè)時(shí)間序列,其算法描述如下。
(1)時(shí)間序列算法描述
輸入:w,k,S,min_sup,min-conf,T,min_J
//輸入滑動(dòng)窗口寬度w,聚類數(shù)k,時(shí)間序列
//S,最小支持度min_sup,最小置信度
//min-conf,最小J值min_J,預(yù)設(shè)時(shí)間段//T
輸出:Rules
1)all_SubSequence=Generate_SubSequence(S,w);
//利用滑動(dòng)窗口初步離散化S,all_SubSequence
//存儲(chǔ)所有的子序列
2)W(S)=Normal_SubSequence(all_SubSequence,w);
//利用式(1)對(duì)all_SubSequence進(jìn)行標(biāo)準(zhǔn)化,結(jié)//果存儲(chǔ)在W(S)
3)Num=W(S).Length;//Num為子序列的數(shù)目
4)K-Means(k,W(S));//調(diào)用K-Means算法聚類得//到C0,C1,C2,…,Ck-1
5)for j=0 to k-1
Cj→j;//利用布爾變量j=0,1,2,…,k-1
//標(biāo)志每個(gè)類Cj
6)for i=0 to n-w
for j=0 to k-1
if(W(S)i∈Cj))//判斷每個(gè)子序列的形狀
then D(S)i=[i,j];//生成趨勢(shì)序列
7)FrequenctOneSets=Generate_FrequentOne(D(S));
//利用定義2產(chǎn)生頻繁特征
8)Frequenct LowSets=FrequenctOneSets;
9)GenerateHighFrequenct(Frequenct LowSets,T)
//生成頻繁高項(xiàng)集
10)If(supA∪B≥min_sup and confA∪B≥min_conf)
//A,B∈D(S),supA∪B為A∪B的支持度,confA∪B
//為A∪B的置信度
11)for each rule riin R do
Jri=J(BT;A);//利用J-measure準(zhǔn)則求J值
12)If(Jri≥min_J)
insert riinto Rules;
13)return Rules;
(2)多時(shí)間序列挖掘算法描述如下:
1)利用本文提出的算法分別挖掘出時(shí)間序列S和時(shí)間序列Z的頻繁項(xiàng)集。
時(shí)間序列S的頻繁1項(xiàng)集I(S)1={Ai},(0≤i<k,Ai∈D(S)),頻繁2項(xiàng)集I(S)2={Ai×Aj},(0≤i<k,i<j<k,Ai,Aj∈D(S)),頻繁3項(xiàng)集I(S)3={Ai×Aj×Am},(0≤i<k,i<j<k,j<m<k,Ai,Aj,Am∈D(S)),以及其它高頻繁項(xiàng)集。時(shí)間序列Z的頻繁1項(xiàng)集為I(Z)1={Bi},(0≤i<k,Bi∈D(Z))。
2)將時(shí)間序列S的頻繁項(xiàng)集與時(shí)間序列Z的頻繁1項(xiàng)集進(jìn)行連接,即I(S)i×I(Z)1,(1≤i≤n-w+1)。若I(S)i×I(Z)1的支持度大于預(yù)設(shè)的最小支持度閾值,則得到關(guān)于序列S和序列Z的高頻繁項(xiàng)集。剩余工作類似于一般時(shí)間序列規(guī)則挖掘。
本文實(shí)驗(yàn)用的數(shù)據(jù)來(lái)源于文獻(xiàn)[10]中的示例數(shù)據(jù)。分別是上海(SH)300天內(nèi)每天的綜指變化序列,以及深圳(SZ)300天內(nèi)每天的成指變化序列。則有序列SH和SZ,其長(zhǎng)度均為300。
實(shí)驗(yàn)?zāi)康?首先,利用本文所提出的算法針對(duì)序列SH發(fā)現(xiàn)用戶感興趣的規(guī)則,并對(duì)規(guī)則進(jìn)行分析。其次,當(dāng)算法中的參數(shù)發(fā)生變化時(shí),分析挖掘結(jié)果。最后,利用本文提出的算法針對(duì)序列SH和序列SZ挖掘多時(shí)間序列中特定時(shí)間段內(nèi)的規(guī)則。
設(shè)w=10,k=7,T=20,最小支持度為0.03,最小置信度為0.4,利用本文提出的算法進(jìn)行規(guī)則挖掘。
(1)利用滑動(dòng)窗口機(jī)制對(duì)序列SH(記為S)初步離散后,再標(biāo)準(zhǔn)化得到序列W(S)={[ID,Si]|0≤i<n-w+1}。
(2)利用K-Means聚類方法對(duì)W(S)進(jìn)行聚類,得到7種聚類結(jié)果,C0,C1,C2,C3,C4,C5,C6,即將序列的變化趨勢(shì)分為7種形狀。
(3)利用布爾變量“0”,“1”,“2”,“3”,“4”,“5”,“6”標(biāo)志每一種形狀,即“0”代表C0類形狀,“1”代表C1類形狀等。將W(S)中的子序列與其所屬形狀相對(duì)應(yīng),得到趨勢(shì)序列D(S),D(S)={i,j},其中i為序列編號(hào),j為布爾變量。D(S)={[0,3],[1,3],[2,6],[3,6],[4,1],[5,1],[6,1],[7,1],[8,1],[9,6],[10,6],[11,0],[12,0],[13,0],[14,0],[15,0],[16,0],[17,0],[18,2],[19,2],[20,1],[21,1],[22,4],[23,4],[24,3],[25,3],[26,3],[27,3],[28,3],[29,3],[30,3],[31,3],[32,3],[33,3],[34,3],[35,3],[36,1],[37,6],[38,6],[39,6],[40,6],[41,6],[42,6],[43,0],[44,0],[45,0],[46,0],[47,0],[48,0],[49,0],[50,0],[51,2],[52,2],[53,2],[54,1],[55,1],[56,1],[57,6],[58,6],[59,6],[60,6],[61,0],[62,0],[63,0],[64,0],[65,2],[66,1],[67,4],[68,4],[69,4],[70,5],[71,5],[72,5],[73,5],[74,5],[75,5],[76,3],[77,3],[78,6],[79,0],[80,0],[81,2],[82,2],[83,2],[84,1],[85,6],[86,1],[87,0],[88,0],[89,0],[90,2],[91,1],[92,4],[93,4],[94,3],[95,3],[96,3],[100,3],[101,3],[102,3],[103,4],[104,4],[105,4],[106,3],[107,3],[108,6],[109,0],[110,0],[111,0],[112,2],[113,2],[114,2],[115,1],[116,4],[117,4],[118,3],[119,3],[120,3],[121,3],[123,6],[124,0],[125,0],[126,0],[127,0],[128,0],[129,0],[130,2],[131,4],[132,4],[133,4],[134,4],[135,3],[136,3],[137,3],[138,6],[139,0],[140,0],[141,0],[142,0],[143,0],[144,0],[145,0],[146,0],[147,0],[148,0],[149,2],[150,2],[151,2],[152,2],[153,0],[154,0],[155,0],[156,0],[157,0],[158,0],[159,1],[160,1],[161,4],[162,3],[163,3],[164,6],[165,0],[166,6],[167,6],[168,2],[169,0],[170,0],[171,0],[172,0],[173,0],[174,1],[175,1],[176,1],[177,1],[178,1],[179,6],[180,6],[181,6],[182,6],[190,0],[191,0],[192,1],[193,1],[194,1],[195,1],[196,6],[197,6],[198,6],[199,6],[200,1],[201,1],[202,1],[203,1],[204,1],[205,6],[206,0],[207,0],[208,0],[209,2],[210,2],[211,2],[212,2],[213,1],[214,4],[215,4],[216,5],[217,5],[218,5],[219,3],[220,3],[221,6],[222,0],[223,2],[224,2],[225,2],[226,1],[227,4],[228,3],[229,4],[230,4],[231,4],[232,5],[233,5],[234,5],[235,5],[236,5],[237,3],[238,3],[239,6],[240,0],[241,2],[242,1],[243,4],[244,4],[245,4],[246,3],[247,3],[248,3],[249,3],[250,1],[251,6],[252,6],[253,0],[254,0],[255,0],[256,2],[257,2],[258,4],[259,4],[260,4],[261,5],[262,5],[263,4],[264,4],[265,3],[267,3],[268,3],[269,6],[270,6],[271,4],[272,4],[273,2],[274,4],[275,4],[276,4],[277,4],[278,3],[279,3],[280,3],[281,6],[282,0],[283,0],[284,0],[285,0],[286,6],[287,6],[288,2],[289,2]}。
(4)對(duì)D(S)進(jìn)行規(guī)則挖掘。挖掘得到的規(guī)則輸出形式為:[支持度,置信度,J]。t的含義是:A發(fā)生后,B相隔t-1(t≤T)天發(fā)生。生成規(guī)則如下:
當(dāng)t=3時(shí),有規(guī)則:
02[0.0395,0.3538,0.0496]
24[0.0206,0.4138,0.0249]
45[0.0223,0.3514,0.0286]
當(dāng)t=4時(shí),有規(guī)則:
16[0.0258,0.3750,0.0284]
24[0.0206,0.4138,0.0249]
當(dāng)t=13時(shí),有規(guī)則:
23[0.0189,0.3793,0.0146]
當(dāng)t=18時(shí),有規(guī)則:
24[0.0189,0.3793,0.0210]
當(dāng)t=19時(shí),有規(guī)則:
24[0.0206,0.4138,0.0249]
(5)按J值對(duì)規(guī)則進(jìn)行排序。根據(jù)J-measure準(zhǔn)則,J值越大則其忠實(shí)度越高,更有可能是用戶感興趣的規(guī)則。因此,認(rèn)為規(guī)則(t=3)最有可能為用戶感興趣的。
(6)遍歷序列D(S),查詢形狀“0”和“2”在3天時(shí)間內(nèi)第一次相繼發(fā)生時(shí)對(duì)應(yīng)的序列編號(hào),得到規(guī)則S19(t=3),即若模式S16發(fā)生后,最多在20天內(nèi)(實(shí)際為3天)模式S19緊跟著發(fā)生。如圖1(a)所示,上海綜指在持續(xù)了約10天的銳減之后(模式S16),在20天內(nèi),上海綜指肯定將會(huì)出現(xiàn)先持續(xù)下降一周再上升的概率為0.0395(模式S19)。表1列出了在w,k取不同值的情況下,具有較高J值的規(guī)則及其支持度、置信度和J值等。
如表1所示,當(dāng)J值均較高,聚類數(shù)發(fā)生微小變化時(shí),滑動(dòng)窗口的寬度w=10和w=20的置信度小于w=13和w=16置信度。由此說(shuō)明,滑動(dòng)窗口的寬度不能太小,否則趨勢(shì)特征過(guò)于單調(diào);同時(shí),滑動(dòng)窗口的寬度也不能太大,否則容易忽略更有意義的規(guī)則。因此,w的選擇應(yīng)根據(jù)具體需求以及已挖掘到的規(guī)則的J值、置信度和支持度。
圖1 參數(shù)w,k取不同值時(shí)的規(guī)則變化趨勢(shì)
通過(guò)時(shí)間序列SH(記為S)和時(shí)間序列SZ(記為Z)進(jìn)行多時(shí)間序列規(guī)則挖掘。
當(dāng)w=10,k=7,T=20,V=10,最小支持度為0.03,最小置信度為0.4時(shí)挖掘出的J值較高的規(guī)則為支持度為0.0344,置信度為0.3636,J值為0.0102。圖2為的規(guī)則趨勢(shì)圖。
如圖2所示,上海綜指出現(xiàn)持續(xù)10天的下降之后(模式S16),緊跟著在10天內(nèi),(模式S19)出現(xiàn)先下降一周后上升的趨勢(shì)。相應(yīng)的,深圳成指在上海成指發(fā)生了如上變化后,在20天內(nèi)(模式Z13)肯定會(huì)出現(xiàn)先緩慢下降到出現(xiàn)明顯的下降趨勢(shì)的概率是0.0344。
圖2 w=10,k=7,(S16,S19)的變化趨勢(shì)
實(shí)驗(yàn)結(jié)果表明:①根據(jù)用戶的要求,對(duì)相關(guān)參數(shù)進(jìn)行彈性設(shè)置可挖掘出用戶感興趣的規(guī)則;②參數(shù)w,k發(fā)生局部變化時(shí)對(duì)挖掘出的規(guī)則影響不大;③挖掘出的規(guī)則可用于做短期的預(yù)測(cè)或決策;④隨著w的變化,可預(yù)測(cè)長(zhǎng)度隨之伸縮。傳統(tǒng)的時(shí)間序列挖掘算法主要針對(duì)多個(gè)時(shí)間序列中特定時(shí)間段內(nèi)單個(gè)趨勢(shì)狀態(tài)進(jìn)行挖掘,對(duì)于規(guī)則的趨勢(shì)變化反映不全面,而本文提出的算法可以反應(yīng)多個(gè)狀態(tài)。文獻(xiàn)[9]所提算法基于事物數(shù)據(jù)庫(kù)挖掘,每個(gè)事物的元素按字典順序,雖能提高整體的挖掘效率,但是破壞了基礎(chǔ)的時(shí)態(tài)關(guān)系,而本文中提出的算法在進(jìn)行規(guī)則挖掘前,去除了關(guān)聯(lián)規(guī)則挖掘方法基于事物數(shù)據(jù)庫(kù)挖掘的約束。
本文給出了特定時(shí)間段內(nèi)時(shí)序關(guān)聯(lián)規(guī)則的相關(guān)定義,并提出了基于滑動(dòng)窗口聚類的時(shí)序關(guān)聯(lián)規(guī)則挖掘方法。最后通過(guò)實(shí)驗(yàn)證明該方法不僅能使用戶發(fā)現(xiàn)更有價(jià)值的規(guī)則,且能反映規(guī)則在局部時(shí)間內(nèi)的變化趨勢(shì),從而指導(dǎo)用戶做短期的預(yù)測(cè)或決策。例如,利用該方法挖掘股票、氣象等特定時(shí)間段內(nèi)的變化規(guī)則。
本文仍存在一些不足,需要進(jìn)一步的研究。本文根據(jù)預(yù)設(shè)的支持度閾值和置信度閾值進(jìn)行規(guī)則篩選,可能會(huì)忽略一些潛在的規(guī)則。類似規(guī)則因其支持度和置信度在全局上小于預(yù)設(shè)的支持度閾值和置信度閾值而被忽略,但其在局部時(shí)間上具有一定的顯著性。對(duì)于這些規(guī)則的挖掘仍需進(jìn)一步的研究。
[1]Pradhan G N.Association rule mining in multiple,multidimensional time series medical data[C]//Proceedings of the IEEE International Conference on Multimedia and Expo,2009:1720-1723.
[2]QIN Liping,BAI Mei.Predicting trend in futures prices time series using a new association rules algorithm[C]//Proceedings of the 16th IEEE International Conference on Management Science &Engineering,2009:1511-1517.
[3]Agrawal R,Srikant R.Mining sequential patterns[C]//Proceedings of the 11th IEEE International Conference on Data Engineering,1995:3-14.
[4]RONG Gang,LIU Jinfeng,GU Haijie.Mining dynamic association rules in databases[J].Control Theory and Applications,2007,24(1):129-133(in Chinese).[榮岡,劉進(jìn)鋒,顧海杰.數(shù)據(jù)庫(kù)中動(dòng)態(tài)關(guān)聯(lián)規(guī)則的挖掘[J].控制理論與應(yīng)用,2007,24(1):129-133.]
[5]SHEN Bin,YAO Min.A new kind of dynamic association rule and its mining algorithms[J].Control and Decision,2009,24(9):1310-1315(in Chinese).[沈斌,姚敏.一種新的動(dòng)態(tài)關(guān)聯(lián)規(guī)則及其挖掘算法[J].控制與決策,2009,24(9):1310-1315.]
[6]Thanawin R.Time series epenthesis:Clustering time series streams requires ignoring some data[C]//Proceedings of the 11th International Conference on Data Mining,2011:547-556.
[7]Liwei L,Qiangjiang J.A hidden Markov model-based KMeans time series clustering algorithm[C]//Proceedings of IEEE International Conference on Intelligent Computing and Intelligent Systems,2010:135-138.
[8]ZHANG Zhonglin,ZENG Qingfei.Method of data tendency measure mining in dynamic association rules[J].Journal of Computer Applications,2012,32(1):196-198(in Chinese).[張忠林,曾慶飛.動(dòng)態(tài)關(guān)聯(lián)規(guī)則的趨勢(shì)度挖掘方法[J].計(jì)算機(jī)應(yīng)用,2012,32(1):196-198.]
[9]ZHANG Lingjie,XU Weixiang.Association rules mining algorithm based on temporal constraint[J].Computer Engineering,2012,38(5):50-51(in Chinese).[張令杰,徐偉祥.基于時(shí)態(tài)約束的關(guān)聯(lián)規(guī)則挖掘算法[J].計(jì)算機(jī)工程,2012,38(5):50-51.]
[10]ZHANG Xiaodong.Econometrics[M].3rd ed.Beijing:Chinese People’s Publishing House,2008(in Chinese).[張曉峒.計(jì)量統(tǒng)計(jì)學(xué)[M].3版.北京:中國(guó)人民出版社,2008.]