殷煒宏,王若愚,段倩倩,李國強(qiáng)
(1.上海工程技術(shù)大學(xué)電子電氣工程學(xué)院,上海 201620 ;2.上海交通大學(xué)軟件學(xué)院,上海 200240)
近年來,數(shù)據(jù)量日益增長,數(shù)據(jù)中隱藏著許多有價值的信息,需要通過數(shù)據(jù)挖掘[1]來探究數(shù)據(jù)中隱含的有用信息。那么,在數(shù)據(jù)挖掘領(lǐng)域中,時間序列則是數(shù)據(jù)挖掘的一個熱門研究領(lǐng)域[2]。時間序列作為一種特殊的大數(shù)據(jù),普遍存在于金融、醫(yī)療、農(nóng)業(yè)、氣象、科學(xué)觀測和工程等各個領(lǐng)域。若將原始數(shù)據(jù)直接用于時間序列的數(shù)據(jù)挖掘任務(wù)[3]中,則會導(dǎo)致過多的噪聲被引入,使得實(shí)驗(yàn)結(jié)果往往較差,影響最終的度量精度。
因此,許多研究者提出了時間序列的表示方法,為后續(xù)的相似性搜索[4,5]工作做了很好的鋪墊?,F(xiàn)階段,時間序列表示方法主要有4種[6]:頻域表示法(離散傅里葉變換DFT(Discrete Fourier Transform)[7]和離散小波變換DWT (Discrete Wavelet Transform)[8])、奇異值分解SVD(Singular Value Decomposition)表示法[9]、符號近似聚合SAX(Symbolic Aggregate Approximation)表示法[10]和分段線性表示法PLR(Piecewise Linear Representation)[11]。
很多應(yīng)用領(lǐng)域更關(guān)注時間序列在某個時間段的變化模式和規(guī)律,而不是單點(diǎn)特征。例如在醫(yī)療領(lǐng)域中,心電時間序列[12]在同一周期內(nèi)會有不同的波段特征,如P波、PR間期、QRS波群、ST段等,這些波段間期有著各自的序列趨勢特征,若從單點(diǎn)特征看是很難看出其屬于哪個波段,而通過時序的表示方法能很清楚地看出每個波段的趨勢特征,能更準(zhǔn)確判斷出該波形屬于哪類波段,進(jìn)一步確診病人的心臟疾病。
在上述時序表示方法中,時間序列的分段線性表示方法簡單直觀且數(shù)據(jù)壓縮效率高。該方法能夠找到原序列上的某些特征點(diǎn),并利用點(diǎn)與點(diǎn)之間一系列連續(xù)、首尾連接的直線段來近似表示時間序列,是一種數(shù)據(jù)降維和降噪的常見時序表示方法。因此,該方法得到了眾多研究者的重視。
然而,尋找一種合適的分段線性表示方法并非易事。近年來,研究人員已經(jīng)提出了一系列分段算法。目前,分段線性表示方法主要有2種,一種是由Keogh等[13]提出的采用擬合誤差的方法進(jìn)行分段表示,其主要思想是使得原始序列與擬合序列之間的殘差平方和最小。而孫志偉等[14]提出的分段算法也是首先考慮擬合誤差,并針對優(yōu)先級較高的分段進(jìn)行預(yù)分段,同時在分段時考慮最大、最小值點(diǎn),從而提高了固定點(diǎn)分段效率。盡管這種自底向上的算法分段效果好,但時間復(fù)雜度較高,且不支持在線分段。另一種表示方法則是考慮全局約束值和尋找重要點(diǎn)。如文獻(xiàn)[15]提出的基于重要趨勢點(diǎn)的分段線性算法,即若一個待測點(diǎn)的特征值在局部區(qū)間內(nèi)與區(qū)間端點(diǎn)特征值的比值超過某個閾值,則認(rèn)定該點(diǎn)為重要點(diǎn);廖俊等[16]根據(jù)序列的特征首先找出重要趨勢轉(zhuǎn)折點(diǎn),即趨勢變化明顯的點(diǎn),進(jìn)而通過某種規(guī)則刪除相對不重要的點(diǎn);陳帥飛等[17]提出了一種根據(jù)序列中極值點(diǎn)和變化幅度比較大的點(diǎn)來得到關(guān)鍵點(diǎn)的分段線性算法;而肖輝等[18]提出的基于時態(tài)邊緣算子的時間序列分段線性表示法,則是根據(jù)時間序列的特征設(shè)計(jì)出一種時態(tài)邊緣算子,并最終得到時間序列的邊緣點(diǎn)。這種自頂向下的算法盡管在一定程度上提高了分段精度,但用戶參數(shù)不易確定,且對整體考慮不足。
針對上述問題,本文提出一種以時態(tài)邊緣算子TEO(Temporal Edge Operator)為基礎(chǔ)的自主分段線性表示方法APLR_TEO(Autonomous Piecewise Linear Representation based on Temporal Edge Operator),該方法不僅精度高,在參數(shù)的設(shè)定上較為簡單,有良好的適應(yīng)性和穩(wěn)定性,且時間復(fù)雜度不高,時間序列測試數(shù)據(jù)集經(jīng)過表示后的可視化效果也不錯,能準(zhǔn)確刻畫出時間序列的主要趨勢特征。首先根據(jù)邊緣極值點(diǎn)的度量方法得到邊緣極值點(diǎn)序列,再通過一種自主分段線性啟發(fā)式規(guī)則得到最終的關(guān)鍵點(diǎn)序列。該方法對分段點(diǎn)數(shù)的劃分更精確,從而使得壓縮率的調(diào)節(jié)更為靈活。同時,也能更精準(zhǔn)地反映時間序列曲線的總體特征,大幅度提高了分段效率,擬合效果也更好。
定義1(時間序列) 時間序列是一組由連續(xù)時間變量和對應(yīng)的特征值組成的有序集合。從時間序列的角度來看,每個數(shù)據(jù)單元可以被抽象成一個二元組(t,v),t為時間變量,v為特征值變量。定義時間序列X={x1=(t1,v1),x2=(t2,v2),…,xn=(tn,vn)},滿足ti X={x1,x2,…,xn} (1) 定義2(時間序列的分段線性表示) 設(shè)時間序列X={x1,x2,…,xn},分段點(diǎn)的集合記為X′={x′1,x′2,…,x′m},其中x′2=x1,x′m=xn,且m XL={f1(x′1,x′2),f2(x′2,x′3),…,fm-1(x′m-1,x′m)} (2) 其中,fm-1(x′m-1,x′m)表示在[x′m-1,x′m]上用于擬合時間序列的線性函數(shù)。 定義3(壓縮率) 設(shè)原始時間序列X={x1,x2,…,xn},分段點(diǎn)的集合為X′={x′1,x′2,…,x′m},那么該時間序列的壓縮率記為: (3) (4) 擬合誤差是檢驗(yàn)擬合時間序列和原始時間序列差異度的一個重要指標(biāo)。在相同壓縮率下,一個序列的擬合誤差越大,那么擬合效果越差;反之,則擬合效果越好。這也是間接判斷分段線性方法好壞的一個標(biāo)準(zhǔn)。 定義5(一維卷積) 與數(shù)字信號不同,本文采用的卷積計(jì)算是基于數(shù)字圖像處理領(lǐng)域。眾所周知,近幾年圖像處理成了熱門的研究領(lǐng)域,二維卷積在該領(lǐng)域用處甚廣,其原理是利用卷積核(卷積模板)在圖像上滑動,將圖像點(diǎn)上的像素灰度值與對應(yīng)的卷積核上的數(shù)值相乘,然后將所有相乘后的值相加作為卷積核中間像素對應(yīng)的圖像上像素的灰度值,并最終滑動完所有圖像卷積的過程,實(shí)質(zhì)為矩陣與矩陣之間的卷積計(jì)算。而一維卷積原理與二維卷積相同,常用于序列模型和自然語言處理等領(lǐng)域,對于2個一維序列的卷積計(jì)算定義為: T*S=E (5) 其中,T∈Rn×1為時間序列,S∈Rn×1為與時間序列做卷積的邊緣算子,而E∈Rn×1為本文所需的與時間序列等長的輸出序列,*表示卷積運(yùn)算符。 定義6(趨勢轉(zhuǎn)折距離) 設(shè)時間序列X={x1,x2,…,xn},在進(jìn)行分段任務(wù)前,我們需要計(jì)算出當(dāng)前點(diǎn)與其前后點(diǎn)之間的趨勢偏轉(zhuǎn)距離[19],如圖1所示。 Figure 1 Trend deflection distance 圖1中的Q1,Q2,Q3為在邊緣極值點(diǎn)序列中的某鄰域內(nèi)的3個點(diǎn),這3個點(diǎn)正好構(gòu)成幾何三角形,圖1中垂直虛線段D的長度d就是趨勢轉(zhuǎn)折距離,定義為: (6) 其中,Q2(t2,v2)為待檢測點(diǎn)。趨勢轉(zhuǎn)折距離d越大,這個點(diǎn)越重要。 APLR_TEO是一種自主分段線性表示方法。將時態(tài)邊緣算子與原始時間序列進(jìn)行卷積得到潛在邊緣點(diǎn)序列,再通過過濾規(guī)則得到最終的關(guān)鍵點(diǎn)序列,并連接這些關(guān)鍵點(diǎn)之間的直線段序列來表示出原始時間序列。該方法主要分為2個部分:第1部分是基于時態(tài)邊緣算子的邊緣極值點(diǎn)度量方法的設(shè)計(jì);第2部分是利用邊緣極值點(diǎn)的自主分段線性方法,并得到關(guān)鍵點(diǎn)序列。 邊緣算子[20]常用于檢測圖像的灰度級變化很快的點(diǎn)的集合(即圖像的邊緣),利用邊緣鄰近梯度值變化規(guī)律檢測邊緣。本文根據(jù)邊緣算子的特征,設(shè)計(jì)出了符合時間序列特點(diǎn)的時態(tài)邊緣算子,采用該算子來檢測時序的邊緣,并根據(jù)相應(yīng)的關(guān)聯(lián)規(guī)則從中提取出若干個邊緣點(diǎn),最后通過分段方法得到最終的分段序列點(diǎn)。在時間序列中,若一個序列點(diǎn)為邊緣點(diǎn),那么在其鄰域內(nèi),位于該點(diǎn)左右兩端的時間序列將呈現(xiàn)不同的變化趨勢。在圖2所示的時間序列中,序列點(diǎn)A左側(cè)呈現(xiàn)上升趨勢,右側(cè)呈現(xiàn)下降趨勢;而點(diǎn)B左側(cè)呈現(xiàn)平緩趨勢,右側(cè)呈現(xiàn)上升趨勢。因此,本文定義A,B為邊緣點(diǎn)。這種左右鄰域都有不同變化趨勢的點(diǎn),可稱之為時間序列的邊緣點(diǎn)[21,22]。 Figure 2 Edge points of a time series 本文將以時態(tài)邊緣算子為基礎(chǔ),對分段線性算法進(jìn)行改進(jìn),設(shè)計(jì)出一種基于時態(tài)邊緣算子的自主分段線性表示方法APLR_TEO。 給定時間序列X={x1,x2,…,xn},定義時態(tài)邊緣算子為: TEO(t,u)={w(i)×(xt+i-xi)|i= -u,…,-2,-1,0,1,2,…,u} (7) 該算子設(shè)計(jì)的基本思路是根據(jù)該點(diǎn)左右鄰域相對該點(diǎn)變化幅度的影響來判斷該點(diǎn)的重要程度,其中w(i)為計(jì)算邊緣算子TEO的權(quán)重,定義為: w(i)=abs(i) (8) 即越靠近檢測窗口中心的點(diǎn)權(quán)重越低,即只考慮該點(diǎn)鄰域?qū)Ξ?dāng)前點(diǎn)的變化幅度影響,u是檢測窗口長度,由用戶自己設(shè)定,實(shí)驗(yàn)表明,當(dāng)u取1,2,3,4時,實(shí)驗(yàn)效果最好。可以針對數(shù)據(jù)集特征來選擇合適的窗口進(jìn)行邊緣算子設(shè)計(jì),該算子具有較強(qiáng)的適應(yīng)性和靈活性。 根據(jù)定義5將TEO與時間序列做一維卷積計(jì)算: TEO(t,u)*X(t)=E(t) (9) 其中,TEO(t,u)是根據(jù)在線卷積計(jì)算時間序列點(diǎn)得到的相應(yīng)的時態(tài)邊緣算子,X(t)為當(dāng)前卷積的序列點(diǎn),E(t)為輸出的邊緣強(qiáng)度序列。 由于時序關(guān)聯(lián)性強(qiáng)的特點(diǎn),相鄰點(diǎn)的邊緣幅度相近,若用這些邊緣點(diǎn)進(jìn)行線性分段,無法準(zhǔn)確刻畫時序的主要特征。下面將給出一種邊緣點(diǎn)的度量方法。 經(jīng)過TEO卷積計(jì)算得到的對應(yīng)的邊緣強(qiáng)度序列記為E={e1,e2,…,en}。若X={x1,x2,…,xn}滿足以下條件之一: (1)ei>ei-1且ei≥ei+1,或ei≥ei-1且ei>ei+1,其中1 (2)ei 點(diǎn)ei即為相應(yīng)的邊緣強(qiáng)度極值序列點(diǎn),由此可找出與之對應(yīng)的時間序列邊緣極值點(diǎn)xi,并將這些邊緣極值點(diǎn)放入邊緣極值點(diǎn)序列集合Q={q1,q2,…,qm}中,最終,就可以得到邊緣極值點(diǎn)序列Q={q1,q2,…,qm},其中m 設(shè)時間序列X={x1,x2,…,xn},其輸出的關(guān)鍵點(diǎn)序列為{xi1,xi2,…,xik},其中1≤i1≤i2<… (10) 其中,L(xik-1,xik)表示在區(qū)間[ik-1,ik]上連接相鄰關(guān)鍵點(diǎn)的線性函數(shù),式(10)也可簡化為L′={L(xi1,xi2),L(xi2,xi3),…,L(xik-1,xik)}。 由于時間序列具有不穩(wěn)定性和相關(guān)聯(lián)性的特點(diǎn),本文提出了APLR _TEO方法,通過提取邊緣極值點(diǎn)并進(jìn)一步經(jīng)過自主分段線性表示的關(guān)聯(lián)規(guī)則來選擇合適的關(guān)鍵點(diǎn)表示時間序列的整體特征。 自主分段線性方法實(shí)現(xiàn)過程:設(shè)時間序列為X={x1,x2,…,xn},通過3.2節(jié)的度量方法得到邊緣極值點(diǎn)序列為Q={q1,q2,…,qm}。再從邊緣極值點(diǎn)序列中篩選出關(guān)鍵點(diǎn)序列Kpts,默認(rèn)將首尾點(diǎn)q1和qm加入到關(guān)鍵點(diǎn)序列,在計(jì)算趨勢轉(zhuǎn)折距離的過程中,默認(rèn)將最后一個點(diǎn)qm作為圖1的Q3,將第1個關(guān)鍵點(diǎn)q1初始化為圖1的Q1。初始化累積分段轉(zhuǎn)折距離sum_d=0和分段內(nèi)的最大轉(zhuǎn)折距離max_d=0,并根據(jù)壓縮率設(shè)定累積分段閾值ε。遍歷邊緣極值點(diǎn)序列,得到序列中每個點(diǎn)的趨勢轉(zhuǎn)折距離dk,同時計(jì)算累積轉(zhuǎn)折距離sum_d=d1+d2+…+dk,其中dk是從q2開始計(jì)算的趨勢轉(zhuǎn)折距離,k≤m-2。判斷dk是否大于最大轉(zhuǎn)折距離max_d,若max_d 基于邊緣極值點(diǎn)度量的自主分段線性方法偽代碼如下所示: 輸入:時間序列X={x1,x2,…,xn},參數(shù)u,ε。 輸出:關(guān)鍵點(diǎn)序列Kpts。 步驟1初始化時間序列X; 步驟2構(gòu)造邊緣極值點(diǎn)序列Q,默認(rèn)將X中的首尾點(diǎn)加入到Q中: fori=1 ton 計(jì)算序列X與TEO卷積后的邊緣強(qiáng)度序列Eepts: Eepts←X(i)*TEO(i,u);E_index←i; endfor forj=1 tom 根據(jù)邊緣極值點(diǎn)的關(guān)聯(lián)規(guī)則找出與E對應(yīng)的邊緣極值點(diǎn)序列: Q←X(E_index[j]); endfor returnQ 步驟3構(gòu)造關(guān)鍵點(diǎn)序列Kpts: fori=1 tom 計(jì)算Q中每個點(diǎn)的分段趨勢轉(zhuǎn)折距離di; sum_d+=di; max_d←di; max_index←i;//max_index為索引列表 if(sum_d>ε) iIndex←max_d.index(max(max_d)); Kpts← (max_index[iIndex],Eepts[max_index[iIndex]]); endif endfor returnKpts (1)APLR_TEO方法只需設(shè)定2個參數(shù),分別是邊緣算子卷積窗口大小u和累積分段閾值ε。其中,參數(shù)u將通過第4節(jié)實(shí)驗(yàn)說明其容易確定,在針對不同數(shù)據(jù)集時,靈活性和適應(yīng)性很強(qiáng);而參數(shù)ε則是根據(jù)壓縮率大小上下浮動的,其變化范圍小,也不難確定。本文方法與文獻(xiàn)[17]中所提及的PLR_KP(Piecewise Linear Representation based on Key Points)方法的3個閾值參數(shù)C,P,R相比,需要設(shè)定的參數(shù)更少,參數(shù)的大小更容易確定。 (2)APLR_TEO方法綜合考慮了擬合誤差大小與時間跨度問題。PLR_ITTP(Piecewise Linear Representation based on Important Trend Transition Points)方法[16]對于分段的約束條件只是針對前一重要點(diǎn)和后一趨勢轉(zhuǎn)折點(diǎn)形成的線段距離大則擁有優(yōu)先分段權(quán)這一局部約束,忽略了序列的全局特征,則會造成圖3a 這種時間跨度小而波形陡的情況,即點(diǎn)A的趨勢轉(zhuǎn)折距離更大。出于降低擬合誤差考慮,這種分段方式往往會造成更大的擬合誤差。相比較而言,圖3b中B點(diǎn)的趨勢轉(zhuǎn)折距離小,時間跨度大,最終的擬合誤差也較小,更能準(zhǔn)確反映波形趨勢特征。利用這一特征,APLR_TEO解決了PLR_ITTP方法未考慮時間跨度這一全局性的問題,在計(jì)算趨勢轉(zhuǎn)折距離的同時,累加分段距離,并根據(jù)累積分段閾值來判斷是否結(jié)束該局部分段,從而達(dá)到精確地整體分段,降低整個序列擬合誤差的目的。 Figure 3 Time span of trend turning points (3)APLR_TEO方法對時間序列進(jìn)行了2次掃描選取關(guān)鍵點(diǎn),其時間復(fù)雜度為O(n),n是時間序列長度??傮w來說,計(jì)算成本不高比較容易實(shí)現(xiàn)。 為了驗(yàn)證APLR_TEO方法的有效性,本文在一系列標(biāo)準(zhǔn)時間序列數(shù)據(jù)集上進(jìn)行時間序列的擬合誤差度量,分別比較在相同壓縮率和不同壓縮率下幾種分段線性方法的擬合效果。 實(shí)驗(yàn)數(shù)據(jù)集采用Keogh等[13]提供的公開數(shù)據(jù)集KData。KData數(shù)據(jù)集包括了來自不同應(yīng)用領(lǐng)域的數(shù)據(jù)集,被廣大時間序列研究者們采用。本文從KData中選取了研究者們常用的10個序列進(jìn)行方法的對比評估,選取的序列如表1所示。 Table 1 Description of KData dataset 為了驗(yàn)證APLR_TEO的性能,將本文方法與廖俊等[16]提出的基于極值點(diǎn)的分段線性方法PLR_ITTP、陳帥飛等[17]提出的一種基于關(guān)鍵點(diǎn)的時間序列線性表示方法PLR_KP和肖輝等[18]提出的基于時態(tài)邊緣算子的時間序列分段線性表示方法PLR_TEO這3種不同的分段線性方法進(jìn)行對比。 本文提出基于時態(tài)邊緣算子的自主分段表示方法APLR_TEO,將時態(tài)邊緣算子與時間序列做卷積得到邊緣極值點(diǎn),并根據(jù)一種自主的線性分段方法得到最終的關(guān)鍵點(diǎn)序列。方法需要輸入2個參數(shù),參數(shù)u表示進(jìn)行卷積的時態(tài)邊緣算子窗口大小,參數(shù)ε為累積分段閾值。由于時間序列來自不同領(lǐng)域,彼此的特征值取值范圍有一定差距,為了便于對比實(shí)驗(yàn),在采用線性分段方法之前首先對時間序列做規(guī)范化處理,將序列特征值規(guī)范化到[0,1],其規(guī)范化公式如式(11)所示: (11) 實(shí)驗(yàn)運(yùn)行在2.5 GHz CPU,8 GB內(nèi)存Windows系統(tǒng)的Python 3.5.1環(huán)境下,在運(yùn)行前樣本都已按規(guī)范化處理。本文選取了KData中的10個序列進(jìn)行擬合誤差對比實(shí)驗(yàn)。 以Burst序列為例,該原始序列長度為9 382,原始序列如圖4所示 ,在壓縮率為80%時采用APLR_TEO方法表示得到的擬合序列如圖5所示,可以明顯看出該方法能很好地刻畫出序列的總體趨勢和特征。 Figure 4 Original Burst sequence (9 382 sections) 接下來,為確定時態(tài)邊緣算子窗口大小,在KData數(shù)據(jù)集上進(jìn)行APLR_TEO方法的性能評估。表2是在壓縮率為80%,u∈{1≤u≤8|u∈N}的條件下,u取不同值時,APLR_TEO的擬合誤差,其中加粗?jǐn)?shù)據(jù)即為擬合誤差最小值。從表2可以看出,在測試的10條序列中,有2條序列在u=1時擬合誤差最??;有2條序列在u=2時擬合誤差最?。挥?條序列在u=3時取得最小擬合誤差;有3條序列在u=4時取得最小擬合誤差。當(dāng)u≥5時,擬合誤差值呈上升趨勢,且u取值越大,擬合誤差的增長幅度也越大。因此,在實(shí)際的運(yùn)算過程中取1≤u≤4,在APLR_TEO方法中增加一個記錄環(huán)節(jié),即用一個for(u=1;u<5;u++)循環(huán),來記錄當(dāng)u取何值使得方法的擬合誤差最小。 Figure 5 Fitting Burst sequence (1 876 sections) 在統(tǒng)一壓縮率為80%的條件下,比較PLR_ITTP、PLR_KP、PLR_TEO、APLR_TEO這4個方法在10個通用序列上的擬合誤差,實(shí)驗(yàn)結(jié)果如表3所示。從表3中可以看出,當(dāng)壓縮率為80%時,APLR_TEO方法在其中的9個序列上的擬合誤差都是最小,方法的整體表現(xiàn)優(yōu)異。這10個序列都是維數(shù)在1 000維以上的高維序列,也從側(cè)面反映了APLR_TEO方法在高維數(shù)據(jù)集上所表現(xiàn)出的良好性能。如在Earthquake超高維序列上,APLR_TEO與其他3種方法的擬合誤差對比的差值更明顯,即APLR_TEO方法在高維數(shù)據(jù)集上的適用性更好。同時,這10個序列分別來自不同領(lǐng)域,本文算法在不同領(lǐng)域時間序列上都表現(xiàn)得十分出色,可見方法本身的適應(yīng)性也很強(qiáng)。 Table 2 Fitting error of APLR_TEO representation Table 3 Comparison of fitting errors when compression rate is 80% 以O(shè)cean數(shù)據(jù)集為例,比較PLR_ITTP、PLR_KP、PLR_TEO、APLR_TEO這4種方法在不同壓縮率下的擬合誤差,結(jié)果如圖6所示。隨著壓縮率的增大,即分段數(shù)減少,擬合誤差隨之增加。而壓縮率越高,擬合誤差的上升幅度越大。在不同壓縮率下,APLR_TEO方法的擬合誤差明顯小于PLR_ITTP、PLR_KP和PLR_TEO這3種方法的。 Figure 6 Comparison of fitting errors under different compression rates 本文將時態(tài)邊緣算子(TEO)引入時間序列的分段線性中,提出一種基于時態(tài)邊緣算子的時間序列自主線性分段表示方法。該方法利用時態(tài)邊緣算子與時間序列做卷積,得到邊緣極值點(diǎn);再根據(jù)鄰域內(nèi)的趨勢轉(zhuǎn)折距離來得到關(guān)鍵點(diǎn)。該分段算法很好地利用了鄰域內(nèi)變化明顯的點(diǎn),通過累計(jì)趨勢轉(zhuǎn)折距離的判斷機(jī)制實(shí)現(xiàn)了自主線性分段。 在一系列KData數(shù)據(jù)集上進(jìn)行了擬合效果評估,實(shí)驗(yàn)結(jié)果表明,本文方法有較強(qiáng)的適應(yīng)性和穩(wěn)定性,且對噪聲不敏感,能有效地壓縮時間序列。3 時態(tài)邊緣算子的自主分段方法
3.1 時序邊緣算子和邊緣點(diǎn)
3.2 邊緣極值點(diǎn)度量
3.3 自主分段線性方法
3.4 方法分析
4 實(shí)驗(yàn)與分析
4.1 數(shù)據(jù)集描述
4.2 實(shí)驗(yàn)方法
4.3 實(shí)驗(yàn)結(jié)果與分析
5 結(jié)束語