• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于算法以及小波分析的智能卡消費數(shù)據(jù)異常檢測*

      2020-07-19 02:03:58羅應機
      通信技術 2020年7期
      關鍵詞:小波乘法尺度

      王 剛,羅應機,劉 芳,劉 琳

      (廣西財經(jīng)學院實驗教學中心,廣西 南寧 530007)

      0 引言

      伴隨著互聯(lián)網(wǎng)的普及和發(fā)展,智能卡在人們的生活中發(fā)揮著越來越大的作用。但是,對企業(yè)或者商戶來說,智能卡在使用過程中存在消費記錄丟失或者錯誤等問題,從而給企業(yè)或者商戶帶來了經(jīng)濟上的巨大損失。財務人員在整理賬務時會出現(xiàn)很多無法處理的賬務,因此解決智能卡消費記錄從刷卡機到后臺過程中信息丟失問題成為重中之重。傳統(tǒng)的檢測異常消費數(shù)據(jù)的方法有最小二乘法[1],但客戶消費數(shù)據(jù)并不是平穩(wěn)的數(shù)據(jù)組,因而直接采用最小二乘法或基于密度的異常檢測算法會有很多數(shù)據(jù)被誤判。小波能夠從非平穩(wěn)信號提取信息,并能夠進行細化分析,因而能夠應用于消費數(shù)據(jù)檢測過程。本文采用最小二乘法、基于密度的異常檢測算法和小波分析相結合的方法,不僅可以處理異常數(shù)據(jù),而且可以處理非平穩(wěn)信號的異常數(shù)據(jù),同時通過比較兩種算法和小波函數(shù)的作用效果,得出較好的應用于異常數(shù)據(jù)檢測的算法和小波組合方式。

      1 小波多分辨分析原理

      1.1 小波變換

      小波分析正在迅速發(fā)展并在當前數(shù)學體系中開拓出一片嶄新領域,在理論和實際應用方面都有重大意義。小波變換源自20 世紀70 年代的法國,由一位叫Morlet 的工程師首先提出[2],當時主要結合實際工作處理信號的經(jīng)驗和物理學的直觀概念建立反演公式,研究成果在當時并未得到數(shù)學家的認可。直到1986 年,數(shù)學家Merey 偶然構造出一個真正的小波基[3]。基于與Mallat 的合作,構造小波基的多尺度分析方法得以建立,在此基礎上小波分析得到了迅速發(fā)展。在比利時數(shù)學家Daubechies I 撰寫的《小波十講(Ten Lectures on Wavelets)》一書中[4],對從非平穩(wěn)信號中提取的信號運用伸縮和平移等運算功能,然后進行尺度細化分析,很好地解決了Fourier 變換不能解決的很多難題。著眼于它的妙用,有人把它親切的譽為“數(shù)學顯微鏡”。

      連續(xù)小波變換(Continuous Wavelet Transform,CWT)亦稱積分小波變換,定義為:

      連續(xù)小波變換能夠定量表示小波函數(shù)系中的每個小波與實際信號接近或者相關的程度情況[7]。也就是說,假如把小波看成L2(R)空間的基函數(shù)系,則連續(xù)小波變換便是實際信號在基函數(shù)系的分解或投影。

      一個函數(shù)φ(t)?L2(R)能夠作為母小波,必須滿足容許條件:

      能夠滿足式(2)的時間函數(shù)φ(t)被稱為基本小波或者母小波,小波是它的統(tǒng)稱[8]。容許條件意味著在ω=0 處的值必須為0,即,其物理意義為φ(t)是一個振幅衰減得很快的“波”。

      在定義式中,當a0=2、b0=1 時,此小波變換變成二進制小波變換。

      1.2 信號空間的分解與重構

      設已經(jīng)構造了一個母小波φ(t),正交或非正交的,由它產生的二進制小波變換為:

      當取不同的k值時,對于每個j,{φj,k;k?Z}的線性組合將能生成L2(R)空間中的一個閉子空間,用wj表示。如果j也取到不同值,這樣得到一個子空間序列{wj;j?Z},便得到L2(R)空間的一個直和分解:

      式中·表示直和。

      由子空間wj(j?Z)按式(5)構造出L2(R)空間的一個嵌套子空間序列{vj;j?Z}:

      若母小波φ(t)正交,那么子空間wj相互正交,即wj ⊥wl(j≠l)。在這種情況下,式(5)變成正交和:

      式中,符號“⊕”表示正交和,可得:

      其中vj是由基(φ是尺度函數(shù))生產的空間,表示分解中的低頻部分;wj是由基生產的空間,表示分解中的高頻部分;vj+1是空間中的正交補。

      假設分解的尺度為N,能夠得到:

      設φ(t)≈φj(t)?vj-1,可得:

      式中用wj表示分解中的高頻部分,用φ0表示分解中的低頻部分,完成了對原始信號的尺度分解。數(shù)據(jù)處理過程中,對分解的一定尺度的高頻部分置為0,再重構回原來的信號,便去掉了原始信號的高頻部分,這樣也就去除了原始信號的異常數(shù)據(jù)[9]。

      1.3 最小二乘法基本原理

      最小二乘法是通過最小化誤差的平方和尋找數(shù)據(jù)的最佳函數(shù)匹配,流程如圖1 所示。

      圖1 最小二乘法流程

      1.4 基于密度的異常檢測算法

      基于密度的異常檢測算法是給所有數(shù)據(jù)分別賦予一個局部異常因子的屬性,然后作為數(shù)據(jù)異常程度的度量[10]。

      定義1 對任意自然數(shù)k,定義k-distance(p)為p和某個對象o之間的距離,其中o滿足至少存在k個對象o’∈D/{p}使得d(p,o′)≤d(p,o),且至多存在k-1 個對象O′∈D{p}使得d(p,o′)<d(p,o)。

      定義2 對象p的k-距離鄰(Nk-distance)給定p的k-距離k-distance(p),p的k-距離鄰域包含所有與p的距離不超過k-distance(p)的對象[11],即:

      Nk-distance(p)-{q|d(p,q)≤k-distance(p)} (10)

      定義3 對象p相對于對象o的可達距離給定自然數(shù)k,對象p相對于對象o的可達距離為:

      reach-disk(p,o)-max{k-distance(o),d(p,o)} (11)

      定義4 對象p的局部可達密度(Local Reachable Distance)為:

      即對象p的局部可達密度為對象p與p的MinPts-鄰域的平均可達距離的倒數(shù)。

      定義5 對象p的局部異常因子(Local Outlier Factor)為:

      對象p的局部異常因子表示p的異常程度,近似正比的關系。也就是說,局部異常因子愈大,它異常的可能性越大;反之,則可能性小[12]。

      局部異常因子有如下性質:簇內靠近核心點的對象的LOF 接近于1,那么不應該被認為是局部異常;處于簇的邊緣或是簇的外面的對象的LOF 相對較大[13]。

      2 消費數(shù)據(jù)的異常檢測

      通過學校的一卡通后臺客戶端采集廣西財經(jīng)系學院學生超市的消費數(shù)據(jù)流水,利用MATLAB 工具箱中的db2 小波函數(shù)和sym2 小波函數(shù)處理采集的數(shù)據(jù),找出其中的異常數(shù)據(jù),并結合最小二乘法和基于密度的異常檢測算法進行比較分析[14]。

      2.1 實現(xiàn)數(shù)據(jù)的采集

      在廣西財經(jīng)學院校園一卡通管理中心后臺服務器客戶端采集廣西財經(jīng)學院學生超市2019 年11 月15 到2019 年12 月23 日 中 午11 點20 到12 點30時間段學生消費次數(shù)信息。在這個時間段內的消費次數(shù)信息屬于非平穩(wěn)信號,基于密度的檢測算法和小波分析相結合進行處理會有較大誤差。通過最小二乘法與小波分析相結合可以較好地消除誤差。其中,采集的信息數(shù)據(jù)曲線如圖2 所示。

      圖2 實測數(shù)據(jù)

      可以看出,在40 個實測數(shù)據(jù)中,實際誤差較大的有4 個數(shù)據(jù)。

      2.2 對數(shù)據(jù)進行處理

      首先利用MATLAB 小波工具箱的sym2 小波函數(shù),依據(jù)多分辨分析原理,處理消費記錄中的異常數(shù)據(jù)。選定的sym2 小波函數(shù)和尺度函數(shù)如圖3 所示,并確定分解尺度為2。

      圖3 sym2 小波函數(shù)和尺度函數(shù)

      對消費數(shù)據(jù)序列進行二尺度分解,得到的低頻系數(shù)和高頻系數(shù)如圖4 中B 所示,對高頻系數(shù)置為0,同時提取尺度的低頻系數(shù),對低頻信號進行重構,得到如圖4 中a2 所示。

      圖4 sym2 小波分解和重構

      依據(jù)同樣的原理和步驟利用db2 小波函數(shù)對數(shù)據(jù)做一次新的處理,小波函數(shù)和尺度函數(shù)如圖5 所示,小波分解圖和重構圖如圖6 所示。

      圖5 db2 小波函數(shù)和尺度函數(shù)

      圖6 db2 小波分解和重構

      2.3 實現(xiàn)異常數(shù)據(jù)的檢測

      最小二乘法是從參數(shù)擬合角度處理數(shù)據(jù),并進行參數(shù)估計,在系統(tǒng)辨識、異常數(shù)據(jù)處理等領域得到了廣泛應用[15]。在進行異常數(shù)據(jù)處理中,最小二乘法對平穩(wěn)數(shù)據(jù)具有很好的檢測性,但是對本文中的非平穩(wěn)數(shù)據(jù)檢測會產生較大的誤差。本文在小波分析不同函數(shù)的基礎上,結合最小二乘法,實現(xiàn)對非平穩(wěn)消費異常數(shù)據(jù)的檢測。通過對消費正常數(shù)據(jù)和二層重構低頻數(shù)組的差值進行處理,找到新數(shù)組中異常數(shù)據(jù)的位置,對應找到原始消費數(shù)據(jù)中相應的數(shù)據(jù),從而實現(xiàn)對異常數(shù)據(jù)的檢測。異常數(shù)據(jù)檢測結果,如表1 所示。

      表1 異常數(shù)據(jù)檢測結果

      可以看出,利用小波函數(shù)和最小二乘法相結合得到的重構序列組數(shù)據(jù)的檢測效果優(yōu)于利用小波函數(shù)和基于密度的異常檢測算法相結合得到的數(shù)據(jù),同時利用sym2 小波的檢測效果要優(yōu)于利用db2 小波的檢測效果。

      3 結語

      本文通過采集連續(xù)時間段學生消費非平穩(wěn)數(shù)據(jù)信號,利用小波多分辨分析進行小波分解和重構,并分別利用最小二乘法和基于密度的異常檢測算法處理非平穩(wěn)數(shù)據(jù)中的異常數(shù)據(jù),得出利用小波分析和最小二乘法相結合的方法,在處理非平穩(wěn)信號中的異常數(shù)據(jù)過程中找出異常數(shù)據(jù)的正確率要優(yōu)于利用基于密度的異常檢測算法和小波分析相結合找出的正確率,同時得出利用sym2 小波函數(shù)找出異常數(shù)據(jù)的性能優(yōu)于利用db2 小波函數(shù)找出異常數(shù)據(jù)的性能。通過實際采集數(shù)據(jù)進行分析處理,通過實際生產工作驗證得出,這些方法能夠有效應用于智能卡客戶消費異常數(shù)據(jù)檢測。

      猜你喜歡
      小波乘法尺度
      算乘法
      我們一起來學習“乘法的初步認識”
      構造Daubechies小波的一些注記
      科技風(2021年19期)2021-09-07 14:04:29
      財產的五大尺度和五重應對
      《整式的乘法與因式分解》鞏固練習
      基于MATLAB的小波降噪研究
      電子制作(2019年13期)2020-01-14 03:15:32
      把加法變成乘法
      基于改進的G-SVS LMS 與冗余提升小波的滾動軸承故障診斷
      宇宙的尺度
      太空探索(2016年5期)2016-07-12 15:17:55
      9
      原平市| 临江市| 黔西县| 桂东县| 吉林省| 堆龙德庆县| 新泰市| 广水市| 资源县| 曲松县| 渝中区| 大埔区| 微山县| 都兰县| 三台县| 礼泉县| 兴城市| 靖江市| 辽中县| 盐源县| 通许县| 武乡县| 荆州市| 东城区| 昌乐县| 海宁市| 静海县| 闸北区| 宁国市| 通山县| 多伦县| 桃园县| 泽州县| 民县| 仙游县| 平顶山市| 兰溪市| 成武县| 白河县| 棋牌| 昌乐县|