• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于深度學(xué)習(xí)的化工企業(yè)財務(wù)數(shù)據(jù)信息異常分析方法

      2023-07-17 11:04:42安世俊
      中國新技術(shù)新產(chǎn)品 2023年8期
      關(guān)鍵詞:財務(wù)數(shù)據(jù)化工企業(yè)公式

      安世俊

      (蘭州資源環(huán)境職業(yè)技術(shù)大學(xué),甘肅 蘭州 730022)

      0 引言

      隨著現(xiàn)代化社會的飛速發(fā)展,互聯(lián)網(wǎng)技術(shù)、數(shù)據(jù)挖掘技術(shù)在國內(nèi)得到了快速發(fā)展與應(yīng)用,我國許多化工企業(yè)均可實現(xiàn)快速、有效地對大規(guī)模異常數(shù)據(jù)進行檢測與分析[1]。這些分析方法將統(tǒng)計的海量檢測數(shù)據(jù)進行合理分析,及時檢測出因網(wǎng)絡(luò)設(shè)備問題或軟件故障而生成的不同種類異常數(shù)據(jù)信息。實時檢測與分析網(wǎng)絡(luò)異常數(shù)據(jù),根據(jù)信息獲取和邏輯思考將時間序列數(shù)據(jù)分段,通過構(gòu)建不同網(wǎng)絡(luò)結(jié)構(gòu)來對異常數(shù)據(jù)信息進行分析,使有標簽數(shù)據(jù)集數(shù)量增加。同時其還加強了網(wǎng)絡(luò)訓(xùn)練的能力,提升對網(wǎng)絡(luò)結(jié)構(gòu)和異常數(shù)據(jù)的檢測實時性及準確性,使海量數(shù)據(jù)的異常識別效果更優(yōu),大幅提升分析的準確性。目前,由于分析過程的算法生成的序列缺少迭代,存在檢測網(wǎng)絡(luò)數(shù)據(jù)中混雜異常數(shù)據(jù)數(shù)量多、分析不明顯等問題,導(dǎo)致企業(yè)的財務(wù)數(shù)據(jù)分析存在多種致命問題,如數(shù)據(jù)缺失、數(shù)據(jù)漂移等。異常數(shù)據(jù)的分布過于隨機使檢測結(jié)果在大數(shù)據(jù)中不好辨別,導(dǎo)致分析進程慢,更易產(chǎn)生虛假預(yù)警,嚴重影響異常數(shù)據(jù)分析的效果,進而造成網(wǎng)絡(luò)診斷準確性大幅降低。因此,現(xiàn)階段,為有效診斷與分析異常數(shù)據(jù),該文以化工企業(yè)財務(wù)異常數(shù)據(jù)信息為試驗對象,運用深度學(xué)習(xí)方法,結(jié)合具體情況進行試驗與分析。

      1 化工企業(yè)財務(wù)數(shù)據(jù)信息異常分析

      1.1 PCA 法進行數(shù)據(jù)預(yù)處理

      測量過程中的大量數(shù)據(jù)中均存在噪聲,將這些噪聲值設(shè)定為異常值。改進化工企業(yè)財務(wù)數(shù)據(jù)信息分析時要對數(shù)據(jù)的噪聲問題進行處理,如果數(shù)據(jù)清洗不干凈,則會影響其判斷的準確率[2]。根據(jù)萊特檢驗的方法對每個網(wǎng)絡(luò)中的信息點進行檢測,對異常值進行發(fā)掘并剔除完成數(shù)據(jù)的預(yù)處理。進行異常信息檢測時,通過T 檢驗得到網(wǎng)絡(luò)中異常數(shù)據(jù)的相關(guān)性,如公式(1)所示。

      式中:f為數(shù)據(jù)中的相關(guān)特征;為所有樣本中的特征均值;n(f)為樣本中的正常數(shù)據(jù)信息的特征均值。

      然后運用深度學(xué)習(xí)中的PCA 算法識別數(shù)據(jù)中的主要成分并進行分類,獲得大量數(shù)據(jù)集中的信息,再降低數(shù)據(jù)的維度。處理高維度數(shù)據(jù)時,通過正交變換得到新坐標系中的映射,形成新的正交變量集合。將獲得的貢獻率作為變量的重要性度量,設(shè)定r個變量的方差貢獻率如公式(2)所示。

      式中:γ為第r個變量中的樣本總數(shù)計算得到的方差值。

      變量中的方差貢獻率值越大,線性集合中的變量收集到的原始數(shù)據(jù)信息就越多。引用PCA 算法得到高維度數(shù)據(jù),并消除其中的數(shù)據(jù)冗余。根據(jù)其特征的提取完成總結(jié),加強異常檢測效率。定義一個財務(wù)數(shù)據(jù)序列為T=(t1,t2,...,tn),表示一組實數(shù)集合,設(shè)定空間W中的數(shù)據(jù)g和度量d,則平均數(shù)據(jù)中的最小化數(shù)據(jù)如公式(3)所示。

      當映射在平均值的每個元素中時,通過運算權(quán)重之和獲得合理權(quán)重P,以此得到新的數(shù)據(jù)樣本。選擇數(shù)據(jù)序列T中的相對距離進行賦值,在隨機一個網(wǎng)絡(luò)端內(nèi)的數(shù)據(jù)樣本Hi得到的權(quán)值pi如公式(4)所示。

      式中:N為相鄰樣本之間的距離,其中距離最近的樣本為最優(yōu)。

      隨后將所有的序列樣本賦予權(quán)重,進行歸一化處理,將得到的結(jié)果作為數(shù)據(jù)序列的權(quán)重,任意選取一個c*初始化,生成新的數(shù)據(jù)序列,并不斷對其進行迭代,合成新的數(shù)據(jù)[3]。對財務(wù)數(shù)字信號進行分解,信號中的最大值和最小值需要通過計算獲得,設(shè)定分解過程的時間間隔為大、小值之間的時間間隔,計算均值并提取局部分量為h(t)=s(t)-imf(t),計算殘留項目并得到公式(5)。

      式中:imf(t)為本征的模態(tài)函數(shù);r(t)為預(yù)留項。

      根據(jù)信號分解,在對應(yīng)尺度中形成表征,獲得進一步分析的機會。為消除在模態(tài)中出現(xiàn)的混疊問題,在不同信號的篩選過程中加入白噪聲,并進行多次分解,獲得平均值后得到對應(yīng)的給定信號s(t)的IMF,加入幅度相似的白噪聲,如公式(6)所示。

      式中:i為分解次數(shù)。

      通過疊加白噪聲抑制模態(tài)的混疊,減少數(shù)據(jù)處理的運算時間。

      1.2 搭建UAE 數(shù)據(jù)關(guān)聯(lián)模型

      定義數(shù)據(jù)關(guān)聯(lián)模型,將時間序列的窗口為s={s1,s2,...,sn},其中n為數(shù)據(jù)序列的長度,每個維度對應(yīng)一種特征;s為獲得對應(yīng)財務(wù)數(shù)據(jù)信息的特征信息,即為數(shù)據(jù)大小、數(shù)量類型和數(shù)據(jù)說明等。將同一網(wǎng)絡(luò)中的異常數(shù)據(jù)和正常數(shù)據(jù)進行歸檔記錄,得到相應(yīng)的發(fā)生時間間隔,通過異常關(guān)聯(lián)性的分析得到參考序列之間的相似程度,判斷數(shù)據(jù)之間的緊密性。設(shè)定參考序列為X,對應(yīng)的關(guān)聯(lián)系數(shù)計算如公式(7)所示。

      式中:p為分析系數(shù),一般狀態(tài)下p=0.5;?(min)為數(shù)據(jù)的兩級差值;?(k)為不同序列中的每點之間的差的絕對值。

      關(guān)聯(lián)度計算如公式(8)所示。

      式中:r的值為1 則說明相關(guān)性強;反之為0 則說明相關(guān)性弱。

      設(shè)財務(wù)數(shù)據(jù)中所有出現(xiàn)過的計量異常數(shù)據(jù)的種類為N類,表示為A(n=1,2,...,n),n為每種異常數(shù)據(jù)出現(xiàn)時的所有次數(shù)[4]。對異常數(shù)據(jù)進行統(tǒng)計,根據(jù)異常數(shù)據(jù)出現(xiàn)的順序分別求出d<15 時異常出現(xiàn)的次數(shù)。再設(shè)適當?shù)臉藴手禐棣?,當d<μ時,可以認為存在異常數(shù)據(jù),且具有關(guān)聯(lián)性。根據(jù)小概率出現(xiàn)原則,得到標準值設(shè)定的計算公式,如公式(9)所示。

      式中:ni為An在網(wǎng)絡(luò)中出現(xiàn)的所有次數(shù)。

      在訓(xùn)練階段,將正確的時間序列作為訓(xùn)練樣本,輸入數(shù)據(jù)關(guān)聯(lián)模型中進行時間序列重構(gòu)。在訓(xùn)練完成后,輸入正確的時間序列,控制重構(gòu)誤差,并使誤差的大小不超過3%。將含有異常數(shù)據(jù)的序列輸入模型中時,重構(gòu)誤差值會變大。此時運用深度學(xué)習(xí)法完成重構(gòu)序列的預(yù)處理,生成一個大小相同的狀態(tài)向量并輸出。在神經(jīng)網(wǎng)絡(luò)中訓(xùn)練對應(yīng)的時間序列數(shù)據(jù)。當序列數(shù)據(jù)的長度超過實際規(guī)定大小時停止訓(xùn)練。如果所訓(xùn)練的數(shù)據(jù)梯度消失,說明只學(xué)習(xí)到一定間隔的時間序列信息,需要及時解決梯度消失問題。在神經(jīng)網(wǎng)絡(luò)中添加控制時間記憶長短的狀態(tài)單元,通過存儲當前時刻的數(shù)據(jù)延長記憶,使當前時刻的數(shù)據(jù)與之前的數(shù)據(jù)存在內(nèi)部關(guān)聯(lián)。在神經(jīng)網(wǎng)絡(luò)中設(shè)置3 個控制開關(guān),運用forget gate 模塊控制是否繼續(xù)保存單元狀態(tài)至當前時刻。其計算如公式(10)所示。

      式中:wf為權(quán)重矩陣;b為偏置量;σ為控制函數(shù)。

      再通過input gate 模塊控制是否將當前時刻狀態(tài)輸入之前的狀態(tài)單元。通過將當前記憶與之前的記憶相結(jié)合形成新的狀態(tài)單元,并保存新的信息,最后將其輸出。同時,為提高預(yù)測確度,運用注意力機制使數(shù)據(jù)能夠在不同周期中具有實際數(shù)值。在不同的應(yīng)用場景中,計算當前輸入序列與輸出向量的對應(yīng)程度,集中點得分越高,計算得到的權(quán)重就越大。將每個隱藏狀態(tài)設(shè)定一個權(quán)重,權(quán)重的不同決定了輸出狀態(tài)。對狀態(tài)向量進行學(xué)習(xí)來重構(gòu)序列。其中s1,s2,...,sn為輸入序列,,,...,為重構(gòu)序列,e為狀態(tài)向量得到的具體的關(guān)聯(lián)度值,以判斷異常數(shù)據(jù)出現(xiàn)并實施檢測。

      1.3 HESS 法分析異常數(shù)據(jù)信息

      對企業(yè)財務(wù)信息進行實時采集與記錄,根據(jù)預(yù)處理的信息獲得對應(yīng)組元信息,并利用信息熵對異常信息數(shù)據(jù)進行初步檢測。通過特定窗口對其求得信息熵值,將得到的數(shù)值與設(shè)定的標準值進行比較,以此來判斷企業(yè)財務(wù)中存在異常數(shù)據(jù)信息的區(qū)間,同時進行第二次深度檢測。其中,信息熵值的計算如公式(11)所示。

      式中:d為樣本數(shù)據(jù),其中d=ni,i=1,2...,N;i為內(nèi)部樣本的數(shù)據(jù);ni為變化的次數(shù);D為樣本取值的對應(yīng)全部數(shù)目。

      在樣本信息熵的變化過程中,設(shè)定的變化區(qū)域范圍為(0,logD),由于樣本的分布相對統(tǒng)一,因此對應(yīng)的信息熵值不變,樣本值相等。為了減少網(wǎng)絡(luò)防御的攻擊,通過在網(wǎng)絡(luò)結(jié)構(gòu)中輸入數(shù)據(jù)樣本,并對正常樣本進行標記,將輸入層的數(shù)據(jù)在其中充分激活,完成解碼與重構(gòu)[5]。在數(shù)據(jù)信息編碼的過程中,產(chǎn)生的隱藏部分的輸出公式如公式(12)所示。

      式中:E1為權(quán)重矩陣;B1為復(fù)合矩陣;σ為激活函數(shù);g為輸出層的對應(yīng)輸出。

      對應(yīng)的重構(gòu)誤差如公式(13)所示。

      式中:J(W,b)為分析重構(gòu)存在的差異值;m為輸入層的相應(yīng)的節(jié)點數(shù)量;x為需要傳遞的數(shù)據(jù);解壓過程中的輸出數(shù)據(jù)。

      與傳統(tǒng)樣本集相比,在利用數(shù)據(jù)異常網(wǎng)絡(luò)編碼的過程中,為獲得對應(yīng)的樣本特征,使神經(jīng)元一直保持在抑制狀態(tài),需要對隱藏部分的神經(jīng)元節(jié)點j完成激活,得到平均值的計算如公式(14)所示。

      式中:m為數(shù)據(jù)的存在條數(shù);aj(2)(x)為神經(jīng)節(jié)點中的輸出激活數(shù)據(jù)。

      在對中間層的神經(jīng)元節(jié)點進行分析的過程中,如果抑制狀態(tài)產(chǎn)生,則需要規(guī)定其中間層的神經(jīng)元節(jié)點j中。設(shè)置對應(yīng)的抑制性參數(shù)為,按照設(shè)計條件,規(guī)定p的 取值范圍為無限趨近于0 的小數(shù)。設(shè)定懲罰參數(shù),利用不同抑制性參數(shù)之間的差異得到相應(yīng)的懲罰,使激活參數(shù)之間的數(shù)據(jù)相等[6]。這種激活公式如公式(15)所示。

      式中:K為隱藏部分的神經(jīng)元數(shù)據(jù)。

      式中:ε為對應(yīng)的正則化因數(shù);b為存在IDE 信息網(wǎng)絡(luò)的層數(shù);W為神經(jīng)元的總數(shù)。

      從第一個結(jié)構(gòu)開始進行特征學(xué)習(xí),訓(xùn)練后獲得W和b的值,得到最終的訓(xùn)練樣本[7]。

      2 試驗測試與分析

      2.1 搭建試驗環(huán)境

      搭建財務(wù)數(shù)據(jù)信息異常檢測方法的試驗環(huán)境,根據(jù)IP地址段對全網(wǎng)進行劃分,主要包括化工企業(yè)中的財務(wù)網(wǎng)段。設(shè)置一臺P8 微處理機,操作系統(tǒng)為Windows 11,充分收集并詳細記錄對應(yīng)的所有測量數(shù)據(jù)[8]。將Java 語言作為開發(fā)工具。運用的軟件環(huán)境和參數(shù)見表1。

      表1 軟件環(huán)境及參數(shù)

      運用Cisco 的NetFlow 從企業(yè)網(wǎng)絡(luò)中的節(jié)點上依次采集樣本數(shù)據(jù)信息,采樣周期為12 個包。在初始數(shù)據(jù)包提供中,按每1440/86min 進行數(shù)據(jù)信息聚合,進行測量數(shù)據(jù)的采集的周期通常為一輪。處理采集到的財務(wù)數(shù)據(jù)信息,根據(jù)其信息熵計算網(wǎng)絡(luò)數(shù)據(jù)在106×7 個數(shù)據(jù)段內(nèi)的原IP 地址、目的IP 地址及端口的信息熵序列值,得到大小為600×4 的矩陣。各個屬性的熵值序列對應(yīng)600 個不同OF 數(shù)據(jù)段。根據(jù)對應(yīng)邊排布,將得到的對應(yīng)元組矩陣變成2869×4 的矩陣P,將得到的結(jié)果按原IP、目的IP 以及端口分成不同序列,并將其作為K-means 的輸入值進行異常分析[9]。

      2.2 試驗結(jié)果與分析

      受公司規(guī)模、盈利范圍等水平的影響,不同化工企業(yè)財務(wù)比率數(shù)據(jù)存在異常數(shù)據(jù)。設(shè)置5 個小組,運用該文方法的小組為試驗組,1~4 對照組運用傳統(tǒng)方法。試驗選取的化工企業(yè)的財務(wù)數(shù)據(jù)信息樣本數(shù)據(jù)為1000 類。先對試驗數(shù)據(jù)進行標準化處理,將試驗的數(shù)據(jù)樣本帶入運算得到樣本的離差數(shù)據(jù)處理,即帶入SOM 模型中,并對其中的異常信息進行分析,得到最優(yōu)的聚類結(jié)果,見表2。

      表2 SOM 信息異常分析表

      由試驗結(jié)果可知,1~4 對照組的分析錯誤率相對較高,聚類結(jié)果中存在的誤差較大,造成化工企業(yè)的財務(wù)數(shù)據(jù)指標不符合標準,異常分析的準確程度下降。和對照組相比,試驗組的分析錯誤率最低,為0.8%。這樣就使聚類結(jié)果中的誤差變小,準確率也有了顯著提升,財務(wù)數(shù)據(jù)信息異常分析趨于準確,分析結(jié)果更具有說服力,可及時發(fā)現(xiàn)財務(wù)數(shù)據(jù)中的數(shù)據(jù)信息異常,使化工企業(yè)財務(wù)數(shù)據(jù)信息異常的分析更全面。

      3 結(jié)語

      該文從化工企業(yè)財務(wù)數(shù)據(jù)信息入手,運用深度學(xué)習(xí)技術(shù),探究了基于深度學(xué)習(xí)的化工企業(yè)財務(wù)數(shù)據(jù)信息異常分析方法。通過檢測與分析化工企業(yè)財務(wù)中的異常數(shù)據(jù),對異常值進行查缺與填補,完成對化工企業(yè)財務(wù)數(shù)據(jù)清洗的過程。但是方法中也存在不足,例如算法中存在的閾值問題、對數(shù)據(jù)的空間特征的異常值檢測問題及空缺值的問題。在以后的研究中應(yīng)及時精細算法,對時間序列進行降維以改進異常值,提升異常分析的準確性。利用特性找出原有數(shù)據(jù)中的臟數(shù)據(jù),對化工企業(yè)財務(wù)數(shù)據(jù)進行合理有效的清洗,構(gòu)建優(yōu)質(zhì)數(shù)據(jù)庫集群,從而使該方法的研究更完善。

      猜你喜歡
      財務(wù)數(shù)據(jù)化工企業(yè)公式
      基于雙重預(yù)防機制創(chuàng)新化工企業(yè)管理模式
      組合數(shù)與組合數(shù)公式
      排列數(shù)與排列數(shù)公式
      等差數(shù)列前2n-1及2n項和公式與應(yīng)用
      化工企業(yè)中的工作票制度
      例說:二倍角公式的巧用
      2018上市公司中報主要財務(wù)數(shù)據(jù)(8)
      2017上市公司年報主要財務(wù)數(shù)據(jù)(6)
      2017年上市公司年報主要財務(wù)數(shù)據(jù)(1)
      某化工企業(yè)清潔生產(chǎn)潛力分析
      永德县| 广汉市| 宁城县| 金乡县| 大石桥市| 房山区| 通州市| 津南区| 遵义市| 建瓯市| 农安县| 阜康市| 潞西市| 宣威市| 花莲市| 彭阳县| 仲巴县| 剑河县| 广元市| 莱西市| 筠连县| 柘城县| 桦甸市| 水富县| 鹤岗市| 米易县| 湖北省| 柘荣县| 牟定县| 岑溪市| 洛隆县| 高淳县| 余江县| 河西区| 罗平县| 武邑县| 乌鲁木齐市| 蕉岭县| 西盟| 台东县| 寻乌县|