徐 敏,薛曉茹,王國(guó)梁,齊 慧
(國(guó)網(wǎng)安徽省電力有限公司信息通信分公司,安徽 合肥 230061)
隨著現(xiàn)代企業(yè)資源計(jì)劃的不斷量化[1],需要采用更精細(xì)化管理模型進(jìn)行ERP數(shù)據(jù)分析。結(jié)合分區(qū)融合技術(shù),進(jìn)行的資源信息調(diào)度,采用大數(shù)據(jù)分析方法進(jìn)行ERP數(shù)據(jù)分析,提高企業(yè)資源的智能化管理能力,相關(guān)的ERP數(shù)據(jù)治理和分析方法研究受到人們的極大關(guān)注[2]。ERP數(shù)據(jù)的管理和治理方法是建立在對(duì)企業(yè)信息資源的大數(shù)據(jù)融合基礎(chǔ)上,通過(guò)建立ERP數(shù)據(jù)信息融合和自適應(yīng)評(píng)估模型,采用模糊信息聚類方法,實(shí)現(xiàn)ERP數(shù)據(jù)的綜合治理,但不論文獻(xiàn)中提到的方法還是傳統(tǒng)方法,進(jìn)行ERP數(shù)據(jù)綜合治理模糊度都比較大。
文獻(xiàn)[3]利用MapReduce模型對(duì)數(shù)據(jù)進(jìn)行了融合,使更為相似的數(shù)據(jù)得到較好的融合,但是在數(shù)據(jù)調(diào)度時(shí),未考慮數(shù)據(jù)的關(guān)聯(lián)規(guī)則特征量,導(dǎo)致準(zhǔn)確率降低,并未對(duì)數(shù)據(jù)進(jìn)行去模糊處理,且計(jì)算過(guò)程較為復(fù)雜,增加了數(shù)據(jù)處理時(shí)間;文獻(xiàn)[4]利用大數(shù)據(jù)技術(shù),實(shí)現(xiàn)不同類型海量數(shù)據(jù)的快速調(diào)度,加快了數(shù)據(jù)處理進(jìn)程,但是未考慮各種數(shù)據(jù)之間的模糊界限,使數(shù)據(jù)處理的準(zhǔn)確性降低。
對(duì)此,該文提出基于模糊信息聚類分析的ERP數(shù)據(jù)管理和治理方法。首先對(duì)ERP數(shù)據(jù)的存儲(chǔ)結(jié)構(gòu)進(jìn)行了分析,建立ERP數(shù)據(jù)的分塊異構(gòu)存儲(chǔ)結(jié)構(gòu)模型,采用關(guān)聯(lián)維分布式調(diào)度的方法,提取ERP數(shù)據(jù)的關(guān)聯(lián)規(guī)則特征量,在云計(jì)算中心進(jìn)行數(shù)據(jù)的高效索引。根據(jù)對(duì)ERP數(shù)據(jù)相似度特征的分析,進(jìn)行數(shù)據(jù)融合。在信息檢索時(shí),建立ERP數(shù)據(jù)的語(yǔ)義本體結(jié)構(gòu)模型,采用自適應(yīng)的特征提取方法完成信息檢索。與傳統(tǒng)方法不同的是,該方法采用模糊C均值聚類方法,進(jìn)行ERP數(shù)據(jù)的二元分組測(cè)試,建立高分辨信息融合模型,得到ERP數(shù)據(jù)信息檢索的迭代模型,實(shí)現(xiàn)ERP數(shù)據(jù)的優(yōu)化管理和治理。最后進(jìn)行仿真測(cè)試分析,以驗(yàn)證該方法的有效性。
為了實(shí)現(xiàn)ERP數(shù)據(jù)管理、治理優(yōu)化,首先需要了解ERP數(shù)據(jù)存儲(chǔ)結(jié)構(gòu),構(gòu)建ERP數(shù)據(jù)的分塊存儲(chǔ)結(jié)構(gòu)模型,采用模糊特征標(biāo)注方法進(jìn)行資源信息調(diào)度[5]。如果ERP數(shù)據(jù)分布滿足凸組合模型X~Sα(1,β,0),1<α<2,即ERP數(shù)據(jù)管理過(guò)程中需要進(jìn)行特征匹配,在ERP數(shù)據(jù)信息庫(kù)中采用模糊關(guān)聯(lián)特征調(diào)度方法進(jìn)行信息匹配,構(gòu)造ERP數(shù)據(jù)的線性組合模型為:
(1)
在構(gòu)建ERP數(shù)據(jù)的異構(gòu)存儲(chǔ)結(jié)構(gòu)模型時(shí),采用關(guān)聯(lián)維分布式調(diào)度的方法[8],提取ERP數(shù)據(jù)的關(guān)聯(lián)規(guī)則特征量,在云計(jì)算中心進(jìn)行數(shù)據(jù)的高效索引,采用日志來(lái)記錄ERP數(shù)據(jù)的存儲(chǔ)節(jié)點(diǎn)[9],構(gòu)建ERP數(shù)據(jù)的異構(gòu)存儲(chǔ)模型,得到梯度特征分布向量為2F(x)。在云計(jì)算環(huán)境中進(jìn)行ERP數(shù)據(jù)的分布式挖掘,采用存儲(chǔ)節(jié)點(diǎn)的異構(gòu)存儲(chǔ)模型進(jìn)行ERP數(shù)據(jù)信息融合,建立分布式B樹(shù)進(jìn)行ERP數(shù)據(jù)的分類處理,得到ERP數(shù)據(jù)的異構(gòu)存儲(chǔ)模型,如圖1所示。
圖1 ERP數(shù)據(jù)的異構(gòu)存儲(chǔ)模型
根據(jù)圖1所示的存儲(chǔ)結(jié)構(gòu)模型,在服務(wù)器中進(jìn)行信息調(diào)度,將所獲得的信息數(shù)據(jù)儲(chǔ)存在本地服務(wù)器中,采用回歸樹(shù)分析的方法進(jìn)行ERP數(shù)據(jù)的綜合管理,綜合管理的交叉樹(shù)結(jié)構(gòu)模型如圖2所示。
圖2 ERP數(shù)據(jù)綜合管理的交叉樹(shù)模型
分析上述存儲(chǔ)結(jié)構(gòu)所獲得的數(shù)據(jù),采用模糊特征標(biāo)注方法進(jìn)行ERP數(shù)據(jù)信息檢索,根據(jù)數(shù)據(jù)特征進(jìn)行數(shù)據(jù)融合,建立ERP數(shù)據(jù)的語(yǔ)義本體結(jié)構(gòu)模型,提高數(shù)據(jù)的綜合管理和治理能力[10]。
建立ERP數(shù)據(jù)的語(yǔ)義本體結(jié)構(gòu)模型,采用自適應(yīng)的特征提取方法進(jìn)行ERP數(shù)據(jù)的信息檢索,建立描述ERP數(shù)據(jù)特征類別的約束特征函數(shù)為:
(2)
判斷緩沖節(jié)點(diǎn)與服務(wù)器中存儲(chǔ)相關(guān)性,進(jìn)行ERP數(shù)據(jù)的分塊區(qū)域調(diào)度[11]。設(shè)ERP數(shù)據(jù)的關(guān)聯(lián)調(diào)度的特征分布映射為f(k),在每次訪問(wèn)根節(jié)點(diǎn)的能耗開(kāi)銷計(jì)算公式為:
Ui,j(t)=exp[-b[zi(t)-zj(t)]2]
(3)
假設(shè)ERP數(shù)據(jù)有6.4萬(wàn)個(gè)
(4)
其中,pi,j(t)為ERP數(shù)據(jù)共享的模糊相關(guān)性特征分布集,s(t)為ERP數(shù)據(jù)共享的模糊決策增量值。
初始化ERP數(shù)據(jù)的信息聚類中心,存儲(chǔ)B樹(shù)節(jié)點(diǎn)的服務(wù)器中找到一個(gè)模糊聚類中心點(diǎn),得到ERP數(shù)據(jù)的特征分辨函數(shù)為F(xi,Aj(L)),i=1,2,…,m,j=1,2,…,k。采用空間規(guī)劃結(jié)構(gòu)重組的方法,建立ERP數(shù)據(jù)非線性特征重組模型,在每次訪問(wèn)ERP數(shù)據(jù)時(shí),統(tǒng)計(jì)數(shù)據(jù)的訪問(wèn)量,結(jié)合定量遞歸分析方法,得到數(shù)據(jù)的相似度特征為:
根據(jù)上述完成ERP數(shù)據(jù)相似度特征的分析,利用上述相似度進(jìn)行數(shù)據(jù)融合,得到數(shù)據(jù)特征融合函數(shù)為:
(6)
其中,δN表示ERP數(shù)據(jù)融合的譜信息。
利用上式完成數(shù)據(jù)特征融合,通過(guò)該步驟為后續(xù)數(shù)據(jù)的管理奠定可行依據(jù)。
根據(jù)上述ERP數(shù)據(jù)的資源信息調(diào)度,采用模糊信息索引的方法,在建立ERP數(shù)據(jù)的分塊存儲(chǔ)結(jié)構(gòu)模型并進(jìn)行特征提取的基礎(chǔ)上,進(jìn)行ERP數(shù)據(jù)的管理和治理優(yōu)化。該文提出基于模糊信息聚類分析的ERP數(shù)據(jù)優(yōu)化檢索和管理模型,用4元組(Ei,Ej,d,t)來(lái)表示ERP數(shù)據(jù)共享調(diào)度的主特征量,建立其關(guān)聯(lián)函數(shù)為:
(7)
其中,P(d|t,ci)為ci類ERP數(shù)據(jù)的特征分辨率,在所有客戶端進(jìn)行ERP數(shù)據(jù)融合和信息檢索[12-13],得到ERP數(shù)據(jù)治理的特征集δk變?yōu)棣膇k(t):
δik(t)=G(V=k|Ui,Θ(t))
(8)
采用延遲更新的方法進(jìn)行ERP數(shù)據(jù)的量化編碼,得到輸出編碼結(jié)果為:
(9)
在數(shù)據(jù)的目標(biāo)域空間,對(duì)采集的ERP數(shù)據(jù)進(jìn)行特征篩選,得到ERP數(shù)據(jù)的信息熵滿足:
esupt(D)>θ
(10)
采用模糊C均值聚類方法,進(jìn)行ERP數(shù)據(jù)的二元分組測(cè)試,建立高分辨信息融合模型,得到ERP數(shù)據(jù)信息檢索的迭代模型為:
(11)
(12)
數(shù)據(jù)模糊聚類是指根據(jù)一組數(shù)據(jù),把其含義劃分為不同的類別,而各個(gè)類別之間并沒(méi)有直接聯(lián)系,根據(jù)實(shí)際需要把一些聯(lián)系比較強(qiáng)的數(shù)據(jù)劃分為一類,是進(jìn)行數(shù)據(jù)模糊采樣的前提。在語(yǔ)義本體模型中執(zhí)行ERP數(shù)據(jù)的樣本統(tǒng)計(jì),得到ERP數(shù)據(jù)信息采樣的n個(gè)統(tǒng)計(jì)變量,遍歷多個(gè)節(jié)點(diǎn)進(jìn)行ERP數(shù)據(jù)綜合治理,得到綜合治理的特征分解函數(shù)為:
(13)
采用分布式的決策樹(shù)模型進(jìn)行ERP數(shù)據(jù)的統(tǒng)計(jì)分析,建立ERP數(shù)據(jù)的統(tǒng)計(jì)檢測(cè)模型為:
(14)
(15)
其中,m,n分別是ERP數(shù)據(jù)分布的維數(shù)和采樣節(jié)點(diǎn)。
設(shè)D為不確定數(shù)據(jù)庫(kù),Ti為數(shù)據(jù)的特征信息采樣延遲,由此得到ERP數(shù)據(jù)的特征重組輸出為:
(16)
(17)
為了驗(yàn)證該方法在實(shí)現(xiàn)ERP數(shù)據(jù)管理和治理優(yōu)化中的應(yīng)用性能,結(jié)合上述過(guò)程中的信息融合方法,進(jìn)行ERP數(shù)據(jù)的綜合管理。采用Matlab進(jìn)行實(shí)驗(yàn)測(cè)試分析,設(shè)定對(duì)ERP數(shù)據(jù)采樣的節(jié)點(diǎn)數(shù)為220,Sink節(jié)點(diǎn)為12,數(shù)據(jù)采樣的單組長(zhǎng)度為1 200,分塊融合聚類的分辨率為0.83,相似度系數(shù)為1.25。根據(jù)上述仿真參數(shù)設(shè)定,進(jìn)行ERP檢索,得到的數(shù)據(jù)時(shí)域分布如圖3所示。
圖3 數(shù)據(jù)時(shí)域分布
以圖3的數(shù)據(jù)時(shí)域分布為研究對(duì)象,結(jié)合企業(yè)大數(shù)據(jù)融合聚類以及數(shù)據(jù)的優(yōu)化治理輸出,進(jìn)行ERP數(shù)據(jù)管理和綜合治理,隨機(jī)采用企業(yè)金融、人力資源和綜合資源三種事物集。
為全面驗(yàn)證該方法的魯棒性,分別檢測(cè)其吞吐量及數(shù)據(jù)召回率。其中,數(shù)據(jù)吞吐量計(jì)算公式為:
(18)
其中,VU表示并發(fā)數(shù),Ti表示響應(yīng)時(shí)長(zhǎng),R表示平均每個(gè)用戶發(fā)出的請(qǐng)求數(shù)量。若吞吐量越高,則表示該方法數(shù)據(jù)傳輸性能越好。
數(shù)據(jù)召回率計(jì)算公式為:
(19)
其中,Nz表示總數(shù)據(jù)數(shù)量。若數(shù)據(jù)召回率越高,則表示方法具有較高的數(shù)據(jù)查全性能。
為驗(yàn)證該方法的有效性及可行性,本次實(shí)驗(yàn)將隨機(jī)采用企業(yè)金融、人力資源和綜合資源三種事物集分別測(cè)試其輸出的吞吐量,得到的測(cè)試結(jié)果如圖4~圖6所示。
圖4 企業(yè)金融事物集下的吞吐量
圖5 人力資源事物集下的吞吐量
圖6 綜合資源事物集下吞吐量
該方法通過(guò)構(gòu)建ERP數(shù)據(jù)的分塊存儲(chǔ)結(jié)構(gòu)模型,在服務(wù)器中進(jìn)行信息調(diào)度,經(jīng)數(shù)據(jù)信息檢索后對(duì)ERP進(jìn)行數(shù)據(jù)融合,分析數(shù)據(jù)時(shí)域分布情況,測(cè)試在不同事物集下的輸出吞吐量。分析上述仿真結(jié)果可知,采用該方法能在不同的ERP數(shù)據(jù)管理模式下提高資源調(diào)度吞吐量,根據(jù)資源調(diào)度吞吐量的結(jié)果,測(cè)試數(shù)據(jù)的召回率,得到的對(duì)比結(jié)果見(jiàn)表1。
由表1可知,隨著迭代次數(shù)的增加,三種方法的召回率都隨之增高,但文中方法的召回率始終高于文獻(xiàn)[3]和文獻(xiàn)[4],顯示出了良好的召回性能。文中方法根據(jù)數(shù)據(jù)特征進(jìn)行數(shù)據(jù)融合,通過(guò)建立描述ERP數(shù)據(jù)特征類別的約束特征函數(shù)來(lái)構(gòu)建ERP數(shù)據(jù)的語(yǔ)義本體結(jié)構(gòu)模型,從而完成特征數(shù)據(jù)融合,提高了資源調(diào)度吞吐量,對(duì)數(shù)據(jù)進(jìn)行了有效管理,為后續(xù)處理奠定了基礎(chǔ)。在進(jìn)行ERP數(shù)據(jù)的信息檢索時(shí),采用模糊C均值聚類方法,建立高分辨信息融合模型,通過(guò)ERP數(shù)據(jù)的二元分組測(cè)試,得到ERP數(shù)據(jù)信息檢索的迭代模型,加快了數(shù)據(jù)處理進(jìn)程。在輸出過(guò)程中,根據(jù)信息聚類結(jié)果,進(jìn)行ERP數(shù)據(jù)的動(dòng)態(tài)規(guī)劃,采用自適應(yīng)尋優(yōu)方法,提高了數(shù)據(jù)召回率,強(qiáng)化了數(shù)據(jù)管理的優(yōu)化檢索,實(shí)現(xiàn)ERP數(shù)據(jù)的優(yōu)化管理和治理。
表1 數(shù)據(jù)召回率測(cè)試
ERP融合了企業(yè)信息技術(shù)和實(shí)踐經(jīng)驗(yàn),隨著企業(yè)的進(jìn)步,不斷對(duì)其數(shù)據(jù)資源進(jìn)行優(yōu)化,加強(qiáng)了員工之間協(xié)同合作,提高了企業(yè)的發(fā)展水平,為增強(qiáng)企業(yè)競(jìng)爭(zhēng)力做出了巨大貢獻(xiàn)。研究ERP數(shù)據(jù)管理、治理方法對(duì)企業(yè)管理有著重要的作用,通過(guò)對(duì)企業(yè)的ERP數(shù)據(jù)管理,提高企業(yè)的資源信息管理和調(diào)度能力。該文提出基于模糊信息聚類分析的ERP數(shù)據(jù)優(yōu)化檢索和管理模型。通過(guò)建立描述ERP數(shù)據(jù)特征類別的約束特征函數(shù)來(lái)構(gòu)建ERP數(shù)據(jù)的語(yǔ)義本體結(jié)構(gòu)模型,并提取ERP數(shù)據(jù)的關(guān)聯(lián)規(guī)則特征量,實(shí)現(xiàn)在云計(jì)算中心進(jìn)行數(shù)據(jù)的高效索引,采用日志來(lái)記錄ERP數(shù)據(jù)的存儲(chǔ)節(jié)點(diǎn),在所有客戶端進(jìn)行ERP數(shù)據(jù)融合和信息檢索。采用模糊C均值聚類方法,建立高分辨信息融合模型,通過(guò)ERP數(shù)據(jù)的二元分組測(cè)試,得到ERP數(shù)據(jù)信息檢索的迭代模型,加快了數(shù)據(jù)處理進(jìn)程。在輸出過(guò)程中,根據(jù)信息聚類結(jié)果,采用自適應(yīng)尋優(yōu)方法,實(shí)現(xiàn)ERP數(shù)據(jù)的優(yōu)化管理和治理。經(jīng)實(shí)驗(yàn)證明,該方法能在不同的ERP數(shù)據(jù)管理模式下,提高資源調(diào)度吞吐量,數(shù)據(jù)治理融合及召回率較高。由此可知,用該方法進(jìn)行資源數(shù)據(jù)管理的檢索能力較好,具有較好的ERP數(shù)據(jù)的管理和治理能力。