胡彥 鐘金琴
摘要:數(shù)據(jù)挖掘是伴隨科技不斷發(fā)展的新興技術(shù),也是目前研究的熱門(mén)領(lǐng)域。本文主要分析了基于數(shù)據(jù)挖掘的預(yù)測(cè)決策模型應(yīng)用相關(guān)內(nèi)容,如下表述。
關(guān)鍵詞:數(shù)據(jù)挖掘;預(yù)算決策;模型;應(yīng)用
數(shù)據(jù)挖掘技術(shù)是科技高速發(fā)展的產(chǎn)物。人們生產(chǎn)和生活中產(chǎn)生的數(shù)據(jù)越來(lái)越多,數(shù)據(jù)挖掘技術(shù)可實(shí)現(xiàn)對(duì)大量數(shù)據(jù)的快速整理和分析,能提高數(shù)據(jù)利用價(jià)值。由此可見(jiàn),數(shù)據(jù)挖掘是順應(yīng)時(shí)代發(fā)展的產(chǎn)物,可為人們生活和生產(chǎn)提供較大便利。
1預(yù)測(cè)決策模型分析
預(yù)測(cè)決策系統(tǒng)可以在歷史數(shù)據(jù)的基礎(chǔ)上預(yù)測(cè)未來(lái)數(shù)據(jù),并根據(jù)其他相關(guān)因素對(duì)預(yù)測(cè)結(jié)果進(jìn)行調(diào)整。預(yù)測(cè)決策系統(tǒng)要想提高數(shù)據(jù)預(yù)測(cè)精準(zhǔn)度,就需要將不同的預(yù)測(cè)決策模型組合在一起,多個(gè)預(yù)測(cè)決策模型組合在一起,可以滿足事物發(fā)展多樣性的需求。通常情況下,人工神經(jīng)網(wǎng)絡(luò)法是企業(yè)預(yù)測(cè)人員在預(yù)測(cè)決策模型構(gòu)建中經(jīng)常采取的預(yù)測(cè)決策方法。預(yù)測(cè)決策模型可檢測(cè)與識(shí)別歷史序列中不良數(shù)據(jù),能確保預(yù)測(cè)精度。預(yù)測(cè)人員也可以根據(jù)實(shí)際情況選取更為合適的預(yù)測(cè)決策方法,并將不同方法下的預(yù)測(cè)結(jié)果進(jìn)行比較,之后綜合分析,得出最終的預(yù)測(cè)結(jié)果。構(gòu)成預(yù)測(cè)決策系統(tǒng)的結(jié)構(gòu)主要有四種,分別是模型庫(kù)、數(shù)據(jù)庫(kù)、綜合分析庫(kù)以及算法庫(kù)[1-2]。
2基于數(shù)據(jù)挖掘的預(yù)測(cè)決策模型的應(yīng)用
2.1預(yù)測(cè)決策模型
常規(guī)預(yù)測(cè)模型、初級(jí)模型以及專用模型是預(yù)測(cè)決策常見(jiàn)的模型類型。預(yù)測(cè)決策模型在構(gòu)建時(shí)可以由用戶自定義模型中的參數(shù),這樣可以將充分的空間開(kāi)放給用戶,實(shí)現(xiàn)人自身的經(jīng)驗(yàn)與計(jì)算機(jī)之間的有機(jī)銜接,提高預(yù)測(cè)決策精度。
2.2預(yù)測(cè)決策策略
2.2.1基于模型庫(kù)的預(yù)測(cè)決策模型管理
該環(huán)節(jié)需要構(gòu)建預(yù)測(cè)決策模型庫(kù)和方法庫(kù),模型庫(kù)和方法庫(kù)可以將計(jì)算機(jī)與人本身的經(jīng)驗(yàn)結(jié)合在一起,由此提高預(yù)測(cè)決策精度。
2.2.2組合模型預(yù)測(cè)決策技術(shù)
組合模型預(yù)測(cè)決策技術(shù)可以預(yù)測(cè)決策相應(yīng)的序列量。該環(huán)節(jié)可供預(yù)測(cè)決策人員選擇的模型較多。一般情況下數(shù)學(xué)模型帶有較強(qiáng)的抽象性,且多數(shù)自然規(guī)律難以使用單一數(shù)學(xué)模型表示出來(lái),因此也不能確保預(yù)測(cè)決策模型精度。不同類型的模型組合在一起可以提高預(yù)測(cè)決策模型精度,不同類型模型組合在一起形成的綜合模型,可更加全面地對(duì)自然規(guī)律進(jìn)行描述。
2.2.3預(yù)測(cè)決策過(guò)程控制技術(shù)
預(yù)測(cè)決策值尚未尚未得到證實(shí)之前,對(duì)于預(yù)測(cè)決策工作人員來(lái)說(shuō)最關(guān)心的問(wèn)題就是預(yù)測(cè)決策系統(tǒng)所得預(yù)測(cè)決策結(jié)果是否與預(yù)測(cè)決策精度要求相一致。預(yù)測(cè)決策系統(tǒng)采用虛擬預(yù)測(cè)決策,可虛擬預(yù)測(cè)決策近期已知的數(shù)據(jù),對(duì)數(shù)據(jù)條件變化下預(yù)測(cè)決策結(jié)果穩(wěn)定性、虛擬預(yù)測(cè)決策精度以及擬合精度等進(jìn)行考察,由此得到更為精確的預(yù)測(cè)決策精度,將自動(dòng)選擇預(yù)測(cè)決策模型功能提供給預(yù)測(cè)決策工作人員。
2.2.4歷史數(shù)據(jù)預(yù)處理技術(shù)
為了獲取最好的預(yù)測(cè)效果,要確保預(yù)測(cè)決策歷史數(shù)據(jù)的合理性,預(yù)測(cè)決策系統(tǒng)需要對(duì)歷史數(shù)據(jù)展開(kāi)分析確保其合理性。歷史數(shù)據(jù)中需要將人為因素帶來(lái)的錯(cuò)誤去除,同時(shí)也要去除統(tǒng)計(jì)口徑不一致帶來(lái)的誤差,避免突發(fā)事件或者特殊原因影響統(tǒng)計(jì)數(shù)據(jù)。
2.2.5結(jié)果評(píng)價(jià)和參數(shù)自動(dòng)修正技術(shù)
預(yù)測(cè)決策結(jié)束后伴隨實(shí)際數(shù)據(jù)的產(chǎn)生,為了確保預(yù)測(cè)決策精度,系統(tǒng)需要對(duì)所得數(shù)據(jù)進(jìn)行全面性分析,以此來(lái)修正預(yù)測(cè)決策模型參數(shù)。全部的誤差分析結(jié)果都需要保存在用戶指定的信息文件中。這樣可方便用戶及時(shí)查閱,起到校正預(yù)測(cè)決策數(shù)據(jù)的作用。具體業(yè)務(wù)實(shí)踐過(guò)程中離不開(kāi)人工干預(yù),以人工的方式對(duì)預(yù)測(cè)決策結(jié)果進(jìn)行干預(yù),便于預(yù)測(cè)決策人員積累更多的經(jīng)驗(yàn)。因此越策決策系統(tǒng)模型構(gòu)建中需要重視人工對(duì)預(yù)測(cè)決策結(jié)果的干預(yù)。
2.3系統(tǒng)框架
數(shù)據(jù)倉(cāng)庫(kù)與管理、前端報(bào)表分析數(shù)據(jù)展示與設(shè)計(jì)以及中間應(yīng)用服務(wù)器調(diào)優(yōu)與設(shè)置是系統(tǒng)框架過(guò)程的主要結(jié)構(gòu)。其中數(shù)據(jù)倉(cāng)庫(kù)與管理主要包括構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)結(jié)構(gòu)、生成目標(biāo)數(shù)據(jù)以及管理并維護(hù)數(shù)據(jù)倉(cāng)庫(kù)主題數(shù)據(jù)等。Web服務(wù)器和報(bào)表分析應(yīng)用服務(wù)器是中間應(yīng)用服務(wù)器主要的構(gòu)成部分。其中WebLogic是Web服務(wù)器主要的應(yīng)用服務(wù)器。報(bào)表分析應(yīng)用服務(wù)器采用最先進(jìn)的商業(yè)智能軟件,可管理并描述元數(shù)據(jù)。加上四級(jí)緩沖技術(shù)可快速提取用戶數(shù)據(jù)內(nèi)容。主題構(gòu)架與屬性定制環(huán)節(jié),借助Microstrategy的Architect構(gòu)架體系可靈活定義主題,并任意增刪有關(guān)屬性,滿足用戶自助式設(shè)計(jì)的需求,不斷擴(kuò)充系統(tǒng)功能。、前端報(bào)表分析數(shù)據(jù)展示與設(shè)計(jì)可借助圖形和表格結(jié)合的方式,對(duì)不一樣的主題進(jìn)行分析。主題分析中可采用的分析手段較多,如切片分析和鉆取分析等,以此滿足不同屬性的多角度分析和多方位轉(zhuǎn)換分析的目的。
2.4數(shù)據(jù)抽取
數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)生成的關(guān)鍵環(huán)節(jié)就是數(shù)據(jù)抽取。在抽取數(shù)據(jù)的過(guò)程中,系統(tǒng)可展示出詳細(xì)的日志。所展示的日志包括的內(nèi)容較為全面,如源數(shù)據(jù)的正確性校驗(yàn)、數(shù)據(jù)抽取的相關(guān)分析、主題抽取情況的說(shuō)明等。根據(jù)不同單位需求將所抽取的日志向各個(gè)部門(mén)工作人員轉(zhuǎn)發(fā),并對(duì)上報(bào)數(shù)據(jù)進(jìn)行更正。數(shù)據(jù)經(jīng)審核驗(yàn)證后,會(huì)進(jìn)一步匯總、聚集,處理后的數(shù)據(jù)可向?qū)?yīng)的數(shù)據(jù)表中自動(dòng)插入。只讀數(shù)據(jù)是基礎(chǔ)數(shù)據(jù)生成后的常見(jiàn)形式,只讀形式下前端分析人員只具備數(shù)據(jù)分析的權(quán)限,沒(méi)有修改基礎(chǔ)數(shù)據(jù)的權(quán)限[3-4]。
3結(jié)語(yǔ)
綜上所述,以上就是本文對(duì)基于數(shù)據(jù)挖掘的預(yù)測(cè)決策模型應(yīng)用內(nèi)容的有關(guān)分析,希望對(duì)該領(lǐng)域研究有一定的幫助。
參考文獻(xiàn):
[1]蔣水賓. 基于多屬性排序決策模型的生態(tài)效率多源異構(gòu)數(shù)據(jù)挖掘研究[D]. 天津:天津大學(xué),2017.
[2]孫鈺. 基于數(shù)據(jù)挖掘的電商促銷活動(dòng)效應(yīng)與銷量預(yù)測(cè)研究[D]. 上海:東華大學(xué),2017.
[3]高明亮,高珊,于闖,等. 融合RCM、PHM和數(shù)據(jù)挖掘的城市軌道交通車輛維護(hù)決策技術(shù)研究[J]. 城市軌道交通研究,2021,24(2):64-68.
[4]韋高潔. 基于數(shù)據(jù)挖掘的P2P網(wǎng)貸獲貸結(jié)果影響因素及放貸決策模型研究[D]. 上海:上海師范大學(xué),2017.
安徽大學(xué)國(guó)際教育學(xué)院 安徽 合肥 230039