張 倩
(河南經(jīng)貿(mào)職業(yè)學(xué)院,河南 鄭州 450018)
隨著科學(xué)技術(shù)的進(jìn)步,信息技術(shù)開始在旋轉(zhuǎn)機(jī)械故障診斷過程中發(fā)揮越來越重要的作用。實(shí)現(xiàn)對(duì)故障診斷知識(shí)的有效獲取,必須科學(xué)處理相關(guān)信息。然而,現(xiàn)階段我們?cè)诓捎迷摷夹g(shù)進(jìn)行知識(shí)庫構(gòu)建、故障知識(shí)獲取、開展知識(shí)管理的過程中仍然存在很多問題,很難實(shí)現(xiàn)大的突破。
SQL Server 2005 屬于關(guān)系數(shù)據(jù)庫管理系統(tǒng)的一種。在設(shè)計(jì)和實(shí)施數(shù)據(jù)挖掘系統(tǒng)的過程中,借助分析服務(wù)功能(AS)中各種數(shù)據(jù)挖掘技術(shù)能夠發(fā)揮良好的推動(dòng)作用。該管理系統(tǒng)具備良好的報(bào)表服務(wù)功能,可以從某個(gè)數(shù)據(jù)集內(nèi)順利找出數(shù)據(jù)模式,同時(shí)針對(duì)具體結(jié)果實(shí)施全面檢查分析,挖掘存在的問題,促進(jìn)平臺(tái)的有效實(shí)現(xiàn)。
決策樹屬于樹形結(jié)構(gòu)圖的一種,通常選擇的是自上而下的樹形結(jié)構(gòu)。對(duì)其具體結(jié)構(gòu)進(jìn)行詳細(xì)分析可知,決策樹的開始通常表現(xiàn)為根節(jié)點(diǎn),針對(duì)某個(gè)屬性值集的測(cè)試,通常表現(xiàn)為具體的中間節(jié)點(diǎn);針對(duì)具體的測(cè)試結(jié)果,通常以決策樹的分支進(jìn)行表示,而針對(duì)具體類別,則以決策樹葉節(jié)點(diǎn)來表示。依靠決策樹方法,我們能夠?qū)崿F(xiàn)對(duì)其類別因變量具體分布的全面分析,并根據(jù)具體的預(yù)測(cè)變量對(duì)個(gè)例的發(fā)展變化趨勢(shì)開展科學(xué)預(yù)測(cè)。
CART 以及C4.5 等均屬于常用的決策樹方法,此類方法一般在小規(guī)模數(shù)據(jù)集分析工作中的應(yīng)用較為廣泛,通常很難針對(duì)海量數(shù)據(jù)進(jìn)行有效分析?,F(xiàn)階段,工程應(yīng)用中充斥著各種復(fù)雜的數(shù)據(jù)挖掘工作,我們必須要對(duì)大量的數(shù)據(jù)集進(jìn)行有效分析,才能促進(jìn)工程應(yīng)用的順利進(jìn)行,以分類回歸算法作為基礎(chǔ)的可伸縮決策樹算法就是在這樣的情況下被提出的。此決策樹算法選擇借助數(shù)據(jù)分析,利用深度優(yōu)先策略,有效構(gòu)建決策樹。這種方式能夠保證計(jì)算機(jī)在內(nèi)存有效的情況下,針對(duì)大量記錄以及屬性開展訓(xùn)練,在訓(xùn)練過程中迅速而有效地在數(shù)據(jù)庫內(nèi)開展數(shù)據(jù)集挖掘。因?yàn)樵摲椒軌蚩朔胀ㄍ诰蛩惴ㄖ斜仨氁啻卧L問數(shù)據(jù)庫的弊端,可以大幅度減少錯(cuò)誤的發(fā)生,因此受到越來越多用戶的青睞。
應(yīng)用數(shù)據(jù)庫技術(shù),能夠針對(duì)海量數(shù)據(jù)實(shí)現(xiàn)科學(xué)管理,創(chuàng)造良好的管理平臺(tái),借助微軟決策方法,可以針對(duì)海量數(shù)據(jù)集的具體分析創(chuàng)造有效的方法途徑。為了實(shí)現(xiàn)對(duì)旋轉(zhuǎn)機(jī)械故障的有效獲取,進(jìn)一步發(fā)展數(shù)據(jù)驅(qū)動(dòng),我們必須要全面了解旋轉(zhuǎn)機(jī)械故障知識(shí)以及數(shù)據(jù)庫技術(shù)的具體功能和特點(diǎn),科學(xué)利用兩者的功能耦合技術(shù),針對(duì)故障知識(shí)的自動(dòng)化獲取制定科學(xué)的解決方案,同時(shí)針對(duì)具體工程應(yīng)用方法開展深入研究。
為了能夠針對(duì)轉(zhuǎn)子故障特征數(shù)據(jù)資源進(jìn)行有效分析,自動(dòng)化獲取相關(guān)故障知識(shí),我們對(duì)故障知識(shí)挖掘數(shù)據(jù)庫進(jìn)行了設(shè)計(jì)和研究,具體設(shè)計(jì)流程如圖1所示。
圖1 系統(tǒng)設(shè)計(jì)及流程圖
對(duì)圖1 中相關(guān)流程進(jìn)行分析,左側(cè)部分對(duì)SQL Server 平臺(tái)上的具體數(shù)據(jù)處理過程進(jìn)行描述,主要包括數(shù)據(jù)庫的設(shè)計(jì)和構(gòu)建、挖掘模塊的設(shè)計(jì)和構(gòu)建以及數(shù)據(jù)挖掘三大部分。右側(cè)部分則針對(duì)數(shù)據(jù)庫的具體構(gòu)建、數(shù)據(jù)挖掘模塊的具體設(shè)計(jì)以及數(shù)據(jù)挖掘和數(shù)據(jù)庫技術(shù)兩者的耦合技術(shù)設(shè)計(jì)及其實(shí)現(xiàn)過程進(jìn)行描述。
圖2 數(shù)據(jù)功能模塊的具體結(jié)構(gòu)
在數(shù)據(jù)挖掘的基礎(chǔ)上設(shè)計(jì)的數(shù)據(jù)庫結(jié)構(gòu)中一般包括三大部分功能模塊,第一個(gè)模塊是特征數(shù)據(jù)庫,第二個(gè)模塊是故障案例庫,第三個(gè)模塊是診斷結(jié)論庫。數(shù)據(jù)功能模塊的具體結(jié)構(gòu)如圖2 所示。其中,特征數(shù)據(jù)庫主要用于對(duì)采集獲得的特征數(shù)據(jù)集進(jìn)行處理,之后妥善進(jìn)行存放;故障案例庫中存放的故障案例類型是具有特殊要求的,要同時(shí)具備案例征兆表以及相應(yīng)決策結(jié)果。前者主要針對(duì)規(guī)則中的條件內(nèi)容進(jìn)行存放,后者則針對(duì)決策結(jié)論內(nèi)容進(jìn)行存放,兩者均選擇“案例號(hào)”實(shí)現(xiàn)外鍵關(guān)聯(lián)。故障知識(shí)庫主要由故障案例庫以及診斷結(jié)論庫共同構(gòu)成,針對(duì)知識(shí)庫的具體維護(hù),一般要求針對(duì)具體案例進(jìn)行添加以及修改,同時(shí)做出刪除處理以及保存處理。深入分析基于數(shù)據(jù)挖掘的數(shù)據(jù)庫,其數(shù)據(jù)源的存儲(chǔ)一般通過關(guān)系數(shù)據(jù)庫的方式來開展。對(duì)于關(guān)系數(shù)據(jù)庫來說,單一的關(guān)系就代表一個(gè)二維表,眾多的二維表共同構(gòu)成數(shù)據(jù)庫,不同的二維表之間借助一樣的屬性名實(shí)現(xiàn)關(guān)聯(lián)。
針對(duì)數(shù)據(jù)挖掘模塊的具體設(shè)計(jì),一般可以借助DMX 語言實(shí)現(xiàn)對(duì)其的有效創(chuàng)建以及處理,同時(shí)針對(duì)數(shù)據(jù)挖掘模塊開展瀏覽管理以及有效預(yù)測(cè)。此外,可以借助可視化界面完成手動(dòng)操作。本次研究采用手動(dòng)方式完成對(duì)數(shù)據(jù)挖掘模塊的構(gòu)建,通過這種方式促進(jìn)人機(jī)交互,同時(shí)對(duì)系統(tǒng)的具體運(yùn)行過程進(jìn)行實(shí)時(shí)監(jiān)測(cè),針對(duì)系統(tǒng)運(yùn)行中存在的問題進(jìn)行診斷,科學(xué)調(diào)節(jié)系統(tǒng)性能。
針對(duì)數(shù)據(jù)源進(jìn)行科學(xué)創(chuàng)建,利用SQL Server 完成分析服務(wù)項(xiàng)目的創(chuàng)建,實(shí)現(xiàn)與數(shù)據(jù)庫的有效連接,科學(xué)創(chuàng)建數(shù)據(jù)源?;诋?dāng)下的關(guān)系數(shù)據(jù)源,確定哪些對(duì)象應(yīng)該包含在數(shù)據(jù)源視圖當(dāng)中,構(gòu)建數(shù)據(jù)源視圖。
決策樹挖掘模型一定要包括有一個(gè)鍵列,包含幾個(gè)輸入列,并且具備一個(gè)可預(yù)測(cè)列,通過輸入列完成數(shù)據(jù)提供,以便開展信息預(yù)測(cè)工作,預(yù)測(cè)列一般存放各種挖掘模型需要預(yù)測(cè)的對(duì)象。程序針對(duì)不同數(shù)據(jù)列的具體屬性進(jìn)行自動(dòng)化檢測(cè),之后針對(duì)數(shù)據(jù)類型開展科學(xué)定義,并將數(shù)據(jù)挖掘模型妥善保存,為協(xié)議階段的規(guī)則提取奠定基礎(chǔ)。
針對(duì)數(shù)據(jù)挖掘模型進(jìn)行有效部署以及處理,構(gòu)建的決策樹可以通過挖掘模型查看器實(shí)現(xiàn)全面查看。對(duì)決策樹挖掘結(jié)果進(jìn)行分析,可發(fā)現(xiàn)決策樹由各種拆分構(gòu)成,能夠針對(duì)診斷規(guī)則進(jìn)行有效顯示,從決策樹的根節(jié)點(diǎn)到?jīng)Q策樹的葉節(jié)點(diǎn)形成的路徑即屬于一條診斷規(guī)則。由決策樹的根節(jié)點(diǎn)至全部葉節(jié)點(diǎn)的路徑組合即為挖掘數(shù)據(jù)模型獲取的所有潛在診斷規(guī)則。
針對(duì)具體診斷規(guī)則進(jìn)行有效提取,完成相應(yīng)驗(yàn)證之后能夠針對(duì)故障診斷工作提供良好依據(jù),將其保存至診斷規(guī)則知識(shí)庫內(nèi),促進(jìn)知識(shí)庫的進(jìn)一步完善。
為了分析和評(píng)價(jià)設(shè)計(jì)完成的系統(tǒng)針對(duì)轉(zhuǎn)子故障知識(shí)發(fā)現(xiàn)過程中的具體應(yīng)用效果,應(yīng)在轉(zhuǎn)子實(shí)驗(yàn)臺(tái)中對(duì)不平衡故障進(jìn)行有效模擬,針對(duì)具體設(shè)計(jì)系統(tǒng)實(shí)施實(shí)驗(yàn)驗(yàn)證。在實(shí)驗(yàn)驗(yàn)證環(huán)節(jié)中分析轉(zhuǎn)子振動(dòng)信號(hào)的具體頻率特征,選擇其中幾種特征構(gòu)建故障識(shí)別的具體特征模式。
[1]李鑫頡,賈振華,吳以嶺.數(shù)據(jù)挖掘方法在中醫(yī)醫(yī)案研究中的現(xiàn)狀分析[J].中國中醫(yī)基礎(chǔ)醫(yī)學(xué)雜志,2012,14(1):45-46.
[2]杜芳芳.基于數(shù)據(jù)挖掘的采購決策系統(tǒng)設(shè)計(jì)[J].中國商貿(mào),2012,13(6):69-72.
[3]劉華.基于數(shù)據(jù)挖掘的數(shù)據(jù)庫營銷研究[J].中國商貿(mào),2012,20(3):205-210.
[4]張翼飛,趙凱.基于決策樹的轉(zhuǎn)子故障自動(dòng)診斷研究[J].計(jì)算機(jī)測(cè)量與控制,2013,16(9):114-115.
[5]劉鳳娟,李建磊.耦合故障轉(zhuǎn)子模型的分析[J].電子測(cè)試,2013,14(12):96-99.