王雅怡
(蘇州大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,江蘇 蘇州 215000)
數(shù)據(jù)挖掘技術(shù)是軟件工程中的組要組成部分,占據(jù)其核心地位。數(shù)據(jù)挖掘技術(shù)的使用,在很大程度上提升了軟件工程的應(yīng)用效益,對(duì)軟件工程中的大量數(shù)據(jù)進(jìn)行了整理與分析,使其作用和效果得以充分發(fā)揮。所以,加強(qiáng)數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用是極其重要的。
數(shù)據(jù)挖掘技術(shù)就是從大量、復(fù)雜、混亂的數(shù)據(jù)資源中找到自己所需要的數(shù)據(jù)信息,并發(fā)揮其重要作用。數(shù)據(jù)挖掘技術(shù)主要包括專用數(shù)據(jù)挖掘系統(tǒng)、確保挖掘技術(shù)的準(zhǔn)確性、可視化的挖掘結(jié)果以及多層次數(shù)據(jù)挖掘。
專用數(shù)據(jù)挖掘系統(tǒng)就是通過(guò)不同的數(shù)據(jù)挖掘系統(tǒng)處理不同的信息資源,且一個(gè)完整的數(shù)據(jù)挖掘系統(tǒng)可以在不同的數(shù)據(jù)庫(kù)中進(jìn)行信息處理。
確保挖掘數(shù)據(jù)的準(zhǔn)確性,就是要保證數(shù)據(jù)挖掘系統(tǒng)在進(jìn)行數(shù)據(jù)整理時(shí),所挖掘的數(shù)據(jù)信息是滿足用戶使用需求的,并可以抑制無(wú)效數(shù)據(jù)顯示,將有效數(shù)據(jù)及時(shí)呈現(xiàn)出來(lái),對(duì)于相近數(shù)據(jù)可提示顯示。
可視化的數(shù)據(jù)挖掘結(jié)果就是要確保數(shù)據(jù)挖掘系統(tǒng)所挖掘的數(shù)據(jù)在不使用解碼方式的情況下進(jìn)行處理,并將結(jié)果通過(guò)可視化處理將其顯示。
多層次數(shù)據(jù)挖掘是滿足數(shù)據(jù)在數(shù)據(jù)資源中的動(dòng)態(tài)變化或以交互形式存在。
軟件工程中所包含的信息多種且復(fù)雜,我們可以將這些數(shù)據(jù)分為兩個(gè)類別,一類是結(jié)構(gòu)化數(shù)據(jù),一類是非結(jié)構(gòu)化數(shù)據(jù)。其中,軟件代碼對(duì)非結(jié)構(gòu)化數(shù)據(jù)有著重要作用,而軟件版本信息對(duì)結(jié)構(gòu)化數(shù)據(jù)會(huì)產(chǎn)生重要影響。結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)之間有著非常密切的聯(lián)系,而數(shù)據(jù)有效利用的實(shí)現(xiàn)就是通過(guò)一定技術(shù)在結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)中找到相應(yīng)的規(guī)律。而數(shù)據(jù)挖據(jù)技術(shù)剛好滿足這樣的需求,在軟件工程中通過(guò)數(shù)據(jù)挖掘技術(shù)對(duì)結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行整合與處理,可提升整個(gè)軟件工程和數(shù)據(jù)資源的有效性。
數(shù)據(jù)挖掘技術(shù)在實(shí)際生產(chǎn)生活中被廣泛應(yīng)用,通過(guò)對(duì)數(shù)據(jù)挖掘技術(shù)的應(yīng)用,我們可以對(duì)實(shí)際情況有更加準(zhǔn)確的評(píng)價(jià),從而得到一個(gè)最優(yōu)的結(jié)果。但是,面對(duì)錯(cuò)綜復(fù)雜的信息數(shù)據(jù)時(shí),由于沒(méi)有一個(gè)統(tǒng)一的標(biāo)準(zhǔn),造成軟件信息的復(fù)雜性,而且在信息標(biāo)書(shū)方面有存在著一定的差異性,導(dǎo)致信息獲取者無(wú)法有效地對(duì)數(shù)據(jù)信息進(jìn)行對(duì)比與應(yīng)用。所以,信息獲取者對(duì)此評(píng)價(jià)不一致,導(dǎo)致信息缺乏容易標(biāo)準(zhǔn)。
軟件工程中所應(yīng)用設(shè)計(jì)到的數(shù)據(jù)信息一般都會(huì)在儲(chǔ)存在軟件代碼庫(kù)中,也就是我們通常所說(shuō)的數(shù)據(jù)庫(kù)中。如果這些數(shù)據(jù)信息得以充分利用,可以最大程度地提高軟件系統(tǒng)開(kāi)發(fā)人員的工作效率,幫助系統(tǒng)工作人員對(duì)系統(tǒng)框架有更進(jìn)一步的了解。在軟件工程中,每一次對(duì)統(tǒng)一軟件的開(kāi)發(fā)循環(huán),都會(huì)產(chǎn)生大量的數(shù)據(jù),而這些數(shù)據(jù)就是軟件系統(tǒng)開(kāi)發(fā)時(shí)所需要挖掘的數(shù)據(jù)。數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用主要體現(xiàn)在開(kāi)源軟件開(kāi)發(fā)、軟件工程管理、軟件故障檢測(cè)以及建立數(shù)據(jù)信息軟件中等。
開(kāi)源軟件就是源代碼,而在開(kāi)發(fā)源代碼時(shí)會(huì)使用到大量的數(shù)據(jù)信息。在這種情況下,如果可以將軟件開(kāi)發(fā)所需要的數(shù)據(jù)充分挖掘出來(lái),就可以最大程度地降低開(kāi)源軟件開(kāi)發(fā)的難度,從而提升開(kāi)源軟件的質(zhì)量與開(kāi)發(fā)效率。
軟件工程管理工作主要是組織人員以及處理軟件版本中存在的問(wèn)題。在整個(gè)軟件工程管理過(guò)程中,會(huì)涉及和使用到大量的數(shù)據(jù)信息,因此,數(shù)據(jù)挖掘技術(shù)在軟件工程管理中的合理應(yīng)用是十分重要的。人力資源的分析與調(diào)配對(duì)于軟件工程項(xiàng)目中的組織管理人員而言,實(shí)質(zhì)上就是一個(gè)數(shù)據(jù)管理過(guò)程。尤其是大規(guī)模的軟件工程,其中的人員組織結(jié)構(gòu)十分復(fù)雜,在這種情況下進(jìn)行人力資源的分析與調(diào)配就需要數(shù)據(jù)挖掘技術(shù)對(duì)相關(guān)信息進(jìn)行挖掘和處理,從而大大節(jié)省人力和時(shí)間成本。
軟件的故障檢測(cè)工作是數(shù)據(jù)挖掘系統(tǒng)中的重要工作,其中,軟件測(cè)試的具體項(xiàng)目,包括軟件系統(tǒng)故障的數(shù)據(jù)收集、轉(zhuǎn)換與清理工作;對(duì)信息系統(tǒng)的數(shù)據(jù)進(jìn)行采集、抽取,并選擇出合適的軟件系統(tǒng)數(shù)據(jù)挖掘信息;對(duì)軟件系統(tǒng)中所出現(xiàn)的故障、漏洞進(jìn)行準(zhǔn)確定位和描述,這都屬于軟件故障檢測(cè)工作的具體任務(wù)。軟件故障檢測(cè)可以及時(shí)發(fā)現(xiàn)軟件系統(tǒng)在開(kāi)發(fā)或應(yīng)用過(guò)程中的問(wèn)題,同時(shí),采取有效措施對(duì)其進(jìn)行處理與解決。這樣不僅降低了系統(tǒng)維護(hù)成本,還有效地增強(qiáng)了軟件系統(tǒng)的運(yùn)行安全性,并為其提供了良好的運(yùn)行環(huán)境。
數(shù)據(jù)庫(kù)是一個(gè)有效數(shù)據(jù)的存儲(chǔ)空間,通過(guò)建立數(shù)據(jù)信息軟件可實(shí)現(xiàn)軟件系統(tǒng)的開(kāi)發(fā)以及應(yīng)用,主要體現(xiàn)在源數(shù)據(jù)的獲取、源數(shù)據(jù)的處理、倉(cāng)庫(kù)管理等方面。
數(shù)據(jù)庫(kù)建模是將現(xiàn)有數(shù)據(jù)構(gòu)建成一個(gè)安全、合理的數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)包含用戶所需要的信息、用戶評(píng)估信息以及軟件系統(tǒng)信息、可行性研究報(bào)告等。
數(shù)據(jù)挖掘執(zhí)行記錄是通過(guò)分析主程序的路徑,發(fā)現(xiàn)程序代碼之間所存有的相關(guān)關(guān)系。實(shí)質(zhì)上,數(shù)據(jù)挖掘執(zhí)行記錄就是通過(guò)對(duì)相關(guān)執(zhí)行路徑的分析,進(jìn)行逆向建模,從而達(dá)到一定的目的。數(shù)據(jù)挖掘執(zhí)行記錄主要在于能夠驗(yàn)證、維護(hù)和了解程序。
在版本信息中應(yīng)用數(shù)據(jù)挖掘系統(tǒng)時(shí),需要注意項(xiàng)目參與者的相關(guān)檔案必須是相同的,這樣一來(lái),不僅為信息挖掘提供了方便,也對(duì)系統(tǒng)更新來(lái)說(shuō)較為方便。利用版本信息對(duì)開(kāi)發(fā)軟件以及系統(tǒng)管理進(jìn)行控制在軟件工程中是一件十分尋常的工作,通過(guò)對(duì)不同版本信息的利用,可以獲取到數(shù)據(jù)信息和資源,還能對(duì)其存在的漏洞和問(wèn)題進(jìn)行檢查。隨著數(shù)據(jù)挖掘系統(tǒng)在軟件工程中的應(yīng)用越來(lái)越廣泛,軟件技術(shù)人員對(duì)系統(tǒng)的把控也有所增強(qiáng),推動(dòng)了軟件的良好開(kāi)發(fā)。
綜上所述,數(shù)據(jù)挖掘技術(shù)具有極高的使用價(jià)值,尤其是在軟件工程中的應(yīng)用。加強(qiáng)數(shù)據(jù)挖掘技術(shù),促進(jìn)數(shù)據(jù)挖掘技術(shù)的發(fā)展,對(duì)軟件工程的發(fā)展與應(yīng)用具有重要意義。隨著數(shù)據(jù)挖掘技術(shù)的應(yīng)用越來(lái)越廣泛,數(shù)據(jù)挖掘技術(shù)在軟件工程中也需要更加可靠、穩(wěn)定。
[1]李楨.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用[J].通訊世界,2017(12):47-48.
[2]蔣維,石華.軟件工程數(shù)據(jù)挖掘技術(shù)研究進(jìn)展淺析[J].電腦迷,2017(04):4,7.