• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      數(shù)據(jù)挖掘技術(shù)在軟件工程的應(yīng)用探索

      2016-08-26 23:25:56孫潔
      中國科技博覽 2016年17期
      關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù)軟件工程應(yīng)用

      孫潔

      [摘 要]當(dāng)前是信息化的大數(shù)據(jù)時代,人們每天都生活在大量的數(shù)據(jù)中,生活和工作中信息無處不在,但如何能夠在海量信息中定位自己的需求信息是現(xiàn)代人關(guān)注的焦。數(shù)據(jù)挖掘技術(shù)很好的解決了這個問題,不僅能夠?qū)崿F(xiàn)信息的定位還能在短時間內(nèi)完成,大大的縮短了處理數(shù)據(jù)的時間。本文就以數(shù)據(jù)挖掘技術(shù)為中心點(diǎn),首先對其概念進(jìn)行簡單的闡述,之后在此基礎(chǔ)上分析了軟件工程中的應(yīng)用,以期能為相關(guān)專業(yè)的技術(shù)人員提供一定的技術(shù)參考。

      [關(guān)鍵詞]數(shù)據(jù)挖掘技術(shù);軟件工程;應(yīng)用

      中圖分類號:TP311.5 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-914X(2016)17-0267-01

      1.數(shù)據(jù)挖掘技術(shù)概述

      所謂數(shù)據(jù)挖掘,主要指的是在大量的數(shù)據(jù)信息中利用科學(xué)、有效的算法第一時間獲取到有用信息的篩選過程。大量的信息存在于生產(chǎn)和生活領(lǐng)域,使得人們在處理事情是無從下手,這樣大大降低了人們的工作效率,也浪費(fèi)了工作人員寶貴的時間。而這一問題通過數(shù)據(jù)挖掘技術(shù)的使用得到了很好的解決。

      1.1 數(shù)據(jù)挖掘技術(shù)所采用的方法

      在具體的操作中,數(shù)據(jù)挖掘技術(shù)會通過很多方法來使任務(wù)得以完成。具體的方法有如下幾種:

      1.1.1 遺傳算法的使用

      所謂遺傳算法,主要是指基于生物自然選擇與遺傳激勵的隨機(jī)搜索算法,也是數(shù)據(jù)挖掘技術(shù)常用的一種操作方法[1]。遺傳算法的有點(diǎn)就在于表面上看似無聯(lián)系的事物,卻能在事物模型間建立相關(guān)的練習(xí),實(shí)現(xiàn)事物之間共同發(fā)展,現(xiàn)在生物界越來越重視的遺傳基因等的研究,所以這種方法很受人們的歡迎。

      1.1.2 采用決策樹方法

      這種方法主要用于對信息的分類和整合,在遇到大量的信息的時候,能夠在短時間內(nèi)找出關(guān)鍵的信息,能夠使信息分類的快速化和簡單化,并且保證了信息分類的準(zhǔn)確度,但是此方法的不足之處就在于具有較差的抗噪性能,不能全面的來表述較為復(fù)雜的概念。

      1.1.3 采用統(tǒng)計分析法

      往往會利用回歸分析和主成分分析等方法來分析數(shù)據(jù)庫字段之間的關(guān)系。在字段之間的關(guān)系包括相關(guān)關(guān)系,函數(shù)關(guān)系也是其中的一種,不同的是函數(shù)關(guān)系可以用公式來表示,而相關(guān)關(guān)系則不能通過公示來表示關(guān)系,系統(tǒng)分析法的使用為這種關(guān)系的分析提供了便利。

      1.1.4 采用可視化技術(shù)

      可視化技術(shù)是采用一些圖表來對數(shù)據(jù)進(jìn)行表現(xiàn),便于對數(shù)據(jù)的理解,比如,使用簡單圖形來展示存在于數(shù)據(jù)庫中的多個數(shù)據(jù),使研究者看起來一目了然,使單調(diào)的數(shù)據(jù)形象化,更容易掌握數(shù)據(jù)的相關(guān)信息。

      1.1.5 采用神經(jīng)網(wǎng)絡(luò)方法

      它模擬人腦神經(jīng)元結(jié)構(gòu),以 MP 模型和Hebb學(xué)習(xí)規(guī)則為基礎(chǔ),用神經(jīng)網(wǎng)絡(luò)連接的權(quán)值表示知識,其學(xué)習(xí)體現(xiàn)在神經(jīng)網(wǎng)絡(luò)權(quán)值的逐步計算上。前饋式網(wǎng)絡(luò)、反饋式網(wǎng)絡(luò)和自組織網(wǎng)絡(luò)是常用的三種神經(jīng)網(wǎng)絡(luò)模型,分別用于預(yù)測、聯(lián)想記憶和聚類等。

      2.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用

      2.1關(guān)于程序代碼及結(jié)構(gòu)方面的挖掘

      ①克隆代碼檢測的方法??寺〈a主要指的是根據(jù)軟件工程運(yùn)行需求,對某一代碼段進(jìn)行復(fù)制、粘貼,若有特殊需求,也可以對部分代碼進(jìn)行適當(dāng)更改,對于上述代碼的檢測主要是為了避免故障傳播,對系統(tǒng)進(jìn)行簡要維護(hù),以此來滿足軟件系統(tǒng)運(yùn)行需求。目前,克隆代碼檢測的方法主要包括4種,即文本對比、標(biāo)識符對比、度量和程序結(jié)構(gòu)[2]。每一種檢測方法都有其不同的檢測流程和判斷依據(jù),需要結(jié)合實(shí)際情況選取最佳的檢測方法。

      ②Aspect 挖掘。Aspect 挖掘就是我們常說的橫切關(guān)注點(diǎn)挖掘,在軟件工程系統(tǒng)中,Aspect 挖掘是系統(tǒng)改造成面向方面軟件所必須要處理好的重要問題。在此項(xiàng)問題的處理中,可供采用的方法有很多,最具針對性的就是度量分析法和形式概念分析法。上述兩種方法可以利用候選集的重構(gòu)將橫切點(diǎn)關(guān)注挖掘相關(guān)問題有效解決。實(shí)際上,數(shù)據(jù)挖掘技術(shù)還可以在很多方面產(chǎn)生不錯的影響。

      ③代碼檢索。在軟件開發(fā)方法學(xué)中提倡著復(fù)用這個重要的原則,近年來有一個軟件復(fù)用這方面領(lǐng)域里的很重重要的議題,也就是關(guān)于在本地或者是面向 WEB 這些代碼庫中檢索出符合現(xiàn)階段項(xiàng)目的代碼之類的議題,已經(jīng)出現(xiàn)了幾種比較有代代表性的方式,比如分類存儲并檢索、基于輸入-輸出映射的檢索、基于構(gòu)件形式化描述、基于代碼相似性等等方法,這些方式主要會涉及到有關(guān)于聚類、分類、語義分析等等幾種比較主要的技術(shù)。由于其Web的應(yīng)用范圍不斷的擴(kuò)大,也就不再單單只有文檔在其中,還有許多猶如 Google Cod 以及 Mica 等等類型的代碼搜索引擎也隨著那些 Web 中的可供參考的代碼而出現(xiàn)

      2.2軟件項(xiàng)目管理中數(shù)據(jù)挖掘技術(shù)的應(yīng)用

      數(shù)據(jù)挖掘技術(shù)在項(xiàng)目管理中的應(yīng)用主要體現(xiàn)在兩個方面,即對組織關(guān)系的挖掘和對版本控制信息的挖掘。由于軟件項(xiàng)目管理是一個全面而又系統(tǒng)的工程,因此,有關(guān)組織關(guān)系的挖掘包含了多個方面的內(nèi)容,最主要的就是對人力資源的有效協(xié)調(diào)和分配。另一方面是對版本控制信息的挖掘,版本信息控制的功能主要是為工作人員查看版本信息提供方便,數(shù)據(jù)挖掘技術(shù)在此方面的應(yīng)用一方面可以自動對系統(tǒng)修復(fù)情況進(jìn)行檢測,并在此基礎(chǔ)上為系統(tǒng)提供警示作用,另一方面則可以避開很多常見錯誤,確保系統(tǒng)正常運(yùn)行,以此來提高軟件項(xiàng)目管理水平。

      2.3故障檢測中數(shù)據(jù)挖掘技術(shù)的應(yīng)用

      在軟件工程系統(tǒng)不斷優(yōu)化與完善的今天,勢必要對故障檢測方法進(jìn)行改進(jìn)。數(shù)據(jù)挖掘技術(shù)的應(yīng)用充分滿足了這一需求。數(shù)據(jù)挖掘技術(shù)對故障的檢測主要是從兩個方面展開,分別為程序說明和交互模式。對程序說明進(jìn)行挖掘主要是為了對于系統(tǒng)運(yùn)行相關(guān)的信息進(jìn)行跟蹤檢測,便于發(fā)現(xiàn)系統(tǒng)運(yùn)行問題,從而做到對系統(tǒng)的有效檢測和維護(hù)。就當(dāng)前常用的挖掘方法來看,主要可分為基于規(guī)則和基于自動化兩種。兩種方法分別依據(jù)程序行為規(guī)則和API規(guī)則開展挖掘工作。

      3.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用方法

      3.1關(guān)聯(lián)方法

      挖掘技術(shù)應(yīng)用與軟件工程中的關(guān)聯(lián)方法,其規(guī)則在于發(fā)現(xiàn)大量數(shù)據(jù)中所具有的相關(guān)聯(lián)系及有趣關(guān)聯(lián)。并且關(guān)聯(lián)規(guī)則具有兩個重要特征,其一為支持度,表示為 P(A ∪B),表明 A、 B 兩個子集在事物集中出現(xiàn)的概率是相同的;其二為置信度,可表示為 P(B|A),說明 A 在事物集中所具有的概率,同樣 B 也會出現(xiàn)[3]。

      3.2聚類方法

      聚類方式的應(yīng)用,顧名思義,便是把對象數(shù)據(jù)分為多個簇或類,并且保證統(tǒng)一類或簇中的數(shù)據(jù)的相似度較高,同時不同類或簇中的對象具有明顯的差別。

      3.3分類方法

      分類方式的應(yīng)用,主要是對離散值和分類標(biāo)號進(jìn)行操作,一般情況下,首先需建立起相應(yīng)的模型,對其概念集和數(shù)據(jù)類集進(jìn)行描述,之后應(yīng)用模型完成分類

      4.結(jié)語

      綜上所述,數(shù)據(jù)挖掘技術(shù)是軟件工程向更加完善、優(yōu)化方向發(fā)展的必然之路,更是時代發(fā)展的要求。隨著社會信息化程度的不斷加深,數(shù)據(jù)挖掘技術(shù)的應(yīng)用將會更加的廣泛。研究人員對此項(xiàng)技術(shù)也要引起重視,通過不斷的研究和探索,進(jìn)一步的提升其自身的水平及其應(yīng)用的價值,為人類的不斷發(fā)展,社會的進(jìn)步體現(xiàn)更大的價值。

      參考文獻(xiàn):

      [1]李明江,唐穎,周力軍. 數(shù)據(jù)挖掘技術(shù)及應(yīng)用[J]. 中國新通信,2012,22:66-67+74.

      [2]陳建樺. 數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用研究[J]. 硅谷,2014,01:73+51.

      [3]劉玉峰. 數(shù)據(jù)挖掘技術(shù)在軟件知識庫中的應(yīng)用研究[D].廣西師范大學(xué),2010.

      猜你喜歡
      數(shù)據(jù)挖掘技術(shù)軟件工程應(yīng)用
      基于Web的數(shù)據(jù)挖掘技術(shù)與相關(guān)研究
      數(shù)據(jù)挖掘技術(shù)在生物信息學(xué)中的應(yīng)用
      數(shù)據(jù)挖掘技術(shù)在CRM中的應(yīng)用
      基于南京地鐵AFC系統(tǒng)的數(shù)據(jù)挖掘
      依托工作室的軟件工程實(shí)踐教學(xué)研究
      基于工程教育認(rèn)證的《軟件工程》課程教學(xué)質(zhì)量建設(shè)研究 
      關(guān)于提高軟件工程實(shí)踐教學(xué)質(zhì)量的幾點(diǎn)思考
      關(guān)于如何創(chuàng)新和完善計算機(jī)軟件工程管理的探討
      GM(1,1)白化微分優(yōu)化方程預(yù)測模型建模過程應(yīng)用分析
      科技視界(2016年20期)2016-09-29 12:03:12
      煤礦井下坑道鉆機(jī)人機(jī)工程學(xué)應(yīng)用分析
      科技視界(2016年20期)2016-09-29 11:47:01
      唐河县| 白沙| 南江县| 赫章县| 台东县| 永泰县| 新沂市| 天门市| 甘肃省| 太谷县| 池州市| 赣州市| 商水县| 通海县| 蒙自县| 盈江县| 重庆市| 丹江口市| 淅川县| 静乐县| 达日县| 大足县| 民县| 上高县| 石楼县| 西盟| 揭东县| 武义县| 金秀| 鞍山市| 都安| 泰安市| 昌江| 龙井市| 达日县| 太仆寺旗| 凯里市| 南木林县| 南通市| 东兰县| 漾濞|