◆米仁沙·艾尼
“互聯(lián)網(wǎng)+”背景下數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用路徑
◆米仁沙·艾尼
(喀什大學(xué)計算機科學(xué)與技術(shù)學(xué)院 新疆 844000)
在軟件工程中實施數(shù)據(jù)挖掘技術(shù)是非常重要的,能夠解決在以往軟件工程中運行卡頓和錯誤的問題,網(wǎng)絡(luò)信息傳輸能夠具備通暢性的特征,在實際工作中需要加強對數(shù)據(jù)挖掘技術(shù)的合理性研究,通過數(shù)據(jù)的傳輸以及整合來提高數(shù)據(jù)最終的處理能力,保證數(shù)據(jù)準確性以及來源的安全性,推動我國軟件工程的穩(wěn)定發(fā)展,因此需要正確地選擇數(shù)據(jù)挖掘技術(shù),為后續(xù)的開發(fā)提供重要的基礎(chǔ)。
軟件工程;數(shù)據(jù)挖掘技術(shù);應(yīng)用研究
隨著科技水平的不斷提高,網(wǎng)絡(luò)通信技術(shù)在不斷進步,對于海量信息來說,需要建立與之匹配的軟件進行過濾以及整合,為了更好地滿足用戶本身的需要,需要充分地利用數(shù)據(jù)挖掘技術(shù)來保證信息的有效整合,提高軟件本身的數(shù)據(jù)處理能力。在實際工作中需要充分地挖掘數(shù)據(jù)和數(shù)據(jù)收集儲存技術(shù),在數(shù)據(jù)庫中過濾無用的信息,提高軟件工程發(fā)展水平。
在軟件工程中融入數(shù)據(jù)挖掘技術(shù)之前,需要了解數(shù)據(jù),挖掘技術(shù)本身的特點,從而為后續(xù)工作提供重要的基礎(chǔ)。在近幾年來隨著科技水平的不斷發(fā)展,我國已經(jīng)進入到大數(shù)據(jù)時代,面對爆炸信息需要進行信息的科學(xué)處理,并且提取有價值的數(shù)據(jù),滿足軟件開發(fā)的需要。在實際工作中需要開發(fā)出能夠高速處理數(shù)據(jù)的技術(shù),這是數(shù)據(jù)挖掘技術(shù)產(chǎn)生的主要前提。數(shù)據(jù)發(fā)展技術(shù)需要根據(jù)軟件操作目的,通過分類以及排序等步驟提取有用的信息,為相關(guān)工作人員提供重要的數(shù)據(jù)。在運用過程中可以按照一定的算法進行數(shù)據(jù)的合理性劃分,找到數(shù)據(jù)的規(guī)律建立之匹配的模型,完成后續(xù)的預(yù)測工作。同時還可以根據(jù)某些特定數(shù)據(jù)開展針對性的分析,利用相似性挖掘不同數(shù)據(jù)之間的聯(lián)系,獲得有意義和有價值的數(shù)據(jù)。
數(shù)據(jù)挖掘技術(shù)不僅僅是動態(tài)數(shù)據(jù)的分析,本質(zhì)上是動態(tài)化的范疇,數(shù)據(jù)挖掘離不開提前的預(yù)處理,在實際工作中需要通過宏觀性的角度發(fā)揮其關(guān)鍵性的作用,例如通過獲取和辨別來梳理數(shù)據(jù)信息的整體脈絡(luò),根據(jù)其中的邏輯關(guān)系為數(shù)據(jù)挖掘創(chuàng)造更高層次的使用價值。其次在數(shù)據(jù)挖掘基礎(chǔ)實施過程中,需要先進行預(yù)處理,根據(jù)最終的結(jié)果進行數(shù)據(jù)價值的進一步挖掘,例如掌握挖掘的算法和目標之后再完成數(shù)據(jù)的分類和總結(jié),使得數(shù)據(jù)挖掘效果能夠得到全面的提高。在完成這些操作之后需要進行深入的分析,做好數(shù)據(jù)的評估,彰顯出數(shù)據(jù)最終的價值,為后續(xù)數(shù)據(jù)管理提供必要性的支撐。通過這些技術(shù)的合理性利用,不僅可以提高軟件數(shù)據(jù)處理能力,還使得軟件運行效果能夠得以充分改善,給用戶帶來不一樣的體驗。
圖1 數(shù)據(jù)挖掘技術(shù)的應(yīng)用流程
在新時期下,在科技水平逐漸發(fā)達的現(xiàn)代,數(shù)據(jù)挖掘技術(shù)得到了全面的優(yōu)化和升級,作用是非常突出的,在軟件工程中的地位越來越重要,有助于推動軟件行業(yè)的穩(wěn)定發(fā)展。
在這一技術(shù)實施時,要根據(jù)源代碼的開放性特征來提高實際的開發(fā)效果,但是由于其中的數(shù)據(jù)具有多樣性的特征,很容易會對用戶使用帶來諸多的管理和安全問題,因此在實際實施時需要通過數(shù)據(jù)挖掘技術(shù)解決以往軟件運行時的一些問題,提升軟件的質(zhì)量。通過這一技術(shù)實施能夠使軟件具備基本的數(shù)據(jù)處理功能,另外還可以在數(shù)據(jù)支持下有效地挖掘和整合大規(guī)模的數(shù)據(jù),根據(jù)復(fù)雜性軟件的特點來提高最終的數(shù)據(jù)處理功能,實現(xiàn)用戶群體的科學(xué)管理。
在項目軟件數(shù)據(jù)挖掘技術(shù)中,包含的是挖掘組織關(guān)系和版本控制信息,軟件項目管理過程是非常復(fù)雜的,因此需要管理處理好其中的影響關(guān)系,控制好資源的浪費情況,對于大型軟件工程來說,其中在研發(fā)時會產(chǎn)生不同的信息數(shù)據(jù),例如電子文檔或者電子郵件等等,如果并沒有進行妥善處理和控制的話,那么會對后續(xù)的軟件使用在流程上產(chǎn)生非常嚴重的影響。因此在實際工作中,需要利用軟件項目數(shù)據(jù)挖掘技術(shù)有效地區(qū)分和過濾一些沒有價值的信息,完成有價值信息的整合,保證后續(xù)軟件項目能夠更加通暢地進行。
代碼數(shù)據(jù)挖掘技術(shù)體現(xiàn)的是代碼搜索和克隆代碼檢測等兩個組成部分,代碼搜索要以用戶所接受的關(guān)鍵詞為主要的輸入內(nèi)容,輸入關(guān)鍵詞匹配,并且向用戶返回一段代碼,段代碼搜索引擎能夠?qū)⒆⑨尯痛a看作成文本內(nèi)容之后,再根據(jù)程序的特點對代碼庫執(zhí)行相對應(yīng)的搜索命令,以文檔信息為主要的返回結(jié)果,優(yōu)化整個工作流程。大多數(shù)編程語言要涵蓋于函數(shù)和變量中,強調(diào)的是重視和標識對于可讀性的重要推動作用,但是值得注意的是,在實際應(yīng)用時經(jīng)常會存在著編程不統(tǒng)一的問題,對于返回正確結(jié)果來說造成了一定的影響,所以在實際工作中,需要充分利用數(shù)據(jù)挖掘技術(shù)本身的優(yōu)勢,使得代碼搜索過程能夠具備精準性的特點,為后續(xù)用戶使用提供更多的便捷。另外還需要加強對提取關(guān)鍵詞的挖掘理解程序的應(yīng)用過程,采取關(guān)鍵詞的方法進行程序的準確性表達,提高軟件開發(fā)的水平。
在克隆代碼檢測中和以往代碼搜索原理是非常相似的,主要是根據(jù)代碼本身來描述整個軟件的行為,在使用時需要輸入已知行為代碼,克隆代碼檢測會向用戶返回與代碼相似的一段內(nèi)容,根據(jù)已知行為代碼能夠描述相近的代碼文本。通過克隆代碼的檢測技術(shù),能夠充分發(fā)揮數(shù)據(jù)挖掘技術(shù)本身的優(yōu)勢,優(yōu)化整個開發(fā)過程,提高軟件開發(fā)的效果和水平。
在軟件故障數(shù)據(jù)挖掘技術(shù)實際實施的過程中,要完成數(shù)據(jù)挖掘任務(wù),還需要做好數(shù)據(jù)的執(zhí)行記錄說明和記錄,通過檢測和判定軟件發(fā)生的故障來提高后續(xù)的工作針對性。數(shù)據(jù)挖掘過程中需要先確定挖掘的目標,獲取跟蹤或者是了解的信息,使得實際問題處理能力能夠得到全面的提高。另外還需要提高相對應(yīng)程序應(yīng)用的熟悉度,在諸多挖掘工具中,需要通過自動化和規(guī)范性的原則來提高數(shù)據(jù)挖掘的應(yīng)用效果,并且在各種因素的推動作用下避免對軟件造成一定的影響。在實際實施時,要通過對程序運行軌跡的抽象定位,利用對比排查的方式,找到最終故障,從而使得故障排查效率和準確性能夠得到全面的提高。
首先可以采取關(guān)聯(lián)的方法,要在日常開發(fā)時發(fā)現(xiàn)大量數(shù)據(jù)之間的相關(guān)聯(lián)系和有趣聯(lián)系,以此來完善數(shù)據(jù)搜集的模式,從而為后續(xù)軟件工程的開發(fā)提供重要的基礎(chǔ)。第二個方法屬于聚類的方法,在運用時要將對象數(shù)據(jù)分成不同的種類,在保證同一類的數(shù)據(jù)中要進行相似度的處理,不同種類的對象要有明顯的差別,在實際數(shù)據(jù)處理時要具體問題具體分析,從而提高數(shù)據(jù)整合的效果。第三個方法屬于分類的方法,主要是通過對離散值和分類編號進行操作,要先建立相對應(yīng)的模型,之后,再進行概念幾何數(shù)據(jù)集的分類描述,共同地完成模型的構(gòu)建,提高軟件的開發(fā)效果。最后屬于遺傳算法的運用,根據(jù)生物自然選擇和遺傳概率的隨機搜索方法來進行日常的操作,這是數(shù)據(jù)挖掘技術(shù)中常見的方法。這一優(yōu)勢能夠在事物模型之間建立相對應(yīng)的聯(lián)系,實現(xiàn)事物之間的共同發(fā)展,并且根據(jù)遺傳基因等相關(guān)的內(nèi)容來完善整體的技術(shù)應(yīng)用模式,從而提高數(shù)據(jù)挖掘的應(yīng)用水平。
在當前軟件工程中運用數(shù)據(jù)挖掘技術(shù)有助于提高軟件的質(zhì)量以及開發(fā)效率,能夠根據(jù)用戶的使用需要,精準地完成軟件的開發(fā)過程,另外通過數(shù)據(jù)挖掘技術(shù)還可以滿足各個領(lǐng)域方面的使用需要。隨著科技水平的不斷進步,數(shù)據(jù)挖掘技術(shù)在不斷地更新,但是在具體實施時也會存在不同程度的質(zhì)量問題,因此需要加強技術(shù)的研究力度,明確數(shù)據(jù)挖掘技術(shù)今后的發(fā)展方向,從而使得軟件開發(fā)效果能夠得到全面的提高。隨著軟件工程規(guī)模的不斷擴大,軟件需求也在不斷地增加,開發(fā)周期在無限地延長,為了使數(shù)據(jù)挖掘技術(shù)應(yīng)用效果能夠得到全面提高,相關(guān)開發(fā)者要圍繞著數(shù)據(jù)降維特征來選擇正確的數(shù)據(jù)處理方式。同時還可以根據(jù)數(shù)據(jù)流和在線挖掘算法,研究出更高效率的挖掘模式,充分發(fā)揮人工智能等新型的數(shù)據(jù)挖掘技術(shù),開發(fā)出更加全面的軟件工程數(shù)據(jù)挖掘技術(shù)。
其次,還需要根據(jù)當前數(shù)據(jù)挖掘工作中的缺陷,搭建高性能的挖掘算法,例如通過軟件規(guī)則檢索,由關(guān)鍵詞向自然語言不斷地發(fā)展,在檢索內(nèi)容方面需要通過動態(tài)或者靜態(tài)方面的特征,為后續(xù)檢測工作提供重要的基礎(chǔ)。為了使計算機軟件開發(fā)能夠具備較為完善的可行性,在實際工作中需要做好合理性的規(guī)劃,構(gòu)建完善的數(shù)據(jù)模塊,從而為后續(xù)計算機軟件開發(fā)提供必要性的支撐。在實際工作中需要降低開發(fā)的難度,增加添加程序和刪減程序等等,可以通過程序的不同劃分來掌握數(shù)據(jù)的原理和主要的工作流程,從而使得功能模塊能夠朝著完善的方向不斷發(fā)展。在實際工作中需要根據(jù)模塊機設(shè)備的要求以及標準,實現(xiàn)資源優(yōu)化性配置,并且還要進行科學(xué)的調(diào)整,保證系統(tǒng)運行能夠基本完整的特點。在后續(xù)工作中要構(gòu)建軟件系統(tǒng),在編寫時不僅可以更加的方便和便捷,還有助于構(gòu)建初始化的編程模式,在實際開發(fā)工作中需要將不同的函數(shù)結(jié)合在一起,搭建科學(xué)較強的模塊設(shè)計方案。特別是對于計算機軟件編碼工作中,要按照科學(xué)的原則來調(diào)整函數(shù)的參數(shù)。但是值得注意的是,在實際編碼時也會遇到一定的困難,比如會影響變量函數(shù)的模塊變量等等,所以在實際工作中需要掌握模塊之間的關(guān)系從而達到優(yōu)化性的設(shè)計。在對象模塊使用時,需要通過函數(shù)對象的屬性分析來防止存在內(nèi)部狀態(tài)暴露的問題,以外部的編碼為主進行適當?shù)母膶懀瑥亩岣邔嶋H的設(shè)計效果。在具體使用時需要貫徹落實簡單化的工作原則,防止對后續(xù)開發(fā)工作造成一定的影響。
數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用是非常廣泛的,但是其中一些技術(shù)問題還是有待解決的,因此需要優(yōu)化數(shù)據(jù)挖掘技術(shù)的發(fā)展模式,在挖掘算法方面進行不斷的研究,從而提高數(shù)據(jù)挖掘技術(shù)發(fā)展水平。另外還需要將挖掘后的數(shù)據(jù)儲存在數(shù)據(jù)庫中,以提高數(shù)據(jù)安全性為主來保證軟件開發(fā)過程的有序進行。
[1]張立鑒.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用研究[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2019(6):47-48.
[2]王祥順.數(shù)據(jù)挖掘技術(shù)在軟件工程中的實踐與探索[J].電腦編程技巧與維護,2019(4):82-83+100.
[3]吳金玲.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用[J].產(chǎn)業(yè)創(chuàng)新研究,2019(3):115-116.