馮彥熙 湖南省長(zhǎng)沙市第一中學(xué)
計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的開(kāi)發(fā)研究
馮彥熙 湖南省長(zhǎng)沙市第一中學(xué)
時(shí)代不斷變化,使得計(jì)算機(jī)技術(shù)研究程度加深,并逐漸融入到人們?nèi)粘I钪小W鳛楦咧猩?,筆者對(duì)計(jì)算機(jī)的認(rèn)識(shí)還處于較為基礎(chǔ)的階段,通過(guò)翻閱相關(guān)書籍,筆者發(fā)現(xiàn)當(dāng)前計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)已經(jīng)達(dá)到了一定的水平,并且在各個(gè)行業(yè)中都有所應(yīng)用。因此總結(jié)了計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)相關(guān)內(nèi)容,對(duì)計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的開(kāi)發(fā)進(jìn)行了研究。
計(jì)算機(jī) 數(shù)據(jù)挖掘技術(shù) 開(kāi)發(fā)
計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)統(tǒng)建在計(jì)算機(jī)基本功能上,利用這些基礎(chǔ)的功能并添加了一些其他學(xué)科的相關(guān)知識(shí),如統(tǒng)計(jì)學(xué)等內(nèi)容,形成了計(jì)算機(jī)數(shù)據(jù)挖掘新的內(nèi)容。數(shù)據(jù)挖掘技術(shù)幫助人們擇取計(jì)算機(jī)系統(tǒng)下的有用信息,對(duì)任何人都有所幫助。筆者在學(xué)習(xí)計(jì)算機(jī)數(shù)據(jù)挖掘相關(guān)知識(shí)時(shí)發(fā)現(xiàn),利用這一技術(shù)極大的提升了自身對(duì)計(jì)算機(jī)內(nèi)容的認(rèn)識(shí),因此希望能通過(guò)本文的研究向高中同學(xué)們宣傳一些計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的相關(guān)知識(shí),促進(jìn)大家對(duì)計(jì)算機(jī)技術(shù)的了解,幫助大家掌握正確的采集信息的方法。
筆者對(duì)計(jì)算機(jī)挖掘技術(shù)的認(rèn)識(shí)多來(lái)源于書籍和向教師的請(qǐng)教,因此總結(jié)了掌握計(jì)算機(jī)挖掘技術(shù)的幾個(gè)要點(diǎn)。我們知道,計(jì)算機(jī)的功能多種多樣,作為在這些功能基礎(chǔ)上發(fā)展而來(lái)的數(shù)據(jù)挖掘技術(shù),需要更加明確的研究章程。因此探討數(shù)據(jù)挖掘技術(shù)需要率先明確數(shù)據(jù)挖掘的目的,根據(jù)個(gè)人對(duì)數(shù)據(jù)類型的需求,建立起相應(yīng)的數(shù)據(jù)庫(kù)。只有能夠明確數(shù)據(jù)挖掘的目的,才有利于數(shù)據(jù)庫(kù)的正確建立和選擇,這樣也就能根據(jù)選擇的數(shù)據(jù)內(nèi)容編寫挖掘技術(shù)數(shù)據(jù)算法,提高結(jié)果的準(zhǔn)確率。
數(shù)據(jù)挖掘技術(shù)的內(nèi)容中還包括數(shù)據(jù)選擇和預(yù)處理,這兩個(gè)環(huán)節(jié)是非常重要的。在數(shù)據(jù)挖掘技術(shù)開(kāi)發(fā)過(guò)程中,需要根據(jù)確定的數(shù)據(jù)挖掘目的及選擇的數(shù)據(jù)庫(kù),來(lái)對(duì)選擇的數(shù)據(jù)進(jìn)行信息處理,將選中的信息內(nèi)容納入到數(shù)據(jù)挖掘研究范圍中,這樣可以促進(jìn)數(shù)據(jù)挖掘的準(zhǔn)確率,保證數(shù)據(jù)挖掘技術(shù)應(yīng)用的準(zhǔn)確性。此外,還要通過(guò)預(yù)處理方式,對(duì)數(shù)據(jù)庫(kù)中存在的錯(cuò)誤信息進(jìn)行刪減、修正,保證進(jìn)入到數(shù)據(jù)庫(kù)的信息都是正確無(wú)誤的??梢?jiàn),這兩部分內(nèi)容是進(jìn)行計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)開(kāi)發(fā)的重要環(huán)節(jié)。
上述部分是數(shù)據(jù)挖掘技術(shù)前期準(zhǔn)備階段中最為重要的步驟,在接下來(lái)的數(shù)據(jù)挖掘技術(shù)開(kāi)發(fā)中,需要更加精確的方式方法,以推動(dòng)數(shù)據(jù)挖掘技術(shù)的順利開(kāi)發(fā)。其一是在數(shù)據(jù)挖掘目標(biāo)明確后,要針對(duì)選擇的數(shù)據(jù)目標(biāo)確定匹配的開(kāi)發(fā)技術(shù)和算法,開(kāi)發(fā)技術(shù)和算法與數(shù)據(jù)挖掘目標(biāo)相符合是提高開(kāi)發(fā)成功率的重要保證;其二是根據(jù)確定下的技術(shù)和算法,建立數(shù)據(jù)挖掘數(shù)學(xué)模型,通過(guò)對(duì)模型的完善來(lái)推動(dòng)研發(fā)的順利進(jìn)行。
評(píng)估結(jié)果的最大作用就是對(duì)開(kāi)發(fā)出的數(shù)據(jù)挖掘結(jié)果進(jìn)行科學(xué)評(píng)估,對(duì)數(shù)據(jù)挖掘技術(shù)的開(kāi)發(fā)成果進(jìn)行檢測(cè)和驗(yàn)證。如果數(shù)據(jù)挖掘結(jié)果不能夠達(dá)到數(shù)據(jù)挖掘開(kāi)發(fā)
評(píng)估可以優(yōu)化數(shù)據(jù)挖掘技術(shù)的開(kāi)發(fā),在數(shù)據(jù)挖掘技術(shù)開(kāi)發(fā)中納入科學(xué)評(píng)估,可以糾正開(kāi)發(fā)過(guò)程中出現(xiàn)的錯(cuò)誤,有利于提升數(shù)據(jù)挖掘技術(shù)開(kāi)發(fā)的質(zhì)量,在確定數(shù)據(jù)挖掘技術(shù)的開(kāi)發(fā)結(jié)果與預(yù)期目標(biāo)相符合的情況下,就可以順利將其投入到實(shí)踐中。
數(shù)據(jù)挖掘技術(shù)的開(kāi)發(fā)需要建立和選擇相應(yīng)的數(shù)據(jù)庫(kù),因此需要對(duì)信息進(jìn)行掌握和處理,計(jì)算機(jī)網(wǎng)絡(luò)中的信息有許多種,其中顯性信息比較容易發(fā)現(xiàn),但是隱性信息還有待開(kāi)發(fā)人員的發(fā)現(xiàn),因此強(qiáng)調(diào)計(jì)算機(jī)可視化技術(shù)的研究。利用計(jì)算機(jī)可視化技術(shù)能夠?qū)ふ页鲇?jì)算機(jī)系統(tǒng)中存在的隱性信息,抓取信息特征,豐富數(shù)據(jù)庫(kù)信息內(nèi)容,尤其是利用散點(diǎn)的方式可以將這些隱性信息表現(xiàn)出來(lái)。
網(wǎng)絡(luò)是復(fù)雜的,其中網(wǎng)絡(luò)信息和數(shù)據(jù)更是十分的龐雜,要想快速、準(zhǔn)確的抓取到自己想要的信息,需要依靠聯(lián)機(jī)分析出不同地域和時(shí)段的多維數(shù)據(jù)。例如,筆者所在學(xué)校有多處辦公室使用計(jì)算機(jī),校長(zhǎng)辦公室、教師辦公室以及各個(gè)學(xué)校的多媒體教學(xué)設(shè)備,這些計(jì)算機(jī)的系統(tǒng)中需要進(jìn)行設(shè)備連接,因此需要建立相應(yīng)的算法,利用這些分析算法對(duì)數(shù)據(jù)做處理。
決策樹是計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)開(kāi)發(fā)中的重要部分,決策樹的建立和形成能夠?qū)⒉杉臄?shù)據(jù)信息進(jìn)行細(xì)致分類。目前開(kāi)發(fā)的決策樹算法已經(jīng)有很多種,主要有SLIQ、SPRINT、ID3、C4.5等,SLIQ算法具備連續(xù)性屬性,SPRINT算法與SLIQ算法有同樣的功能屬性,并且這兩種算法可以通過(guò)大型訓(xùn)練集對(duì)決策時(shí)做出歸納。
計(jì)算機(jī)神經(jīng)網(wǎng)絡(luò)借鑒了中醫(yī)學(xué)的神經(jīng)系統(tǒng)概念,計(jì)算機(jī)神經(jīng)網(wǎng)絡(luò)是虛擬稱呼,并不是按照人體神經(jīng)脈絡(luò)為計(jì)算機(jī)建設(shè)了神經(jīng),而是通過(guò)科學(xué)技術(shù)建立與之相似的功能。計(jì)算機(jī)中研發(fā)出的神經(jīng)網(wǎng)絡(luò)是安全輸入、輸出和處理單元三種類型進(jìn)行規(guī)劃的,這三個(gè)層面代表了計(jì)算機(jī)神經(jīng)網(wǎng)絡(luò)系統(tǒng),是體現(xiàn)計(jì)算機(jī)神經(jīng)功能的具體部門。
遺傳算法應(yīng)用到的原理有許多,著重體現(xiàn)出了自然科學(xué)和生命科學(xué)中的內(nèi)容,生物因?yàn)檫z傳而獲得了信息的傳遞,計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)同樣借助遺傳算法的設(shè)立獲取計(jì)算機(jī)功能的自我優(yōu)化功能,不斷的通過(guò)創(chuàng)新來(lái)更新數(shù)據(jù)算法。
綜上所述,在數(shù)據(jù)鋪天蓋地而來(lái)的現(xiàn)代,數(shù)據(jù)挖掘技術(shù)顯得尤為重要。而數(shù)據(jù)挖掘技術(shù)的開(kāi)發(fā)研究,有利于我們高中生對(duì)走在時(shí)代前沿的技術(shù)有一個(gè)充分的了解,有利于我們對(duì)于數(shù)據(jù)挖掘技術(shù)中數(shù)據(jù)的選擇和處理方法有初步的了解,同時(shí)也有助于我們高中生今后在這方面的應(yīng)用與發(fā)展,為我們成為時(shí)代的先鋒奠基。
[1]夏天維. 計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的開(kāi)發(fā)及其應(yīng)用探究[A]. 《決策與信息》雜志社、北京大學(xué)經(jīng)濟(jì)管理學(xué)院.“決策論壇——管理科學(xué)與工程研究學(xué)術(shù)研討會(huì)”論文集(下)[C].《決策與信息》雜志社、北京大學(xué)經(jīng)濟(jì)管理學(xué)院:,2016:1.
[2]沈文淵,丁穎. 計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的開(kāi)發(fā)及其應(yīng)用探究[J]. 信息系統(tǒng)工程,2014,06:87.
[3]曾雪峰. 計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)開(kāi)發(fā)及其在檔案信息管理中的運(yùn)用研究[J]. 科技創(chuàng)新與應(yīng)用,2016,09:285