李華 張井玲 劉婷婷
摘 ?要:大數(shù)據(jù)時代是目前世界發(fā)展的潮流與趨勢,隨著智能化與信息化的快速發(fā)展,大數(shù)據(jù)成為目前主要的研究課題。通過對大數(shù)據(jù)的研究,各行各業(yè)的行業(yè)人士更加容易掌握行業(yè)的相關(guān)信息,從而促進(jìn)了行業(yè)的發(fā)展,同時,大數(shù)據(jù)對于某些服務(wù)類公益類活動也有著極大的幫助。大數(shù)據(jù)時代的研究主要是指數(shù)據(jù)挖掘技術(shù),畢竟在此時代,數(shù)據(jù)的紛繁眾多使得有巨大價值的數(shù)據(jù)不被重視,數(shù)據(jù)挖掘技術(shù)的重要性在此刻就凸顯出來。本文通過文獻(xiàn)的大量搜集,進(jìn)行相應(yīng)的分析綜合,從大數(shù)據(jù)以及大數(shù)據(jù)挖掘技術(shù)的含義、大數(shù)據(jù)挖掘技術(shù)的具體應(yīng)用以及最為主要的應(yīng)用的改進(jìn)三個方面進(jìn)行詳細(xì)的闡述與研究,旨在促進(jìn)大數(shù)據(jù)時代的發(fā)展,促進(jìn)大數(shù)據(jù)挖掘技術(shù)的完善。
關(guān)鍵詞:大數(shù)據(jù)時代;數(shù)據(jù)挖掘;技術(shù)應(yīng)用研究
中圖分類號:TP311.13 ? ? ?文獻(xiàn)標(biāo)識碼:A 文章編號:2096-4706(2019)13-0132-03
Research on the Application of Data Mining Technology in the Age of Big Data
LI Hua,ZHANG Jingling,LIU Tingting
(Shandong Huayu University of Technology,Dezhou ?253034,China)
Abstract:The era of big data is now the world tide and trend of development,with the rapid development of intellectualization and informatization,big data as the main research subject,based on the research of the big data,make relevant information from all walks of life are more likely to be mastered in the industry to promote the development of some industry,at the same time,the big data for some public welfare activities of the service industry has a great help,the research mainly is the index of the era of big data,according to the mining technology,after all,in the era of the numerous and complicated data makes the great value of the data is ignored,the importance of data mining technology is highlighted at this moment. Through the huge collection of literature,this paper analyses the corresponding comprehensive,from the meaning of big data and the data mining technology,the application of the technology of data mining,and the application of the most main improvement three aspects in detail elaborated and research,to promote the development of the era of big data,promote the improvement of the technology of data mining.
Keywords:big data era;data mining;technical application research
0 ?引 ?言
大數(shù)據(jù)時代是目前世界發(fā)展不可逆轉(zhuǎn)的趨勢,隨著智能化、信息化的發(fā)展,互聯(lián)網(wǎng)技術(shù)的應(yīng)用在目前已經(jīng)非常普遍,互聯(lián)網(wǎng)技術(shù)承載著成千上萬的各種信息,這些信息的載體就是大數(shù)據(jù)。對大數(shù)據(jù)的研究,特別是對大數(shù)據(jù)挖掘技術(shù)的應(yīng)用研究,有利于在眾多信息中尋找到更為有價值的信息,促進(jìn)大數(shù)據(jù)時代的發(fā)展,從而促進(jìn)世界的進(jìn)步。本文主要從三個方面就大數(shù)據(jù)挖掘技術(shù)的應(yīng)用進(jìn)行研究,通過文獻(xiàn)搜集的方法對各種相應(yīng)的文獻(xiàn)進(jìn)行分析和綜合,旨在為日后大數(shù)據(jù)挖掘技術(shù)的改革提供理論參考意義。
1 ?大數(shù)據(jù)及大數(shù)據(jù)挖掘技術(shù)的含義
1.1 ?大數(shù)據(jù)的含義
大數(shù)據(jù)時代是目前正在發(fā)展且逐漸完善的時代,大數(shù)據(jù)是承載著眾多信息的載體,通過對大數(shù)據(jù)的研究,可以了解掌握各種有價值的信息,大數(shù)據(jù)是互聯(lián)網(wǎng)時代的基礎(chǔ),是不可動搖的根基,通過對大數(shù)據(jù)特點的分析,可以為日后對各行各業(yè)信息的掌握提供參考。大數(shù)據(jù)有著眾多的特點,其中有幾個較為特色鮮明的特點:
(1)大量化。大量化指的就是數(shù)據(jù)的量較為龐大,幾乎囊括所有信息,這樣,獲取較為有價值的信息就會異常艱難,猶如大海撈針,所以在后文將會提到數(shù)據(jù)挖掘技術(shù),主要是針對大數(shù)據(jù)的大量化特點找出相應(yīng)的技術(shù)支持。
(2)多樣性。所謂多樣性是指其涉及信息的種類多樣,并非指的是單純的數(shù)量,其中包括信息的表達(dá)方式多樣等等,多樣性充分展現(xiàn)出大數(shù)據(jù)值得挖掘和探索的價值,通過對其進(jìn)行深刻的研究,可以找到需要的各種信息。
(3)快速化。這是互聯(lián)網(wǎng)時代的優(yōu)點同樣也是大數(shù)據(jù)時代的特點,快速化指的是尋找有價值信息的過程并非繁瑣且需要長時間等待的,而是能夠很快找到相匹配的結(jié)果??焖倩沟么髷?shù)據(jù)的特征更為明顯,研究更為有意義。
1.2 ?數(shù)據(jù)挖掘技術(shù)的含義
所謂數(shù)據(jù)挖掘技術(shù)就猶如表面展現(xiàn)的那樣,是從各種大量的信息中快速找到有用或者有價值的信息,以便更好地完成尋找數(shù)據(jù)的過程;還有在數(shù)據(jù)進(jìn)行模糊表達(dá)或者數(shù)據(jù)呈現(xiàn)的含義不清時,對數(shù)據(jù)進(jìn)行深層次的剖析,以便完全掌握數(shù)據(jù)想要表達(dá)的內(nèi)容的過程;同時,就找到的各種信息進(jìn)行分析綜合,直接找到數(shù)據(jù)想要表達(dá)的含義。它屬于一種新型的數(shù)據(jù)處理技術(shù),通過數(shù)據(jù)的處理實現(xiàn)對信息的掌握。數(shù)據(jù)挖掘技術(shù)的特點為循環(huán)往復(fù),及對使用的數(shù)據(jù)進(jìn)行多次反復(fù)地分析,以便尋找到數(shù)據(jù)在某一層面有著更為深刻的含義。多次反復(fù)分析是數(shù)據(jù)挖掘的基本,不能丟掉每個有價值的信息是數(shù)據(jù)挖掘技術(shù)的根本,也是其宗旨。
數(shù)據(jù)挖掘技術(shù)的實施過程較為復(fù)雜,并且有著多種相應(yīng)的方法,無論哪種方法,其實施的步驟基本一致,首先,是對要進(jìn)行挖掘的數(shù)據(jù)分析判斷其是否具有挖掘意義,其次,對于將要挖掘的數(shù)據(jù)進(jìn)行篩選,將基本無用的殘余信息進(jìn)行清除,防止數(shù)據(jù)量過大,耗費(fèi)時間過長,最終,對數(shù)據(jù)進(jìn)行深度挖掘,找到想要得到的結(jié)論或者信息。目前針對數(shù)據(jù)挖掘技術(shù)的研究十分有必要,它的研究可以促進(jìn)各行各業(yè)的發(fā)展,找到與行業(yè)相適應(yīng)的市場預(yù)測,使其按照行業(yè)內(nèi)發(fā)展趨勢進(jìn)行發(fā)展。
2 ?大數(shù)據(jù)時代下數(shù)據(jù)挖掘技術(shù)的應(yīng)用
數(shù)據(jù)的挖掘技術(shù)在各行各業(yè)的發(fā)展中都有著極為明顯的應(yīng)用,本文將分別就數(shù)據(jù)挖掘技術(shù)在教育行業(yè)、電信行業(yè)以及科研行業(yè)進(jìn)行應(yīng)用研究,通過對其應(yīng)用研究的了解,為下文提出相應(yīng)的提升改進(jìn)舉措奠定基礎(chǔ)。
2.1 ?教育行業(yè)
目前,教育行業(yè)的發(fā)展明顯在逐步走向智能化與信息化,數(shù)據(jù)的挖掘技術(shù)在教育行業(yè)的應(yīng)用極其明顯,隨著慕課、翻轉(zhuǎn)課堂等新型課堂模式的出現(xiàn),免不了使用多媒體或者互聯(lián)網(wǎng)技術(shù)進(jìn)行配合。大數(shù)據(jù)的挖掘技術(shù)更為主要地應(yīng)用于教學(xué)信息管理或者評價中,例如在教學(xué)信息的管理中,如何使得教學(xué)信息有效保存并且被眾多教師或者在線平臺的使用者看到,就需要數(shù)據(jù)挖掘技術(shù)的應(yīng)用,還有在教學(xué)評價中,對于教師的各種行為進(jìn)行有標(biāo)準(zhǔn)的評價,評價后的總結(jié)也是數(shù)據(jù)挖掘技術(shù)的應(yīng)用。在眾多的信息中,找到某種相應(yīng)的信息進(jìn)行歸類、分析、綜合是數(shù)據(jù)挖掘技術(shù)所要達(dá)到的,數(shù)據(jù)挖掘技術(shù)使得教育行業(yè)的發(fā)展更為快速,使得各種信息可以更為有效地發(fā)揮其應(yīng)有的作用,值得在日后繼續(xù)發(fā)展。
2.2 ?電信行業(yè)
電信行業(yè)同樣是我國發(fā)展的朝陽行業(yè),隨著智能手機(jī)、智能電視等的普遍發(fā)展,電信行業(yè)的發(fā)展也日益快速。電信行業(yè)想要健康有效發(fā)展,需要對數(shù)據(jù)挖掘技術(shù)的應(yīng)用進(jìn)行相應(yīng)的研究。4G、5G時代的到來使各種網(wǎng)絡(luò)信息紛繁復(fù)雜,不少的信息是無用信息,甚至是有害信息,其中,黃賭毒信息對于電信行業(yè)的傷害是不可低估的。數(shù)據(jù)挖掘技術(shù)可以將有益信息與有害信息進(jìn)行選擇分類,呈現(xiàn)出有用信息。電信行業(yè)對于各種信息的分析處理也要密切地關(guān)注,尤其是對各種信息的整合需要耗費(fèi)一定的時間,在進(jìn)行數(shù)據(jù)挖掘時,確保將要進(jìn)行分類管理的信息是有益信息是很困難的,需要專業(yè)人員逐步在實踐中進(jìn)行摸索。
2.3 ?科研行業(yè)
科研行業(yè)的信息更是不計其數(shù),就單拿中國知網(wǎng)的數(shù)據(jù)庫來說,里面的有價值信息不計其數(shù),科研文章,期刊,論文等等,需要及時選擇分類,將屬于一類的文章進(jìn)行分類擱置;對于信息的重復(fù)等問題也是數(shù)據(jù)挖掘所要考慮的,需要保證獲得的信息不可以進(jìn)行重復(fù);同時,信息的正確率也需要進(jìn)行保證。所以,數(shù)據(jù)挖掘技術(shù)在科研行業(yè)中的地位同樣不可忽視。例如,在進(jìn)行較為嚴(yán)謹(jǐn)?shù)目蒲袑嶒炦^程中,不僅實驗本身涉及大量的數(shù)據(jù),而且在進(jìn)行實驗數(shù)據(jù)的處理過程中也產(chǎn)生各種數(shù)據(jù),這時,為了保證處理結(jié)果的準(zhǔn)確性和處理過程的簡潔性,會直接選擇數(shù)據(jù)挖掘技術(shù)進(jìn)行數(shù)據(jù)分析,這樣會提高科研實驗的精準(zhǔn)度,對于實驗結(jié)果也會有極高的保障。
3 ?大數(shù)據(jù)時代數(shù)據(jù)挖掘技術(shù)的改進(jìn)措施
上文就大數(shù)據(jù)時代數(shù)據(jù)挖掘技術(shù)的相關(guān)應(yīng)用進(jìn)行了詳細(xì)闡述,主要是針對教育行業(yè)、科研行業(yè)及電信行業(yè)進(jìn)行的分析,接下來,將會對大數(shù)據(jù)時代數(shù)據(jù)挖掘技術(shù)的改進(jìn)舉措進(jìn)行詳細(xì)論述,為日后數(shù)據(jù)挖掘技術(shù)改進(jìn)提供理論參考價值。
3.1 ?多媒體數(shù)據(jù)的應(yīng)用與發(fā)展
所謂多媒體技術(shù)指的是包含圖片、文字、音樂等內(nèi)容的在電腦中呈現(xiàn)的技術(shù),此項技術(shù)可以更加高效快速方便地對內(nèi)容進(jìn)行理解,掌握該了解與掌握的信息,多媒體技術(shù)同樣也是互聯(lián)網(wǎng)技術(shù)的相關(guān)應(yīng)用,通過將多媒體與大數(shù)據(jù)挖掘技術(shù)節(jié)能型結(jié)合,方便信息的呈現(xiàn),大數(shù)據(jù)主要是指信息的呈現(xiàn)方式,數(shù)據(jù)挖掘針對模糊信息進(jìn)行深度挖掘,多媒體是信息承載者,通過兩者的結(jié)合,將會提升信息的處理速度和信息傳達(dá)的速度,不失為一個極為有效的方式。多媒體數(shù)據(jù)的發(fā)展將會對教育行業(yè)有著前所未有的幫助,目前教育行業(yè)只有兩者分離的模式,主要是運(yùn)用多媒體技術(shù)進(jìn)行內(nèi)容的呈現(xiàn),幫助師生進(jìn)行溝通理解,數(shù)據(jù)挖掘主要是就師生等相關(guān)信息進(jìn)行綜合分類處理,兩者的結(jié)合將會有效增強(qiáng)想要達(dá)到的效果,不失為值得改進(jìn)的方式。
3.2 ?改進(jìn)數(shù)據(jù)挖掘的算法
大數(shù)據(jù)進(jìn)行挖掘靠的是計算機(jī)的算法,通過一步一步進(jìn)行算法的演進(jìn),從而得到信息的根本含義。然而,原有的算法肯定會產(chǎn)生一系列的問題,例如,算法的過程不夠簡練,需要進(jìn)行長時間的演算,算法能夠得到信息的準(zhǔn)確度降低等等情況,這時,對于算法的研究就要提上日程。算法的演進(jìn)要根據(jù)時代的特征,找到時代發(fā)展的特點逐步發(fā)展出相應(yīng)的符合大數(shù)據(jù)時代特征的算法。同時,算法也會在眾多的數(shù)據(jù)中進(jìn)行有效的挖掘,不會造成挖掘過程中數(shù)據(jù)的丟失或者難以保證數(shù)據(jù)的準(zhǔn)確程度,算法的改進(jìn)將會極大促進(jìn)信息的發(fā)展,是極為不錯的一項使用舉措。
3.3 ?數(shù)據(jù)挖掘技術(shù)與其他系統(tǒng)的綜合運(yùn)用
對于數(shù)據(jù)的挖掘,不只是一種計算機(jī)的模式和方法可以完成的,需要使用多種有效的方法和模式進(jìn)行綜合運(yùn)用。如在科研行業(yè),要將大量的信息分類處理并保證信息的準(zhǔn)確度就是一項不小的挑戰(zhàn),在這個過程中,應(yīng)該盡力保證數(shù)據(jù)挖掘技術(shù)的使用準(zhǔn)確性,同時,也應(yīng)該盡可能地將其他的技術(shù)模式與其綜合,綜合使用可以使得信息處理的結(jié)果準(zhǔn)確性更高,并且處理時間更短,有著較為重要的作用,像上文提到的舉措中的多媒體數(shù)據(jù)就算其中的一種。然而,數(shù)據(jù)挖掘技術(shù)與其他系統(tǒng)的綜合運(yùn)用是目前并未實現(xiàn)的難題,需要進(jìn)行專業(yè)人員的培訓(xùn),經(jīng)歷一段艱難的歷程從而實現(xiàn)。
4 ?結(jié) ?論
在今天這樣一個高速發(fā)展的時代,原來的數(shù)據(jù)挖掘技術(shù)可能在目前還可以有效使用,然而,隨著發(fā)展,早晚將會有一天將其淘汰,進(jìn)行數(shù)據(jù)挖掘技術(shù)的改進(jìn)還是十分有必要的,將數(shù)據(jù)挖掘的模式和方法進(jìn)行改變,從而促進(jìn)大數(shù)據(jù)時代的發(fā)展。大數(shù)據(jù)的動態(tài)特征在目前變化的世界尤為明顯,抓住改革的機(jī)遇,迎接挑戰(zhàn),通過多媒體數(shù)據(jù)的運(yùn)用、數(shù)據(jù)挖掘算法的演進(jìn)以及與其他系統(tǒng)的綜合等措施,可以更為有效地促進(jìn)各行各業(yè)的發(fā)展。
參考文獻(xiàn):
[1] 鄢澤然.大數(shù)據(jù)時代的數(shù)據(jù)挖掘技術(shù)與應(yīng)用 [J].現(xiàn)代營銷(經(jīng)營版),2019(2):122.
[2] 于晶.大數(shù)據(jù)時代的數(shù)據(jù)挖掘及應(yīng)用探究 [J].科技與創(chuàng)新,2018(24):160-161.
[3] 劉銘,呂丹,安永燦.大數(shù)據(jù)時代下數(shù)據(jù)挖掘技術(shù)的應(yīng)用 [J].科技導(dǎo)報,2018,36(9):73-83.
[4] 邵燕,陳守森,賈春樸,等.探究大數(shù)據(jù)時代的數(shù)據(jù)挖掘技術(shù)及應(yīng)用 [J].信息與電腦(理論版),2016(10):118-119.
[5] 趙倩倩,程國建,冀乾宇,等.大數(shù)據(jù)崛起與數(shù)據(jù)挖掘芻議 [J].電腦知識與技術(shù),2014,10(33):7831-7833.
作者簡介:李華(1991-),女,漢族,山東泰安人,教師,助教,碩士,研究方向:工業(yè)信息化;張井玲(1991-),女,漢族,山東棗莊人,教師,助教,碩士,研究方向:高等教育;劉婷婷(1994-),女,漢族,山東德州人,教師,助教,碩士,研究方向:網(wǎng)絡(luò)信息安全。