劉芬
摘 要:數(shù)據(jù)挖掘?qū)W科的出現(xiàn),是對計算機領(lǐng)域的補充,在計算機領(lǐng)域的發(fā)展下發(fā)展迅速,引起了國內(nèi)的重視,并在國家的大力促進下不斷發(fā)展,取得了階段性的成就,但是發(fā)展現(xiàn)狀仍然不容樂觀,本篇文章將針對數(shù)據(jù)挖掘的定義以及國內(nèi)的現(xiàn)狀進行分析,并對其發(fā)展趨勢進行預(yù)測,目的在于加快我國的數(shù)據(jù)挖掘技術(shù)研究進程。
關(guān)鍵詞:數(shù)據(jù)挖掘;中國;現(xiàn)狀;發(fā)展
DOI:10.16640/j.cnki.37-1222/t.2018.17.110
0 引言
隨著計算機的發(fā)展與數(shù)據(jù)量的增加,其對于數(shù)據(jù)的處理技術(shù)如生成、收集、儲存數(shù)據(jù)等的水平要求越來越高,因此新型的數(shù)據(jù)挖掘技術(shù)的出現(xiàn)是必然趨勢,替代了傳統(tǒng)落后的數(shù)據(jù)處理技術(shù)。我國對于數(shù)據(jù)挖掘技術(shù)的研究已經(jīng)取得矚目的效果,但是應(yīng)用程度不高,提高數(shù)據(jù)挖掘技術(shù)的實際應(yīng)用成為了主要的問題,需要采取必要措施加快數(shù)據(jù)挖掘技術(shù)應(yīng)用進程。
1 數(shù)據(jù)挖掘的定義
數(shù)據(jù)挖掘(DM)是一個新興的學(xué)科,學(xué)名叫做數(shù)據(jù)庫中發(fā)現(xiàn)知識(KDD),其出現(xiàn)在20世紀90年代,并在這三十年間發(fā)展迅速,它的主要工作領(lǐng)域為數(shù)據(jù)庫系統(tǒng)以及數(shù)據(jù)庫應(yīng)用領(lǐng)域,其作用在于能夠從應(yīng)用數(shù)據(jù)中提取隱藏的關(guān)鍵信息與知識,應(yīng)用數(shù)據(jù)的范圍廣泛,不管是不完整的數(shù)據(jù),還是受干擾的數(shù)據(jù),數(shù)據(jù)挖掘技術(shù)都能夠通過對其數(shù)據(jù)的轉(zhuǎn)換分析或者模塊化處理進行識別與篩選,并提取和處理其中的有用信息。數(shù)據(jù)挖掘的目的在于通過對數(shù)據(jù)中信息的處理,篩選關(guān)鍵數(shù)據(jù),發(fā)現(xiàn)被忽略的數(shù)據(jù),從而尋找數(shù)據(jù)中的規(guī)律,為決策者提供合理科學(xué)的數(shù)據(jù)分析報告,幫助其作出最優(yōu)化的決策。
數(shù)據(jù)挖掘技術(shù)學(xué)科的本質(zhì)在于加深對數(shù)據(jù)的使用層次,挖掘數(shù)據(jù)的內(nèi)在含義并進行抽象化的概括,改變了以往數(shù)據(jù)只能簡單查詢的低級層次。數(shù)據(jù)挖掘具有先知性、實用性以及科學(xué)性的特點,同時數(shù)據(jù)挖掘的發(fā)展依賴于數(shù)據(jù)庫、人工智能統(tǒng)計學(xué)等計算機學(xué)科的快速發(fā)展,因此吸引了一大批專業(yè)人才加入到其的研發(fā)過程中,加快了其的研究發(fā)展進程。
2 數(shù)據(jù)挖掘在中國的現(xiàn)狀分析
2.1 研究現(xiàn)狀分析
我國開展數(shù)據(jù)挖掘技術(shù)的研究在1993年,中科院合肥分院成為首個被自然科學(xué)基金支持進行數(shù)據(jù)挖掘技術(shù)研究,從此以后,我國掀開了研究數(shù)據(jù)挖掘研究的序幕,主要研究機構(gòu)與人員主要是相關(guān)專業(yè)的大學(xué)教授以及一些數(shù)據(jù)處理研究機構(gòu)。近年來,我國對數(shù)據(jù)挖掘的研究工作高度重視,通過中國自然科學(xué)基金等對其進行資金支持,同時,政府創(chuàng)立“九五”計劃以及 “863” 計劃對其提供政策支持。
數(shù)據(jù)挖掘的研究引起了我國相關(guān)專業(yè)的人才的廣泛關(guān)注,并在全國范圍內(nèi)掀起了研究數(shù)據(jù)挖掘知識技術(shù)的理論與實際應(yīng)用的熱潮,其中包括高等學(xué)府與科研機構(gòu)。例如:對于數(shù)據(jù)挖掘技術(shù)的算法計算與改造研究是復(fù)旦大學(xué)與華中理工大學(xué)等高校的研究方向,非結(jié)構(gòu)化數(shù)據(jù)知識的網(wǎng)頁數(shù)據(jù)挖掘技術(shù)是南京大學(xué)的主要研究方向,而科研機構(gòu)如北京系統(tǒng)工程研究院來說,其主要研究方向是數(shù)據(jù)挖掘技術(shù)在模糊信息中的實際應(yīng)用。
2.2 應(yīng)用現(xiàn)狀分析
在我國,能夠真正應(yīng)用數(shù)據(jù)挖掘技術(shù)并取得成就的公司包括是廣州華工明天科技有限公司以及菲奈特-融通企業(yè),其中廣州華工明天科技有限公司主要進行多功能數(shù)據(jù)挖掘設(shè)備的研發(fā),而菲奈特-融通企業(yè)依賴于數(shù)據(jù)挖掘軟件的發(fā)展進行其商業(yè)智能套件的研發(fā)。
2.3 研究成果分析
近年來,由于國家的大力扶植與資金支持,我國數(shù)據(jù)挖掘技術(shù)研究取得了重要性的成果,在亞太數(shù)據(jù)挖掘的國際會議中,由南京大學(xué)周志華帶隊的數(shù)據(jù)挖掘技術(shù)研究小組表現(xiàn)突出,同時參與數(shù)據(jù)挖掘編程大賽并奪得桂冠;同樣在了亞太數(shù)據(jù)挖掘國際會議上,中國香港大學(xué)的電子商業(yè)科技研究院的黃哲學(xué)教授的論文獲得亞太數(shù)據(jù)挖掘國際會議論文大獎。
2.4 國內(nèi)外對比
國內(nèi)外的數(shù)據(jù)挖掘技術(shù)研究的進程具有很大的差距,不僅表現(xiàn)在相關(guān)理論的研究上,更在于對數(shù)據(jù)挖掘技術(shù)的實際應(yīng)用的方面。與國外的數(shù)據(jù)挖掘技術(shù)研究進程相比,我國的研究起步晚,仍然處于發(fā)展的初級階段,并且還沒有成熟的理論與技術(shù)應(yīng)用成果,目前的主要研究方向是對于數(shù)據(jù)的初級處理如模糊化處理,技術(shù)尚不成熟。
國外關(guān)于數(shù)據(jù)挖掘技術(shù)的軟件研發(fā)發(fā)展已經(jīng)取得矚目的成就,而國內(nèi)的軟件研發(fā)尚不成熟,研究的重心在于高等學(xué)府的人才,同時都是屬于政府資助項目,可能導(dǎo)致其成果要求較低,從而阻塞了研發(fā)的步伐。
3 數(shù)據(jù)挖掘在我國的未來發(fā)展
3.1 研究方向展望
近年來,隨著計算機科學(xué)領(lǐng)域的快速發(fā)展,數(shù)據(jù)挖掘技術(shù)作為一種新興的學(xué)科,其研究熱度正在逐漸升溫,研究的水平也在逐步提高,同時由于國家政府的政策支持與資金支持,越來越多的數(shù)據(jù)專業(yè)研究者被吸引加入其中。在數(shù)據(jù)挖掘技術(shù)未來的研究過程中,其主要方向應(yīng)包括以下幾點:
(1)參照于SQL語言的標(biāo)準(zhǔn)化的研究成果,對數(shù)據(jù)挖掘技術(shù)進行形式化的描述,即發(fā)現(xiàn)數(shù)據(jù)語言。(2)為實現(xiàn)關(guān)于數(shù)據(jù)額挖掘技術(shù)人機交互工作的順利開展,應(yīng)滿足用戶對知識發(fā)現(xiàn)過程的可視化進程。(3)研究在計算機領(lǐng)域的數(shù)據(jù)挖掘技術(shù)的發(fā)展,可以通過數(shù)據(jù)挖掘服務(wù)器的有效配合的方式實現(xiàn)。
3.2 面臨的問題
(1)挖掘方法與人機交互問題。我國數(shù)據(jù)挖掘技術(shù)的發(fā)展受限制于挖掘方法,不管是知識類型的限制,還是維度上的限制,都是影響其發(fā)展的重要因素。(2)性能問題。能夠有效的解決數(shù)據(jù)挖掘技術(shù)算法中的問題是解決其性能問題的關(guān)鍵,應(yīng)對其有效性、可伸縮性等問題進行研究,保證其算法能夠滿足用戶的性能要求。(3)數(shù)據(jù)類型多樣性問題。對于算法復(fù)雜的,多維度的數(shù)據(jù)類型,現(xiàn)有的研究水平很難去解決此類問題,同時對于多跨度的全球化信息技術(shù)的挖掘水平仍然落后。
4 結(jié)束語
數(shù)據(jù)挖掘技術(shù)作為新興的數(shù)據(jù)應(yīng)用工具,能夠有效的加強對數(shù)據(jù)的處理程度,但是由于我國研發(fā)起步晚,導(dǎo)致我國的發(fā)展水平落后與國外水平。近年來,國家對數(shù)據(jù)挖掘技術(shù)的政策與資金支持,掀起了研究的熱潮。我國應(yīng)重視數(shù)據(jù)挖掘算法研究以及其實際應(yīng)用,不斷地發(fā)展數(shù)據(jù)挖掘技術(shù)的研究。
參考文獻:
[1]謝邦昌,李揚.數(shù)據(jù)挖掘與商業(yè)智能的現(xiàn)況及未來發(fā)展[J].統(tǒng)計與信息論壇,2015(05):94-96.
[2]李菁菁,邵培基,黃亦瀟.數(shù)據(jù)挖掘在中國的現(xiàn)狀和發(fā)展研究[J]. 管理工程學(xué)報,2016(03):10-15.