趙翠榮
(安徽文達信息工程學院,安徽 合肥 231201)
前言:網(wǎng)絡(luò)型數(shù)據(jù)挖掘系統(tǒng),英文全稱E-Data Mining System,簡稱E-DMS.在互聯(lián)網(wǎng)技術(shù)不斷發(fā)展的今天,網(wǎng)絡(luò)基礎(chǔ)設(shè)施平臺越來越趨于寬帶化,整體網(wǎng)絡(luò)的人性化與智能化水平也在日益提升,在應(yīng)用技術(shù)領(lǐng)域內(nèi)則更加偏向于多元與個性化發(fā)展,網(wǎng)絡(luò)型數(shù)據(jù)挖掘系統(tǒng)便是在這種條件下誕生的,為數(shù)據(jù)挖掘技術(shù)領(lǐng)域的進一步發(fā)展開拓了新的空間.
E-DMS是以網(wǎng)絡(luò)技術(shù)動態(tài)以及數(shù)據(jù)挖掘發(fā)展為依托的,其提出的主要目的是為了使數(shù)據(jù)挖掘能夠在互聯(lián)網(wǎng)的基礎(chǔ)上,為大眾所普遍應(yīng)用,為社會經(jīng)濟的進一步發(fā)展提供條件.
現(xiàn)階段在網(wǎng)絡(luò)應(yīng)用領(lǐng)域中,比較主要的網(wǎng)絡(luò)架構(gòu)有以下幾種:C/S,B/S,B/C/S等[1].在對其進行選擇的過程中,需要以網(wǎng)絡(luò)不同的應(yīng)用特點以及相應(yīng)的架構(gòu)優(yōu)勢來進行合理選擇,針對相對復(fù)雜的網(wǎng)絡(luò)系統(tǒng),也可以采用多種網(wǎng)絡(luò)架構(gòu)相結(jié)合的模式.其中,C/S指的是客戶機/服務(wù)器,其主要優(yōu)勢是能夠?qū)C的處理能力充分發(fā)揮出來,使PC的反應(yīng)更加迅速,但這種模式只可以對局域網(wǎng)絡(luò)起作用,且PC需要安裝專用軟件才能夠完成作業(yè).B/S指的是瀏覽器/服務(wù)器,其優(yōu)勢在于不需要安裝專門軟件,在任何地點都可以進行使用,但這種模式對服務(wù)器來講,其運行的數(shù)據(jù)負荷相對較重.B/C/S指的是瀏覽器/客戶機/服務(wù)器,這種模式能夠有效彌補上兩種模式中的不足,同時兼顧兩種模式中的優(yōu)勢,是當前一種比較好的網(wǎng)絡(luò)架構(gòu)模式.
J2EE,英文全稱Java 2 Enterprise Edition,是現(xiàn)階段一種相對大型的網(wǎng)絡(luò)應(yīng)用軟件系統(tǒng)平臺,在平臺內(nèi)部,是由多分層的布局結(jié)構(gòu)組成的,具有能夠跨平臺、跨語言、支持標準網(wǎng)際協(xié)議、兼容多種數(shù)據(jù)庫、J2EE API數(shù)量較多、應(yīng)用程序伸縮性較大等優(yōu)勢[2].具體來講,該系統(tǒng)平臺可以分為以下幾個層次:
1.客戶層
所謂的客戶層,主要指的是對網(wǎng)絡(luò)程序中客戶信息進行處理和表示的界面,主要通過網(wǎng)絡(luò)設(shè)備、PC、無線移動設(shè)備等與對應(yīng)的網(wǎng)絡(luò)應(yīng)用系統(tǒng)進行交流,以客戶端實現(xiàn)的功能與技術(shù)為基礎(chǔ),可以將客戶分為胖瘦兩種類型.所謂的瘦客戶結(jié)構(gòu),主要是將內(nèi)部的一切功能都歸于相應(yīng)的服務(wù)器一端,在客戶端方面,只用于顯示用戶界面,普遍情況下,這種結(jié)構(gòu)以瀏覽器為基礎(chǔ),與服務(wù)器進行交互的過程中主要運用的是HTTP/HTTPS[3].而胖客戶結(jié)構(gòu)主要指的是處于服務(wù)器一端負責存儲數(shù)據(jù)的裝置,而內(nèi)部的其他相關(guān)功能,則全部位于客戶端中.這種結(jié)構(gòu)普遍執(zhí)行于瀏覽器之外,具有相對獨立的GUI應(yīng)用程序,可以以通信協(xié)議為依托,與服務(wù)器進行應(yīng)用層的交互.
2.表示層
表示層,也可以稱之為web層,主要的組成部分為web容器,用于對瘦客戶HTTP的信息進行處理.在web容器中,包含的Java技術(shù)主要有Java Sever Page,以及Servlet兩種,能夠共同對客戶端所發(fā)出的的請求進行處理,也能夠處理應(yīng)用層請求的相關(guān)表示邏輯,之后對能夠返回原本客戶端的相應(yīng)頁面內(nèi)容進行有效創(chuàng)建.與傳統(tǒng)的CGI相比,Servlet的使用效率更高、可操作性強、功能更為強大、可移植性較強,且能夠有效節(jié)省成本,是當前一種性價比較高的技術(shù).
3.應(yīng)用層
應(yīng)用層,主要的組成部分為Enterprise Java Beans容器,簡稱EJB,是一種封裝應(yīng)用邏輯,也是一種可以在服務(wù)器內(nèi)運行的軟件組件[4].EJB主要負責對客戶端所發(fā)出的請求進行處理,在處理的過程中,可能涉及到對數(shù)據(jù)層進行訪問.EJB主要分為會話、實體以及消息驅(qū)動三種類型,用于對不同的應(yīng)用系統(tǒng)角度進行解決,與此同時,還能夠使相對復(fù)雜的應(yīng)用系統(tǒng)更加的便捷化.使用EJB能夠使應(yīng)用軟件的實用性與可移植性大大增強,簡化開發(fā)的相應(yīng)步驟,進而節(jié)約系統(tǒng)開發(fā)的時間與成本,提升系統(tǒng)開發(fā)的靈活性.
4.數(shù)據(jù)層
數(shù)據(jù)層主要包含ERP、數(shù)據(jù)庫、事物處理信息等.在J2EE中,規(guī)定了Java數(shù)據(jù)庫鏈接(JDBC)以及連接器等兩項相關(guān)技術(shù),用于對數(shù)據(jù)層標準的和可移植的提供相應(yīng)訪問[5].運用CORBA以及Java連接器等形式,使運行組件與其他資源實現(xiàn)通信,已達到分布式數(shù)據(jù)存取的目的.
數(shù)據(jù)庫技術(shù)隨著計算機應(yīng)用系統(tǒng)的快速發(fā)展得到進一步開發(fā),而數(shù)據(jù)模型作為數(shù)據(jù)庫的主要組成部分也歷經(jīng)了網(wǎng)狀、層次、關(guān)系、關(guān)系-對象、對象等多個階段.從類型角度看,也從傳統(tǒng)的簡單型發(fā)展到現(xiàn)在的多媒體、空間等數(shù)據(jù)庫類型.從能力角度看,也由起初的簡單存儲發(fā)展到現(xiàn)在擁有強大功能的OLAP、OLTP、OLAM等數(shù)據(jù)庫,為數(shù)據(jù)的挖掘提供了有效支持.從應(yīng)用領(lǐng)域角度看,也由起初的單機形式,發(fā)展到現(xiàn)在的web中來.運用數(shù)據(jù)庫技術(shù)的相關(guān)產(chǎn)品也為多種網(wǎng)絡(luò)應(yīng)用系統(tǒng)的實施與開發(fā)提供了良好條件.
E-DMS是在web結(jié)構(gòu)、應(yīng)用平臺、數(shù)據(jù)庫技術(shù)等內(nèi)容的基礎(chǔ)上,以B/C/S為依托的新型數(shù)據(jù)挖掘系統(tǒng)[6].從客戶層的角度看,胖瘦兩種客戶的劃分標準主要取決于客戶對數(shù)據(jù)挖掘性能的不同要求,瘦客戶一般情況下只要求提供數(shù)據(jù)挖掘的結(jié)果,而胖客戶則要求在客戶端進行相對頻繁的相關(guān)分析與計算,運用E-DMS能夠有效提升客戶端的運行效率,使網(wǎng)絡(luò)的負載大大降低.從表示層的角度看,主要用于完成客戶對數(shù)據(jù)挖掘的不同請求,還需要將結(jié)果反饋給客戶,運用JSP與Servlet相結(jié)合的方式,能夠使網(wǎng)絡(luò)請求和動態(tài)頁面的形成更加便捷與高效.從應(yīng)用層的角度看,這一部分是整個系統(tǒng)中最重要的部分,系統(tǒng)內(nèi)部絕大多數(shù)的重要信息與數(shù)據(jù)都集中在這一部分中,運用EJB將系統(tǒng)內(nèi)部已有的有效數(shù)據(jù)挖掘算法集中起來,形成DMB,而不同的DMB中,蘊藏著數(shù)據(jù)挖掘功能,這種方法更有利于調(diào)整與拓展系統(tǒng)功能.
E-DMS中,涉及到很多新型的網(wǎng)絡(luò)技術(shù),因此,想要設(shè)計好一個完善高效的E-DMS,需要注意以下幾方面問題:
1.網(wǎng)絡(luò)安全問題
在進行網(wǎng)絡(luò)設(shè)計的過程中,網(wǎng)絡(luò)的結(jié)構(gòu)與性能只是其中需要考慮的一個方面,網(wǎng)絡(luò)的安全問題也是不容忽視的.隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,安全問題也日益突出,在對網(wǎng)絡(luò)進行設(shè)計的過程中,需要設(shè)置防火墻、客戶認證等相應(yīng)的網(wǎng)絡(luò)安全措施,以免網(wǎng)絡(luò)中重要的數(shù)據(jù)信息泄露.
2.模型建立與維護問題
在E-DMS中,拋開通用的數(shù)據(jù)挖掘算法不談,針對專用的數(shù)據(jù)挖掘系統(tǒng),需要構(gòu)建相應(yīng)的數(shù)據(jù)挖掘模型,以避免重復(fù)挖掘所產(chǎn)生的浪費問題,以任務(wù)為基礎(chǔ)進行構(gòu)建的數(shù)據(jù)庫挖掘模型能夠進行永久性應(yīng)用,也能夠?qū)ν诰蚰J降南嚓P(guān)參數(shù)進行相應(yīng)調(diào)整,完成重新應(yīng)用[7].這便需要對數(shù)據(jù)挖掘模型進行快捷高效的構(gòu)建,并對數(shù)據(jù)挖掘模型進行及時的維護與調(diào)整.
3.數(shù)據(jù)源兼容問題
在E-DMS的數(shù)據(jù)層中,會有很多不同類型、不同結(jié)構(gòu)的數(shù)據(jù)庫數(shù)據(jù),只有有效保證各種結(jié)構(gòu)類型的數(shù)據(jù)庫數(shù)據(jù)能夠良好的協(xié)同工作,才能有效保證數(shù)據(jù)庫系統(tǒng)的穩(wěn)定性與可靠性,確保其能夠安全順利運行.然而由于這些數(shù)據(jù)庫的生產(chǎn)廠家與產(chǎn)品型號各不相同,在組成數(shù)據(jù)庫系統(tǒng)后,往往會由于各種型號數(shù)據(jù)的不兼容,導(dǎo)致各種問題的出現(xiàn).因此,在對E-DMS進行設(shè)計的過程中,需要充分考慮到這一點,注意數(shù)據(jù)源相互不兼容的客觀問題,從而有效確保數(shù)據(jù)庫系統(tǒng)運行的安全與穩(wěn)定.
4.應(yīng)用集成問題
現(xiàn)階段,在數(shù)據(jù)挖掘應(yīng)用過程中所應(yīng)用到的相關(guān)方式主要有DM、OLAP、OLAM等,這些數(shù)據(jù)挖掘方式都有其各自的優(yōu)勢和缺陷,但以當前的技術(shù)條件還無法真正將其有效結(jié)合起來,無法使各種數(shù)據(jù)挖掘方式能夠科學有效的協(xié)調(diào)工作、優(yōu)勢互補.因此,對這些數(shù)據(jù)挖掘方式進行有效合理的集成與應(yīng)用,是當前對E-DMS進行設(shè)計過程中需要解決的主要問題之一.
另外,除了以上所說的網(wǎng)絡(luò)安全、模型建立與維護、數(shù)據(jù)源兼容以及應(yīng)用集成等問題,在進行E-DMS設(shè)計的過程中,還需要注意整個網(wǎng)絡(luò)系統(tǒng)的可維護性、網(wǎng)絡(luò)系統(tǒng)的穩(wěn)定性,以及網(wǎng)絡(luò)系統(tǒng)的可拓展性的問題,以有效避免各種網(wǎng)絡(luò)系統(tǒng)惡意軟件的攻擊,進而推動網(wǎng)絡(luò)數(shù)據(jù)系統(tǒng)的長足發(fā)展.
網(wǎng)絡(luò)型數(shù)據(jù)挖掘系統(tǒng),即E-DMS,是網(wǎng)絡(luò)與數(shù)據(jù)挖掘技術(shù)進步發(fā)展之下的產(chǎn)物,符合人們對數(shù)據(jù)挖掘技術(shù)的發(fā)展需求.E-DMS能夠?qū)崿F(xiàn)將傳統(tǒng)意義上的數(shù)據(jù)挖掘系統(tǒng)向網(wǎng)絡(luò)形態(tài)下的轉(zhuǎn)移,在很大程度上方便了終端客戶對數(shù)據(jù)挖掘方面的客觀需求,實現(xiàn)了在計算機網(wǎng)絡(luò)環(huán)境下的移動辦公,隨時隨地都能夠?qū)ο到y(tǒng)進行操作與管理.隨著科技的不斷進步,相信解決了E-DMS當前存在的相關(guān)問題,在未來,E-DMS能夠為人們提供更加方便高效的數(shù)據(jù)挖掘服務(wù).
〔1〕江文斌,張仁津,張方霞.基于W eb Services的電子商務(wù)系統(tǒng)的研究與架構(gòu) [J].電腦知識與技術(shù),2011,05(25):206-207.
〔2〕邵紅全,趙茜,歐陽仙桃.用SQL Server2000實現(xiàn)數(shù)據(jù)挖掘的技術(shù)與策略 [J].電腦開發(fā)與應(yīng)用,2013,12(20):206-207.
〔3〕徐薇,黃厚寬,李昆侖.數(shù)據(jù)挖掘和數(shù)據(jù)倉庫的關(guān)系研究[J].廣西師范大學學報(自然科學版),2014,02(15):129-130.
〔4〕于海防,解福.基于Agent的數(shù)據(jù)挖掘在CRM中的應(yīng)用[J].山東師范大學學報(自然科學版),2013,04(19):105-106.
〔5〕陳志高,成奮華,許彪.Hadoop異構(gòu)網(wǎng)絡(luò)下基于自適應(yīng)螞蟻算法的策略路由研究[J].文山學院學報,2013,08(15):218-219.