• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      云計算環(huán)境下面向領(lǐng)域的數(shù)據(jù)挖掘服務(wù)平臺研究

      2014-05-25 00:34:22曹小春曾安潘丹
      自動化儀表 2014年9期
      關(guān)鍵詞:數(shù)據(jù)挖掘架構(gòu)構(gòu)件

      曹小春 曾安 潘丹

      (溫州廣播電視大學(xué)1,浙江 溫州 325000;廣東工業(yè)大學(xué)計算機學(xué)院2,廣東 廣州 510006;美國Batteries Plus公司3,威斯康辛州 哈特蘭市 53029)

      云計算環(huán)境下面向領(lǐng)域的數(shù)據(jù)挖掘服務(wù)平臺研究

      曹小春1曾安2潘丹3

      (溫州廣播電視大學(xué)1,浙江 溫州 325000;廣東工業(yè)大學(xué)計算機學(xué)院2,廣東 廣州 510006;美國Batteries Plus公司3,威斯康辛州 哈特蘭市 53029)

      為促進數(shù)據(jù)挖掘開發(fā)及其商業(yè)應(yīng)用,采用云計算技術(shù)、領(lǐng)域工程和數(shù)據(jù)挖掘等技術(shù),結(jié)合領(lǐng)域驅(qū)動設(shè)計和云計算框架,提出了一種面向領(lǐng)域的數(shù)據(jù)挖掘云平臺框架,并闡述了云計算環(huán)境下面向領(lǐng)域的數(shù)據(jù)挖掘服務(wù)的機理。定義了面向領(lǐng)域的數(shù)據(jù)挖掘云平臺服務(wù)開發(fā)模式,這對面向領(lǐng)域的數(shù)據(jù)挖掘、云計算環(huán)境下的數(shù)據(jù)挖掘服務(wù)模式以及數(shù)據(jù)挖掘服務(wù)的開發(fā)和應(yīng)用都有一定的參考價值。

      云計算 領(lǐng)域工程 數(shù)據(jù)挖掘 面向領(lǐng)域 領(lǐng)域驅(qū)動

      0 引言

      目前,關(guān)于云計算和大數(shù)據(jù)的研究已成為計算機科學(xué)中的研究熱點之一。隨著互聯(lián)網(wǎng)和企業(yè)業(yè)務(wù)的發(fā)展,海量商業(yè)信息數(shù)據(jù)成為了企業(yè)的又一寶貴財富。當(dāng)然隨之而來的問題是怎樣有效地從這些大數(shù)據(jù)中挖掘出具有商業(yè)價值的信息。顯然,建立一個分布式的、高效的、靈活的、擴展性強的數(shù)據(jù)挖掘模式和云計算平臺已然成為了當(dāng)務(wù)之急。而基于云計算環(huán)境的數(shù)據(jù)挖掘通常不能很好地適應(yīng)跨領(lǐng)域或多領(lǐng)域的數(shù)據(jù)挖掘任務(wù),且難以適應(yīng)多變的需求,對領(lǐng)域人員的知識、經(jīng)驗的要求較高。本文考慮基于領(lǐng)域構(gòu)件的軟件復(fù)用,將云計算、數(shù)據(jù)挖掘、領(lǐng)域工程相結(jié)合,提出了一種面向領(lǐng)域的數(shù)據(jù)挖掘云平臺架構(gòu)。

      1 相關(guān)技術(shù)

      1.1 領(lǐng)域工程

      在軟件工程環(huán)境中,領(lǐng)域是指一組具有相似或相近軟件需求的應(yīng)用系統(tǒng)所覆蓋的功能、問題、問題解決方案或知識區(qū)域[1]。領(lǐng)域工程是為一組相似或相近系統(tǒng)的應(yīng)用工程建立基本能力和必備基礎(chǔ)的過程,它覆蓋了建立可復(fù)用的軟件構(gòu)件的所有活動[2]。領(lǐng)域工程是針對應(yīng)用工程中多個系統(tǒng)共享的領(lǐng)域需求開發(fā)和組織特定領(lǐng)域的可復(fù)用構(gòu)件的過程,具體而言是將領(lǐng)域知識轉(zhuǎn)化成系統(tǒng)中共同的規(guī)約、設(shè)計和架構(gòu)。通過領(lǐng)域工程產(chǎn)生的可復(fù)用構(gòu)件來源于領(lǐng)域系統(tǒng)中現(xiàn)有的系統(tǒng),體現(xiàn)了領(lǐng)域中系統(tǒng)的本質(zhì)需求[3]。

      領(lǐng)域工程包括以下三個主要階段。

      ①領(lǐng)域分析:目標(biāo)是獲得領(lǐng)域分析模型。結(jié)合用戶需求,通過分析、研究一組應(yīng)用系統(tǒng)的特性,發(fā)現(xiàn)并描述出需求的共性和特性,從而界定領(lǐng)域的邊界。

      ②領(lǐng)域設(shè)計:目標(biāo)是獲得特定領(lǐng)域的軟件架構(gòu)(domain-specific software architecture,DSSA)。領(lǐng)域設(shè)計是以領(lǐng)域分析模型為基礎(chǔ),獲取特定領(lǐng)域的軟件體系結(jié)構(gòu)DSSA的過程(又稱復(fù)用基礎(chǔ)設(shè)施)。

      ③領(lǐng)域?qū)崿F(xiàn):目標(biāo)是實現(xiàn)DSSA和構(gòu)件,并依據(jù)領(lǐng)域分析模型和DSSA組織可復(fù)用構(gòu)件庫。

      領(lǐng)域工程和應(yīng)用工程是兩個并行的過程,兩者關(guān)系圖如圖1所示。在應(yīng)用工程中,重用領(lǐng)域工程的結(jié)果,是利用在領(lǐng)域工程中開發(fā)的可復(fù)用資源制作具體系統(tǒng)的過程。領(lǐng)域工程的三個主要階段是一個反復(fù)迭代、逐漸求精的過程。

      圖1 領(lǐng)域工程和應(yīng)用工程關(guān)系圖Fig.1 Relationship between domain engineering and application engineering

      1.2 領(lǐng)域驅(qū)動設(shè)計和經(jīng)典分層架構(gòu)

      2004年,Eric Evans發(fā)表領(lǐng)域驅(qū)動設(shè)計(domaindriven design-tackling complexity in the heart of software, Evans DDD)。領(lǐng)域驅(qū)動設(shè)計分為兩個階段:以一種領(lǐng)域?qū)<?、設(shè)計人員、開發(fā)人員都能理解的通用語言作為交流工具,進而發(fā)現(xiàn)領(lǐng)域概念并將其設(shè)計成領(lǐng)域模型;由領(lǐng)域模型驅(qū)動軟件設(shè)計,用代碼來實現(xiàn)該領(lǐng)域模型。

      領(lǐng)域驅(qū)動設(shè)計的經(jīng)典分層架構(gòu)如圖2所示。

      圖2 領(lǐng)域驅(qū)動設(shè)計的經(jīng)典分層架構(gòu)圖Fig.2 Classical hierarchical architecture of domain driven design

      各層具體說明如下。

      ①用戶界面/展現(xiàn)層:負責(zé)向用戶展現(xiàn)信息以及解釋用戶命令。

      ②應(yīng)用層:定義軟件要完成的任務(wù)。

      ③領(lǐng)域?qū)?負責(zé)表達業(yè)務(wù)概念、業(yè)務(wù)狀態(tài)信息以及業(yè)務(wù)規(guī)則,領(lǐng)域模型處于這一層,是業(yè)務(wù)軟件的核心。

      ④基礎(chǔ)設(shè)施層:為其他層提供通用的技術(shù)能力;提供層間的通信;為領(lǐng)域?qū)訉崿F(xiàn)持久化機制。

      構(gòu)建領(lǐng)域數(shù)據(jù)挖掘系統(tǒng),需要不同領(lǐng)域?qū)<?、行業(yè)人員及開發(fā)人員相互協(xié)作完成。結(jié)合領(lǐng)域工程和云計算技術(shù)的數(shù)據(jù)挖掘云平臺開發(fā)模式是非常關(guān)鍵的。

      2 領(lǐng)域數(shù)據(jù)挖掘云平臺

      面向領(lǐng)域的數(shù)據(jù)挖掘云平臺架構(gòu)的基本要求如下。

      ①云資源透明:數(shù)據(jù)挖掘工作不要求使用人員深入了解云資源或云技術(shù);數(shù)據(jù)挖掘服務(wù)必須在合適的云平臺服務(wù)機器上執(zhí)行。

      ②應(yīng)用開發(fā)支持:存在云服務(wù)中的數(shù)據(jù)挖掘應(yīng)用服務(wù)、技術(shù)以及相關(guān)資源能夠在數(shù)據(jù)挖掘應(yīng)用程序中被有效啟用,且不受應(yīng)用程序的干擾。

      ③數(shù)據(jù)挖掘和領(lǐng)域架構(gòu)及操作:系統(tǒng)應(yīng)該有效地依靠存在的和整合的云相關(guān)標(biāo)準(zhǔn),采用廣泛的開源和構(gòu)件技術(shù)。

      針對這些基本要求,結(jié)合領(lǐng)域設(shè)計和領(lǐng)域驅(qū)動設(shè)計經(jīng)典分層架構(gòu),面向領(lǐng)域的數(shù)據(jù)挖掘云平臺自然而然分解成多層次架構(gòu)。在此提出一種面向領(lǐng)域的數(shù)據(jù)挖掘云平臺框架,具體如圖3所示。圖3主要呈現(xiàn)的是積木式的框架層次以及構(gòu)件和接口。從系統(tǒng)結(jié)構(gòu)層面來看,在云平臺環(huán)境有利于數(shù)據(jù)挖掘和領(lǐng)域知識的有機結(jié)合,且使得數(shù)據(jù)挖掘更加開源化。

      在云計算環(huán)境中,根據(jù)不同的抽象層提供面向領(lǐng)域數(shù)據(jù)挖掘應(yīng)用、特殊服務(wù)資源和平臺。

      從面向領(lǐng)域數(shù)據(jù)挖掘云平臺的全面建設(shè)和有效運行的角度出發(fā),面向領(lǐng)域數(shù)據(jù)挖掘云平臺應(yīng)用架構(gòu)模型由四部分組成:物理資源、領(lǐng)域構(gòu)件資源庫和數(shù)據(jù)資源、領(lǐng)域數(shù)據(jù)挖掘服務(wù)平臺、面向領(lǐng)域的數(shù)據(jù)挖掘軟件服務(wù)。這些層次自下而上依次滿足物理資源整合、數(shù)據(jù)和領(lǐng)域構(gòu)件整合、數(shù)據(jù)挖掘服務(wù)整合和面向領(lǐng)域數(shù)據(jù)挖掘的整合需要,按照領(lǐng)域工程和應(yīng)用工程的發(fā)展向用戶提供領(lǐng)域數(shù)據(jù)挖掘服務(wù)。與傳統(tǒng)的數(shù)據(jù)挖掘系統(tǒng)架構(gòu)相比,該平臺具有高可擴展性、海量數(shù)據(jù)處理能力、面向服務(wù)、硬件成本低廉等優(yōu)越性。

      圖3 面向領(lǐng)域數(shù)據(jù)挖掘云平臺應(yīng)用架構(gòu)Fig.3 Cloud platform application framework of domain oriented data mining

      從面向領(lǐng)域數(shù)據(jù)挖掘云平臺的全面建設(shè)和有效運行的角度出發(fā),面向領(lǐng)域數(shù)據(jù)挖掘云平臺應(yīng)用架構(gòu)模型主要包含如下四個部分。

      2.1 面向領(lǐng)域的數(shù)據(jù)挖掘軟件服務(wù)

      面向領(lǐng)域的數(shù)據(jù)挖掘應(yīng)用服務(wù)是一個軟件即服務(wù)(software-as-a-service,SAAS)。SAAS服務(wù)平臺向用戶提供云服務(wù)、數(shù)據(jù)挖掘應(yīng)用管理、數(shù)據(jù)挖掘云服務(wù)。此外,還針對專家的領(lǐng)域?qū)<曳?wù),結(jié)合第三方數(shù)據(jù)挖掘服務(wù)(如:Weka數(shù)據(jù)挖掘算法等)為用戶提供服務(wù)。該應(yīng)用服務(wù)平臺主要包括以下三個方面的內(nèi)容。

      ①面向用戶的可視化應(yīng)用接口,即為用戶提供面向領(lǐng)域的數(shù)據(jù)挖掘可視化應(yīng)用接口,包括數(shù)據(jù)的抽取-轉(zhuǎn)換-加載(ETL)、數(shù)據(jù)挖掘模型、算法演示以及云計算平臺各服務(wù)展示。

      ②面向領(lǐng)域的數(shù)據(jù)挖掘過程服務(wù),即在該服務(wù)過程中,將領(lǐng)域工程和基于數(shù)據(jù)挖掘的應(yīng)用工程相結(jié)合。從領(lǐng)域構(gòu)件的有效利用角度,將面向領(lǐng)域的數(shù)據(jù)挖掘過程服務(wù)規(guī)劃成領(lǐng)域知識服務(wù)、領(lǐng)域軟件規(guī)劃、領(lǐng)域需求分析服務(wù)和領(lǐng)域軟件設(shè)計服務(wù)四個主要過程。

      ③功能服務(wù),該服務(wù)主要從云計算平臺、數(shù)據(jù)挖掘云服務(wù)以及領(lǐng)域構(gòu)件資源的角度出發(fā),為系統(tǒng)提供一系列的服務(wù),如數(shù)據(jù)挖掘(data mining,DM)應(yīng)用管理服務(wù)、云資源服務(wù)、算法服務(wù)、DM云服務(wù)、領(lǐng)域?qū)<曳?wù)等。

      2.2 面向領(lǐng)域數(shù)據(jù)挖掘服務(wù)平臺

      面向領(lǐng)域數(shù)據(jù)挖掘服務(wù)平臺在云服務(wù)的基礎(chǔ)上為用戶提供數(shù)據(jù)挖掘核心服務(wù),是平臺即服務(wù)(platformas-a-service,PAAS),主要包括信息服務(wù)、服務(wù)管理、系統(tǒng)監(jiān)控、數(shù)據(jù)挖掘服務(wù)、DM算法服務(wù)、領(lǐng)域服務(wù)等。在PAAS服務(wù)中,不僅實現(xiàn)了為用戶提供領(lǐng)域數(shù)據(jù)挖掘相關(guān)服務(wù)、云資源管理服務(wù)、服務(wù)調(diào)度和系統(tǒng)監(jiān)控,還為可復(fù)用領(lǐng)域構(gòu)件資源庫的開發(fā)提供了技術(shù)支撐。

      ①數(shù)據(jù)挖掘服務(wù):該服務(wù)功能中包括面向領(lǐng)域數(shù)據(jù)挖掘的核心功能。在該服務(wù)中提供ETL引擎、算法引擎和SQL引擎以及數(shù)據(jù)管理中間件。該服務(wù)功能實現(xiàn)了數(shù)據(jù)挖掘中的強大的數(shù)據(jù)處理功能,它的基礎(chǔ)性、通用性毋庸置疑。

      ②DM算法服務(wù):該服務(wù)提供算法學(xué)習(xí)、算法調(diào)度、算法管理等服務(wù)功能,同時在數(shù)據(jù)層提供算法庫,這樣才能針對不同領(lǐng)域,提供適合該領(lǐng)域的ETL數(shù)據(jù)處理算法、數(shù)據(jù)挖掘算法等。

      ③領(lǐng)域服務(wù):該服務(wù)功能包括對領(lǐng)域知識庫的管理、調(diào)度以及領(lǐng)域構(gòu)件資源庫的相關(guān)操作功能。

      ④面向領(lǐng)域的數(shù)據(jù)挖掘應(yīng)用支持框架:以領(lǐng)域模型、領(lǐng)域驅(qū)動設(shè)計和領(lǐng)域架構(gòu)為依據(jù),提供數(shù)據(jù)挖掘系統(tǒng)所需的基礎(chǔ)應(yīng)用開發(fā)環(huán)境,可作為數(shù)據(jù)挖掘應(yīng)用系統(tǒng)參考原型。支持框架為領(lǐng)域構(gòu)件組裝和數(shù)據(jù)交換提供標(biāo)準(zhǔn)接口,根據(jù)用戶的個性化需求,實現(xiàn)快速的構(gòu)件開發(fā)與交付。

      2.3 領(lǐng)域構(gòu)件資源、數(shù)據(jù)資源

      領(lǐng)域構(gòu)件資源和數(shù)據(jù)資源為面向領(lǐng)域數(shù)據(jù)挖掘云平臺不同層次上的服務(wù)和功能提供數(shù)據(jù)資源交換和共享、領(lǐng)域知識、算法知識、數(shù)據(jù)挖掘模型以及領(lǐng)域構(gòu)件資源的相關(guān)整合等。該層是基礎(chǔ)架構(gòu)即服務(wù)(infrastructure-as-a-service,IAAS)。

      通過虛擬化技術(shù),把云環(huán)境下的各種分布式資源集中匯集,并封裝成服務(wù)資源,為上層提供服務(wù)和應(yīng)用。

      ①數(shù)據(jù)庫:集中存放面向自適應(yīng)領(lǐng)域的服務(wù)構(gòu)件所需的領(lǐng)域數(shù)據(jù)信息,為面向領(lǐng)域數(shù)據(jù)挖掘的運行提供強大的數(shù)據(jù)支撐。

      ②領(lǐng)域構(gòu)件資源庫:存放各種可復(fù)用的領(lǐng)域構(gòu)件資源。針對不同領(lǐng)域的數(shù)據(jù)挖掘,需要根據(jù)不同的領(lǐng)域規(guī)則來處理。根據(jù)領(lǐng)域工程和應(yīng)用工程,把這些過程開發(fā)或封裝成可復(fù)用的領(lǐng)域構(gòu)件,為面向領(lǐng)域數(shù)據(jù)挖掘服務(wù)提供有利的支撐,增加系統(tǒng)的靈活性和有效性。

      ③領(lǐng)域知識庫:通過領(lǐng)域?qū)<也⒔Y(jié)合應(yīng)用知識規(guī)定的各種針對各領(lǐng)域的數(shù)據(jù)標(biāo)準(zhǔn)、結(jié)構(gòu)標(biāo)準(zhǔn)、信息標(biāo)準(zhǔn)等,領(lǐng)域知識庫為領(lǐng)域工程和面向領(lǐng)域的數(shù)據(jù)挖掘相關(guān)服務(wù)提供統(tǒng)一的標(biāo)準(zhǔn)規(guī)范。

      ④算法庫:存放不同領(lǐng)域的DM算法,為數(shù)據(jù)挖掘過程中的算法服務(wù)提供強大的算法資源。如決策樹算法、關(guān)聯(lián)規(guī)則算法、分類算法、聚類算法等。

      2.4 物理資源

      物理資源即基礎(chǔ)設(shè)施層,為面向領(lǐng)域的數(shù)據(jù)挖掘云平臺服務(wù)提供所需的計算存儲資源。利用相應(yīng)接口,把分布式的軟硬件資源通過云計算和網(wǎng)絡(luò)技術(shù),實現(xiàn)資源的互聯(lián)和共享,同時為虛擬化數(shù)據(jù)資源過程提供服務(wù)。

      3 開發(fā)模式和相關(guān)實現(xiàn)

      基于云計算環(huán)境下的面向領(lǐng)域數(shù)據(jù)挖掘應(yīng)用就是利用云計算服務(wù)和可復(fù)用的領(lǐng)域構(gòu)件為用戶提供更多的數(shù)據(jù)挖掘服務(wù)。數(shù)據(jù)挖掘應(yīng)用包括執(zhí)行數(shù)據(jù)挖掘算法、領(lǐng)域構(gòu)件、數(shù)據(jù)挖掘工具、領(lǐng)域知識庫、數(shù)據(jù)倉庫等。這些數(shù)據(jù)挖掘應(yīng)用是云計算環(huán)境中靈活的、可擴展的以及分布式的服務(wù)資源。結(jié)合傳統(tǒng)的數(shù)據(jù)挖掘模式和服務(wù)流程,研究了多個數(shù)據(jù)挖掘應(yīng)用的設(shè)計和開發(fā)過程,提出了如圖4所示的云平臺開發(fā)模式。

      圖4所示的開發(fā)模式按領(lǐng)域工程的分析、設(shè)計、實現(xiàn)的流程逐步結(jié)合應(yīng)用工程,最后與云計算技術(shù)融合構(gòu)造數(shù)據(jù)挖掘應(yīng)用系統(tǒng)。在具體的實現(xiàn)中,面向領(lǐng)域的數(shù)據(jù)挖掘云平臺開發(fā)模式可以歸納為由圖5所示的三個主要服務(wù)開發(fā)過程構(gòu)成。

      圖4 面向領(lǐng)域的數(shù)據(jù)挖掘云平臺開發(fā)模式Fig.4 Cloud platform development mode of domain oriented data mining

      圖5 服務(wù)開發(fā)過程Fig.5 The service development process

      3.1 面向領(lǐng)域的數(shù)據(jù)挖掘分析與建模

      領(lǐng)域分析在對領(lǐng)域中若干典型成員系統(tǒng)的需求進行分析的基礎(chǔ)上,考慮預(yù)期的需求變化、技術(shù)演化、限制條件等因素,確定恰當(dāng)?shù)念I(lǐng)域范圍,識別領(lǐng)域的共性特征和變化特征,獲取一組具有足夠可復(fù)用性的領(lǐng)域需求,并對其抽象形成領(lǐng)域模型。而在面向領(lǐng)域的數(shù)據(jù)挖掘云平臺中,首先從領(lǐng)域?qū)<液皖I(lǐng)域知識庫中獲取相應(yīng)的領(lǐng)域知識,對特定領(lǐng)域的數(shù)據(jù)挖掘進行分析,提取領(lǐng)域內(nèi)的可復(fù)用需求,并形成領(lǐng)域服務(wù)規(guī)約。在分析的基礎(chǔ)上,為面向領(lǐng)域的數(shù)據(jù)挖掘建立靜態(tài)、動態(tài)等領(lǐng)域需求模型。

      3.2 領(lǐng)域構(gòu)件、服務(wù)和架構(gòu)設(shè)計

      根據(jù)需求模型和服務(wù)規(guī)約,在云計算環(huán)境中為面向領(lǐng)域的數(shù)據(jù)挖掘系統(tǒng)設(shè)計可復(fù)用領(lǐng)用構(gòu)件和面向特定領(lǐng)域的服務(wù),并設(shè)計出基于特定領(lǐng)域的數(shù)據(jù)挖掘系統(tǒng)架構(gòu)。這些抽象的、靈活的、可復(fù)用的領(lǐng)域構(gòu)件和服務(wù)進一步提高了開發(fā)的效率,降低了系統(tǒng)的復(fù)雜性,同時也增強了系統(tǒng)的可擴展性、可重構(gòu)性和可維護性。

      3.3 領(lǐng)域構(gòu)件、服務(wù)和系統(tǒng)架構(gòu)實現(xiàn)

      在這個階段,結(jié)合云計算環(huán)境特性和現(xiàn)有的開發(fā)技術(shù),實現(xiàn)面向領(lǐng)域數(shù)據(jù)挖掘的可復(fù)用構(gòu)件和支撐DM系統(tǒng)以及云計算平臺服務(wù)。這些構(gòu)件和服務(wù),在領(lǐng)域規(guī)約和應(yīng)用工程的基礎(chǔ)上進行高內(nèi)聚、低耦合的功能集成。當(dāng)然在云計算中要充分考慮到并行計算、分布式調(diào)用等問題,如MapReduce并行計算編程模型,它可屏蔽分布式處理的諸多問題。

      3.4 相關(guān)實現(xiàn)和期望

      現(xiàn)階段云計算平臺已處在蓬勃發(fā)展期,像Google App Engine[4-5]和Amazon Elastic Compute Cloud等。在數(shù)據(jù)存儲方面,Google Bigtable與Amazon Simple Storage Service等為實現(xiàn)海量數(shù)據(jù)的分布式存儲與訪問提供了支持。本文將在Google App Engine平臺下結(jié)合Java編程語言,利用插件技術(shù)實現(xiàn)領(lǐng)域構(gòu)件,實現(xiàn)基于云平臺的數(shù)據(jù)挖掘系統(tǒng)原型。眾所周知,醫(yī)學(xué)和生物學(xué)是兩大聯(lián)系緊密的領(lǐng)域,生物學(xué)中的生物技術(shù)、化學(xué)以及中藥等都對醫(yī)學(xué)做出了重大貢獻,它們之間有很多的交集。生物醫(yī)學(xué)的發(fā)展關(guān)系到醫(yī)療診斷水平和人類健康的重要工程領(lǐng)域。隨著人類基因組計劃、分子生物學(xué)、DNA、蛋白質(zhì)等生物數(shù)據(jù)的涌現(xiàn),心電圖、腦電圖、核磁共振成像、臨床等醫(yī)學(xué)數(shù)據(jù)不斷增多。為了更好地利用這些數(shù)據(jù),幫助生物工程、臨床診斷、藥物臨床作用的發(fā)展以及將它們有機結(jié)合起來,從面向醫(yī)學(xué)和生物學(xué)數(shù)據(jù)挖掘角度出發(fā),結(jié)合本文提出的平臺框架和服務(wù)開發(fā)模式,設(shè)計相應(yīng)的領(lǐng)域構(gòu)件和數(shù)據(jù)挖掘原型系統(tǒng),利用醫(yī)學(xué)和生物醫(yī)藥學(xué)數(shù)據(jù)集,做一定的數(shù)據(jù)挖掘驗證。

      4 結(jié)束語

      鑒于現(xiàn)有的數(shù)據(jù)挖掘服務(wù)研究和應(yīng)用存在的不足,在云平臺服務(wù)架構(gòu)基礎(chǔ)上,將領(lǐng)域工程技術(shù)、應(yīng)用工程技術(shù)和數(shù)據(jù)挖掘技術(shù)結(jié)合在一起,提出了面向領(lǐng)域的數(shù)據(jù)挖掘云平臺體系結(jié)構(gòu)。同時,定義了面向領(lǐng)域的數(shù)據(jù)挖掘云平臺應(yīng)用開發(fā)模式。該模式對面向領(lǐng)域的數(shù)據(jù)挖掘、云計算環(huán)境下的數(shù)據(jù)挖掘服務(wù)模式以及數(shù)據(jù)挖掘服務(wù)的開發(fā)和應(yīng)用都有一定的參考價值。在下一步研究中,將進一步完善系統(tǒng)架構(gòu),使其能服務(wù)更多的領(lǐng)域。同時在云計算平臺下,針對特定領(lǐng)域,實現(xiàn)相關(guān)的數(shù)據(jù)挖掘服務(wù),從而進一步驗證本文提出的面向領(lǐng)域的數(shù)據(jù)挖掘云平臺的應(yīng)用價值。

      [1] Tracz W.Domain specific software architecture(DSSA)frequently asked questions(FAQ)[J].Software Engineering Notes,1994,19(2):52-56.

      [2] 李克勤,陳兆良,梅宏,等.領(lǐng)域工程概述[J].計算機科學(xué),1999, 26(5):21-25.

      [3] Prieto R.Domain analysis for reusability[J].IEEE Computer Society, 1987,23(7):23-29.

      [4] Stanoevska K,Wozniak T.Cloud basics an introduction to cloud computing[J].Grid and Cloud Computing,2010(7):47-61.

      [5] Chang F,Dean J,Ghemawat S,et al.A distributed storage system for structured data[C]∥Proceedings of the 7thSymposium on Operating Systems Design and Implementation(OSI'06),2006:205-218.

      Research on the Domain-oriented Data Mining Service Platform under Cloud Computation Environment

      To promote the development and commercial applications of data mining,by adopting technologies of cloud computation,domain engineering and data mining,and combining domain driving design and cloud computing framework,the domain-oriented architecture of data mining cloud platform is proposed and the mechanism of domain-oriented data mining service under cloud computation environment is described. The development mode of domain-oriented data mining service is defined,it possesses certain reference value for the development and application of domain-oriented data mining,data mining service mode under cloud computation environment and data mining service.

      Cloud computation Domain engineering Data mining Domain-oriented Domain-driven

      TP311+.5

      A

      國家自然科學(xué)基金資助項目(編號:61300107)。

      修改稿收到日期:2014-04-10。

      曹小春(1976-),男,2011年畢業(yè)于同濟大學(xué)計算機科學(xué)與技術(shù)專業(yè),獲碩士學(xué)位,講師;主要從事計算機應(yīng)用、遠程教育、網(wǎng)絡(luò)與信息安全等方向的研究。

      猜你喜歡
      數(shù)據(jù)挖掘架構(gòu)構(gòu)件
      基于FPGA的RNN硬件加速架構(gòu)
      功能架構(gòu)在電子電氣架構(gòu)開發(fā)中的應(yīng)用和實踐
      汽車工程(2021年12期)2021-03-08 02:34:30
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      LSN DCI EVPN VxLAN組網(wǎng)架構(gòu)研究及實現(xiàn)
      基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      建筑構(gòu)件
      建筑構(gòu)件
      建筑構(gòu)件
      建筑構(gòu)件
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      故城县| 阿巴嘎旗| 泽库县| 承德市| 大足县| 拉萨市| 永吉县| 江西省| 五河县| 临朐县| 崇州市| 镇远县| 横山县| 甘德县| 西乡县| 聂荣县| 罗甸县| 潮州市| 无极县| 互助| 措美县| 和平县| 漳州市| 和龙市| 高青县| 绥棱县| 绥中县| 台东市| 广州市| 乾安县| 永登县| 钦州市| 额尔古纳市| 屏边| 分宜县| 高尔夫| 龙州县| 金湖县| 海南省| 伊吾县| 德惠市|