• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于云計算的物聯(lián)網(wǎng)數(shù)據(jù)挖掘模型研究

      2018-01-02 08:45:02
      軟件 2017年12期
      關(guān)鍵詞:數(shù)據(jù)處理數(shù)據(jù)挖掘聯(lián)網(wǎng)

      任 偉

      (南通科技職業(yè)學(xué)院,江蘇 南通 226007)

      基于云計算的物聯(lián)網(wǎng)數(shù)據(jù)挖掘模型研究

      任 偉

      (南通科技職業(yè)學(xué)院,江蘇 南通 226007)

      隨著計算機和網(wǎng)絡(luò)技術(shù)的發(fā)展,數(shù)據(jù)挖掘、云計算、物聯(lián)網(wǎng)等技術(shù)在人們生活、工作當(dāng)中占據(jù)著越來越重要的地位。本文分析了物聯(lián)網(wǎng)、信息融合技術(shù)及其應(yīng)用方法,闡述了以云為中心的物聯(lián)網(wǎng)數(shù)據(jù)處理模型,并以城市公共交通出租車數(shù)據(jù)集為例,描述了數(shù)據(jù)處理的基本過程,驗證了物聯(lián)網(wǎng)實時數(shù)據(jù)處理的可行性與可操作性。

      云計算;物聯(lián)網(wǎng);數(shù)據(jù)挖掘;模型

      0 引言

      數(shù)據(jù)挖掘技術(shù)是從一個隨機海量數(shù)據(jù)中,提取有效可用的信息,進(jìn)而過渡到信息數(shù)據(jù)挖掘其應(yīng)用價值的過程。數(shù)據(jù)挖掘平臺在物聯(lián)網(wǎng)、云計算等強大技術(shù)的支持下,功能更加強大,結(jié)構(gòu)更加穩(wěn)固,進(jìn)而將模式辨別、統(tǒng)計學(xué)等科技元素融為一體,使得數(shù)據(jù)處理高效而經(jīng)濟(jì)。數(shù)據(jù)挖掘技術(shù)在現(xiàn)代科技領(lǐng)域中發(fā)揮著極其重要作用。

      1 物聯(lián)網(wǎng)技術(shù)

      1.1 物聯(lián)網(wǎng)的概念

      物聯(lián)網(wǎng)(“Internet of things”,簡稱 IOT。)是指物與物之間相通相連的一種網(wǎng)絡(luò),是信息時代最重要的技術(shù)之一。物聯(lián)網(wǎng)利用其本身強大的辨別和智能感知技術(shù),在網(wǎng)絡(luò)中融會貫通,使物物相連的同時,也使互聯(lián)網(wǎng)客戶端的應(yīng)用業(yè)務(wù)得以延伸。為此,物聯(lián)網(wǎng)被稱之為繼計算機、Internet之后的第三次世界信息產(chǎn)業(yè)浪潮。

      物聯(lián)網(wǎng)的應(yīng)用領(lǐng)域十分廣泛,從智能交通、政府工作、環(huán)境保護(hù),再到智慧城市、公共安全、環(huán)境監(jiān)測、食品溯源、智能家居等,都或多或少涉及到物聯(lián)網(wǎng)的應(yīng)用。具體而言,在家電、電網(wǎng)、食品以及鐵路橋梁等物之中設(shè)置傳感器,對網(wǎng)絡(luò)信息予以整合,進(jìn)而通過中心控制系統(tǒng),反饋、解決實時信息,方可達(dá)到有效管理、提高生產(chǎn)的目的。在應(yīng)用領(lǐng)域中進(jìn)一步創(chuàng)新,加強用戶體驗,是物聯(lián)網(wǎng)未來發(fā)展的核心所在。

      1.2 物聯(lián)網(wǎng)的特點

      首先,物聯(lián)網(wǎng)技術(shù)具有強大感知能力,利用諸多傳感器,獲取不同信息源的實時數(shù)據(jù),這些數(shù)據(jù)具有不用的形式、內(nèi)容,并且根據(jù)一定的周期頻率搜集環(huán)境信息,予以更新。

      其次,物聯(lián)網(wǎng)是一種基于互聯(lián)網(wǎng)的泛在網(wǎng)絡(luò),其技術(shù)核心仍然是互聯(lián)網(wǎng)。由物聯(lián)網(wǎng)傳感器定時收集信息,利用網(wǎng)絡(luò)協(xié)議傳遞物體實時信息。由于數(shù)據(jù)信息量大,導(dǎo)致形成海量數(shù)據(jù),在傳遞期間,為確保實時性信息,必須與不同結(jié)構(gòu)的協(xié)議、網(wǎng)絡(luò)相適應(yīng)。

      再次,物聯(lián)網(wǎng)中的傳感器具有智能化處理的功能。物聯(lián)網(wǎng)將傳感器和智能處理相結(jié)合,利用云計算、模式識別等各種智能技術(shù),擴(kuò)充其應(yīng)用領(lǐng)域。從傳感器獲得的海量信息中分析、加工和處理出有意義的數(shù)據(jù),以適應(yīng)不同用戶的不同需求,發(fā)現(xiàn)新的應(yīng)用領(lǐng)域和應(yīng)用模式。

      2 信息融合技術(shù)

      2.1 信息融合技術(shù)的概念

      信息與技術(shù)融合,又稱數(shù)據(jù)融合。通過計算機技術(shù),在一定原則下,綜合、分析多種信息源的傳感器信息,以此來取得一個或者是單個信息源所不及的有價值信息。也可以是多傳感器信息融合,綜合一個或多個信息源,進(jìn)而獲取相關(guān)數(shù)據(jù)、關(guān)聯(lián)信息,以此來精準(zhǔn)估計身份、確定位置,動態(tài)評估、處理信息的過程。該過程具有持續(xù)性和創(chuàng)新性,最終實現(xiàn)結(jié)果的更新。

      2.2 信息融合技術(shù)的基本方法

      信息融合技術(shù)中,具有代表性的方法,有以下幾種:

      第一,小波分析方法:這種方法最大的特征在于局部化信息時域,可良好解決分布特征信息、信號。

      第二,加權(quán)平均方法:對傳感器所獲取的信息實施加權(quán)平均,最后的融合值為平均過后的數(shù)值,是信息融合技術(shù)中最簡單直接的一種方法。

      第三,概率論:分析不同傳感器信息源,將錯誤、低水平的信息刪除,如果已知條件為先驗概率,則通過貝葉斯概率法,最終取得有價值的信息融合結(jié)果。

      第四,卡爾曼濾波法:適用于低層次動態(tài)實時傳感器冗余信息,于線性系統(tǒng)而言,當(dāng)傳感器噪聲、系統(tǒng)噪聲達(dá)到建模條件時,此方法可提取有意義的統(tǒng)計融合值,在此期間的存儲不需要太大的空間,對信息的處理可以達(dá)到實時化。

      第五,D-S證據(jù)理論方法:此方法可擴(kuò)充概率論,可應(yīng)用于人工智能、辨別技術(shù)、專家系統(tǒng)以及系統(tǒng)決策領(lǐng)域。

      第六,模糊邏輯理論法:這種邏輯是一種多數(shù)據(jù)邏輯,在推理期間,可反應(yīng)出傳感器的不確定性。該方法可運用在多傳感器信息融合技術(shù)中。

      第七,貝葉斯信息融合方法:多傳感器信息融合時,將諸多不同傳感器傳遞的不確定信息,以概率來表示,把互相獨立的決策視作樣本空間劃分,利用貝葉斯概率方法,予以處理,最后利用系統(tǒng)決策中的準(zhǔn)則,獲取有用信息。

      3 基于云計算的數(shù)據(jù)挖掘模型及其層次分析

      云計算作為一種新型技術(shù),與物聯(lián)網(wǎng)的結(jié)合,是社會發(fā)展的必然結(jié)果。圖1是基于云計算所形成的數(shù)據(jù)處理平臺,也是物聯(lián)網(wǎng)數(shù)據(jù)處理中的挖掘環(huán)節(jié)。在模型中,充分考慮了挖掘算法與推薦算法的并行運行與分布運行。模型將數(shù)據(jù)處理平臺分為三個基本層次,分層設(shè)計的思想使得整個物聯(lián)網(wǎng)數(shù)據(jù)處理的有效性更高,處理效率也得到極大的提升。自下而上為:云計算支撐平臺層、數(shù)據(jù)挖掘能力層、數(shù)據(jù)挖掘云服務(wù)層。

      3.1 云計算支撐平臺層

      提供文件或數(shù)據(jù)存儲空間以及數(shù)據(jù)計算能力,是數(shù)據(jù)處理平臺的基石。在該平臺中,融入了第三方挖掘算法服務(wù),業(yè)務(wù)運作可以基于企業(yè)自主研發(fā)的云計算平臺,也可以基于第三方提供的云計算平臺來進(jìn)行,這也是物聯(lián)網(wǎng)的便捷性所在。

      圖1 基于云計算的數(shù)據(jù)處理平臺模型Fig.1 A model of data processing platform based on cloud computing

      3.2 數(shù)據(jù)挖掘能力層

      給予整個平臺數(shù)據(jù)挖掘的基礎(chǔ)能力。在該層次中,必須要有基本的算法服務(wù)管理、調(diào)度引擎和數(shù)據(jù)并行處理框架。同時,還需要對數(shù)據(jù)挖掘云服務(wù)層的能力提供必然的支撐。從某種程度上來說,數(shù)據(jù)挖掘能力的高低,直接影響云計算的服務(wù)能力,整個物聯(lián)網(wǎng)的服務(wù)力都將受到影響。

      3.3 數(shù)據(jù)挖掘云服務(wù)層

      對外提供數(shù)據(jù)挖掘云服務(wù),其服務(wù)能力封裝的接口形式對外是具有多樣性的,簡單的對象訪問協(xié)議、XML或者本地應(yīng)用程序編程接口等形式,都可以成為云服務(wù)的對外接口形式。物聯(lián)網(wǎng)的基本作用就是利用信息技術(shù)為用戶提供更加便捷的服務(wù)。而云服務(wù)的存在,就是為了強化其服務(wù)能力。云服務(wù)層實際上是綜合其下兩層的數(shù)據(jù)處理,實現(xiàn)的某種用戶需求。另外,云服務(wù)層還可以支持結(jié)構(gòu)化的查詢語言語句的訪問,從而使得數(shù)據(jù)在處理的過程中,語言的轉(zhuǎn)化更加方便。

      4 物聯(lián)網(wǎng)中實時數(shù)據(jù)處理

      物聯(lián)網(wǎng)中,運用不同傳感器所采集到的數(shù)據(jù)多數(shù)為實時數(shù)據(jù)流,對實時數(shù)據(jù)進(jìn)行處理和加工成為物聯(lián)網(wǎng)數(shù)據(jù)處理的核心問題。本文通過對路面部分公共交通監(jiān)控定位數(shù)據(jù)的采集與處理以感知城市交通狀況。與此同時,還搭建了原型系統(tǒng)來處理物聯(lián)網(wǎng)的實時數(shù)據(jù)。

      筆者通過利用出租車GPS獲得的行車軌跡信息作為傳感數(shù)據(jù)來源,搭建原型系統(tǒng)以及必要的驗證平臺。在某城市采集數(shù)據(jù)時,有7648輛出租車在一天時間內(nèi)正常行駛的軌跡信息,傳感采樣的數(shù)據(jù)達(dá)1800萬條。在處理數(shù)據(jù)時,需要處理好兩個問題。第一,交通狀況處于不斷變化中,應(yīng)該如何確保實時處理的數(shù)據(jù)對交通狀況的有效性。第二,出租車在城市中隨機行使,在時空維度上,采集的數(shù)據(jù)呈現(xiàn)出非均勻稀疏狀態(tài)且分布在不同道路中。因此,筆者提出利用在線實時估算法建立物聯(lián)網(wǎng)實時數(shù)據(jù)處理系統(tǒng)。

      4.1 多元線性回歸模型基礎(chǔ)上的實施估算法

      為了能夠解決缺失值估算的問題,所以運用多元線性回歸方法的在線算法。運用多元線性回歸模型來運算出有關(guān)的系數(shù):

      式子中:vit代表t時刻區(qū)域ri的交通條件;vkt,k={1.2.3…m}代表臨近區(qū)域中 rk在 t時刻的交通條件;βk代表 vit和vkt的偏相關(guān)系數(shù);μ代表隨機誤差項。

      式子中:?itv代表 vit的估計;vkt,k={1.2.3…m}代表區(qū)域中t時刻的真實值。

      再運用式子(2)運算出系數(shù)估計值,解決方案的具體算法,見圖2。

      圖2 在交通缺失的情況下的估計算法Fig.2 Estimation algorithm in the absence of traffic

      運用 geohash法分割地球表現(xiàn)經(jīng)緯度,在維度[90-90]、經(jīng)度[180-180]中不斷迭代二分,直至達(dá)到需要的精度位置。運用原始二進(jìn)制來儲存與操作,可以把 geohash轉(zhuǎn)化成浮點數(shù),以便根據(jù)浮點數(shù)自動儲存和訪問。運用 geohash從二進(jìn)制的字符串到浮點數(shù)的映射設(shè)計,因為研究區(qū)域被限制在一個城市中,geohash二進(jìn)制字符串的多位是一樣的,出租車GPS數(shù)據(jù)集中前十位是相同的。把相同部位截斷,壓縮數(shù)據(jù)以方便下一步計算。對有效位實施移位操作,得到儲存浮點數(shù)。以達(dá)到簡化運算的目的,把地區(qū)分成9個矩形(如圖3),估算樣本參考區(qū)就有8個。來自一個估算方向以及速度的兩組樣本臨近兩側(cè)的樣本區(qū),每組采樣組區(qū)都會有圖3所示的矩形區(qū)域。空缺區(qū)域值是按照一個估算速度方向中兩側(cè)臨近樣本得到了交通信息來估算。

      圖3 區(qū)域交通網(wǎng)絡(luò)劃分Fig.3 Division of regional traffic network

      4.2 原型系統(tǒng)結(jié)構(gòu)構(gòu)建與驗證

      實時數(shù)據(jù)處理系統(tǒng)的運行流程,見圖 4。出租車軌跡數(shù)據(jù)集中的信息按照時間順序依次排列到消息隊列中。在處理過程中,包括了4種業(yè)務(wù)處理邏輯,一種Spout和三種Bolt。Spout讀取數(shù)據(jù)消息隊列;Bolt切分每條原始數(shù)據(jù),處理為標(biāo)準(zhǔn)化數(shù)據(jù)處理結(jié)構(gòu)。完成樣本區(qū)域中的 geohash劃分,最后實施聚合操縱業(yè)務(wù)。在具體運用中,數(shù)據(jù)傳感速度非常高,若使用傳統(tǒng)數(shù)據(jù)庫處理,其效率很低。所以使用內(nèi)存數(shù)據(jù)來儲存,減少數(shù)據(jù)處理時延。在實時數(shù)據(jù)處理過程中,分布了五臺臺式計算機,并將其組成集群運行環(huán)境,將ubuntu server操作系統(tǒng)安裝在節(jié)點上,通過web頁面實現(xiàn)將數(shù)據(jù)呈現(xiàn)出來,實現(xiàn)用戶的交互。

      運用上述算法設(shè)計以及分布式計算框架,在當(dāng)前計算機設(shè)備環(huán)境中也能夠滿足應(yīng)用提出的數(shù)據(jù)處理實時性的要求。在數(shù)據(jù)交互與訪問過程中,計算單元時延保持為毫秒級,能夠滿足數(shù)據(jù)實時性要求。

      5 結(jié)論

      隨著科學(xué)技術(shù)的發(fā)展,人們的工作和生活對網(wǎng)絡(luò)的實際需求將不斷增加,以云為中心的物聯(lián)網(wǎng)數(shù)據(jù)處理與傳統(tǒng)的數(shù)據(jù)處理系統(tǒng)相比,可拓展性更強,數(shù)據(jù)處理效率和準(zhǔn)確性更高,其面向的服務(wù)群體更廣,提供的服務(wù)力有更大的發(fā)展?jié)摿Α?/p>

      圖4 實時數(shù)據(jù)處理系統(tǒng)結(jié)構(gòu)Fig.4 The structure of real time data processing system

      [1] 丁巖, 楊慶平, 錢煜明. 基于云計算的數(shù)據(jù)挖掘平臺架構(gòu)及其關(guān)鍵技術(shù)研究[J]. 中興通訊技術(shù), 2013(01).

      [2] 張毅, 崔曉燕. 基于云計算平臺的物聯(lián)網(wǎng)數(shù)據(jù)挖掘研究[J].軟件, 2014(01).

      [3] 卜范玉, 王鑫, 張清辰. 基于云計算的物聯(lián)網(wǎng)數(shù)據(jù)挖掘模型[J]. 電腦與信息技術(shù), 2012(06).

      [4] 張春梅. 云計算物聯(lián)網(wǎng)體系的數(shù)據(jù)挖掘模式設(shè)計[J]. 信息系統(tǒng)工程, 2017(02).

      [5] 解姍姍. 一種基于云計算的數(shù)據(jù)挖掘平臺架構(gòu)設(shè)計與實現(xiàn)[J]. 安陽師范學(xué)院學(xué)報, 2015(05).

      [6] 熊敏, 林榮恒, 鄒華. 云計算環(huán)境下的自適應(yīng)資源監(jiān)測模型設(shè)計[J]. 新型工業(yè)化, 2012(11).

      [7] 葛曉玢, 劉杰. 基于云計算的數(shù)據(jù)挖掘平臺架構(gòu)及其關(guān)鍵技術(shù)研究[J]. 德鎮(zhèn)學(xué)院學(xué)報, 2017(03).

      [8] 張宏萌. 云計算平臺下智能車輛管理系統(tǒng)的研究與設(shè)計[J].中小企業(yè)管理與科技, 2012(04).

      [9] 趙會群, 李會峰, 劉金鑾. RFID物聯(lián)網(wǎng)復(fù)雜事件模式聚類算法研究[J]. 計算機應(yīng)用研究, 2017(03).

      [10] 李立, 張玉州, 江克勤. 一種改進(jìn)的基于云平臺的物聯(lián)網(wǎng)數(shù)據(jù)挖掘算法[J]. 安慶師范學(xué)院學(xué)報(自然科學(xué)版),2014(06).

      Research on Data Mining Model of Internet of Things Based on Cloud Computing

      REN Wei
      (Nantong science and technology Academy, Nantong, Jiangsu 226007)

      With the development of computer and network technology, data mining, cloud computing, Internet of things and other technologies occupy more and more important position in people's life and work. This paper analyzes the networking, information fusion technology and its application method, describes the data processing model of IOT cloud centric, and the city public transportation taxi data set as an example, describes the basic process of data processing, real-time data processing and networking verifies the feasibility and operability.

      Cloud computing; Internet of things; Data mining; Model

      TP391.8

      A

      10.3969/j.issn.1003-6970.2017.12.045

      本文著錄格式:任偉. 基于云計算的物聯(lián)網(wǎng)數(shù)據(jù)挖掘模型研究[J]. 軟件,2017,38(12):229-232

      任偉(1981-),男,講師,主要研究方向:云計算、物聯(lián)網(wǎng)技術(shù)。

      猜你喜歡
      數(shù)據(jù)處理數(shù)據(jù)挖掘聯(lián)網(wǎng)
      “身聯(lián)網(wǎng)”等五則
      認(rèn)知診斷缺失數(shù)據(jù)處理方法的比較:零替換、多重插補與極大似然估計法*
      ILWT-EEMD數(shù)據(jù)處理的ELM滾動軸承故障診斷
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      搶占物聯(lián)網(wǎng)
      通信世界(2018年27期)2018-10-16 09:02:56
      基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      基于希爾伯特- 黃變換的去噪法在外測數(shù)據(jù)處理中的應(yīng)用
      可再生能源與物聯(lián)網(wǎng)
      風(fēng)能(2015年10期)2015-02-27 10:15:34
      得MCU者得物聯(lián)網(wǎng)天下
      普兰店市| 正宁县| 大埔县| 奉贤区| 桃源县| 曲阳县| 拜城县| 洛扎县| 宁明县| 灵山县| 甘德县| 五莲县| 右玉县| 清流县| 嘉禾县| 铁力市| 句容市| 安塞县| 堆龙德庆县| 凤庆县| 阜城县| 大庆市| 双鸭山市| 泾阳县| 玛纳斯县| 衡阳县| 广德县| 乌海市| 广平县| 康保县| 上饶县| 丁青县| 绥江县| 左云县| 南昌县| 汤原县| 曲松县| 思南县| 汉中市| 京山县| 博野县|