• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      面向邊緣智能計算的數(shù)據(jù)場分類算法

      2022-11-30 08:39:16孫志于王琪高彬梁中軍徐曉斌王尚廣
      計算機應(yīng)用 2022年11期
      關(guān)鍵詞:邊緣分布式分類

      孫志于,王琪,高彬,梁中軍,徐曉斌,王尚廣

      面向邊緣智能計算的數(shù)據(jù)場分類算法

      孫志于1,王琪2,高彬2,梁中軍3*,徐曉斌2,王尚廣4

      (1.新疆氣象信息中心,烏魯木齊 830002; 2.北京工業(yè)大學(xué) 信息學(xué)部,北京 100124; 3.國家氣象信息中心 資料服務(wù)室,北京 100081; 4.網(wǎng)絡(luò)與交換技術(shù)國家重點實驗室(北京郵電大學(xué)),北京 100876)(?通信作者電子郵箱 liangzj@cma.gov.cn)

      針對聚類算法研究中普遍存在不能充分利用歷史信息、參數(shù)優(yōu)化過程慢的問題,結(jié)合邊緣智能計算提出了一種基于數(shù)據(jù)場的分布式自適應(yīng)分類算法,算法部署于邊緣計算(EC)節(jié)點,提供本地的智能分類服務(wù)。該算法通過引入監(jiān)督信息改造傳統(tǒng)數(shù)據(jù)場聚類模型的結(jié)構(gòu),使其能夠應(yīng)用于分類問題,擴展了數(shù)據(jù)場理論可應(yīng)用的領(lǐng)域。基于數(shù)據(jù)場思想,該算法將數(shù)據(jù)的域值空間轉(zhuǎn)化為數(shù)據(jù)勢場空間,依據(jù)空間勢值將數(shù)據(jù)分為無標(biāo)簽的多個類簇結(jié)果,再將類簇結(jié)果與歷史監(jiān)督信息進行云相似度比較,并將其歸屬于與其最相似的類中;同時,提出了一種基于滑動步長的參數(shù)搜索策略以提高算法參數(shù)的優(yōu)化速度。在此算法基礎(chǔ)上還提出了一種基于分布式的數(shù)據(jù)處理方案,通過云中心與邊緣設(shè)備的協(xié)作,將分類任務(wù)切割分配到不同層次的節(jié)點,實現(xiàn)模塊化、低耦合。仿真結(jié)果表明,所提算法的查準率和查全率均保持在96%以上,且漢明損失均低于0.022。實驗結(jié)果表明,所提算法可以準確分類并提高參數(shù)優(yōu)化速度,整體性能優(yōu)于邏輯回歸(LR)算法與隨機森林(RF)算法。

      邊緣智能計算;分布式數(shù)據(jù)處理;參數(shù)優(yōu)化;數(shù)據(jù)場;自適應(yīng)分類

      0 引言

      隨著數(shù)以億計的智能終端部署于醫(yī)院、學(xué)校、工廠等地,在各個終端內(nèi)產(chǎn)生了海量的數(shù)據(jù)。其中,很多數(shù)據(jù)都需要做出及時的決策,但受限于本地的計算能力,終端無法對數(shù)據(jù)進行有效處理,這時終端節(jié)點就需要占用網(wǎng)絡(luò)鏈路將本地數(shù)據(jù)上傳,并等待云端反饋結(jié)果[1]。為了減少網(wǎng)絡(luò)通信時間、實現(xiàn)更快的本地響應(yīng),邊緣計算(Edge Computing, EC)將云計算的資源、計算、存儲能力下沉到本地邊緣設(shè)備(如網(wǎng)關(guān)、基站等),使大量計算可直接在本地進行。近些年來,學(xué)者們在關(guān)于EC的具體實踐提出了兩種思路:一是設(shè)計合理的通信與計算資源聯(lián)合分配方案[2];二是將機器學(xué)習(xí)技術(shù)引入EC,提供一種本地的泛智能服務(wù)[3-4]。文獻[3]中提出了一種用于EC環(huán)境中的自動攻擊檢測系統(tǒng),利用EC能力來有效地執(zhí)行基于云上預(yù)構(gòu)建的復(fù)雜極限學(xué)習(xí)機器模型的流量分類;文獻[4]提出了一種基于長短期記憶(Long Short?Term Memory, LSTM)網(wǎng)絡(luò)的面向移動邊緣網(wǎng)絡(luò)的智能互聯(lián)車輛信道預(yù)測模型,該模型能夠捕獲序列中有價值的信息,很好地分析信道參數(shù)的時空相關(guān)性。文獻[3-4]將機器學(xué)習(xí)技術(shù)和EC有機結(jié)合在一起,不僅為機器學(xué)習(xí)技術(shù)找到了實踐應(yīng)用的方向,也使邊緣設(shè)備更加智能。

      以機器學(xué)習(xí)為代表的智能技術(shù)有效地擴大了EC的應(yīng)用空間,經(jīng)過優(yōu)化的模型并不會占用太多的資源,很適用于部署于邊緣設(shè)備以提供高效的服務(wù)[5]。更進一步地,采用分布式的EC與機器學(xué)習(xí)框架,可以為整個系統(tǒng)帶來更高的智能,利用終端采集大量的數(shù)據(jù),聯(lián)合邊緣服務(wù)器與云端共同學(xué)習(xí)算法,智能地通過云中心與邊緣節(jié)點的協(xié)作交換學(xué)習(xí)參數(shù),通過動態(tài)的系統(tǒng)優(yōu)化與應(yīng)用級的調(diào)整,可以更好地訓(xùn)練和推斷模型,達到更高的智能[6]。

      現(xiàn)在很多經(jīng)典的機器學(xué)習(xí)算法被廣泛應(yīng)用于EC,為邊緣設(shè)備提供各種服務(wù)[7]。本文主要提出一種基于數(shù)據(jù)場的自適應(yīng)學(xué)習(xí)的分類算法,類似于傳統(tǒng)機器學(xué)習(xí)技術(shù),同樣可以部署于EC中,提供有效的分類服務(wù)。分類算法是當(dāng)前數(shù)據(jù)挖掘領(lǐng)域中最重要的技術(shù)之一,為數(shù)據(jù)處理提供重要的支撐作用。分類算法通過學(xué)習(xí)有標(biāo)簽的樣本數(shù)據(jù)、優(yōu)化模型參數(shù)、訓(xùn)練分類器,從而獲得預(yù)測未知類型數(shù)據(jù)的能力[8]。

      數(shù)據(jù)場理論基于傳統(tǒng)物理學(xué),將多維數(shù)據(jù)映射為多維空間內(nèi)的對象點。映射后的對象會在數(shù)據(jù)空間內(nèi)相互作用,通過彼此的牽引形成場域,該場域也被稱為數(shù)據(jù)場?,F(xiàn)在,學(xué)者們基于數(shù)據(jù)場提出了多種聚類算法[9-10],這些聚類算法在各自的應(yīng)用領(lǐng)域均取到了良好的效果?;跀?shù)據(jù)場的聚類算法具有參數(shù)依賴量少、算法適應(yīng)性強的優(yōu)點,但是也有不能充分利用歷史信息、參數(shù)優(yōu)化過程慢的缺點。

      本文改進傳統(tǒng)數(shù)據(jù)場聚類算法的結(jié)構(gòu),引入了監(jiān)督信息,使其可以應(yīng)用于分類問題中;同時,為了加快算法參數(shù)的優(yōu)化,提出了一種基于滑動步長的搜索策略,避免了傳統(tǒng)模型陷入過擬合或欠擬合的問題,通過學(xué)習(xí)數(shù)據(jù)之間的相互關(guān)系將數(shù)據(jù)分類,且僅依賴于少量的參數(shù);還提出了一種基于分布式的數(shù)據(jù)處理方案,通過云中心與邊緣設(shè)備的協(xié)作,將分類任務(wù)切割分配到不同層次的節(jié)點,實現(xiàn)模塊化、低耦合。

      1 相關(guān)工作

      傳統(tǒng)的分類算法有基于決策樹的算法、基于貝葉斯的算法和基于神經(jīng)網(wǎng)絡(luò)的算法等。文獻[11]基于經(jīng)典的ID3算法提出了一種改進的疾病預(yù)測分類方法,解決了數(shù)值屬性離散化的問題;文獻[12]提出了一種用于寬帶無線電中的信號分類和干擾檢測技術(shù),使用貝葉斯分類器將各種窄帶信號分類為各自的調(diào)制,檢測不同窄帶信號的干擾;文獻[13]提出了一種基于粒子分類優(yōu)化的BP網(wǎng)絡(luò)客戶流失預(yù)測算法,優(yōu)化了BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值,提高了預(yù)測精度。傳統(tǒng)的分類算法存在一些弊端,如容易陷入過擬合、欠擬合,也不易分析數(shù)據(jù)間的相互關(guān)系。

      分布式分類算法可以提高分類的效率,很多研究者對基于分布式分類算法進行了研究。如文獻[14]提出了一種分布式像素統(tǒng)計方法,探討了分布式處理技術(shù)開發(fā)用于監(jiān)督分割和高分辨率遙感圖像分類方法的有效性,以縮短所需的計算時間;文獻[15]描述了用于分布式優(yōu)化的交替方向乘子算法的具體實現(xiàn),實現(xiàn)在大型數(shù)據(jù)集上運行具有L2正則化的邏輯回歸。

      基于數(shù)據(jù)場的分類方法在聚類中應(yīng)用較多,文獻[16]研究了基于數(shù)據(jù)場的K?Means聚類雷達信號分類算法,將數(shù)據(jù)場引入非自由度雷達信號排序以消除噪聲;文獻[17]提出了一種基于數(shù)據(jù)場聚類和云模型分區(qū)的算法,以解決相鄰群集中心的估計問題。由于數(shù)據(jù)場沒有監(jiān)督信息,是自適應(yīng)而形成的類,所以傳統(tǒng)的數(shù)據(jù)場只能用于聚類而不能用于分類。

      本文提出一種基于數(shù)據(jù)場的自學(xué)習(xí)分類算法,通過將數(shù)據(jù)場理論應(yīng)用到分類問題中,引入監(jiān)督信息,利用類的數(shù)量對參數(shù)進行優(yōu)化,充分利用現(xiàn)有信息,使分類更加高效。利用分布式的數(shù)據(jù)處理方案,將分類任務(wù)切割分配到不同層次的節(jié)點,實現(xiàn)模塊化、低耦合。

      2 基于數(shù)據(jù)場的分布式自適應(yīng)分類算法

      2.1 數(shù)據(jù)場

      在物理學(xué)中,某一物理量在空間區(qū)域的分布稱為場,如磁場、引力場等,物質(zhì)粒子之間的相互作用通過場的作用來實現(xiàn)。隨著場論的發(fā)展,它被抽象為一個數(shù)學(xué)概念來描述物理量或數(shù)學(xué)函數(shù)在空間中的分布[18]。數(shù)據(jù)場理論突破了在傳統(tǒng)數(shù)據(jù)挖掘領(lǐng)域中數(shù)據(jù)對象只有一對一的映射關(guān)系,因為它認為在數(shù)域空間內(nèi)的數(shù)據(jù)可以互相作用,從而在整體上形成一個新的勢值場域。

      式(1)被稱為勢值函數(shù),其中:是單位數(shù)據(jù)點的質(zhì)量;是數(shù)據(jù)點之間的歐氏距離;是數(shù)據(jù)場的影響因子。影響因子會影響數(shù)據(jù)對象之間相互作用力的大小,從而影響數(shù)據(jù)勢場的分布,影響分類決策。圖1描述了基于高斯隨機函數(shù)生成的兩團類簇。

      圖2 影響因子對于分類結(jié)果的影響

      2.2 基于滑動步長的參數(shù)優(yōu)化搜索策略

      現(xiàn)有關(guān)于數(shù)據(jù)場影響因子的優(yōu)化普遍面向聚類過程,不能完全適用于分類任務(wù)。優(yōu)化的核心在于是否對分類標(biāo)簽進行了有效學(xué)習(xí)。舊有的優(yōu)化方法一般分為兩類:一是基于經(jīng)驗的選取,二是基于信息熵的選取。

      如圖3所示,多分類的數(shù)據(jù)集會在數(shù)據(jù)場內(nèi)形成多峰的數(shù)據(jù)勢圖,越靠近勢值中心其勢值會越大。其中,峰值代表了分類簇的分類中心,是局部勢值的極大點。

      圖3 面向兩個分類簇的3D勢圖

      本文利用滑動搜索框?qū)ふ揖植縿葜档臉O大點,搜索框如圖4所示。圖4描述了一個簡單的數(shù)據(jù)勢場,滑動框會沿著上、下、左、右四個方向向框內(nèi)勢值最大的方向滑動。當(dāng)框內(nèi)中心勢值達到最大時,滑動框會將此最大點返回,作為分類中心。

      圖4 局部勢值與滑動搜索框

      當(dāng)面對多分類問題時,將在勢值場內(nèi)均勻分布生成與分類個數(shù)相同的搜索框,當(dāng)各個搜索框停止搜索返回后,若發(fā)現(xiàn)兩個搜索框重合,則需要再隨機生成一個搜索框,直到生成與分類目標(biāo)簇數(shù)相同的獨立中心。

      2.3 基于數(shù)據(jù)場的自學(xué)習(xí)分類算法

      本文提出了一種基于數(shù)據(jù)場的自學(xué)習(xí)分類算法。算法分類器的構(gòu)造需要學(xué)習(xí)目標(biāo)數(shù)據(jù)樣本的期望、熵、超熵、數(shù)據(jù)場影響因子。

      通過對訓(xùn)練集進行參數(shù)訓(xùn)練,構(gòu)造最優(yōu)分類器模型,接著對未知類別的數(shù)據(jù)進行分類分析,算法流程如下:

      算法1 基于數(shù)據(jù)場的自學(xué)習(xí)分類算法。

      輸出 分類結(jié)果。

      步驟3 將局部最大勢值點確定為類別中心;

      2.4 基于分布式的智能算法

      在網(wǎng)絡(luò)中,傳感器節(jié)點一般只負責(zé)收集數(shù)據(jù)并提交到上行匯聚節(jié)點,如一些基站等邊緣節(jié)點,可以利用本地有限的資源處理一些簡單的信息處理任務(wù)。但面對不斷增長的任務(wù)需求,傳統(tǒng)小規(guī)模集群越來越難以滿足機器學(xué)習(xí)算法訓(xùn)練、學(xué)習(xí)的需求。云中心可以支持多用戶共享物理資源,支持高效執(zhí)行多個模型任務(wù)的訓(xùn)練。

      算法主要分為兩個部分:一是基于滑動搜索的模型訓(xùn)練階段;二是基于模型預(yù)測的推理階段。模型的訓(xùn)練是一個探索性的過程,通過反復(fù)大量的運算調(diào)整訓(xùn)練目標(biāo)超參數(shù),但EC節(jié)點難以滿足大量的計算需求,所以可以將模型的訓(xùn)練過程放到性能更為強大的云端進行集中訓(xùn)練,再將訓(xùn)練好的模型分布式下發(fā)反饋到EC節(jié)點。將訓(xùn)練模型的任務(wù)從EC節(jié)點抽離,可以更好地減少EC節(jié)點的負荷,而且經(jīng)過優(yōu)化的模型并不會占用太多的資源,很適于部署到邊緣節(jié)點[6]。網(wǎng)絡(luò)拓撲結(jié)構(gòu)如圖5所示。

      圖5 網(wǎng)絡(luò)拓撲圖

      基于分布式的智能算法的具體過程如下:

      1)傳感器節(jié)點收集數(shù)據(jù)并提交到推理層相應(yīng)的EC節(jié)點中。

      2)各個EC節(jié)點將收集到的數(shù)據(jù)發(fā)送到訓(xùn)練層的云中心進行訓(xùn)練。

      3 實驗與結(jié)果分析

      3.1 數(shù)據(jù)集

      本文實驗采用了來自UCI(University of California Irvine)大學(xué)的鳶尾花數(shù)據(jù)集和人工生成的二維隨機數(shù)數(shù)據(jù)集。其中,二維隨機數(shù)數(shù)據(jù)集的數(shù)據(jù)共有三類?;诙S數(shù)據(jù)的可視化,本文實驗主要對鳶尾花數(shù)據(jù)集中花瓣長度和花瓣寬度兩個維度進行分類處理。對數(shù)據(jù)集進行分析,由于訓(xùn)練樣本具有天然不平衡性,本文實驗使用逆向云模型提取數(shù)據(jù)集原始數(shù)據(jù)特征,再使用正向云模型重構(gòu)基于隨機數(shù)數(shù)據(jù)集的新數(shù)據(jù)集和基于鳶尾花原始數(shù)據(jù)特征的3個不同規(guī)模的數(shù)據(jù)集[21]。本文使用原始數(shù)據(jù)集作為訓(xùn)練集,將重構(gòu)數(shù)據(jù)作為測試集。二維隨機數(shù)數(shù)據(jù)集重構(gòu)數(shù)據(jù)如圖6所示,鳶尾花數(shù)據(jù)集重構(gòu)數(shù)據(jù)如圖7所示。

      3.2 運行環(huán)境

      本文實驗主要針對本文算法與邏輯回歸(Logistic Regression, LR)算法和隨機森林(Random Forest, RF)算法對鳶尾花數(shù)據(jù)集的分類進行比較。實驗環(huán)境:操作系統(tǒng)為MacOS Catalina,開發(fā)軟件為Matlab R2019a,CUP為Intel Core i5@2.40 GHz,內(nèi)存16 GB,硬盤容量512 GB。

      3.3 實驗結(jié)果與結(jié)果分析

      表1 混淆矩陣

      查準率表示預(yù)測正確的結(jié)果占預(yù)測為正例中的比例,計算公式如下:

      查全率表示預(yù)測正確的結(jié)果占實際為正例中的比例,計算公式如下:

      漢明損失表示所有錯誤預(yù)測樣本的比例,其值越小,模型的分類能力越強。計算公式如下:

      隨機數(shù)數(shù)據(jù)集的分類結(jié)果如表2所示,由圖6可知隨機數(shù)據(jù)分為三類,可以看出在數(shù)據(jù)量很大的情況下,本文算法的查準率和查全率都大于90%,保持在較高的水平。

      表2 隨機數(shù)測試集規(guī)模為1 800時本文算法準確率與漢明損失

      圖6 使用云模型重構(gòu)的1 800個隨機數(shù)數(shù)據(jù)

      不同測試集規(guī)模下的鳶尾花分類實驗結(jié)果對比如表3所示。

      對比圖7(a)與表3可知,在數(shù)據(jù)規(guī)模為150時,三種算法均對線性易區(qū)分的山鳶尾數(shù)據(jù)有了清晰的分類,在線性較不易區(qū)分的雜色鳶尾、維吉尼亞鳶尾的分類中,本文算法相比LR算法和RF算法保持了較高或相近的查準率、查全率水平。對比圖7(b)與表3可知,在數(shù)據(jù)規(guī)模為300時,得到了與上一個實驗相近的結(jié)果。對比圖7中的(a)、(b)、(c)可知,在數(shù)據(jù)規(guī)模為600時,雜色鳶尾與維吉尼亞鳶尾數(shù)據(jù)大量交錯在一起,線性極不易區(qū)分,分類難度大。通過表3可知,在數(shù)據(jù)規(guī)模為600時,本文算法在雜色鳶尾和維吉尼亞鳶尾的分類中的查準率和查全率仍高于RF算法;在雜色鳶尾數(shù)據(jù)的分類中,查全率高于LR算法,但查準率略低于LR算法;在維吉尼亞鳶尾的分類中,查準率高于LR算法,但查全率略低于LR算法。

      表3 不同測試集規(guī)模下鳶尾花分類實驗結(jié)果對比 單位: %

      通過表4可知,在三次不同規(guī)模數(shù)據(jù)集實驗中,本文算法的漢明損失都要小于LR算法和RF算法。通過表3和表4可以得出結(jié)論:本文算法的分類能力優(yōu)于LR算法和RF算法,整體性能上也優(yōu)于LR算法和RF算法。

      圖7 云模型重構(gòu)的鳶尾花數(shù)據(jù).

      表4 不同規(guī)模鳶尾花數(shù)據(jù)集下的漢明損失對比

      4 結(jié)語

      分類算法是數(shù)據(jù)挖掘領(lǐng)域的重要組成部分,研究高效可靠的分類算法已經(jīng)成為廣大研究者的重要目標(biāo)。本文主要提出了一種基于數(shù)據(jù)場的分類算法,該算法可部署于EC設(shè)備中,提供有效的分類服務(wù)。在基于分布式的系統(tǒng)中,利用云端訓(xùn)練模型、邊緣設(shè)備端推演模型,達到分層的協(xié)作。下一步的工作中,可以重點探討算法關(guān)于異常點的識別,進一步優(yōu)化算法;同時,也需要構(gòu)建更注重細節(jié)、更系統(tǒng)性的EC與機器學(xué)習(xí)的協(xié)同框架。

      [1] STERGIOU C, PSANNIS K E, KIM B G, et al. Secure integration of IoT and cloud computing[J]. Future Generation Computer Systems, 2016, 78(3): 964-975.

      [2] BOZORGCHENANI A, MASHHADI F, TARCHI D, et al. Multi? objective computation sharing in energy and delay constrained mobile edge computing environments[J]. IEEE Transactions on Mobile Computing, 2020, 20(10): 2992-3005.

      [3] KOZIK R, CHORA? M, FICCO M, et al. A scalable distributed machine learning approach for attack detection in edge computing environments[J]. Journal of Parallel & Distributed Computing, 2018, 119: 18-26.

      [4] LIU G, XU Y, HE Z, et al. Deep learning?based channel prediction for edge computing networks toward intelligent connected vehicles[J]. IEEE Access, 2019, 7: 114487-114495.

      [5] ZHU G, LIU D, DU Y, et al. Toward an intelligent edge: wireless communication meets machine learning[J]. IEEE Communications Magazine, 2020, 58(1):19-25.

      [6] WANG X, HAN Y, WANG C, et al. In?Edge AI: intelligentizing mobile edge computing, caching and communication by federated learning[J]. IEEE Network, 2019, 33(5): 156-165.

      [7] CUI Q, GONG Z, NI W, et al. Stochastic online learning for mobile edge computing: learning from changes[J]. IEEE Communications Magazine, 2019, 57(3):63-69.

      [8] SARITAS M M, YASAR A. Performance analysis of ANN and Naive Bayes classification algorithm for data classification[J]. International Journal of Intelligent Systems and Applications in Engineering, 2019, 7(2): 88-91.

      [9] 盧意紅,王雪紅,薛開創(chuàng),等.一種基于數(shù)據(jù)場聚類的圖片相似性比較方法[J].光電技術(shù)應(yīng)用,2019,34(4):34-38,51.(LU Y H, WANG X H, XUE K C, et al. Image similarity comparison method based on data field clustering[J]. Electro?Optic Technology Application, 2019, 34(4): 34-38,51.)

      [10] 郜麗鵬,沙作金.一種改進的數(shù)據(jù)場聚類算法[J].應(yīng)用科技, 2019, 46(6): 30-34.(GAO L P, SHA Z J. An improved data field clustering algorithm[J]. Applied Science and Technology, 2019, 46(6): 30-34.)

      [11] YANG S, GUO J Z, JIN J W. An improved Id3 algorithm for medical data classification[J]. Computers & Electrical Engineering, 2018, 65: 474-487.

      [12] MUGHAL M O, KIM S. Signal classification and jamming detection in wide?band radios using Naive Bayes classifier[J]. IEEE Communications Letters, 2018, 22(7): 1398-1401.

      [13] YU R Y, AN X M, JIN B, et al. Particle classification optimization?based BP network for telecommunication customer churn prediction[J]. Neural Computing and Applications, 2018, 29(3): 707-720.

      [14] VILLALON T, IVAN E. Distributed land use classification with improved processing time using high?resolution multispectral data[C]// IGARSS 2012: Proceedings of the 2012 IEEE International Geoscience and Remote Sensing Symposium. Piscataway: IEEE, 2012: 6987-6990.

      [15] LUBELL D P, SONDAG J. Practical distributed classification using the Alternating Direction Method of Multipliers algorithm[C]// Proceedings of the IEEE International Conference on Big Data. Piscataway: IEEE, 2013: 773-776.

      [16] FENG X, HU X, LIU Y. Radar signal sorting algorithm of k?means clustering based on data field[C]// ICCC 2017: Proceedings of the 2017 3rd IEEE International Conference on Computer and Communications. Piscataway: IEEE, 2017: 2262-2266.

      [17] RUAN G Q, GUO Q, GONG X. Underdetermined mixing matrix estimation algorithm based on data field clustering and cloud model partitioning[C]// ICEMI 2017: Proceedings of the 2017 13th IEEE International Conference on Electronic Measurement & Instruments. Piscataway: IEEE, 2017: 337-342.

      [18] 李德毅,劉常昱,杜鹢,等.不確定性人工智能[M].北京:國防工業(yè)出版社, 2004: 1583-1594.(LI D Y, LIU C Y, DU Y, et al. Artificial Intelligence with Uncertainty[M]. Beijing: National Defense Industry Press, 2004: 1583-1594.)

      [19] WANG S L, GAN W Y, LI D Y, et al. Data field for hierarchical clustering[J]. International Journal of Data Warehousing & Mining, 2011, 7(4): 43-63.

      [20] 余陽.基于數(shù)據(jù)場的聚類系統(tǒng)的設(shè)計與實現(xiàn)[D].北京:北京理工大學(xué),2016:33-34.(YU Y. Design and Implementation of Cluster System Based on Data Field[D]. Beijing: Beijing Institute of Technology, 2016: 33-34.)

      [21] 李杰,鄒慧蘭.大數(shù)據(jù)交叉映射融合的逆向云算法仿真[J].計算機仿真,2020,37(2):284-288.(LI J, ZOU H L. Reverse cloud algorithm simulation of big data cross mapping fusion [J]. Computer Simulation, 2020, 37(2): 284-288.)

      Data field classification algorithm for edge intelligent computing

      SUN Zhiyu1, WANG Qi2, GAO Bin2, LIANG Zhongjun3*, XU Xiaobin2, WANG Shangguang4

      (1,830002,;2,,100124,;3,,100081,;4,,100876,)

      In view of the general problems of not fully utilizing historical information and slow parameter optimization process in the research of clustering algorithms, an adaptive classification algorithm based on data field was proposed in combination with edge intelligent computing, which can be deployed on Edge Computing (EC) nodes to provide local intelligent classification service. By introducing supervision information to modify the structure of the traditional data field clustering model, the proposed algorithm enabled the traditional data field to be applied to classification problems, extending the applicable fields of data field theory. Based on the idea of the data field, the proposed algorithm transformed the domain value space of the data into the data potential field space, and divided the data into several unlabeled cluster results according to the spatial potential value. After comparing the cluster results with the historical supervision information for cloud similarity, the cluster results were attributed to the most similar category. Besides, a parameter search strategy based on sliding step length was proposed to speeded up the parameter optimization of the proposed algorithm. Based on this algorithm, a distributed data processing scheme was proposed. Through the cooperation of cloud center and edge devices, classification tasks were cut and distributed to different levels of nodes to achieve modularity and low coupling. Simulation results show that the precision and recall of the proposed algorithm maintained above 96%, and the Hamming loss was less than 0.022. Experimental results show that the proposed algorithm can accurately classify and accelerate the speed of parameter optimization, and outperforms than Logistic Regression (LR) algorithm and Random Forest (RF) algorithm in overall performance.

      edge intelligent computing; distributed data processing; parameter optimization; data field; adaptive classification

      SUN Zhiyu, born in 1973, senior engineer. His research interests include cloud computing, meteorological big data.

      WANG Qi, born in 1998, M. S. candidate. Her research interests include space?air?ground integrated information network, internet of things, mobile edge computing.

      GAO Bin, born in 1996, M. S. candidate. His research interests include network big data.

      LIANG Zhongjun, born in 1983, Ph. D., senior engineer. His research interests include cloud computing, meteorological big data.

      XU Xiaobin, born in 1986, Ph. D., lecturer. His research interests include space?air?ground integrated information network, internet of things, mobile edge computing.

      WANG Shangguang, born in 1982, Ph. D., professor. His research interests include service computing, 6G, mobile edge computing.

      TP301

      A

      1001-9081(2022)11-3473-06

      10.11772/j.issn.1001-9081.2021091692

      2021?09?29;

      2021?10?29;

      2021?11?08。

      孫志于(1973—),男,江蘇新沂人,高級工程師,主要研究方向:云計算、氣象大數(shù)據(jù);王琪(1998—),女,北京人,碩士研究生,主要研究方向:天地一體化信息網(wǎng)絡(luò)、物聯(lián)網(wǎng)、移動邊緣計算;高彬(1996—),男,山西太原人,碩士研究生,主要研究方向:網(wǎng)絡(luò)大數(shù)據(jù);梁中軍(1983—),男,新疆烏魯木齊人,高級工程師,博士,主要研究方向:云計算、氣象大數(shù)據(jù);徐曉斌(1986—),男,河南鶴壁人,講師,博士,CCF會員,主要研究方向:天地一體化信息網(wǎng)絡(luò)、物聯(lián)網(wǎng)、移動邊緣計算;王尚廣(1982—),男,河南周口人,教授,博士,CCF會員,主要研究方向:服務(wù)計算、6G、移動邊緣計算。

      猜你喜歡
      邊緣分布式分類
      分類算一算
      分類討論求坐標(biāo)
      數(shù)據(jù)分析中的分類討論
      分布式光伏熱錢洶涌
      能源(2017年10期)2017-12-20 05:54:07
      教你一招:數(shù)的分類
      分布式光伏:爆發(fā)還是徘徊
      能源(2017年5期)2017-07-06 09:25:54
      一張圖看懂邊緣計算
      基于DDS的分布式三維協(xié)同仿真研究
      雷達與對抗(2015年3期)2015-12-09 02:38:50
      西門子 分布式I/O Simatic ET 200AL
      在邊緣尋找自我
      雕塑(1999年2期)1999-06-28 05:01:42
      枝江市| 彭山县| 恩施市| 达尔| 福鼎市| 台安县| 绥德县| 孟州市| 镇安县| 松江区| 兴隆县| 同仁县| 株洲县| 丹阳市| 城口县| 新安县| 班玛县| 凉山| 蒙山县| 英吉沙县| 建湖县| 城口县| 铁岭市| 桐庐县| 正安县| 浑源县| 科尔| 杨浦区| 揭阳市| 沭阳县| 上思县| 宣威市| 香格里拉县| 新巴尔虎左旗| 雷山县| 西华县| 佳木斯市| 闽侯县| 大港区| 林西县| 阿拉善左旗|