• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于改進極限學(xué)習(xí)機的食品安全風(fēng)險預(yù)測研究

      2021-12-13 08:31:38陳碩峰石懷明郭承湘劉康康陳寧江
      關(guān)鍵詞:學(xué)習(xí)機貝葉斯合格

      陳碩峰,石懷明,郭承湘,劉康康,陳寧江,4

      (1.廣西大學(xué) 計算機與電子信息學(xué)院, 廣西 南寧 530004;2.廣西壯族自治區(qū)食品藥品安全信息與監(jiān)控中心, 廣西 南寧 530029;3.廣西中醫(yī)藥大學(xué)校長辦公室、發(fā)展規(guī)劃處、網(wǎng)絡(luò)和信息化管理辦公室(合署), 廣西 南寧 530200;4.廣西高校并行與分布式計算技術(shù)重點實驗室, 廣西 南寧 530004)

      0 引言

      食品安全問題一直是國家重點關(guān)注對象,近年來跟隨著國家的食品安全監(jiān)管戰(zhàn)略的實施,各個食品監(jiān)督管理部門都建設(shè)了業(yè)務(wù)管理系統(tǒng),實現(xiàn)信息化監(jiān)管,隨著食品監(jiān)管工作的信息化、智能化,工作效率也日益提升,積累的數(shù)據(jù)也越來越多[1]。但這些積累下來的食品監(jiān)管數(shù)據(jù)面臨著數(shù)據(jù)混亂冗雜、整合利用程度低、挖掘不充分等問題,利用率很低[2],大多數(shù)還處于信息記錄、備案階段,只有少量的數(shù)據(jù)應(yīng)用到分析圖表上,食品檢測數(shù)據(jù)并沒有得到充分的利用,也未能有效地利用現(xiàn)有數(shù)據(jù)來提高發(fā)現(xiàn)食品潛在風(fēng)險的機率。

      本文針對食品監(jiān)管數(shù)據(jù)中的隱藏信息提出了一種加權(quán)粒子群算法的極限學(xué)習(xí)機模型(加權(quán)PSO-ELM),利用現(xiàn)有數(shù)據(jù)實現(xiàn)對食品檢測的預(yù)測。本文研究對象為某省食品藥品監(jiān)督管理局的食品日常抽檢數(shù)據(jù),結(jié)合抽檢數(shù)據(jù)的分布不平衡的規(guī)律,該模型基于加權(quán)極限學(xué)習(xí)機[3]進行分類預(yù)測,同時針對極限學(xué)習(xí)機(extreme learning machine, ELM)算法的參數(shù)使用粒子群算法(partical swarm optimization, PSO)進行優(yōu)化??紤]到實際食品抽樣中正負樣本不平衡,即抽檢結(jié)果為合格的數(shù)據(jù)量過多而結(jié)果為不合格的數(shù)據(jù)量過少,這會導(dǎo)致對人們關(guān)注的不合格樣本預(yù)測結(jié)果不夠理想的問題,因此,使用一種加權(quán)處理方法,提高對抽樣結(jié)果為不合格的少數(shù)樣本預(yù)測結(jié)果的準(zhǔn)確度。最后,為了驗證模型預(yù)測結(jié)果的可信度,基于歷史數(shù)據(jù)使用貝葉斯網(wǎng)絡(luò)模型[4]計算在食品抽檢結(jié)果為不合格的情況下食品數(shù)據(jù)的后驗概率,以此驗證改進極限學(xué)習(xí)機預(yù)測結(jié)果的可靠性。

      1 模型設(shè)計

      1.1 加權(quán)PSO-ELM

      ELM能夠在極快的學(xué)習(xí)速度下獲得很好泛化性能,現(xiàn)在ELM在圖像識別、自然語言處理、文本情感分析等各領(lǐng)域的應(yīng)用都展現(xiàn)了其快速學(xué)習(xí)的能力和精確度,因此ELM在對食品安全風(fēng)險預(yù)測方面也會有適用的優(yōu)勢[5]。在單隱藏層神經(jīng)網(wǎng)絡(luò)ELM中,假設(shè)有N個任意的樣本(Xi,ti),其中Xi=[xi1,xi2,…,xin]T∈Rn為輸入值,ti=[ti1,ti2,…,tim]T∈Rm,并假設(shè)隱藏層有L個節(jié)點,則其表達式如式(1)所示:

      (1)

      式中,g(x)為激活函數(shù);Wi=[wi1,wi2,…,win]T為輸入權(quán)重;βi為輸出權(quán)重;bi是第i個隱藏層單元的偏置;oj為樣本預(yù)測值。Wi·Xj表示W(wǎng)i和Xj的內(nèi)積。

      為了獲得最優(yōu)解,需要定義一個損失函數(shù),其表示如式(2)所示:

      (2)

      式中,oj為樣本的預(yù)測值;tj為樣本的真實值。

      只有當(dāng)輸出誤差達到最小,此時的解才是最優(yōu)解,即存在βi、Wi和bi,使得式(3)成立:

      (3)

      (4)

      式中,i=1,…,L,這相當(dāng)于最小化損失函數(shù),損失函數(shù)如式(5)所示:

      (5)

      但是考慮到ELM算法的求解很大程度依賴一定的輸入權(quán)集和隱藏偏置,雖然實現(xiàn)了求解線性系統(tǒng)全局極小點,但是在不同的輸入權(quán)集與隱藏偏差可能具有不同的性能,所以它可能不是問題空間的全局極小點,故需要對ELM輸入權(quán)集以及隱藏偏置進行優(yōu)化。

      眾所周知,進化算法是可以通過全局搜索策略來避免局部極小問題,而PSO算法作為一種進化算法,其前期收斂速度快,能夠極快逼近最優(yōu)解[6]。除此之外,使用PSO優(yōu)化算法還不需要手動決定或者旋轉(zhuǎn)參數(shù),故使用PSO算法對ELM進行優(yōu)化。與此同時,考慮到本文所研究的食品安全檢測中的實際情況,大部分食品的檢測結(jié)果是合格的,導(dǎo)致抽檢數(shù)據(jù)中正負樣本數(shù)量上的巨大差距,繼而導(dǎo)致在對食品安全風(fēng)險預(yù)測中對抽檢結(jié)果為不合格的樣本預(yù)測的不理想,但是抽檢結(jié)果為不合格的少數(shù)類數(shù)據(jù)是人們更加關(guān)注的,所以使用加權(quán)法對PSO算法進行優(yōu)化,在進行數(shù)據(jù)處理時提高對少數(shù)樣本的關(guān)注,研究處理數(shù)據(jù)不平衡的加權(quán)方案[7]。

      在PSO算法中,設(shè)有一個N維空間,其中有n個只有位置信息和速度信息的粒子,則第i個粒子在空間中的位置為Xi=(x1,x2,…,xn),飛行速度為Vi=(v1,v2,…,vn)。pbest表示某個粒子目前的最優(yōu)解,gbest表示所有粒子中的最優(yōu)解。PSO算法是通過不斷更新pbest和gbest來尋找最優(yōu)解的,而定義的適應(yīng)度函數(shù)計算所得的適應(yīng)度值就是在某一輪迭代中是否更新pbest的判斷標(biāo)準(zhǔn)。

      第一種加權(quán)方案如式(6)所示:

      (6)

      式中,count(ti)為訓(xùn)練樣本中檢測結(jié)果為ti的樣本數(shù)量。

      對于本文研究對象來說抽檢結(jié)果只有合格與不合格兩種,因此上述方法的權(quán)值分子都是1,分母分別為兩種抽檢結(jié)果的樣本數(shù)量。

      第二種加權(quán)方案如式(7)所示:

      (7)

      這種加權(quán)方案的結(jié)果只有兩類,而且將少數(shù)類和多數(shù)類的權(quán)值比例控制在0.618∶1(黃金分割比),實際上是以犧牲多數(shù)類的分類精度換取少數(shù)類的分類精度。結(jié)合食品的實際檢測情況,此方案中抽檢結(jié)果為合格屬于多數(shù)類,抽檢結(jié)果為不合格屬于少數(shù)類。

      在食品安全問題領(lǐng)域中,由于大部分食品的檢測結(jié)果是合格的,這就導(dǎo)致抽檢數(shù)據(jù)中正負樣本數(shù)量上的巨大差距,會導(dǎo)致在對食品安全風(fēng)險預(yù)測中對不合格的樣本預(yù)測的不理想。但是不合格的少數(shù)類數(shù)據(jù)是更加受關(guān)注的。在方案一中,更加適用于有多種抽樣結(jié)果而且加權(quán)權(quán)重相同的數(shù)據(jù)處理,相比之下,方案二是將抽樣結(jié)果分為少數(shù)類和多數(shù)類兩類,而且是犧牲多數(shù)類的分類精度來提高少數(shù)類的分類精度,更符合本文的要求。

      在PSO算法中分別為輸入權(quán)重、輸出權(quán)重、偏置設(shè)置粒子群,運行結(jié)束后會得到輸入權(quán)值、輸出權(quán)值、偏置的參數(shù)矩陣[8],通過使用式(7)中的加權(quán)方法對輸出權(quán)值進行二次加權(quán),便得到加權(quán)PSO算法訓(xùn)練結(jié)果,將該結(jié)果作為ELM的參數(shù)。由于ELM需要優(yōu)化的參數(shù)為權(quán)值和閥值,其適應(yīng)度函數(shù)[9]可用式(5)進行表示,即求目標(biāo)函數(shù)min(E)。加權(quán)PSO算法步驟如下:

      輸入:訓(xùn)練樣本

      輸出:極限學(xué)習(xí)機所需的輸入權(quán)值、輸出權(quán)值、偏置

      ① 設(shè)置種群大小N、最大迭代次數(shù)M及學(xué)習(xí)因子c1、c2;

      ② 循環(huán)執(zhí)行如下操作,直到當(dāng)前迭代次數(shù)等于最大迭代次數(shù)M;

      ③ 對每個粒子i;

      ④ 計算其適應(yīng)度fit(i);

      ⑤ 如果fit(i)

      ⑥ 如果fit(i)

      ⑦ 更新粒子位置:xi=xi+vi;

      ⑨ 對輸出權(quán)重粒子群的歷史最優(yōu)粒子位置,根據(jù)式(7)進行加權(quán);

      其中,rand()可以產(chǎn)生0和1之間的隨機數(shù),c1和c2為學(xué)習(xí)因子,ω為慣性因子。加權(quán)粒子群算法訓(xùn)練得到的輸入權(quán)重、輸出權(quán)重和偏置作為極限學(xué)習(xí)機的參數(shù),從而得到加權(quán)PSO-ELM,用此模型對食品安全風(fēng)險進行分類預(yù)測。

      1.2 貝葉斯網(wǎng)絡(luò)模型

      本小節(jié)使用貝葉斯網(wǎng)絡(luò)模型對上一小節(jié)的預(yù)測結(jié)果的可信度進行驗證。首先對加權(quán)PSO-ELM的預(yù)測結(jié)果進行統(tǒng)計,分析預(yù)測結(jié)果為不合格的數(shù)據(jù)中各個字段中占比最高的取值。然后根據(jù)各個字段之間的關(guān)系建立貝葉斯網(wǎng)絡(luò),在通過歷史數(shù)據(jù)計算出所有先驗概率,最后計算所需后驗概率(即不合格的情況下各個字段取到的概率),找出各個字段中概率最高的取值,將結(jié)果與人工神經(jīng)網(wǎng)絡(luò)階段的預(yù)測分析結(jié)果進行對比,判斷預(yù)測結(jié)果是否可信。

      根據(jù)字段關(guān)系建立的貝葉斯網(wǎng)絡(luò)如圖1所示,其中X1至X15為特征字段,Y為抽檢結(jié)果,箭頭終點字段受起點字段影響。

      圖1 貝葉斯網(wǎng)絡(luò)

      部分先驗概率見表1。

      表1 部分先驗概率

      計算后驗概率的公式分為三類(Y=1表示抽檢結(jié)果為不合格,xi為特征字段):

      第一類求P(xi|Y=1),i=2,5,6,7,9,10,13,15。這類后驗概率的公式如式(8)所示:

      (8)

      式(8)在計算時,對于xj變量,需要使用改式分別計算xj變量各個取值下的概率,如計算P(x2|Y=1),需要分別計算P(x2=1|Y=1)、P(x2=2|Y=1)、P(x2=3|Y=1)、P(x2=4|Y=1),這樣即可知道對于某一個變量xj,在抽檢結(jié)果為不合格的情況下,該變量的哪一個取值出現(xiàn)的概率最高。

      第二類求P(xi|Y=1),i=3,4,8。這類后驗概率的公式如式(9)所示:

      (9)

      式中,xj為xi的前驅(qū)節(jié)點,即由xj到xi的單箭頭。公式(9)的計算和公式(8)類似,對于每一個xi,也需要計算該變量各個取值下的概率(其中xi取某個值時對應(yīng)的xj有多個取值情況,需要將這些情況下計算得到的概率值相加,得到xi的某個取值的概率)。

      第三類求P(xi|Y=1),i=11,12,14。這類后驗概率的公式如式(10)所示:

      (10)

      式中,xi為xj的前驅(qū)節(jié)點,即由xi到xj的單箭頭。式(10)的具體計算方式和式(9)類似。

      2 實驗

      本文選擇了基于LMA的神經(jīng)網(wǎng)絡(luò)[10-11]、基于GA的神經(jīng)網(wǎng)絡(luò)、基于BP的神經(jīng)網(wǎng)絡(luò)[12]、極限學(xué)習(xí)機及貝葉斯網(wǎng)絡(luò)來進行實驗分析。在進行實驗之前,首先對源數(shù)據(jù)進行預(yù)處理,經(jīng)數(shù)據(jù)預(yù)處理后共計9 025條數(shù)據(jù),取75%作為訓(xùn)練集,25%作為測試集;然后進行數(shù)據(jù)轉(zhuǎn)換,將文本型數(shù)據(jù)轉(zhuǎn)為數(shù)值型數(shù)據(jù),并將數(shù)據(jù)進行歸一化至[0,1]內(nèi),最后進行數(shù)據(jù)規(guī)約,選出來最重要的14個屬性。

      相關(guān)對比模型參數(shù)主要包括:加權(quán)PSO-ELM模型的迭代次數(shù)設(shè)置為20次,粒子群規(guī)模設(shè)置為20,隱藏層節(jié)點數(shù)設(shè)置為20,精確度閾值設(shè)置為0.000 001;基于LMA的神經(jīng)網(wǎng)絡(luò)的隱藏層節(jié)點數(shù)設(shè)置為10;基于GA的神經(jīng)網(wǎng)絡(luò)的隱藏層節(jié)點數(shù)設(shè)置為2;BP神經(jīng)網(wǎng)絡(luò)隱藏層節(jié)點數(shù)為8;核極限學(xué)習(xí)機的隱藏層節(jié)點數(shù)為150。上述網(wǎng)絡(luò)結(jié)構(gòu)中的隱藏層節(jié)點數(shù)為模型準(zhǔn)確率最高的情況下的隱藏層節(jié)點數(shù)。

      加權(quán)PSO-ELM和3種模型的性能對比如圖2所示。從圖2中可見,LMA神經(jīng)網(wǎng)絡(luò)和GA神經(jīng)網(wǎng)絡(luò)在訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集上的表現(xiàn)都不夠好;而加權(quán)PSO-ELM和BP模型在訓(xùn)練數(shù)據(jù)集上都表現(xiàn)較好,但BP在測試數(shù)據(jù)集上表現(xiàn)相對較差。綜上所述,加權(quán)PSO-ELM模型表現(xiàn)最好。

      (a) MSE對比

      ELM優(yōu)化前后的性能對比如圖3所示。從圖3可以看出,單純使用加權(quán)法對于ELM的性能沒有任何改變,單純使用PSO算法模型性能得到了極大提升,說明PSO算法可以對ELM的輸入?yún)?shù)進行有效優(yōu)化;在PSO算法優(yōu)化ELM的基礎(chǔ)上結(jié)合加權(quán)法使得模型性能有進一步提升,準(zhǔn)確率得到提高,因此可以得出加權(quán)PSO-ELM模型能較好提高預(yù)測準(zhǔn)確率。另外,還對加權(quán)PSO-ELM模型進行了多次實驗,發(fā)現(xiàn)該模型在測試數(shù)據(jù)上的預(yù)測準(zhǔn)確率始終穩(wěn)定在92%左右,表明該模型具有較強的穩(wěn)定性。

      (a) MSE對比

      另外,與文獻[5]提出的基于徑向基核函數(shù)(RBF_kernel)的極限學(xué)習(xí)機、基于線性核函數(shù)(Lin_kernel)的極限學(xué)習(xí)機進行了對比,這兩種模型在文獻[5]中被用于肉制品安全的預(yù)測。將文獻[5]的2種模型與加權(quán)PSO-ELM模型在本文所使用的數(shù)據(jù)集上進行測試后發(fā)現(xiàn),加權(quán)PSO-ELM模型對于本文研究對象的預(yù)測具有較高的準(zhǔn)確率(表2)。

      表2 與其他研究者成果對比

      表3是加權(quán)PSO-ELM預(yù)測結(jié)果為不合格的數(shù)據(jù)中各個字段占比最高的取值及其占比,表4是貝葉斯網(wǎng)絡(luò)模型計算得到的歷史數(shù)據(jù)中在抽檢結(jié)果為不合格的情況下各個字段中后驗概率最高的取值。由于年份字段的研究意義不大,所以這兩個表中都去除了年份字段。

      表3 加權(quán)PSO-ELM預(yù)測結(jié)果統(tǒng)計

      表4 貝葉斯網(wǎng)絡(luò)各字段概率最高取值

      結(jié)合表3和表4可以看出,通過對兩個階段結(jié)果的分析和相互印證,最終得出結(jié)論:加權(quán)PSO-ELM的預(yù)測結(jié)果符合過往歷史數(shù)據(jù)中隱藏的規(guī)律,因此其預(yù)測結(jié)果具有較高的可信度。工作人員可以結(jié)合貝葉斯網(wǎng)絡(luò)階段的結(jié)果(表4)有針對性的進行日常抽檢,節(jié)省人力資源、提高工作效率。

      3 結(jié)語

      本文針對某省食品藥品監(jiān)督管理局的食品日常抽檢數(shù)據(jù)正負樣本不平衡的問題提出了一種加權(quán)PSO-ELM模型,主要是首先通過粒子群算法計算得到極限學(xué)習(xí)機所需的輸入權(quán)重、輸出權(quán)重、偏置這3個參數(shù),然后對輸出權(quán)重進行加權(quán),最后將這3個參數(shù)輸入極限學(xué)習(xí)機進行預(yù)測。該模型在預(yù)測準(zhǔn)確率上相比其他對比的模型具有更好的效果,與優(yōu)化前相比也有所提升,同時也通過貝葉斯網(wǎng)絡(luò)模型對歷史數(shù)據(jù)的分析驗證了加權(quán)PSO-ELM模型預(yù)測結(jié)果的高可信度。本文提出的加權(quán)PSO-ELM模型雖然準(zhǔn)確率較高,且具有極好的穩(wěn)定性,但在預(yù)測準(zhǔn)確率達到92%左右后增加迭代次數(shù),準(zhǔn)確率都不會再增加,而且在貝葉斯-人工神經(jīng)網(wǎng)絡(luò)兩階段模型中,雖然是通過兩個階段的結(jié)果相互印證來驗證模型的可靠性,但是兩個階段的結(jié)合并不充分。因此,下一步工作考慮將貝葉斯網(wǎng)絡(luò)模型計算得到的結(jié)果轉(zhuǎn)化為第一階段權(quán)值的一部分來改進加權(quán)PSO-ELM模型,探索進一步提升準(zhǔn)確率的途徑。

      猜你喜歡
      學(xué)習(xí)機貝葉斯合格
      極限學(xué)習(xí)機綜述
      基于極限學(xué)習(xí)機參數(shù)遷移的域適應(yīng)算法
      分層極限學(xué)習(xí)機在滾動軸承故障診斷中的應(yīng)用
      我是合格的小會計
      貝葉斯公式及其應(yīng)用
      誰不合格?
      消費者報道(2016年4期)2016-11-23 19:48:47
      基于貝葉斯估計的軌道占用識別方法
      做合格黨員
      大江南北(2016年8期)2016-02-27 08:22:46
      一種基于貝葉斯壓縮感知的說話人識別方法
      電子器件(2015年5期)2015-12-29 08:43:15
      一種基于AdaBoost的極限學(xué)習(xí)機分類方法
      中牟县| 芦溪县| 江都市| 博白县| 花莲市| 苍梧县| 临朐县| 尉氏县| 嵊州市| 镶黄旗| 乡城县| 甘孜| 木里| 关岭| 剑河县| 南岸区| 夏邑县| 如皋市| 寿阳县| 美姑县| 商城县| 岗巴县| 遂川县| 镶黄旗| 大连市| 陇西县| 确山县| 抚顺县| 若尔盖县| 三门县| 成都市| 蓝山县| 阿勒泰市| 福建省| 连州市| 柞水县| 股票| 永春县| 鹤山市| 个旧市| 喜德县|