• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于PCA和PSO-SVM在葡萄酒分類中的應(yīng)用研究

    2014-05-23 15:33:38徐小華全曉松張子鋒胡曉飛
    關(guān)鍵詞:粒子群優(yōu)化支持向量機(jī)主成分分析

    徐小華,全曉松,張子鋒,胡曉飛

    (1.昭通學(xué)院信息科學(xué)與技術(shù)學(xué)院,云南昭通657000;2.昭通學(xué)院數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,云南昭通657000)

    基于PCA和PSO-SVM在葡萄酒分類中的應(yīng)用研究

    徐小華1,全曉松1,張子鋒1,胡曉飛2

    (1.昭通學(xué)院信息科學(xué)與技術(shù)學(xué)院,云南昭通657000;2.昭通學(xué)院數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,云南昭通657000)

    摘要:針對(duì)葡萄酒的物理化學(xué)成分冗余數(shù)據(jù),提出了一種基于主成分分析(PCA)和粒子群優(yōu)化—支持向量機(jī)(PSO-SVM)的模型用于葡萄酒的分類.首先,對(duì)葡萄酒的物理化學(xué)成分進(jìn)行主成分分析,提取主要影響因素,減少輸入維數(shù),再利用粒子群優(yōu)算法尋找支持向量機(jī)的最佳參數(shù),并用支持向量機(jī)完成對(duì)訓(xùn)練集樣本的學(xué)習(xí)和測(cè)試集樣本的預(yù)測(cè)分類.結(jié)果表明,該模型與其他模型相比較,具有較高的準(zhǔn)確性,有一定的適用價(jià)值.

    關(guān)鍵詞:主成分分析;粒子群優(yōu)化;支持向量機(jī)

    隨著人民生活水平的不斷提高,對(duì)葡萄酒的需求量也越來(lái)越大,消費(fèi)者和生產(chǎn)者迫切需要一種準(zhǔn)確、快速的葡萄酒鑒別方法.傳統(tǒng)的鑒別方法主要是依靠品酒專家的個(gè)人經(jīng)驗(yàn)來(lái)完成,而品評(píng)的結(jié)果主觀性較強(qiáng)、費(fèi)用高,不利于大批量樣本的感官品評(píng)[1-2].然而葡萄酒的品質(zhì)受多種不同的物理化學(xué)成分因素的影響,故可借其物理化學(xué)數(shù)據(jù)成分對(duì)葡萄酒進(jìn)行分類鑒別,而葡萄酒的物理化學(xué)成分比較復(fù)雜,存在著非線性關(guān)系和大量的數(shù)據(jù)冗余.針對(duì)以上的問(wèn)題,本文提出了一種基于主成分分析(principal component analysis,PCA)和粒子群優(yōu)化—支持向量機(jī)(particle swarm optimization-support vector machine,PSO-SVM)的分類模型,其中PCA算法解決各個(gè)數(shù)據(jù)之間的線性冗余,減低數(shù)據(jù)的維數(shù);PSOSVM算法解決傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型復(fù)雜、數(shù)據(jù)質(zhì)量要求高等缺點(diǎn).在有限樣本訓(xùn)練的情況下,該模型能提供較好的泛化能力,提高了葡萄酒分類的準(zhǔn)確性和精確性.

    1 分類原理

    1.1 主成分分析(PCA)算法

    主成分分析(PCA)又稱主分量分析,由皮爾遜1990年首先引入[3-7].其基本思想是當(dāng)研究的問(wèn)題涉及多個(gè)變量,并且變量間相關(guān)性明顯,包含的信息重疊時(shí),采用主成分分析方法來(lái)抓住事物的主要矛盾,使問(wèn)題得到簡(jiǎn)化.PCA算法思想如下:

    設(shè)X=(x1,x2,…,xp)為p維總體矩陣,且E(X)=μ為期望,Var(X)=Σ為協(xié)方差矩陣.存在如下線性變換:

    1.2 粒子群優(yōu)化(PSO)算法

    粒子群優(yōu)算法(PSO)最早由Kennedy和Eberhart在1995年提出[8-9],其基本思想是在可解空間中初始化一群粒子,用適應(yīng)度、位置和速度來(lái)表示該粒子的特征,其適應(yīng)度值由適應(yīng)度函數(shù)計(jì)算得到,其值表示粒子的優(yōu)劣.具體算法是:假設(shè)在搜索空間D中,由n個(gè)粒子組成的種群X=(X1,X2,…,Xn),其中第i個(gè)粒子表示一個(gè)D維向量Xi=(xi1,xi2,…,xid)′,代表第i個(gè)粒子在D維搜索空間的位置,據(jù)目標(biāo)函數(shù)即可計(jì)算出每個(gè)粒子位置Xi對(duì)應(yīng)的適應(yīng)度值.設(shè)第i個(gè)粒子的速度Vi=(vi1,vi2,…,vid)′,其個(gè)體極值Pi=(pi1,pi2,…,pid)′,種族全局極值Pg=(pg1,pg2,…,pgd)′.在每一次迭代過(guò)程中,計(jì)算一次適應(yīng)度,并且通過(guò)比較新的適應(yīng)度值和個(gè)體極值、群體極值的的適應(yīng)度更新個(gè)體極值pbest和全局極值Gbest的位置.更新公式速度和位置分別如下:

    1.3 支持向量機(jī)

    SVM算法(support vector machine)在解決小樣本、非線性及高維模式識(shí)別中表現(xiàn)出許多特有的優(yōu)勢(shì),并能夠推廣應(yīng)用到函數(shù)擬合、分類等其他機(jī)器學(xué)習(xí)問(wèn)題中[10-14].Matlab中,SVM主要的函數(shù)是svmtrain,調(diào)用格式是model=svmtrain(train_label,train_natrix,[‘libsvm_options’]).其中l(wèi)ibsvm_options表示選項(xiàng)參數(shù),它的選擇直接影響SVM分類的準(zhǔn)確性,故本文采用PSO算法來(lái)確定最優(yōu)的選項(xiàng)參數(shù).

    2 基于PCA和PSO-SVM在葡萄酒分類

    2.1 數(shù)據(jù)來(lái)源

    本文數(shù)據(jù)來(lái)源于UCI數(shù)據(jù)庫(kù)[7],記錄的是意大利同一區(qū)域3種不同品種葡萄酒的化學(xué)成分.共有178個(gè)樣本,選擇了酒精(x1),蘋果酸(x2),灰分(x3),灰的堿度(x4),鎂(x5),苯酚含量(x6),類黃酮物質(zhì)(x7),非類黃酮苯酚(x8),前花青素(x9),顏色強(qiáng)度(x10),色度(x11),稀釋葡萄酒的蛋白質(zhì)(x12),脯氨酸(x13)等13個(gè)指標(biāo)作為影響葡萄酒種類的體系指標(biāo).樣本中1~59屬于第1類,類別標(biāo)簽為1;60~130屬于第2類,類別標(biāo)簽為2;131~178屬于第3類,標(biāo)簽類別為3.將每個(gè)類別分成2組,其中1~39,60~110,131~158用做SVM的訓(xùn)練集,剩下部分用作測(cè)試集.即訓(xùn)練集有118個(gè)樣本,測(cè)試集有60個(gè)樣本.

    2.2 PCA分析

    文章采用Matlab對(duì)葡萄酒的13種主要化學(xué)成分進(jìn)行主成分分析,在主成分分析中先對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化.分析結(jié)果見(jiàn)表1.從表中可以看出,前8個(gè)主成分的累積貢獻(xiàn)率達(dá)到了92.017 5%,后5個(gè)主成分貢獻(xiàn)率非常小,將其后5個(gè)冗余信息不作為輸入變量.所以只用前8個(gè)因素來(lái)作為SVM的輸入.

    表1 主成分分析結(jié)果

    由于主成分是線性的組合函數(shù),根據(jù)圖1中主成分相關(guān)系數(shù)矩陣,可以得出:在第3行中苯酚含量、類黃酮物和前花青素較大的正載荷;在第4行中酒精、灰分、顏色強(qiáng)度和脯氨酸有較大的正載荷;在第5行中灰分和灰的堿度有較大的正載荷;在第6行中蘋果酸和前花青素有較大的正載荷;在第7行中鎂有較大的正載荷;在第8行中蘋果酸有較大的正載荷;在第9行中蘋果酸、非類黃酮苯酚和前花青素有較大的正載荷;在第10行中酒精、灰的堿度和色度有較大的正載荷.在第3、4行和第10行中反應(yīng)了葡萄酒的內(nèi)外品質(zhì)綜合指標(biāo),其他表達(dá)式反應(yīng)了葡萄酒的外在品質(zhì)的綜合指標(biāo).

    2.3 PSO-SVM學(xué)習(xí)和預(yù)測(cè)分類

    由主成分分析可知,選取前8個(gè)主要因素作為SVM的輸入,將118個(gè)樣本作為訓(xùn)練集,60個(gè)樣本作為測(cè)試集.采用交叉驗(yàn)證(cross validation,CV)意義下的準(zhǔn)確率作為PSO的適應(yīng)度函數(shù)值,以此來(lái)尋找SVM的最佳參數(shù)值Cbest,Gbest.在得到最佳參數(shù)后,用訓(xùn)練集來(lái)訓(xùn)練SVM,在得到合理的訓(xùn)練準(zhǔn)確率以后,用測(cè)試集來(lái)預(yù)測(cè)分類.圖2表示PSO優(yōu)化SVM參數(shù)流程圖.本文中PSO的種群數(shù)量pop=20,終止代數(shù)為150,參數(shù)C1=1.9,C2=2.3,以此得到SVM的最佳參數(shù)Cbest=43.321 6,Gbest=3.713 9,用SVM對(duì)訓(xùn)練樣本學(xué)習(xí)和測(cè)試的樣本來(lái)預(yù)測(cè)分類.圖3是葡萄酒分類流程圖.

    為了驗(yàn)證該模型分類的優(yōu)劣,同時(shí)用BP神經(jīng)網(wǎng)絡(luò)、SVM神經(jīng)網(wǎng)絡(luò)、SOM神經(jīng)網(wǎng)絡(luò)的分類結(jié)果進(jìn)行對(duì)比,結(jié)果如表2.由表2可知PCA和PSO-SVM神經(jīng)網(wǎng)絡(luò)對(duì)葡萄酒的分類準(zhǔn)確率最高,由于PCA降低了數(shù)據(jù)的維數(shù),消除了因素之間的多種共線性的關(guān)系,所運(yùn)行的時(shí)間比其他模型較短.

    表2 各模型分類結(jié)果的對(duì)比

    3 結(jié)語(yǔ)

    本文以葡萄酒的分類為例,在不損害葡萄酒的物理化學(xué)成分前提下,運(yùn)用PCA方法來(lái)減少輸入維數(shù),消除了成分?jǐn)?shù)據(jù)之間的冗余性和相關(guān)性,利用PSO尋找SVM的最佳參數(shù),用SVM完成對(duì)樣本的學(xué)習(xí)和預(yù)測(cè)分類.結(jié)果表明,該系統(tǒng)結(jié)果較理想,具有一定的適用價(jià)值和可操作性.

    參考文獻(xiàn):

    [1]高年發(fā),李麗,張健.利用模式識(shí)別技術(shù)鑒別中國(guó)葡萄酒的產(chǎn)地和品種[J].中國(guó)釀造,2009,28(3):68-72.

    [2]劉曉鵬,姜寧,魏璐,等.白靈菇深層發(fā)酵培養(yǎng)基的優(yōu)化研究[J].中國(guó)釀造,2009,28(3):65-68.

    [3]陳沁濱,侯喜林,張波,等.洋蔥種質(zhì)資源數(shù)量性狀的主成分分析和聚類分析[J].江蘇農(nóng)業(yè)學(xué)報(bào),2007,23(4):376-378.

    [4]鄒云波.基于LLE和PCA的人臉識(shí)別算法研究[J].云南民族大學(xué)學(xué)報(bào):自然科學(xué)版,2013,22(1):58-61.

    [5]羅會(huì),劉寶鎖,黎火金,等.合浦珠母貝不同地理種群的形態(tài)差異和判別分析[J].廣東農(nóng)業(yè)科學(xué),2013,40(12):171-174.

    [6]孫崇璇.基于PCA主成分分析的人臉檢測(cè)實(shí)現(xiàn)與分析[J].云南民族大學(xué)學(xué)報(bào):自然科學(xué)版,2010,19(6):439-443.

    [7]史峰,王小川,郁磊,等.Matlab神經(jīng)網(wǎng)絡(luò)30個(gè)案例分析[M].北京:北京航空航天大學(xué),2010(3):258-259.

    [8]王越,曾晶,董麗梅,等.基于粒子群的BP神經(jīng)網(wǎng)絡(luò)算法在豬等級(jí)評(píng)定中的應(yīng)用[J].重慶理工大學(xué)學(xué)報(bào):自然科學(xué)版,2013,27(1):85-90.

    [9]李仁府,獨(dú)孤明哲,胡麟.基于PSO算法的路徑規(guī)劃收斂性與參數(shù)分析[J].華中科技大學(xué)學(xué)報(bào):自然科學(xué)版,2013,41(Z1):271-275.

    [10]程玉柱,陳勇,車軍,等.基于Bayes與SVM的玉米彩色圖像分割新算法[J].江蘇農(nóng)業(yè)科學(xué),2012,40(7):355-358.

    [11]袁從貴,張新政.基于多核LS-SVM的河涌水質(zhì)預(yù)測(cè)模型[J].環(huán)境科學(xué)與技術(shù),2013,36(5):171-175.

    [12]劉孝永,王未名,封文杰,等.病蟲(chóng)害專家系統(tǒng)研究進(jìn)展[J].山東農(nóng)業(yè)科學(xué),2013,45(9):138-143.

    [13]馬瀟瀟,王寶山,李長(zhǎng)春,等.基于Diverse AdaBoost改進(jìn)SVM算法的無(wú)人機(jī)影像信息提?。跩].地理與地理信息科學(xué),2014,30(1):13-17.

    [14]焦暢.網(wǎng)購(gòu)評(píng)論情感數(shù)據(jù)的k近鄰和SVM處理方法研究[J].云南民族大學(xué)學(xué)報(bào):自然科學(xué)版,2013,22(3):209-212.

    (責(zé)任編輯 莊紅林)

    中圖分類號(hào):TP311

    文獻(xiàn)標(biāo)志碼:A

    文章編號(hào):1672-8513(2014)06-0456-04

    收稿日期:2014-05-19.

    基金項(xiàng)目:云南省教育廳科學(xué)研究基金(2012C80).

    作者簡(jiǎn)介:徐小華(1980-),男,碩士,講師.主要研究方向:智能計(jì)算.

    A study on the application of PCA and PSO-SVM to the classification of grape wines

    XU Xiao-hua1,QUAN Xiao-song1,ZHANG Zi-feng1,HU Xiao-fei2
    (1.School of Information Science and Technology,Zhaotong University,Zhaotong 657000,China;2.School of Mathematics and Statistics,Zhaotong University,Zhaotong 657000,China)

    Abstract:As the data of physical and chemical components of grape winesare characterized by redundancy,this paper proposes a model based on PCA and PSO-SVM for the classification of grape wines.First,it analyzes the principal physical and chemical components of grape wines,and the major influencing factors in order to reduce input dimensions;second,the particle swarm optimization is adopted to find out the best parameters of the support vector machine which is used to complete the study of training samples and forecast the classification of test samples.The result indicates that this model has higher precision than other models and is of certain applicability.

    Keywords:principal component analysis;partical swarm optimization;support vector machine

    猜你喜歡
    粒子群優(yōu)化支持向量機(jī)主成分分析
    引入螢火蟲(chóng)行為和Levy飛行的粒子群優(yōu)化算法
    動(dòng)態(tài)場(chǎng)景中的視覺(jué)目標(biāo)識(shí)別方法分析
    論提高裝備故障預(yù)測(cè)準(zhǔn)確度的方法途徑
    主成分分析法在大學(xué)英語(yǔ)寫作評(píng)價(jià)中的應(yīng)用
    江蘇省客源市場(chǎng)影響因素研究
    基于熵技術(shù)的公共事業(yè)費(fèi)最優(yōu)組合預(yù)測(cè)
    SPSS在環(huán)境地球化學(xué)中的應(yīng)用
    考試周刊(2016年84期)2016-11-11 23:57:34
    長(zhǎng)沙建設(shè)國(guó)家中心城市的瓶頸及其解決路徑
    基于支持向量機(jī)的金融數(shù)據(jù)分析研究
    能源總量的BP網(wǎng)絡(luò)與粒子群優(yōu)化預(yù)測(cè)
    科技視界(2016年20期)2016-09-29 11:58:53
    鄯善县| 府谷县| 永登县| 古丈县| 侯马市| 陆丰市| 凌云县| 乳山市| 繁峙县| 莫力| 双江| 梁山县| 达拉特旗| 呼图壁县| 来凤县| 东平县| 沅陵县| 连州市| 甘肃省| 贵南县| 垦利县| 惠安县| 五指山市| 永吉县| 荔浦县| 新营市| 武义县| 邹城市| 邯郸市| 开化县| 城口县| 建昌县| 梅州市| 静海县| 永年县| 明星| 宝应县| 容城县| 吉水县| 昌宁县| 白朗县|