范梓淼, 周菊玲
(新疆師范大學 數(shù)學科學學院,新疆 烏魯木齊 830017)
?
育種雜交棉的品質(zhì)分析
范梓淼,周菊玲
(新疆師范大學 數(shù)學科學學院,新疆 烏魯木齊 830017)
摘 要:文章用主成分分析法分析了新疆南疆22種育種雜交棉的馬克隆、上半均長、整齊度、短纖維、反射率、黃度等9項指標,目的是找出代表絕大部分信息的綜合變量。結(jié)果顯示:四個主成分可以代表原始信息85%以上的信息,降低了數(shù)據(jù)維度,極大簡化了育種雜交棉品質(zhì)評價程序,為客觀準確的評價棉花品質(zhì)提供了理論依據(jù)。
關(guān)鍵詞:育種雜交棉;主成分分析;品質(zhì)評價
棉花產(chǎn)業(yè)是新疆經(jīng)濟發(fā)展支柱產(chǎn)業(yè),為新疆提供了大量的就業(yè)機會。在新疆棉花產(chǎn)業(yè)快速發(fā)展的同時,棉花自身出現(xiàn)了很多問題:如棉花品種“多、亂、雜”現(xiàn)象,且品種退化嚴重;原棉“類型單一、纖維一致性差、強力不足”等問題,這些都影響和制約新疆棉花產(chǎn)業(yè)持續(xù)發(fā)展。因此,培育出優(yōu)質(zhì)、豐產(chǎn)的廣適棉為新疆育種目標[1]。而對育種雜交棉品質(zhì)評價問題為首要問題。文章便是針對如何客觀、正確地評價育種棉花品質(zhì),簡化品質(zhì)評價程序展開的研究。以新疆南疆某單位培育的22個育種雜交棉品種為例,對其馬克隆、上半均長、整齊度、短纖維、反射率、黃度等9項指標進行分析。由于該數(shù)據(jù)指標多、數(shù)量級差異且各指標間可能有很大關(guān)聯(lián),因此文章選擇主成分分析法解決。主成分分析是常用的多元統(tǒng)計方法,由于其降維的思想與多指標評價指標序化的要求非常接近,近年來更多地被應用于社會學、經(jīng)濟學、農(nóng)學的評價中,逐漸成為極具特色的多指標評價技術(shù)[2]。
1主成分分析
1.1主成分分析原理
主成分分析(Principal Components Analysis)也叫主分量分析,在1933年由霍特林首先提出。主成分分析是利用降維的思想,在損失最少信息的條件下,把多個指標轉(zhuǎn)化為幾個綜合變量的多元統(tǒng)計方法,這幾個綜合指標就成為主成分[3]。這些主成分的特點是,它們是原始指標的線性組合,且各主成分間彼此不相關(guān)。這樣在研究指標多的問題上通過主成分分析就可以只考慮少數(shù)幾個變量,濾去重疊信息的同時也不至于損失太多信息,便更容易抓住研究對象的主要矛盾,揭示其內(nèi)部規(guī)律,使問題簡化。
主成分分析的數(shù)學步驟如下:
設(shè)有n個樣品,每個樣品有p個指標,這樣共得到np個數(shù)據(jù),原始資料矩陣如下:
1.2建立模型
表1 公因子方差
*提取方法:主成分分析。
首先需要知道信息損失量,也就是 9個指標轉(zhuǎn)化成新的綜合變量提取原始指標信息的能力??梢詮谋?“提取”一列看出,除上半均長提取信息較少(0.699),即損失較大外,新的綜合變量幾乎包含了其他指標85%以上的信息,這就保證了接下來分析的客觀性。
表2 解釋的總方差
*提取方法:主成分分析。
在育種雜交棉品質(zhì)評價的問題中,保留累積方差貢獻率85%以上為宜。觀察表2,前四個成分的方差累積率已達85.709%,因此文章提取四個綜合變量,即主成分,就可保留絕大部分原始的信息,且起到了降維作用。再由表3成分矩陣分析知,第一主成分方差貢獻率為36.774%,是分析的主要方面,它與強度(0.855)、整齊度(0.76)、成熟度(0.662)正相關(guān),與伸長率(-0.866)、短纖維(-0.518)、黃度(-0.461)負相關(guān)。該主成分幾乎涉及所有變量且各特征值絕對值大即顯著相關(guān),因此可稱為品質(zhì)綜合因子,第一主成分得分高的品種,纖維整齊度好,紡出的紗強力高,外觀色澤好。第二主成分方差貢獻率為25.887%,與馬克隆值(0.838)、成熟度(0.659)、短纖維(0.618)正相關(guān),與上半均長(-0.583)、黃度(-0.49)負相關(guān)。第二主成分得分適中的品種棉纖維細度好,且可保證纖維平均長度,稱為細度因子。第三主成分與反射率(0.883)正相關(guān),稱為反射率因子。得分高的品種,成熟度高。第四主成分與黃度(0.683)正相關(guān),成為外觀色澤因子[4]。
表3 成份矩陣(a)
*提取方法 :主成分分析法。a已提取了 4 個成分。
1.3計算得分并排序
表4 各主成分系數(shù)
由表4得到四個主成分y1,y2,y3,y4的線性組合為:
表5 各品種對應各主成分的得分
表6 各育種雜交棉品種得分
2結(jié)語
主成分分析法能夠在面對變量較多,信息重疊的問題時,通過線性變換將多個變量減少為幾個綜合因子,簡化算法,提高分析效率,其特點是提取出的主成分能夠極大可能的反映原始數(shù)據(jù)的信息且主成分盡量互不相關(guān)。所以,主成分分析方法是解決此類問題行之有效的方法。文章中提取了累積貢獻率達85%以上的四個主成分,分別是品質(zhì)綜合因子、細度因子、反射率因子、外觀色澤因子,通過主成分得分可計算出各雜交棉品種得分,從而對培育雜交棉提供了指導意見。因此,此方法應用于農(nóng)業(yè)等相關(guān)產(chǎn)業(yè)的指導中,將大有益處[5]。
參考文獻:
[1] 崔建平.新疆棉花生產(chǎn)現(xiàn)狀及持續(xù)發(fā)展建議[J].新疆農(nóng)業(yè)科學,2008,(45):46-48.
[2] 李靖華.主成分分析用于多指標評價的方法研究[J].管理工程學報,2002,(1):39-44.
[3] 何曉群.多元統(tǒng)計方法[M].北京:中國人民大學出版社,2011,12.
[4] 朱明哲,等.雜交春棉纖維品質(zhì)性狀的多元統(tǒng)計分析[J].河南科技學院學報,2007,35(3):4-6.
[5] 王芳.主成分分析與因子分析的異同比較與應用[J].統(tǒng)計教育,2003,(5):1-17.
The Quality Characters Analysis of Breeding Hybrid Cotton
FAN Zi-miao,ZHOU Ju-ling
(DepartmentofMathematicalSciences,XinjiangNormalUniversity,Urumqi,Xinjiang, 830017,China)
Abstract:The breeding hybrid in the southern Xinjiang was assessed by using the principal component analysis. Nine indexes have analyzed including micromere, uniformity ration, reflectivity etc, so that calculated the new comprehensive variables which consists of most of the information. The results showed that 85% of the raw information could be described by the four comprehensive variables. By this way, the goal was achieved that the data dimension reduced, and then greatly simplifies the breeding hybrid cotton quality evaluation program. There’s theory for evaluating the quality objectively and accurately.
Key words:Breeding hybrid cotton; Principal component analysis; Quality evaluation
中圖分類號:S114
文獻標識碼:A
文章編號:1008-9659(2016)01-058-05
[作者簡介]范梓淼(1991-),女,新疆阿克蘇人,碩士研究生,主要從事概率論與數(shù)理統(tǒng)計方向的研究。
[基金項目]新疆師范大學研究生科技創(chuàng)新基金資助(XYS201502011)。
[收稿日期]2015-10-25