金開林,陳兆賢,侯紹云,熊 斌,熊應(yīng)龍,何宇峰
(1.冕寧縣農(nóng)業(yè)農(nóng)村局,四川 冕寧 615600;2.涼山州原生農(nóng)業(yè)綜合開發(fā)有限責(zé)任公司,四川 冕寧 615600;3.涼山州農(nóng)業(yè)農(nóng)村局,四川 西昌 615000)
瀘寧雞是產(chǎn)于四川省冕寧縣的地方家禽品種,屬于肉蛋兼用型優(yōu)良地方遺傳資源,中心產(chǎn)區(qū)位于四川省涼山州冕寧縣瀘寧區(qū),該雞種具有早期生長快、肉質(zhì)鮮美、體型較大、產(chǎn)蛋多、抗病力強、耐粗飼、耐應(yīng)激等特點。群體中存在白羽烏骨雞,由于數(shù)量少,過去很少有相關(guān)研究,課題組在與涼山州原生農(nóng)業(yè)綜合開發(fā)有限責(zé)任公司合作進行瀘寧雞保種繁育的過程中,對白羽烏骨雞進行了家系繁育,為了保種選育有據(jù)可依,應(yīng)用主成分分析法對白羽烏骨家系的生長發(fā)育性狀進行了研究分析,以便找出影響白羽烏骨家系個體的主要性狀。
主成分分析是把原來多個變量化為少數(shù)幾個綜合指標(biāo)的一種統(tǒng)計分析方法,從數(shù)學(xué)角度來看,主成分分析法是一種降維處理技術(shù)。其具體分析方法如下。
假定有n個樣本,每個樣本有p個變量描述,這樣就可以構(gòu)成一個n×p階的數(shù)據(jù)矩陣:
(1)
怎樣才能從眾多變量的數(shù)據(jù)中抓住主要的變量指標(biāo),就需要進行降維處理,即用較少的幾個綜合指標(biāo)來代替原來較多的變量指標(biāo),而且使這些較少的指標(biāo)既能盡量多地反映原來較多指標(biāo)所反映的信息,同時它們之間又是彼此獨立的。如何選取這些綜合指標(biāo)(即新變量),最簡單的方法就是取原來變量指標(biāo)的線性組合,適當(dāng)調(diào)整組合系數(shù),使新的變量指標(biāo)之間相互獨立且代表性最好。
如記原來的變量指標(biāo)為X1,X2,……,Xp,它們的綜合指標(biāo)(新變量指標(biāo))為Z1,Z2,……,Zm(m≤p),則:
(2)
式中,系數(shù)1ij由以下原則來決定:①Zi與Zj(i≠ j;i,j=1,2,……,m)相互無關(guān)。②Z1是X1,X2,……,XP的一切線性組合中方差最大者;Z2是與Z1不相關(guān)的X1,X2,……,XP的第一,第二,……,第m主成分,其中Z1在總方差中占的比例最大,Z2,Z3,……,Zm的方差依次遞減,在生產(chǎn)實際中進行主成分分析,經(jīng)常是挑選前幾個最大的主成分,這樣既可以減少變量的數(shù)目,又抓住了主要矛盾,簡化了變量之間的關(guān)系。
通過以上說明可以看出,找出主成分就是確定原來變量Xj(j=1,2,……,p)在諸主成分Zi(i=1,2,……,m)上的荷載1ij(i=1,2,……,m;j=1,2,……,p),從數(shù)學(xué)上可以知道它們分別是 X1,X2,……,XP相關(guān)矩陣的m個較大的特征值所對應(yīng)的特征向量。
主成分分析是畜禽遺傳育種中研究應(yīng)用最多的一種多元統(tǒng)計方法,其原理是利用降維的思想,使復(fù)雜的問題簡單化,抓住主要矛盾進行分析。其基本步驟為:確定分析變量,收集數(shù)據(jù),原始數(shù)據(jù)的標(biāo)準(zhǔn)化處理,由標(biāo)準(zhǔn)數(shù)據(jù)求斜方差矩陣,求R的特征值、特征向量和主成分的方差貢獻率,提取主成分,求主成分分值,計算綜合分值。
瀘寧雞來自涼山州原生農(nóng)業(yè)綜合開發(fā)有限責(zé)任公司,通過對瀘寧雞擴繁群后代的選擇,將白羽烏骨雞組成家系繁育群,按公母1:10的比例組群,并采用人工授精方式配種,在相同條件下孵化飼養(yǎng),飼養(yǎng)到19周齡時,隨機抽樣測定相關(guān)指標(biāo)作為分析材料。
分析材料飼養(yǎng)到19周齡時,在早上飼喂前隨機抽樣,按農(nóng)業(yè)行業(yè)標(biāo)準(zhǔn)NY/T523-2004家禽生產(chǎn)性能名詞術(shù)語和度量統(tǒng)計方法,測定體尺體重指標(biāo),包括:胸深(X1)、胸寬(X2)、龍骨長(X3)、脛長(X4)、盆骨寬(X5)、脛圍(X6)、體斜長(X7)、體重(X8);利用Excel和spss軟件,分別進行性狀描述分析,相關(guān)分析和主成分分析。
19周齡體尺性狀分析如表1所示,體重性狀統(tǒng)計分析如表2所示。從表1、表2可看出,各性狀平均值參數(shù)指標(biāo)與中位數(shù)均較接近,表明性狀均值有代表性,從各性狀峰度值在-0.02~0.8,偏度值在-0.22~0.51,各性狀最大值與最小值經(jīng)處理相差比率在36.10~183.40,表明各性狀分布離差較大,群體中存在性狀的明顯差異,表型值遺傳差異明顯,存在明顯的可選擇性。
表1 樣本體尺性狀統(tǒng)計分析
表2 樣本體重性狀統(tǒng)計分析
3.2.1 性狀相關(guān)分析
從表3可以看出除胸寬與脛長(r X2X4=0.182 2)相關(guān)性較弱,龍骨長與脛長(r X3X4=0.241 1)相關(guān)顯著(P<0.05)外,其余性狀間相關(guān)系數(shù)均達到極顯著水平(P<0.01);說明體重與體尺相關(guān)性狀間都是正相關(guān)關(guān)系,選擇這些體尺大的,都會影響體重性狀和相關(guān)性狀。
表3 樣本相關(guān)系數(shù)
3.2.2 主成分荷載與特征值貢獻率
從表4可以看出,按不低于85%的累計特征值貢獻率提取前4個主成分,特征值分別是4.810、0.907、0.682、0.557,方差貢獻率分別是60.121%、11.343%、8.529%、6.957%,累計貢獻率達到86.949%。
表4 主成分特征值及貢獻率
主成分分析的原理就是可以將多指標(biāo)問題化為較少的新的指標(biāo)來獲得相關(guān)重要信息,并可以包含樣本的主要信息,此例提取4個主成分已包含了樣本主要信息,可以取代樣本的綜合指標(biāo)。因此可以用提取的主成分荷載進行主成分因子判斷,主成分荷載如表5所示。
表5 主成分荷載
第一主成分中8個性狀荷載系數(shù)在0.451~0.923,其中較大荷載系數(shù)是體重(0.923),其次是體斜長(0.884),可見能最大限度的結(jié)合較多原始信息,是概括指標(biāo)差異的最佳線性函數(shù),當(dāng)體重大時相應(yīng)的體斜長等指標(biāo)會更大,因此第一主成分可定義為體斜長生長發(fā)育因子。
第二主成分中突出較大荷載系數(shù)是脛長(0.825),表明當(dāng)脛長越長時,個體體重會更大,因此可為脛長因子。
第三主成分中較大荷載系數(shù)是胸寬(0.537),其次是脛圍(0.334),當(dāng)胸寬較大時,胸圍相應(yīng)會更大,其個體體重也會更大,可定義為胸寬因子。
第四主成分中較大荷載系數(shù)是并列的胸寬(0.362)和脛長(0.310),當(dāng)胸寬和脛長同時較大時,對個體體重產(chǎn)生影響,鑒于第二主成分為脛長因子、第三主成分為胸寬因子,因此第四主成分可定義為胸寬脛長互補因子。
通過以上分析可以看出,所提取的4個主成分代表的主要信息定義的主要因子——體斜長生長發(fā)育因子、脛長因子、胸寬因子和胸寬脛圍互補因子,是影響瀘寧雞白羽烏骨雞生長發(fā)育性狀的主要因素。
通過對瀘寧雞白羽烏骨家系后代的主成分分析可以看出,性狀大小分布差異較大,研究樣本具有可選擇性,提取的4個主成分累計貢獻率達到86.949%,因此可以作為瀘寧雞白羽烏骨雞的選育依據(jù),初步得出以下結(jié)論。
1)運用主成分分析所提取的4個主成分,完全包含了樣本的主要信息,可以取代樣本的綜合指標(biāo)。將其作為選育依據(jù),可以提高以群體體重為主的綜合性狀。
2)通過提取主成分最大荷載命名因子,可以得出影響瀘寧雞白羽烏骨雞個體體重的主要性狀是體斜長、脛長和胸寬。