杜秉華,戴美玲,樓平兒,毛元良,朱水芬,林文君
(浙江天蓬集團有限公司,浙江 衢州 324100)
在現(xiàn)場的種豬自動測定設備的測定數(shù)據(jù)中,往往會發(fā)現(xiàn)有的單次采食量過高,比如,一次采食近3 kg,又會發(fā)現(xiàn)采食過少的現(xiàn)象,甚至出現(xiàn)實際不存在的負采食量。這兩種“出錯”數(shù)據(jù)是在自動測定設備運行中較常見的數(shù)據(jù)現(xiàn)象,這既是極端“錯誤”的表現(xiàn),卻又是富含“測定過程”信息的表現(xiàn),對這些現(xiàn)象的科學分析正是理解數(shù)據(jù)的正確性的有效途徑之一[1]。文章就這兩個典型的數(shù)據(jù)現(xiàn)象來分析其中發(fā)生的問題和由此對測定數(shù)據(jù)正確性的影響。當然還有其他的數(shù)據(jù)現(xiàn)象,限于篇幅,將在以后的續(xù)篇中再議。
因為測定數(shù)據(jù)是測定設備性能、人為管理因素、動物行為因素和隨機突發(fā)等眾多因素疊加的結果,所以筆者用現(xiàn)場的實測數(shù)據(jù),對它們進行統(tǒng)計分析,以得到在當前測定條件下開放型自動測定設備出現(xiàn)的這種“錯誤”現(xiàn)象對測試數(shù)據(jù)正確性的影響,以及影響程度。從這兩個數(shù)據(jù)現(xiàn)象得到與之相關的出錯數(shù)據(jù)的“出錯閾值”和數(shù)據(jù)正確性評估的“正確性閾值”,這兩個閾值是監(jiān)測測定運行和評估正確性的一個重要參數(shù)。
浙江某規(guī)?;i場,16個測定站,2017年下半年批次和2018年上半年的測定數(shù)據(jù)。2017年共測定公豬146頭,母豬27頭,共計173頭。2018年測定大約克公豬116頭,母豬57頭;杜洛克公豬3頭,母豬4頭; 16個測定站共計180頭。兩年的測定頭數(shù)為353頭。入測體重為23~35 kg,入測日齡為85~100 d。結測體重為100 kg。鑒于測定規(guī)程要求,統(tǒng)計的數(shù)據(jù)從測定豬進入測定站5 d后采信。文章采信的兩批次的事件數(shù)據(jù)。1頭豬1個采食事件數(shù)據(jù)的內(nèi)容包括:測定站號、測定豬的電子耳牌號、測定豬的耳號、該次采食開始時間、該次采食結束時間、該次采食開始料槽初重、該次采食結束后料槽末重、該次采食的采食量、該次采食時的體重、該次采食的中間自動投料量。在測定認可期(去掉測定前的馴化期和最后一天)內(nèi),數(shù)據(jù)量分別有131,654個和174,654,共計306,308個。這些數(shù)據(jù)(以下均稱為材料數(shù)據(jù))還可分成兩類:即(認可期)有效數(shù)據(jù)和(認可期)無效數(shù)據(jù)。無效數(shù)據(jù)為沒有電子耳牌號和耳號,以及沒有體重的數(shù)據(jù)。16個站的有效數(shù)據(jù)分別為130,788和172,863個;無效數(shù)據(jù)分別為866和1791個,占認可期全部記錄數(shù)據(jù)的0.66%和1.03%(不以站為單位計平均值)。特別強調的是,本材料數(shù)據(jù)中沒有刪除任何一個測定站或某個測定站在某個測定時間段的數(shù)據(jù)。采集本材料數(shù)據(jù)使用的設備是奧飼本的動態(tài)投料型的生長性能自動測定系統(tǒng)。
自動測定設備在測定過程中把每一次測定豬進入測定工作站后的采食和體重數(shù)據(jù)都記錄下來。如圖1是單次最大采食量的實例。
圖1 采食記錄中出現(xiàn)的單次最大采食量記錄
在動物行為正常的情況下,測定豬在測定欄內(nèi)采食一次性的最大量是有上限的,然而上圖中紅色圓圈標注的一次采食量有2.653 kg,37.6 kg體重的豬能否在33 min內(nèi)一次采食這么多的飼料,即這個采食記錄有疑問。為此,先從動物的采食行為數(shù)據(jù)看,將上述的材料數(shù)據(jù)用采食量頻數(shù)直方圖和正態(tài)曲線分布圖(圖2)進行分析測定期的測定豬采食量頻數(shù)分布的實際情況。
圖2顯示的采食量統(tǒng)計范圍在負0.1 kg到1.5 kg(當然從理論上講是±∝g)時,測定豬一次采食的飼料量情況(干料)。上圖的正態(tài)分布曲線上顯示了測定豬本能性的干料一次采食量大約在0.2 kg至0.3 kg,它們一次采食量為1.5 kg事件發(fā)生的概率非常小,以致在以上的正態(tài)曲線和頻數(shù)直方圖中不能顯示出來。即使有偶爾發(fā)生的超過1.5 kg采食量事件,我們通過對其原因核查,發(fā)現(xiàn)造成的原因基本都是有關飼料中斷短缺或投料功能失常的問題,不是測定豬本身的正常采食行為所致。恰恰上述的舉例中,其2.653 kg的采食記錄也是這個原因所致。
在運行管理正常的情況下,上面提到的飼料中斷短缺或投料功能失常兩個原因中的飼料中斷則是主要原因。當然,如果在運行不正常的情況下,原因類別會增加,最終結果是≥1.5 kg的事件數(shù)會增加更多。這個分析圖表示測定豬在正常情況下的單次采食量是有統(tǒng)計意義上的上限值,超過這個上限值的事件數(shù)增加則預示著有顯著影響數(shù)據(jù)正確性的故障因素在影響測定工作。
曾經(jīng)在其他場分析過的測定數(shù)據(jù)上也顯示了這樣的一個現(xiàn)象,以下是一個有關測定豬的單次最大采食量的分析報告[2]。這里顯示了在測定期內(nèi)發(fā)生大于的事件數(shù)與測定管理水平成正相關的現(xiàn)象。測定過程中運行故障的多發(fā)是這些場大于的事件數(shù)上升的重要原因,評估管理水平不高的標志是飼料中斷、設備粘連和管理故障等出現(xiàn)的高發(fā)比例。
管理不良的原因導致影響的因素多重和復雜,如斷料、動物行為、粘連等因素,以及各種因素之間的交叉疊加影響,所以造成B場和C場結果的原因就是多重的。不管影響他們數(shù)據(jù)的具體原因,其結果也反映了一次性采食最大量事件數(shù)與出錯產(chǎn)生的影響是正相關的,說明不管是運行正常的場內(nèi)測定還是管理欠缺的場內(nèi)測定,監(jiān)測單次最大采食量都是有意義的。
圖2直方圖的分析覆蓋范圍大,難以看出大采食量段1 kg以后的詳細情況,所以在圖2的一次采食量正態(tài)分布曲線上截取了1~2 kg區(qū)段的一部分,以進一步探討一次最大采食量的現(xiàn)象(圖3)。
從圖 3 可以看到 :1) 測定條件下的測定豬采食量的事件概率在1.0 kg段是事件概率密度急劇下降的階段,該處分布的事件概率密度為0.005左右。圖3中左端橫坐標開始的1.018 kg處的事件概率密度已經(jīng)低至0.0037,而到了臨近的1.218 kg處的概率密度更是急降低至 0.0001;2)在 1~ 1.3 kg處的曲線是一個圓弧狀,這個圓弧狀范圍表內(nèi)的大部分事件無法否定不是正常的采食行為事件;3)從1.3~1.5 kg的正態(tài)曲線已基本變直,1.5 kg到2.0 kg則是完全平直了。這就表示如果曲線的平直部分反彈或反常,說明有影響正常動物行為測定數(shù)據(jù)其他因素出現(xiàn)的結果。1.3~1.5 kg事件的概率密度平均為0.000005,或發(fā)生的頻次數(shù)是0.03%,所以,如果在1.5 kg段以后有采食事件發(fā)生頻次上升超過頻次0.03%時,就可以認為有問題了。 因此,研究得到了設置監(jiān)測單次最大采食量定義閾值的依據(jù),暫設的定義閾值可為1.5 kg。
在暫設1.5 kg為單次最大采食量的定義閾值基礎上,再繼續(xù)分析這類事件產(chǎn)生的飼料量對總飼料報酬的影響分析見圖4。
圖2 采食量的頻數(shù)分布情況
圖3 單次最大采食量1.0~2.0 kg區(qū)段情況
把材料數(shù)據(jù)中32個測定站的結測數(shù)據(jù)分別按1.5 kg閾值的事件數(shù),以及這些事件的飼料量對各自總采食量的影響比例進行比較分析,把各站的結果按事件數(shù)排序得到圖4的分析表。因為有15個站的1.5 kg事件發(fā)生率為0,所以圖4的藍色曲線在圖表的左一半表現(xiàn)為0水平的直線,這說明在正常運行情況下降低1.5 kg事件數(shù)到控制范圍內(nèi)的是應該能做到的。 隨后藍色的事件數(shù)曲線開始上升,但其相應的飼料影響值赭色曲線與藍色曲線的上升呈非比例態(tài)勢,并且呈急劇變化的特點。在研究中,曾調查了多起事件數(shù)上升的原因,確定均為故障所致,基本上沒有一起是確認的動物行為所致。由此結果得到的結論是1.5 kg作為該項目的定義閾值是可行的,定義閾值縮小到1.3 kg時保留余地不夠,擴大到2 kg其意義不大反而增加了出錯機會的可能。
圖4 單次最大采食量對飼料報酬的影響
當把1.5 kg事件數(shù)的出現(xiàn)頻次與它們對飼料報酬的影響聯(lián)系起來,則顯示了兩者之間有突變的臨界值關系,即該事件數(shù)達到一定數(shù)量(臨界值)時,它對數(shù)據(jù)正確性影響產(chǎn)生的是一個劇增的特征,這個臨界值就可作為在表2中提到的正確性閾值。從這里的分析可以看到,把一次最大采食量的定義閾值設置為1.5 kg的時候,可以通過監(jiān)測該類事件數(shù)的量來監(jiān)測它對測定數(shù)據(jù)的正確性影響。在圖4中有兩個突變的顯示,一個是事件數(shù)為總事件數(shù)的0.07%時,其對飼料報酬的正確性影響為0.5%左右;另一個事件數(shù)為總事件數(shù)的0.1%時,其對飼料報酬的正確性影響在1%左右。
如希望此數(shù)據(jù)對結測報告的影響控制在1%,那可倒推出這個監(jiān)測項目的定義閾值為1.5 kg時,這個數(shù)據(jù)的事件數(shù)發(fā)生率應該在0.1%以內(nèi)。
經(jīng)調查與分析,引起上述出錯數(shù)據(jù)的主要原因是飼料供應中斷。飼料中斷是現(xiàn)場測定時常見的現(xiàn)象,因為豬場不希望料斗里的飼料滯留時間太長而盡可能只存留不超過1 d的飼料,所以場內(nèi)測定的種種原因會經(jīng)常發(fā)生料槽內(nèi)的飼料短時間的飼料中斷,尤其是用自動料線向全體測定站統(tǒng)一供料的情況下。兩三個小時的暫時斷料對測定豬來講不會產(chǎn)生任何影響,但對自動設備的運行來講,這段時間內(nèi)就很可能產(chǎn)生一次采食量大于1.5 kg的事件。
圖5顯示的是單次最小采食量的實例, 這次的采食記錄表現(xiàn)為負值。
這個分析只顯示0 g以下的采食量范圍,圖6是對結測報告中發(fā)生的負采食事件進行頻數(shù)等統(tǒng)計分析的情況。圖6中赭色曲線是各分段負采食事件發(fā)生的總量對全部事件數(shù)的采食總量的比例曲線,藍色曲線是各分段負采食事件發(fā)生的頻率數(shù)對全部事件的次數(shù)的比例曲線。
圖6顯示的信息是:1)在實際運行中自動測定設備會有負采食量的事件出現(xiàn),如果測定軟件是真實反映測定記錄的話; 2) 所有的負采食量的總和對測定豬的采食量分析的影響不大,因為盡管它們占了總事件數(shù)的2.87%,但其影響只占總飼料量的0.18%。從影響飼料報酬的角度來看,這些全部負采食事件似乎都可以忽略。3)負值事件數(shù)隨著負值量的增加而急劇減少。按正態(tài)分布曲線,右面三段范圍的負采食事件概率密度分別是0.5,0.1和0.01,自-20 g起向左方向的曲線更是從平緩變成直線。像前面提到的1.5 kg事件那樣,如果向左的曲線不平直了,就表示有該類事件分發(fā)生頻數(shù)增加,測定故障的發(fā)生超出了管理容許的范圍。
導致產(chǎn)生負采食量事件比1.5 kg采食量事件的原因要更復雜些,除了有產(chǎn)生1.5 kg事件的原因外,還有設備的電子噪聲和機械噪聲,以及老鼠等原因。圖6中的各負采食量段落實際上是以各自不同的主要導致原因而進行分段的。在-20~0 g段落主要的引起原因是設備系統(tǒng)自帶的電子噪聲和機械噪聲;-200~-20 g的主要引起原因是一般粘連;而-200 g以后的主要原因是斷料或嚴重粘連和動物行為。
圖5 單次最小采食量表現(xiàn)為負值的記錄
從設置定義閾的兩個條件來講,一是處于正常運行情況下的正態(tài)分布曲線的下降轉平緩的位置, 二是其定義閾值下監(jiān)測到的事件數(shù)量要與涉及的飼料總量呈負相關和顯著影響的關系。 所以需要更詳細地再看一下-20~0 g段的分析,見圖7。
圖7 可以看到在-20~0 kg的區(qū)段里,該事件出現(xiàn)頻數(shù)的急劇下降處實際是-5 g到-9 g區(qū)段。我們前面提到引起該段事件數(shù)的主要原因是正常的電子和機械噪聲,不是故障或其他管理因素所導致,-4 g 到0 g主要是設備系統(tǒng)內(nèi)部的隨機發(fā)生的電子噪聲所致[3]。加上機械噪聲,會造成負采食量的情況再增加±5 g左右的誤差,所以出現(xiàn)上述“頻數(shù)的急劇下降處實際是-9 g到-5 g區(qū)段”,而且在-10 g以后的區(qū)段,其產(chǎn)生的飼料量影響才開始趨于平緩,所以把0 g或-9 g作為監(jiān)測測定故障的意義不大。
為此再把圖6和圖7各區(qū)段內(nèi)的事件數(shù)量與其對飼料報告的影響匯總,并從設置定義閾來監(jiān)測故障數(shù)據(jù)的條件進行探討一次最小采食量的出錯定義閾值。表2陳列了從-200~-10 g的全部負采食量的情況。負采食量區(qū)段的分割原則是按其事件數(shù)的頻數(shù)來定。
從表2 可以看到-19 g到-10 g區(qū)段內(nèi)的事件數(shù)與飼料影響還是呈正相關變化,然而從-20 g以后的區(qū)段的事件數(shù)與飼料報告影響呈負相關變化,而且-20 g以后區(qū)段的比例系數(shù)也呈急劇上升的趨勢。由此可認為-19 g到-10 g區(qū)段還是受正常的電子和機械噪聲影響的過渡區(qū),而錯誤數(shù)據(jù)的臨界值在-20 g的位置。
按表2顯示,可以把-20 g作為單次最小采食量出錯數(shù)據(jù)的臨界值。那么在<-20 g的情況下來看出錯事件所發(fā)生的數(shù)量狀況,以及在這樣的數(shù)量狀況下其對的飼料報告的正確性之間的關系。圖8是材料數(shù)據(jù)的分析結果。
圖6 負采食量事件數(shù)比例與影響總采食量比例關系圖
圖7 0至負19 g的事件數(shù)與采食量比例
圖8 -20 g以下采食事件的飼料量對飼料報酬影響的分析表
表2 -200~-10g的全部負采食量比例及影響總采食量 %
圖6和圖7顯示在<-20 g的采食事件數(shù)發(fā)生概率在正常情況下是趨于零的, 32個站次的測定結果也顯示有3個站的此類事件數(shù)為零;有50%測定站的此類事件數(shù)發(fā)生頻數(shù)平均值只有0.04%。 這表明在正常運行下可以把<-20g的采食事件數(shù)降低到可控的范圍之內(nèi)。從這里得到的推論是:如果有此類事件發(fā)生的頻次增加,則說明有故障發(fā)生的可能也在增加。在圖8中顯示的情況表明,當<-20 g的采食事件數(shù)出現(xiàn)頻次達到一個閾值的時候,其對飼料報酬會產(chǎn)生一個劇增的和超出允許范圍的影響。所以把單次最小采食量事件的定義閾值設置為-20 g是有意義的,并且是可行的。
綜上所述,與單次性最大采食量情況相似,單次最小采食量事件數(shù)量與其對數(shù)據(jù)正確性兩者之間有突變的臨界值通常需要定在1%左右,所以該監(jiān)測項目的閾值: 把單次最小采食量事件對飼料報酬的正確性影響定為1%時,定義閾值為<-20 g的事件數(shù)量應控制<1%。
一次性最大與最小采食量事件在數(shù)據(jù)正確性方面的主要意義是這些數(shù)值已經(jīng)讓測定數(shù)據(jù)遠遠偏離了這個事件的真值。
經(jīng)通過不同采食量事件比率和對飼料報酬的影響分析,文章初步得到的最大采食量定義閾值為1.5 kg,這個數(shù)據(jù)的事件數(shù)發(fā)生率應該在0.1%以內(nèi);單次最小采食量事件對飼料報酬的正確性影響定為1%時,定義閾值為<-20 g的事件數(shù)量應控制<1%。