崔雪森, 唐峰華, 張 衡, 伍玉梅, 樊 偉
(中國水產(chǎn)科學(xué)研究院東海水產(chǎn)研究所 農(nóng)業(yè)部東海與遠(yuǎn)洋漁業(yè)資源開發(fā)利用重點(diǎn)實(shí)驗(yàn)室, 上海 200090)
?
基于樸素貝葉斯的西北太平洋柔魚漁場預(yù)報模型的建立?
崔雪森, 唐峰華, 張 衡, 伍玉梅??, 樊 偉
(中國水產(chǎn)科學(xué)研究院東海水產(chǎn)研究所 農(nóng)業(yè)部東海與遠(yuǎn)洋漁業(yè)資源開發(fā)利用重點(diǎn)實(shí)驗(yàn)室, 上海 200090)
西北太平洋是中國進(jìn)行柔魚(Ommastrephesbartramii)捕撈生產(chǎn)的重要海區(qū),準(zhǔn)確預(yù)報漁場出現(xiàn)的位置對提高漁業(yè)捕撈產(chǎn)量、節(jié)省燃油有重要的意義。本研究利用2002—2011年中國在該海域的歷史產(chǎn)量數(shù)據(jù)、漁場時空數(shù)據(jù)以及包括海表溫度、葉綠素濃度a、表溫梯度強(qiáng)度和葉綠素梯度強(qiáng)度在內(nèi)的海洋環(huán)境數(shù)據(jù),基于樸素貝葉斯方法,建立了西北太平洋柔魚漁場的預(yù)報模型。為滿足樸素貝葉斯方法對條件獨(dú)立性的假設(shè),利用獨(dú)立成份分析,重新獲得相互獨(dú)立的屬性變量。通過求Cohen′s Kappa系數(shù)最大值的方法,確定3種CPUE類型的先驗(yàn)概率,建立可用于漁場預(yù)報的樸素貝葉斯預(yù)報模型。作為實(shí)際驗(yàn)證,將2012年7~11月我國柔魚漁船在西北太平洋實(shí)際生產(chǎn)數(shù)據(jù)與預(yù)報的高CPUE漁場位置進(jìn)行疊加,平均綜合預(yù)報精度達(dá)到69.9%,表明該模型對西北太平洋漁場的預(yù)報具有較好效果和可行性。
獨(dú)立成分分析; 樸素貝葉斯; 漁場預(yù)報; 柔魚
西北太平洋是中國遠(yuǎn)洋漁船從事大規(guī)模商業(yè)性捕撈的重要作業(yè)海域,柔魚(Ommastrephesbartramii)是該海域的主要捕撈對象之一。日本在2006—2010年的捕撈產(chǎn)量為0.7~4.2萬t,平均2.2萬t[1]。中國自1990年代,魷釣生產(chǎn)規(guī)模逐步擴(kuò)大,近5年來漁船數(shù)達(dá)200~280艘,年產(chǎn)量在3.6~11.3萬t[2]。柔魚通常分為中部秋生群、東部秋生群、西部冬春生群和中東部冬春生群等4個群體,170°E以西為冬春生群[3-4],是中國魷釣船的傳統(tǒng)捕撈對象[5]。
和大多數(shù)漁場一樣,柔魚漁場的形成和變化也受海洋環(huán)境因子的影響。利用魚類的這一特性,國內(nèi)外學(xué)者對不同魚類設(shè)計了各種漁場分析和預(yù)報模型。如陳新軍等[6]利用算術(shù)平均法(AM)和聯(lián)乘法(GM)分別建立基于表溫因子(表溫和表溫水平梯度)的綜合棲息地指數(shù)模型,取得了較好的擬合效果。基于經(jīng)驗(yàn)累計分布函數(shù)(Empirical cumulative distribution function, ECDF),Zainuddin[7]提供了一種尋找潛在漁場的方法。樊偉等[8]利用廣義加性模型(GAM)對柔魚同SST、葉綠素a濃度、經(jīng)度和緯度4個變量的關(guān)系進(jìn)行了定量分析,為實(shí)現(xiàn)GAM模型的預(yù)測的功能奠定了基礎(chǔ)。陳雪忠等[9]設(shè)計了5(°)×5(°)印度洋長鰭金槍魚的隨機(jī)森林模型,也取得了較好的預(yù)報效果。
以上研究多綜合數(shù)個環(huán)境因子來分析和預(yù)報漁場,使分析結(jié)果更加準(zhǔn)確,但實(shí)際的海洋環(huán)境因子之間并非都是獨(dú)立關(guān)系,例如某些海域海表溫度與葉綠素a濃度存在著的一定的相關(guān)性[10]。而在應(yīng)用一些模型進(jìn)行分析時,由于部分因子存在著多重共線性,使分析穩(wěn)定性大大降低,嚴(yán)重影響了最終的結(jié)果[11-12]。如果假設(shè)海洋環(huán)境因子之間相互獨(dú)立,也不符合漁場學(xué)的實(shí)際關(guān)系[13]。而且,樸素貝葉斯方法的應(yīng)用前提條件也是要求輸入因子是相互條件獨(dú)立的。因此,本研究需要先通過獨(dú)立成分分析的方法從時空和環(huán)境變量中提取出相互獨(dú)立的屬性,然后以此作為新的輸入變量建立樸素貝葉斯?jié)O場預(yù)報模型,從而實(shí)現(xiàn)西北太平洋柔魚西部冬春生群漁場的預(yù)報,通過這項(xiàng)工作為提高柔魚漁業(yè)生產(chǎn)效率提供參考。
本研究中的漁獲數(shù)據(jù)由上海海洋大學(xué)魷釣技術(shù)組提供,時間范圍為2002—2011年,空間范圍為140°E~170°E、34°N~48°N,數(shù)據(jù)的內(nèi)容包括日期、經(jīng)度、緯度、產(chǎn)量、作業(yè)次數(shù)和平均日產(chǎn)量。時間分辨率為天,經(jīng)、緯度為實(shí)際漁獲的位置(由于歷史統(tǒng)計的原因,2002年空間分辨率為0.5(°)×0.5(°)。按根據(jù)Tian等[14]提供的方法計算CPUE值,即
(1)
其中:∑Catch為1(°)×1(°)網(wǎng)格中一個月的總產(chǎn)量;∑Fishingdays為當(dāng)月漁船作業(yè)的天數(shù)之和,CPUE的單位為:t·船-1·d-1。作為模型的輸出變量,需要先將CPUE進(jìn)行離散化處理,即將按CPUE高低劃分成若干類別,其中三分位數(shù)可將樣本在統(tǒng)計基礎(chǔ)上分為高、中、低3種級別,這是研究中一種常用的分級方法[15]。同時,由于各個月份CPUE波動范圍較大,在全年內(nèi)取統(tǒng)一的分位點(diǎn)會造成訓(xùn)練數(shù)據(jù)集中,某些月份高CPUE太少或不存在,不利于各個類別CPUE數(shù)量上的平衡。所以根據(jù)文獻(xiàn)[9]的方法,分別以各個月CPUE的33.3%與66.7%分位點(diǎn)為界,將漁獲數(shù)據(jù)集按CPUE的高低劃分為高CPUE、中等CPUE和低CPUE3個級別,以保證各個月份都有三類CPUE漁區(qū)的出現(xiàn)。
環(huán)境數(shù)據(jù)包括該海域的海表溫度(SST)、葉綠素a濃度(CHL)數(shù)據(jù)、表溫梯度強(qiáng)度(SSTG)數(shù)據(jù)和葉綠素a濃度梯度(CHLG)數(shù)據(jù)。前兩者均取自http://oceancolor.gsfc.nasa.gov/的月平均數(shù)據(jù)。為了使環(huán)境數(shù)據(jù)與生產(chǎn)數(shù)據(jù)匹配,將生產(chǎn)數(shù)據(jù)和環(huán)境數(shù)據(jù)按1(°)×1(°)的空間分辨率進(jìn)行網(wǎng)格化處理,并將環(huán)境數(shù)據(jù)點(diǎn)均取在漁區(qū)網(wǎng)格的中心點(diǎn)上。
表溫梯度強(qiáng)度可應(yīng)用求溫度梯度幅值(Gradient Magnitude,GM)的公式來進(jìn)行[16]。設(shè)當(dāng)前漁區(qū)的上下左右4個網(wǎng)格點(diǎn)的海表溫度分別為SSTi±1,j和SSTi,j±1,以差分的格式表示表溫梯度為:
SSTGi,j=
(2)
其中:Δy表示i-1行和i+1行之間的距離,單位為km;Δx表示j-1列和j+1列之間的距離,單位為km。
同理,可得到葉綠素a濃度梯度
CHLGi,j=
(3)
最后,以月份和經(jīng)緯度為關(guān)鍵字,將以上4種環(huán)境數(shù)據(jù)與網(wǎng)格化的CPUE數(shù)據(jù)進(jìn)行匹配。
2.1 預(yù)測變量的選擇
海表溫度、葉綠素a濃度、海表溫度梯度和葉綠素a濃度梯度等環(huán)境要素對漁場的形成和變化具有很重要的作用[17-19]。同時,柔魚按著季節(jié)進(jìn)行洄游,但即使在同一季節(jié),西北太平洋柔魚在不同海區(qū)作業(yè)漁場最適環(huán)境因子也有較大差異[20]。因此,在本研究除了選定海表溫度、葉綠素a濃度、表溫梯度強(qiáng)度和葉綠素a濃度梯度外,也將月份以及經(jīng)度、緯度共7個要素作為漁場預(yù)報模型中的輸入變量,將CPUE作為響應(yīng)變量。
2.2 模型的建立方法
本研究采用樸素貝葉斯方法建立漁場預(yù)報模型,但樸素貝葉斯分類器的條件獨(dú)立假設(shè)在現(xiàn)實(shí)情況下很少發(fā)生,如果不做處理直接使用,可能導(dǎo)致其分類性能下降[21]。因此,在應(yīng)用樸素貝葉斯方法進(jìn)行漁場預(yù)報模型訓(xùn)練之前,必須對各個漁場類屬性(即漁場時空和環(huán)境因子)進(jìn)行獨(dú)立成分的分解。
2.2.1 獨(dú)立成分分析 假設(shè)中心化后的漁場時空與環(huán)境屬性數(shù)據(jù)用隨機(jī)向量x=(x1,x2,x3,…,xN)表示,其中N是屬性的個數(shù),獨(dú)立成分量可以定義為向量s=(s1,s2,s3,…,sM),M是獨(dú)立成分的個數(shù)。獨(dú)立成分分析的目的是通過線性變換把數(shù)據(jù)x,轉(zhuǎn)換成獨(dú)立成分向量,即s=Wx,式中W是非混合矩陣。FastICA算法是實(shí)現(xiàn)獨(dú)立成分分析的一種快速尋優(yōu)的迭代算法,以負(fù)熵最大化作為搜尋方向是其具體算法之一。該算法通過對分離結(jié)果的非高斯性度量來表示分離變量之間的相互獨(dú)立性,當(dāng)非高斯性度量達(dá)到最大時,則表明完成了對各獨(dú)立分量的分離[22]。
假設(shè)X是要輸入的隨機(jī)M維特征變量,記為X=(x1,x2,x3,…,xM),Y是要輸出的目標(biāo)類別集合,即Y=(C1,C2,C3,…,CK),K是類別數(shù)。將訓(xùn)練數(shù)據(jù)集按不同類別分成K個子數(shù)據(jù)集,分別利用獨(dú)立成分分析方法提取出類內(nèi)相互獨(dú)立成分s,根據(jù)文獻(xiàn)[25]的方法,基于對數(shù)似然的類條件下樸素貝葉斯分類模型可以表達(dá)為:
(4)
(5)
3.1 漁場時空與環(huán)境數(shù)據(jù)的獨(dú)立成分分析
2002—2011年西北太平洋柔魚漁獲產(chǎn)量數(shù)據(jù)與時空及環(huán)境數(shù)據(jù)匹配后,共得到訓(xùn)練數(shù)據(jù)記錄1 223條,以33.3%與66.7%作為各月份CPUE的分位點(diǎn),將數(shù)據(jù)集劃分為高、中和低CPUE三類,然后利用FastICA方法分別將三類數(shù)據(jù)集進(jìn)行獨(dú)立成分分析。為了避免環(huán)境屬性信息的損失,仍將獨(dú)立成份個數(shù)定為7,即M=7,最終得到含7個獨(dú)立成分的記錄集和3個相應(yīng)分離矩陣Wk(k=1,2,3)。
3.2 先驗(yàn)概率的確定
雖然訓(xùn)練數(shù)據(jù)集的記錄按CPUE的分位數(shù)進(jìn)行了三等分,但由于漁船作業(yè)范圍不能完全覆蓋整個研究海域,因此將三類漁場的先驗(yàn)概率組合Pr=(PrH,PrM,PrL)簡單地定為(33.3%,33.3%,33.3%)并不一定能獲得最高預(yù)報精度。Cohen′s Kappa系數(shù)可以用作評價判斷的一致性程度的指標(biāo),也可作為檢驗(yàn)該模型精度的一個指標(biāo)。Kappa系數(shù)變動范圍在-1~1之間,越大表示2組判斷的一致性越高。通用的法則是當(dāng)Kappa值在0.40~0.75之間時,表明2組判斷結(jié)果具有一般的一致性[27-28]。所以本研究采用篩選Kappa系數(shù)最大值的方法,來獲得能使預(yù)報與實(shí)際漁場分布最大一致性的先驗(yàn)概率值組合Pr。具體方法如下:采用間隔為5%的不同先驗(yàn)概率組合,利用2.2.2節(jié)中求得的3類CPUE類別下各個獨(dú)立成份的邊緣密度與特征值,代入公式(4)中,分別得出2002—2011年各月份所有漁區(qū)進(jìn)行分類,分類結(jié)果分別與實(shí)際生產(chǎn)CPUE分類數(shù)據(jù)進(jìn)行比較,求得不同先驗(yàn)概率組合對應(yīng)的Kappa系數(shù)(p值均小于0.001),將其記為KappaPrH,PrM,PrL。由于PrH+PrM+PrL=100%,因此也可記為
KappaPrH,PrM,PrL=Kappa(PrH,PrL)
(6)
式中:PrH和PrL分別以5%為間隔取5%,10%,15%,…,85%,90%,并且需滿足PrH+PrL<100%。以PrH為橫軸、PrL為縱軸的獲得的Kappa分布等值面(見圖1)。由于Pr組合中概率值采樣密度間隔為5%,而該圖的右上部分PrM<5%,所以只有左下三角區(qū)域有實(shí)際意義。
從圖1中可以看出,當(dāng)PrH在0.3~0.4之間且PrL在0.2~0.4之間取值時,Kappa值均在0.43左右,即分類的檢驗(yàn)結(jié)果可達(dá)到一般的一致性,其中Kappa(0.35,0.25)=0.444,為最大值。因此,選擇(PrH=0.35,PrM=0.40,PrL=0.25)作確定三類CPUE的先驗(yàn)概率值組合。
圖1 不同先驗(yàn)概率組合下的Cohen′s Kappa系數(shù)
3.3 預(yù)報結(jié)果與精度檢驗(yàn)
經(jīng)計算得到2012年7~11月的分月高CPUE漁區(qū)預(yù)報圖,并與同期實(shí)際生產(chǎn)數(shù)據(jù)相疊加(其余月份為非漁汛期,缺乏可供驗(yàn)證數(shù)據(jù)),如圖2所示。
利用公式(5)中的預(yù)報精度檢驗(yàn)方法,計算得到2012年7~11月的漁場預(yù)報準(zhǔn)確率如圖3所示。從圖中可知該年度5個月的預(yù)報準(zhǔn)確率均在64%~75%之間,平均準(zhǔn)確率為69.9%。
4.1 實(shí)際精度檢驗(yàn)分析
2012年與常年相比漁獲生產(chǎn)情況低迷,每月的產(chǎn)量都較上一年明顯偏低,漁場范圍也比2011年度小,且呈點(diǎn)狀分布,這也為預(yù)報增加了一定的難度。但全年整體上預(yù)報結(jié)果和實(shí)際生產(chǎn)的漁場重心吻合較好。從定量的預(yù)報精度檢驗(yàn)結(jié)果看,8、9和11月的預(yù)報綜合準(zhǔn)確率均超過了70%,精度比較高,而7和10月為65%左右,相對精度較低。
(a.7月July; b.8月August; c.9月September; d.10月October; e.11月November)圖2 2012年實(shí)際生產(chǎn)漁場與預(yù)報漁場對比圖
圖3 2012年7-11月份漁場預(yù)報綜合準(zhǔn)確率
其中7月份的預(yù)報結(jié)果較低有2個原因:一是因?yàn)殡m然在西北太平洋西部海域預(yù)報出了高CPUE漁場,但靠近日本的專屬經(jīng)濟(jì)區(qū)附近,沒有我國漁船生產(chǎn),所以缺少實(shí)際生產(chǎn)資料進(jìn)行驗(yàn)證;二是因?yàn)?月份在東部(165°E以東)也有漁場存在,但并未做出預(yù)報。據(jù)資
料記載,2012年7月份165°E以東海域的作業(yè)對魷魚釣線進(jìn)行了加長,深度達(dá)200~400 m,可能為東部秋生群,而非本研究關(guān)注的西部冬春生群,所以造成了7月份預(yù)報綜合準(zhǔn)確率較低。
而10月份精度偏低的原因主要是預(yù)報漁區(qū)位置普遍偏北所致。根據(jù)衛(wèi)星遙感數(shù)據(jù)顯示,10月份特征等溫線(10、15和20 ℃)較常年均偏北,除個別區(qū)域外表溫偏低外,整個海域的海表溫度較常年普遍偏高(見圖4)。陳新軍認(rèn)為,柔魚漁場的在各海區(qū)均有一定的適溫范圍,其中10月份140°E~150°E的適溫范圍為13~18 ℃,150°E~165°E海域?yàn)?2~15 ℃[29]。偏高的溫度會致使柔魚的最適溫度帶整體向北偏移,因此實(shí)際漁場與往年相比整體偏北,最終導(dǎo)致使預(yù)報準(zhǔn)確率降低。這也說明在海洋環(huán)境較常年發(fā)生較大變動時,利用模型預(yù)報漁場后,仍需要結(jié)合實(shí)際海洋環(huán)境對漁場預(yù)報位置進(jìn)行再分析和適當(dāng)調(diào)整。
圖4 2012年10月份西北太平洋海表溫度與常年對比圖
另外,在2012年8和10月的預(yù)報結(jié)果中,個別海域(如北海道以北145°E、45°N附近)也出現(xiàn)了漁場。據(jù)Ichii等的有關(guān)研究[30],西北太平洋柔魚的冬春生群索餌場的范圍并沒有包含上述海域,因此這類區(qū)域?qū)儆陬A(yù)報中的明顯誤報,應(yīng)該通過人工干預(yù)予以去除。產(chǎn)生這種誤報的原因主要是因?yàn)槟P椭豢紤]了時空及環(huán)境要素,而未考慮柔魚的洄游規(guī)律等生物學(xué)特征。這也說明了在以環(huán)境要素為條件的漁場預(yù)報模型中,還需準(zhǔn)確掌握目標(biāo)魚種生活史過程,才能較大地提高漁情預(yù)報精度[13]。
4.2 與其它模型的比較
雖然國內(nèi)外對于漁場預(yù)報模型的探索已有大量研究[6,9,31-32],但針對西北太平洋柔魚漁場的中、短期預(yù)報的報道卻不多見,目前最為普遍使用的是棲息地指數(shù)(HSI)模型。Tian等[33]利用HSI模型,結(jié)合次表層水溫等環(huán)境數(shù)據(jù)獲得了2005與2006年的柔魚冬春生群體漁場預(yù)報結(jié)果,與實(shí)際漁場相比非常吻合,并定量研究了捕撈努力量和CPUE作業(yè)次數(shù)與平均日產(chǎn)量適宜指數(shù)(SI)值與海洋環(huán)境的關(guān)系;Igarashi等[34]也用相同的模型和包括次表層溫度在內(nèi)的多個海洋環(huán)境因子預(yù)報了2012年北太平洋東部海域柔魚秋生群的漁場分布。利用棲息地適應(yīng)性指數(shù)計算得到的預(yù)測結(jié)果是一個類似于漁場概率的概率值,但作為一個平均化的指標(biāo)與實(shí)時漁場并不具有嚴(yán)格的相關(guān)性[13]。
樸素貝葉斯方法有堅實(shí)的數(shù)學(xué)理論基礎(chǔ),通過聯(lián)合概率來得到一個分類結(jié)果,在計算公式中無需計算屬性的先驗(yàn)概率,也無需考慮屬性之間的相關(guān)性,因此具有算法邏輯簡單、計算開銷小等特點(diǎn)。本研究的實(shí)驗(yàn)結(jié)果也證明在漁場預(yù)報中具有較好的預(yù)報精度。與上述HSI模型相比,由于本模型中各個輸入環(huán)境因子映射到了新的相應(yīng)獨(dú)立成分空間,無法直觀地對環(huán)境因子進(jìn)行分析,因此還需要借助模型以外的相關(guān)性分析等方法對預(yù)報結(jié)果進(jìn)行分析和說明,才能獲得各個環(huán)境因子的重要性指標(biāo),這是本模型的不足之處。另外,上述文獻(xiàn)中的HSI模型均利用了次表層環(huán)境因子作為輸入?yún)?shù),而本模型中只使用了表層的環(huán)境信息。一方面次表層更能反映柔魚所處水層的實(shí)際環(huán)境,能更準(zhǔn)確地把握漁場形成的機(jī)理,另一方面,根據(jù)現(xiàn)有海洋環(huán)境獲取設(shè)備和條件,大面積、實(shí)時地獲得次表層環(huán)境因子相對表層環(huán)境因子更困難,并不適合當(dāng)前漁場預(yù)報業(yè)務(wù)化運(yùn)行的應(yīng)用,因此在本模型的輸入?yún)?shù)中未涉及次表層的環(huán)境數(shù)據(jù)。
本研究利用獨(dú)立成份分析的方法,從時空和環(huán)境變量中重新提取出條件獨(dú)立的特征屬性,在滿足樸素貝葉斯條件獨(dú)立性假設(shè)的情況下,建立了西北太平洋的柔魚漁場預(yù)報模型。由于數(shù)據(jù)資料的限制,2012年各生產(chǎn)月份的漁獲信息僅限于我國魷釣船的捕撈數(shù)據(jù),其他國家和地區(qū)的統(tǒng)計數(shù)據(jù)由于獲取困難未能加入其中,這對預(yù)報結(jié)果的驗(yàn)證和分析帶來一定的限制。從整體上看,在選擇合適的先驗(yàn)概率的情況下,基于樸素貝葉斯預(yù)報模型的預(yù)報結(jié)果與2012年7~11月我國柔魚漁船實(shí)際生產(chǎn)漁場位置吻合度較好,表明該模型對西北太平洋漁場的預(yù)報具有較好效果和可行性。在環(huán)境數(shù)據(jù)方面,由于即時獲取的困難,本研究只采用了表層溫度、葉綠素a濃度、表溫梯度強(qiáng)度和葉綠素a梯度強(qiáng)度4個要素,在今后的研究當(dāng)中,尚需要將更多的環(huán)境因子,如海流、鹽度等,甚至臨近時空的環(huán)境因子也加入模型當(dāng)中,以提高西北太平洋柔魚漁場的預(yù)報精度。
致謝:向提供海表溫度數(shù)據(jù)、葉綠素a濃度數(shù)據(jù)的發(fā)布機(jī)構(gòu)NASA表示誠摯的謝意。
[1] 酒井光夫, 若林敏江, 加藤慶樹. 平成23年度國際漁業(yè)資源の現(xiàn)況-アカイカ北太平洋 [D]. 橫浜: 水産庁· 水産総合研究センター, 2012.
[2] 陳新軍, 陸化杰, 劉必林, 等. 大洋性柔魚類資源開發(fā)現(xiàn)狀及可持續(xù)利用的科學(xué)問題 [J]. 上海水產(chǎn)大學(xué)學(xué)報, 2012, 21(5): 831-840.
[3] Yatsu A, Tanaka H, Mori J. Population structure of the neon flying squid, Ommastrephes bartramii, in the North Pacific [C].//Okutani T. Contributed Papers to International Symposium on Large Pelagic Squids. Tokyo: Japan Marine Fishery Resources Research Center, 1998: 31-48.
[4] Chen C S, Chiu T S.Variations of life history parameters in two geographical groups of the neo flying squid, Ommastrephes bartramii, from the North Pacific [J]. Fisheries Research, 2003, 63: 349-366.
[5] 陳新軍, 曹杰, 劉必林, 等. 基于貝葉斯Schaefer模型的西北太平洋柔魚資源評估與管理 [J]. 水產(chǎn)學(xué)報, 2011, 35(10): 1573-1581.
[6] 陳新軍, 劉必林, 田思泉, 等. 利用基于表溫因子的棲息地模型預(yù)測西北太平洋柔魚漁場 [J]. 海洋與湖沼, 2009, 40(6): 707-713.
[7] Zainuddin Mukti.Skipjack tuna in relation to sea surface temperature and chlorophyll-a concentration of bone bay using remotely sensed satellite data [J]. Journal Ilmu dan Teknologi Kelautan Tropis, 2011, 3(1): 82-90.
[8] 樊偉, 崔雪森, 沈新強(qiáng). 西北太平洋巴特柔魚漁場與環(huán)境因子關(guān)系研究 [J]. 高技術(shù)通訊, 2004, 14(10) : 84-89.
[9] 陳雪忠, 樊偉, 崔雪森, 等. 基于隨機(jī)森林的印度洋長鰭金槍魚漁場預(yù)報 [J]. 海洋學(xué)報, 2013, 35(1): 158-164.
[10] He R, Chen K, Moore T, et al. Mesoscale variations of sea surface temperature and ocean color patterns at the Mid-Atlantic Bight shelfbreak [J]. Geophysical Research Letters, 2010, 37(9): 1-5. doi: 10.1029/2010GL042658.
[11] 金龍, 黃小燕, 史旭明. 復(fù)共線性關(guān)系對逐步回歸預(yù)報方程的影響研究 [J]. 氣象學(xué)報, 2008, 66(4): 547-554.
[12] 吳云芳, 李珍照, 徐帆, 等. 因子相關(guān)性對兩種大壩監(jiān)測模型的影響分析 [J]. 武漢大學(xué)學(xué)報工學(xué)版, 2004, 37(1): 36-40.
[13] 陳新軍, 高峰, 官文江, 等. 漁情預(yù)報技術(shù)及模型研究進(jìn)展 [J]. 水產(chǎn)學(xué)報, 2013(18): 1270-1280.
[14] Tian Siquan, Chen Xinjun, Chen Yong, et al. Standardizing CPUE ofOmmastrephesbartramiifor Chinese squid-jigging fishery in the northwest Pacific Ocean [J]. Chinese Journal of Oceanology and Limnology, 2009, 27(4): 729-739.
[15] Ismail A I, Morrison E C, Burt B A, et al. Natural history of periodontal disease in adults: findings from the Tecumseh Periodontal Disease Study, 1959-87 [J]. J Dent Res, 1990, 69(2): 430-435.
[16] Pi Qingling, Hu Jianyu.Analysis of Sea Surface Temperature Fronts in the Taiwan Strait and its Adjacent Area Using an Advanced Edge Detection Method [J]. Science China Earth Science,2010, 53(7): 1008-1016.
[17] 沈新強(qiáng), 王云龍, 袁騏, 等. 北太平洋柔魚漁場葉綠素a分布特點(diǎn)及其與漁場的關(guān)系 [J]. 海洋學(xué)報, 2004, 26(6): 118-123.
[18] 唐峰華, 崔雪森, 樊偉, 等. 北太平洋柔魚漁獲量與海洋環(huán)境關(guān)系的遙感學(xué)研究 [J]. 海洋技術(shù), 2011, 18(2): 78-82.
[19] Taro Ichii, Kedarnath Mahapatra, Mitsuo Sakai, et al. Differing body size between the autumn and the winter-spring cohorts of neon flying squid (Ommastrephes bartramii)related to the oceanographic regime in the North Pacific: a hypothesis [J]. Fisheries Oceanography, 2004, 13(5): 295-309.
[20] Yatsu Akihiko, Watanabe Tomowo, Mori Junta, et al. Interannual variability in neon flying squid abundance and oceanographic conditions in the central North Pacific, 1982-1992 [J]. Bull Nat Res Inst Far Seas Fish, 1996, 33: 123-138.
[21] 陳朝大, 梁柱勛, 鄭士基. 一種利用關(guān)聯(lián)規(guī)則的改進(jìn)樸素貝葉斯分類算法 [J]. 計算機(jī)系統(tǒng)應(yīng)用, 2010, 19(11): 106-109.
[22] Hyv?rinen A. Fast and Robust Fixed-Point Algorithms for Independent Component Analysis [J]. IEEE Transactions on Neural Networks, 1999, 10(3): 626-634.
[23] Mia K Stern, Joseph E Beck. Beverly Park Woolf. Using a Naive Bayes Classifiers for User Modeling [D]. Banff: Proceedings of the Conference on User Modeling, 1999.
[24] Domingos P, Pazzzani M. On the optimality of Simple Bayesian Classifier under zero-one Loss [J]. Machine Learning, 1997, 29: 103-130.
[25] Fan L W, poh K L, Zhou P. Partition-conditional ICA for Bayesian classification of microarray data [J]. Expert Systems With Applications, 2010, 37(12): 8188-8192.
[26] 張衡, 崔雪森, 樊偉. 基于遙感數(shù)據(jù)的智利竹莢魚漁場預(yù)報系統(tǒng) [J]. 農(nóng)業(yè)工程學(xué)報, 2012, 28(15): 140-144.
[27] Cohen J. A Coefficient of Agreement for Nominal Scales [J]. Educational and Psychological Measurement, 1960, 20(1): 37-46.
[28] Brennan R L, Prediger D J. Coefficient Kappa: some uses, misuses, and alternatives [J]. Educational and Psychological Measurement, 1981, 41(3): 687-699.
[29] 陳新軍, 田思泉. 西北太平洋海域柔魚的產(chǎn)量分布及作業(yè)漁場與表溫的關(guān)系研究 [J]. 中國海洋大學(xué)學(xué)報: 自然科學(xué)版, 2005, 35(1): 101-107.
[30] Ichii T, Mahapatra K, Okamura H, et al. Stock assessment of the autumn cohort of neon flying squid (Ommastrephes bratramii) in the North pacific based on past large-scale high seas driftnet fishery data[J]. Fish Res, 2006, 78: 286-297.
[31] 崔雪森, 伍玉梅, 張晶, 等. 基于分類回歸樹算法的東南太平洋智利竹莢魚漁場預(yù)報 [J]. 中國海洋大學(xué)學(xué)報: 自然科學(xué)版, 2012, 42(7-8): 53-59.
[32] 范江濤, 陳新軍, 錢衛(wèi)國, 等. 南太平洋長鰭金槍魚漁場預(yù)報模型研究 [J]. 廣東海洋大學(xué)學(xué)報, 2011, 31(6): 61-67.
[33] Tian S Q, Chen X J, Chen Y, et al. Evaluating habitat suit-ability indices derived from CPUE and fishing effort data for Ommatrephes bratramii in the northwestern Pacific Ocean [J]. Fish Res, 2009, 95: 181-188.
[34] Igarashi H, Awaji T, Ishikawa Y, et al. Development of a habitat suitability index model for neon flying squid by using 3-D ocean reanalysis product and its practical use [R/OL]. (2013-12-5)[2013-12-28]. http://www.jamstec.go.jp/j/pr/publication/jamstec_rrd/img/20131205. pdf.
責(zé)任編輯 朱寶象
The Establishment of Northwest PacificOmmastrephesbartramiiFishing Ground Forecasting Model Based on Naive Bayes Method
CUI Xue-Sen, TANG Feng-Hua, ZHANG Heng, WU Yu-Mei, FAN Wei
(The Key Laboratory of East China Sea & Oceanic Fishery Resources Exploitation and Utilization,Ministry of Agriculture, East China Sea Fisheries Research Institute, Chinese Academy of Fishery Sciences, Shanghai 200090, China)
Northwest Pacific is an important fishing ground ofOmmastrephesbartramiifor China. The accurate prediction of fishing grounds is critical to energy saving and catch increasing. In this study, a squid fishing ground forecasting model was built with Naive Bayesian method according to the historical catching, spatio-temporal and marine environmental data of this region. The environmental data included sea surface temperature (SST), concentration of chlorophyll ( (CHL), SST gradient strength and CHL gradient strength collected from 2002 to 2011. In order to satisfy the conditional independence assumption of naive Bayes method, the independent component analysis was carried out. By maximizing the Cohen′s Kappa coefficient, three-type CPUEs prior probabilities were determined for the Naive Bayesian forecasting model. As a test, the forecasted fishing ground maps were overlapped with the practical fishing grounds found from July to November 2012. Such an overlapping showed that the average comprehensive accuracy of forecasted fishing grounds was 69.9%, indicating that the Naive Bayesian model was effective for and feasible in forecasting the squid fishing grounds in northwest Pacific.
independent component analysis; naive Bayes method; fishing ground forecasting;Ommastrephesbartramii
國家科技支撐計劃項(xiàng)目(2013BAD13B01);中央級公益性科研院所基本科研業(yè)務(wù)費(fèi)專項(xiàng)項(xiàng)目(2012T07)資助
2013-11-08;
2014-03-29
崔雪森(1973-),男,副研究員。E-mail:cuixuesen@eastfishery.ac.cn
?? 通訊作者: E-mail: wym_07@163.com
S931.3
A
1672-5174(2015)02-037-07
10.16441/j.cnki.hdxb.20130413