魏廣恩,陳新軍,2,3*
( 1. 上海海洋大學(xué) 海洋科學(xué)學(xué)院,上海 201306;2. 大洋漁業(yè)資源可持續(xù)開發(fā)教育部重點(diǎn)實(shí)驗(yàn)室,上海 201306;3. 國家遠(yuǎn)洋漁業(yè)工程技術(shù)研究中心,上海 201306)
柔魚(Ommastrephes bartramii)是一種短生命周期的大洋性頭足類,是北太平洋重要經(jīng)濟(jì)種類[1]。日本魷釣船最早于1974 年對該資源進(jìn)行利用[2],我國對該資源的調(diào)查始于1993 年,1994 年后開始進(jìn)行商業(yè)化生產(chǎn),主要捕撈對象為冬春生群體[3]。歷年來的生產(chǎn)情況表明其資源年間變動較大,因此,探究其資源豐度波動原因?qū)?shí)際生產(chǎn)有重要意義。
柔魚是一種“生態(tài)機(jī)會主義”物種,其漁場分布和資源豐度都易受海洋環(huán)境的影響[4]。已有的研究表明[5–7],柔魚資源量及分布受產(chǎn)卵場和索餌場海水表層溫度和葉綠素濃度等因素的影響,補(bǔ)充量大小則受產(chǎn)卵場適宜水溫范圍影響。造成這一現(xiàn)象的主要原因是短生命周期的柔魚在親體產(chǎn)完卵后即死亡,其資源量大小主要取決于補(bǔ)充量[8–9],而補(bǔ)充量則主要取決于早期存活率。該階段的柔魚(胚胎和仔魚)自主選擇適宜生存環(huán)境的能力較弱,容易產(chǎn)生較高的自然死亡率,海洋環(huán)境的變化會影響到仔魚的生長和存活,進(jìn)而影響柔魚資源補(bǔ)充量[10]。
Murakami 等[11]認(rèn)為北太平洋柔魚存在3 個產(chǎn)卵場,分 別 為140°~150°E 海 域、170°E 附 近 海 域和160°W~180°海 域。Nakamura[12]和Okutain[13]分 別 通過性成熟雌性個體的分布和仔稚魚出現(xiàn)海域驗(yàn)證了這些產(chǎn)卵場的存在。西北太平洋柔魚冬春生群體的產(chǎn)卵場為130°~170°E[14]。以往研究中[15],以單位捕撈努力量漁獲量(Catch Per Unit Effort,CPUE)來表征漁業(yè)資源豐度的相對指標(biāo),以產(chǎn)卵場最適海表面溫度的范圍來表征柔魚產(chǎn)卵場環(huán)境條件的優(yōu)劣,通過計算柔魚產(chǎn)卵期整個產(chǎn)卵場最適海表水溫的范圍占總面積的比值(Ps)序列值與對應(yīng)年份CPUE組成的時間序列值的相關(guān)性,來分析產(chǎn)卵場環(huán)境對西北太平洋柔魚資源補(bǔ)充量的影響。西北太平洋柔魚產(chǎn)卵場是否均勻分布在130°~170°E 海域,或者只是分布于該海域內(nèi)的局部區(qū)域尚未定論。故直接使用整個產(chǎn)卵場的Ps 來分析柔魚產(chǎn)卵場環(huán)境對柔魚資源補(bǔ)充量的影響,會因?yàn)楫a(chǎn)卵場經(jīng)緯度跨度較大,造成產(chǎn)卵場的Ps 序列值和CPUE 序列值之間的相關(guān)性降低。索餌場最適海表水溫的比例(Pf)的計算亦是如此。故本研究通過對產(chǎn)卵場和索餌場的逐步等分,通過相關(guān)性決定等分的空間尺度,通過隨機(jī)森林得出各個產(chǎn)卵場和索餌場對CPUE的重要性,以此來確定各月份所對應(yīng)的產(chǎn)卵場和索餌場海域。以相關(guān)性和隨機(jī)森林模型篩選出的最適海表水溫的范圍占總面積的比值,作為自變量,以CPUE作為因變量,構(gòu)建神經(jīng)網(wǎng)絡(luò)模型,分析相關(guān)性和隨機(jī)森林兩種篩選方式下,神經(jīng)網(wǎng)絡(luò)模型預(yù)測資源豐度的準(zhǔn)確性。
2.1.1 漁業(yè)數(shù)據(jù)
西北太平洋柔魚漁獲數(shù)據(jù)來源于上海海洋大學(xué)中國魷釣技術(shù)組,時間為2004-2015 年,作業(yè)海域主要分布在35°~50°N,140°~160°E 范圍內(nèi)??臻g分辨率為1°×1°,數(shù)據(jù)包括日期(年、月)、經(jīng)度、緯度、產(chǎn)量(t)、年作業(yè)船數(shù)(表1)等。本研究以CPUE 表征西北太平洋柔魚的資源豐度(圖1)。
表1 2004-2015 年各年份作業(yè)船數(shù)Table 1 The numbers of fishing vessels from 2004 to 2015
圖1 2004-2015 年西北太平洋柔魚產(chǎn)量及CPUEFig. 1 The annual total catch and catch per unit effort (CPUE)of O. bartramii from 2004 to 2015 in the Northwest Pacific Ocean
2.1.2 環(huán)境數(shù)據(jù)
圖2 西北太平洋柔魚產(chǎn)卵場和索餌場分布Fig. 2 Distribution of spawning and feeding grounds of O.bartramii in the Northwest Pacific Ocean
根據(jù)前人研究[16–17],確定了西北太平洋柔魚冬春生群體的產(chǎn)卵場分布海域和月份,索餌場分布海域和月份。環(huán)境數(shù)據(jù)包括產(chǎn)卵場(20°~30°N,130°~170°E)(圖2)和索餌場(38°~46°N,150°~165°E)(圖2)的海表水溫(SST),時間分辨率為月,空間分辨率為0.1°×0.1°,用于計算產(chǎn)卵場Ps 值和索餌場Pf 值。時間范圍為2004-2015 年,其中產(chǎn)卵場為1-4 月,索餌場為8-11 月。SST 數(shù)據(jù)來源于NOAA OceanWatch 數(shù)據(jù)庫(http://pifscoceanwatch.irc.noaa.gov/erddap/griddap/Ocea nWatch_pfgac_sst_monthly.html)。
2.2.1 確定產(chǎn)卵場與索餌場的劃分方案
產(chǎn)卵場和索餌場的劃分方案遵循逐步等分,經(jīng)度和緯度交叉分割的方式。結(jié)合產(chǎn)卵場和索餌場海域的實(shí)際情況,進(jìn)行逐步分割。產(chǎn)卵場海域具體劃分方案如圖3 所示,索餌場具體劃分方案如圖4 所示。
分別計算產(chǎn)卵場產(chǎn)卵期(1-4 月)和索餌場索餌期(8-11 月)各海區(qū)各月份對應(yīng)的Ps 和Pf(產(chǎn)卵場產(chǎn)卵期1-4 月最適海表水溫范圍為21~25℃,索餌場索餌期8-11 月各月份最適海表水溫范圍不同,8 月為15~19℃;9 月 為14~18℃;10 月 為12~15℃;11 月為10~13℃[16-17])。分析各海區(qū)各月份的Ps 和Pf 時間序列值與CPUE 時間序列值的相關(guān)性。通過相關(guān)性分析作為最終劃分方案的選擇依據(jù)。
2.2.2 隨機(jī)森林法提取產(chǎn)卵場和索餌場海域
1)隨機(jī)森林定義及其思想
隨機(jī)森林就是通過集成學(xué)習(xí)的思想將多棵樹集成的一種算法,它的基本單元是決策樹,而它的本質(zhì)屬于機(jī)器學(xué)習(xí)的一大分支—集成學(xué)習(xí)(ensemble learning)方法[18]。隨機(jī)森林是一個樹型分類器{h(x,βk),k=1,···} 的集合,其中元分類器h(x,βk)是使用CART 算法構(gòu)建的沒有剪枝的分類決策樹;x是輸入向量; βk是獨(dú)立同分布的隨機(jī)向量,決定了單棵樹的生長過程。通過自助法重采樣技術(shù),從原始的訓(xùn)練樣本集N中進(jìn)行有放回的重復(fù)隨機(jī)取樣,抽取k個樣本,生成新的訓(xùn)練集樣本集合,自助樣本集生成的k個決策樹組成隨機(jī)森林,新數(shù)據(jù)的分類結(jié)果按決策樹投票多少形成的分?jǐn)?shù)而定。隨機(jī)森林就是對數(shù)據(jù)集的列變量和行觀測進(jìn)行隨機(jī)化,生成多個分類數(shù),最終將分類樹結(jié)果進(jìn)行匯總[19]。隨機(jī)森林在降低運(yùn)算量的同時也能夠保證預(yù)測精度,而且該算法對多元共線性不敏感,對缺失數(shù)據(jù)和非平衡數(shù)據(jù)比較穩(wěn)健,可以很好地適應(yīng)多達(dá)幾千個解釋變量的數(shù)據(jù)集。
圖3 西北太平洋海域柔魚產(chǎn)卵場的劃分方案Fig. 3 The division of spawning grounds of O. bartramii in the Northwest Pacific Ocean
圖4 西北太平洋海域柔魚索餌場的劃分方案Fig. 4 The division of feeding grounds of O. bartramii in the Northwest Pacific Ocean
2)隨機(jī)森林的估計過程
隨機(jī)森林建立模型以及預(yù)測的具體步驟如圖5所示。
圖5 隨機(jī)森林工作原理Fig. 5 The working principle of random forest
(1)首先,用N表示原始訓(xùn)練集樣本的個數(shù),用M表示變量的數(shù)目。確定一個定值m,用來決定當(dāng)在一個節(jié)點(diǎn)上做決定時,會使用到多少個變量。即隨機(jī)產(chǎn)生m個變量用于節(jié)點(diǎn)上的二叉樹,二叉樹變量的選擇仍然滿足節(jié)點(diǎn)不純度最小原則。
(2)應(yīng)用Bootstrap 自助法在原數(shù)據(jù)集中有放回地隨機(jī)抽取k個樣本集,組成k棵決策樹,而對于未被抽取的樣本用于單棵決策樹的預(yù)測。
(3)每個自助樣本集生長成為單棵決策樹。在樹的每個節(jié)點(diǎn)處從M個特征中隨機(jī)挑選m個特征(m小于M),按照節(jié)點(diǎn)不純度最小的原則從這m個特征中選出一個特征進(jìn)行分支生長。這棵決策樹進(jìn)行充分生長,使每個節(jié)點(diǎn)的不純度達(dá)到最小,不進(jìn)行通常的剪枝操作。根據(jù)k個決策樹組成的隨機(jī)森林對待分類樣本進(jìn)行分類或預(yù)測,分類的原則是投票法,預(yù)測的原則是簡單平均[20]。
3)隨機(jī)森林的兩個重要參數(shù)
樹節(jié)點(diǎn)預(yù)選的變量個數(shù)和隨機(jī)森林中樹的個數(shù),這兩個參數(shù)是構(gòu)建隨機(jī)森林模型過程中的兩個重要參數(shù),也是決定隨機(jī)森林預(yù)測能力的兩個重要參數(shù)。其中第一個參數(shù)決定了單棵決策樹的情況,而第二個參數(shù)決定了整片隨機(jī)森林的總體規(guī)模。兩個參數(shù)分別從隨機(jī)森林的微觀和宏觀層面上決定整片隨機(jī)森林的構(gòu)造[21–23]。
4)隨機(jī)森林模型評價因素
(1)森林中單棵樹的分類強(qiáng)度:每棵樹的分類強(qiáng)度越大,即每棵樹生長越茂盛,組成森林的分類性能越好。
(2)森林中樹之間的相關(guān)度:樹與樹之間的相關(guān)性越差,或樹之間是獨(dú)立的,則森林的分類性能越好[24–25]。
2.2.3 神經(jīng)網(wǎng)絡(luò)預(yù)報模型
誤差反向傳播神經(jīng)網(wǎng)絡(luò)(Error Backpropagation Network, EBP)屬于多層前向神經(jīng)網(wǎng)絡(luò),利用誤差反向傳播的監(jiān)督算法,學(xué)習(xí)和存儲大量的模式映射關(guān)系[26–27]。該算法主要包括學(xué)習(xí)過程信號的正向傳播與誤差的反向傳播兩個過程。正向傳播時,樣本從輸入層進(jìn)入,經(jīng)隱藏層激活函數(shù)處理,傳向輸出層,如果輸出層的實(shí)際輸出與期望的輸出不符合誤差要求,則轉(zhuǎn)入誤差的反向傳播階段。反向傳播是將誤差以某種形式通過隱藏層向輸入層逐層反向傳播,將誤差分?jǐn)偨o各層所有節(jié)點(diǎn),從而獲得各層節(jié)點(diǎn)的誤差信號,以此誤差信號作為修正的依據(jù)。這種信號的正向傳播與誤差的反向傳播周而復(fù)始地進(jìn)行,權(quán)值不斷調(diào)整,即為網(wǎng)絡(luò)學(xué)習(xí)的過程,直至網(wǎng)絡(luò)輸出的誤差減少到可接受程度或進(jìn)行到預(yù)先設(shè)定的學(xué)習(xí)次數(shù)為止[28]。
利用2.2.1 節(jié)和2.2.2 節(jié)所得相關(guān)性和重要性海域,按照產(chǎn)卵場和索餌場分別組成樣本集,建立神經(jīng)網(wǎng)絡(luò)的預(yù)報模型。經(jīng)歸一化處理后,將2004-2013 年的樣本,隨機(jī)化分配70%作為訓(xùn)練樣本,30%作為測試樣本,2014-2015 年的樣本作為驗(yàn)證樣本。將最適海表水溫范圍比值Ps 和Pf 作為輸入向量,CPUE 作為輸出向量。輸入層神經(jīng)元個數(shù)根據(jù)篩選出的Ps 或Pf 海域個數(shù)決定。輸出神經(jīng)元為CPUE,隱含層神經(jīng)元個數(shù)根據(jù)經(jīng)驗(yàn)公式確定:
式中,J為隱含層節(jié)點(diǎn)數(shù);m為輸出層節(jié)點(diǎn)數(shù);n為輸入層節(jié)點(diǎn)數(shù);a為1~10 之間的常數(shù)。其中,學(xué)習(xí)速率為0.1,動量參數(shù)為0.5。最大訓(xùn)練次數(shù)為1 000 次,最大誤差給定0.001,經(jīng)多次訓(xùn)練,取最優(yōu)結(jié)果,防止過擬合出現(xiàn)[29]。
以均方誤差(Mean Squared Error, MSE)作為判斷最優(yōu)模型的標(biāo)準(zhǔn)。均方誤差(式(2))根據(jù)測試樣本的預(yù)報值與實(shí)際值進(jìn)行計算,
式中,yk為CPUE 的實(shí)際值; ^yk為CPUE 的預(yù)報值。比較產(chǎn)卵場和索餌場在兩種篩選條件下所得海區(qū)的Ps 和Pf 作為輸入變量時,模型的均方誤差。
根據(jù)模型的CPUE 預(yù)測值,結(jié)合2014-2015 年的CPUE 實(shí)際值,分別計算各模型的預(yù)報準(zhǔn)確度,計算公式為
式中,P表示預(yù)報準(zhǔn)確度;yk為CPUE 的實(shí)際值; ^yk為CPUE 的預(yù)報值。計算產(chǎn)卵場和索餌場在兩種篩選條件下所得海區(qū)的Ps 和Pf 作為輸入變量時,以每種模型預(yù)報準(zhǔn)確度的均值,作為該模型的預(yù)報準(zhǔn)確度。
通過上述劃分方案,分別對產(chǎn)卵場和索餌場進(jìn)行劃分,計算每一個劃分海區(qū)的最適海表水溫范圍的比值,分析產(chǎn)卵場Ps 與CPUE、索餌場Pf 與CPUE 序列值的相關(guān)性,結(jié)果如表2、表3 所示。從表中可以看出,產(chǎn)卵場和索餌場隨著劃分海區(qū)的增加,與CPUE序列值出現(xiàn)顯著相關(guān)性的海區(qū)隨之增加;另一方面,也驗(yàn)證了上文中提及的直接使用整個產(chǎn)卵場或索餌場最適海表水溫比例的序列值,分析其與CPUE 序列值之間的相關(guān)性,將造成相關(guān)性降低的現(xiàn)象。故確定D 方案作為產(chǎn)卵場和索餌場的劃分方案。
3.2.1 隨機(jī)森林的兩個重要參數(shù)
根據(jù)上述各方案下Ps、Pf 與CPUE時間序列相關(guān)性出現(xiàn)的規(guī)律,確定產(chǎn)卵場和索餌場海區(qū)的劃分方案。最終選取D 方案下,產(chǎn)卵場和索餌場所劃分的海區(qū)作為隨機(jī)森林的分析對象。分別選取產(chǎn)卵場和索餌場所有劃分海區(qū)各月份的Ps 值和Pf 值作為輸入向量,通過隨機(jī)森林模型,計算各自變量對模型的重要性,篩選出重要性海區(qū)。
表2 西北太平洋海域柔魚產(chǎn)卵場Ps 與CPUE 時間序列的相關(guān)性和顯著性Table 2 The correlation and significance of Ps in the spawning grounds with CPUE time series of O. bartramii in the Northwest Pacific Ocean
表3 西北太平洋海域柔魚索餌場Pf 與CPUE 時間序列的相關(guān)性和顯著性Table 3 The correlation and significance of Pf in the feeding grounds with CPUE time series of O. bartramii in the Northwest Pacific Ocean
采用逐一增加變量的方法來進(jìn)行建模,根據(jù)模型的誤判率均值最小原則,確定模型中決策樹的節(jié)點(diǎn)最優(yōu)變量個數(shù),構(gòu)建最優(yōu)模型。從圖6 中可以確定,當(dāng)構(gòu)建的Ps 模型決策樹節(jié)點(diǎn)所選變量數(shù)為13 時,模型的誤判率均值最低,確定Ps 模型最優(yōu)變量個數(shù)為13 個。當(dāng)構(gòu)建的Pf 模型決策樹節(jié)點(diǎn)所選變量數(shù)為12 時,模型的誤判率均值最低,Pf 模型最優(yōu)變量個數(shù)為12 個。
確定模型中決策樹的節(jié)點(diǎn)最優(yōu)變量個數(shù)之后,根據(jù)模型誤差是否趨于穩(wěn)定,確定最優(yōu)模型中決策樹的數(shù)量。從圖7 中可以看出,Ps 模型中決策樹數(shù)量在300 以內(nèi)時,模型誤差會出現(xiàn)較大的波動,當(dāng)決策樹數(shù)量大于300 以后,模型誤差趨于穩(wěn)定,但仍有少許變化,該模型誤差最小值出現(xiàn)在決策樹數(shù)量為500 左右,故確定Ps 模型中最優(yōu)決策樹數(shù)量為500。同樣Pf 模型中決策樹數(shù)量在200 以內(nèi)時,模型誤差會出現(xiàn)較大的波動,當(dāng)決策樹數(shù)量大于200 以后,模型誤差趨于穩(wěn)定,進(jìn)而確定Pf 模型中最優(yōu)模型中決策樹的數(shù)量為480。
圖6 不同決策樹節(jié)點(diǎn)分支變量數(shù)模型的誤判率均值Fig. 6 The mean of misjudgment rate of models with different numbers of branch variable on the decision trees node
圖7 決策樹數(shù)量和模型誤差關(guān)系Fig. 7 The relation between model error and numbers of decision trees
3.2.2 各月份重要海區(qū)的選取
通過隨機(jī)森林模型的構(gòu)建,可以得到產(chǎn)卵場和索餌場不同月份下各海區(qū)對模型影響的重要值。各海區(qū)重要值越高,說明該海區(qū)對模型的影響越大。本研究以精度平均減少值度量各海區(qū)的的重要值。產(chǎn)卵場在產(chǎn)卵期不同海區(qū)的重要值如圖8 所示。
以精度平均減少值15 為篩選標(biāo)準(zhǔn),產(chǎn)卵場重要海區(qū)分布:1 月為D9 海區(qū)、D10 海區(qū),2 月為D11 海區(qū),3 月無重要性海區(qū),4 月為D13 海區(qū)、D16 海區(qū)。比較于相關(guān)性篩選出的海區(qū),差異在于1 月增加了D9 的 相 鄰 海 區(qū)D10,2 月 減 少 了D11 的 相 鄰 海區(qū)D3(負(fù)相關(guān)),3 月一致,4 月增加了D16 海區(qū)。此結(jié)果與相關(guān)性海區(qū)結(jié)果基本吻合。
以精度平均減少值10 為篩選標(biāo)準(zhǔn),產(chǎn)卵場重要海區(qū)增加范圍:1 月份增加D1、D7、D12、D16 海區(qū);2 月份增加D8、D12、D16 海區(qū);3 月份增加D6、D8、D15、D16 海區(qū),4 月份增加D7 海區(qū)。索餌場在索餌期不同海區(qū)的重要性如圖9 所示。
以精度平均減少值15 為篩選標(biāo)準(zhǔn),索餌場重要海區(qū)分布:8 月為D5 海區(qū)、D7 海區(qū),9 月為D6 海區(qū),10 月 為D1 海 區(qū),11 月 為D1 海 區(qū)、D6 海 區(qū)、D7 海區(qū)、D8 海區(qū)。比較于相關(guān)性篩選出的海區(qū),差異在于8 月增加了D5 海區(qū),9 月增加了D6 海區(qū),10 月一致,11 月增加了D1 海區(qū),減去了D10 海區(qū)。此結(jié)果與相關(guān)性海區(qū)結(jié)果基本吻合。
以精度平均減少值10 為篩選標(biāo)準(zhǔn),索餌場重要海區(qū)增加范圍:8 月份增加D1 海區(qū)、D3 海區(qū)、D4 海區(qū)、D8 海區(qū);9 月份增加D1 海區(qū)、D4 海區(qū)、D5 海區(qū)、D7 海區(qū)、D8 海區(qū)、D12 海區(qū);10 月份無變化,11 月份增加了D9 海區(qū)。
3.3.1 神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建
根據(jù)上述結(jié)果,將相關(guān)性作為篩選條件所得海區(qū)的最適海表水溫范圍占該海區(qū)面積的比值,以及隨機(jī)森林模型中所得重要性海區(qū)的最適海表水溫范圍占該海區(qū)面積的比值作為輸入變量,構(gòu)造的模型如表4所示,其中,I 和II 分別是基于相關(guān)性篩選的產(chǎn)卵場各海區(qū)于產(chǎn)卵期(1-4 月)各月份的Ps 時間序列值和索餌場各海區(qū)于索餌期(8-11 月)各月份的Pf 時間序列值與CPUE 時間序列值顯著相關(guān)的海區(qū)的Ps 值和Pf 值作為輸入因子,構(gòu)建網(wǎng)絡(luò)結(jié)構(gòu)(輸入層∶隱藏層∶輸出層)分別為4∶5∶1 和6∶7∶1 的神經(jīng)網(wǎng)絡(luò)模型;III 和IV 分別是基于隨機(jī)森林模型以精度平均減少值15 為篩選條件獲得的產(chǎn)卵場各海區(qū)于產(chǎn)卵期(1-4月)各月份和索餌場各海區(qū)于索餌期(8-11 月)各月份重要海區(qū)的Ps 值和Pf 值作為輸入因子,構(gòu)建網(wǎng)絡(luò)結(jié)構(gòu)分別為5∶6∶1 和8∶9∶1 的神經(jīng)網(wǎng)絡(luò)模型。
圖8 產(chǎn)卵期各海區(qū)重要性分布Fig. 8 The distribution of each sea area’s importance during spawning period
3.3.2 預(yù)報模型實(shí)現(xiàn)及結(jié)果比較
通過上述構(gòu)造神經(jīng)網(wǎng)絡(luò)預(yù)測模型方案,進(jìn)行模型擬合,模型的均方誤差和預(yù)報準(zhǔn)確度如圖10 所示。D 方案下,產(chǎn)卵場和索餌場劃分海區(qū)的最適海表水溫范圍占該海區(qū)面積的比值作為輸入變量構(gòu)建的神經(jīng)網(wǎng)絡(luò)預(yù)測模型均能準(zhǔn)確預(yù)報柔魚的資源量,預(yù)報準(zhǔn)確度在90%以上?;陔S機(jī)森林選取重要性海區(qū)的最適海表水溫范圍占該海區(qū)面積的比值構(gòu)建的模型的預(yù)報準(zhǔn)確度高于相關(guān)性篩選的海區(qū)。而基于D 方案下產(chǎn)卵場劃分海區(qū)的最適海表水溫范圍占該海區(qū)面積的比值作為輸入變量的神經(jīng)網(wǎng)絡(luò)預(yù)測模型的均方誤差,明顯小于索餌場。
圖11 中黑色實(shí)線包圍的海域,為整個產(chǎn)卵場最適海表水溫所占范圍。根據(jù)D 方案的劃分方式,對產(chǎn)卵場進(jìn)行劃分,可以大致了解劃分的各個海區(qū)最適海表水溫分布情況。從圖中可以看出,計算產(chǎn)卵場整片海域的最適海表水溫范圍所占的比值與按照不同的方案劃分情況下計算Ps 差異較大,不同經(jīng)度和緯度,最適海表水溫空間分布不同,若采用整個產(chǎn)卵場的Ps 進(jìn)行分析,極易削弱產(chǎn)卵場海域Ps 與CPUE 時間序列的顯著相關(guān)性,故需要將整個產(chǎn)卵場按照不同方案進(jìn)行劃分,從而找到與CPUE 序列值顯著相關(guān)的海域,索餌場亦是如此。
圖9 索餌期各海區(qū)重要性分布Fig. 9 The distribution of each sea area’s importance during the feeding period
表4 神經(jīng)網(wǎng)絡(luò)預(yù)報模型構(gòu)建方案Table 4 Construct the scenarios of neural network
通過產(chǎn)卵場的相關(guān)性分析可以看出,隨著劃分海域不斷增多,各海域面積減小,Ps 與CPUE 時間序列出現(xiàn)顯著性的海域也不斷增多。主要集中在1 月、2 月和4 月。首先從相關(guān)性可以肯定,柔魚資源補(bǔ)充量的變動和各海域最適海表水溫的比值存在顯著性,相關(guān)性卻出現(xiàn)差異正負(fù),D 方案下,D3 海區(qū)與D11 海域經(jīng)度范圍一致,緯度范圍分別為20°~25°N 和25°~30°N。在相同的月份(2 月)卻出現(xiàn)了相反的相關(guān)性,表明:25°~30°N 海域內(nèi)21~25℃作為最適溫度計算所得的Ps 和CPUE 的正相關(guān)性成立,在25°N 以南海域,該溫度范圍下計算的Ps 與CPUE 的負(fù)相關(guān)性表明,該溫度范圍不是最適溫度范圍,隨著緯度靠南,海表水溫逐漸升高(圖11),故最適海表水溫范圍可能需要作出調(diào)整,而具體最適溫度范圍有待于后續(xù)研究。從4 月份來看,B3 和D13 海域的Ps 與CPUE 時間序列的負(fù)相關(guān)性同樣表明最適溫度范圍不適用于4 月份。只結(jié)合出現(xiàn)相關(guān)性的海域和出現(xiàn)的月份來看,可預(yù)測柔魚從卵孵化至稚仔魚的洄游路徑:1 月份集中在D9 海域(25°~30°N,130°~135°E),2 月份集中在D3 海區(qū)和D11 海域(20°~30°N,140°~145°E),4 月份集中在D13 海域(25°~30°N,150°~155°E),即隨著時間的變化,最適海表水溫分布海域發(fā)生變化(圖11),柔魚幼體從西向東洄游至150°~155°E 海域,后續(xù)進(jìn)入漁場(38°~46°N,150°~165°E)。
通過索餌場的相關(guān)性分析可以看出,從劃分方案A 至D,劃分海域不斷增多,各海域面積減小,Pf 與CPUE 時間序列出現(xiàn)顯著性的海域也不斷增多。相關(guān)性海域出現(xiàn)月份主要集中在11 月,海域主要分布在42°~46°N,150°~155°E;38°~42°N,162.5°~165°E;42°~46°N,157.5°~160°E 海域;8 月和10 月出現(xiàn)相關(guān)性海域極少。從相關(guān)性正負(fù)來看8 月和10 月均為顯著負(fù)相關(guān),11 月均為(極)顯著正相關(guān)。即8 月的15~19℃和10 月的10~13℃索餌場最適溫度范圍所占比值與CPUE 的關(guān)系為顯著負(fù)相關(guān),9 月的14~18℃索餌場最適溫度范圍所占比值與CPUE 未發(fā)現(xiàn)相關(guān)性;故各月份最適溫度范圍是否準(zhǔn)確還需繼續(xù)驗(yàn)證。因7 月、8 月和9 月出現(xiàn)相關(guān)性海域較少,很難判斷出相關(guān)性海域的空間位置隨時間的變化。
圖10 神經(jīng)網(wǎng)絡(luò)模型的模擬結(jié)果和預(yù)報準(zhǔn)確度Fig. 10 The simulation results and forecast accuracy of neural network
隨機(jī)森林模型得出的產(chǎn)卵場和索餌場重要性海區(qū)的分布可以看出,在精度平均減少值15 作為篩選標(biāo)準(zhǔn)時,產(chǎn)卵場和索餌場所得重要性海區(qū)范圍與相關(guān)性作為篩選條件所獲得的海區(qū)基本吻合,故隨機(jī)森林判定海區(qū)重要性結(jié)果的可靠性得到驗(yàn)證。若精度平均減少值為15 所得結(jié)果成立,則精度平均減少值10 作為篩選標(biāo)準(zhǔn)時,重要性海區(qū)所增加的范圍及月份同樣成立。因此,隨機(jī)森林模型可以探究產(chǎn)卵場與索餌場不同月份各海區(qū)最適海表水溫比例序列值與CPUE 序列值之間的潛在關(guān)系,從而更加詳細(xì)的推測柔魚在產(chǎn)卵期和索餌期洄游路徑的變化。根據(jù)以上研究結(jié)果,結(jié)合歷年來我國魷釣船隊(duì)在西北太平洋的實(shí)際作業(yè)分布,推測柔魚的洄游路徑,推測結(jié)果如圖12 和圖13 所示,其中箭頭的方向表示柔魚在產(chǎn)卵期和索餌期可能存在的洄游路徑。以精度平均減少值為10 作為篩選條件,隨機(jī)森林結(jié)果表明(圖12),產(chǎn)卵場海區(qū)主要集中在兩個海域,西部海域主要集中在140°E 東西海域范圍內(nèi),隨著時間從西向東移動;東部海域主要集中在160°E 東西海域范圍內(nèi),隨著時間從東向西移動。此結(jié)果與Hayase[14]推測的柔魚產(chǎn)卵場分布在143°~150.5°E、161°~165.5°E和160°~170°E海域,以及Young 和Hirota[30]所推斷的基本一致。產(chǎn)卵場重要性海區(qū)隨著時間而出現(xiàn)的空間變化趨勢為:西部產(chǎn)卵場1 月從20°~30°N,130°~135°E;25°~30°N,135°~140°E 海域,向東移動至25°~30°N,140°~150°E海域(2 月),至4 月時移動到25°~30°N,150°~155°E海域,后續(xù)進(jìn)入索餌場時會繼續(xù)向北移動。東部產(chǎn)卵場1 月和2 月主要集中在20°~30°N,165°~170°E 海域,3 月份向西移動至25°~30°N,160°~165°E;20°~25°N,155°~160°E 海域,至4 月時移動到25°~30°N,150°~155°E 海域,后續(xù)向北移動進(jìn)入索餌場。此外160°~170°E 海域仍有柔魚稚仔魚分布,且繼續(xù)向西洄游。隨機(jī)森林模型產(chǎn)卵場重要性海區(qū)相對于相關(guān)性篩選海區(qū),不僅可以更加詳細(xì)的展示產(chǎn)卵期的洄游路徑的變動,同時也揭示了東部產(chǎn)卵場的存在,具有更敏銳的判別能力。
圖11 2015 年產(chǎn)卵場1-4 月最適海表水溫分布情況Fig. 11 The distribution of the optimal sea surface temperature in the spawning grounds from January to April of 2015
圖12 精度平均減少值為10 產(chǎn)卵期各月份重要性海區(qū)篩選結(jié)果Fig. 12 The results of important sea areas in period of spawning each month under the condition that mean decrease accuracy was 10
圖13 精度平均減少值為10 索餌期各月份重要性海區(qū)篩選結(jié)果Fig. 13 The results of important sea areas in period of feeding each month under the condition that mean decrease accuracy was 10
以精度平均減少值為10 作為篩選條件,隨機(jī)森林結(jié)果表明(圖13),索餌場在8 月份與9 月份出現(xiàn)的重要性海區(qū),8 月主要集中在38°~46°N,150°~155°E和38°~42°N,155°~162.5°E 海域;9 月份38°~46°N,150°~155°E 和38°~42°N,157.5°~165°E。10 月份重要性海區(qū)較少,僅38°~42°N,150°~152.5°E 海域,從8 月、9 月和10 月精度平均減少值主要集中在10~15 之間,與上述相關(guān)性海區(qū)較少相驗(yàn)證。近幾十年,隨著海洋氣候的改變,柔魚生存海域環(huán)境也發(fā)生變化,各月最適溫度范圍8 月為15~19℃;9 月為14~18℃;10 月為10~13℃可能需要做出微調(diào)來適應(yīng)最新的氣候變化所帶來的誤差。11 月份主要集中42°~46°N,150°~157.5°E 和38°~42°N,162.5°~165°E 海域。故索餌場海區(qū)各月份主要集中42°~46°N,150°~157.5°E海域,部分分布在38°~46°N,160°~165°E 海域。
神經(jīng)網(wǎng)絡(luò)預(yù)報模型結(jié)果表明,基于相關(guān)性與隨機(jī)森林篩選出的產(chǎn)卵場和索餌場海區(qū)構(gòu)建的預(yù)報模型可以準(zhǔn)確預(yù)報柔魚資源豐度,可驗(yàn)證兩種方法下,所篩選海區(qū)的正確性。通過隨機(jī)森林模型篩選重要性海區(qū)與相關(guān)性條件下篩選出的海區(qū)比較,可以看出,所屬海區(qū)分布范圍大致相同,部分海區(qū)有差異(增加或減少),基于隨機(jī)森林構(gòu)建的神經(jīng)網(wǎng)絡(luò)模型的預(yù)報準(zhǔn)確度優(yōu)于相關(guān)性,且基于產(chǎn)卵場和索餌場構(gòu)建的模型預(yù)報準(zhǔn)確度均有提高。表明隨機(jī)森林篩選出的重要性海區(qū)的最適海表水溫范圍占該海區(qū)面積的比值與資源豐度的關(guān)系更緊密。從各模型的均方誤差來看,基于索餌場海區(qū)構(gòu)建預(yù)報模型的均方誤差明顯大于產(chǎn)卵場海區(qū)構(gòu)建的模型,而MSE 的值越小,說明預(yù)測模型的精確度越高,且更加穩(wěn)定。由于北太平洋柔魚其獨(dú)特的生物學(xué)特性,短生命周期形成其特有的資源補(bǔ)充模式,即種群資源量的大小主要取決于補(bǔ)充量,補(bǔ)充量又主要取決于早期生活史階段柔魚幼體的死亡率。從卵孵化至作為補(bǔ)充量進(jìn)入漁場前,柔魚個體洄游能力,自主選擇合適的生存海域能力較弱,可以看作是被動洄游,極易受到海洋外界因素的影響。進(jìn)入索餌期后,柔魚個體生長,游動能力增加,自主選擇合適海域的能力加強(qiáng),受制于外界環(huán)境因素的程度減弱。故基于索餌場最適海表水溫的比值Pf 構(gòu)建的預(yù)測模型精確度較低,模型不穩(wěn)定。因此,產(chǎn)卵場最適海表水溫范圍所占的比值Ps 作為輸入變量構(gòu)建模型更為可靠。