王艷艷,羅烈虎,崔相維,高永亮
(天津普澤工程咨詢有限責(zé)任公司,天津 300204)
投影尋蹤是用于處理和分析高維觀測(cè)數(shù)據(jù),尤其是來(lái)自非正態(tài)、非線性的高維數(shù)據(jù)的一類新興探索性數(shù)據(jù)分析方法?;舅枷胧抢糜?jì)算機(jī)技術(shù)把高維數(shù)據(jù)投影到低維子空間上,通過使某個(gè)投影指標(biāo)極大化(或極小化),尋找出能反映高維數(shù)據(jù)結(jié)構(gòu)和特征的投影,以達(dá)到分析處理高維數(shù)據(jù)的目的[1]。建立投影尋蹤模型一般包括以下步驟。
1.1.1 樣本評(píng)價(jià)指標(biāo)集的歸一化處理
設(shè)各指標(biāo)值的樣本集為:{x*(i,j)|i=1,…,n,j=1,…,p}。
式中 x*(i,j)為第i個(gè)樣本第j個(gè)指標(biāo)值;n、p分別為樣本的個(gè)數(shù)和指標(biāo)的數(shù)目。
為消除各指標(biāo)值的量綱和統(tǒng)一各指標(biāo)值的變化范圍,可采用式(1)進(jìn)行極值歸一化處理。
對(duì)于越大越優(yōu)的指標(biāo):
對(duì)于越小越優(yōu)的指標(biāo):
式中 xmax(j)、xmin(j)分別為第j個(gè)指標(biāo)值的最大值和最小值;x(i,j)為指標(biāo)特征值歸一化的序列。
1.1.2 構(gòu)造投影指標(biāo)函數(shù)Q(a)
投影尋蹤方法就是把p維數(shù)據(jù){x(i,j)|j=1,…,p}綜合成以a={a(1),a(2),…,a(p),}為投影方向的一維投影值z(mì)(i):
然后根據(jù){z(i)|i=1~n}的一維散布圖進(jìn)行分類。其中a為單位長(zhǎng)度向量。綜合投影指標(biāo)值時(shí),要求投影值z(mì)(i)的散布特征應(yīng)為:局部投影點(diǎn)盡可能密集,最好凝聚成若干個(gè)點(diǎn)團(tuán);而在整體上投影點(diǎn)團(tuán)之間盡可能散開。
投影指標(biāo)函數(shù)可以表達(dá)成:
式中 Sz為投影值z(mì)(i)的標(biāo)準(zhǔn)差;Dz為投影值z(mì)(i)的局部密度。即:
式中 z軃為序列{z(i)|i=1,…,n}的平均值;R為局部密度的窗口半徑,R可以根據(jù)試驗(yàn)來(lái)確定,一般可取值為0.1Sz;r(i,j)表示樣本之間的距離,r(i,j)=|z(i)-z(j)|;u(t)為一單位階躍函數(shù),當(dāng)t≥0時(shí),其值為1,當(dāng)t<0時(shí)其函數(shù)值為0。
1.1.3 優(yōu)化投影指標(biāo)函數(shù)
當(dāng)各指標(biāo)值的樣本集給定時(shí),投影指標(biāo)函數(shù)Q(a)只隨著投影方向a的變化而變化。不同的投影方向反映不同的數(shù)據(jù)結(jié)構(gòu)特征,最佳投影方向就是最大可能暴露高維數(shù)據(jù)某類特征結(jié)構(gòu)的投影方向,因此可以通過求解投影指標(biāo)函數(shù)最大化問題來(lái)估計(jì)最佳投影方向,即最大化目標(biāo)函數(shù):
以{a(j)|j=1,…,p}為優(yōu)化變量的復(fù)雜非線性優(yōu)化問題,用傳統(tǒng)的優(yōu)化方法處理較難。因此,本文應(yīng)用模擬生物優(yōu)勝劣汰與群體內(nèi)部染色體信息交換機(jī)制的基于實(shí)數(shù)編碼的遺傳算法來(lái)解決其高維全局尋優(yōu)問題。
尋找一維投影方向的基本思想是[2]:在單位超球面上隨機(jī)抽取若干個(gè)初始投影方向,計(jì)算其投影指標(biāo)的大小,根據(jù)投影指標(biāo)Q(a)選大原則,進(jìn)行遺傳算法操作,最后確定最大指標(biāo)函數(shù)值對(duì)應(yīng)的投影方向?yàn)樽顑?yōu)投影方向。遺傳算法優(yōu)化投影方向流程圖略。
對(duì)農(nóng)田控制排水體系進(jìn)行衡量,要從農(nóng)田水分利用自身的特性及其與環(huán)境、經(jīng)濟(jì)效益的關(guān)系方面入手,建立農(nóng)田控制排水評(píng)價(jià)指標(biāo)體系,以定性和定量相結(jié)合的方式對(duì)農(nóng)田控水方案進(jìn)行評(píng)價(jià)。
試驗(yàn)于2008年6月~10月在南方地區(qū)高效灌排與農(nóng)業(yè)水土環(huán)境教育部重點(diǎn)實(shí)驗(yàn)室進(jìn)行。試驗(yàn)地土壤為回填土,質(zhì)地為粘壤土,田間持水量25.28%,pH值7.78,總孔隙度45.77%,0~30mm土壤飽和含水率30.44%,土壤養(yǎng)分含量差異較小。
對(duì)水稻生長(zhǎng)最旺盛的4個(gè)生育階段進(jìn)行控水處理,試驗(yàn)在水稻受淹處理時(shí)保持了一定的滲漏量,用以模擬真實(shí)的水土環(huán)境,將滲漏量控制為2mm/d和4mm/d。試驗(yàn)在相同的條件下,對(duì)水稻分蘗期、拔節(jié)孕穗期、抽穗開花期和乳熟期進(jìn)行農(nóng)田水位控制試驗(yàn)。各個(gè)生育期內(nèi)受澇處理和受旱處理水位控制布置情況見表1。其中受澇各生育階段淹水時(shí)間為10d,淹水期間按設(shè)定的滲漏量控制;控水結(jié)束后將水層降至適宜水層上限或無(wú)淹水處理時(shí),滲漏量按2mm/d控制;CK處理在無(wú)底測(cè)坑中進(jìn)行,作為對(duì)照組;受旱控水時(shí)地下水位按控制標(biāo)準(zhǔn)保持不變,補(bǔ)水時(shí)應(yīng)通過豎管補(bǔ)充地下水;控水結(jié)束后,灌水至適宜水深上限。
水稻田間控制排水評(píng)價(jià)體系主要涉及經(jīng)濟(jì)效益、水資源高效利用和減少污染3個(gè)方面。
表1 試驗(yàn)方案 單位:mm
(1)經(jīng)濟(jì)效益方面主要考慮籽粒產(chǎn)量指標(biāo);
(2)水資源高效利用指標(biāo)主要考慮水稻耗水量;
(3)環(huán)境污染方面主要選取地表水中總磷釋放量和總氮釋放量。
該評(píng)價(jià)體系由目標(biāo)層、準(zhǔn)則層和指標(biāo)層3層構(gòu)成,其中指標(biāo)層是整個(gè)指標(biāo)體系最基礎(chǔ)的層面,由可直接度量計(jì)算的指標(biāo)構(gòu)成;準(zhǔn)則層由資源、環(huán)境和效益3個(gè)方面組成;目標(biāo)層是指標(biāo)體系的最高層,是以農(nóng)田控制排水評(píng)價(jià)優(yōu)選為總目標(biāo),用以綜合表征控水模式的優(yōu)劣[3]。
2.3.1 耗水量
為各處理全生育期的蒸發(fā)蒸騰量(ET)(mm)。
2.3.2 總磷釋放量
為各處理控水后期地表水排出的總磷量,農(nóng)田水位小于50mm的處理設(shè)定為0,地表水位超過50mm的按超出量計(jì)算總磷釋放量(kg/hm2)。
2.3.3 總氮釋放量
為各處理控水后期地表水排出的總氮量,把農(nóng)田水位小于50mm的處理得總氮釋放量設(shè)定為0,地表水位超過50mm的按超出量計(jì)算總氮釋放量(kg/hm2)。
2.3.4 籽粒產(chǎn)量
為各處理的理論籽粒產(chǎn)量,理論籽粒產(chǎn)量=單位面積有效穗數(shù)×每穗粒數(shù)×結(jié)實(shí)率×千粒重(kg/ha)。各處理指標(biāo)值見表2。
表2 各處理指標(biāo)值匯總
根據(jù)選定的評(píng)價(jià)指標(biāo)體系,將16個(gè)處理、每個(gè)生育階段及受旱處理和受澇處理的水位調(diào)控方案作為樣本進(jìn)行評(píng)價(jià)。
計(jì)算步驟采用Matlab7.0語(yǔ)言進(jìn)行編程,計(jì)算得出測(cè)坑16個(gè)控制排水方案中最大投影指標(biāo)函數(shù)值為Q*=0.0020;最佳投影方向a*=(0.3870,0.7018,0.6121,0.2329),相應(yīng)一維投影值Z=(0.8467,0.9406,0.7531,0.5787,0.9596,1.1386,1.0545,1.0077,1.5713,1.6140,1.6139,1.7319,1.7767,1.5718,1.5676,1.7176)。 最佳投影方向各分量值代表了相應(yīng)指標(biāo)對(duì)總體評(píng)價(jià)目標(biāo)貢獻(xiàn)的大小和方向,各分量所代表的指標(biāo)順序依次為:籽粒產(chǎn)量、總磷釋放量、總氮釋放量、耗水量。由于籽粒產(chǎn)量投影分量最大,認(rèn)為籽粒產(chǎn)量對(duì)總體評(píng)價(jià)目標(biāo)的貢獻(xiàn)最大,其次為總磷釋放量、總氮釋放量,耗水量對(duì)總體評(píng)價(jià)目標(biāo)的貢獻(xiàn)最小。某個(gè)方案的投影值越大,表明該方案的綜合效果越好,對(duì)各控水模式的優(yōu)劣排序即為H5>H4>H8>H2>H3>H6>H1>H7>L6>L7>L8>L5>L2>L1>L3>L4。
從評(píng)價(jià)結(jié)果看,H5是本次控水試驗(yàn)的最優(yōu)控水模式,其次為H4,最差的控水模式為L(zhǎng)4。表明對(duì)水稻全生育期而言,從資源、環(huán)境和效益統(tǒng)一的角度考慮,受旱選擇的順序?yàn)槌樗腴_花期、乳熟期、拔節(jié)孕穗期、分蘗期;受澇選擇的順序?yàn)槿槭炱?、抽穗開花期、分蘗期、拔節(jié)孕穗期。此外,從投影值可以得出,從綜合角度考慮,水稻一定范圍內(nèi)的受旱相對(duì)于受澇來(lái)說所產(chǎn)生的不利影響更小。
(1)將基于遺傳算法的投影尋蹤模型具體應(yīng)用到水稻田間控制排水方案的評(píng)價(jià)中,將多個(gè)指標(biāo)(高維數(shù)據(jù))通過尋求其映射到一維子空間的最佳投影方向,形成綜合評(píng)價(jià)指標(biāo),對(duì)排水方案進(jìn)行綜合評(píng)價(jià),避免了模糊綜合評(píng)判等方法中的專家賦權(quán)的人為干擾,最優(yōu)投影方向反映了地表水環(huán)境質(zhì)量各個(gè)因素的不同重要程度,使尋求客觀權(quán)重成為可能。
(2)通過對(duì)試驗(yàn)結(jié)果的研究,發(fā)現(xiàn)從水稻全生育期來(lái)看,綜合考慮資源、環(huán)境和效益統(tǒng)一,受旱選擇的順序?yàn)槌樗腴_花期、乳熟期、拔節(jié)孕穗期、分蘗期;受澇選擇的順序?yàn)槿槭炱?、抽穗開花期、分蘗期、拔節(jié)孕穗期。此外,從投影值可以得出,水稻一定范圍內(nèi)的受旱相對(duì)于受澇來(lái)說所產(chǎn)生的不利影響更小。
[1]李祚泳,汪嘉楊,熊建秋,等.可持續(xù)發(fā)展評(píng)價(jià)模型與應(yīng)用[M].北京:科學(xué)出版社,2007.
[2]湯成友,官學(xué)文,張世明.現(xiàn)代中長(zhǎng)期水文預(yù)報(bào)方法及其應(yīng)用[M].北京:中國(guó)水利水電出版社,2008.
[3]俞雙恩.以農(nóng)田水位為調(diào)控指標(biāo)的水稻田間灌排理論研究[D].南京:河海大學(xué),2008.
[4]殷國(guó)璽,張展羽,邵光成.農(nóng)田地表控水排水對(duì)排水中磷質(zhì)量濃度的影響[J].水利水電科學(xué)進(jìn)展,2006,26(4):24-26.
[5]陳曉東,寇傳和.水田控制排水技術(shù)的環(huán)境效益初探[J].節(jié)水灌溉,2006(4):32-36.