• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于隨機(jī)森林-投影尋蹤法的生物滯留系統(tǒng)多目標(biāo)評價方法

      2022-08-30 06:21:02程麒銘唐穎輝袁紹春
      水資源與水工程學(xué)報 2022年4期
      關(guān)鍵詞:投影介質(zhì)生物

      程麒銘, 陳 垚, 2, 劉 臻,2, 唐穎輝, 袁紹春,2

      (1.重慶交通大學(xué) 河海學(xué)院, 重慶 400074; 2.重慶交通大學(xué) 環(huán)境水利工程重慶市工程實(shí)驗(yàn)室, 重慶 400074)

      1 研究背景

      生物滯留系統(tǒng)是海綿城市建設(shè)的主要技術(shù)措施之一,其可通過植物吸收、填料過濾和微生物降解等多種作用實(shí)現(xiàn)對徑流量的削減和污染物的控制[1-2],植物與介質(zhì)土均是組成生物滯留系統(tǒng)的重要部分[3],可直接影響生物滯留系統(tǒng)的運(yùn)行性能。因此,植物和介質(zhì)土的篩選是生物滯留系統(tǒng)設(shè)計和運(yùn)行的重要考量部分[4]。由于不同植物和介質(zhì)土對生物滯留系統(tǒng)除污能力和水力性能的改善效果不盡相同,使得評價指標(biāo)數(shù)據(jù)樣本之間存在高度非線性關(guān)系,且原始實(shí)驗(yàn)數(shù)據(jù)通常具有較高的維度。研究結(jié)果表明[5],高維度、非線性數(shù)據(jù)樣本的數(shù)值分析容易造成維數(shù)災(zāi)難,導(dǎo)致計算工作量成倍增加。目前,國內(nèi)外均未形成統(tǒng)一的評價方法,通常采用層次分析法、模糊綜合評價法等[6],但此類方法存在評價結(jié)果主觀性較強(qiáng),且模型假設(shè)和概化對評價結(jié)果影響較大的問題[7]。

      為尋求更客觀、高效的多目標(biāo)綜合評價方法,研究者們嘗試采用神經(jīng)網(wǎng)絡(luò)模型(如Elman神經(jīng)網(wǎng)絡(luò)[8]、模糊神經(jīng)網(wǎng)絡(luò)[9]和BP神經(jīng)網(wǎng)絡(luò)[10])的機(jī)器學(xué)習(xí)功能實(shí)現(xiàn)對水體水質(zhì)的多目標(biāo)評價,但結(jié)果顯示評價具有偶然性而導(dǎo)致結(jié)果可信度不高。而采用貝葉斯模型[11]、基于改進(jìn)螢火蟲算法的投影尋蹤模型[12-13]等統(tǒng)計學(xué)模型,則易發(fā)生“棄真”和“取偽”的錯誤[14]。同時,上述方法還存在典型的維數(shù)災(zāi)害問題,導(dǎo)致計算量呈指數(shù)增長,甚至造成計算機(jī)無法運(yùn)行。閆佰忠等[15]采用隨機(jī)森林模型的機(jī)器學(xué)習(xí)功能對安陽市8個地下水監(jiān)測點(diǎn)的水質(zhì)檢測數(shù)據(jù)進(jìn)行處理,證實(shí)基于隨機(jī)森林模型的水質(zhì)評價模型能夠準(zhǔn)確評價水質(zhì)的同時,擁有更高訓(xùn)練效率與穩(wěn)定性。但該方法主要基于模型的分類原理,并未達(dá)到降低數(shù)據(jù)維度的目的,導(dǎo)致計算工作量較大。而基于特征選擇功能的隨機(jī)森林模型可達(dá)到數(shù)據(jù)降維的目的,在保證數(shù)據(jù)分析結(jié)果準(zhǔn)確性的同時大幅提高計算速度。為此,本文采用隨機(jī)森林(random forest,RF)模型對不同植物、介質(zhì)土下的水力性能和污染物去除率等原始數(shù)據(jù)進(jìn)行特征篩選以降低數(shù)據(jù)維度,構(gòu)建基于投影尋蹤(projection pursuit,PP)模型的多目標(biāo)綜合評價模型(RF-PP),并通過遺傳算法(genetic algorithm,GA)和粒子群算法(particle swarm optimization,PSO)對RF-PP模型進(jìn)行求解,最后將評價結(jié)果與傳統(tǒng)評價方法進(jìn)行對比分析,以驗(yàn)證本文方法的準(zhǔn)確性,從而提出一種適合生物滯留系統(tǒng)多目標(biāo)評價的方法。

      2 數(shù)據(jù)來源與研究方法

      2.1 數(shù)據(jù)來源

      表1 本研究所采用的原始數(shù)據(jù)情況

      2.2 模型原理

      (1)隨機(jī)森林特征選擇。隨機(jī)森林(RF)算法屬于機(jī)器學(xué)習(xí)算法的一種,最早由美國統(tǒng)計學(xué)家Leo Breiman提出,其可通過袋外數(shù)據(jù)誤差估計(out of bag error estimation)衡量每個數(shù)據(jù)特征對模型擬合效果的重要性,從而實(shí)現(xiàn)研究數(shù)據(jù)的特征選擇[18],具體步驟詳見文獻(xiàn)[19]、[20]。

      (2)投影尋蹤模型。投影尋蹤(PP)法是對采集到的樣本數(shù)據(jù)進(jìn)行高維處理和分析的新型統(tǒng)計學(xué)方法[21],該方法采用計算機(jī)對低維空間進(jìn)行分析,以描述高維空間的數(shù)據(jù)信息,通過對高維空間的數(shù)據(jù)再整合,并將數(shù)據(jù)引入低維子空間進(jìn)行降維處理,得到指標(biāo)量遠(yuǎn)小于樣本數(shù)據(jù)量的投影指標(biāo),從而尋找出高維樣本數(shù)據(jù)的整體特征[22-23]。在投影尋蹤模型中,投影方向代表不同的高維數(shù)據(jù)結(jié)構(gòu)或特征,其中最佳投影方向最能體現(xiàn)高維數(shù)據(jù)的結(jié)構(gòu)特征,而求解最佳投影方向就是對投影指標(biāo)函數(shù)進(jìn)行最大化尋優(yōu),具體方法詳見文獻(xiàn)[24]。本研究首先利用RF算法對原始數(shù)據(jù)進(jìn)行降維后利用PP方法進(jìn)行模型構(gòu)建,最終建立生物滯留系統(tǒng)多目標(biāo)評價RF-PP模型。

      2.3 模型求解

      由于不同評價指標(biāo)具有不同的量綱和取值范圍,為消除奇異樣本數(shù)據(jù)導(dǎo)致的不良影響,通常需要采用歸一化方法(如最大最小歸一化、Z-score歸一化、非線性歸一化等)對原始數(shù)據(jù)樣本進(jìn)行處理。根據(jù)生物滯留系統(tǒng)運(yùn)行性能越大越優(yōu)的目標(biāo),應(yīng)采用最大最小歸一化法:

      (1)

      由于投影尋蹤模型屬于非線性優(yōu)化問題,通??刹捎敏~群算法、粒子群算法、螢火蟲算法、遺傳算法等群體智能算法求解這類多極值點(diǎn)的復(fù)雜優(yōu)化問題[25-26]。其中,遺傳算法(GA)是受生物界進(jìn)化規(guī)律啟發(fā),從初始群體中隨機(jī)選擇個體,將該個體作為父級生成下一代子級,通過一系列的交叉、變異等重復(fù)步驟后,對獲得的樣本進(jìn)行適應(yīng)性驗(yàn)證,最終演化為模型最優(yōu)解,已廣泛應(yīng)用于各領(lǐng)域中求解有約束或無約束的非線性優(yōu)化問題[27-28]。粒子群算法(PSO)是受鳥群捕食行為的啟發(fā),將鳥群作為一個粒子群,將每只鳥作為一個粒子,根據(jù)各粒子自身所處的位置,將尋找食物的路徑分享給群體,通過比較路徑距離而不斷改變路徑,最終獲得最優(yōu)路徑即模型最優(yōu)解[29-31]。為了避免單一算法造成的偶然性結(jié)果,本研究采用GA和PSO兩類算法求解構(gòu)建的生物滯留系統(tǒng)多目標(biāo)評價RF-PP模型,并對多目標(biāo)評價結(jié)果進(jìn)行優(yōu)劣排序。

      3 結(jié)果分析與討論

      3.1 隨機(jī)森林法結(jié)果分析

      根據(jù)隨機(jī)森林原理編寫Python程序,運(yùn)行后得到A、B兩組數(shù)據(jù)中相關(guān)指標(biāo)重要性程度的得分情況如圖1所示,兩組數(shù)據(jù)指標(biāo)各自的相關(guān)系數(shù)如圖2所示。

      圖1 A、B兩組數(shù)據(jù)相關(guān)指標(biāo)的重要程度得分值

      圖2 A、B兩組數(shù)據(jù)指標(biāo)各自的相關(guān)系數(shù)

      3.2 投影尋蹤法結(jié)果分析

      利用MATLAB遺傳算法工具箱函數(shù),并改寫PSO工具箱函數(shù)分別運(yùn)行GA算法和PSO算法以求解本研究構(gòu)建的RF-PP模型的優(yōu)化問題[32],從而得到各指標(biāo)的最優(yōu)投影系數(shù)a=a(a1,a2,…,am),如圖3所示。投影系數(shù)a越大,則表明該系數(shù)對應(yīng)指標(biāo)對評價結(jié)果的權(quán)重越大。

      圖3 A、B兩組數(shù)據(jù)指標(biāo)的最優(yōu)投影系數(shù)

      表2 A、B兩組數(shù)據(jù)指標(biāo)的方差

      將GA和PSO兩種方法求得的最優(yōu)投影系數(shù)分別代入投影尋蹤模型中,可分別得到A組和B組不同實(shí)驗(yàn)對象的投影值,如圖4所示。A、B兩組數(shù)據(jù)不同評價方法的評價結(jié)果分別見表3、4。

      圖4 A、B兩組實(shí)驗(yàn)數(shù)據(jù)投影尋蹤模型結(jié)果

      表3 A組數(shù)據(jù)不同評價方法的評價結(jié)果

      表4 B組數(shù)據(jù)不同評價方法的評價結(jié)果

      根據(jù)本研究算法得到的結(jié)果,植物與介質(zhì)土單獨(dú)實(shí)驗(yàn)時,可以采用風(fēng)車草作為生物滯留系統(tǒng)的植物,采用RST2作為生物滯留系統(tǒng)的介質(zhì)土;但由于植物與介質(zhì)土可能存在耦合效應(yīng),因此,對于生物滯留系統(tǒng)中植物與介質(zhì)土的最優(yōu)組合仍需進(jìn)一步通過實(shí)驗(yàn)進(jìn)行驗(yàn)證。

      4 結(jié) 論

      (1)針對生物滯留系統(tǒng)多目標(biāo)評價問題的復(fù)雜性,提出了RF-PP模型,且通過對原始數(shù)據(jù)采用隨機(jī)森林進(jìn)行特征篩選降維后,在一定程度上提升了模型求解速度;但受實(shí)驗(yàn)數(shù)據(jù)樣本數(shù)所限,RF-PP模型尚不能體現(xiàn)出在避免維數(shù)災(zāi)難上的優(yōu)勢。同時利用魯棒性高、求解速度快、參數(shù)不敏感的GA與PSO算法確定的權(quán)重指標(biāo),可有效避免傳統(tǒng)求解方法參數(shù)難以確定、易陷入局部最優(yōu)解等問題,進(jìn)而得到更加合理的指標(biāo)權(quán)重,實(shí)現(xiàn)方案優(yōu)劣排序。

      (2)植物評價結(jié)果表明,風(fēng)車草為生物滯留系統(tǒng)的最佳植物,且評價結(jié)果與層次分析模型和BP神經(jīng)網(wǎng)絡(luò)模型方法相似;介質(zhì)土評價結(jié)果表明,RST2(9.8%壤砂土+88.2%細(xì)砂+2.0%蛭石)為生物滯留系統(tǒng)的最佳介質(zhì)土配置方案,且評價結(jié)果與傳統(tǒng)投影尋蹤法相似。本研究利用GA和PSO算法求解RF-PP模型具有一定的可行性和適用性,可為生物滯留系統(tǒng)多目標(biāo)評價研究提供一定的參考和借鑒。

      (3)本研究得出的最佳植物與最佳介質(zhì)土組合后可能存在耦合效應(yīng),未來可進(jìn)一步通過植物與介質(zhì)土組合實(shí)驗(yàn)研究,選取更佳的組合方式。

      猜你喜歡
      投影介質(zhì)生物
      生物多樣性
      信息交流介質(zhì)的演化與選擇偏好
      生物多樣性
      上上生物
      解變分不等式的一種二次投影算法
      基于最大相關(guān)熵的簇稀疏仿射投影算法
      淬火冷卻介質(zhì)在航空工業(yè)的應(yīng)用
      第12話 完美生物
      航空世界(2020年10期)2020-01-19 14:36:20
      找投影
      找投影
      陕西省| 龙泉市| 衡水市| 辉南县| 临澧县| 乌苏市| 南雄市| 博兴县| 湖口县| 武城县| 刚察县| 哈尔滨市| 上饶市| 门源| 贵定县| 进贤县| 绥芬河市| 通州区| 定襄县| 周宁县| 塔河县| 奉节县| 从化市| 商水县| 建德市| 茂名市| 蒙阴县| 新竹县| 府谷县| 芒康县| 青神县| 舞阳县| 库尔勒市| 皋兰县| 喜德县| 新余市| 郸城县| 固阳县| 双柏县| 滨州市| 平远县|