• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    BAS-RF組合算法在大壩水平位移預(yù)測中的應(yīng)用

    2022-09-09 01:45:34劉立龍梁月吉黃順謀陳金磊
    無線電工程 2022年9期
    關(guān)鍵詞:天牛決策樹步長

    張 炎,劉立龍*,梁月吉,徐 勇,黃順謀,陳金磊

    (1.桂林理工大學(xué) 測繪地理信息學(xué)院,廣西 桂林 541006;2.廣西空間信息與測繪重點實驗室,廣西 桂林 541006;3.鄭州騰飛建設(shè)工程集團有限公司,河南 鄭州 450000)

    0 引言

    攔蓄水流的大壩通常可以帶來顯著的經(jīng)濟效益,然而一旦發(fā)生決堤事件,將會嚴(yán)重損害大壩周邊人民的生命財產(chǎn)安全,實時掌握大壩的變形規(guī)律并做好預(yù)測至關(guān)重要[1]。經(jīng)過長期的大壩監(jiān)測研究發(fā)現(xiàn),影響大壩變形的因素主要有氣候、庫水位、材料特性、時效和溫度等,其中溫度、時效和庫水位占比重最大[2]。大壩位移是大壩變形的直接體現(xiàn),其具備高度的非線性與隨機性,傳統(tǒng)的預(yù)測方法難以滿足現(xiàn)今大壩變形監(jiān)測的高精度要求[3]。隨著大壩監(jiān)測模式的不斷改變,組合預(yù)測模型越來越多地應(yīng)用到大壩變形監(jiān)測領(lǐng)域中。陳波等[4]提出采用瑞利分布構(gòu)造滯后函數(shù),分析了大壩變形受到模擬寒區(qū)復(fù)雜溫度荷載的影響,構(gòu)建了考慮溫度連續(xù)滯后效應(yīng)和幅值削減效應(yīng)的寒區(qū)混凝土壩變形預(yù)測預(yù)報模型。馬廣臣等[5]通過動態(tài)權(quán)重粒子群算法——自適應(yīng)模糊神經(jīng)網(wǎng)絡(luò)組合法來構(gòu)建大壩變形預(yù)測模型,利用改進粒子群算法對自適應(yīng)模糊神經(jīng)網(wǎng)絡(luò)中模糊層的適應(yīng)度值進行參數(shù)尋優(yōu),使預(yù)測模型的穩(wěn)定性得到加強。胡清義等[6]采用將IDE應(yīng)用于優(yōu)選對OSVR中的懲罰參數(shù)和核參數(shù),引入的自適應(yīng)因子對基本差分進化算法進行改進,建立了壩體、壩基位移與材料參數(shù)的非線性關(guān)系,從而得到壩體及壩基變形模型。目前所提及的生物智能算法參數(shù)尋優(yōu)存在運算效率較低且參數(shù)設(shè)置較為復(fù)雜的問題,需要進一步改進。

    本文提出利用天牛須搜索(Beetle Antennae Search,BAS)算法優(yōu)化隨機森林(Random Forest,RF)算法來建立大壩水平位移預(yù)測模型。RF算法在許多領(lǐng)域已得到廣泛的應(yīng)用,其具備抗過擬合和預(yù)測精度高的優(yōu)勢。利用計算量低且運算速度快的BAS優(yōu)化算法來為RF回歸算法選取參數(shù)最優(yōu)解,能夠近一步提高模型預(yù)測的精準(zhǔn)性。將改進后的模型應(yīng)用于大壩水平位移的預(yù)測中,并與傳統(tǒng)的預(yù)測模型進行對比,驗證其穩(wěn)定性及現(xiàn)實性。

    1 天牛須搜索算法

    2017年,Jiang等[7]提出了一種新的生物智能算法——BAS算法,也稱為甲殼蟲須搜索算法。天牛在覓食的過程中,主要是根據(jù)左右觸須接收的信息來判別目標(biāo)具體方位及距離,與蜂群算法、灰狼算法等相比,該算法僅需要一個獨立個體,參數(shù)少、計算簡單、搜尋速度較快[8-9]。具體過程是:天牛通過左右雙須可以同時接收到食物散發(fā)氣味的濃度,如果左觸須收集到的食物氣味的濃度高于右觸須,則天牛向左觸須提供的方向移動,反之,則向右觸須提供的方向移動。整個過程實質(zhì)上就是尋找散發(fā)氣味最濃的食物的具體位置[7]。搜索過程如圖1所示。

    圖1 天牛搜尋食物過程Fig.1 Process of longhorn beetles searching for food

    根據(jù)天牛搜尋食物的過程,可以總結(jié)出天牛搜索算法的關(guān)鍵步驟:(1)根據(jù)天牛在現(xiàn)實中覓食的行為可以模擬出在虛擬世界中天牛在多維空間中計算函數(shù)極值的結(jié)果情況;(2)盡管實際天牛的左右兩須長度不一,虛擬天牛必須保持左右兩須相互對稱;(3)天牛覓食過程中,身體前進方向具備隨機性,且移動距離與左右觸須間距離成比例。具體過程如下:

    ① 確定隨機方向

    天牛在搜尋食物的過程中,前進的方向是隨機的,左右兩須所指方向也具備不確定性,則其前進方向向量可以表示為:

    (1)

    式中,n為空間維數(shù);rand(·)為隨機方向。

    ② 確定天牛左右須的空間坐標(biāo)

    通過天牛覓食的行為來模仿天牛觸須情況以確定左右須坐標(biāo),表示為:

    (2)

    式中,xl為左須指定坐標(biāo);xr為右須指定坐標(biāo);xt為在迭代第t次時天牛所處的具體位置;Lt為第t次迭代時天牛兩須之間的距離。

    ③ 選定適應(yīng)度函數(shù)表達式

    (3)

    式中,f(·)為適應(yīng)度函數(shù);fl,fr分別為天牛的左、右兩須的適應(yīng)度函數(shù),對于待優(yōu)化的函數(shù)值f,判斷左右兩須的值的大?。?/p>

    若fl

    若fl>fr,則天牛朝著右須的方向前進距離s,即x=x-s×normal(xl-xr)。

    綜上情況,可以將以上2種情況采用符號函數(shù)sign統(tǒng)一寫成:

    x=x-s×normal(xl-xr)×sign(fl-fr),

    (4)

    式中,normal為歸一化函數(shù),可進一步表示為:

    x=x-s×a×sign(fl-fr)。

    (5)

    ④ 確定下一次迭代時天牛的前進距離及方向

    在迭代搜尋的過程中,步長隨著迭代次數(shù)的增加也在隨之改變,從而確保最大范圍搜索到氣味濃度最大的食物的位置,可以表示為:

    xt=xt-1+st×a×sign(fl-fr),

    (6)

    式中,st為迭代第t次的步長。

    天牛在搜尋食物的過程中,天牛的行進步長s與兩須之間的距離L0之間的比值是個固定常數(shù),即:

    s=c×L0,

    (7)

    式中,c為步長因子,c∈[0,1],通常可取c=0.95,則:

    st=0.95×st-1+0.01。

    (8)

    在天牛算法尋優(yōu)的過程中,剛開始,為保證全局范圍內(nèi)尋優(yōu),避免陷入局部最優(yōu),搜索步長應(yīng)足夠大,在搜索尋優(yōu)后期,隨著迭代次數(shù)的增加,步長將隨之逐步減小。為提高算法的收斂速度,當(dāng)?shù)趇次的適應(yīng)度值fi小于當(dāng)前的最佳適度值fm,步長調(diào)節(jié)機制可以改進如下:

    (9)

    式中,θ∈[0,2],為隨機選取的常數(shù)。當(dāng)fi大于歷史最佳適度值fm時,則步長因子為c,否則,步長因子為g。通過不斷減小步長因子來提高算法尋優(yōu)的收斂速度,使適應(yīng)度值逐漸穩(wěn)定于最佳值。

    2 隨機森林算法

    RF算法是Breiman等提出的一種由Bagging和分類回歸樹(Classification and Regression Tree,CART)相結(jié)合的分類回歸模型[10]。在訓(xùn)練集中利用bootstrap重抽樣技術(shù)來隨機抽取樣本集,其中決策樹是通過二分遞歸分割技術(shù)將樣本集進行一分為二的分割,引入袋裝法和特征子空間法來對訓(xùn)練樣本集進行抽樣,在促進決策樹生長的過程中,毫無約束、最大限度地成長,最終多棵決策樹組成RF分類器,對數(shù)據(jù)訓(xùn)練集進行分類預(yù)測,將預(yù)測均值作為最終預(yù)測結(jié)果[11]。彌補決策樹單一分類器所存在的易陷入局部最優(yōu)及預(yù)測結(jié)果存在偶然性的缺陷。

    2.1 CART決策樹

    在RF算法中,各個單一決策樹之間毫無關(guān)聯(lián),獨立存在,所以分節(jié)點處的特征值均是隨機抽取的[12]。在決策樹分枝的過程中,主要是通過最小信息化原則依據(jù)每個子節(jié)點上的基尼不純度平均減小值來劃分出最佳分類特征,依次分枝形成下一個子節(jié)點,最終建立無約束的回歸模型樹。針對分類問題,CART使用基尼指數(shù)(Gini)作為評判標(biāo)準(zhǔn),若有n棵樹,則:

    (10)

    式中,Gini為基尼指數(shù);i為特征分類數(shù)量;Pi為目前特征類別的概率;1-Pi為特征樣本特征歸類錯誤的概率。由式(10)可以看出,特征分類越平均,Gini的值越大;分類越不均勻,Gini值越小。

    對于回歸問題,在n個節(jié)點分枝成為2個節(jié)點之后,Gini將趨近于最小化,則該特征值對應(yīng)的Gini為:

    |Gini|=min[min∑(wi-b1)2+∑(wi-b2)2],

    (11)

    式中,在分枝為2個節(jié)點處的樣本集y1,y2中,wi為輸入樣本;b1,b2分別為2個樣本的輸出均值。

    2.2 參數(shù)的選取

    在利用RF建模的過程中,盡管算法會受到眾多參數(shù)的影響,但其中能夠決定模型預(yù)測精度及穩(wěn)定性的主要參數(shù)是決策樹的個數(shù)和分裂屬性個數(shù),常用ntree和mtry表示。ntree的值越大,預(yù)測過擬合的效果越小,一般不小于100。mtry是指決策樹在進行分裂時所生成的節(jié)點數(shù)量,其值越大,則子模型間的差異越小[13]。目前,常規(guī)RF算法中常利用人工經(jīng)驗、網(wǎng)格搜索的方法進行RF參數(shù)的標(biāo)定,所提供的參數(shù)在訓(xùn)練過程中難以達到擬合結(jié)果最佳的效果。引入BAS算法來進行RF模型參數(shù)調(diào)優(yōu),進一步來提高RF模型的預(yù)測精度。

    2.3 BAS-RF預(yù)測模型構(gòu)建

    由混凝土大壩結(jié)構(gòu)成因分析,大壩產(chǎn)生水平位移主要受溫度、水壓和時效的影響,從而產(chǎn)生變形、裂縫、滑動力和滲流等現(xiàn)象[14]。這些因素之間呈現(xiàn)出非線性關(guān)系,傳統(tǒng)的預(yù)測模型有時會受到多重共線性的影響,最終的預(yù)測效果難以達到實際工程的要求[15]。本文提出利用RF方法來解決多重變量間的交互作用,考慮到RF算法的預(yù)測精度受到?jīng)Q策樹個數(shù)和分類屬性個數(shù)的影響,進而引入天牛尋優(yōu)算法進行參數(shù)優(yōu)化,最終利用BAS-RF組合算法來構(gòu)建大壩水平位移預(yù)測模型,具體步驟如下:

    ① 利用統(tǒng)計學(xué)方法對收集的大壩水平位移監(jiān)測數(shù)據(jù)進行初步處理,剔除存有缺陷的數(shù)據(jù),保證參與實驗數(shù)據(jù)的可靠性,并將數(shù)據(jù)集分為訓(xùn)練集和測試集,進行歸一化;

    ② 初始化BAS算法的參數(shù),設(shè)定步長因子、最大迭代次數(shù)和天牛的初始位置;

    ③ 選定BAS參數(shù)優(yōu)化中的適應(yīng)度函數(shù),分析理解ntree,mtry與均方根誤差之間的函數(shù)關(guān)系來構(gòu)建BAS算法的適應(yīng)度函數(shù),具體如下:

    (12)

    ④ 確定天牛初始的位置,首先需要計算出天牛左右須的適應(yīng)度函數(shù)值f(xl)和f(xr),比較保留記錄最佳函數(shù)值的天牛位置;

    ⑤ 更新迭代天牛的位置,對左右須收集到的氣味濃度進行比較,獲取最佳食物氣味濃度的傳播方向,選定前進方向的步長值,計算出天牛下一次所到達的位置;

    ⑥ 根據(jù)設(shè)定的最大迭代次數(shù)或預(yù)先設(shè)定的適應(yīng)函數(shù)值的理想精度是否達到,判斷之后的操作,若滿足要求,則參數(shù)輸出進行下一步,否則重新迭代更新天牛位置,繼續(xù)參數(shù)尋優(yōu)過程;

    ⑦ 獲取迭代結(jié)束輸出的最佳參數(shù)值,將其帶入RF預(yù)測模型中,計算輸出預(yù)測值,進行精度評定分析。具體的操作流程如圖2所示。

    圖2 BAS-RF預(yù)測模型流程Fig.2 BAS-RF prediction model flowchart

    3 實驗分析

    3.1 數(shù)據(jù)來源

    本文數(shù)據(jù)選擇的是豐滿大壩30號壩段1985年1月—1988年7月的壩頂水平位移及同期溫度、時效以及庫水位的監(jiān)測數(shù)據(jù)[16]。豐滿大壩壩頂全長1 080 m,其中最大的壩高91.7 m,壩頂高程加固后為267.7 m。大壩共有60個壩段,左右兩邊有37個壩段,11個溢流壩段,11個廠房取水壩段和1個過渡壩段,每個壩段的長度均為18 m,最大壩基寬度65 m,壩頂寬度9.0~13.5 m。將所選用的30號壩的200組監(jiān)測數(shù)據(jù)中的150組作為訓(xùn)練樣本集用于預(yù)測模型建立,50組數(shù)據(jù)作為訓(xùn)練模型的檢測。大壩水平位移序列如圖3所示 。

    圖3 大壩水平位移序列Fig.3 Horizontal displacement sequence of the dam

    大壩水平位移變形主要受溫度、時效和水壓的影響,即:

    δ=δθ+δT+δH,

    (13)

    式中,δθ為時效分量;δT為溫度分量;δH為水壓分量。

    根據(jù)文獻[17]通過屬性約簡和重要性評價結(jié)果選定時效分量(θ,lnθ),溫度分量(sin(2πt/365),sin(4πt/365),cos(2πt/365),cos(4πt/365))和水壓分量(H,H2,H3),共9項影響因子作為輸入量,大壩水平位移作為輸出值。

    針對RF算法中參數(shù)的選擇,傳統(tǒng)RF算法中選用網(wǎng)格搜索法來尋找ntree和mtry兩個參數(shù),最終的預(yù)測效果往往難以達到理想值。本文引入BAS算法來進行參數(shù)優(yōu)化,建立大壩水平位移預(yù)測模型,相較于常規(guī)方法,預(yù)測結(jié)果更為穩(wěn)定。

    3.2 網(wǎng)格搜索尋參

    網(wǎng)格搜索算法(Grid Search Algorithm,GSM)是一種通過遍歷給定的參數(shù)組合來優(yōu)化模型表現(xiàn)的方法,是常規(guī)RF算法中尋找參數(shù)的常用方法[18]。其將所有參數(shù)可能存在的值進行排列分組,并將所有的組合利用網(wǎng)格的形式呈現(xiàn)出來,全部用于RF模型的參數(shù)值,利用訓(xùn)練數(shù)據(jù)構(gòu)建模型,選出預(yù)測效果最優(yōu)的模型所對應(yīng)的參數(shù)值即為所尋找的最適參數(shù)值[19]。對于RF算法中的ntree和mtry兩個參數(shù),分別將其尋優(yōu)區(qū)間設(shè)置為[10,800]和[1,15],且尋優(yōu)間隔為4和1,選擇均方根誤差作為評判的目標(biāo)函數(shù),從而獲取RF算法中的參數(shù)值。

    3.3 天牛搜索尋參

    在利用BAS算法進行優(yōu)化尋參時,最大迭代次數(shù)設(shè)置為100,維數(shù)為2,天牛初始步長為1,步長衰減因子為0.95,且確定ntree,mtry和均方根誤差值間的函數(shù)關(guān)系,設(shè)定兩參數(shù)的取值區(qū)間分別為[10,800]和[1,15]。通過選定的訓(xùn)練數(shù)據(jù)集通過BAS算法優(yōu)化迭代選定出最優(yōu)解,如圖4所示。當(dāng)?shù)螖?shù)達到15之后,目標(biāo)函數(shù)達到最小值,此時的均方根誤差為0.534 mm。

    圖4 天牛迭代尋參Fig.4 Longhorn beetles iterative search for parameters

    3.4 預(yù)測精度分析

    為了驗證BAS-RF預(yù)測模型的優(yōu)越性,本實驗分別利用BP,LSSVM,RF及BAS-RF四種方法來建立大壩水平位移預(yù)測模型,其中通過GSM和天牛搜尋算法為RF算法建模所提供的參數(shù)分別為(171,1)和(155,1),2種算法最終選定的參數(shù)相差不大,但GSM在尋參的過程中迭代的次數(shù)為1 213,尋參時長要遠遠大于天牛搜索算法,表明天牛搜索算法收斂速度更快。在4種方法建立大壩水平位移預(yù)測模型后,將選定的測試集輸入各個預(yù)測模型進行精度檢驗,獲取其預(yù)測曲線,如圖5~圖8所示。

    圖5 RF建模預(yù)測結(jié)果Fig.5 RF modeling prediction results

    圖6 BP建模預(yù)測結(jié)果Fig.6 BP modeling prediction results

    圖7 LSSVM建模預(yù)測結(jié)果Fig.7 LSSVM modeling prediction results

    圖8 BAS-RF建模預(yù)測結(jié)果Fig.8 BAS-RF modeling prediction results

    利用150組訓(xùn)練集數(shù)據(jù)建立水平位移預(yù)測模型,并通過50組測試集數(shù)據(jù)進行檢測,獲得4種預(yù)測模型的大壩水平位移預(yù)測曲線圖。其中,利用BP神經(jīng)網(wǎng)絡(luò)法所構(gòu)建模型的預(yù)測值與檢測值間的曲線吻合度最低,表明傳統(tǒng)BP神經(jīng)算法構(gòu)建預(yù)測模型的穩(wěn)定性仍需進一步提升。相比于BP神經(jīng)網(wǎng)絡(luò)算法、LSSVM和RF三種方法,BAS-RF組合算法構(gòu)建的大壩水平位移預(yù)測模型的曲線走勢與測試集曲線圖最為接近,相差最小。為更加清晰地展現(xiàn)4種模型預(yù)測結(jié)果與真值間誤差的變化及整體波動范圍,繪制出模型預(yù)測誤差變化曲線,如圖9所示。

    圖9 4種方法的殘差結(jié)果Fig.9 Residual results of the four methods

    由圖9可以看出,4種預(yù)測模型的擬合誤差曲線的波動范圍均為-3~3 mm,擬合效果較為理想。相較于BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型,LSSVM預(yù)測模型與RF預(yù)測模型的誤差變化范圍較為接近,其波動范圍要略小于BP神經(jīng)網(wǎng)絡(luò)。而通過天牛須算法優(yōu)化后的RF算法構(gòu)建預(yù)測模型的誤差范圍最小,大致處于-1~1 mm,其預(yù)測精度明顯要優(yōu)于其他3種預(yù)測模型,穩(wěn)定性相較于常規(guī)RF也得到提升。為了進一步比較分析4種預(yù)測模型的預(yù)測精度,分別計算出各個模型預(yù)測結(jié)果的誤差變化區(qū)間、均方差、均方根誤差和平均絕對誤差來作為模型預(yù)測精度的評定參數(shù),如表1所示。

    表1 4種模型預(yù)測精度統(tǒng)計

    由表1可以看出,相比于其他3種預(yù)測模型,BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測結(jié)果誤差變化區(qū)間為[-2.274,2.075],波動范圍較大,且均方根誤差為1.086 mm,要明顯大于RF和LSSVM所構(gòu)建的預(yù)測模型,說明傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)構(gòu)建預(yù)測模型的穩(wěn)定性及精確度需要進一步提高。RF算法和LSSVM算法建模的預(yù)測誤差區(qū)間、均方差等比較接近,其模型預(yù)測效果也較為理想,但精度不高,結(jié)合圖5和圖7可知,二者局部范圍波動較大,誤差值也隨之明顯變大,可能出現(xiàn)了局部最優(yōu)的問題。經(jīng)過BAS優(yōu)化后的RF能夠提高收斂速度,且避免在后期迭代的過程中陷入局部最優(yōu),能夠全局搜索參數(shù)最優(yōu)值,從而提高模型大壩水平位移預(yù)測精度。因此BAS-RF能夠較好地處理大壩水平位移與影響因子之間的非線性關(guān)系,具有一定的適用性。

    4 結(jié)束語

    針對當(dāng)前大壩水平位移預(yù)測模型精準(zhǔn)度及穩(wěn)定性存在的不足,引入生物智能組合算法來構(gòu)建預(yù)測模型,并與常規(guī)模型進行對比,具體結(jié)論如下:

    ① 提出一種BAS算法與RF算法相結(jié)合的建模預(yù)測方法,將其應(yīng)用于大壩水平位移預(yù)測中,可以快速地提取出RF算法的最佳參數(shù),解決了該算法建模難以確定最適參數(shù)的問題。

    ② 通過實訓(xùn)數(shù)據(jù),與傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)算法、最小二乘支持向量機算法、RF算法構(gòu)建預(yù)測模型進行比較分析,驗證了該組合算法在大壩水平位移預(yù)測中具有較高的擬合精度,其尋參速度及預(yù)測精度也得到了明顯提升,為以后的大壩水平位移預(yù)測提供一定的參考。

    猜你喜歡
    天牛決策樹步長
    基于Armijo搜索步長的BFGS與DFP擬牛頓法的比較研究
    天牛到底有多牛
    一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
    黑黃花天牛
    巨型昆蟲——天牛
    決策樹和隨機森林方法在管理決策中的應(yīng)用
    電子制作(2018年16期)2018-09-26 03:27:06
    基于決策樹的出租車乘客出行目的識別
    天牛
    基于逐維改進的自適應(yīng)步長布谷鳥搜索算法
    基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
    孝义市| 榕江县| 南部县| 平邑县| 汉沽区| 松溪县| 北宁市| 民县| 博罗县| 大埔区| 大庆市| 英吉沙县| 罗源县| 砚山县| 丹东市| 左贡县| 金乡县| 门头沟区| 读书| 遵义市| 报价| 林芝县| 曲阳县| 辽中县| 汾阳市| 雷波县| 泽普县| 承德县| 盈江县| 惠安县| 鄂温| 当涂县| 漳平市| 毕节市| 志丹县| 余庆县| 高州市| 克什克腾旗| 黔东| 大兴区| 津市市|