• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于分位數(shù)回歸的煤炭發(fā)熱量預測

      2022-08-13 08:01:10趙先枝陳軍林
      工礦自動化 2022年7期
      關(guān)鍵詞:發(fā)熱量煤質(zhì)因變量

      趙先枝, 陳軍林

      (1. 內(nèi)蒙古煤炭地質(zhì)勘查(集團)一五三有限公司,內(nèi)蒙古 呼和浩特 010010;2. 中國地質(zhì)大學(北京) 地球科學與資源學院,北京 100083))

      0 引言

      煤炭發(fā)熱量是評價煤質(zhì)的關(guān)鍵指標,對于煤炭利用、煤炭價值評估等非常重要[1]。精確的煤炭發(fā)熱量數(shù)據(jù)需要通過實驗測試得到,但煤炭發(fā)熱量的實驗測定在當前技術(shù)條件下較繁瑣、耗時且昂貴[2]。在對煤炭發(fā)熱量精度要求不高的情況下,通常通過建立數(shù)學模型,利用測試相對廉價且容易獲取的指標來預測煤炭發(fā)熱量。在煤炭發(fā)熱量預測方面,前人提出了線性回歸[3-4]、BP神經(jīng)網(wǎng)絡[5]、支持向量回歸[6-7]等方法。其中實際應用最廣泛的是線性回歸,該方法模型簡單、計算快速,但存在以下問題:對于非線性數(shù)據(jù)擬合能力欠佳,難以表達較為復雜的自變量和因變量關(guān)系;需要數(shù)據(jù)服從特定的分布假設;對異常值敏感。

      分位數(shù)回歸是Roger Koenker和Gilbert Bassett于1978年提出的一種回歸分析方法[8],經(jīng)過不斷發(fā)展形成了線性分位數(shù)回歸、神經(jīng)網(wǎng)絡分位數(shù)回歸、分位數(shù)回歸森林等方法。分位數(shù)回歸具有如下優(yōu)點:不需要對數(shù)據(jù)做任何的分布假定;具有對異常點不敏感的特征;模型比較穩(wěn)??;能夠給出比傳統(tǒng)回歸分析更豐富的預測結(jié)果;可用來研究自變量與因變量之間的關(guān)系。目前關(guān)于分位數(shù)回歸在煤炭發(fā)熱量預測方面的應用研究較少。本文采用線性分位數(shù)回歸和分位數(shù)回歸森林2種分位數(shù)回歸分析方法對煤炭發(fā)熱量進行預測,分析各預測變量對結(jié)果變量的影響,并與傳統(tǒng)線性回歸方法進行對比,分析不同回歸分析方法在煤炭發(fā)熱量預測中的效果。

      1 數(shù)據(jù)介紹

      為建立可靠的數(shù)學模型,需要充足的數(shù)據(jù)來進行回歸模型訓練和測試。美國地質(zhì)調(diào)查局的COALQUAL(https://ncrdspublic.er.usgs.gov/coalqual/)煤炭質(zhì)量數(shù)據(jù)庫[9]包含了美國25個州的煤質(zhì)樣品測試數(shù)據(jù),數(shù)據(jù)量大且煤質(zhì)分析指標較全面,可以公開使用。本文從該數(shù)據(jù)庫中選取煤質(zhì)工業(yè)分析數(shù)據(jù)和元素分析數(shù)據(jù)組成數(shù)據(jù)集,考慮到實際應用中更多地使用工業(yè)分析數(shù)據(jù)進行發(fā)熱量計算,選取煤炭的全水分Mt、灰分Asd、揮發(fā)分Vad3個工業(yè)分析指標來進行回歸分析,計算低位發(fā)熱量Qnet,ad。

      數(shù)據(jù)集中一些數(shù)據(jù)存在空值、異常值等問題,因此在回歸分析之前,需要進行數(shù)據(jù)預處理,剔除包含空值的數(shù)據(jù),刪除明顯在正常煤質(zhì)指標范圍之外的異常數(shù)據(jù)。經(jīng)過數(shù)據(jù)預處理得到4 540個煤質(zhì)樣品測試數(shù)據(jù),其中80%的數(shù)據(jù)用來訓練回歸模型,其余數(shù)據(jù)用來測試回歸模型。

      2 方法原理

      2.1 線性回歸

      線性回歸方程為

      式中:yi為第i(i=1,2,…,n,n為樣本個數(shù))個樣本的因變量; β0為常數(shù)項; βj為第j(j=1,2,…,p,p為自變量個數(shù))個自變量的回歸系數(shù);xij為第i個樣本的第j個自變量。

      通過已知的自變量和因變量求解式(1)中的常數(shù)項和回歸系數(shù),得到自變量和因變量之間的函數(shù)關(guān)系,利用該函數(shù)關(guān)系可對新的樣本進行預測。

      2.2 線性分位數(shù)回歸

      線性分位數(shù)回歸是線性回歸的擴展,其方程與線性回歸方程相似:

      式中:τ為分位點,取值范圍為0~1;Qτ(yi)為因變量yi的τ分位數(shù)估計值; β0(τ)為 常數(shù)項; βj(τ)為第j個自變量的τ分位數(shù)回歸系數(shù)。

      通過使中值絕對偏差達到最小來找到最佳的分位數(shù)回歸線。

      式中:M為中值絕對偏差; ρτ為檢查函數(shù)。

      檢查函數(shù)根據(jù)誤差的分位數(shù)和符號(正或負)為誤差賦予不對稱權(quán)重。

      式中μ為單個數(shù)據(jù)點的誤差。

      傳統(tǒng)線性回歸分析預測的結(jié)果是因變量的條件期望,分位數(shù)回歸的預測結(jié)果則是因變量的條件分位數(shù),不同分位點對應不同的條件分位數(shù)估計值[10],多個條件分位數(shù)估計值構(gòu)成了因變量的條件概率分布[11]。

      2.3 分位數(shù)回歸森林

      由線性回歸擴展得到的線性分位數(shù)回歸能處理的問題有限,預測結(jié)果往往精度不高。近年來有許多學者將分位數(shù)回歸思想應用到機器學習算法中[12-14],如將分位數(shù)回歸與隨機森林[15]結(jié)合,形成了分位數(shù)回歸森林方法。該方法繼承了隨機森林算法抗過擬合能力強、穩(wěn)定性高、無需復雜調(diào)參、可處理非線性回歸問題等優(yōu)點。其計算過程如下:

      (1) 生成多棵決策樹,存儲每棵決策樹每個葉節(jié)點的所有觀測值。

      (2) 給定觀測變量x,遍歷所有決策樹,計算每棵決策樹觀測值的權(quán)重wi(x)。

      (3) 對于所有y∈R,利用權(quán)重wi(x)計算分布函數(shù)的估計:

      式中:X為自變量矩陣;I(·)為示性函數(shù);Y為決策樹節(jié)點上的因變量觀測值。

      (4) 計算條件分位數(shù)的估計值:

      式中inf{·}為取下限函數(shù)。

      3 結(jié)果及分析

      回歸模型需要先確定輸入變量集,以確保所使用的自變量能夠反映因變量的變化,同時自變量之間能夠排除多重共線性。不同自變量之間及其與發(fā)熱量之間的關(guān)系可用相關(guān)系數(shù)(表1)來表示。從表1可看出,Mt與Qnet,ad之間的相關(guān)性很高,且呈負相關(guān),說明該指標是回歸分析預測發(fā)熱量的主要指標。而Vad,Asd與Qnet,ad的相關(guān)系數(shù)均較小,說明這2個指標對于發(fā)熱量預測的重要性遠低于Mt。Mt,Vad,Asd3個預測變量之間的相關(guān)性也較小,則可同時使用Mt,Vad,Asd來構(gòu)建回歸模型。因此,發(fā)熱量預測模型以Mt,Vad,Asd為預測變量,以Qnet,ad為結(jié)果變量。

      表1 煤質(zhì)參數(shù)相關(guān)系數(shù)Table 1 Correlation coefficients of coal quality parameters

      利用訓練數(shù)據(jù)訓練線性回歸模型,得到回歸方程:Qnet,ad=37.736-0.087Vad-0.647Mt-0.387Asd。對線性回歸方程進行檢驗,得到方差膨脹因子小于10,表明自變量之間不存在多重共線性,且回歸方程F檢驗顯示回歸效果顯著。

      用測試數(shù)據(jù)對訓練好的線性回歸模型進行驗證。選取9個分位點(τ=0.1~0.9),利用R語言軟件包quantreg,quantregForest分別執(zhí)行線性分位數(shù)回歸、分位數(shù)回歸森林,采用均方誤差、平均絕對誤差、均方根誤差和決定系數(shù)4個指標來評價回歸分析結(jié)果,得到不同回歸模型評價結(jié)果,見表2。

      表2 不同回歸模型評價結(jié)果Table 2 Evaluation results of different regression models

      從表2可看出,不同回歸分析方法得到的結(jié)果有一定差別,但決定系數(shù)均在0.96以上(τ= 0.5時),說明用Mt,Vad,Asd3個指標來預測煤炭低位發(fā)熱量是可行的,能夠得到較為可信的發(fā)熱量預測值。分位數(shù)回歸森林方法的預測誤差隨分位點增大呈先減小后增大趨勢,在τ= 0.5處預測誤差最小,且決定系數(shù)最大達0.984,預測效果優(yōu)于線性回歸和線性分位數(shù)回歸方法。

      不同回歸分析方法下回歸擬合線如圖1所示??煽闯鼍€性回歸擬合線為1條,且穿過數(shù)據(jù)點分布范圍的中心,反映的是數(shù)據(jù)點的平均趨勢,但僅1條線無法限定數(shù)據(jù)點的分布范圍;分位數(shù)回歸擬合線為多條,大部分數(shù)據(jù)點分布在τ= 0.1和τ= 0.9對應的2條擬合線之間的范圍內(nèi)(未包括在該范圍內(nèi)的數(shù)據(jù)點為異常點)。由此可知,線性回歸給出的預測值是1個均值,而通過分位數(shù)回歸能夠給出預測值的范圍,在評估煤質(zhì)時更具有實際意義。

      圖1 不同回歸分析方法下回歸擬合線Fig. 1 Regression fitting lines under different regression analysis methods

      通過線性分位數(shù)回歸可計算出不同分位點對應的回歸系數(shù),見表3。

      為研究不同預測變量對結(jié)果變量的影響,根據(jù)表3可得線性分位數(shù)回歸系數(shù)隨分位點變化曲線,如圖2所示??煽闯鯩t回歸系數(shù)隨分位點增大呈增大趨勢,其絕對值則越來越小,說明Mt對低發(fā)熱量煤炭的發(fā)熱量預測影響大,對高發(fā)熱量煤炭的發(fā)熱量預測影響小。Vad和Asd的回歸系數(shù)隨分位點增大呈先減小后略增大趨勢,其絕對值則先增大后稍有減小,說明Vad和Asd對低發(fā)熱量煤炭的發(fā)熱量預測影響小,對高發(fā)熱量煤炭的發(fā)熱量預測影響大。

      表3 不同分位點下線性分位數(shù)回歸系數(shù)Table 3 Linear quantile regression coefficients under different quantiles

      圖2 線性分位數(shù)回歸系數(shù)隨分位點變化曲線Fig. 2 Variation curves of linear quantile regression coefficients with quantiles

      4 結(jié)論

      (1) 應用線性回歸、線性分位數(shù)回歸、分位數(shù)回歸森林3種回歸分析方法進行了煤炭發(fā)熱量預測,其中分位數(shù)回歸森林的預測誤差最小。

      (2) 分位數(shù)回歸方法能夠預測煤炭發(fā)熱量的條件分位數(shù),而不僅僅是條件均值,從而為煤炭發(fā)熱量預測提供了更豐富的信息。

      (3) 根據(jù)煤質(zhì)參數(shù)相關(guān)系數(shù)評估全水分、灰分、揮發(fā)分對于煤炭發(fā)熱量預測的重要程度,結(jié)果表明全水分對于煤炭發(fā)熱量預測的重要程度遠大于灰分和揮發(fā)分。

      (4) 利用線性分位數(shù)回歸分析了全水分、灰分、揮發(fā)分對煤炭發(fā)熱量預測的影響,結(jié)果表明:全水分對低發(fā)熱量煤炭的發(fā)熱量預測影響大,對高發(fā)熱量煤炭的發(fā)熱量預測影響小;揮發(fā)分和灰分對低發(fā)熱量煤炭的發(fā)熱量預測影響小,對高發(fā)熱量煤炭的發(fā)熱量預測影響大。

      猜你喜歡
      發(fā)熱量煤質(zhì)因變量
      曹家灘煤灰分和水分對發(fā)熱量影響的理論與實驗研究
      煤化工(2022年5期)2022-11-09 08:34:44
      多煤層復雜煤質(zhì)配煤入選方案的研究
      調(diào)整有限因變量混合模型在藥物經(jīng)濟學健康效用量表映射中的運用
      中國藥房(2022年7期)2022-04-14 00:34:30
      電廠燃煤虛擬采樣及發(fā)熱量均值不確定度評定
      計量學報(2021年4期)2021-06-04 07:58:22
      Effect of moxibustion combined with acupoint application on enteral nutrition tolerance in patients with severe acute pancreatitis
      適應性回歸分析(Ⅳ)
      ——與非適應性回歸分析的比較
      偏最小二乘回歸方法
      文理導航(2017年20期)2017-07-10 23:21:03
      通柘煤田—1—2煤層的煤質(zhì)變化規(guī)律
      中國煤層氣(2015年6期)2015-08-22 03:25:30
      天然氣發(fā)熱量間接測量不確定度評估方法初探
      三家企業(yè)煤質(zhì)超標各被罰3萬
      蚌埠市| 蓬安县| 甘孜| 富川| 济阳县| 宝兴县| 蒲江县| 夏河县| 昌平区| 洮南市| 长海县| 曲周县| 澎湖县| 蒙自县| 沿河| 渝中区| 广南县| 潼关县| 道孚县| 海林市| 青河县| 威远县| 遂溪县| 虞城县| 德清县| 黄陵县| 南皮县| 托克托县| 景洪市| 馆陶县| 张家川| 巴楚县| 山东省| 余江县| 永寿县| 怀来县| 涞源县| 海口市| 江达县| 道真| 宜章县|