虢詩影
(華中科技大學(xué)同濟(jì)醫(yī)學(xué)院附屬同濟(jì)醫(yī)院,湖北 武漢 430100)
天然氣是醫(yī)院冬季供暖的主要能源,在日常工作中,我們對(duì)于天然氣消耗量與氣象環(huán)境的關(guān)系,未作出深刻的認(rèn)識(shí)。在值班日志中,僅記錄當(dāng)日天氣一個(gè)維度,而關(guān)于天然氣的消耗量,僅停留在數(shù)值記錄和傳統(tǒng)的歸納統(tǒng)計(jì)法上。
為響應(yīng)國家于2060年前實(shí)現(xiàn)碳中和的目標(biāo),作為醫(yī)院的后勤部門,完善醫(yī)院的能源管理方案,提升能源利用效率,用現(xiàn)代方法來彌補(bǔ)傳統(tǒng)粗獷管理方案上的不足,是后勤部門一直以來的研究型課題。
在通過現(xiàn)有的統(tǒng)計(jì)學(xué)方法來預(yù)測(cè)天然氣消耗量中,對(duì)于連續(xù)變化的天氣情況暫不能進(jìn)行有效的精細(xì)化預(yù)測(cè)。在一些特殊氣象環(huán)境,例如極端的雨雪大風(fēng)天氣中往往現(xiàn)實(shí)結(jié)果與預(yù)測(cè)結(jié)果有較大出入。后勤人員雖然已經(jīng)記錄了大量的天然氣消耗的數(shù)值記錄和天氣記錄,卻沒有高效和科學(xué)的利用方法,只能依靠自身過往經(jīng)驗(yàn)來預(yù)測(cè),而這些經(jīng)驗(yàn)推測(cè),帶有很強(qiáng)的主觀性,既無法面對(duì)復(fù)雜的氣象環(huán)境,也無法作為有效經(jīng)驗(yàn)來推廣。
充分利用現(xiàn)有的記錄數(shù)據(jù),結(jié)合歷史氣象資料,利用機(jī)器學(xué)習(xí)框架TensorFlow對(duì)氣象環(huán)境與能源消耗量進(jìn)行建模,構(gòu)建具有地方特性氣象環(huán)境與能源消耗量的模型,為后勤工作所保障的區(qū)域提供科學(xué)化的預(yù)測(cè)手段。減少基于個(gè)人經(jīng)驗(yàn)所產(chǎn)生的誤差。
TensorFlow是機(jī)器學(xué)習(xí)領(lǐng)域,被選擇最多的機(jī)器學(xué)習(xí)框架,其可以在CPU和GPU上以數(shù)據(jù)流的形式進(jìn)行高效的分布式數(shù)值計(jì)算。同時(shí),TensorFlow具有跨平臺(tái)的特性,不僅可以跑在傳統(tǒng)的Windows上,也可以跑在Linux和Mac OS X上,讓每一個(gè)科研人員都可以便捷的使用。
Sequential模型又名順序模型,是函數(shù)式模型的簡(jiǎn)單版本,是最簡(jiǎn)單的線性,無分叉的順序結(jié)構(gòu),是多個(gè)神經(jīng)網(wǎng)絡(luò)“層”的線性疊加,它的每一層都具有一個(gè)輸入張量和一個(gè)輸出張量。
本文數(shù)據(jù),天氣數(shù)據(jù)部分主要從“中國天氣網(wǎng)”(http://www.weather.com)下載,天然氣消耗量數(shù)據(jù)來自于值班日志。數(shù)據(jù)采樣時(shí)間為2019年1月7日~2020年3月2日,數(shù)據(jù)共163組。由于文章篇幅有限,此處僅列出前6天數(shù)據(jù)。表1為天氣與天然氣數(shù)據(jù)表,Gas為當(dāng)天天然氣的消耗量(m3),Max為最高溫度(℃),Min為最低溫度(℃),Weather為天氣,Wind為風(fēng)向,Levels為風(fēng)級(jí)。
表1 氣象環(huán)境與天然氣消耗量
(1)訓(xùn)練數(shù)據(jù)與測(cè)試數(shù)據(jù)。通過隨機(jī)取值將數(shù)據(jù)分拆為訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù),其中訓(xùn)練數(shù)據(jù)占所有數(shù)據(jù)的80%,測(cè)試數(shù)據(jù)占20%。
(2)模型的初始化。本文使用一個(gè)“Sequential”模型,具備兩個(gè)神經(jīng)網(wǎng)絡(luò)“層”,包含4801個(gè)參數(shù),以及返回單個(gè)、連續(xù)的輸出層。將初始化的模型進(jìn)行500個(gè)周期的訓(xùn)練后,得到一個(gè)預(yù)測(cè)誤差為±540m3的模型結(jié)果。
(3)訓(xùn)練周期和模型“層”數(shù)對(duì)結(jié)果的影響。神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)周期和“層”數(shù)對(duì)模型預(yù)測(cè)的準(zhǔn)確度有很大的影響,當(dāng)訓(xùn)練次數(shù)不夠,或者模型“層”不夠時(shí),訓(xùn)練結(jié)果會(huì)不盡人意,這時(shí)候叫“欠擬合”狀態(tài),“欠擬合”狀態(tài)代表著神經(jīng)網(wǎng)絡(luò)模型尚未學(xué)習(xí)到訓(xùn)練數(shù)據(jù)集中的相關(guān)特征模式。而太多的訓(xùn)練周期和“層”不僅會(huì)增加訓(xùn)練和預(yù)測(cè)的時(shí)間,而且會(huì)起到相反的效果。當(dāng)模型過度擬合訓(xùn)練數(shù)據(jù)時(shí),則模型無法泛化于測(cè)試數(shù)據(jù),導(dǎo)致預(yù)測(cè)結(jié)果精度的下降,這時(shí)候稱為“過擬合”狀態(tài)。
(4)不同組合的實(shí)驗(yàn)結(jié)果。這里僅追求模型預(yù)測(cè)數(shù)據(jù)的準(zhǔn)確性,暫不考慮訓(xùn)練時(shí)間及預(yù)測(cè)時(shí)間的經(jīng)濟(jì)性,進(jìn)行反復(fù)迭代的試驗(yàn)及預(yù)測(cè)。
如表2所示,最終在“層”數(shù)為7時(shí),訓(xùn)練周期為2000時(shí),得到了一個(gè)較為準(zhǔn)確的模型,預(yù)測(cè)誤差為±489m3,該模型含有6個(gè)緊密相連的隱藏層和1個(gè)連續(xù)值的輸出層,以及17281個(gè)訓(xùn)練參數(shù)。
表2 模型與誤差
本文通過對(duì)真實(shí)數(shù)據(jù)的歸納,選定了影響天然氣消耗量的氣象與時(shí)空特征8個(gè)(每種特征對(duì)其影響因數(shù)不同,但對(duì)其均產(chǎn)生一定波動(dòng)。),通過TensorFlow機(jī)器學(xué)習(xí)框架進(jìn)行機(jī)器學(xué)習(xí),在Sequential模型下,模型“層”數(shù)量為7,訓(xùn)練周期為2000時(shí),該模型有相對(duì)較好的預(yù)測(cè)效果,平均誤差±489m3。
本文在常規(guī)天氣的基數(shù)上,加入了年、月、日、天氣、溫度、風(fēng)向及風(fēng)級(jí)等因素,這有助于提升模型的預(yù)測(cè)精度,但是,劃分粒度較大,而且由于收集的樣本數(shù)據(jù)有限,供暖時(shí)能源消耗量對(duì)人群密度、室內(nèi)溫度設(shè)定等其他因素有關(guān),因此,想要提高模型的預(yù)測(cè)精度,后期還需要對(duì)這些因素加強(qiáng)更深的研究,也是未來工作努力的方向。
醫(yī)院冬季供暖天然氣取決于多種因素,本文從時(shí)間,天氣等角度出發(fā),對(duì)能源消耗量做預(yù)報(bào)研究,采取先進(jìn)的機(jī)器學(xué)習(xí)框架TensorFlow來代替?zhèn)鹘y(tǒng)的統(tǒng)計(jì)學(xué)歸納法。該模型的建立為我院后勤在大數(shù)據(jù)人工智能時(shí)代背景下的發(fā)展,提供了新的思路和方案。