聶華偉 鄧 捷 廖曉梅
(貴州交通職業(yè)技術(shù)學(xué)院,貴州 貴陽(yáng)551400)
隨著機(jī)動(dòng)車的快速普及,路網(wǎng)的不斷完善,成為人類社會(huì)經(jīng)濟(jì)生活不可缺少的工具,為人類發(fā)展帶來(lái)了便利,但是交通安全問(wèn)題卻日漸突出,導(dǎo)致的交通事故卻日漸頻繁,帶來(lái)了生命和經(jīng)濟(jì)上的損失不可估量[1]。因此,提高道路交通安全水平已經(jīng)成為國(guó)內(nèi)外的迫切需求,預(yù)測(cè)道路交通安全事故,國(guó)內(nèi)外研究學(xué)者進(jìn)行了相關(guān)研究工作。本文提出基于RBF 神經(jīng)網(wǎng)絡(luò)的道路交通安全預(yù)測(cè)模型,利用RBF 神經(jīng)網(wǎng)絡(luò)的全局最優(yōu)解,提高預(yù)測(cè)精度。
影響交通安全的因素由眾多的確定因素和不定因素組成,且這些因素內(nèi)部和外部還存在著復(fù)雜的關(guān)聯(lián)性,因此要分別理清楚因素與因素,因素與結(jié)果之間的關(guān)系,利用簡(jiǎn)單的數(shù)學(xué)模型或者關(guān)聯(lián)分析是很難清楚解釋的。為了合理分析道路交通安全事故的相關(guān)因素,將影響因素分為微觀因素和宏觀因素兩個(gè)方面進(jìn)行分析。微觀因素,指的是人、車、路和環(huán)境?!叭恕笔侵附煌▍⑴c者,包括駕駛員和行人;“車”是指機(jī)動(dòng)車和非機(jī)動(dòng)車;“路”是指道路及相關(guān)的設(shè)施設(shè)備;“環(huán)境”是指天氣條件。宏觀因素,指的是社會(huì)環(huán)境,包括政治、經(jīng)濟(jì)、文化、教育、人口、法律等[2]。
選擇合適的道路交通安全影響因素指標(biāo)是建立高精度預(yù)測(cè)模型的前提,根據(jù)前面對(duì)影響道路交通安全影響因素分析,依據(jù)相關(guān)性、可靠性和可操作性的選擇原則,選擇的影響因素包括人口、GDP、汽車擁有量、從業(yè)人員數(shù)、客運(yùn)量、運(yùn)營(yíng)車量、里程、貨運(yùn)量、周轉(zhuǎn)量等9 個(gè)影響因素指標(biāo)[4]。
本文在研究中,采用道路交通綜合死亡率作為道路交通安全量化指標(biāo),該指標(biāo)綜合展示了人、車、路、環(huán)境和交通事故的關(guān)系,它說(shuō)明道路交通綜合死亡率是萬(wàn)車死亡率、十萬(wàn)人死亡率和公路里程的幾何平均數(shù)[5]。道路交通綜合死亡率[6]記作Sd:
Sd為道路交通綜合死亡率,D 為死亡人數(shù),P 為人口數(shù),N 為機(jī)動(dòng)車保有量,L 為公路里程。
根據(jù)本文原始數(shù)據(jù)構(gòu)成,以及數(shù)據(jù)間的關(guān)系,采用spearman(斯伯曼/斯皮爾曼)相關(guān)系數(shù)進(jìn)行相關(guān)系數(shù)分析[7]。斯皮爾曼等級(jí)相關(guān)對(duì)數(shù)據(jù)條件的要求沒(méi)有積差相關(guān)系數(shù)嚴(yán)格,只要兩個(gè)變量的觀測(cè)值是成對(duì)的等級(jí)評(píng)定資料,或者是由連續(xù)變量觀測(cè)資料轉(zhuǎn)化得到的等級(jí)資料,不論兩個(gè)變量的總體分布形態(tài)、樣本容量的大小如何,都可以用斯皮爾曼等級(jí)相關(guān)來(lái)進(jìn)行研究[8]。利用python 自帶的 pandas 工具包調(diào)用 corr 函數(shù)實(shí)現(xiàn)計(jì)算Spearman 秩相關(guān)系數(shù)。
九個(gè)影響因素中最小的里程相關(guān)系數(shù)為0.483,最大的人口相關(guān)系數(shù)為0.983,與預(yù)測(cè)指標(biāo)都有很強(qiáng)的相關(guān)性,滿足因素選擇原則。
RBF 網(wǎng)絡(luò)是一種三層前饋式網(wǎng)絡(luò)。
RBF 神經(jīng)網(wǎng)絡(luò)在進(jìn)行處理時(shí),需要學(xué)習(xí)的參數(shù)有3 個(gè):基函數(shù)的中心、方差和隱含輸與出層間的權(quán)值。學(xué)習(xí)過(guò)程為:
自組織學(xué)習(xí)過(guò)程要用到聚類算法,本文利用K - 均值聚類算法。
中心學(xué)完就固定了,接著確定基函數(shù)的方差。RBF 神經(jīng)網(wǎng)絡(luò)選用高斯函數(shù)為基函數(shù),即方差為
RBF 神經(jīng)網(wǎng)絡(luò)一種性能優(yōu)良的前饋型神經(jīng)網(wǎng)絡(luò),能任意精度逼近任意的非線性函數(shù);其次,具有局部逼近能力,這意味著逼近一個(gè)輸入輸出映射時(shí),在相同逼近精度要求下,它所需的時(shí)間要比其它方法少;再次,它具有唯一最佳逼近的特性,從根本上解決了局部最優(yōu)問(wèn)題;最后,它與模糊邏輯能夠?qū)崿F(xiàn)很好的互補(bǔ),提高神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)泛化能力。因此,利用RBF 神經(jīng)網(wǎng)絡(luò)進(jìn)行交通生成預(yù)測(cè),能得到精度較高的結(jié)果,為后面進(jìn)行交通生成預(yù)測(cè)提供一定的理論依據(jù)。
利用RBF 神經(jīng)網(wǎng)絡(luò)對(duì)交通生成進(jìn)行預(yù)測(cè),主要分以下六個(gè)步驟:
3.1 對(duì)原始數(shù)據(jù)進(jìn)行歸一化處理;
3.2 把處理后的數(shù)據(jù)作為樣本數(shù)據(jù)輸入?yún)?shù);
3.3 進(jìn)行RBF 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練;
3.4 訓(xùn)練是否完全,若是則進(jìn)行第五步,否則回到3.3 ;
3.5 將測(cè)試數(shù)據(jù)導(dǎo)入模型進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果是否滿足需求精度,若滿足則
進(jìn)行下一步,否則回到3.3 ;
3.6 將預(yù)測(cè)得到的數(shù)據(jù)進(jìn)行逆反處理, 獲得實(shí)際預(yù)測(cè)值,并計(jì)算預(yù)測(cè)誤差。
選擇以2010 年-2017 年的原始數(shù)據(jù)作為模型訓(xùn)練樣本數(shù)據(jù),2018 年的數(shù)據(jù)做為基于RBF 神經(jīng)網(wǎng)絡(luò)的道路交通安全預(yù)測(cè)模型測(cè)試數(shù)據(jù),預(yù)測(cè)結(jié)果如圖1。
圖1 基于RBF 神經(jīng)網(wǎng)絡(luò)的道路交通安全預(yù)測(cè)模型輸出相對(duì)誤差如表1 所示。
表1 基于RBF 神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)值
由表1 可以得到,預(yù)測(cè)結(jié)果與實(shí)際值誤差均在5%以內(nèi),證明該預(yù)測(cè)模型能夠用于道路交通安全預(yù)測(cè),滿足實(shí)際生產(chǎn)應(yīng)用有需求。
本文首先對(duì)國(guó)內(nèi)外在道路交通安全的研究現(xiàn)狀進(jìn)行了分析,發(fā)現(xiàn)當(dāng)前道路交通安全的評(píng)估的方法無(wú)法充分考慮影響因素,且建立的模型存在擬合過(guò)度,以及不是最優(yōu)擬合等現(xiàn)象,提出了基于RBF 神經(jīng)網(wǎng)絡(luò)的道路交通安全預(yù)測(cè)模型。以9 種影響因素作為道路交通安全評(píng)價(jià)量化指標(biāo),以綜合死亡率作為評(píng)價(jià)指標(biāo),并分析了影響因素和綜合評(píng)價(jià)指標(biāo)的關(guān)聯(lián)性,發(fā)現(xiàn)9 種影響因素和評(píng)價(jià)指標(biāo)間存在很強(qiáng)的相關(guān)性。建立了基于RBF 神經(jīng)網(wǎng)絡(luò)的道路交通安全預(yù)測(cè)模型,以全國(guó)2010 年-2018 年的統(tǒng)計(jì)數(shù)據(jù)為例,利用模型對(duì)道路交通安全進(jìn)行了評(píng)價(jià),證明了該預(yù)測(cè)模型的實(shí)用性。