郭 慶
(合肥工業(yè)大學(xué) 數(shù)學(xué)學(xué)院,安徽 合肥 230601)
經(jīng)典粗糙集模型[1-2]只能局限于分類問題而不能有效地處理分級決策問題。基于此原因,文獻[3]提出了優(yōu)勢粗糙集模型,該模型主要以優(yōu)勢關(guān)系代替等價關(guān)系對決策等級類進行近似。近年來,很多學(xué)者針對優(yōu)勢粗糙集模型做了相應(yīng)的改進并應(yīng)用于多個領(lǐng)域[4-9]。交通事故指標分析方法主要包括專家評議法、層次分析法、模糊聚類、關(guān)聯(lián)度分析、決策樹分析、BP神經(jīng)網(wǎng)絡(luò)、Bayes網(wǎng)絡(luò)等方法[10-13]。作為一種處理不精確、不確定與不完全數(shù)據(jù)的新的數(shù)學(xué)理論,粗糙集模型能在無先驗知識并且沒有事先對數(shù)據(jù)或知識進行主觀評價的條件下,僅僅利用數(shù)據(jù)本身所包含的信息,就能夠客觀有效地對數(shù)據(jù)進行分析和處理。文獻[14]通過事故多發(fā)點的統(tǒng)計數(shù)據(jù)建立了基于粗糙集理論的決策表,并對交通事故的影響因素的程度大小進行了分析;文獻[15]構(gòu)建了基于分辨矩陣的屬性約簡算法模型,并結(jié)合實測數(shù)據(jù)驗證分析,提取出導(dǎo)致?lián)矶碌年P(guān)鍵因素;文獻[16]研究了高速公路黑點成因分析,提出了一種基于粗糙集與模糊集的因素權(quán)重算法。
現(xiàn)有的研究都是基于等價關(guān)系并且只對單個決策屬性的粗糙集模型進行分析,并未考慮交通事故指標的多元性及其指標值大小的比較。本文以交通事故指標為背景,從隱患指標和事故指標2個一級指標構(gòu)造一種多決策屬性優(yōu)勢粗糙集模型,分析其相關(guān)性質(zhì)及其與單決策屬性優(yōu)勢粗糙集模型的區(qū)別與聯(lián)系,定義隱患指標相對于事故指標的分類質(zhì)量,并基于分類質(zhì)量給出指標的相對約簡及其最簡序決策規(guī)則的獲取方法;最后結(jié)合具體的數(shù)據(jù)對模型進行驗證。
在優(yōu)勢粗糙集模型中,有序的屬性也稱為準則,相應(yīng)的信息系統(tǒng)稱為序信息系統(tǒng),對應(yīng)的序關(guān)系通常分為優(yōu)勢關(guān)系與劣勢關(guān)系。
交通事故數(shù)據(jù)可以用一個決策信息系統(tǒng)S=(U,C∪D,V,f)表示[13],其中,U表示論域,即所有待研究的交通事故數(shù)據(jù)集;C表示交通隱患指標集;D表示交通事故指標集。本文考慮多個事故指標的情形,設(shè)D={t(1),t(2),…,t(n)}表示所有的事故指標集,并且第i個事故指標t(i)下的序分類記為:
(1)
(2)
(3)
(4)
分別表示論域中在多個事故指標t(1),t(2),…,t(h)下的優(yōu)勢序分類集與劣勢序分類集。
(5)
(6)
(7)
性質(zhì)1 多個事故指標下優(yōu)勢序分類的上下近似集滿足下列性質(zhì):
證明
性質(zhì)1揭示了優(yōu)勢關(guān)系下單個事故指標下的上下近似與多個事故指標下的上下近似之間的區(qū)別與聯(lián)系;劣勢關(guān)系的情形可類似得到,這里不再一一給出。
(8)
為了驗證模型的有效性,本文采用文獻[10]中的部分數(shù)據(jù)見表1所列,其中,ai表示所研究的對象;隱患指標包括如下7個指標:r1表示城鎮(zhèn)化水平,r2表示道路交通網(wǎng)密度,r3表示千人均車輛保有量,r4表示惡劣天氣比例,r5表示交通違法率,r6表示駕駛員技術(shù)的平均水平,r7表示道路管控的水平;事故指標包括如下3個指標:d1表示事故的致死率,d2表示交通事故的死亡率,d3表示萬輛機動車引發(fā)的死亡率。表中各項指標的詳細意義可參考文獻[10]。
表1 道路交通安全指標原始數(shù)據(jù)
首先對表1進行數(shù)據(jù)預(yù)處理[10],即對各個指標進行量化等級,具體如下:
r1:[45,50)為1級,[50,55)為2級,[55,60)為3級,[60,65)為4級,[65,70)為5級;
r2:[1.5,2)為1級,[1.2,1.5)為2級,[1,1.2)為3級,[0.8,1)為4級,[0,0.8)為5級;
r3:[225,300)為1級,[200,225)為2級,[175,200)為3級,[150,175)為4級,[0,150)為5級;
r4:[0,30)為1級,[30,35)為2級,[35,40)為3級,[40,45)為4級,[45,50)為5級;
r5:[0,2)為1級,[2,4)為2級,[4,6)為3級,[6,8)為4級,[8,10)為5級;
r6:[8,10)為1級,[6,8)為2級,[4,6)為3級,[2,4)為4級,[0,2)為5級;
r7:[20,30)為1級,[15,20)為2級,[10,15)為3級,[5,10)為4級,[0,5)為5級。
d1:[10,14)為1級,[14,18)為2級,[18,22)為3級,[22,26)為4級,[26,30)為5 級;
d2:[0,0.2)為1級,[0.2,0.25)為2級,[0.25,0.3)為3級,[0.3,0.4)為4級,[0.4,0.5)為5級;
d3:[0,2)為1級,[2,5)為2級,[5,10)為3級,[10,15)為4級,[15,20)為5級。
其中,1級表示非常安全;2級表示較安全;3級表示安全;4級表示較不安全;5級表示不安全。根據(jù)上述量化等級,將表1轉(zhuǎn)化,見表2所列。
表2 量化等級后的指標數(shù)據(jù)
由(5)式和(6)式可得到如下計算結(jié)果:
由(8)式得:
于是可得4個相對隱患指標約簡集:
R1={r1,r2,r4,r5,r6,r7},
R2={r1,r2,r3,r4,r6,r7},
R3={r1,r2,r3,r4,r5,r7},
R4={r1,r2,r3,r4,r5,r6}。
根據(jù)下近似集中的對象可獲取下列確定性序決策規(guī)則:
規(guī)則1:若r1≥3∧r2≥4∧r4≥2∧r5≥4∧r6≥2∧r7≥3,則d1≥4∧d2≥4∧d3≥3。
規(guī)則2:若r1≥3∧r2≥4∧r4≥3∧r5≥4∧r6≥2∧r7≥3,則d1≥4∧d2≥4∧d3≥3。
規(guī)則3:若r1≥3∧r2≥4∧r4≥3∧r5≥4∧r6≥2∧r7≥3,則d1≥5∧d2≥4∧d3≥3。
規(guī)則4:若r1≥3∧r2≥4∧r3≥3∧r4≥2∧r6≥2∧r7≥3,則d1≥4∧d2≥4∧d3≥3。
規(guī)則5:若r1≥3∧r2≥4∧r3≥2∧r4≥3∧r6≥2∧r7≥3,則d1≥5∧d2≥4∧d3≥3。
規(guī)則6:若r1≥3∧r2≥4∧r3≥3∧r4≥2∧r5≥4∧r7≥3,則d1≥4∧d2≥4∧d3≥3。
規(guī)則7:若r1≥3∧r2≥4∧r3≥2∧r4≥3∧r5≥4∧r7≥3,則d1≥5∧d2≥4∧d3≥3。
規(guī)則8:若r1≥3∧r2≥4∧r3≥3∧r4≥2∧r5≥4∧r6≥2,則d1≥4∧d2≥4∧d3≥3。
規(guī)則9:若r1≥3∧r2≥4∧r3≥2∧r4≥3∧r5≥4∧r7≥2,則d1≥5∧d2≥4∧d3≥3。
可能性序決策規(guī)則可由邊界集中的對象類似得到,這里不再一一給出。
基于相關(guān)系數(shù),文獻[10]給出單個隱患指標與單個事故指標之間的正負相關(guān)計算結(jié)果,但未體現(xiàn)隱患指標與事故指標間的整體關(guān)聯(lián)性。
本文基于多決策屬性的優(yōu)勢粗糙集模型直接面向具體數(shù)據(jù)表,消去冗余的隱患指標,并獲取多個交通隱患指標與多個事故指標間的序決策規(guī)則,且計算方便。以決策規(guī)則1為例,如果該地區(qū)城鎮(zhèn)化水平高于3級,道路交通網(wǎng)密度高于4級,惡劣天氣比例高于2級,交通違法率高于4級,駕駛員技術(shù)的平均水平高于2級,且道路管控的水平高于3級,那么該地區(qū)交通事故的致死率高于4級,交通事故的死亡率高于4級,且萬輛機動車引發(fā)的死亡率高于3級。
現(xiàn)有交通事故指標分析的粗糙集模型不能有效處理多個決策屬性的情形。本文面向交通事故指標數(shù)據(jù),分別從隱患指標和事故指標2個一級指標,構(gòu)造了一種多決策屬性優(yōu)勢粗糙集模型,分析了其相關(guān)性質(zhì)及其與單決策屬性優(yōu)勢粗糙集模型的區(qū)別與聯(lián)系,定義了隱患指標相對于事故指標的分類質(zhì)量,給出了隱患指標相對于事故指標的相對約簡的求解及其序最簡決策規(guī)則的獲取方法,結(jié)合具體的數(shù)據(jù)對模型進行了驗證,拓展了粗糙集理論在交通事故指標關(guān)聯(lián)分析中的應(yīng)用。