摘要:鑒于在航空運(yùn)輸領(lǐng)域中應(yīng)用經(jīng)濟(jì)計(jì)量模型預(yù)測(cè)航空客流量存在一定的局限性,為此本文運(yùn)用粗糙集理論分析區(qū)域航空客流量。在選擇影響區(qū)域航空客流量因素的基礎(chǔ)上,形成了我國(guó)31個(gè)地區(qū)航空客流量的決策表,進(jìn)而對(duì)決策表運(yùn)用粗糙集的有關(guān)方法得出了我國(guó)31個(gè)地區(qū)的航空客流量生成規(guī)則,最后采用這些規(guī)則對(duì)區(qū)域航空客流量進(jìn)行預(yù)測(cè),取得比較好的預(yù)測(cè)結(jié)果。
關(guān)鍵詞:粗糙集;航空客流量;連續(xù)值離散化;屬性
為了識(shí)別航空客流量與其決定因素之間的關(guān)系并對(duì)前者進(jìn)行預(yù)測(cè),目前最常見(jiàn)的方法是建立經(jīng)濟(jì)計(jì)量模型。這些傳統(tǒng)模型建立在各種統(tǒng)計(jì)假設(shè)的基礎(chǔ)上,因此當(dāng)變量之間相互依存、變量的概率分布未知時(shí),那么這些模型就無(wú)法得出比較準(zhǔn)確的結(jié)果。為此本文試圖探討一種基于粗糙集理論的航空客流量預(yù)測(cè)模型。
作為計(jì)算智能方法之一的粗糙集理論(Rough sets theory,簡(jiǎn)稱RS)是波蘭數(shù)學(xué)家Zdzislaw Pawlak于1982年首次提出的。粗集理論誕生的30多年來(lái),已成功地在許多領(lǐng)域中得到應(yīng)用,然而在航空運(yùn)輸領(lǐng)域中還沒(méi)有見(jiàn)到關(guān)于粗集理論的應(yīng)用文獻(xiàn)。因此,本文在這方面作一個(gè)嘗試,并通過(guò)實(shí)例闡明粗集理論在航空客流量方面的應(yīng)用是適合的。
式(1)和(2)分別為屬性集合[Xi]的分類精度和覆蓋度,式(3)和(4)分別為所有屬性集合的總分類精度和總分類覆蓋度。
2.粗糙集在區(qū)域航空客流量中的應(yīng)用
2.1 航空客流量影響因素分析
分析我國(guó)航空運(yùn)輸業(yè)特點(diǎn),并結(jié)合相關(guān)已有的研究,本文采用六個(gè)影響因素來(lái)預(yù)測(cè)各地區(qū)航空客流量:人均GDP、人口、第一產(chǎn)業(yè)就業(yè)人員的比重、城市人口、國(guó)際旅游人數(shù)、與航空樞紐的距離等。這六個(gè)因素就是六個(gè)條件屬性,而決策屬性就是各地區(qū)的航空客流量,研究對(duì)象則是我國(guó)大陸的31個(gè)省、直轄市、自治區(qū)。每個(gè)對(duì)象由一個(gè)多值屬性(即條件屬性和決策屬性)的集合來(lái)描述,從而形成一個(gè)二維表格,即決策表,表格的“行”與對(duì)象相對(duì)應(yīng),表格的“列”對(duì)應(yīng)于對(duì)象的屬性,表中為具體的屬性值。
條件屬性中的“人均GDP”“人口數(shù)”和“第一產(chǎn)業(yè)人員比重”均為傳統(tǒng)需求模型中所常用的經(jīng)濟(jì)變量?!俺鞘腥丝跀?shù)”的選取主要是考慮城市規(guī)模對(duì)航空客流量的影響?!皣?guó)際旅游人數(shù)”的選取主要是考慮該屬性能間接反映某地區(qū)旅游資源的多少,它能解釋對(duì)于當(dāng)?shù)亟?jīng)濟(jì)并不發(fā)達(dá)的地區(qū)(如云南)卻有較多的航空客流量。關(guān)于“與航空樞紐的距離”這個(gè)屬性,從我國(guó)航空運(yùn)輸格局來(lái)看,北京、上海和廣州是三大航空樞紐,因此這三個(gè)地區(qū)的該屬性值為“0”;天津離北京很近,而北京又處于河北的中心,所以天津和河北的該屬性值均為“1”,表示“特近”的含義;另外,由于江蘇的常州、無(wú)錫、蘇州、昆山等經(jīng)濟(jì)重心緊靠著上海,所以其“與航空樞紐的距離”屬性為“2”,表示“近”的含義;其余地區(qū)類推,數(shù)字越大的地區(qū)表示該地區(qū)與航空樞紐的距離越遠(yuǎn)。在決策時(shí),把決策屬性“地區(qū)航空客流量”分成若干等級(jí),運(yùn)用粗糙集理論得出每個(gè)“地區(qū)航空客流量”等級(jí)所對(duì)應(yīng)的生成規(guī)則。
2.2 數(shù)據(jù)離散化
在應(yīng)用粗糙集理論對(duì)實(shí)際數(shù)據(jù)進(jìn)行分析和獲取知識(shí)時(shí),一般要求由實(shí)際數(shù)據(jù)構(gòu)成的決策表中各個(gè)屬性值必須用離散值表達(dá)。如果某些條件屬性或決策屬性的值域?yàn)檫B續(xù)的,則在處理前必須經(jīng)過(guò)離散化。所以對(duì)于下表1中的連續(xù)型數(shù)據(jù)需再進(jìn)一步離散化成分類數(shù)據(jù)值以適用于粗糙集的方法。對(duì)粗糙集連續(xù)屬性離散化的方法一般是采用其他領(lǐng)域已有的離散化方法, 本文采用熵方法對(duì)連續(xù)型數(shù)據(jù)進(jìn)行離散化。
2.3 決策規(guī)則
本文使用2012年至2015年四年共124個(gè)對(duì)象(共868個(gè)觀測(cè)值),使用其中60%的對(duì)象作為訓(xùn)練規(guī)則用,去發(fā)現(xiàn)決策規(guī)則,其余的40%的對(duì)象(即50個(gè))作為預(yù)測(cè)用,以驗(yàn)證規(guī)則的有效性。在使用粗糙集方法后得出了表2中的航空客流量決策規(guī)則的主要部分。
第一條規(guī)則的含義是:如果某地區(qū)人均GDP小于7198元且人口數(shù)小于2642萬(wàn)人且第一產(chǎn)業(yè)就業(yè)人員比重大于等于50.5%且國(guó)際旅游人數(shù)小于44.5萬(wàn)人,那么該地區(qū)航空客流量就小于200萬(wàn)人次,其余的規(guī)則含義類推。
該規(guī)則把航空客流量影響因素的定性和定量?jī)煞矫婧芎媒Y(jié)合在一起,另外,同樣的航空客流量可以由多條規(guī)則產(chǎn)生,這符合實(shí)際情況。從規(guī)則中各屬性出現(xiàn)的頻次可得出各屬性的重要程度,從多到少依次是“第一產(chǎn)業(yè)就業(yè)人員比重”“人均GDP”“人口數(shù)”“國(guó)際旅游人數(shù)”和“與航空樞紐的距離”,而“200萬(wàn)人口以上城市數(shù)”被約簡(jiǎn),從未出現(xiàn)過(guò)。
運(yùn)用上述公式,對(duì)用于測(cè)試的50個(gè)地區(qū)進(jìn)行擬合,得出表3中的預(yù)測(cè)結(jié)果。
在被測(cè)試地區(qū)總數(shù)中,等級(jí)4的上近似集合中地區(qū)實(shí)際個(gè)數(shù)是12個(gè),被正確預(yù)測(cè)的為10個(gè),預(yù)測(cè)精度為83%;等級(jí)3的上近似集合中地區(qū)實(shí)際個(gè)數(shù)是19個(gè),被正確預(yù)測(cè)的為17個(gè),預(yù)測(cè)精度為90%;等級(jí)2的上近似集合中地區(qū)實(shí)際個(gè)數(shù)是10個(gè),被正確預(yù)測(cè)的為8個(gè),預(yù)測(cè)精度為80%;等級(jí)1的上近似集合中地區(qū)實(shí)際個(gè)數(shù)是8個(gè),被正確預(yù)測(cè)的為8個(gè),預(yù)測(cè)精度為100%;全部等級(jí)的總體精度為88%。另外,等級(jí)3中有一個(gè)地區(qū)的覆蓋度為95%,從而使總體覆蓋度為98%,因此粗糙集理論應(yīng)用在航空客流量預(yù)測(cè)中是可行的。
結(jié)論
本文論述應(yīng)用粗糙集理論及其模型對(duì)我我國(guó)區(qū)域航空客流量進(jìn)行預(yù)測(cè),得出了一些預(yù)測(cè)規(guī)則,其預(yù)測(cè)精度較高。與許多傳統(tǒng)模型需要建立各種統(tǒng)計(jì)假設(shè)基礎(chǔ)不同,該方法僅需對(duì)屬性值進(jìn)行分類。區(qū)別于復(fù)雜的數(shù)學(xué)公式,該方法的分析的結(jié)果以規(guī)則形式進(jìn)行描述,直觀并容易理解。此外粗糙集能夠使用定性數(shù)據(jù),無(wú)須轉(zhuǎn)換成數(shù)值,因此可以有效地防止信息失真。當(dāng)然,針對(duì)不同時(shí)間段的航空客流量數(shù)據(jù)進(jìn)行動(dòng)態(tài)規(guī)則的形成是有待進(jìn)一步解決的問(wèn)題。
參考文獻(xiàn):
[1]張文修,吳偉志,梁吉業(yè)等.粗糙集理論與方法[M].北京:科學(xué)出版社,2001.
[2]張永莉,張曉全.我國(guó)城市間航空客運(yùn)量影響因素的實(shí)證分析[J].經(jīng)濟(jì)地理,2007,4:20-24.
[3]中國(guó)民用航空局發(fā)展計(jì)劃司.從統(tǒng)計(jì)看民航[M].北京:中國(guó)民航出版社,2012-2015.
[4]中華人民共和國(guó)統(tǒng)計(jì)局編.中國(guó)統(tǒng)計(jì)年鑒[M].北京:中國(guó)統(tǒng)計(jì)出版社,2012-2016.
作者簡(jiǎn)介:
劉曉明(1963- ),男,副教授,研究方向:區(qū)域經(jīng)濟(jì)管理。endprint