孫進進,王苗苗
(1.中國民航大學 機場學院,天津 300300;2.長安大學 公路學院,陜西 西安 710000)
對于事物的分類,過去人們主要利用統(tǒng)計學方法對事物進行分類處理,這些分類方法往往帶有較強的主觀性和任意性,不能很好地揭示待分類物之間的內(nèi)在本質(zhì)差別和聯(lián)系,而且數(shù)據(jù)處理的量級以及計算效率較低。自組織特征映射神經(jīng)網(wǎng)絡(luò)(SOM)是一種無監(jiān)督競爭式學習的前饋網(wǎng)絡(luò),這種神經(jīng)網(wǎng)絡(luò)接收外界輸入時,將會對應(yīng)分成不同的相應(yīng)區(qū)域,各相應(yīng)區(qū)域?qū)μ囟ǖ妮斎刖哂胁煌捻憫?yīng)特征,而且這個相應(yīng)分類過程是網(wǎng)絡(luò)自動完成的。這種分類方法能夠反映輸入樣本的本質(zhì)特征,大大消減一致性準則中的人為因素。
國內(nèi)外已有許多學者對機場分類進行研究。例如,美國聯(lián)邦航空局FAA按照旅客吞吐量占當年旅客總運輸量的比例將美國的機場分為4類。我國楊英寶等依據(jù)旅客吞吐量以及機場當?shù)氐腉DP和人口等指標對機場進行分類。褚衍昌同樣依據(jù)吞吐量與機場當?shù)亟?jīng)濟指標進行分類,但通過對眾多指標的主成分分析,找出關(guān)鍵指標。
人工神經(jīng)網(wǎng)絡(luò)具有并行處理和自適應(yīng)、自組織的學習能力,對處理非線性問題十分有效。現(xiàn)有多種神經(jīng)網(wǎng)絡(luò)類型,如誤差反向傳播BP(Error back prorogation)、徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)RBF(Radical Basis Function)和SOM網(wǎng)絡(luò)等。其中自組織特征映射神經(jīng)網(wǎng)絡(luò)SOM(Self-Organizing feature Map)是由Kohonen提出的神經(jīng)網(wǎng)絡(luò)數(shù)值模擬方法。SOM模擬大腦神經(jīng)系統(tǒng)的自組織特征映射功能,可在訓練中無監(jiān)督自組織學習,通過學習提取數(shù)據(jù)中的重要特征或內(nèi)在規(guī)律。進而實現(xiàn)分類分析的功能。
SOM是輸入層、輸出層的構(gòu)成兩層網(wǎng)絡(luò)。與傳統(tǒng)的聚類方法相比,SOM網(wǎng)絡(luò)形成的聚類中心可以被映射到一個曲面或平面上,以保持固定不變的拓撲結(jié)構(gòu)。在輸入層的神經(jīng)元個數(shù)為n,M=n2個競爭層組成的一個兩維平面的神經(jīng)元陣列上,輸入層和競爭層的各神經(jīng)元之間能夠?qū)崿F(xiàn)完整的全連接。
SOM的基本結(jié)構(gòu)中,網(wǎng)絡(luò)的輸出層為一個二維的平面拓撲結(jié)構(gòu)。輸入層和競爭層各神經(jīng)元之間可以實現(xiàn)全向連接,即每個輸出節(jié)點與所有的輸入節(jié)點之間存在連接,每個連接權(quán)重被用來指示連接強度。各個神經(jīng)元的連接權(quán)值具有一定的分布,每個輸入節(jié)點與輸出節(jié)點通過連接權(quán)重w相連接,輸出層節(jié)點j與輸入層各個階段xi(i=1,2,…,N)的連接權(quán)Wij為第j類的聚類中心;競爭層之間實行橫向連接,鄰近的神經(jīng)元互相激勵,而相互較遠的神經(jīng)元則互相抑制,而更遠的神經(jīng)元之間又具有較弱的激勵。
SOM運行分為訓練和工作兩個階段進行,當輸入模式的類別發(fā)生改變后,獲勝節(jié)點也將在節(jié)點二維平面上改變。在獲勝節(jié)點相互連接的外側(cè)因為存在相互刺激興奮作用,所以產(chǎn)生一個較大的響應(yīng),然后獲勝節(jié)點及其周圍獲勝鄰域內(nèi)節(jié)點的權(quán)向量值也將進行不同程度調(diào)整,其調(diào)整的方向、大小根據(jù)距離獲勝節(jié)點的遠近而變化。通過自組織網(wǎng)絡(luò)中的大量的輸入訓練樣本用來調(diào)整網(wǎng)絡(luò)的權(quán)值,最終使得輸入層的每個節(jié)點成為對一個特定的輸入模式敏感的神經(jīng)細胞,其對應(yīng)的一個權(quán)向量的成為某個特定輸入模式的中心向量。當有兩個類別的特征向量非常接近時,這意味著這兩個節(jié)點的在節(jié)點拓撲圖上位置接近,從而在輸出層上形成輸入模式類別的特征向量圖。
SOM訓練結(jié)束,輸出層中對于每一個輸入模式類的特定關(guān)系是完全確定地,這個網(wǎng)絡(luò)即可用來模式識別。當你任意輸入一個模式,網(wǎng)絡(luò)輸出層神經(jīng)元中一個特定的類將有最大的響應(yīng),從而實現(xiàn)自動分類。
1)對由歸一化處理過的隨機數(shù)組成輸出層的權(quán)值向量進行初始化,并對學習率賦予初始值。
2)從訓練樣本集中接收一個輸入模式并進行歸一化處理。
3)計算點積,尋找獲勝節(jié)點,以計算得到的點積結(jié)果中最大的作為獲勝節(jié)點,如果輸入是非規(guī)范的未經(jīng)歸一化處理,則需計算歐氏距離,以歐式距離最小的作為獲勝節(jié)點。
4)確定獲勝鄰域,以中心時刻作為確定權(quán)重的調(diào)整時間域,在訓練期間獲勝鄰域隨時間逐漸收縮。
5)對獲勝鄰域內(nèi)所有節(jié)點進行權(quán)值調(diào)整。
6)判斷是否結(jié)束,在SOM網(wǎng)絡(luò)中有沒有類似的BP網(wǎng)絡(luò)的輸出誤差的概念,以學習率是否到達預(yù)定條件作為結(jié)束依據(jù)。未到達則返回第二步。具體算法流程見圖1。
圖1 算法流程
遴選8個因素作為運輸機場的聚類指標,依次為旅客吞吐量(x1)、貨郵吞吐量(x2)、起降架次(x3)、航站樓面積(x4)、航線條數(shù)(x5)、機場服務(wù)城市的就業(yè)人數(shù)(x6)、GDP(x7)、外商直接投資(x8)。從關(guān)鍵指標看出,影響機場分類還是基于機場自身的運營數(shù)據(jù)指標,這些指標直接反映機場的運營規(guī)模和發(fā)展情況。除此之外,也不能忽視機場地區(qū)的社會經(jīng)濟發(fā)展狀況對機場分類帶來的影響,例如,機場所在地的經(jīng)濟總量、人口規(guī)模等,這些指標都直接或間接影響機場的運營與發(fā)展情況。
本文采用2010年全國主要機場的指標數(shù)據(jù)進行聚類分析。由于2010年排名前40位機場的客、貨吞吐量分別占全國吞吐量的90%、92%以上,所以本文選取排名前40位機場作為聚類分類對象。
使用的SOM網(wǎng)絡(luò)模型是基于MATLAB語言構(gòu)建,利用其中的神經(jīng)網(wǎng)絡(luò)工具箱可以方便實現(xiàn)整個學習、訓練和模擬過程,輸入層共8個節(jié)點,分別對應(yīng)上述機場評價指標體系中的8項指標。以40個機場為樣本,確定的網(wǎng)絡(luò)輸入模式為
其中:k=1,2,…,q(q=40,n=8),構(gòu)成樣本數(shù)為40,指標為8的輸入矩陣。競爭層組織結(jié)構(gòu)根據(jù)分類方法將SOM神經(jīng)網(wǎng)絡(luò)的競爭層結(jié)構(gòu)選為[8,1]類型,即將40個樣本最終分別劃為8類進行學習,使用Newsom函數(shù)創(chuàng)建一個SOM網(wǎng)絡(luò):net=netsom([01],[81])。其中,[01](為網(wǎng)絡(luò)輸入P的最大值和最小值,[8,1]為競爭層的網(wǎng)絡(luò)結(jié)構(gòu);SOM網(wǎng)絡(luò)參數(shù)設(shè)置,拓撲函數(shù)默認為‘hextop’,距離函數(shù)為‘linkdist’,排列階段鄰域半徑為兩個神經(jīng)元的最大可能距離,排列階段學習速率設(shè)定為1,排列階段學習次數(shù)為10000次,調(diào)整階段鄰域半徑為1,調(diào)整階段學習速率為0.02。
通過SOM神經(jīng)網(wǎng)絡(luò)對所選指標數(shù)據(jù)的處理和分析,最終得到2010年全國主要的40個機場的分類結(jié)果,見表1。
從表2可以看出,第一類至第二類機場的客貨量突出,起降架次較多,航線條數(shù)密集,所在城市的各項數(shù)據(jù)明顯領(lǐng)先于其他機場所在城市。我國機場布局中的大型樞紐機場,所在的城市屬于國家的政治經(jīng)濟、中心,是我國經(jīng)濟最為發(fā)達、人口流動量大的城市。其中第一類機場的各項指標均明顯高于其他機場,是國家級的航空樞紐。第二類機場指標稍弱與第一類機場,為大區(qū)域級航空樞紐。
第三類、第四類的客運量基本持平,但是第三類的貨運量和所在城市的經(jīng)濟指標明顯大于第四類,因此,區(qū)域級的航空樞紐,特別是區(qū)域的物流集散中心。第四類機場所在城市為旅游性城市,機場的航線條數(shù)、起降架次以及航站樓面積均大于第三類,也是區(qū)域的航空樞紐。第三類與第四類機場均是服務(wù)于各自所在的主要經(jīng)濟圈,機場所在城市經(jīng)濟發(fā)達,人口密度較大,所以機場客流量較大,未來成長潛力巨大。
表1 分類結(jié)果
表2 各個類別的平均指標
第五類機場客貨量中等、航線條數(shù)中等、所在城市的人口較多、GDP較高,多為所在地區(qū)的客流中轉(zhuǎn)中心,為地區(qū)級的航空樞紐。
第六類機場客貨量不多,所在城市經(jīng)濟發(fā)展水平較高,人口密度稍多,多為省會級的航空樞紐。
第七類、第八類機場客貨量較低,航線條數(shù)一般,多為中小型機場,所處城市人口不多,經(jīng)濟發(fā)展水平不高,多為中西部省份經(jīng)濟中心城市,其旅游資源比較豐富,第八類人口密度眾多,除個別城市外,機場運輸量近幾年增長平穩(wěn)。
將SOM原理應(yīng)用于民用機場的聚類分析中,其分類結(jié)果有較強的客觀性,能夠準確地把握各個類別的本質(zhì)聯(lián)系。這種民用機場的新地分類方法,將對全國整體機場布局研究以及各個機場在未來制定運營策略和定位分析上都具有非常重要的現(xiàn)實意義。
[1] 趙曉丹,齊志.基于SOM神經(jīng)網(wǎng)絡(luò)的聚類方法研究[J].吉林省經(jīng)濟管理干部學院學報,2008,22(2):1-3.
[2] 董志毅,夏新平,褚衍昌.我國機場分類的影響機理與聚類分析研究[J].商場現(xiàn)代化,2006(36):1-2.
[3] 伊春華.基于SOM神經(jīng)網(wǎng)絡(luò)的人力資本聚類分析[J].遼東學院學報,2006,13(1):1-2.
[4] 韓力群.人工神經(jīng)網(wǎng)絡(luò)理論、設(shè)計及應(yīng)用[M].北京:化學工業(yè)出版社,2007.
[5] 褚衍昌.機場運營效率評價及改善研究[D].天津:天津大學,2009.
[6] 趙威,李磊,李琳.基于SOM 網(wǎng)絡(luò)的中原城市群可持續(xù)發(fā)展水平研究[J].河南科學,2009,27(12):3-4.
[7] 褚衍昌,于劍,李艷偉.民航運輸產(chǎn)業(yè)競爭力的組合評價方法[J].交通運輸工程學報,2009,9(6):6-8.