許一洲
摘? 要:近年來,隨著交通運輸?shù)牟粩喟l(fā)展,乘坐飛機人數(shù)越來越多,而出租車成為乘客們離開機場的主要交通工具之一。為研究機場出租車的流量情況,通過尋找分析指標來建立出租車司機在機場的決策模型,幫助機場對打車乘客和機場出租車進行合理規(guī)劃,文章通過收集某日機場的一天中各時間到達航班乘客數(shù)據(jù)和機場蓄車池中出租車數(shù)量的實時數(shù)據(jù),運用SPSS軟件的K-means聚類算法對機場到達航班乘客進行時間上的分類,比較不同時間段下對機場出租車的數(shù)量變化。
關(guān)鍵詞:機場客流量;機場出租車數(shù)量; K-means聚類
中圖分類號:TP18? ? ? ? ? 文獻標志碼:A? ? ? ? ?文章編號:2095-2945(2020)16-0022-03
Abstract: In recent years, with the continuous development of transportation, more and more people take planes, and taxi has become one of the main means of transportation for passengers to leave the airport. In order to study the flow of airport taxis, the decision-making model of taxi drivers at the airport is established by looking for analysis indicators to help the airport make reasonable plans for taxi passengers and airport taxis. In this paper, by collecting the data of passengers arriving at different times of the day at the airport and the real-time data of the number of taxis in the airport car storage pool, the K-means clustering algorithm of SPSS software is used to classify the passengers arriving at the airport in time, and the changes of the number of airport taxis in different time periods are compared.
Keywords: airport passenger flow; number of airport taxis; K-means clustering
1 概述
K-means聚類算法[1]是由Steinhuas 1955年、Lloyd 1957年、Ball&Hall 1965年、McQueen 1967年分別在不同的科學(xué)研究領(lǐng)域獨立提出來的一種算法,K-means聚類算法被提出來之后,被廣泛研究和應(yīng)用于不同的學(xué)科領(lǐng)域,并且發(fā)展出了大量的不同的改進算法。目前它依舊是應(yīng)用最廣泛的劃分聚類算法之一。通過K-means聚類算法,可以有效分析機場客流量的變化對機場出租車數(shù)量影響情況。
2 模型的建立與求解
2.1 機場客流量數(shù)據(jù)的收集與分析
首先通過選取了某日鄭州新鄭機場的當日航班的客流量信息,篩選出了當日機場的到達航班,得出了某日全天不同時間的到達航班乘客人數(shù),并用SPSS軟件生成當日到達航班乘客數(shù)量散點圖(如圖1所示)。
通過以1小時為單位,整理出某日0:00至24:00各小時乘車總?cè)藬?shù)與時間的關(guān)系線形圖(如圖2所示)。
2.2 利用K-means聚類算法分析機場客流量變化
由以上散點圖和折線圖分析,可初步將所有時間段分為5類:0:00點至2:00點,5:00點至8:00點,8:00至14:00,14:00至18:00和18:00至24:00這幾個時間段,具有一定的分類效果。因此可通過K-means聚類算法對該數(shù)據(jù)進行進一步分析。
K-means算法首先需要的是選取初始聚類中心,然后對相關(guān)的所有數(shù)據(jù)進行分類,最后計算出每一個聚類的平均值調(diào)整聚類中心,再進行不斷地迭代循環(huán)。最終使得類內(nèi)對象相似性最小[2]。K-means聚類算法流程圖如圖3所示。
設(shè)置最大迭代次數(shù)為20,聚類個數(shù)為5,得到最終聚類中心,每個聚類中的個案數(shù)目,聚類成員和與聚類中心位置(如表1和表2所示)。
通過本次聚類分析可以得到0:00至2:00,5:00至10:00,10:05至13:40,13:45至18:20和18:25至23:50五組分類,與上述初步分類接近??梢哉J定機場的客流量在不同時間段具有不同的影響效果。
2.3 機場客流量與蓄車池候車量之間關(guān)系比較
通過提取鄭州新鄭機場某日從11:30至22:30在機場內(nèi)蓄車池等待的車輛數(shù)量數(shù)據(jù),利用Excel數(shù)據(jù)分析,可以得到場內(nèi)待運車輛數(shù)與機場乘客人數(shù)隨時間變化的線形圖(如圖4所示)。
由該表的曲線趨勢可以看出,在17:00之前機場乘客人數(shù)與場內(nèi)車輛數(shù)量大致呈正相關(guān)關(guān)系,而在17:00之后,機場場內(nèi)車輛數(shù)量大致與后一小時的機場乘客人數(shù)呈正向關(guān)系。但在17:00到19:00之間,機場人數(shù)和場內(nèi)車輛數(shù)關(guān)系有差異。結(jié)合現(xiàn)實生活我們可以得知,在17:00至19:00這一時間區(qū)間,市區(qū)正值下班高峰期,市區(qū)交通擁堵狀況較為嚴重,而在上下班高峰期時,市區(qū)交通擁堵程度過高,使得市區(qū)交通擁堵程度成為了主要因素迫使出租車司機選擇在機場蓄車池排隊。
3 結(jié)束語
K-means聚類算法對數(shù)據(jù)的劃分聚類具有一定的優(yōu)點。通過收集機場一天中乘客人數(shù)變化和機場蓄車池出租車數(shù)量變化情況,利用K-means聚類算法進行分類,可以有效直觀得出不同時間段下機場出租車的變化因素,合理建立機場出租車司機的決策模型,對機場乘客打車和機場出租車的規(guī)劃有一定積極作用。
參考文獻:
[1]Anil K J. Data clustering: 50 years beyond K-Means[J]. Pattern Recognition Letters,2010,31(8):651-666.
[2]朱明.數(shù)據(jù)挖掘[M].合肥:中國科學(xué)技術(shù)大學(xué)出版社,2002.
[3]司守奎,孫堯亮.數(shù)學(xué)建模算法與應(yīng)用(2版)[M].北京:國防工業(yè)出版社,2019.