北京交通大學(xué) 羅 王瑩
基于鐵路客票的旅客目的地出行服務(wù)本體模型構(gòu)建
北京交通大學(xué) 羅 王瑩
我國鐵路客運承載了全國大部分的人口流動,隨著鐵路的建設(shè)發(fā)展,鐵路客運量也逐年攀升。2014年鐵路發(fā)送旅客23.57億人,2015年為25億人次,20160年達27.7億人次,連續(xù)三年實現(xiàn)10%增長。與此同時,鐵路客運的電子化、信息化建設(shè)也在不斷進行,如12306電子票務(wù)網(wǎng)站、鐵路主數(shù)據(jù)管理平臺等。利用旅客的客票信息構(gòu)造模型,能夠為旅客提供諸如酒店推薦、餐飲店推薦等有針對性的目的地出行服務(wù),同時也可提供交通查詢、景區(qū)推薦等功能。
目前,對鐵路客票的研究集中在通過客票數(shù)據(jù)分析旅客的客票選擇行為,從而為客運產(chǎn)品提供參考,以及制定客票的營銷策略,尚未延伸到其他產(chǎn)品或服務(wù)。在高速鐵路的旅客出行情況中,路途相對較短的客票,不同車種、席別之間價格差距小,旅客的價格敏感度不高。隨著路途里程增加,由車種、席別帶來的價格差距擴大,旅客的價格敏感度則相應(yīng)增加;在更廣泛的客運專線中,對票務(wù)數(shù)據(jù)進行分析,同樣發(fā)現(xiàn)客票里程的長短與票價的影響程度成正比。
為了向旅客推薦同等消費水平的酒店與餐飲店,以路段及車種席別兩個維度對旅客的消費水平進行衡量。1~200km為短途,200km~500km為中途,500km以上為長途;根據(jù)《中華人民共和國鐵路客運》,篩選出載客量大并具有模型構(gòu)建意義的客運車種為高速動車組列車、城際動車組列車、動車組列車、直達特快列車、特快列車和快速列車,并確定列車相應(yīng)的席別,車種席別等級高且里程長的則具有相應(yīng)高的消費水平。酒店的消費水平參考攜程、去哪兒網(wǎng)的方法,以星級進行劃分;參考《餐飲業(yè)消費的人群特征及趨勢研究數(shù)據(jù)報告》,餐飲店以人均消費為標(biāo)準(zhǔn)進行劃分為高中低檔。
目前最被人們接受的本體概念是“共享概念模型的明確的形式化規(guī)范說明”,即對現(xiàn)實世界的特定對象進行抽象,得到明確定義的概念模型,并能被計算機識別、可共享。通過對本體模型中類、屬性、實例的規(guī)則編輯,可以實現(xiàn)模型的推理功能。選擇本體作為構(gòu)造模型的方式,可以使知識共享并重用,提高系統(tǒng)通訊、互操作、可靠性的能力。
以本體編輯工具protege4.3建立模型。
2.1 建立類
根據(jù)模型需要,抽象出如下概念:酒店、餐飲店、景區(qū)、城市、乘客、客票、公共交通、客運車站、車種、席別。在抽象概念的基礎(chǔ)上建立類,并將酒店五星、四星、三星、二星與經(jīng)濟型酒店;餐飲店按人均消費水準(zhǔn)劃分為四類;客票也根據(jù)路途和車種席別兩個維度劃分為四類;公共交通分為地鐵與公交;根據(jù)所選車種,席別子類包括特等座、商務(wù)座、一等座、二等座、高級軟臥、軟臥、硬臥、軟座、硬座以及無座。
2.2 建立對象屬性
對象屬性用于描述類與類之間的關(guān)系,抽象出的關(guān)系屬性如表1所示。
表1 抽象出的關(guān)系屬性
2.3 建立數(shù)據(jù)屬性
數(shù)據(jù)屬性用于描述類自身的數(shù)據(jù)特征,建立數(shù)據(jù)屬性如下:
hasAdmissionFee為景區(qū)屬性,描述景區(qū)的門票費用,類型為整數(shù);hasDepartureDate為客票屬性,描述客票上的列車始發(fā)日期與時間;hasDistance為客票屬性,描述從客票始發(fā)站距離客票到達站的里程,類型為整型;hasGender為乘客屬性,描述乘客性別,類型為字符串;hasLocationInfo為酒店、餐飲店、景區(qū)屬性,描述地點位置,類型為字符串;hasPerCapitaConsumption為餐飲店屬性,描述餐飲店人均消費。
2.4 建立規(guī)則
在protege中,規(guī)則的建立采用SWRL(Semantic Web Rule Language),以語義方式表達規(guī)則。如hasPerant(?a,?b) -> hasChild(?b,?a),箭頭前半部分為推理條件,hasPerant為屬性,表達的意思為a有家長b,后半部分為推理結(jié)果,意思為b有孩子a。
模型中共建立四類規(guī)則,分別表達了酒店推薦、餐飲店推薦、景區(qū)推薦和交通查詢的邏輯推理。
(1)酒店推薦規(guī)則。ticket_type_1(?x), (five_star or four_star) (?z), has_bought(?a, ?x), has_destination_city(?x, ?y), is_located_in(?z, ?y) -> is_recommended_for(?z, ?a)。
(2)餐飲店推薦規(guī)則。catering_type_3(?x), ticket_type_3(?z), has_bought(?a, ?z), has_destination_city(?z, ?y), is_located_in(?x, ?y) -> is_recommended_for(?x, ?a)。
(3)景區(qū)推薦規(guī)則。attraction(?b), has_bought(?a, ?x), has_destination_city(?x, ?y), is_located_in(?b, ?y) -> is_recommended_for(?b, ?a)。
(4)交通查詢規(guī)則。has_bought(?a, ?b), is_available_to(?y, ?x), is_bound_for_station(?b, ?x) -> can_take_public_transit(?a, ?y)。
2.5 添加實例
添加實例,即為抽象的概念創(chuàng)建個體。假設(shè)乘客從上海虹橋站出發(fā),乘坐G18次列車二等車席到達北京南站,并為北京的酒店、餐飲店、景區(qū)、交通分別添加實例:
城市類添加實例北京、上海;客運車站添加上海虹橋站和北京南站;客票添加ticket1客票;車種添加G18次高鐵列車;席別添加G18次07車5排F座;乘客添加王小明;公共交通添加北京4號線和14號線北京南站,6號線平安里站以及20路公交車;酒店添加北京市西城區(qū)某二星級酒店;餐飲店添加北京市西城區(qū)某人均消費為114元的餐廳。
實例添加完成后,補充各實例的對象屬性和數(shù)據(jù)屬性。
2.6 推理
Protege4.3自帶HermiT 1.3.8推理機可運行SWRL規(guī)則并實現(xiàn)推理。啟動推理機后,查看客票以及餐飲店實例,發(fā)現(xiàn)客票實例已根據(jù)車種、席別、里程劃分了客票類別,餐飲店實例根據(jù)人均消費劃分了餐飲店類別。
查看乘客實例王小明的推理結(jié)果,發(fā)現(xiàn)已實現(xiàn)對王小明的餐飲店、酒店、景區(qū)推薦(may_be_interested_in推理結(jié)果),并顯示目的地車站可搭乘的公共交通(can_take_public_transit推理結(jié)果)。
同樣地,在酒店、餐飲店、景區(qū)、公共交通實例的推理結(jié)果中,也顯示了推薦給乘客實例王小明的相應(yīng)逆向結(jié)果。
模型需要輸入的主要信息為:客票信息,包括客票車種席別、始發(fā)站、到達站、始發(fā)城市、到達城市、站間里程、出發(fā)日期時間;乘客與客票之間的購票關(guān)系;酒店信息,包括所處城市、星級及附近公共交通;餐飲店信息,包括所處城市、人均消費和附近公共交通;風(fēng)景區(qū)信息,包括所處城市和門票費用;客運車站公共交通信息。
從乘客的角度,輸出的信息為推薦的酒店、餐飲店、景區(qū)及到達車站的公共交通,如果點擊進入推薦的酒店、餐飲店、景區(qū)等實例,可進一步查看酒店的星級、地址和交通,餐飲店的人均消費、地址與交通,以及景區(qū)地址、門票費用和交通信息;從酒店、餐飲店、景區(qū)的角度,可以了解自己被推薦給了哪些乘客。
模型輸入信息為各類下實例的基本信息,輸出信息為實例之間的關(guān)系,對于不同的主體,還包括可查詢的輸出信息。
(1)本文模型為輕量型,只構(gòu)建了初步的思路和包含了大致的模型元素,還可以擴充數(shù)據(jù)來源,如訂票網(wǎng)站中旅客填寫的個人信息、在旅行網(wǎng)站中預(yù)定的產(chǎn)品等,達到添加拓展更多概念的目的,從而豐富模型中的類及關(guān)系屬性。同時,每個類也具有豐富的數(shù)據(jù)屬性可拓展性。如在模型分析部分所討論的,不同的實例主體可查看與自己有相應(yīng)關(guān)系的實例主體信息。乘客在酒店的推薦結(jié)果中,除了可以查看酒店的地址、星級及公共交通信息,還應(yīng)能夠查看酒店的聯(lián)系方式、評價等信息,從而為乘客提供更多的決策參考信息。對于酒店方面,還可另外查看乘客的出發(fā)日期時間以及到達日期時間,為酒店的準(zhǔn)備工作安排提供參考信息。
(2)模型從車種席別及旅客行程的里程兩個角度劃分旅客類型,為了使劃分結(jié)果更加精確有保障,還可增加劃分旅客類型的維度與方式:利用旅客出行時間,可劃分為春節(jié)、寒暑假、勞動節(jié)、清明節(jié)等假期出行以及非假期的平日出行;根據(jù)民族、籍貫等因素帶來的不同民俗文化與風(fēng)俗習(xí)慣,可以進一步對旅客進行分類;同時,旅客的職業(yè)、年齡、性別等因素也可幫助對旅客在消費習(xí)慣和消費水平方面的細分。
(3)對營銷產(chǎn)品也可進行對維度的劃分及進一步細分。酒店的分類可增加好評度、酒店風(fēng)格、酒店平均價格等因素;餐飲店可增加口味、好評度等因素。同時還可增加營銷產(chǎn)品的種類。
(4)在本文中,對客票數(shù)據(jù)的利用是一次性的,而我國鐵路客運售票系統(tǒng)每日有多達300萬余條的客票數(shù)據(jù)存儲在鐵路系統(tǒng)的各級數(shù)據(jù)庫中,鐵路客票年銷售量超過20億,這些歷史數(shù)據(jù)都非常有價值。通過大數(shù)據(jù)的分析方法,可以更為準(zhǔn)確地定位每位旅客,從而更準(zhǔn)確地實現(xiàn)精準(zhǔn)營銷。通過旅客客票的歷史數(shù)據(jù)可以分析旅客的購票習(xí)慣和消費習(xí)慣,以及歷史出行軌跡與出行時間等方面的出行習(xí)慣;同時可利用客票之間的關(guān)聯(lián)性,分析旅客的家庭關(guān)系網(wǎng),為當(dāng)前出行給予家庭導(dǎo)向性的產(chǎn)品營銷。
[1]駱泳吉,劉軍,馬敏書.客票數(shù)據(jù)“受限”條件下旅客選擇偏好估計[D].北京:北京交通大學(xué),2015.
[2]劉高原.基于客票特征數(shù)據(jù)的我國高速鐵路旅客出行行為分析研究[D].北京:北京交通大學(xué),2012.
[3]裴志遠,劉萬明.用模糊綜合評價方法分析旅客城際出行的選擇行為[J].交通運輸工程與信息學(xué)報,2004,2(1):86-91.
[4]王瑩,韓寶明,唐寶剛.基于既有線客票數(shù)據(jù)的客運專線旅客選擇行為研究[J].鐵道運輸與經(jīng)濟,2008,30(12):35-39.
[5]餐飲業(yè)消費的人群特征及趨勢研究數(shù)據(jù)報告[DB/OL].https:// wenku.baidu.com/view/237a167eb52acfc788ebc939.html.
本文受基金項目“中國鐵路總公司科技研究開發(fā)計劃課題(課題編號:2016X004-E);山東省社科基金(基金編號:14CGLJ20)”資助。