李海闊,曾小杰
(1.西南石油大學(xué) 理學(xué)院,四川 成都 610500;2.西南石油大學(xué) 機(jī)電工程學(xué)院,四川 成都 610500)
“拍照賺錢”是互聯(lián)網(wǎng)時(shí)代的一種自助式服務(wù)模式,用戶通過(guò)手機(jī)APP領(lǐng)取需要拍照的任務(wù),賺取任務(wù)對(duì)應(yīng)的酬金,這樣的自助平臺(tái)為商家搜集商品數(shù)據(jù)信息提供了便利。在此模式下,任務(wù)的定價(jià)成為關(guān)乎平臺(tái)運(yùn)行的核心因素。本文主要研究了“拍照賺錢”任務(wù)的定價(jià)問(wèn)題,分析了影響任務(wù)定價(jià)的各種因素。同時(shí),根據(jù)任務(wù)定價(jià)的相關(guān)影響因素和任務(wù)完成情況設(shè)計(jì)了新的任務(wù)定價(jià)方案,取得了較好的效果。
本文數(shù)據(jù)源于2017年全國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽B題。
通過(guò)對(duì)附件1和附件2的數(shù)據(jù)分析發(fā)現(xiàn),任務(wù)號(hào)碼與會(huì)員編號(hào)的經(jīng)緯度只能是北緯與東經(jīng)(其他經(jīng)緯度都在海里),也就是在我國(guó)深圳市。其中,附件2中的會(huì)員編號(hào)B1175的北緯達(dá)到113.131 483,東經(jīng)為23.031 824,這是一個(gè)明顯的錯(cuò)誤參數(shù)。因此,這里把經(jīng)緯度進(jìn)行了交換,使得北緯為23.031 824,東經(jīng)為113.131 483.同時(shí),分析附件1和附件2中的數(shù)據(jù)發(fā)現(xiàn),大部分?jǐn)?shù)據(jù)集中在北緯[22.4,24],東經(jīng)為[112.5,115]。所以,對(duì)于附件2中的數(shù)據(jù)進(jìn)行了篩選與剔除(剔除數(shù)據(jù)表格),將北緯[22.4,24]與東經(jīng)[112.5,115]范圍之外的數(shù)據(jù)都剔除,剔除了會(huì)員編號(hào)B0005,B0006,B0007,B0022,B0039,B0048,B0082,B0472,B0136,B1708,B1727,B1822.
由于數(shù)據(jù)涉及會(huì)員之間的距離計(jì)算,而信息中僅僅提供坐標(biāo)經(jīng)緯度,所以,需將經(jīng)緯度與距離換算,具體如下。地球是一個(gè)近乎標(biāo)準(zhǔn)的橢球體,赤道半徑為6 378.140 km,極半徑為 6 356.755 km,平均半徑為6 371.004 km。假設(shè)地球是一個(gè)完美的球體,那么,它的半徑就是地球的平均半徑,記為R=6 371 km。如果以0°經(jīng)線為基準(zhǔn),那么,根據(jù)地球表面任意2點(diǎn)的經(jīng)緯度就可以計(jì)算出這2點(diǎn)間的地表距離(這里忽略地球表面地形給計(jì)算帶來(lái)的誤差,僅僅是理論上的估算值)。設(shè)第一點(diǎn)A的經(jīng)緯度為(x1,y1),第二點(diǎn)B的經(jīng)緯度為(x2,y2),過(guò)AB兩點(diǎn)的大圓的劣弧長(zhǎng)即為2點(diǎn)的實(shí)際距離。以地心為坐標(biāo)原點(diǎn)O,以赤道平面為XOY平面,以0°經(jīng)線圈所在的平面為XOZ平面建立三維直角坐標(biāo)系,則AB兩點(diǎn)的直角坐標(biāo)分別為[3]:A=(Rcosx1cosy1,Rsinx1cosy1,Rsiny1),B=(Rcosx2cosy2,Rsinx2cosy2,Rsiny2),則AB兩點(diǎn)的實(shí)際距離為:經(jīng)過(guò)化簡(jiǎn)
得:d=Rarccos[cos(x1-x2)cosy1cosy2+siny1siny2].
通過(guò)以上的數(shù)據(jù)處理,分析會(huì)員信息數(shù)據(jù)、新項(xiàng)目任務(wù)數(shù)據(jù)和已結(jié)束項(xiàng)目任務(wù)數(shù)據(jù),選取了數(shù)據(jù)分布集中區(qū)域,并做了與任務(wù)定價(jià)相關(guān)的因素分析,優(yōu)選出5個(gè)因素指標(biāo),即任務(wù)與會(huì)員最短距離、任務(wù)與任務(wù)最短距離、會(huì)員密度、平均預(yù)定限額和平均預(yù)定時(shí)間。對(duì)任務(wù)定價(jià)規(guī)律進(jìn)行了影響因素分析,結(jié)果表明,任務(wù)的定價(jià)和任務(wù)與會(huì)員的最短距離、任務(wù)與任務(wù)的最短距離呈正相關(guān)趨勢(shì),與會(huì)員密度、平均預(yù)定時(shí)間之間呈現(xiàn)負(fù)相關(guān)。
為了能夠建立出比較合理的任務(wù)定價(jià)方案,引入了簡(jiǎn)明的前向神經(jīng)網(wǎng)絡(luò)模型,即BP模型。BP網(wǎng)絡(luò)模型[1-2]是經(jīng)典的前向網(wǎng)絡(luò),主要由輸入層、隱層(可有若干層)和輸出層組成。一個(gè)具有任意的壓縮(Squashing)型激活函數(shù)(比如Sigmoid函數(shù)或雙曲正切函數(shù)等)的單隱層前向網(wǎng)絡(luò),只要有足夠的隱層單元,就能夠以任意的精度逼近任意一個(gè)有限維的波萊爾可測(cè)函數(shù)(Borel measurable function)。這表明,BP網(wǎng)絡(luò)可以作為一個(gè)通用的函數(shù)逼近器。事實(shí)上,基于BP網(wǎng)絡(luò)模型就是利用BP網(wǎng)絡(luò)模型的泛函逼近能力,完成特征空間到目標(biāo)空間的非線性映射。因此,根據(jù)前面分析的與任務(wù)定價(jià)的因素指標(biāo),即任務(wù)與會(huì)員的最短距離、任務(wù)與任務(wù)的最短距離、會(huì)員密度,平均預(yù)定限額、平均預(yù)定時(shí)間,建立任務(wù)定價(jià)的神經(jīng)網(wǎng)絡(luò)模型,并反復(fù)試算。隱層結(jié)點(diǎn)數(shù)選擇24是最佳結(jié)果,即5×24×1的任務(wù)定價(jià)的BP神經(jīng)網(wǎng)絡(luò)模型。任務(wù)定價(jià)的神經(jīng)網(wǎng)絡(luò)模型如圖1所示。
BP算法將神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)輸入輸出的映射問(wèn)題轉(zhuǎn)變?yōu)橐粋€(gè)非線性優(yōu)化問(wèn)題,可使用最優(yōu)化理論中的梯度下降算法,用迭代運(yùn)算修正網(wǎng)絡(luò)權(quán)重,以實(shí)現(xiàn)網(wǎng)絡(luò)輸出與期望輸出間的均方誤差最小化。BP神經(jīng)網(wǎng)絡(luò)由前向計(jì)算過(guò)程和誤差反向傳播過(guò)程組成。在前向計(jì)算過(guò)程中,輸入信息從輸入層經(jīng)隱層逐層處理,傳向輸出層,每一層神經(jīng)元的狀態(tài)只影響下一層神經(jīng)元的狀態(tài)。如果在輸出層得不到期望的輸出,則轉(zhuǎn)向反向傳播,將誤差信號(hào)沿原來(lái)的連接通路返回,通過(guò)修改各層的權(quán)重使得誤差信號(hào)最小。
圖1 任務(wù)定價(jià)的神經(jīng)網(wǎng)絡(luò)模型
前向計(jì)算過(guò)程分2步完成:
輸入信息經(jīng)輸入層處理,傳向隱層,得到:
信息由隱層輸入經(jīng)隱層處理,傳向輸出層,得到:
式(2)中:yk為輸出,即第k個(gè)任務(wù)定價(jià)的計(jì)算結(jié)果(k=1,2,…,N);為隱層第j節(jié)點(diǎn)與輸出層的連接權(quán)重(j
BP神經(jīng)網(wǎng)絡(luò)的誤差反向傳播過(guò)程與前向計(jì)算過(guò)程相關(guān)。在前向計(jì)算過(guò)程中,輸入信息從輸入層經(jīng)隱層處理,傳向輸出層。如果在輸出層得不到期望的輸出,則轉(zhuǎn)向反向傳播,將誤差信號(hào)沿原來(lái)的連接通路返回,通過(guò)修改各層的權(quán)重,使得誤差信號(hào)最小。
原數(shù)據(jù)一共為835個(gè),隨機(jī)選取了800個(gè)任務(wù)定價(jià)數(shù)據(jù)進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練,實(shí)際任務(wù)定價(jià)與訓(xùn)練任務(wù)定價(jià)的平均擬合誤差為1.65%,如表1、圖2所示。
表1 訓(xùn)練任務(wù)定價(jià)與原任務(wù)定價(jià)的擬合數(shù)據(jù)
圖2 訓(xùn)練任務(wù)定價(jià)與原任務(wù)定價(jià)的擬合
表2 預(yù)測(cè)任務(wù)定價(jià)與原任務(wù)定價(jià)
利用訓(xùn)練擬合好的網(wǎng)絡(luò),預(yù)測(cè)隨機(jī)選出的35個(gè)任務(wù)定價(jià)數(shù)據(jù),平均預(yù)測(cè)誤差為6.42%,如圖3所示。這表明,訓(xùn)練完成的神經(jīng)網(wǎng)絡(luò)系統(tǒng)能夠較好地適應(yīng)定價(jià)環(huán)境,同時(shí)也說(shuō)明所構(gòu)建的任務(wù)定價(jià)神經(jīng)網(wǎng)絡(luò)模型能夠較好地解決任務(wù)定價(jià)問(wèn)題。預(yù)測(cè)任務(wù)定價(jià)與原任務(wù)定價(jià)的相關(guān)情況如表2所示。
BP神經(jīng)網(wǎng)絡(luò)具有良好的非線性映射能力、自學(xué)習(xí)容錯(cuò)能力和數(shù)據(jù)融合的能力,具有一定的優(yōu)越性。由于各個(gè)影響因素與定價(jià)之間并非簡(jiǎn)單的線性或非線性關(guān)系,因而直接進(jìn)行統(tǒng)計(jì)分析效果不明顯。對(duì)于進(jìn)行因素指標(biāo)優(yōu)選之后構(gòu)建的三層神經(jīng)網(wǎng)絡(luò)系統(tǒng),導(dǎo)入實(shí)際的信息數(shù)據(jù),經(jīng)過(guò)對(duì)數(shù)據(jù)信息的提取與處理,最終獲得能夠適應(yīng)定價(jià)環(huán)境的映射關(guān)系,最終輸出預(yù)測(cè)定價(jià),模型思路與過(guò)程清晰,便于實(shí)現(xiàn)。但是,因?yàn)榻o出的有效因素和數(shù)據(jù)有限,導(dǎo)致建立的定價(jià)機(jī)制可能不夠完整。如果考慮任務(wù)難易程度和地區(qū)交通情況等因素,定價(jià)機(jī)制會(huì)更加準(zhǔn)確。另外,所建立的模型不僅適用于定價(jià)問(wèn)題,還可以拓展到諸多方面,比如神經(jīng)網(wǎng)絡(luò)可應(yīng)用于參數(shù)優(yōu)化和深度學(xué)習(xí)。
根據(jù)優(yōu)選出的5個(gè)因素指標(biāo)進(jìn)行訓(xùn)練,由于神經(jīng)網(wǎng)絡(luò)具有良好自學(xué)習(xí)容錯(cuò)能力,所以,能夠較好地反映出因素與定價(jià)規(guī)律之間的映射關(guān)系,并且將擬合的平均相對(duì)誤差控制在10%以內(nèi)。對(duì)于最終獲得的定價(jià)方案,其預(yù)測(cè)值與實(shí)際值的誤差僅為6.42%,能夠較好地解決任務(wù)定價(jià)問(wèn)題。
[1]焦李成.神經(jīng)網(wǎng)絡(luò)計(jì)算[M].西安:西安電子科技大學(xué)出版社,1993.
[2]王小川,史峰,郁磊,等.MATLAB神經(jīng)網(wǎng)絡(luò)43個(gè)案例分析[M].北京:北京航空航天大學(xué)出版社,2013.
[3]Koryako.根據(jù)兩點(diǎn)經(jīng)緯度計(jì)算距離[EB/OL].[引用時(shí)間不詳].http://blog.csdn.net/koryako/article/details/51864161.