李樂吟+戴靖宇+王姮冰
摘要:合理的任務(wù)定價(jià)是任務(wù)完成的關(guān)鍵,為了設(shè)計(jì)新的任務(wù)定價(jià)方案,文章建立以新的項(xiàng)目任務(wù)定價(jià)之和最小、任務(wù)的完成率最高為目標(biāo),多元線性回歸方程各個參數(shù)的取值范圍為約束條件的多目標(biāo)規(guī)劃模型。通過遍歷定價(jià)規(guī)律中各參數(shù)的值,求解不同參數(shù)下的定價(jià)金額,并利用支持向量機(jī)求解不同定價(jià)方案下的任務(wù)完成率,得到最優(yōu)定價(jià)方案的任務(wù)完成率為80%。
關(guān)鍵詞:多元線性回歸;多目標(biāo)規(guī)劃;支持向量機(jī)
一、研究背景
“拍照賺錢”在當(dāng)下互聯(lián)網(wǎng)時代越來越流行。這種基于移動互聯(lián)網(wǎng)的自助式平臺,為企業(yè)進(jìn)行各種商業(yè)檢查和信息搜集提供了便利。為了對任務(wù)進(jìn)行合理的定價(jià),使得任務(wù)完成率提高,本文首先確定任務(wù)定價(jià)的多元線性回歸方程,建立多目標(biāo)規(guī)劃模型,然后運(yùn)用遍歷算法和支持向量機(jī)求解多元回歸方程各參數(shù)值和任務(wù)完成率。
二、模型的建立與求解
(一)多元線性回歸方程的確定
通過數(shù)據(jù)分析,觀測出任務(wù)定價(jià)分布有兩個地理聚集中心,并利用MATLAB得到兩個聚集中心的具體位置為:A(22.1°N,115.8°E)、B(23.4°N,112.5°E)。同時對會員信息數(shù)據(jù)分析,得到任務(wù)點(diǎn)周圍的會員數(shù)量(會員密集度)、會員信譽(yù)值、任務(wù)密集度、會員預(yù)定時間對任務(wù)定價(jià)均有影響。定義會員密集度為以任務(wù)點(diǎn)為中心、以3km為半徑的圓周內(nèi)的會員數(shù)量。會員信譽(yù)值為以任務(wù)點(diǎn)為中心、以3km為半徑的圓周內(nèi)的會員信譽(yù)度的均值。會員預(yù)定時間以任務(wù)點(diǎn)為中心、以3km為半徑的圓周內(nèi)的會員預(yù)定時間的均值。
綜上得到,影響任務(wù)定價(jià)到的主要因素有:離中心點(diǎn)A的距離x1、離中心點(diǎn)B的距離x2、會員密集度x3、會員信譽(yù)值x4、任務(wù)密集度x5和會員預(yù)定時間x6。為分析這6個因素與定價(jià)之間的規(guī)律,建立以定價(jià)為因變量,以這6個因素為自變量的多元線性回歸模型。通過給定的定價(jià)以及各個參數(shù)的值求得多元線性回歸方程。
y=a x +a x +a x +a x +a x +a +εε~N(0,σ )
式中,a1,a2…,a7,σ2都是與x1,x2…,x6無關(guān)的未知參數(shù),其中a1,a2…,a7稱為回歸系數(shù)。
(二)多目標(biāo)規(guī)劃模型的建立
企業(yè)只有對未完成的任務(wù)點(diǎn)提升任務(wù)標(biāo)價(jià)才能使得任務(wù)完成率增加,考慮到企業(yè)資金的限制,盡可能使新的方案中對所有任務(wù)定價(jià)金額總和最少。定義任務(wù)點(diǎn)任務(wù)完成的數(shù)量占所有任務(wù)點(diǎn)的數(shù)量比例為p。于是建立以新的任務(wù)定價(jià)總和最小、任務(wù)的完成率最高為目標(biāo)函數(shù),以回歸方程各個參數(shù)的取值范圍作為約束條件建立多目標(biāo)規(guī)劃模型。
選取執(zhí)行完成的任務(wù)點(diǎn)的相關(guān)因素的值與其對應(yīng)的任務(wù)標(biāo)價(jià)做多元線性回歸,得到a1、a2、a3、a4、a5、a6、a7的合理取值范圍,若某個參數(shù)超過該范圍,則必然會導(dǎo)致執(zhí)行任務(wù)完成的點(diǎn)將不能完成任務(wù),建立多目標(biāo)規(guī)劃模型如下:
min yi
s.t.0.058≤a ≤0.1320.064≤a ≤0.138-0.111≤a ≤-0.078-0.0006≤a ≤-0.003-0.245≤a ≤-0.164-0.400≤a ≤-0.16022.404≤a ≤50.383
每個任務(wù)點(diǎn)對應(yīng)的有一個新的定價(jià),通過修改任務(wù)定價(jià)方案,使得任務(wù)完成率最大。在各因素參數(shù)取值范圍內(nèi)通過遍歷算法求取使得滿足新的任務(wù)定價(jià)總和最小以及任務(wù)完成率最大的新的任務(wù)定價(jià)方案。
(三)任務(wù)完成率的確定
為了分析不同的定價(jià)方案對任務(wù)完成率的影響,運(yùn)用支持向量機(jī)來求解不同定價(jià)方案下的任務(wù)完成率。其主要思想是找到一個超平面,使得它能夠盡可能多地將兩類數(shù)據(jù)點(diǎn)正確分開,同時使分開的兩類數(shù)據(jù)點(diǎn)的距離分類面最遠(yuǎn)。根據(jù)分類函數(shù),帶入相關(guān)因素的參數(shù)值對未知屬性的樣本進(jìn)行分類,從而求得任務(wù)完成率。
求取835組已完成項(xiàng)目各個因素的取值,其中x1為任務(wù)點(diǎn)距離A中心點(diǎn)的距離,x2為任務(wù)點(diǎn)距離B中心點(diǎn)的距離,x3為會員密度,x4為會員信譽(yù)值,x5為任務(wù)密度,x6為會員預(yù)定時間。如果完成了執(zhí)行任務(wù),則類型為1,如果未完成執(zhí)行任務(wù),則類型為0。如表1所示。
用i=1,…,835分別表示835個任務(wù)點(diǎn),第i個任務(wù)點(diǎn)的第j個指標(biāo)的取值為aij。yi=1表示第1類,yi=-1表示第0類。計(jì)算835個樣本點(diǎn)的均值向量:
μ=[μ1,…,μ6]=[119.45,253.43,
13.38,259.74,7.40,7.28]
835個樣本點(diǎn)的標(biāo)準(zhǔn)差向量為:
σ=[σ1,…,σ6]=[41.98,42.41,12.16,
814.22,5.00,1.48]
對所有樣本點(diǎn)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理:
對應(yīng)稱 j= ,j=1,2,…,6為標(biāo)準(zhǔn)化指標(biāo)變量, =[ 1,…, 6]T。記標(biāo)準(zhǔn)化后的835個已分類樣本點(diǎn)數(shù)據(jù)行向量為bi=[ i1,…, i6],i=1,…,835。求得支持向量共為658個,記支持向量為bi,得分類函數(shù)為:
c( )= βiK(bi, )+b
式中βi=αiyi, =[ 1,…, 6],K(bi· )當(dāng)已知各因素參數(shù)值時,可以利用分類函數(shù)求解該任務(wù)點(diǎn)在執(zhí)行時是否可以完成,即當(dāng)c( )≥0, 屬于第1類,當(dāng)c( )<0, 屬于0類。從而根據(jù)屬于1類的任務(wù)數(shù)目占總?cè)蝿?wù)的比例確定任務(wù)完成率。
(四)模型的求解
在給定各因素參數(shù)取值范圍的情況下,對各因素的參數(shù)值進(jìn)行遍歷,分別求得其對應(yīng)的定價(jià)金額和利用支持向量機(jī)求得任務(wù)完成率。通過對數(shù)據(jù)的分析,發(fā)現(xiàn)任務(wù)完成率與加價(jià)金額(新的任務(wù)定價(jià)與原定價(jià)之差)呈一定的曲線關(guān)系,故分析不同加價(jià)金額與該金額下的任務(wù)完成率的關(guān)系,如圖1所示。
分析圖1發(fā)現(xiàn),隨著加價(jià)金額的增加,任務(wù)完成率逐漸增加,但增長速率越來越小。在企業(yè)不給于任何加價(jià)時,任務(wù)的完成度只能達(dá)到63%,即只有522個任務(wù)點(diǎn)可以完成任務(wù)。在加價(jià)總金額在0~132元之間時,任務(wù)完成率的增長較快,并能在加價(jià)132元時達(dá)到80%的任務(wù)完成率,即共有668個任務(wù)點(diǎn)可以完成任務(wù)。在加價(jià)132~955元時,任務(wù)完成率增長減慢,即任務(wù)完成率只增加了2%。在加價(jià)16204元時,任務(wù)完成率達(dá)到了94%,共有780個任務(wù)點(diǎn)完成任務(wù)。但是企業(yè)所需要給予的加價(jià)金額達(dá)到16204元。
綜合考慮到為使項(xiàng)目標(biāo)價(jià)金額總和越小越好,任務(wù)完成率越高越好,選取在加價(jià)132元時作為新的任務(wù)定價(jià)方案。求得新的任務(wù)定價(jià)規(guī)律為:
y=0.09486x1+0.1012x2-0.0944x3-0.00046x4-0.2045x5-0.28x6+36.393
三、結(jié)語
通過對求得的數(shù)據(jù)分析可知,新的項(xiàng)目定價(jià)越高,任務(wù)完成率越高,但企業(yè)需要支付的金額越多,不利于企業(yè)的發(fā)展。在增加項(xiàng)目定價(jià)總和132元時達(dá)到80%的任務(wù)完成率,即共有668個任務(wù)點(diǎn)可以完成任務(wù),任務(wù)完成率較高。文中運(yùn)用支持向量機(jī)快速高效求解不同任務(wù)定價(jià)方案下的任務(wù)完成率,更方便、準(zhǔn)確率高。最后求得新的定價(jià)規(guī)律得到的定價(jià)值與原任務(wù)點(diǎn)完成的標(biāo)價(jià)值誤差,發(fā)現(xiàn)誤差較小,從而驗(yàn)證了模型的正確性。
參考文獻(xiàn):
[1]卓金武,李必文,魏永生,秦健.MATLAB在數(shù)學(xué)建模中的應(yīng)用[M].北京航空航天大學(xué)出版社,2010.
[2]張志涌,楊祖櫻.MATLAB教程[M].北京航空航天大學(xué)出版社,2015.
[3]司守奎,孫璽.數(shù)學(xué)建模算法與分析[M].國防工業(yè)出版社,2011.
[4]姜雪.應(yīng)用支持向量機(jī)評價(jià)土壤環(huán)境質(zhì)量[J].中國環(huán)境科學(xué),2014(05).
*本文系2017高教社杯全國大學(xué)生數(shù)學(xué)建模競賽決賽B題解題方案(具體題目詳見公開資料)。
(作者單位:南京郵電大學(xué))endprint