葛曉玲 陳婭梅 汪偉杰 藺彤 錢祎瑋
【摘?要】近年來,二手車市場(chǎng)規(guī)范化的進(jìn)程加快,交易也越來越興旺,但價(jià)格商品交易中的公平性卻難以體現(xiàn),為此,我們進(jìn)行了二手車估價(jià)模型的建立。
我們依據(jù)網(wǎng)上所獲得的二手車各個(gè)方面的信息,對(duì)二手車的價(jià)格做出模型估計(jì),由于變量眾多,我們依據(jù)散點(diǎn)圖篩選出了主要因素,針對(duì)數(shù)據(jù)利用了多元回歸的方法,擬合出了價(jià)格預(yù)測(cè)模型。
【關(guān)鍵詞】多元回歸;多元目標(biāo)規(guī)劃;MATLAB
1.1問題的描述及分析
此問題要求我們利用網(wǎng)上獲得的信息,考慮地區(qū),品牌,新車價(jià)格,汽車維修價(jià)值,車況等,對(duì)二手車的價(jià)格進(jìn)行件建模預(yù)測(cè)。根據(jù)從網(wǎng)上得到的數(shù)據(jù)信息,顧及到用戶滿意度和大眾購買傾向性,我們選定數(shù)據(jù)中的車輛狀況為正常,無出現(xiàn)重大事故。針對(duì)汽車維修價(jià)值這一因素,根據(jù)解釋,指的是汽車是否還有必要進(jìn)行維修,進(jìn)行公示定義,我們假設(shè)所有的車都處于同一種故障狀態(tài),即泡水狀態(tài),根據(jù)網(wǎng)上信息,我們得到泡水維修的平均價(jià)格為20000,我們認(rèn)為為汽車維修價(jià)值。
針對(duì)品牌因素,我們考慮的品牌所屬車系對(duì)于保值率的影響,經(jīng)過網(wǎng)上所了解到的信息得出各種車系的保值率排名為日系車,德系車,美系車,韓系車。而對(duì)于車輛產(chǎn)地我們考慮地區(qū)的經(jīng)濟(jì)發(fā)展因素,根據(jù)網(wǎng)上整理的人均GDP,將地區(qū)進(jìn)行分檔處理。
由于是要對(duì)二手價(jià)格進(jìn)行預(yù)測(cè),可采用多元回歸模型,對(duì)價(jià)格進(jìn)行預(yù)測(cè)。由于變量眾多,我們首先需要對(duì)因素進(jìn)行篩選,簡(jiǎn)化模型。
1.2模型的建立
多元線性回歸模型[1]是對(duì)數(shù)據(jù)進(jìn)行進(jìn)行擬合的常用模型,用來解決一個(gè)因變量受多種變量影響的情況,從而對(duì)因變量的發(fā)展起到解釋和預(yù)測(cè)的作用。例如,一個(gè)地區(qū)的經(jīng)濟(jì)發(fā)展,大學(xué)生的就業(yè)薪酬等。我們運(yùn)用最小二乘法對(duì)模型進(jìn)行參數(shù)估計(jì),得到擬合值。為了模型的準(zhǔn)確性,常進(jìn)行殘差的分析檢驗(yàn),適當(dāng)剔除異常數(shù)據(jù),從而得到更為優(yōu)化的改進(jìn)模型。
模型的求解步驟分為三步:
第一步:對(duì)模型中的參數(shù)進(jìn)行最小二乘法估計(jì),即應(yīng)選取估計(jì)值,使得當(dāng)時(shí),誤差平方和達(dá)到最小。令。
第二步:整理求導(dǎo)之后的方程,化為矩陣形式,可得出解為,帶回原模型得到的估計(jì)值,將變量的觀測(cè)值帶入,即可得到數(shù)據(jù)的擬合值。則為殘差。
觀察殘差圖,結(jié)合置信區(qū)間,得出最終結(jié)果。
1.3模型的求解
由于二手車價(jià)格的眾多,無法更好評(píng)估整個(gè)的價(jià)格走向,我們轉(zhuǎn)換為舊車與新車的百分比作為因變量進(jìn)行建模。首先我們進(jìn)行因素的篩選,為了更加直觀看出差將各個(gè)自變量與因變量進(jìn)行散點(diǎn)圖的描述。
首先進(jìn)行地區(qū)和百分比的散點(diǎn)圖的描述,如圖
由圖可知,圖上的點(diǎn)基本處于均勻分散狀態(tài),經(jīng)濟(jì)程度對(duì)折舊百分比沒有太大影響。
對(duì)于品牌保值率對(duì)折舊率的影響,我們做出如下散點(diǎn)圖
由圖可知,品牌產(chǎn)地對(duì)于折舊率的影響不是太大,但是根據(jù)保值率,應(yīng)當(dāng)是有一些聯(lián)系,經(jīng)查閱,由于每種車具體情況不同,車輛又分為低中高三個(gè)檔次,也便弱化了保值率的整體影響。
而對(duì)于維修價(jià)值和里程,在整個(gè)數(shù)據(jù)整理過程中便可發(fā)現(xiàn)其中有聯(lián)系。我們假設(shè)x1為里程變量,x2為維修價(jià)值。設(shè)式子,其中y表示折舊百分比。
利用MATLAB線性回歸程序,我們得出系數(shù)為:
相應(yīng)的置信區(qū)間如圖所示:
置信區(qū)間不包括零點(diǎn),擬合良好。
R2檢驗(yàn)趨向于1,由此可得到折舊率方程為
由此可得二手車價(jià)格的方程為Z=新車價(jià)格×折舊率
1.4模型的誤差分析
在本模型中,由于條件限制,將各個(gè)車輛的保值率算出較為艱難,未能將各類檔次的汽車進(jìn)行細(xì)化分類,導(dǎo)致保值率在對(duì)二手車影響的中被淡化。
并且將新車價(jià)格作為一個(gè)單獨(dú)變量列出,事實(shí)上,人們?cè)诳紤]二手車購買價(jià)格時(shí)存在心理因素的影響,車輛的原有價(jià)格會(huì)對(duì)二手價(jià)格造成一定的判斷影響作用。
3.4模型誤差分析
由于每輛車的品牌不同,車輛配置也不相同,因此新車價(jià)格會(huì)相差很大,所以我們采用了分檔的方法將車輛分成了三個(gè)檔次來進(jìn)行計(jì)算,由此也忽略了車輛檔次中的數(shù)量概率問題,對(duì)結(jié)果會(huì)造成一定的誤差。
并且,在對(duì)事故率進(jìn)行指數(shù)曲線擬合時(shí),我們采用的數(shù)據(jù)是車輛在一段路程上設(shè)置的故障修理點(diǎn)個(gè)數(shù),然后將他轉(zhuǎn)化為了里程上的概率值,這在實(shí)際操作中由于不可控的因素等問題,概率轉(zhuǎn)化上會(huì)造成誤差。
參考文獻(xiàn):
[1]司守奎.孫兆亮.數(shù)學(xué)建模算法與應(yīng)用.國防工業(yè)出版社.2015.4.P1-6
[2]百度知道.https://baijiahao.baidu.com
[3]司守奎.孫兆亮.數(shù)學(xué)建模算法與應(yīng)用.國防工業(yè)出版社.2015.4.P436
[4]駱穎哲.汽車故障事故風(fēng)險(xiǎn)評(píng)價(jià)方法研究.東北林業(yè)大學(xué)學(xué)位論文
(作者單位:1南京理工大學(xué);2南京審計(jì)大學(xué);3南京審計(jì)大學(xué);4南京審計(jì)大學(xué);5南京審計(jì)大學(xué))