• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于關(guān)聯(lián)分析的互聯(lián)網(wǎng)商戶評分研究

      2017-05-10 00:29:14郭少友簡丹
      創(chuàng)新科技 2017年2期
      關(guān)鍵詞:相關(guān)分析回歸分析

      郭少友+簡丹

      [摘 要] 本文通過采集網(wǎng)站上1 500家餐飲商戶的評分數(shù)據(jù),利用SPSS軟件對其進行相關(guān)分析和回歸分析,挖掘餐飲商戶評分數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系。通過相關(guān)分析找出用戶評分時的打分習慣,發(fā)現(xiàn)用戶對于各項評分打分時存在關(guān)聯(lián)關(guān)系,通過回歸分析判斷商戶的總評分與各項評分之間的關(guān)聯(lián),發(fā)現(xiàn)他們之間存在線性關(guān)系。

      [關(guān)鍵詞] 商戶評分數(shù)據(jù);相關(guān)分析;回歸分析;SPSS

      [中圖分類號] F713 [文獻標識碼] A [文章編號] 1671-0037(2017)2-44-3

      Research of Internet Business Rating Based on Correlation Analysis

      ——A Case of the Rating Data for Catering Businesses

      Guo Shaoyou Jian Dan

      (School of Information Management,Zhengzhou University,Zhengzhou Henan 450001)

      Abstract: In this paper, we collected the rating data of 1500 catering businesses on the website, and conducted correlation analysis and regression analysis using SPSS software to find the relation between the rating data of the catering businesses. We found out users' grating habit via correlation analysis and found that there was a correlation between different individual scores of the users. And we judged the correlation between the overall score and individual scores via regression analysis and found that they had linear relationship.

      Key words: rating data for businesses; correlation analysis; regression analysis; SPSS

      1 引言

      現(xiàn)代的消費模式往往會伴隨著口碑評價信息,人們在選擇商戶的時候經(jīng)常會參考網(wǎng)站上的商家評分信息,為了研究這些網(wǎng)站上的評分數(shù)據(jù),筆者采集了1 500家餐飲商戶的評分數(shù)據(jù),對其進行關(guān)聯(lián)分析,使用相關(guān)分析和回歸分析的方法,找出用戶打分習慣之間的關(guān)聯(lián),計算出商戶總評分與各項評分之間的關(guān)聯(lián)。

      在學術(shù)領(lǐng)域,對于商戶評分數(shù)據(jù)的分析方面研究較少,只有此篇文章供參考。曾晨、張瑾[1]利用數(shù)據(jù)堂網(wǎng)站上的商戶評分數(shù)據(jù)集,使用R語言編寫程序,對商戶評分數(shù)據(jù)進行聚類分析、關(guān)聯(lián)分析、決策樹分析,探索不同類別商戶的評分高低,利用聚類分析將商戶分級,利用決策樹分析幫助消費者選擇商家。

      筆者受此研究的啟發(fā),選擇研究商戶評分數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系。在數(shù)據(jù)上,根據(jù)分析需求直接從網(wǎng)站上采集最新的數(shù)據(jù)集合,保證數(shù)據(jù)集的針對性和時效性;在分析方法上,采用統(tǒng)計學上的回歸分析與相關(guān)分析方法,分析商戶評分之間的關(guān)聯(lián)關(guān)系;在分析工具上,選擇已有的統(tǒng)計學軟件SPSS對于數(shù)據(jù)進行計算處理[2]。

      2 餐飲商戶評分數(shù)據(jù)的關(guān)聯(lián)分析

      本文的商戶評分關(guān)聯(lián)分析主要分為兩個部分,首先使用相關(guān)分析找出不同商戶評分間的關(guān)聯(lián),之后使用回歸分析找出商戶總評分與各項評分之間的關(guān)聯(lián),挖掘商戶評分間的關(guān)聯(lián)關(guān)系。

      2.1 餐飲商戶評分數(shù)據(jù)的來源

      筆者所用的數(shù)據(jù)是使用八爪魚采集器[3],于2016年8月將大眾點評網(wǎng)鄭州地區(qū)人氣最高的1 500家商戶的評分數(shù)據(jù)采集下來,匯總成excel形式,采集的字段信息包括商家的名稱、地址、總評分、口味評分、環(huán)境評分和服務(wù)評分六個字段信息。

      2.2 餐飲商戶評分數(shù)據(jù)的相關(guān)分析

      相關(guān)分析指的是分析兩個變量之間相關(guān)關(guān)系的一種分析方法,常使用兩個變量間的相關(guān)系數(shù)來衡量,相關(guān)系數(shù)越接近于1,變量之間的相關(guān)關(guān)系越密切[4]。在本文研究中,筆者通過計算商戶評分之間相關(guān)關(guān)系,找出不同評分之間的關(guān)聯(lián)關(guān)系。

      在該電商網(wǎng)站上用戶對商家進行打分的時候,需要從口味、環(huán)境和服務(wù)這三方面對商戶進行打分,為了驗證這三個評分是否存在某種關(guān)聯(lián),我們通過兩兩計算商戶不同評分間的相關(guān)系數(shù),來判斷二者間的關(guān)系[5-6],評分A與評分B之間的關(guān)系系數(shù)計算公式如公式1所示。

      R= (1)

      R表示評分A與評分B間的相關(guān)系數(shù),和分別為評分A和評分B的樣本值,和分別表示評分A和評分B樣本值的均值,在實際操作中,該相關(guān)系數(shù)可通過將樣本值錄入到軟件中,由軟件直接計算得出。

      筆者選擇使用SPSS分析軟件,將這1 500家商戶的評分輸入到SPSS中進行相關(guān)分析,結(jié)果如表1所示。

      用Pearson相關(guān)系數(shù)來判斷變量間的關(guān)系時,相關(guān)系數(shù)越大,二者的相關(guān)關(guān)系越大。從表格當中,我們可以看到關(guān)系系數(shù)的P值都約等于0,所以該統(tǒng)計分析顯著。

      環(huán)境與服務(wù)評分的相關(guān)系數(shù)是0.887,二者相關(guān)度極強;口味與服務(wù)評分的相關(guān)系數(shù)為0.822,二者相關(guān)度較高;口味和環(huán)境評分的相關(guān)系數(shù)為0.713,二者比較相關(guān)??梢钥闯觯P(guān)系最密切的是環(huán)境與服務(wù)評分間的關(guān)系,因為通常一家裝修環(huán)境較好的餐廳,代表其定位比較高,會在各方面為顧客考慮,所以通常服務(wù)質(zhì)量也會比較高,因而環(huán)境與服務(wù)評分之間的關(guān)系比較緊密。

      2.3 餐飲商戶評分數(shù)據(jù)的回歸分析

      回歸分析是將有關(guān)變量還原到數(shù)學模型當中,從而來評估事物間關(guān)系的一種分析方法。通過樣本值來估計回歸模型中的各項參數(shù),再將參數(shù)值帶入回歸模型生成回歸方程,利用回歸方程表達事物之間的關(guān)聯(lián)關(guān)系。

      商戶的總評分代表商戶的綜合水平,與各項評分間應(yīng)該具有某種關(guān)系,為確定商戶的總評分與各項評分之間的關(guān)聯(lián),驗證商戶總評分的依據(jù),我們假設(shè)商戶的總評分與各項評分存在線性關(guān)系,使用回歸分析對其進行分析。令商戶的總評分為y,表示因變量;令口味評分為,服務(wù)評分為,環(huán)境評分為,表示三個自變量,令設(shè)自變量的參數(shù)為、、,常數(shù)為c,則該回歸分析的回歸模型如公式2所示。

      由于回歸分析是根據(jù)變量的樣本值計算變量的參數(shù),從而來判斷不同變量之間的關(guān)系,參數(shù)的估計方法使用最小二乘法,依次將變量的樣本值帶入回歸模型,聯(lián)立方程求出參數(shù),實際過程中,可以利用軟件實現(xiàn)參數(shù)的計算[7]。

      將采集的1 500家餐飲商戶的總評分與餐飲商戶的口味、環(huán)境、服務(wù)三方面的評分輸入到SPSS軟件中,進行回歸分析,為了避免三個評分之間互相影響,我們選擇逐步回歸對數(shù)據(jù)進行處理,依次將重要的變量引入方程當中,避免共線性的問題,回歸結(jié)果如表2所示。

      通過表2我們可以看到,把對回歸模型影響最大的變量依次回歸入方程中,R方的值越來越趨近于1且誤差值越來越小,當三個變量都引入回歸模型時,此回歸模型的R方值為0.825且誤差為0.677 2,D-W值為1.855,表明該回歸方程較為準確,商戶的總評分與口味、服務(wù)和環(huán)境評分確實呈線性關(guān)系,假設(shè)成立,商戶的總評分與各項評分呈線性關(guān)系。

      該回歸分析的回歸系數(shù)如表3所示,將方程的各項系數(shù)帶入到回歸模型中,此時,該回歸方程如公式3所示。

      可以看出,商戶的總評分與用戶打的三個評分之間呈線性關(guān)系。自變量前的參數(shù)越大,表明該變量與因變量商戶總評分間關(guān)系越密切,所以最能影響商戶總評分的因素依次為口味評分、服務(wù)評分、環(huán)境評分,該網(wǎng)站商戶的總評分依靠商戶的各項評分計算出來,所以值得信任。

      3 結(jié)語

      本文通過統(tǒng)計學中的相關(guān)分析與回歸分析方法,找出商戶評分數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,分析發(fā)現(xiàn),商戶的口味評分與環(huán)境評分關(guān)系極為密切,商戶的總評分與各項評分間呈線性關(guān)系,驗證了商戶總評分的可信度。遺憾的是本文依然存在一些不足之處,體現(xiàn)在:一是樣本量不足,在原始數(shù)據(jù)上,樣本量為1 500條,屬于對餐飲商戶的一個抽樣調(diào)查,如果能得到所有的餐飲商戶評分,會使得分析的結(jié)果更為準確;二是依賴軟件計算。在計算方法上主要是用SPSS軟件實現(xiàn)計算,并沒有考慮到軟件計算的誤差問題。

      參考文獻:

      [1] 曾晨,張瑾,張瑞.基于數(shù)據(jù)挖掘方法下的大眾點評網(wǎng)美食類商家評分研究[A].中國統(tǒng)計教育學會.2015年(第四屆)全國大學生統(tǒng)計建模大賽論文[C].中國統(tǒng)計教育學會,2015.

      [2] 黃中文.SPSS統(tǒng)計分析與應(yīng)用[M].北京:電子工業(yè)出版社,2016.

      [3] 尤建新,孟銀薇.基于Web數(shù)據(jù)挖掘的網(wǎng)站知識獲取及應(yīng)用——以大眾點評網(wǎng)為例[J].上海大學學報(自然科學版),2014(3):261-273.

      [4] 鄭淞月,劉益,楊偉,等.基于美團網(wǎng)的產(chǎn)品因素對網(wǎng)絡(luò)團購影響因素實證研究[J].管理學報,2013(3):397-403.

      [5] 丁學君.網(wǎng)絡(luò)環(huán)境下口碑信息可信度影響因素的實證研究[J].中國經(jīng)貿(mào)導刊,2012(29):75-77.

      [6] Yan X,Wang J Chau.Customer revisit intention to restaurants:Evidence from online reviews[J].Information Systems Frontiers, 2015(3):645-657.

      [7] 黃冰毅.餐飲類網(wǎng)絡(luò)團購策略研究——基于大眾點評網(wǎng)的數(shù)據(jù)分析[J].電子商務(wù),2016(3):48-49.

      猜你喜歡
      相關(guān)分析回歸分析
      關(guān)于高校體育教學組織形式的相關(guān)分析
      城鄉(xiāng)居民醫(yī)療費用的相關(guān)性與回歸分析
      基于變形監(jiān)測的金安橋水電站壩體穩(wěn)定性分析
      價值工程(2016年29期)2016-11-14 01:56:12
      寶雞市區(qū)空氣質(zhì)量變化分析
      價值工程(2016年29期)2016-11-14 00:44:40
      森林碳匯影響因素的計量模型研究
      中國市場(2016年33期)2016-10-18 13:00:47
      河北省城鎮(zhèn)居民人均可支配收入與消費統(tǒng)計分析
      商(2016年27期)2016-10-17 05:53:09
      河南省經(jīng)濟增長質(zhì)量與創(chuàng)新能力關(guān)系的實證分析
      河南省能源消費與經(jīng)濟增長實證分析
      商情(2016年11期)2016-04-15 20:04:07
      清原| 通榆县| 来宾市| 穆棱市| 溆浦县| 长泰县| 韶山市| 铜鼓县| 谷城县| 丰台区| 富锦市| 巴彦淖尔市| 泌阳县| 乌苏市| 尼木县| 钦州市| 隆安县| 泗阳县| 扶余县| 乡城县| 宜昌市| 定襄县| 绍兴市| 文昌市| 广昌县| 扎鲁特旗| 囊谦县| 都昌县| 张家川| 汝阳县| 张掖市| 济阳县| 曲靖市| 嫩江县| 会昌县| 敖汉旗| 甘南县| 句容市| 南昌县| 安宁市| 汝城县|