羅嬌霞 彭文武 陳政 劉杰
摘? 要: 傳統(tǒng)基于方差分析方法的線上消費(fèi)行為空間特征自動(dòng)分析系統(tǒng)存在系統(tǒng)吞吐率低的問題,為此設(shè)計(jì)基于空間特征的線上消費(fèi)行為空間特征自動(dòng)分析系統(tǒng)。硬件選擇DSP處理核心和ARM處理核心組合成雙核處理模式,通過不同的接口實(shí)現(xiàn)消費(fèi)者消費(fèi)行為特征的采集與傳輸;軟件通過驅(qū)動(dòng)代碼實(shí)現(xiàn)硬件與軟件的連接,計(jì)算消費(fèi)者對(duì)于空間特征的所屬性和消費(fèi)行為路徑的相似性,完成對(duì)線上消費(fèi)行為空間特征的自動(dòng)分析。測(cè)試結(jié)果表明,與傳統(tǒng)分析系統(tǒng)相比,設(shè)計(jì)的基于空間特征的線上消費(fèi)行為空間特征自動(dòng)分析系統(tǒng)的吞吐率是傳統(tǒng)分析系統(tǒng)的2倍,說明所設(shè)計(jì)的系統(tǒng)更適合應(yīng)用在實(shí)際項(xiàng)目中。
關(guān)鍵詞: 空間特征自動(dòng)分析; 線上消費(fèi)行為; 系統(tǒng)設(shè)計(jì); 雙核處理模式; 行為特征采集; 系統(tǒng)測(cè)試
中圖分類號(hào): TN830.1?34; TP391? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼: A? ? ? ? ? ? ? ? ? ? ? 文章編號(hào): 1004?373X(2020)20?0034?03
Spatial feature based automatic analysis system of online consumption
behavior spatial feature
LUO Jiaoxia1, PENG Wenwu2, CHEN Zheng3, LIU Jie2
(1. Central South University of Forestry and Technology, Changsha 410004, China; 2. Hunan Institute of Technology, Hengyang 421002, China;
3. Hunan Institute of Traffic Engineering, Hengyang 421001, China)
Abstract: As the online consumption behavior spatial feature automatic analysis system based on the traditional variance analysis method has low throughput, a spatial feature based automatic analysis system of spatial feature of online consumption behavior is designed. In the hardware, the DSP processing core and ARM processing core are selected to form the dual?core processing mode, and the collection and transmission of consumer consumption behavior features are realized through different interfaces. In the software, the connection between hardware and software is realized by driving code, and the attribute of consumers′spatial feature and the similarity of consumption behavior path are calculated to complete the automatic analysis of the spatial feature of online consumption behavior. The testing results show that the throughput of the spatial feature based designed automatic analysis system of spatial feature of online consumption behavior is twice as high as that of the traditional analysis system, which explains that the designed system is more suitable for practical projects.
Keywords: spatial feature automatic analysis; online consumption behavior; system design; dual?core processing mode; behavior feature collection; system testing
0? 引? 言
隨著移動(dòng)互聯(lián)技術(shù)的迅速發(fā)展,互聯(lián)網(wǎng)普及率增高,網(wǎng)民數(shù)量呈現(xiàn)逐年增長(zhǎng)的趨勢(shì),線上購(gòu)物已經(jīng)成為人們生活中不可缺失的一部分[1?2]。線上消費(fèi)具有巨大的潛力。分析線上消費(fèi)行為,得到居民消費(fèi)所關(guān)注的具體內(nèi)容。針對(duì)不同的消費(fèi)人群組合成最優(yōu)組合,提高居民對(duì)線上消費(fèi)的滿意度,對(duì)于沒有線上消費(fèi)經(jīng)驗(yàn)和線上消費(fèi)較少的消費(fèi)者具有指導(dǎo)意義[3]。
隨著線上消費(fèi)者的增加,使用方差分析方法對(duì)常規(guī)線上消費(fèi)行為分析已經(jīng)不能滿足當(dāng)前需求。由于處理的數(shù)據(jù)量過于龐大,造成系統(tǒng)吞吐率較低[4?5]。為了解決這一問題,設(shè)計(jì)基于空間特征的線上消費(fèi)空間特征自動(dòng)分析系統(tǒng)。通過設(shè)計(jì)多目標(biāo)跟蹤模塊,獲得消費(fèi)者不同消費(fèi)信息,利用空間特征剖析線上消費(fèi)空間三元特征,避免冗余數(shù)據(jù)的干擾,解決常規(guī)系統(tǒng)中存在的問題。
1? 自動(dòng)分析系統(tǒng)設(shè)計(jì)
1.1? 系統(tǒng)硬件設(shè)計(jì)
本文系統(tǒng)通過跟蹤技術(shù)獲取線上消費(fèi)信息以及消費(fèi)時(shí)的環(huán)境信息。為了滿足系統(tǒng)硬件功能,采用ARM處理器和DSP處理的雙核模式。其中ARM作為主控制器,控制硬件中串口通信、數(shù)據(jù)傳輸以及線程調(diào)度等功能。DSP控制器負(fù)責(zé)獨(dú)立處理計(jì)算量較大的分析算法,系統(tǒng)硬件框圖如圖1所示。
ARM處理器負(fù)責(zé)處理獲取的消費(fèi)者消費(fèi)行為信息及相關(guān)的數(shù)據(jù)處理,DSP處理器負(fù)責(zé)計(jì)算量比較大的跟蹤算法[6]。其中ARM處理器的任務(wù)多數(shù)都是計(jì)算量較小的任務(wù),ARM處理器選擇ARM926EJ?S作為核心,工作主頻為297 MHz,滿足實(shí)際工作的需求[7]。DSP處理器選擇C64X+作為核心,工作頻率為594 MHz,在DSP核心中設(shè)置4個(gè)DACs和1個(gè)編碼器,減少DSP處理器的任務(wù)量[8]。
在核心處理器上設(shè)置2個(gè)輸出接口,其中ATA硬盤接口與上位機(jī)相連,存儲(chǔ)消費(fèi)者的跟蹤數(shù)據(jù),通過以太網(wǎng)接口滿足上位機(jī)對(duì)消費(fèi)者消費(fèi)行為的跟蹤和相關(guān)數(shù)據(jù)的采集。
1.2? 系統(tǒng)軟件設(shè)計(jì)
通過void main定義軟件與硬件連接方法,利用NumCode設(shè)置不同的串口,不同串口的連接通過connect實(shí)現(xiàn),利用for循環(huán)語句循環(huán)串口,最后通過驅(qū)動(dòng)完成軟件與硬件部分的連接[9?10]。
將獲取的空間數(shù)據(jù)按照內(nèi)在相似性分為若干個(gè)類別,使同一類別內(nèi)相似性較大,類別較小[11]。假設(shè)消費(fèi)者線上消費(fèi)空間到訪記錄為[uv]的矩陣[W],則:
[W=α11α12…α1vα21α22…α2v????αu1αu2…αuv] (1)
式中:[α]的取值為1或0;[αuv]表示消費(fèi)者[u]是否訪問過單位空間[v]。采用聚類算法,更新空間內(nèi)的聚類中心,使每個(gè)空間特征樣本到其最近聚類中心的距離平方和最小[12]。計(jì)算閾值,衡量消費(fèi)者對(duì)其自身空間特征的所屬性,即:
[k=xu-yumaxxu,yu] (2)
式中:[k]表示消費(fèi)者[u]空間特征樣本的閾值;[xu]表示該樣本到統(tǒng)一類別內(nèi)的其他樣本的平均距離;[yu]表示樣本到不同類別樣本平均距離。正常情況下,[k]的取值范圍在[-1,1],值越大表示對(duì)自身空間特征類的所屬性越強(qiáng)。在同一空間內(nèi),只有路徑間相似性強(qiáng),才能成為典型的消費(fèi)行為空間特征[13]。測(cè)試消費(fèi)者消費(fèi)路徑相似性的指標(biāo)計(jì)算如下:
[ruv=buv1+quv] (3)
式中:[ruv]表示相似性指標(biāo);[buv]表示消費(fèi)行為路徑間相同節(jié)點(diǎn)數(shù)量占總節(jié)點(diǎn)數(shù)的比例;[quv]為空間特征距離。當(dāng)消費(fèi)行為路徑之間完全相同時(shí),[ruv=1];當(dāng)兩者完全不同時(shí),[ruv=0]。
2? 系統(tǒng)性能測(cè)試
2.1? 系統(tǒng)測(cè)試環(huán)境及相關(guān)技術(shù)
測(cè)試操作系統(tǒng)在Windows 10的計(jì)算機(jī)中進(jìn)行,采用Java語言和C++語言實(shí)現(xiàn)。軟件開發(fā)平臺(tái)為Eclipse。系統(tǒng)軟件調(diào)用的擴(kuò)展庫(kù)主要有JMF,通過Java語言調(diào)用JMF類實(shí)現(xiàn)對(duì)線上消費(fèi)行為數(shù)據(jù)的讀取。計(jì)算機(jī)內(nèi)存為8 GB,硬盤內(nèi)存為500 GB,CPU為i5?8600K。
2.2? 線上消費(fèi)行為數(shù)據(jù)集準(zhǔn)備
線上消費(fèi)行為空間特征自動(dòng)分析系統(tǒng)性能測(cè)試使用的數(shù)據(jù)集來自淘寶電子商務(wù)網(wǎng)站。因淘寶網(wǎng)站的產(chǎn)品數(shù)據(jù)品種較多,零售商較多,其中包含的數(shù)據(jù)量龐大,產(chǎn)品種類豐富,具有較強(qiáng)的代表性。數(shù)據(jù)集中包括消費(fèi)者的線上消費(fèi)行為數(shù)據(jù)以及消費(fèi)產(chǎn)品各項(xiàng)屬性,將數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)庫(kù)中,使用MySQL數(shù)據(jù)庫(kù)管理數(shù)據(jù),并通過相同的消費(fèi)產(chǎn)品將用戶關(guān)聯(lián)起來,對(duì)數(shù)據(jù)表中的MEAN_ID屬性進(jìn)行關(guān)聯(lián),并以MEAN_ID1,MEAN_ID2的格式保存在txt文檔中。通過txt2pajek工具,將txt文檔轉(zhuǎn)換為可視化工具Pajek軟件處理NET形式的文檔。數(shù)據(jù)中用戶關(guān)系網(wǎng)如圖2所示。
圖2中的點(diǎn)表示不同用戶的MEAN_ID。從圖中可以看出,線上消費(fèi)用戶之間形成了一個(gè)龐大而復(fù)雜的網(wǎng)絡(luò),在系統(tǒng)測(cè)試中默認(rèn)該復(fù)雜網(wǎng)絡(luò)確實(shí)存在。
在此基礎(chǔ)上,將數(shù)據(jù)匯總為流量,設(shè)置成10組不同上行和下行流量,多次測(cè)試分析系統(tǒng)的性能。線上行為信息數(shù)據(jù)流量具體設(shè)置如表1所示。
使用以上準(zhǔn)備的測(cè)試數(shù)據(jù),測(cè)試系統(tǒng)吞吐率,驗(yàn)證系統(tǒng)的數(shù)據(jù)處理能力強(qiáng)弱。
2.3? 系統(tǒng)吞吐率結(jié)果及分析
在以上測(cè)試環(huán)境中,使用準(zhǔn)備好的數(shù)據(jù)測(cè)試系統(tǒng)吞吐率。系統(tǒng)吞吐率是系統(tǒng)在單位時(shí)間內(nèi)滿負(fù)載的情況下,每秒處理數(shù)據(jù)流量的能力。
為了驗(yàn)證設(shè)計(jì)的基于空間特征的線上消費(fèi)行為空間特征自動(dòng)分析系統(tǒng)的性能,通過與傳統(tǒng)方差分析方法的分析系統(tǒng)進(jìn)行對(duì)比,在相同的測(cè)試環(huán)境下,針對(duì)同一數(shù)據(jù)集測(cè)試。為了比對(duì)方便,采用統(tǒng)計(jì)軟件統(tǒng)計(jì)結(jié)果。測(cè)試結(jié)果如圖3所示。
分析圖3可以看出,圖3a)中顯示在一定時(shí)間內(nèi),該系統(tǒng)下行流量數(shù)據(jù)的吞吐量在30~45 MB之間,上行流量數(shù)據(jù)在5~10 MB之間,經(jīng)過計(jì)算可知該系統(tǒng)的吞吐率為25.6 MB/s。圖3b)中系統(tǒng)下行流量數(shù)據(jù)的吞吐量在25~33 MB之間,上行流量數(shù)據(jù)的吞吐量在0~6 MB之間,經(jīng)過計(jì)算系統(tǒng)的吞吐率為12.7 MB/s。證明本文所設(shè)計(jì)系統(tǒng)的數(shù)據(jù)吞吐率更好,性能更優(yōu)越。
3? 結(jié)? 語
線上消費(fèi)形式在現(xiàn)今社會(huì)消費(fèi)背景下逐漸滲入人們的日常生活中,隨著線上消費(fèi)的普及,線上消費(fèi)空間也逐漸成為重要研究對(duì)象之一。本文設(shè)計(jì)基于空間特征的線上消費(fèi)行為空間特征自動(dòng)分析系統(tǒng),利用空間特征分析用戶線上消費(fèi)行為,找尋其中的規(guī)律,制定使消費(fèi)者更滿意的消費(fèi)對(duì)策。經(jīng)過系統(tǒng)性能測(cè)試,證明了該系統(tǒng)各功能正常,并且有效地解決了常規(guī)的分析系統(tǒng)中存在的問題,具有一定的現(xiàn)實(shí)意義。
注:本文通訊作者為陳政。
參考文獻(xiàn)
[1] 韓增林,謝永順,劉天寶,等.大連市初中教育消費(fèi)者的社會(huì)空間結(jié)構(gòu)研究[J].地理科學(xué),2018,38(7):1129?1138.
[2] 郎月華,李仁杰,傅學(xué)慶.基于GPS軌跡柵格化的旅游行為空間模式分析[J].旅游學(xué)刊,2019,34(6):48?57.
[3] 劉金花,李向,鄭新奇.多尺度視角下資源環(huán)境承載力評(píng)價(jià)及其空間特征分析:以濟(jì)南市為例[J].地域研究與開發(fā),2019,38(4):115?121.
[4] 楊曉俊,朱凱凱,陳朋艷,等.城市電影院空間分布特征及演變:以西安市為例[J].經(jīng)濟(jì)地理,2018,38(6):85?93.
[5] 夏春萍,雷欣悅,王翠翠.我國(guó)農(nóng)村多維貧困的空間分布特征及影響因素分析:基于31省的多維貧困測(cè)度[J].中國(guó)農(nóng)業(yè)大學(xué)學(xué)報(bào),2019,24(8):229?238.
[6] 裴廈,劉春蘭,謝高地.贛江上游山洪災(zāi)害空間分布特征及生態(tài)影響因子分析[J].江西農(nóng)業(yè)大學(xué)學(xué)報(bào),2018,40(2):413?422.
[7] 吳海霞,杜尚嘉,陳國(guó)德,等.鸚哥嶺自然保護(hù)區(qū)藥用植物資源種群空間分布特征分析[J].西南農(nóng)業(yè)學(xué)報(bào),2019,32(5):981?986.
[8] 曹雪,舒季君,唐根年,等.浙江省創(chuàng)新空間分異特征分析與驅(qū)動(dòng)機(jī)制研究[J].科技管理研究,2019,39(9):106?114.
[9] 廉曉梅,吳金華.東北地區(qū)人口與經(jīng)濟(jì)空間格局演變分析[J].人口學(xué)刊,2018,40(1):45?55.
[10] 王斌,陳琳,侯翔宇,等.透明計(jì)算中用戶訪問行為特征分析與預(yù)測(cè)[J].計(jì)算機(jī)工程與應(yīng)用,2018,54(16):49?54.
[11] 王彥雲(yún),李樹剛,成連華.基于地鐵乘客個(gè)體特征的非適應(yīng)性行為研究[J].火災(zāi)科學(xué),2019,28(2):79?84.
[12] 李東進(jìn),張宇東.量化自我的效應(yīng)及其對(duì)消費(fèi)者參與行為的影響機(jī)制[J].管理科學(xué),2018,31(3):112?124.
[13] 李欠男,李谷成,尹朝靜,等.河北省縣域農(nóng)業(yè)綠色全要素生產(chǎn)率的空間特征[J].生態(tài)與農(nóng)村環(huán)境學(xué)報(bào),2019,35(7):845?852.