劉新帥,林 強(qiáng),曹永春,楊津達(dá),滿正行,紀(jì)金水
(西北民族大學(xué) 數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,甘肅 蘭州 730030)
隨著無線通信和微電子技術(shù)的發(fā)展,智能手機(jī)(Smartphone)應(yīng)運(yùn)而生,且日漸普及.智能手機(jī)這一搭載獨(dú)立操作系統(tǒng)和內(nèi)存,支持軟件、應(yīng)用自行安裝,并可通過移動(dòng)通訊網(wǎng)絡(luò)實(shí)現(xiàn)無線網(wǎng)絡(luò)接入的移動(dòng)計(jì)算平臺(tái),為人們的日常生活、學(xué)習(xí)和工作提供了諸多便利,已經(jīng)成為不可或缺的“個(gè)人移動(dòng)助手”.2018年9月,市場研究機(jī)構(gòu)Newzoo發(fā)布的《2018年全球移動(dòng)市場報(bào)告(Newzoo Global Mobile Market Report 2018)》[1]預(yù)測,2018年全球智能手機(jī)用戶將達(dá)到33億,其中中國將擁有7.83億用戶量,成為最大的智能手機(jī)市場.
支持應(yīng)用開發(fā)是智能手機(jī)與傳統(tǒng)手機(jī)一大主要區(qū)別,這歸因于其搭載的操作系統(tǒng),主要包括蘋果的iOS和谷歌的Android.特別是Android操作系統(tǒng)以其代碼開源的優(yōu)勢,占據(jù)了智能手機(jī)市場的半壁江山.在2018年8月全球操作系統(tǒng)市場份額報(bào)告中[2],Android占有41.66%的市場份額,位居第一.
除了基本的通訊功能以外,智能手機(jī)同時(shí)承載了信息獲取和傳輸、娛樂、消費(fèi)、電子支付等移動(dòng)計(jì)算功能,成為推動(dòng)“信息物理融合系統(tǒng)(Cyber-physical System,CPS)”付諸實(shí)現(xiàn)的重要技術(shù)推動(dòng)力.智能手機(jī)與人之間存在的固定綁定關(guān)系,使得其成為記錄人在物理世界中真實(shí)行為的有效工具.
應(yīng)用程序APP是除硬件配置之外智能手機(jī)吸引用戶的最主要方面,種類繁多、功能各異的APP為用戶提供了信息交互、網(wǎng)上購物和移動(dòng)支付等方面的便利.綜合個(gè)人APP使用的全部歷史信息,應(yīng)用合理的數(shù)據(jù)挖掘技術(shù),便可發(fā)現(xiàn)和識(shí)別隱藏在數(shù)據(jù)中的用戶生活習(xí)慣、興趣愛好、職業(yè)種類及消費(fèi)水平等個(gè)性化行為,以便提供個(gè)性化建議和提醒,在提升用戶使用體驗(yàn)的同時(shí)一定程度上可減輕或消除手機(jī)使用的負(fù)面影響.
以用戶個(gè)性化行為的理解為目標(biāo),本文研究基于數(shù)據(jù)挖掘技術(shù)的智能手機(jī)APP使用模式提取,以發(fā)現(xiàn)APP使用模式背后的用戶行為特征.首先,基于Android平臺(tái),應(yīng)用傳感器端口監(jiān)測技術(shù),實(shí)時(shí)監(jiān)測并收集智能手機(jī)APP的基本狀態(tài)信息,包括APP的啟動(dòng)時(shí)間和持續(xù)時(shí)長.其次,應(yīng)用去噪技術(shù)對(duì)APP狀態(tài)數(shù)據(jù)進(jìn)行預(yù)處理,進(jìn)而形式化定義APP事務(wù)為二元組.再次,應(yīng)用關(guān)聯(lián)規(guī)則挖掘技術(shù),挖掘并提取個(gè)人歷史APP事務(wù)中隱含的模式關(guān)聯(lián).最后,應(yīng)用真實(shí)的個(gè)人數(shù)據(jù)集,測試并驗(yàn)證所提提出方法的有效性.實(shí)驗(yàn)結(jié)果表明,本文提出的方法在APP事務(wù)關(guān)聯(lián)的提取中具有較好的性能.
從數(shù)據(jù)感知的角度講,智能手機(jī)是融合類型各異傳感器的綜合感知平臺(tái).利用手機(jī)傳感器開展用戶行為分析研究,是國內(nèi)外學(xué)者關(guān)注的重要研究分支.Jennifer R等人[3]研究用手機(jī)加速度傳感器識(shí)別簡單活動(dòng),包括走、上下樓梯、跑等;Lee等人[4]綜合考慮手機(jī)存儲(chǔ)容量和計(jì)算能力的前提下,研究基于手機(jī)加速度傳感器的人體活動(dòng)識(shí)別,提出基于隱馬爾可夫模型(Hidden Markov Models,HMMS)的兩階段識(shí)別模型,即先通過上層HMMS模型識(shí)別活動(dòng)序列,再通過下層HMMS模型識(shí)別用戶的具體活動(dòng);Yan等人[5]研究并提出了基于傳感器的自適應(yīng)活動(dòng)識(shí)別模型A3R,用于簡單活動(dòng)如上下樓、隨意行走等活動(dòng)的識(shí)別.Zhang等人[6]利用手機(jī)加速度傳感器識(shí)別6種簡單活動(dòng),該工作首先將活動(dòng)進(jìn)行分級(jí)分類,先判別其是靜止的還是非靜止的,然后再分別進(jìn)行具體活動(dòng)的識(shí)別.
李晶等人[7]研究應(yīng)用智能手機(jī)內(nèi)置傳感器獲取的用戶室內(nèi)移動(dòng)數(shù)據(jù),構(gòu)建面向用戶行為識(shí)別的分類模型,并對(duì)不同分類模型的準(zhǔn)確度進(jìn)行了對(duì)比.為了提高行為活動(dòng)識(shí)別的準(zhǔn)確度,朱響斌等人[8]先利用降維技術(shù)對(duì)實(shí)驗(yàn)數(shù)據(jù)集進(jìn)行特征約簡得到最優(yōu)實(shí)驗(yàn)特征子集,再利用隨機(jī)森林集成分類器完成了人類行為的識(shí)別.李文洋[9]提出了一種基于譜聚類和隱馬爾可夫模型(Spectral clustering and Hidden Markov Models,SC-HMM)的日常行為識(shí)別算法,胡龍[10]研究基于支持向量機(jī)的用戶行為分類算法,邱慧玲[11]提出了基于三階層連續(xù)隱馬爾可夫模型(Three-Stage Continuous Hidden Markov Model,TSCHMM)的人類行為識(shí)別算法.
上述研究基于傳感器數(shù)據(jù)識(shí)別人的活動(dòng)或行為,屬于細(xì)粒度活動(dòng)的范疇.本文研究基于手機(jī)APP使用情況的用戶行為理解,屬于粗粒度行為的范疇,因而與上述工作的研究目標(biāo)有所不同.
在智能手機(jī)的絕大多數(shù)應(yīng)用中,用戶使用手機(jī)是通過操作APP實(shí)現(xiàn)的.APP與業(yè)務(wù)類型的綁定關(guān)系為用戶行為的理解提供了數(shù)據(jù)記錄途徑,因而成為極具潛力的研究分支.Wu等人[12]研究并開發(fā)了一個(gè)實(shí)驗(yàn)數(shù)據(jù)收集平臺(tái),可記錄和分析現(xiàn)實(shí)生活中智能手機(jī)的用戶操作行為,數(shù)據(jù)經(jīng)由Internet連接定期上傳至服務(wù)器予以存儲(chǔ),同時(shí)提供圖表展示、日志查詢和實(shí)時(shí)日志模式分析等功能.Chittaranjan等人[13]針對(duì)智能手機(jī)使用情況,提出了基于機(jī)器學(xué)習(xí)方法的用戶性格特征分類方法.Tseng等人[14]通過挖掘智能手機(jī)的使用日志,探索用戶使用智能手機(jī)的模式,以發(fā)現(xiàn)用戶真實(shí)的APP使用行為.針對(duì)智能手機(jī)使用數(shù)據(jù),Sarker等人[15]提出了一種基于用戶接受、拒絕或錯(cuò)過電話呼叫事件的個(gè)性化行為發(fā)現(xiàn)方法,在其后續(xù)的研究工作中又提出了基于行為的時(shí)間分割技術(shù)[16]和用戶行為關(guān)聯(lián)規(guī)則挖掘技術(shù)[17].
針對(duì)APP事務(wù)及其關(guān)聯(lián),本文研究基于智能手機(jī)使用情況的行為捕獲與分析,從宏觀層面理解用戶的手機(jī)使用行為,以便支撐行為習(xí)慣和特征的提取.
本文研究基于手機(jī)APP使用情況的用戶行為捕獲與分析,本部分首先介紹APP狀態(tài)數(shù)據(jù)的收集方法,基于此描述APP數(shù)據(jù)的預(yù)處理和形式化,然后給出本文提出的APP事務(wù)關(guān)聯(lián)規(guī)則挖掘方法.
APP數(shù)據(jù)的收集本質(zhì)上是對(duì)APP運(yùn)行狀態(tài)的數(shù)字化記錄,借助于移動(dòng)開發(fā)平臺(tái)的應(yīng)用程序端口監(jiān)測予以實(shí)現(xiàn).具體而言,本文研究基于開源Android平臺(tái)的APP運(yùn)行狀態(tài)數(shù)據(jù)實(shí)時(shí)感知,應(yīng)用Android studio工具中的UsageStatsManager類,對(duì)運(yùn)行在Android智能手機(jī)平臺(tái)上的應(yīng)用程序進(jìn)行監(jiān)聽并記錄其狀態(tài)數(shù)據(jù).
為做到完整記錄APP的運(yùn)行狀態(tài)以真實(shí)反映用戶的使用行為,數(shù)據(jù)采樣頻率是一個(gè)需要慎重選擇的重要參數(shù).這是因?yàn)椴蓸宇l率設(shè)置太大、持續(xù)時(shí)間較短的APP不能被有效記錄;相反,采樣頻率設(shè)置太小,存儲(chǔ)空間開銷會(huì)明顯上升.
圖1 基于固定頻率的APP狀態(tài)數(shù)據(jù)采樣機(jī)制
如圖1所示,較大的采樣頻率f1導(dǎo)致持續(xù)時(shí)間較短的APP B未被記錄,較小的采樣頻率f2使得最終記錄的APP運(yùn)行狀態(tài)數(shù)量明顯增加.
鑒于此,本文提出基于界標(biāo)窗口模型(Landmark Window Model)的APP運(yùn)行狀態(tài)數(shù)據(jù)收集機(jī)制.如圖2所示,每當(dāng)APP開始運(yùn)行時(shí),將開啟一個(gè)界標(biāo)窗口(Landmark window),這個(gè)窗口一直向前延續(xù)直到當(dāng)前APP停止運(yùn)行.APP停止運(yùn)行意味著新的APP開始運(yùn)行,或者系統(tǒng)進(jìn)入“桌面”狀態(tài)(桌面也可以看作一種APP狀態(tài)).很顯然,基于界標(biāo)窗口模型的數(shù)據(jù)收集機(jī)制克服了固定頻率方式存在的問題,真實(shí)記錄了各個(gè)APP的運(yùn)行狀態(tài).
圖2 基于界標(biāo)窗口模型的APP狀態(tài)數(shù)據(jù)采樣機(jī)制
應(yīng)用基于界標(biāo)窗口模型的采集機(jī)制,每一個(gè)APP運(yùn)行數(shù)據(jù)可表示為三元組A=(N,TS,TE),其中:N代表APP的名稱,如QQ、鐵路12306等,TS和TE分別代表該APP執(zhí)行開始和結(jié)束的時(shí)間,如PM 11∶31和PM 11∶45.
a.預(yù)處理前的數(shù)據(jù) b.預(yù)處理后的數(shù)據(jù)
圖3數(shù)據(jù)預(yù)處理
本文研究APP使用模式的提取,以進(jìn)一步研究個(gè)體的使用習(xí)慣和行為.因此,那些僅僅是短程切換而非真正使用的APP產(chǎn)生的數(shù)據(jù)記錄不僅不是模式提取關(guān)注的對(duì)象,反而可能會(huì)為模式挖掘帶來負(fù)面影響.例如,圖3a中的APP B、C和E的持續(xù)時(shí)間明顯偏短,它們可能代表從當(dāng)前APP短程切換至另一個(gè)APP后很快切換回來(如APP B所示),也可能是從一個(gè)APP切換至另一個(gè)APP之間行為習(xí)慣上的過渡(如APP C和E所示).此外,為了進(jìn)一步提取宏觀層面的APP使用關(guān)聯(lián),而不僅僅是APP之間的前后依賴關(guān)系,需要對(duì)原始APP三元組數(shù)據(jù)進(jìn)行映射處理.
2.2.1 短程數(shù)據(jù)的移除處理
設(shè)定時(shí)間閾值Tthr,給定APP三元組序列A= {A1,A2,…,Ai-1},是否將第i個(gè)APP記入A,取決于Ai=(N,TS,TE)的持續(xù)時(shí)間TE-TS是否大于閾值Tthr.若TE-TS>Tthr,則Ai記入序列A,此時(shí)A= {A1,A2,…,Ai-1,Ai};否則,Ai被識(shí)別為短程數(shù)據(jù),不記入序列A.
應(yīng)用上述短程數(shù)據(jù)移除規(guī)則,可將圖3a所示原始數(shù)據(jù)中的APP B、C和G移除掉,獲得如圖3b所示的處理后數(shù)據(jù).
2.2.2 基于時(shí)間軸的APP數(shù)據(jù)投影
前述APP運(yùn)行狀態(tài)的三元組(N,TS,TE)記錄反映了APP運(yùn)行的時(shí)空狀態(tài),其中N為空間域、TS和TE為時(shí)間域.很顯然,同一周期中空間域相同的多個(gè)三元組記錄在時(shí)間域上將不同,不同周期中空間域相同的三元組記錄的時(shí)間域很難完全對(duì)齊.這些問題的存在為APP關(guān)聯(lián)規(guī)則的挖掘帶來巨大挑戰(zhàn),不利于用戶行為模式的提取.
鑒于此,本文提出基于時(shí)間軸的APP三元組投影機(jī)制,將APP三元組轉(zhuǎn)換為二元組表示,以解決不同周期中APP運(yùn)行記錄無法對(duì)齊和同一周期中APP運(yùn)行記錄重復(fù)的問題.
圖4 基于時(shí)間軸的APP三元組投影
圖4將時(shí)間軸劃分為一系列固定長度(tsize)的時(shí)間片,并對(duì)時(shí)間片序列進(jìn)行編碼(Tslice1-Tslicen);然后,基于如下規(guī)則將三元組投影到時(shí)間軸:
1)若TS和TE正好與某個(gè)時(shí)間片的開始時(shí)間和結(jié)束時(shí)間嚴(yán)格對(duì)應(yīng),則將該三元組的時(shí)間域用投影所在的時(shí)間片編碼替換,產(chǎn)生對(duì)應(yīng)的二元組.如圖4所示,投影到第一個(gè)時(shí)間片Tslice1的三元組被表示為(N,Tslice1).
2)若TS或TE處于某個(gè)時(shí)間片的內(nèi)部,且跨越部分的距離不超過時(shí)間片長度的1/3,則做縮減投影處理.如圖4所示,投影到第三個(gè)時(shí)間片Tslice3中的三元組有部分跨越到第二個(gè)時(shí)間片Tslice2,但跨越距離不超過tsize/3,所以將投影結(jié)果縮減并表示為(N,Tslice3).
3)若TS或TE處于某個(gè)時(shí)間片的內(nèi)部,且TE-TS>tsize/2,則做擴(kuò)展投影處理.如圖4所示,投影到第四個(gè)時(shí)間片Tslice4中的三元組雖然尚未充滿整個(gè)時(shí)間片,但其跨越距離超過tsize/2,所以將投影結(jié)果擴(kuò)展并表示為(N,Tslice4).
經(jīng)過上述預(yù)處理步驟,原始APP運(yùn)行狀態(tài)數(shù)據(jù)將表示為由APP名和投影所在的時(shí)間片構(gòu)成的二元組(N,Tslice),其中不含持續(xù)時(shí)間很短的短程數(shù)據(jù).本文將該二元組稱為APP事務(wù).本文定義APP事務(wù)如下:
定義1.APP事務(wù)是APP運(yùn)行狀態(tài)的時(shí)空二元組(N,T),其中N代表APP的名稱、T代表APP投影所在的時(shí)間片.
APP之間的關(guān)聯(lián)本質(zhì)上是APP之間的時(shí)空依賴關(guān)系,蘊(yùn)含著用戶的使用習(xí)慣和使用行為.數(shù)據(jù)挖掘領(lǐng)域常見的事務(wù)關(guān)聯(lián)挖掘算法有Apriori[18]和FP-Growth[19].鑒于Apriori結(jié)構(gòu)簡單,同時(shí)對(duì)于規(guī)模較小的數(shù)據(jù)集有著良好的性能.因此,本文選用Apriori算法作為APP事務(wù)關(guān)聯(lián)規(guī)則的提取算法.
假定suppthr代表支持度閾值,對(duì)于給定的APP事務(wù)A=(N,T),A的支持度定義為support(A)=number(A) /number(Allsamples);稱A為頻繁事務(wù),support(A)≥suppthr.其中:number(A)代表數(shù)據(jù)集中包含A的記錄的條數(shù),number(Allsamples)代表數(shù)據(jù)集中記錄的總數(shù)量.類似地,定義兩個(gè)APP事務(wù)A和B的支持為support(A→B)=number(AB)/number(Allsamples),反映了事務(wù)A和B同時(shí)發(fā)生的概率.
不同于支持度,置信度是另一個(gè)反映兩個(gè)或以上事務(wù)同時(shí)發(fā)生概率的度量指標(biāo).對(duì)于兩個(gè)APP事務(wù)A和B,定義當(dāng)A發(fā)生的前提下B發(fā)生的概率為置信度confidence(A→B)=number(AB)/number(A),即A、B同時(shí)存在的記錄占A存在的記錄的比重.
在給定的支持度閾值suppthr的前提下,Apriori算法不斷計(jì)算支持度和置信度值,在滿足條件的前提下遍歷數(shù)據(jù)集以查找k-頻繁事務(wù),直到條件不滿足為止.
應(yīng)用收集自5位智能手機(jī)用戶的真實(shí)數(shù)據(jù)集,本部分驗(yàn)證并呈現(xiàn)本文提出方法在APP關(guān)聯(lián)規(guī)則挖掘應(yīng)用中的有效性.
表1給出了本文實(shí)驗(yàn)數(shù)據(jù)的概貌,包括數(shù)據(jù)集名、記錄總數(shù)和APP總數(shù).其中,記錄總數(shù)與采樣周期一一對(duì)應(yīng),即一個(gè)采樣周期產(chǎn)生一條APP記錄,而一條APP記錄可能包含多個(gè)APP事務(wù),APP總數(shù)代表一個(gè)數(shù)據(jù)集中所包含的APP類型總量.
表1 本文實(shí)驗(yàn)數(shù)據(jù)
表2給出了本文實(shí)驗(yàn)中預(yù)定義參數(shù)的取值,這些值較強(qiáng)關(guān)聯(lián)于所選用的實(shí)驗(yàn)數(shù)據(jù).因此,實(shí)驗(yàn)數(shù)據(jù)不同,取值可能略有差異.
表2 預(yù)定義參數(shù)的取值
表2中時(shí)間片大小tsize設(shè)定為15分鐘,將一天當(dāng)中的9∶00-24∶00作為一個(gè)周期,即自9∶00開始每隔15分鐘作為一個(gè)時(shí)間片,如T1(9∶00-9∶15)、T2(9∶15-9∶30)……T60(23∶45-24∶00).
實(shí)驗(yàn)評(píng)價(jià)指標(biāo)為挖掘所得關(guān)聯(lián)規(guī)則的客觀性,因?yàn)榭陀^性較難量化定義,且每個(gè)數(shù)據(jù)集僅代表個(gè)人的APP運(yùn)行記錄,不同數(shù)據(jù)集之間的可比性較小.因此,本文通過邀請(qǐng)用戶對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行應(yīng)證評(píng)分,實(shí)現(xiàn)關(guān)聯(lián)規(guī)則的客觀性評(píng)價(jià).具體而言,若用戶認(rèn)為本文實(shí)驗(yàn)結(jié)果正確反映了其80%以上的行為特征和關(guān)聯(lián),則該規(guī)則為客觀的,否則,該規(guī)則為不客觀的.
利用經(jīng)典關(guān)聯(lián)規(guī)則算法Apriori算法,對(duì)用戶的APP事務(wù)集進(jìn)行關(guān)聯(lián)規(guī)則挖掘,設(shè)置關(guān)聯(lián)規(guī)則的最小支持度為15%,最小置信度設(shè)置為50%,得出的DataSet 1和4的APP事務(wù)間的關(guān)聯(lián)規(guī)則如圖5所示.
a.DataSet 1的關(guān)聯(lián)規(guī)則
b.DataSet 4的關(guān)聯(lián)規(guī)則
由圖5所示的DataSet1和DataSet 4的APP事務(wù)之間的關(guān)聯(lián)規(guī)則可以看出,DataSet 1的最大頻繁項(xiàng)集為(QQ57,QQ58,WeChat59),可推斷該用戶經(jīng)常使用“QQ”和“微信”這兩種社交類APP聊天和瀏覽新聞.此外,根據(jù)頻繁APP所在的時(shí)間片,可以看出該用戶經(jīng)常在晚上23∶00-23∶45之間使用QQ和微信,可進(jìn)一步得知用戶在這個(gè)時(shí)間段內(nèi)先使用QQ后使用微信這一使用行為模式.類似DataSet4的最大頻繁項(xiàng)集為(Bili54,Bili55,Bili56),可以得知該用戶經(jīng)常在晚上22∶15-23∶00之間使用“嗶哩嗶哩視頻”APP觀看視頻、學(xué)習(xí)等.
用戶1至用戶5所得APP事務(wù)間的關(guān)聯(lián)規(guī)則見表3.
從實(shí)驗(yàn)結(jié)果可以得知,不同的用戶(數(shù)據(jù)集)擁有不同的APP使用行為,有些用戶喜歡使用社交類軟件,如用戶1、2和5;有些用戶喜歡看視頻軟件,如用戶2和4;還有些用戶喜歡瀏覽網(wǎng)頁,如用戶3.此外,雖然用戶1、2和5都經(jīng)常使用微信APP,但他們運(yùn)行微信APP的時(shí)間段不同,所以有著不完全相同的行為習(xí)慣.
表3 DataSet1的APP事務(wù)間的關(guān)聯(lián)規(guī)則
如前所述,為驗(yàn)證挖掘所得的關(guān)聯(lián)規(guī)則的客觀性,實(shí)驗(yàn)結(jié)束后,邀請(qǐng)5位用戶對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行應(yīng)證評(píng)分,見表4.
表4 用戶應(yīng)證評(píng)分表
由表4可知,所有數(shù)據(jù)集上的關(guān)聯(lián)規(guī)則均符合定義的80%的客觀性,即本文提出的基于數(shù)據(jù)挖掘的用戶行為挖掘結(jié)果較好反映了用戶的APP使用行為.其中,DataSet 1的評(píng)分值達(dá)到95%,說明挖掘所得的行為模式很好體現(xiàn)了用戶的使用習(xí)慣;而DataSet5的評(píng)分值81%,其主要原因是該數(shù)據(jù)集包含的APP記錄數(shù)太少,數(shù)據(jù)量不能較好支撐關(guān)聯(lián)規(guī)則的提取.
為了發(fā)現(xiàn)用戶的APP使用習(xí)慣和模式,本文研究并提出了基于數(shù)據(jù)挖掘技術(shù)的智能手機(jī)APP使用模式提取技術(shù).首先,基于Android平臺(tái)開發(fā)了智能手機(jī)APP狀態(tài)數(shù)據(jù)的收集平臺(tái);其次,提出并實(shí)現(xiàn)了面向APP去噪的預(yù)處理技術(shù);再次,應(yīng)用關(guān)聯(lián)規(guī)則挖掘技術(shù),提出并實(shí)現(xiàn)了個(gè)人歷史APP事務(wù)模式的挖掘和提取;最后,應(yīng)用包含5個(gè)數(shù)據(jù)集的真實(shí)個(gè)人APP數(shù)據(jù),測試并驗(yàn)證了本文提出方法的有效性,實(shí)驗(yàn)結(jié)果表明,本文提出的方法在APP事務(wù)關(guān)聯(lián)的提取中具有較好的性能和客觀性.
未來可以在以下幾個(gè)方面進(jìn)一步拓展:首先,收集大量數(shù)據(jù),進(jìn)一步完善和提升本文提出的APP關(guān)聯(lián)挖掘方法;其次,完整實(shí)現(xiàn)面向APP使用模式提取的數(shù)據(jù)收集與挖掘系統(tǒng);最后,結(jié)合智能推薦系統(tǒng),將模式挖掘與輔助提醒集成到系統(tǒng)中并應(yīng)用于實(shí)踐.