張嘉璐 牟勇
(1.大連海事大學(xué),遼寧大連 116026;2.中體彩科技發(fā)展有限公司,北京 100021)
隨著人們生活水平的提高和環(huán)境輔助的廣泛應(yīng)用,在移動物聯(lián)網(wǎng)的高速發(fā)展下,行為識別領(lǐng)域得到了長足的發(fā)展[1]。但是在智能家居中泛在傳感器的行為識別仍然呈現(xiàn)出許多挑戰(zhàn):例如通過傳感器觸發(fā)的異常行為數(shù)據(jù)點來分析居民日常行為[2],以便于有效地保護老年人和生活不能自理的人。根據(jù)上述原因,泛在傳感器下的智能家居環(huán)境中行為識別技術(shù)研究具有重要的學(xué)術(shù)意義。
在行為識別領(lǐng)域中,根據(jù)傳感器與人體的交互模式,可以將行為識別中應(yīng)用的傳感器分為兩大類:非侵入式和入侵式傳感器。本文實驗的行為識別數(shù)據(jù)集均來自于華盛頓州立大學(xué)CASAS實驗室。
基于泛在傳感器的日常行為識別無法獲取用戶日常生活圖像、聲音等信息,只能通過傳感器傳輸?shù)男袨閿?shù)據(jù)來對異常行為進行分析。通過對用戶觸發(fā)的傳感器進行分析,得到居民日常行為規(guī)律,從而將同一行為中與行為習(xí)慣規(guī)律相左的行為識別異常行為,本文主要研究兩種情況下的泛在傳感器智能家居異常行為:
(1)第一類為行為開始和結(jié)束時間異常。例如:在單用戶行為識別中,某一個用戶每天吃藥的開始時間通常在中午12點左右,但是突然有一天吃藥的開始時間發(fā)生在了下午或者其余時間,在這種情況下,發(fā)生的行為就屬于吃藥行為開始時間異常。
(2)第二類為行為持續(xù)時間異常。例如:在單用戶行為識別中,某一個用戶每天去衛(wèi)生間的持續(xù)時間為30min左右,但是突然有一天去衛(wèi)生間的時間持續(xù)了兩個小時,那么該行為就屬于行為持續(xù)時間異常,可能原因是用戶身體出現(xiàn)異?;蛘呤怯脩艏依锏脑O(shè)備壞了,可能需要維修等。
在日常行為識別中,異常行為識別[3-4]的方法主要是先將人工標(biāo)注的正常行為進行建模,再將待測試行為與建模后的模型進行對比來判別是否為異常行為。本文根據(jù)不同行為的不同異常表現(xiàn)形式,首先對行為進行余弦相似度計算,將余弦相似度計算出的向量作為特征值。之后,采用DBSCAN聚類算法以正常行為為參照來對該類行為的特征進行聚類來進行異常行為識別。
余弦相似度是通過計算特征之間的距離來計算行為之間的相似度,公式1給出了余弦相似度在異常行為識別中的應(yīng)用。本文將計算余弦相似度后的特征作為DBSCAN算法的輸入:
基于密度的聚類算法中最常用的算法之一為DBSCAN算法,其具有良好的抗噪性并且對異常數(shù)據(jù)敏感的特點。不但適用于凸樣本數(shù)據(jù)集,同樣適用于非凸樣本數(shù)據(jù)集。
本文首先,對第一種異常行為采用統(tǒng)計方法某一行為的開始和結(jié)束時間作為特征,然后用余弦相似度進行特征計算,計算后的距離值作為新的特征向量。采用DBSCAN算法來對這些特征向量進行聚類,從而進行異常行為識別。然后針對第二種異常行為統(tǒng)計觸發(fā)該行為的持續(xù)時間和傳感器作為特征向量,同樣余弦距離與DBSCAN算法來識別其中的異常行為。最后,通過對比實驗驗證了本文提出的異常行為識別方法可以有效識別異常行為。
為了驗證異常行為識別的有效性,本文采用hh103數(shù)據(jù)集分別展示了兩類異常行為識別的實驗結(jié)果。
如圖1所示,橫軸表示Cook_Lunch行為的開始時間,縱軸表示Cook_Lunch行為的結(jié)束時間(為了將特征描述更加清晰,將24h制的時間轉(zhuǎn)換秒值,例如:01:20轉(zhuǎn)換為相應(yīng)的小數(shù)值為4800)。
從圖2中可以看出hh103數(shù)據(jù)集“Cook_Lunch”行為的發(fā)生時間和結(jié)束時間的特征向量利用余弦距離和DBSCAN算法相結(jié)合后,進行聚類之后獲得了該用戶有六個異常行為數(shù)據(jù)點,可能是用戶行為發(fā)生了異常行為。其中“Cook_Lunch”行為的開始與結(jié)束時間均異常的數(shù)據(jù)點有四個,行為開始時間異常的數(shù)據(jù)點有一個。從圖1中還可以看出,用戶的做飯開始時間在43000s結(jié)束時間在46000s,而異常點則不在此范圍內(nèi)。
為了驗證第二類異常行為實驗的有效性,本章采用余弦相似度與DBSCAN算法對某個行為的持續(xù)時間和傳感器觸發(fā)頻次進行聚類。
圖2展示了hh103數(shù)據(jù)集的“Cook_Lunch”行為的持續(xù)時間的異常點情況。其中,這個圖的橫軸表示行為觸發(fā)的傳感器頻次,縱軸表示行為持續(xù)的時間。從圖2中看出,被檢測出的異常點有5個。其中,用戶觸發(fā)正常行為的持續(xù)時間在400s之內(nèi),而異常行為的持續(xù)時間則超過了400s,并且從圖2中也可以直觀的看出這5個行為偏離了其正常行為的范圍,因此可以考慮這5個行為為用戶“Cook_Lunch”的異常行為。
從本文監(jiān)測的行為的開始/結(jié)束時間異常和持續(xù)時間異常的兩種異常行為識別可以看出不同用戶有自己特定的日常生活習(xí)慣在做相同的行為時,行為發(fā)生時間、結(jié)束時間以及持續(xù)時間都不相同。因此采用余弦相似度與DBSCAN結(jié)合對每個用戶的行為模式來檢測用戶行為的異常情況。