劉 罡, 朱茂飛, 張春鵬, 鐘 華
(合肥學(xué)院先進制造工程學(xué)院, 安徽 合肥 230601)
從傳感器數(shù)據(jù)中學(xué)習(xí)行為模式的問題出現(xiàn)在許多應(yīng)用中,包括智能環(huán)境[1,6],監(jiān)控[7,9],人類機器人交互[4,5],以及殘疾人輔助技術(shù)。研究的熱點之一是使用來自傳感器的數(shù)據(jù),來學(xué)習(xí)識別機器人在固定的時間段內(nèi)從事的活動[3,4]。這項研究的目標是將機器人活動的一天分為日?;顒?,如“工作”、“訪問”,并識別和標記重要的地方“教室”、“學(xué)生公寓”、“物品站”。
活動模型的基本概念如圖1所示。模型中的每個圓圈表示一個對象,如北斗定位系統(tǒng)讀數(shù)、活動或重要的位置。
北斗定位系統(tǒng)讀數(shù)是模型的輸入。每個活動節(jié)點代表某個區(qū)域內(nèi)的一組連續(xù)的北斗定位系統(tǒng)讀數(shù)。標準的動態(tài)貝葉斯網(wǎng)絡(luò)或隱馬爾可夫模型只有有限的支持。
活動是為空間分段的北斗定位系統(tǒng)軌跡中的每個節(jié)點估計的,如圖1所示。區(qū)分兩大類活動,導(dǎo)航活動和重要活動。與導(dǎo)航相關(guān)的活動包括自主行走、乘坐交通工具(節(jié)省機器人自身動力需要)。重要的活動通常在機器人停留在某個位置時執(zhí)行,例如送物品、休息、取物品/裝物品,或者當(dāng)機器人切換移動模式時,例如上交通工具/下交通工具。
圖1 基于位置的活動識別的概念層次
重要位置是在機器人的活動中起重要作用的地方。這些地方包括機器人的充電站和工作站,機器人通常使用的交通工具乘坐點等等。
研究目標是設(shè)計概率時間模型并從北斗導(dǎo)航讀數(shù)序列中提取高級活動。一種方法是使用生成模型,如隱馬爾可夫模型[7,8,2]或動態(tài)貝葉斯網(wǎng)絡(luò)。然而,諸如條件隨機場(CRF)之類的判別模型被證明在諸如自然語言處理和計算機視覺等領(lǐng)域優(yōu)于生成技術(shù)。
使用識別圖模型中的分層條件隨機場。條件隨機場中的節(jié)點代表一系列觀測值(如北斗定位系統(tǒng)讀數(shù)),表示為x =
(1)
其中Z(x)=Σy∏c∈Cφc(xc,yc)是歸一化函數(shù)。Фc(xc,yc)由特征函數(shù)fc()的對數(shù)線性組合來描述,如公式(2):
(2)
(3)
(4)
參數(shù)學(xué)習(xí)的目標是確定公式(4)中使用的特征函數(shù)的權(quán)重。權(quán)重的確定是為了最大化標記訓(xùn)練數(shù)據(jù)的條件似然p(y|x)。
2.1.1 在學(xué)習(xí)算法的推導(dǎo)過程中,將式(4)改寫為公式(5),(6):
(5)
(6)
其中w和f分別是條件隨機場中所有集團的權(quán)重和特征函數(shù)“疊加”后得到的向量。為了避免過度擬合,將目標函數(shù)梯度定義如公式(7)-(10):
(7)
(8)
(9)
(10)
條件似然性的以下近似如公式(11):
(11)
其中MB(yi)是變量yi的馬爾科夫毯,包含條件隨機場圖中yi的近鄰(學(xué)習(xí)過程中每個節(jié)點的值是已知的)。偽似然可以重寫為公式(12):
(12)
其中f(yi,MB(yi))是涉及變量yi的局部特征計數(shù),Z(MB(yi),w) =Σyi‘exp{wT· f(yi‘,MB(yi‘))}是局部歸一化函數(shù)。目標函數(shù)變成公式(13),(14):
(13)
(14)
梯度可以計算為公式(15):
(15)
構(gòu)建了一個考慮北斗定位系統(tǒng)讀數(shù)之間空間關(guān)系的條件隨機場,結(jié)構(gòu)如圖2所示。觀察到的實心節(jié)點對應(yīng)于北斗定位系統(tǒng)讀數(shù),其中下標t表示時間指數(shù),白色節(jié)點代表街景斑塊st,對應(yīng)于第3章中的隱藏狀態(tài)y。北斗定位系統(tǒng)讀數(shù)gt一定距離內(nèi)的街景斑塊上的每個st的值。圖2中的線條定義了條件隨機場的團結(jié)構(gòu)。通過以下特征函數(shù)定義:
測量小集團(圖2中的藍色):北斗定位系統(tǒng)噪聲和地圖不確定性由小集團考慮,其特征測量北斗定位系統(tǒng)測量值與其關(guān)聯(lián)的斑塊中心之間的平方距離如公式(16):
(16)
其中g(shù)t是第t個北斗定位系統(tǒng)讀數(shù)的位置。st表示gt附近的一個街區(qū)的中心。σ用于控制距離的比例。
圖2 條件隨機場將北斗定位系統(tǒng)測量與街景斑塊相關(guān)聯(lián)
一致性小集團(圖2中的黃色):時間一致性由四個節(jié)點小集團保證。特征函數(shù)比較北斗定位系統(tǒng)讀數(shù)和相關(guān)斑塊之間的矢量如公式(17):
fcons(gt,gt+1,st,st+1)=
(17)
st和st+1是連續(xù)兩次關(guān)聯(lián)的街景斑塊的中心。
平滑小集團(圖2中的灰色):使用二進制特征來測試連續(xù)的斑塊是在同一條街景上、相鄰的街景上還是在同一個方向上。以下二元特征檢查街景和方向是否相同如公式(18):
fsmooth(st,st+1)=δ(st.street,st+1.street)·
δ(st.direction,st+1.direction)
(18)
其中,δ(u,v)是指示函數(shù),如果u = v,則等于1,否則等于0。
一旦北斗定位系統(tǒng)軌跡被分割,系統(tǒng)就會生成一個新的條件隨機場,其中包含從北斗定位系統(tǒng)軌跡中提取的每個片段的隱藏活動節(jié)點。該條件隨機場由圖3所示的兩個較低級別組成。
圖3 標識活動和場所的條件隨機場
在一個地方發(fā)生的活動強烈地表明了這個地方的類型。例如,在工作站,機器人主要是工作,而在充電站,機器人主要是充電。圖3中的節(jié)點p1,a1和aN-2形成了這樣一個團。該模型計算每個地方發(fā)生的不同活動。在實驗中,將計數(shù)離散為四類:計數(shù)= 0,計數(shù)= 1,2 ≤計數(shù)≤ 3,計數(shù)≥ 4。對于地點類型、活動類型和頻率類別的每個組合,都有一個指示特征。
表1總結(jié)了構(gòu)建的條件隨機場的算法。該算法將北斗定位系統(tǒng)軌跡作為輸入。
表1 檢測重要地點并推斷活動和地點類型的算法
從三個不同的機器人那里收集了北斗定位系統(tǒng)數(shù)據(jù),每個機器人大約七d的數(shù)據(jù)。每個機器人的數(shù)據(jù)由大約800個北斗定位系統(tǒng)測量組成,導(dǎo)致大約200個片段。手動標記所有活動和重要位置。使用遺漏交叉驗證進行評估,使用最大偽似然進行學(xué)習(xí),這需要(在3.0 GHz的PC上)大約5min來收斂到訓(xùn)練數(shù)據(jù)。圖4(a)是將北斗定位系統(tǒng)軌跡捕捉到街道地圖的方法所實現(xiàn)的質(zhì)量。圖4(b)顯示了兩種方法實現(xiàn)的假陽性和假陰性率。模型相比閾值法表現(xiàn)得更好:它只產(chǎn)生4個假陽性和3個假陰性。
圖4 (a)街道地圖(線)上的北斗定位軌跡(灰色圓圈)和相關(guān)的網(wǎng)格單元(黑色圓圈);(b)提取的重要位置的準確性。
表2顯示了重要活動的活動估計結(jié)果。如果在沒有發(fā)生重大活動時檢測到重大活動,則該實例被視為假陽性(FP),如果發(fā)生重大活動但被標記為非重大活動(如行走),則該實例被視為假陰性(FN)。
表2 交叉驗證數(shù)據(jù)的活動混淆矩陣
表3提供了不同評估的活動推斷準確性。只顯示重要的活動,該系統(tǒng)實現(xiàn)了80%以上的導(dǎo)航活動的準確性,如自主行走,或交通工具。前兩行提供了表2所示混淆矩陣的準確度值。方法在估計重要活動時達到了85%以上的準確率,無論有沒有街道地圖。表4所示的混淆矩陣總結(jié)了在檢測和標記重要位置方面所取得的結(jié)果。該方法在標記用于測試的機器人的充電站和工作地點時沒有錯誤。位置檢測和標記的總體準確率為95%。無論是否使用街道地圖,地點檢測結(jié)果都是相同的。
表3 活動評估
表4 地點混淆矩陣
與現(xiàn)有技術(shù)相比,使用一致的框架來進行低級推理和提取機器人的重要位置。通過迭代構(gòu)建一個分層的條件隨機場來實現(xiàn)的,其中上層是基于下層的映射推理生成的。在模型中使用偽似然的判別學(xué)習(xí)和使用循環(huán)信念傳播的推理可以非常有效地執(zhí)行?;诒倍范ㄎ幌到y(tǒng)數(shù)據(jù)的實驗表明不僅能夠了解機器人的重要位置,它還可以推斷出低級別的活動,如走路、工作或上車。未來將在模型中添加更多類型的傳感器,包括由可穿戴多傳感器收集的數(shù)據(jù),如3軸加速度、音頻信號。使用這些傳感器提供的附加信息,系統(tǒng)將能夠執(zhí)行極其細粒度的活動識別。