陳慶果,李 翔
《“健康中國2030”規(guī)劃綱要》的實(shí)施和全民健身上升為國家戰(zhàn)略把科學(xué)健身提到了新的高度,隨著“互聯(lián)網(wǎng)+”和大數(shù)據(jù)熱潮的到來,運(yùn)動(dòng)類可穿戴設(shè)備呈井噴式的出現(xiàn),各種品牌、各種型號(hào)的運(yùn)動(dòng)手環(huán)、運(yùn)動(dòng)手表和運(yùn)動(dòng)能耗監(jiān)測(cè)儀層出不窮。但從體力活動(dòng)測(cè)量的原理上看,這些儀器大部分都屬于加速度計(jì)范疇,均是利用加速度傳感器捕捉的客觀原始加速度數(shù)據(jù)來監(jiān)測(cè)運(yùn)動(dòng)狀況。
在學(xué)界,加速度計(jì)能耗監(jiān)測(cè)的研究由來已久,早在20世紀(jì)80年代初,Montoye等(1983)和Wong等(1981)就進(jìn)行了一系列開創(chuàng)性的研究,把原始數(shù)據(jù)合成count值,再將其代入回歸方程建立計(jì)算模型,成為能耗預(yù)測(cè)領(lǐng)域的經(jīng)典算法。后來不斷有學(xué)者通過豐富建模數(shù)據(jù)特征、完善count指標(biāo)體系和利用硬件提升效益等手段不斷優(yōu)化回歸模型。近年來,隨著機(jī)器學(xué)習(xí)算法的興起,為了充分挖掘原始數(shù)據(jù)蘊(yùn)含的豐富信息提高預(yù)測(cè)的準(zhǔn)確性,不斷有學(xué)者將不同的機(jī)器學(xué)習(xí)算法引入到能耗預(yù)測(cè)中,Staudenmayer等(2009,2015)先后將神經(jīng)網(wǎng)絡(luò)模型應(yīng)用到髖部加速度計(jì) 和腕部加速度計(jì)中,研究結(jié)果均表明,機(jī)器學(xué)習(xí)算法在非周期性活動(dòng)的準(zhǔn)確性上明顯優(yōu)于傳統(tǒng)的以count值為基礎(chǔ)的線性模型,Rothney等(2007)和Trost等(2012)針對(duì)髖部加速度計(jì)的研究也得出相似的結(jié)論。但在此領(lǐng)域的研究中,鮮見對(duì)不同部位之間兩類算法差異的系統(tǒng)比較,缺少對(duì)算法效應(yīng)的整體考量。
針對(duì)不同佩戴部位的現(xiàn)有研究也存在同樣的不足,例如,在線性回歸預(yù)測(cè)能耗的相關(guān)研究中,髖部因其靠近身體的質(zhì)心而被視為理想的佩戴位置,部分研究結(jié)果顯示,相比大腿和腕部,髖部線性模型的預(yù)測(cè)精度顯著提高(Preece et al.,2016),但仍然沒法準(zhǔn)確的預(yù)測(cè)非周期性活動(dòng)的能耗(Hendelman et al.,2000)。Swarts等(2000)采用腕部-髖部的混合模型提高非周期性活動(dòng)的預(yù)測(cè)準(zhǔn)確性,Crouter等(2015)應(yīng)用分段回歸模型的研究卻表明,腕部也能準(zhǔn)確地預(yù)測(cè)運(yùn)動(dòng)能耗。目前對(duì)機(jī)器學(xué)習(xí)算法的探究結(jié)果則相對(duì)較少,Ellis等(2014)引入隨機(jī)森林模型,髖部和腕部模型的RMSE分別為1.09 METs和1.00 METs,算法的部位特征不顯著,對(duì)神經(jīng)網(wǎng)絡(luò)模型的研究也顯示相似的結(jié)果(Montoye et al.,2015,2016),目前來看,還需更多的實(shí)證依據(jù)以形成概化性的結(jié)論。
綜上所述,當(dāng)前的研究主要是探討單一算法不同部位間預(yù)測(cè)準(zhǔn)確性的差異,或是單一部位間不同算法的差異,鮮見系統(tǒng)探討佩戴部位和算法之間可能存在的交互效應(yīng),算法能否降低佩戴部位對(duì)預(yù)測(cè)準(zhǔn)確性的影響也不得而知。本研究旨在通過對(duì)部位效應(yīng)、算法效應(yīng)及其之間的交互效應(yīng)進(jìn)行系統(tǒng)探究,明晰佩戴部位對(duì)能耗監(jiān)測(cè)的影響效力,探究算法的應(yīng)用價(jià)值。
在告知測(cè)試內(nèi)容和健康問詢后,經(jīng)受試者同意確定42人的測(cè)試名單(表1)。所有受試者無運(yùn)動(dòng)禁忌癥,測(cè)試前24 h無大強(qiáng)度體力活動(dòng),測(cè)試均在餐后1 h進(jìn)行,測(cè)試前簽署知情同意書。
表1 佩戴部位對(duì)加速度計(jì)能耗監(jiān)測(cè)準(zhǔn)確性測(cè)試受試者基本信息Table 1 TheAnthropometryCharacteristicsofParticipant
本研究采用3個(gè)美國產(chǎn)Actigraph-GT3X+(以下簡稱GT3X+)收集人體活動(dòng)中不同部位的加速度信息,GT3X+是目前應(yīng)用最為廣泛的3軸加速度計(jì),重量約為27 g,對(duì)加速度原始數(shù)據(jù)的采樣頻率可以達(dá)到100 Hz,內(nèi)存容量為250 MB。測(cè)試前利用Actilife6.0軟件進(jìn)行校對(duì)、信息錄入和采樣頻率設(shè)置(30 Hz),然后使用相應(yīng)長度的彈性綁帶固定在受試者右側(cè)髖部(右側(cè)髂脊處)、右側(cè)大腿處(大腿前正中線上1/3處)和右側(cè)手腕處(腕橫紋處)。每天測(cè)試完成后,將數(shù)據(jù)保存為*.GT3X格式,以便導(dǎo)出加速度原始數(shù)據(jù)。
能量消耗的標(biāo)準(zhǔn)測(cè)量采用意大利產(chǎn)的CosmedK4b2便攜式氣體代謝分析儀(以下簡稱K4b2),該儀器采用每口氣呼氣法進(jìn)行測(cè)量,準(zhǔn)確性得到廣泛驗(yàn)證,被視為金標(biāo)準(zhǔn)。為保障測(cè)量精度,整個(gè)測(cè)試前更換氧電池,每天測(cè)試均對(duì)儀器進(jìn)行預(yù)熱和定標(biāo)。測(cè)試中,為確保GT3X+和K4b2的數(shù)據(jù)同步,測(cè)試人員在每一分鐘第一秒按壓儀器主機(jī)上的Enter鍵開始正式記錄數(shù)據(jù),并使用心率帶同步監(jiān)控受試者心率,以此確定活動(dòng)之間的間隔時(shí)間。每天測(cè)試完成后,將數(shù)據(jù)保存為*.xpo格式,后期再轉(zhuǎn)制為周期為30 s的數(shù)據(jù)庫。
采用恒康佳業(yè)HK-6000身高體重儀測(cè)量受試者身高和體重,使用韓國VIVENTE-GOLD體成分儀測(cè)量體脂率。
活動(dòng)方案由4類20項(xiàng)體力活動(dòng)構(gòu)成(表2),分別為5項(xiàng)靜息類活動(dòng)、6項(xiàng)走跑活動(dòng)、5項(xiàng)生活方式活動(dòng)和4項(xiàng)體育活動(dòng),每項(xiàng)活動(dòng)的時(shí)間為5 min(跳繩除外),活動(dòng)之間的時(shí)間間隔視心率的恢復(fù)狀況而定,一般為1~5 min。實(shí)驗(yàn)方案基本囊括日常體力活動(dòng)的主要類型和項(xiàng)目,兼顧項(xiàng)目的周期特征、肢體特征和強(qiáng)度特征。
表2 佩戴部位對(duì)加速度計(jì)能耗監(jiān)測(cè)準(zhǔn)確性測(cè)試項(xiàng)目Table 2 List of Physical Activies
整個(gè)測(cè)試分兩個(gè)階段進(jìn)行,第1階段進(jìn)行形態(tài)學(xué)指標(biāo)測(cè)量、靜息類項(xiàng)目和走跑類運(yùn)動(dòng)的測(cè)試;第2階段包括5項(xiàng)生活方式活動(dòng)和4項(xiàng)體育活動(dòng)測(cè)試。
靜息活動(dòng)和生活方式活動(dòng)在實(shí)驗(yàn)室模擬的生活情景中進(jìn)行,要求受試者按照日常狀態(tài)完成活動(dòng)。走跑活動(dòng)(除自由走跑)在德國h/p/cosmos公司生產(chǎn)的Pular跑臺(tái)上進(jìn)行。體育活動(dòng)中乒乓球和羽毛球采用多球練習(xí)的方式,受試者不撿球;跳繩和籃球運(yùn)動(dòng)均要求受試者按自己節(jié)奏進(jìn)行。
所有測(cè)試共需120~140 min,溫度控制在18℃~25℃,相對(duì)濕度在50%~60%。
研究將建立一般線性回歸模型和神經(jīng)網(wǎng)絡(luò)模型,因模型數(shù)據(jù)要求不同,將前期導(dǎo)出的*.GT3X文件轉(zhuǎn)換為*.CSV的原始文件后,分別進(jìn)行不同的數(shù)據(jù)預(yù)處理和特征指標(biāo)的提取,數(shù)據(jù)處理的時(shí)間周期為30 s,每個(gè)項(xiàng)目第一個(gè)和最后一個(gè)30 s的數(shù)據(jù)不納入統(tǒng)計(jì)口徑。
線性回歸模型的輸入指標(biāo)為count值,雖然GT3X+的配套軟件actlife6.11可直接導(dǎo)出,但因數(shù)據(jù)處理的過程是其商業(yè)機(jī)密,未見相關(guān)文獻(xiàn)報(bào)告。為提高數(shù)據(jù)處理結(jié)果的普適性,本研究未直接使用軟件導(dǎo)出的count值,而是參考相關(guān)研究成果自行合成,數(shù)據(jù)處理分為3個(gè)階段:1)濾波:濾除噪聲頻段和干擾及特定波段頻率,參考孫泊等(2013)的研究,采用二階巴特沃茲0.2~10 HZ帶通濾波器對(duì)X、Y、Z三軸的原始加速度數(shù)據(jù)進(jìn)行濾波;2)數(shù)據(jù)的修正:為了去除重力趨勢(shì)對(duì)各軸的作用,同時(shí)對(duì)3個(gè)軸過濾后的加速度數(shù)據(jù)進(jìn)行去趨勢(shì)處理,公式為特征指標(biāo)的提?。河捎谠夹盘?hào)均是雙向的,先取絕對(duì)值后再計(jì)算積分,同時(shí)考慮到加速度計(jì)佩戴在不同部位,會(huì)出現(xiàn)傳感器的運(yùn)動(dòng)軸與實(shí)際運(yùn)動(dòng)情況不能有效匹配(Schaefer et al.,2014),故采用三軸的數(shù)據(jù)合成矢量計(jì)數(shù)(vector magnitude,VM),公式為來表征count值。
神經(jīng)網(wǎng)絡(luò)模型特征指標(biāo)的提取中,為降低模型的運(yùn)算負(fù)擔(dān),同時(shí)鑒于Migueles等(2017) 的研究顯示,頻閾指標(biāo)在提高能耗預(yù)測(cè)準(zhǔn)確性的作用有限,本研究僅選取時(shí)域類指標(biāo),直接從原始數(shù)據(jù)中(未濾波)提取每個(gè)軸每30 s中的9個(gè)指標(biāo):M、SD、Min、Max、P10、P25、P50、P75 和P90,3個(gè)軸共計(jì)27個(gè)指標(biāo),前4個(gè)指標(biāo)的選取依據(jù)Montoye等(2015)的研究成果,后5個(gè)指標(biāo)來自Staudenmayer(2009)的研究。
采用MATLAB7.0對(duì)數(shù)據(jù)進(jìn)行預(yù)處理和指標(biāo)的合成,形成每30 s的各種特征指標(biāo)(過程見1.4),然后從K4b2導(dǎo)出*.xpo文件,并轉(zhuǎn)換獲取METs/30數(shù)據(jù)庫,與加速度特征指標(biāo)按照時(shí)間點(diǎn)一一對(duì)應(yīng)形成數(shù)據(jù)庫。
使用Matlab7.0軟件進(jìn)行6次留一交叉驗(yàn)證分析,分別建立髖部、手腕和大腿的神經(jīng)網(wǎng)絡(luò)模型和線性回歸模型(共計(jì)6個(gè)模型),并輸出相應(yīng)的預(yù)測(cè)值。留一交叉驗(yàn)證分析以每個(gè)受試者為單位,在42名受試者中,每輪留1個(gè)個(gè)體數(shù)據(jù)作驗(yàn)證,其他41個(gè)個(gè)體數(shù)據(jù)建模,總共輪換進(jìn)行42輪,得到42個(gè)測(cè)試結(jié)果,用參數(shù)的平均值來表征模型。該方法相對(duì)于傳統(tǒng)的holdout檢驗(yàn)(將數(shù)據(jù)分為兩組,一組建模和一組驗(yàn)證),可以從有限的數(shù)據(jù)中獲得盡可能多的有效信息,避免陷入局部的極值(范永東,2013)。
采用均方根誤差(root-mean-square error,RMSE)指標(biāo)來判斷模型預(yù)測(cè)準(zhǔn)確性,公式為:
以個(gè)體為單位來計(jì)算該指標(biāo),并作為檢驗(yàn)變量,采用SPSS22.0軟件運(yùn)用雙因素重復(fù)測(cè)量方差分析進(jìn)行佩戴部位和算法交互效應(yīng)的分析,以及相同模型不同部位之間的比較和相同部位不同模型之間的比較。
使用MiniTAP軟件進(jìn)行等效性檢驗(yàn),以判斷各模型預(yù)測(cè)METs和實(shí)測(cè)METs測(cè)量結(jié)果的等效性,標(biāo)準(zhǔn)為:預(yù)測(cè)均值90%置信區(qū)間是否落入實(shí)測(cè)均值的等效區(qū)間(μ±10% μ)(Nolan et al.,2014),如果落入則接受備擇假設(shè):下限<檢驗(yàn)值/校標(biāo)均值<上限,可認(rèn)定兩種測(cè)量方法等效。
統(tǒng)計(jì)分析中顯著性水平定義為P<0.05,高度顯著性水平定義為P<0.01。
2.1.1 不同佩戴部位線性回歸方程的建構(gòu)
手腕、髖部和大腿的線性回歸模型見表3,R2分別是0.428、0.702和0.659,SEE分別為1.922、1.415和1.472。髖部模型的斜率最大、腕部模型的截距最大。
表3 不同部位佩戴加速度計(jì)能耗測(cè)量的一般線性回歸模型Table 3 List of Linear Regression Model of Different Wearing Sites
2.1.2 不同佩戴部位神經(jīng)網(wǎng)絡(luò)模型的建構(gòu)
在對(duì)數(shù)據(jù)采用標(biāo)準(zhǔn)公式Y(jié)=(X-Xmin)/(Xmax-Xmin)進(jìn)行歸一化處理后,將輸入層和輸出層指標(biāo)數(shù)帶入?yún)遣眩?007)介紹的公式(n為輸入層指標(biāo)數(shù)、為輸出層指標(biāo)數(shù)),確定各個(gè)部位神經(jīng)網(wǎng)絡(luò)模型的隱層節(jié)點(diǎn)數(shù)為10個(gè),采用動(dòng)量-學(xué)習(xí)率自動(dòng)調(diào)整算法,初始動(dòng)量取值范圍0.2~0.9,學(xué)習(xí)率范圍0.01~0.2,訓(xùn)練網(wǎng)絡(luò)的最大誤差設(shè)定0.001。將1 000次作為停止訓(xùn)練的標(biāo)準(zhǔn)。通過對(duì)網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)的多次調(diào)整和比較,各模型的平均參數(shù)見表4。
從表5可知,各模型的METs預(yù)測(cè)值隨項(xiàng)目變化的趨勢(shì)與實(shí)測(cè)值基本一致,但從同一活動(dòng)項(xiàng)目預(yù)測(cè)值的變異上看,不同部位的神經(jīng)網(wǎng)絡(luò)模型變異較小,預(yù)測(cè)的結(jié)果較為一致,而線性模型中部位之間的變異較大,尤其是在走的項(xiàng)目和上肢活動(dòng)為主的項(xiàng)目中。提示,部位對(duì)預(yù)測(cè)準(zhǔn)確性的影響可能受到算法的調(diào)節(jié),需要進(jìn)一步使用兩因素重復(fù)測(cè)量的方差分析進(jìn)行檢驗(yàn)。
表4 不同部位佩戴加速度計(jì)能耗測(cè)量的神經(jīng)網(wǎng)絡(luò)模型Table 4 List of Neural Network Model of Different Wearing Sites
表5 不同部位佩戴加速度計(jì)的不同能耗預(yù)測(cè)模型的預(yù)測(cè)值和實(shí)測(cè)值Table 5 Predictive Value and Measured Value of Different Models of Energy Expenditure
結(jié)合圖1可知,相對(duì)各部位線性回歸模型的散點(diǎn),神經(jīng)網(wǎng)絡(luò)模型各部位的散點(diǎn)均較靠近參考線,通過對(duì)平均百分誤差(BIAS)的計(jì)算,髖部、大腿和手腕3個(gè)部位中分別有7個(gè)、5個(gè)和6個(gè)項(xiàng)目的BIAS在±5%以內(nèi),在線性回歸模型中,這一數(shù)值分別為3個(gè)、4個(gè)和0個(gè)。而BIAS在±20%之外的項(xiàng)目數(shù)量,線性模型也多于神經(jīng)網(wǎng)絡(luò)模型。
本研究中佩戴部位和算法都是類別變量,檢驗(yàn)變量為RMSE,按照溫忠麒等(2012)的建議,結(jié)合數(shù)據(jù)獲取的被試特征,采用雙因素重復(fù)測(cè)量的方差分析進(jìn)行交互效應(yīng)的檢驗(yàn)。
2.3.1 交互效應(yīng)檢驗(yàn)
表6為球形檢驗(yàn)的結(jié)果,交互項(xiàng)的Mauchly'sW=0.923,P=0.201>0.05,檢驗(yàn)變量滿足球形檢驗(yàn)假設(shè),適合進(jìn)行球形檢驗(yàn),不采用Greenhouse&Geisser方法進(jìn)行校正。
表6 交互項(xiàng)球型檢驗(yàn)Table 6 Sphericity Test of Interaction Items
圖1 各模型預(yù)測(cè)值和實(shí)測(cè)值之間散點(diǎn)圖Figure 1. Scatter Plot between Estimated and Measured Values of Each Models
從表7可以看出,算法和部位的交互項(xiàng)存在著統(tǒng)計(jì)學(xué)意義,F(xiàn)(1、41)=5.376,P=0.006,表明算法與部位存在著交互效應(yīng),算法是部位對(duì)測(cè)量準(zhǔn)確性影響的調(diào)節(jié)變量。
表7 算法*部位交互效應(yīng)檢驗(yàn)Table 7 Interaction Test Table from Algorithms*Sites
2.3.2 不同佩戴部位兩種算法測(cè)量準(zhǔn)確性的多重比較
在交互效應(yīng)確認(rèn)的情況下,應(yīng)進(jìn)一步明晰各自變量的單獨(dú)效應(yīng),先逐一分析不同部位兩種算法的差異。Bonferroni多重比較的結(jié)果顯示(圖2、表8):在髖部,神經(jīng)網(wǎng)絡(luò)模型的RMSE=1.29,線性回歸模型為1.31,兩者之間平均差值僅為0.018,不存在統(tǒng)計(jì)學(xué)意義(P=0.293),在大腿和手腕,兩種算法的差值增加,分別為0.204和0.279,均存在非常顯著性差異(P=0.001和P=0.000)。
表8 不同佩戴位置中兩種算法測(cè)量準(zhǔn)確性的檢驗(yàn)Table 8 Test of Accuracy of Two Algorithms in Different Wearing Sites
圖2 不同佩戴部位中兩種算法的測(cè)量準(zhǔn)確性對(duì)比Figure 2. Comparison of Measurement Accuracy of Two Algorithms in Different WearingSites
2.3.3 不同算法中不同佩戴部位測(cè)量準(zhǔn)確性的多重比較
繼續(xù)探究佩戴部位的單獨(dú)效應(yīng),分別在兩種算法內(nèi)進(jìn)行重復(fù)測(cè)量方差分析。Bonferroni多重比較結(jié)果顯示(表9):在線性回歸模型中,髖部與大腿、髖部與手腕和大腿與手腕之間預(yù)測(cè)準(zhǔn)確性的差異具有統(tǒng)計(jì)學(xué)意義,兩者之間的差值分別為-0.245、-0.402和-0.152,P值分別為0.000,0.000和0.015;在神經(jīng)網(wǎng)絡(luò)模型中,僅有髖部和腕部之間的差異存在統(tǒng)計(jì)學(xué)意義,而髖部與大腿、手腕與大腿之間的差值均不存在統(tǒng)計(jì)學(xué)意義(P=0.380和P=0.201),這也進(jìn)一步表明了神經(jīng)網(wǎng)絡(luò)模型可以降低佩戴部位所產(chǎn)生的測(cè)量誤差。
從表10可知,髖部的神經(jīng)網(wǎng)絡(luò)模型和線性回歸模型以及大腿的神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)數(shù)值90%置信區(qū)間分別為3.81~4.30、3.69~4.27和3.75~4.29,均落在了3.61~4.41的等效區(qū)間,可以認(rèn)定,整體而言上述3個(gè)模型預(yù)測(cè)值與K4b2校標(biāo)值測(cè)量之間具有等效性。
表9 兩種算法中不同佩戴部位之間的測(cè)量準(zhǔn)確性檢驗(yàn)Table 9 Accuracy between Different Wearing Sitesin Two Kinds of Algorithms
表10 各模型預(yù)測(cè)值與校標(biāo)的等效性檢驗(yàn)Table 10 Equivalence Test Table of Model Predictions and Criterion
在日常體力活動(dòng)能耗測(cè)量的研究中,學(xué)者們普遍摒棄了早期以Freedson方程為代表的走跑運(yùn)動(dòng)實(shí)驗(yàn)方案(Hendelman et al.,2000),認(rèn)為走跑方案難以準(zhǔn)確反映日常體力活動(dòng)的特征,其建構(gòu)的方程不能準(zhǔn)確測(cè)量日常生活中的非走跑類活動(dòng)(Leenders et al.,2006),實(shí)驗(yàn)方案的制定必須是走跑方案與非走跑方案的結(jié)合(朱琳 等,2012)。在此基礎(chǔ)上,部分學(xué)者在研究中將靜息類的體力活動(dòng)融入到活動(dòng)方案中,認(rèn)為靜息類的活動(dòng)雖然梅脫值低,但在日常活動(dòng)中占據(jù)較長時(shí)間,不能因其引入方案會(huì)影響方程對(duì)走跑和非走跑運(yùn)動(dòng)的預(yù)測(cè)準(zhǔn)確性而視而不見(Chen et al.,2005)。此外,還有學(xué)者認(rèn)為,在設(shè)計(jì)活動(dòng)方案時(shí)應(yīng)該考慮上下肢的運(yùn)動(dòng)特征。綜上,本研究認(rèn)為,在進(jìn)行加速度計(jì)預(yù)測(cè)日常體力活動(dòng)的能耗研究中,實(shí)驗(yàn)方案應(yīng)是被預(yù)測(cè)人員日常生活的縮影,在構(gòu)建時(shí)應(yīng)考慮被試者因素、肢體活動(dòng)特征因素和活動(dòng)強(qiáng)度因素,綜合搭配,選擇適應(yīng)種類和數(shù)量的體力活動(dòng),保證方案的代表性。
本研究的實(shí)驗(yàn)方案由5種靜息類活動(dòng)、6種走跑類運(yùn)動(dòng),5種生活方式類活動(dòng)和4種體育活動(dòng)構(gòu)成,基本囊括該群體日常體力活動(dòng)的主要類型和項(xiàng)目,又兼顧了活動(dòng)的肢體特征和強(qiáng)度特征。坐姿玩手機(jī)、坐姿打字和坐姿看書均涉及少量上肢肢體活動(dòng),而疊衣服、整理書桌主要是站姿狀態(tài)下較大幅度的上肢活動(dòng),掃地拖地及所有的體育項(xiàng)目均是上、下肢活動(dòng)兼有的非周期性活動(dòng),所有的走跑類活動(dòng)為上、下肢活動(dòng)兼有的周期性活動(dòng)。本方案有6個(gè)活動(dòng)屬于小強(qiáng)度的體力活動(dòng)(<3 METs),8個(gè)活動(dòng)屬于中等強(qiáng)度體力活動(dòng)(3~5.9 METs),6個(gè)活動(dòng)屬于大強(qiáng)度體力活動(dòng)(≥6 METs),活動(dòng)方案基本滿足強(qiáng)度特征。
雖有研究表明,在走跑運(yùn)動(dòng)中,隨著坡度的增加,基于回歸模型的加速度計(jì)能耗預(yù)測(cè)誤差加大,但是鑒于坡道環(huán)境下的走跑在日常走跑下占據(jù)較大比重,同時(shí)考慮到機(jī)器學(xué)習(xí)算法的普適性檢驗(yàn),遂將坡度走跑納入實(shí)驗(yàn)方案中。
本研究結(jié)果顯示,在髖部,神經(jīng)網(wǎng)絡(luò)模型和一般線性模型的RMSE分別為1.29 METs和1.31 METs,兩者之間的差異無統(tǒng)計(jì)學(xué)意義,該研究結(jié)果得到部分其他研究的支持。Montoye等(2017a)的研究顯示,在RMSE指標(biāo)上髖部神經(jīng)網(wǎng)絡(luò)模型僅比線性回歸模型高3%,差異不具統(tǒng)計(jì)學(xué)意義;Freedson等(2011)采用獨(dú)立樣本數(shù)據(jù)進(jìn)行評(píng)估,結(jié)果顯示,兩種模型的RMSE分別為1.90 MET和2.07 METs,差值也較小。在對(duì)能量消耗(energy expenditure,EE)的預(yù)測(cè)上,研究結(jié)果也相似(Rothney et al.,2007)。而Staudenmayer等(2009)用已有模型與神經(jīng)網(wǎng)絡(luò)模型進(jìn)行比較時(shí),結(jié)果卻顯示,神經(jīng)網(wǎng)絡(luò)模型的RMSE為1.22 METs,大幅低于Swarts模型(1.77 METs)和Freedson模型(2.09 METs)。在該研究中,對(duì)于已有模型,采用的是完全獨(dú)立的樣本數(shù)據(jù)進(jìn)行預(yù)測(cè),這是導(dǎo)致其預(yù)測(cè)精度下降的主要原因??傮w來看,在同類型數(shù)據(jù)樣本中進(jìn)行的對(duì)比研究,神經(jīng)網(wǎng)絡(luò)模型對(duì)髖部能耗預(yù)測(cè)的精度提高的作用有限。Freedsons等(2011)認(rèn)為,建模數(shù)據(jù)中包含的活動(dòng)特征信息有限是造成神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)精度難以大幅提高的主要原因。該解釋只是部分原因,而在非獨(dú)立樣本數(shù)據(jù)中出現(xiàn),相似結(jié)果,提示,回歸模型輸入的特征指標(biāo)可能在髖部這一佩戴位置已經(jīng)涵蓋絕大部分的運(yùn)動(dòng)信息,這也可能是造成兩種算法預(yù)測(cè)精度差異不明顯的主要原因。
在腕部能耗預(yù)測(cè)中,本研究結(jié)果顯示,神經(jīng)網(wǎng)絡(luò)模型與線性回歸模型預(yù)測(cè)準(zhǔn)確性存在顯著性的差異,Staudenmayer等(2015)使用高頻數(shù)據(jù)得出的結(jié)果與本研究相似。目前來看,腕部線性回歸算法預(yù)測(cè)精度低已經(jīng)形成共識(shí),Montoye等(1983)、Swartz等(2000)和Chen等(2003)的研究顯示,其預(yù)測(cè)值和實(shí)測(cè)值的相關(guān)系數(shù)分別為0.36、0.18和0.70。而神經(jīng)網(wǎng)絡(luò)模型在腕部加速度計(jì)中的預(yù)測(cè)效力逐漸得到實(shí)證支持(Montoye et al.,2015),這主要是因?yàn)槭滞筇幍倪\(yùn)動(dòng)信息特征豐富,傳統(tǒng)線性回歸模型輸入指標(biāo)count數(shù)值難以表征,造成信息大量流失,影響預(yù)測(cè)的精度和準(zhǔn)確性。
目前對(duì)腿部加速度計(jì)預(yù)測(cè)準(zhǔn)確性的研究相對(duì)較少,一項(xiàng)研究對(duì)比神經(jīng)網(wǎng)絡(luò)模型和線性回歸模型結(jié)果顯示,兩個(gè)模型的RMSE相差高達(dá)0.67 METs(Montoye et al.,2017b),大大超過本研究兩模型的差距(0.204 METs),究其主要原因,可能與統(tǒng)計(jì)分析技術(shù)有關(guān),該研究中線性模型使用的是已有模型,這就造成獨(dú)立樣本數(shù)據(jù)和非獨(dú)立樣本數(shù)據(jù)的錯(cuò)位比較。
綜上所述,似乎存在這樣一個(gè)現(xiàn)象:越接近身體質(zhì)心的位置,算法對(duì)加速度計(jì)預(yù)測(cè)準(zhǔn)確性的影響就越小,或者說,佩戴部位的運(yùn)動(dòng)特征越豐富,算法的作用就越大,未來還需大量的實(shí)證研究對(duì)此形成概化性的結(jié)論。
本研究結(jié)果顯示,線性模型在髖部、大腿和手腕部位的RMSE分別為1.31 METs、1.56 METs和1.71 METs,且兩兩之間的差異存在統(tǒng)計(jì)學(xué)意義。實(shí)際上,佩戴部位對(duì)線性模型影響的研究由來已久,早在20世紀(jì)初Swarts等(2000)就考量了線性回歸模型在髖部和手腕測(cè)量的準(zhǔn)確性,結(jié)果顯示,兩個(gè)部位的加速度計(jì)預(yù)測(cè)的決策系數(shù)僅為0.317和0.033,雖然兩個(gè)部位預(yù)測(cè)差異較大,但整體都低,究其原因,主要是硬件技術(shù)限制,使用的單軸加速度計(jì)很難捕捉豐富的運(yùn)動(dòng)信息。Chen等(2003)的研究采用能量代謝房的測(cè)試結(jié)果作為效標(biāo)檢驗(yàn)髖部和手腕的回歸模型,結(jié)果顯示,實(shí)測(cè)值和預(yù)測(cè)值的相關(guān)系數(shù)分別為0.9和0.7,因其測(cè)試的均是周期性的走跑活動(dòng),所以測(cè)量的準(zhǔn)確性也主要反映的是在走跑活動(dòng)中的準(zhǔn)確性,該研究結(jié)果與Hildebrand等(2014)對(duì)走跑活動(dòng)研究的結(jié)果相似。此外,Rosenberge等(2013)的研究也表明,兩個(gè)部位能耗預(yù)測(cè)準(zhǔn)確性存在顯著性差異。目前對(duì)腿部能耗預(yù)測(cè)的研究相對(duì)較少,Puyau等(2002)采集兒童戶外活動(dòng)的數(shù)據(jù)進(jìn)行分析后顯示,腿部與髖部都能準(zhǔn)確的預(yù)測(cè)走跑為主的活動(dòng)能耗,這與本研究的結(jié)果有一定的出入,其主要原因還是與活動(dòng)方案的設(shè)計(jì)有關(guān),本研究的活動(dòng)方案運(yùn)動(dòng)特征豐富,包含了上肢運(yùn)動(dòng)為主的活動(dòng),這勢(shì)必會(huì)影響線性模型在腿部應(yīng)用的準(zhǔn)確性。
與線性模型部位之間的預(yù)測(cè)差異相比,神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)的結(jié)果截然不同。本研究結(jié)果顯示,僅髖部和手腕之間的差異存在統(tǒng)計(jì)學(xué)意義,且RMSE的差值也僅為0.14 METs,而大腿與髖部和手腕之間均不存在顯著性差異。Montoye等(2017a)的研究顯示,使用神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)時(shí)大腿和髖部之間無顯著性差異,且均顯著性低于手腕部,這與本研究結(jié)果略有差異,體現(xiàn)在大腿和手腕的差異性上;Strath等(2015)利用時(shí)間序列模型預(yù)測(cè)的結(jié)果顯示,髖部、踝關(guān)節(jié)和手腕的RMSE分別為1.05 METs、1.06 METs和1.03 METs,兩兩之間的差異均無顯著性,該研究各個(gè)部位的預(yù)測(cè)誤差均低于本研究,尤其是在手腕關(guān)節(jié)處;Ellis(2014)使用隨機(jī)森林算法的髖部RMSE為1.18 METs,手腕為1.29 METs,且兩者之間的差異也無統(tǒng)計(jì)學(xué)意義。
整體上看,機(jī)器學(xué)習(xí)算法中影響預(yù)測(cè)準(zhǔn)確性的部位特征沒有一般線性模型明顯,線性模型不同部位之間預(yù)測(cè)準(zhǔn)確性的差異更大,這也印證了算法能夠減少佩戴部位對(duì)加速度計(jì)測(cè)量準(zhǔn)確性的影響,與本研究的交互效應(yīng)檢驗(yàn)的結(jié)果是一致的。究其原因:1)因?yàn)槠涑浞掷迷紨?shù)據(jù),將其合成為反映原始信息的眾多指標(biāo),不像傳統(tǒng)的線性回歸模型,受算法限制只能將原始數(shù)據(jù)合成單一的count值,不能充分挖掘原始數(shù)據(jù)中蘊(yùn)含的豐富信息;2)因?yàn)樵撍惴ň哂小爸悄堋碧卣?,能夠自主學(xué)習(xí),依據(jù)現(xiàn)有數(shù)據(jù)優(yōu)化算法,充分利用數(shù)據(jù)中蘊(yùn)含的豐富信息。
線性回歸模型中輸入的指標(biāo)稱為counts,通常是用單位時(shí)間內(nèi)的積分值來表征,即加速度值與X軸圍成的面積,亦有研究采用SVMBrandes et al.,2012)和SVM的校正指標(biāo)(Hildebrand et al.,2014),少量研究還嘗試使用過MAD指標(biāo)(Bastian et al.,2015;V?h?-Ypy? et al.,2015)。對(duì)髖部加速度計(jì)的研究表明,積分值與能耗具有緊密的關(guān)聯(lián)關(guān)系。但本研究結(jié)果表明,在大腿和手腕位置,積分值并不是合適的輸入指標(biāo)。未來應(yīng)進(jìn)一步研究是否有更為匹配相關(guān)佩戴部位的單一輸入指標(biāo),探究是否具有低多重共線性的多元回歸指標(biāo)體系。
機(jī)器學(xué)習(xí)算法的輸入指標(biāo)體中一類是時(shí)域指標(biāo),一類是頻域指標(biāo)。時(shí)域指標(biāo)因其提取簡單、含義清晰而受青睞,并且有研究認(rèn)為,頻域指標(biāo)適合應(yīng)用于活動(dòng)分類上,而在能量消耗預(yù)測(cè)上價(jià)值有限(Preece et al.,2009)。因此,本研究選擇每個(gè)軸9個(gè)時(shí)域指標(biāo),共計(jì)27個(gè)指標(biāo)作為輸入指標(biāo),從預(yù)測(cè)的準(zhǔn)確性上看,該指標(biāo)群是滿足應(yīng)用需要的。目前,對(duì)指標(biāo)的篩選和數(shù)量的確認(rèn)缺乏明確的標(biāo)準(zhǔn),少數(shù)研究采用試湊的方法對(duì)此進(jìn)行研究,Kates等(2016)認(rèn)為,對(duì)于活動(dòng)類型識(shí)別的任務(wù),更多特征指標(biāo)的輸入能夠提高機(jī)器學(xué)習(xí)模型的準(zhǔn)確性;而對(duì)于能耗預(yù)測(cè)的任務(wù),特征指標(biāo)的數(shù)量對(duì)預(yù)測(cè)準(zhǔn)確性的影響具有邊際效應(yīng),Montoye等(2015)的研究結(jié)果支持了這一結(jié)論。但上述研究對(duì)于不同指標(biāo)組合的確認(rèn)具有較大的主觀性,如何客觀地篩選指標(biāo)是未來研究應(yīng)該解決的問題。
本研究中的受試者并沒有包括超重肥胖群體,年齡段也均為18~29歲年輕人,所建立的模型跨樣本的信、效度還有待后續(xù)研究;在研究方案上,所有活動(dòng)均在實(shí)驗(yàn)室情境下以清單的形式執(zhí)行,雖然活動(dòng)項(xiàng)目眾多,基本反映該群體日常體力活動(dòng)狀況,且各強(qiáng)度兼而有之,但還是與日常生活的實(shí)際情況有一定出入,未來在條件允許和技術(shù)成熟的情況下,應(yīng)注重在自由生活情景下進(jìn)行能量準(zhǔn)確性的考察,進(jìn)一步提高方程預(yù)測(cè)的外部效度。
算法是佩戴部位對(duì)加速度計(jì)能耗預(yù)測(cè)準(zhǔn)確性影響的調(diào)節(jié)變量,神經(jīng)網(wǎng)絡(luò)模型可以降低佩戴部位對(duì)預(yù)測(cè)準(zhǔn)確性產(chǎn)生的影響,未來應(yīng)進(jìn)一步加強(qiáng)佩戴部位算法識(shí)別和多部位通用機(jī)器學(xué)習(xí)算法模型的探討,提高加速度計(jì)應(yīng)用的便利性和測(cè)量的準(zhǔn)確性。
從能耗監(jiān)測(cè)的準(zhǔn)確性上看,3個(gè)部位中髖部是最佳的佩戴位置,其次是大腿,最后是手腕;在髖部使用線性回歸模型和神經(jīng)網(wǎng)絡(luò)模型,在大腿應(yīng)用神經(jīng)網(wǎng)絡(luò)模型,能較準(zhǔn)確地監(jiān)測(cè)活動(dòng)能耗,具有應(yīng)用的價(jià)值;腕部和大腿不宜運(yùn)用線性回歸模型,腕部神經(jīng)網(wǎng)絡(luò)模型的運(yùn)用應(yīng)進(jìn)一步探討。