• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    函數(shù)型正則廣義典型相關(guān)分析

    2022-11-09 09:57:24王志超TENENHAUSArthur王惠文趙青
    關(guān)鍵詞:方差投影權(quán)重

    王志超 TENENHAUS Arthur 王惠文 趙青

    (1. 中國(guó)工商銀行 博士后科研工作站, 北京 100032; 2. 法國(guó)高等電力學(xué)院 信號(hào)處理與電子系統(tǒng)系, 吉夫伊維特 91192;3. 北京航空航天大學(xué) 經(jīng)濟(jì)管理學(xué)院, 北京 100083;4. 北京航空航天大學(xué) 復(fù)雜系統(tǒng)分析與管理決策教育部重點(diǎn)實(shí)驗(yàn)室, 北京 100083)

    Abstract: An effective dimension reduction method for multivariate functional data is developed within the theoretical framework of regularized generalized canonical correlation analysis. Functional data in square integrable spaces is first projected in an integral form to a series of numeric variables, and those variables are then used for simultaneously determining the related projection directions of functional features by maximizing a kind of global correlation measure, which achieves the featured information extraction and rapid dimension reduction of multivariate functional data as traditional numeric variables. A general basis function system is used to create the iterative computing algorithm for the optimal functional projection weights, which is independent of the specified basis functions. A large number of simulation results for infinite samples show that the proposed method is able to detect the correlation among multivariate functional data and obtain consistent estimates for the associated functional projection weights. The real-data study on the gait of Parkinson’s patients indicates the interpretability of the numeric featured information derived from the original functional data and the utility of the proposed method.

    Keywords: functional data; regularized generalized canonical correlation analysis; feature extraction;functional principal component; gait of Parkinson’s syndrome

    隨著傳感器、硬件存儲(chǔ)等信息技術(shù)的快速發(fā)展,數(shù)據(jù)信息的獲取得到極大便捷,可供使用的數(shù)據(jù)資料不再局限于傳統(tǒng)單點(diǎn)型數(shù)值變量,而具有復(fù)雜多樣的表現(xiàn)形式和內(nèi)在特征。 作為新興復(fù)雜數(shù)據(jù)類型之一,函數(shù)型數(shù)據(jù)描述一類指標(biāo)變量隨時(shí)間、空間等因素連續(xù)變化的曲線[1],被廣泛應(yīng)用于眾多研究領(lǐng)域[2-7]。 例如,對(duì)于壓力傳感器實(shí)時(shí)監(jiān)測(cè)的記錄,以及高頻變動(dòng)的股票日內(nèi)價(jià)格和收益率,這些指標(biāo)應(yīng)當(dāng)認(rèn)為是連續(xù)變化的,而不僅僅是若干時(shí)間點(diǎn)觀測(cè)的離散數(shù)值。 曲線的無(wú)窮維特征,成為函數(shù)型數(shù)據(jù)分析(functional data analysis, FDA)需要解決的關(guān)鍵問(wèn)題;因此,許多對(duì)于函數(shù)的等價(jià)表達(dá)方法被陸續(xù)提出,如基函數(shù)展開(kāi)和重生核表示等[8]。

    在日趨復(fù)雜的應(yīng)用場(chǎng)景中,往往需要同時(shí)考慮2 個(gè)甚至更多函數(shù)型變量之間,或函數(shù)型變量與數(shù)值變量之間的關(guān)系。 面對(duì)數(shù)據(jù)多樣化引發(fā)的高維問(wèn)題,需要對(duì)多元函數(shù)型數(shù)據(jù)進(jìn)行降維處理;對(duì)此,一種有效的解決方法是:從函數(shù)型數(shù)據(jù)中提取一系列蘊(yùn)含原函數(shù)特征信息的數(shù)值變量用于后續(xù)統(tǒng)計(jì)建模。 按照這一思路,Ferre 和Yao[9]提出基于切片逆回歸(sliced inverse regression, SIR)的函數(shù)型數(shù)據(jù)充分降維方法;Wang 等[10]進(jìn)一步提出函數(shù)型SIR 方法的穩(wěn)健估計(jì);Reiss 和Ogden[11]則通過(guò)函數(shù)型主成分回歸和函數(shù)型偏最小二乘(partial least squares, PLS)方法確定函數(shù)型數(shù)據(jù)的展開(kāi)表示。

    現(xiàn)有研究主要根據(jù)函數(shù)型數(shù)據(jù)變量?jī)?nèi)部變化信息或模型設(shè)定實(shí)現(xiàn)特征信息的數(shù)值化表達(dá),當(dāng)變量個(gè)數(shù)較多時(shí),逐一進(jìn)行特征信息提取不僅效率低下,且無(wú)法建立不同函數(shù)曲線之間的聯(lián)系?;赟IR 和PLS 的方法雖然考慮了兩兩函數(shù)型變量之間的相關(guān)關(guān)系,但很難適用于更多變量的情形。 Tenenhaus 父子[12-14]提出的正則廣義典型相關(guān)分析(regularized generalized canonical correlation analysis, RGCCA)將眾多分塊數(shù)據(jù)分析方法進(jìn)行推廣統(tǒng)一,得到許多推廣和應(yīng)用[15-18]。

    為了實(shí)現(xiàn)多元函數(shù)型數(shù)據(jù)的特征信息提取及快速降維過(guò)程,本文在FDA 框架下,考慮函數(shù)型RGCCA(functional RGCCA, FRGCCA)。 具體來(lái)說(shuō),FRGCCA 沿一系列函數(shù)型積分投影方向?qū)⒍嘣瘮?shù)型數(shù)據(jù)投影至若干組數(shù)值變量;在整體相關(guān)性度量最大的準(zhǔn)則下,借助函數(shù)型主成分分析(functional principal component analysis, FPCA)方法,確定主成分基函數(shù)展開(kāi)系數(shù),并最終估計(jì)最優(yōu)積分投影方向。 經(jīng)過(guò)大量數(shù)值驗(yàn)證,本文方法被驗(yàn)證能夠快速有效探測(cè)多元函數(shù)型數(shù)據(jù)之間的相關(guān)關(guān)系,并得到相應(yīng)最優(yōu)投影權(quán)重函數(shù)的一致估計(jì)。 在實(shí)例研究中,通過(guò)帕金森綜合征患者步態(tài)數(shù)據(jù)表明,由多元函數(shù)型數(shù)據(jù)投影得到的數(shù)值特征信息具有可解釋性,本文方法具有一定實(shí)用價(jià)值。

    1 FRGCCA 優(yōu)化模型

    考慮函數(shù)型隨機(jī)變量{X(t):t∈F},F表示連續(xù)指標(biāo)集。 對(duì)于任意t∈F,設(shè)X(t)均為數(shù)值隨機(jī)變量,并存在二階矩,即E[X2(t)] <∞,簡(jiǎn)記為X∈L2(F)。 這樣,函數(shù)型數(shù)據(jù)的平方積分內(nèi)積可以表示為

    如式(1)所示,函數(shù)型數(shù)據(jù)X沿投影權(quán)重函數(shù)α被變換至一個(gè)數(shù)值積分投影。

    對(duì)于J個(gè)函數(shù)型隨機(jī)變量Xj∈L2(Fj)及其對(duì)應(yīng)投影權(quán)重函數(shù)αj(j=1,2,…,J),FRGCCA 考慮極大化整體的相關(guān)性度量,即

    式中:連接參數(shù)cjk表示第j和第k個(gè)函數(shù)型隨機(jī)變量之間是否存在關(guān)聯(lián)性,當(dāng)認(rèn)為Xj與Xk相關(guān)時(shí),cjk=1,否則為0;非負(fù)凸函數(shù)g(·)為給定的相關(guān)性度量;Cov(·,·)表示數(shù)值隨機(jī)變量或隨機(jī)向量之間的協(xié)方差或協(xié)方差矩陣。

    與此同時(shí),待估參數(shù)αj需要滿足一定約束條件,即

    式中:Var(·)為數(shù)值隨機(jī)變量的方差;收縮參數(shù)τj∈[0,1]平衡投影方向長(zhǎng)度和投影方差兩方面約束,特別當(dāng)τj=1 時(shí),FRGCCA 具有多元PLS 的形式,當(dāng)τj=0 時(shí),FRGCCA 退化為廣義典型相關(guān)分析。

    2 FRGCCA 參數(shù)估計(jì)

    本文重點(diǎn)討論FRGCCA 的參數(shù)求解過(guò)程,即在式(4)約束條件下,使整體相關(guān)性度量式(3)達(dá)到最大的一系列最優(yōu)投影權(quán)重函數(shù)的估計(jì)方法。

    2.1 基函數(shù)展開(kāi)

    給定Fj上一組基函數(shù)?j= (?j1,?j2,…,?j,Sj)T,Sj為維數(shù),對(duì)于任意t∈Fj,Xj可以表示為

    2.2 最優(yōu)投影權(quán)重函數(shù)估計(jì)

    通過(guò)上述基函數(shù)展開(kāi)表達(dá),式(3)可以表示為

    式中:Σjk= Cov(Uj,Uk);λj為拉格朗日乘子。

    由L(aj,λj;j=1,2,…,J)關(guān)于aj的偏梯度可以得到平穩(wěn)方程:

    式(12)的推導(dǎo)過(guò)程詳見(jiàn)附錄A。

    式(13)和式(14)優(yōu)化過(guò)程基于一系列給定的基函數(shù)系統(tǒng),即?j(j=1,2,…,J)。 事實(shí)上,?j的選取不會(huì)影響Fj上最優(yōu)投影權(quán)重函數(shù)αj的最終結(jié)果(過(guò)程詳見(jiàn)附錄B)。

    本文所提出FRGCCA 的求解算法總結(jié)如下:

    步驟1 初始化。

    如果ω≤ωmax,或者

    注:本文采用基函數(shù)展開(kāi)方法將函數(shù)型數(shù)據(jù)轉(zhuǎn)換為一系列數(shù)值展開(kāi)系數(shù),通過(guò)對(duì)多組展開(kāi)系數(shù)進(jìn)行分析建模,以此重構(gòu)得到對(duì)應(yīng)函數(shù)型投影權(quán)重的相關(guān)結(jié)果。 這一建模思路表明:本文所提出的FRGCCA 方法同樣適用于多組數(shù)值數(shù)據(jù)與一個(gè)或多個(gè)函數(shù)型數(shù)據(jù)同時(shí)存在的混合數(shù)據(jù)情形。 此時(shí),數(shù)值變量和函數(shù)型變量分別在實(shí)向量空間和平方可積空間中通過(guò)各自投影實(shí)現(xiàn)數(shù)值化降維。 具體來(lái)說(shuō),在式(11)中,不妨假設(shè)第j個(gè)變量Xj退化為數(shù)值變量,此時(shí)選取實(shí)向量空間中的自然基?j,那么對(duì)應(yīng)度量矩陣Wj退化為單位矩陣,aj即為Xj在?j下的投影權(quán)重向量。 相應(yīng)計(jì)算過(guò)程與上述FRGCCA 求解算法保持一致。

    2.3 其他因素

    選取特定參數(shù)形式的基函數(shù)往往具有一定主觀性[19];對(duì)此,本文采用基于數(shù)據(jù)驅(qū)動(dòng)的FPCA方法確定基函數(shù)系統(tǒng)。 具體來(lái)說(shuō),在給定?j的基礎(chǔ)上,FPCA 希望找到某個(gè)函數(shù)ξj∈L2(F),使得Xj與ξj的數(shù)值積分投影的方差最大:

    令vj表示ξj在?j下的展開(kāi)系數(shù),則式(15)等價(jià)于求解關(guān)于vj的多元主成分問(wèn)題:

    式中:0≤l0≤1 為設(shè)定的累積方差貢獻(xiàn)率閾值。

    通過(guò)標(biāo)準(zhǔn)正交基函數(shù)系統(tǒng)ξ0j= (ξ1j,ξ2j,…,

    式中:mjkl(k,l=1,2,…,Sj)為Mj中第k行、第l列元素,mjkl和mjkk的方差用相應(yīng)無(wú)偏估計(jì)替代。

    3 數(shù)值實(shí)驗(yàn)

    本節(jié)從3 個(gè)方面檢驗(yàn)所提出FRGCCA 方法在有限樣本情況下對(duì)多元函數(shù)型數(shù)據(jù)進(jìn)行特征信息提取的表現(xiàn),即函數(shù)型數(shù)據(jù)樣本量、特征信息強(qiáng)度及觀測(cè)擾動(dòng)強(qiáng)度、收縮參數(shù)設(shè)置。

    3.1 生成模型

    考慮3 個(gè)定義在不同區(qū)間Ij上的函數(shù)型變量Xj(j=1,2,3),Xj由Ij上通過(guò)等間隔內(nèi)節(jié)點(diǎn)決定的3 次B 樣條基函數(shù)?j= (?j1,?j2,…,?j,Sj)T線性生成,生成系數(shù)為Uj。

    對(duì)于非對(duì)角分塊,

    在3 組展開(kāi)系數(shù)中,依次假設(shè)第2 至第3、第4 至第7、第8 至第11 個(gè)展開(kāi)系數(shù)分量之間是相關(guān)的。 那么當(dāng)τj=1 時(shí),W1/2j aj的理論最優(yōu)解為單位化向量(0,0,…,0,1,1,…,1,0,0,…,0)T,其中取值為1 的分量對(duì)應(yīng)具有相關(guān)性的展開(kāi)系數(shù)分量。 在上述假設(shè)下,首先從U中獨(dú)立生成Xj的n組展開(kāi)系數(shù)uij(i=1,2,…,n),然后在Ij上等概率選取T個(gè)時(shí)刻tj,并生成一系列數(shù)值觀測(cè):

    式中:Φj(tj)為如式(6)所示的數(shù)據(jù)矩陣;εij(tj)為從標(biāo)準(zhǔn)正態(tài)分布中獨(dú)立產(chǎn)生的觀測(cè)擾動(dòng);σ>0為控制擾動(dòng)強(qiáng)度。

    在每次實(shí)驗(yàn)中,假設(shè)3 個(gè)函數(shù)型變量之間兩兩相關(guān),并使用Horst 型單位函數(shù)作為相關(guān)性度量;在FPCA 確定基函數(shù)系統(tǒng)過(guò)程中,選取通過(guò)相應(yīng)區(qū)間上17 個(gè)等間隔內(nèi)節(jié)點(diǎn)決定的3 次B 樣條函數(shù)作為初始基函數(shù)。 記通過(guò)FRGCCA 估計(jì)得到的最優(yōu)投影權(quán)重函數(shù)及其對(duì)應(yīng)展開(kāi)系數(shù)分別為^αj和^aj,用積分平方誤差(integral square error,ISE)衡量^αj的估計(jì)精度,即

    對(duì)于式(21)生成模型中的每種參數(shù)設(shè)置,獨(dú)立重復(fù)進(jìn)行1 000 次數(shù)值實(shí)驗(yàn)。

    3.2 函數(shù)型數(shù)據(jù)樣本量

    考慮不同函數(shù)型數(shù)據(jù)樣本量n對(duì)^αj的影響。在式(21)生成模型中,依次從n=200 增加至n=1 000,并固定T=200、σ=0.1 及收縮參數(shù)τj=1(j=1,2,3)。 表1 報(bào)告了不同函數(shù)型數(shù)據(jù)樣本量情況下,^αj關(guān)于αj理論最優(yōu)解的ISE(放大100 倍)的均值和標(biāo)準(zhǔn)差。

    從表1 中可以看到,隨著n的增加,^αj的均值與相應(yīng)理論最優(yōu)解的差距一致減小,其標(biāo)準(zhǔn)差也同步減小;基于FPCA 生成基函數(shù)得到的估計(jì)結(jié)果,逐步趨近于已知真實(shí)設(shè)定基函數(shù)系統(tǒng)及投影權(quán)重函數(shù)展開(kāi)系數(shù)的理想情況。 上述數(shù)值結(jié)果表明,所提出FRGCCA 方法能夠在有限樣本情況下對(duì)αj的估計(jì)具有一致性。

    表1 不同函數(shù)型數(shù)據(jù)樣本量下FRGCCA 的估計(jì)精度Table 1 Estimation accuracy of FRGCCA under different sample sizes of functional data

    3.3 特征信息及擾動(dòng)強(qiáng)度

    用函數(shù)型數(shù)據(jù)中數(shù)值觀測(cè)量T的大小來(lái)衡量相應(yīng)特征信息強(qiáng)度,考慮T對(duì)^αj的影響。 在式(21)生成模型中,依次設(shè)T=50,100,…,300,并固定n=500、σ=0.1 及τj=1(j=1,2,3)。 表2 報(bào)告了不同數(shù)值觀測(cè)量情況下,關(guān)于αj理論最優(yōu)解的ISE(放大100 倍)的均值和標(biāo)準(zhǔn)差。

    從表2 中可以看到,當(dāng)函數(shù)型數(shù)據(jù)中數(shù)值觀測(cè)量較少(如T=50)時(shí),對(duì)αj的估計(jì)也普遍較差;當(dāng)觀測(cè)量適量增加時(shí),相應(yīng)估計(jì)結(jié)果將顯著提升,并同樣接近真實(shí)設(shè)定基函數(shù)系統(tǒng)及投影權(quán)重函數(shù)展開(kāi)系數(shù)已知情況下的理想結(jié)果。 然而,在達(dá)到一定規(guī)模(如T=200)后,由于基函數(shù)展開(kāi)存在截?cái)嗾`差,過(guò)多的數(shù)值觀測(cè)無(wú)法進(jìn)一步提高估計(jì)精度。

    表2 不同數(shù)值觀測(cè)量下FRGCCA 的估計(jì)精度Table 2 Estimation accuracy of FRGCCA under different sizes of observations

    在本節(jié)參數(shù)設(shè)置基礎(chǔ)上,固定T=200,并考慮不同擾動(dòng)強(qiáng)度σ∈{0,0.2,…,1}。 特別地,σ=0 表示生成模型中不存在觀測(cè)擾動(dòng),但由于使用FPCA 確定基函數(shù)系統(tǒng),相應(yīng)展開(kāi)系數(shù)并不等同于由分布生成的真實(shí)設(shè)置。 表3 報(bào)告了不同數(shù)值觀測(cè)擾動(dòng)強(qiáng)度情況下,^αj關(guān)于αj理論最優(yōu)解的ISE(放大100 倍)的均值和標(biāo)準(zhǔn)差。 從表3 中可以看到,增加σ雖然從整體上增加了^αj的偏差,但增加程度相對(duì)較小。

    由表1 ~表3 可知,在FPCA 確定基函數(shù)系統(tǒng)過(guò)程中,設(shè)定較小的累積方差貢獻(xiàn)率閾值(如l0=0.8)即可得到較好的估計(jì)結(jié)果;設(shè)定過(guò)大的累積方差貢獻(xiàn)率閾值(如l0=0.99)將引入不必要的觀測(cè)擾動(dòng)信息,從而干擾優(yōu)化過(guò)程,使得估計(jì)結(jié)果產(chǎn)生一定偏差和波動(dòng)。 此外,累積方差貢獻(xiàn)率閾值的經(jīng)驗(yàn)設(shè)定可以根據(jù)函數(shù)型數(shù)據(jù)的數(shù)值觀測(cè)量進(jìn)行調(diào)整。 當(dāng)數(shù)值觀測(cè)不足時(shí),需要通過(guò)較多的基函數(shù)展開(kāi)系數(shù)盡可能挖掘函數(shù)型數(shù)據(jù)的變化特征,即設(shè)置較大的l0;而當(dāng)觀數(shù)值觀測(cè)較多時(shí),則需要適當(dāng)減少使用的展開(kāi)系數(shù)個(gè)數(shù),以避免過(guò)擬合。 不過(guò),累積方差貢獻(xiàn)率閾值的設(shè)定并不會(huì)對(duì)投影權(quán)重函數(shù)的估計(jì)產(chǎn)生顯著影響。

    表3 不同數(shù)值觀測(cè)擾動(dòng)強(qiáng)度下FRGCCA 的估計(jì)精度Table 3 Estimation accuracy of FRGCCA under different perturbations of observations

    3.4 收縮參數(shù)

    考慮不同收縮參數(shù)τj對(duì)^αj的影響。 在式(21)生成模型中,設(shè)n=600、T=200 且σ=0.1。 為了衡量^αj的整體波動(dòng),考慮^αj在Ij上的積分方差(integral variance, IVar),即

    圖1 展示了收縮參數(shù)從1 同步變化至0 情況下,相應(yīng)IVar(^αj)的折線圖。 圖中:豎直線段表示均值加減一個(gè)標(biāo)準(zhǔn)差范圍。 此外,設(shè)l0=0.9。

    如圖1 所示,隨著τj減小,IVar(^αj)的均值和標(biāo)準(zhǔn)差顯著增加,這意味著^αj逐漸偏離τj=1 時(shí)αj的理論最優(yōu)解,并具有更大波動(dòng)。 事實(shí)上,在式(4)約束條件中,τj=1 要求αj具有單位函數(shù)長(zhǎng)度,這使得αj無(wú)法變化很大;當(dāng)τj逐漸減小時(shí),這種約束隨之減小,αj的變化程度則相應(yīng)增加。圖1驗(yàn)證了τj在FRGCCA 中的正則化功能,這與傳統(tǒng)RGCCA 框架中的有關(guān)結(jié)論是一致的。

    圖1 不同收縮參數(shù)下FRGCCA 估計(jì)結(jié)果的Ivar 折線圖Fig.1 Line chart for IVar of FRGCCA under different shrinkage parameters

    4 實(shí)例分析

    本節(jié)通過(guò)有關(guān)帕金森綜合征患者行走步態(tài)的實(shí)例數(shù)據(jù)(簡(jiǎn)稱Gait 數(shù)據(jù)集)檢驗(yàn)所提出FRGCCA 方法的實(shí)用性。 表4 簡(jiǎn)要介紹了本文使用的Gait 數(shù)據(jù)集中4 組指標(biāo)變量,更加詳細(xì)的描述參見(jiàn)Goldberger 等[21]的研究。

    表4 Gait 數(shù)據(jù)集指標(biāo)變量說(shuō)明Table 4 Gait dataset indicator variables description

    值得說(shuō)明的是,在Gait 數(shù)據(jù)集中,同時(shí)存在若干組數(shù)值變量(患者體型等)和一個(gè)函數(shù)型變量(實(shí)時(shí)步態(tài))。 按照本文所提出FRGCCA 方法采用的基函數(shù)展開(kāi)思路,函數(shù)型數(shù)據(jù)和傳統(tǒng)數(shù)值數(shù)據(jù)混合的情形同樣適用于本文方法。 本文只需將函數(shù)型變量轉(zhuǎn)化為對(duì)應(yīng)的基函數(shù)展開(kāi)系數(shù)。

    首先將高頻采集的TFULF 原始數(shù)據(jù)曲線進(jìn)行分割,通過(guò)核函數(shù)估計(jì)方法對(duì)一系列分割的原始曲線進(jìn)行擬合,并對(duì)齊至0 ~1 的區(qū)間,其中0和1 分別表示一步行走的開(kāi)始和結(jié)束。 圖2 展示了編號(hào)為“GaPt28”和“SiPt08”患者的TFULF 原始數(shù)據(jù)和擬合曲線。

    圖2 Gait 數(shù)據(jù)集TFULF 曲線示意圖Fig.2 Diagrams of curves of TFULF for Gait dataset

    然后對(duì)上述指標(biāo)變量建立FRGCCA 模型。采用Horst 型單位函數(shù)作為相關(guān)性度量,令收縮參數(shù)均為1,并假設(shè)“患者體型”與“患病程度”2組指標(biāo)變量之間不存在相關(guān)性,那么相應(yīng)關(guān)聯(lián)關(guān)系矩陣為

    在FPCA 確定基函數(shù)系統(tǒng)過(guò)程中,將通過(guò)[0,1]中17 個(gè)等間隔內(nèi)節(jié)點(diǎn)決定的3 次B 樣條函數(shù)作為初始基函數(shù),并設(shè)l0=0.95。 與此同時(shí),通過(guò)重抽樣算法構(gòu)造投影權(quán)重函數(shù)估計(jì)的置信域,并進(jìn)行1 000 次獨(dú)立重復(fù)實(shí)驗(yàn)。 在每次重復(fù)實(shí)驗(yàn)中,有放回選取80%實(shí)驗(yàn)數(shù)據(jù)。 表5 報(bào)告了通過(guò)全樣本估計(jì)得到的3 組多元數(shù)值變量的最優(yōu)投影方向估計(jì)及其相應(yīng)經(jīng)驗(yàn)置信區(qū)間。 圖3 展示了函數(shù)型變量TFULF 對(duì)應(yīng)最優(yōu)投影權(quán)重函數(shù)的全樣本估計(jì)及5%置信水平下的經(jīng)驗(yàn)置信帶。

    表5 三組多元數(shù)值變量對(duì)應(yīng)投影權(quán)重向量的估計(jì)結(jié)果Table 5 Estimated results of corresponding weighted integral vectors for three multivariate groups

    從表5 中可以看到,在“患病程度”分組中,投影權(quán)重向量的分量均為正數(shù),這說(shuō)明通過(guò)投影得到的數(shù)值特征信息與帕金森綜合征患者的患病程度呈正相關(guān)關(guān)系。 與此同時(shí),“步態(tài)特征”分組對(duì)應(yīng)投影權(quán)重向量也印證了這一事實(shí),即患病越嚴(yán)重,患者行走速度越慢、完成一個(gè)步態(tài)周期所需的時(shí)間也就越長(zhǎng)。 在此基礎(chǔ)上,“患者體型”分組對(duì)應(yīng)估計(jì)結(jié)果說(shuō)明,對(duì)于帕金森綜合征患者而言,身高越高或體重越大均會(huì)加重患病的嚴(yán)重程度,且體重對(duì)于患病程度的影響更大。 在經(jīng)驗(yàn)置信區(qū)間方面,FRGCCA 得到估計(jì)結(jié)果的置信區(qū)間普遍較窄,且在5%置信水平下均顯著不為零。

    從圖3 中可以看到,TFULF 對(duì)應(yīng)的最優(yōu)投影權(quán)重函數(shù)估計(jì)曲線在步態(tài)周期開(kāi)始(完成20%前)和結(jié)束(完成80%左右)存在2 個(gè)顯著高于零的波峰,這一結(jié)果說(shuō)明起步和收尾階段的步態(tài)情況對(duì)判斷帕金森綜合征患者的患病程度存在顯著關(guān)聯(lián)。

    5 結(jié) 論

    本文提出對(duì)于多元函數(shù)型數(shù)據(jù)的RGCCA 理論,即FRGCCA,并推導(dǎo)其迭代求解算法。

    1) 本文所提出FRGCCA 方法將RGCCA 的理論框架推廣至FDA 領(lǐng)域,實(shí)現(xiàn)了對(duì)多元函數(shù)型數(shù)據(jù)特征信息的數(shù)值化提取及快速降維。

    2) 通過(guò)基函數(shù)展開(kāi)方法,推導(dǎo)得到關(guān)于最優(yōu)函數(shù)型投影權(quán)重方向的迭代估計(jì)方法,該方法對(duì)于基函數(shù)系統(tǒng)的選取具有獨(dú)立性。 通過(guò)基于數(shù)據(jù)驅(qū)動(dòng)的FPCA 方法確定標(biāo)準(zhǔn)正交的基函數(shù)系統(tǒng)。

    3) 通過(guò)一系列數(shù)值實(shí)驗(yàn),從3 個(gè)方面說(shuō)明了所提出FRGCCA 方法在有限樣本情況下對(duì)投影權(quán)重函數(shù)的估計(jì)具有一致性,并有效實(shí)現(xiàn)多元函數(shù)型數(shù)據(jù)特征信息的數(shù)值化提取及快速降維。

    4) 在對(duì)于Gait 數(shù)據(jù)集的實(shí)例數(shù)據(jù)研究中,所提出FRGCCA 方法得到的數(shù)值特征信息與患病程度呈正相關(guān)關(guān)系,由此驗(yàn)證了所提出方法的實(shí)用價(jià)值。

    附錄A:

    附錄B:

    此時(shí)由式(B2)可以驗(yàn)證

    猜你喜歡
    方差投影權(quán)重
    方差怎么算
    概率與統(tǒng)計(jì)(2)——離散型隨機(jī)變量的期望與方差
    解變分不等式的一種二次投影算法
    權(quán)重常思“浮名輕”
    基于最大相關(guān)熵的簇稀疏仿射投影算法
    計(jì)算方差用哪個(gè)公式
    找投影
    找投影
    為黨督政勤履職 代民行權(quán)重?fù)?dān)當(dāng)
    方差生活秀
    台中市| 禹城市| 剑川县| 景洪市| 正蓝旗| 澄城县| 潼关县| 新巴尔虎左旗| 蓬莱市| 洛隆县| 琼中| 丹巴县| 鄄城县| 平阳县| 竹北市| 区。| 新昌县| 凤山市| 仪陇县| 武义县| 噶尔县| 望奎县| 贵州省| 临城县| 修武县| 靖州| 泰来县| 黄大仙区| 淄博市| 武山县| 潜山县| 同江市| 西盟| 寿宁县| 咸丰县| 佳木斯市| 成都市| 监利县| 吉林省| 平湖市| 南涧|