勾建偉, 夏業(yè)茂
(南京林業(yè)大學理學院, 江蘇 南京 210037)
分類數(shù)據(jù)在社會調(diào)查中普遍存在.在客服滿意度調(diào)查中, 消費者對服務產(chǎn)品的滿意度通常存在如下評價:“很滿意”,“滿意”, “一般”,“不滿意”,“非常不滿意”; 人口普查問卷通常設計為諸如性別、民族、受教育程度、職業(yè)等若干選項用以了解人口和住戶的基本情況; 在產(chǎn)品質(zhì)量檢測時對產(chǎn)品質(zhì)量等級的認定等, 這都形成分類數(shù)據(jù).對分類數(shù)據(jù)的統(tǒng)計分析, 一般著眼于研究外部因素如何影響或作用于“類”的機制, 這通常存在兩種辦法: 一是基于類的觀測頻率并結(jié)合各種logit模型來進行統(tǒng)計推斷.這方面存在大量的文獻和著作, 經(jīng)典的《Categorical data analysis》[1]一書對此做了詳細的分析和回顧.但這種方法存在一些問題, 譬如當分類變量個數(shù)較多時, 類別總數(shù)會急劇增加, 這必將大大提高計算的強度和分析的復雜度, 另外, 該方法在刻畫多重分類變量的關(guān)聯(lián)性時不盡如意, 因為它需要借助于偏相關(guān)這一數(shù)學工具, 這無疑割裂了多重變量的整體關(guān)聯(lián)性.另一種是引入潛變量方法.該方法假定每個分類變量都聯(lián)系一個連續(xù)潛變量或向量, 類的界定是通過潛變量或向量的實現(xiàn)值落在不同區(qū)域或窗口來完成的.例如產(chǎn)品的使用期達到一定期限時可以認為是次品, 考試成績達到一定分數(shù)時視為合格等.相比于logit模型而言, 潛變量方法不僅在統(tǒng)計建模和計算方面具有較大優(yōu)勢, 而且在刻畫不同分類變量的關(guān)聯(lián)性方面也十分自然: 連續(xù)變量之間的相關(guān)性在一定程度上就能夠體現(xiàn)出分類變量之間的關(guān)聯(lián)性.[2-7]
基于潛變量方法的分類數(shù)據(jù)分析也存在一些問題, 例如過于依賴潛變量的分布指定等.但最突出的問題是模型或似然對參數(shù)存在不可識別性, 也稱為模型的不確定性.若一個參數(shù)統(tǒng)計模型p(Y,θ)有p(Y,θ1) =p(Y,θ2)蘊含θ1=θ2.則稱p(Y,θ)基于Y對未知參數(shù)θ是可識別的.[8]一個對參數(shù)不能識別的模型將對估計構(gòu)成極大威脅, 它會產(chǎn)生不相合估計.帶有分類變量的潛變量模型的不確定性歸根結(jié)底是由潛變量的不可觀測性所造成的.為了解決分類數(shù)據(jù)潛變量模型的識別性問題, 很多作者對此作了研究, 但主要工作是建立在單個分類變量的基:上并局限于回歸分析領域[9-13].這對于帶有多重分類變量的潛變量模型的可識別性顯然是不夠的.近年來, 部分學者在多元分析領域內(nèi)對多重二分、次序變量展開統(tǒng)計建模, 并針對模型的可識別性提出了一些具體方法和建議[14-16], 但這些工作大多是面向具體模型且沒有從理論上給予嚴格保證, 很多方法只是保證模型是局部可識別的.
本文主要是對帶有多重二分、次序或名義變量的潛變量模型的可識別性在因子分析框架內(nèi)給出了若干使用方便的充分條件.這些條件本質(zhì)上是將因子分析模型的可識別性和分類數(shù)據(jù)的潛變量模型的可識別性結(jié)合起來, 但并不僅僅是簡單組合, 而是力求從模型結(jié)構(gòu)本身去提出條件.這些條件為模型的統(tǒng)計計算提供了一定的便利.
設對i= 1,··· ,n,yi= (yi1,··· ,yip)T為p維獨立的二分觀測向量, 其中yij為取值0,1的隨機變量,j=1,··· ,p,p ≥2,“T”表示轉(zhuǎn)置.在潛變量模型框架內(nèi), 通常假定存在一個p維連續(xù)潛變量使得
其中,
μ為p×1維均值向量,Σ為p×p階協(xié)方差矩陣.對應的似然函數(shù)為
其中,φ(·|μ,Σ)為Np(μ,Σ)的概率密度函數(shù),
為由yi確定的積分區(qū)域.
模型(2.1)-(2.2)通常稱為多元Probit模型.然而似然(2.3)卻對μ,Σ具有不可識別性.事實上,
定理2.1若存在{μ(1),Σ(1)},{μ(2),Σ(2)}使得
當且僅當存在一個正定對角矩陣D=diag{d1,··· ,dp}(dj >0), 使得
證必要性: 首先注意到樣本量的增加并不能改變模型的確定性, 因此考慮n=1, 略去下標i.令由
可知, 若(2.4)成立, 則必然有
其次, 注意到:
其中,R為Σ的相關(guān)系數(shù)矩陣.上述方程組共計有2p個方程, 由(2.7)及上述方程組蘊含R(1)=R(2), 從而Σ(2)=DΣ(1)D.
充分性: 設(2.5)成立.因為
證畢.
為了更仔細地說明方程組(2.8)蘊含R的唯一性, 我們以p=2為例.不難計算,
其中,φ(·)為一元標準正態(tài)概率密度函數(shù), 積分區(qū)域
定理2.1表明似然函數(shù)Lb并不能由μ,Σ唯一確定, 而是在參數(shù)的尺度變換(等價類)意義下唯一確定.在實際應用中, 為了破壞這種同變性, 通常采用參數(shù)約束的辦法, 這導致如下的結(jié)果.
推論2.1若限制μ為分量不為0的已知向量μ0或Σ為相關(guān)系數(shù)矩陣, 則似然(2.3)關(guān)于未知參數(shù)是可識別的.
證由假設可知, (2.5)中D=Ip.證畢.
在因子分析領域, 通常將上述的延伸至帶有因子變量的因子模型[17]:
其中,Λ為p×m階因子負荷矩陣,ωi ~Nm(0,Φ)為m×1維因子變量,δi ~Np(0,Ψδ)為p×1維誤差向量, 且ωi與δi兩者獨立.記θ={μ,Λ,Φ,Ψδ}, 則(μ,Σ), 其中,
此時似然函數(shù)依然為(2.3)形式, 只不過需要將其中的Σ換成Σ(θ).很明顯, 該似然函數(shù)關(guān)于θ不可識別, 其原因有兩種: 1)因子模型本身不確定; 事實上注意到(2.11)中的邊際分布在因子可逆變換下會保持不變.2) Probit模型(2.1)不確定性; 這由定理2.1給出.為了保持最終的似然關(guān)于未知參數(shù)是可識別的, 一種有效的方法是在保證因子模型確定的基:上利用定理2.1通過約束參數(shù)來保證最終似然對參數(shù)具有識別性.
對因子分析模型的模型確定性研究已經(jīng)有相當長的歷史, Bollen[17]等就對此就作出過深刻的研究.但到目前為止, 仍無一個使用方便的充分必要條件來確定該模型.大多數(shù)的做法都是面向具體模型通過約束參數(shù)來達到模型的確定性.本文引用Bollen[17]的兩指標準則.該結(jié)果雖然是一個充分條件, 但它具有較大的普適性: 對一般的因子模型(無論正交或傾斜因子)均適合, 而且因為它對因子負荷矩陣和誤差協(xié)方差矩陣的元素分開進行約束, 這在計算和理論分析上具有較大優(yōu)勢.我們引用如下:
兩指標準則[17]:
1) 每個因子都尺度化, 即對每個因子ωik, 存在λjk=1; 亦即Λ的每一列都存在一個元素1;
2)Λ的每一行都有一個非零元素;
3) 聯(lián)系每個因子的指標個數(shù)至少為2; 即Λ的每一列至少存在兩個非零元素;
4)Ψδ為對角正定矩陣;
5)Φ正定, 且至少存在一對非0的非對角元Φjk0().
對上述條件的說明是必要的: 條件1)是對因子進行標度.由于因子變量為不可觀測變量,其單位一般不明確, 限定因子系數(shù)為1是將因子變量的尺度與觀測變量的尺度等同起來, 這便于解釋該因子對其它指標變量的貢獻; 條件2)則表明每個指標變量都聯(lián)系一個因子, 這也是必要的, 因為指標的主要作用是明示因子; 條件3)要求明示因子變量時需要多重而非單個指標,這主要是因為因子本身就是來解釋多指標的相關(guān)性; 條件4)則要求因子變量能夠解釋指標間的全部相關(guān)性; 條件5)要求至少存在一對因子不獨立.這個條件可以適當放寬.如果要求“每一列非零元素的個數(shù)至少為3”時, 條件5)的因子可以允許相互獨立.
下面我們考慮模型(2.1), (2.11)的可識別性問題.根據(jù)推論2.1, 在保證因子模型確定的基:上, 只需要約束Σ(θ)為相關(guān)系數(shù)矩陣即可.但這種約束破壞了因子負荷參數(shù)與協(xié)方差參數(shù)的分離性, 將會給統(tǒng)計計算造成一定的困難.下面的結(jié)果給出了一個充分條件.該條件只要求在模型(2.11)確定的基:上約束誤差的協(xié)方差陣為單位矩陣即可, 這保持了參數(shù)的分離性, 因此在計算上較為方便.
定理2.2假定模型(2.11)中的Λ,Ψδ和Φ滿足兩指標準則, 且Ψδ=Ip, 則邊際似然(2.3)關(guān)于μ,Λ,Φ是確定的.
證由定理2.1可知, 若Lb(θ(1)) =Lb(θ(2)), 則存在正定對角矩陣D= diag{d1,··· ,dp}(dj >0), 使得
由Σ的確定性立即可知d1=···=d4=1.0.
當然,在(2.11)假定下,似然函數(shù)的不確定性也可以通過限制均值μ=μ0來完成,其中μ0為分量不為0的已知向量, 但這需要事先明確或估計出μ0的位置, 這又要歸結(jié)到Σ約束上.
若定理2.2中的Φ含有參數(shù)結(jié)構(gòu)Φ(φ) 且Φ(φ)關(guān)于φ確定時, 則最終的似然函數(shù)也關(guān)于φ確定.
推論2.2假定模型(2.11)中的Λ,Ψδ和Φ滿足兩指標準則, 且Φ=Φ(φ).若限定Ψδ=Ip且Φ(φ)關(guān)于φ確定, 則邊際似然(2.3)關(guān)于μ,Λ和φ確定.
推論2.2一個直接應用就是結(jié)構(gòu)方程模型的確定.在潛變量分析領域, 結(jié)構(gòu)方程模型[17]是一種用來描述多重因子之間內(nèi)部相互關(guān)系和因果關(guān)聯(lián)的統(tǒng)計方法.該模型將因子變量ωi分為m1個內(nèi)在因子ηi和m2= (m-m1) 個外在因子ξi.內(nèi)在因子之間的關(guān)聯(lián)性以及外在因子對內(nèi)在因子的影響方式是通過如下結(jié)構(gòu)方程來體現(xiàn):
其中, 誤差變量ζi與外在因子ξi以及模型(2.11)中的誤差變量δi相互獨立,B為主對角元素為0的m1×m1階矩陣,Γ為m1×m2(m2=m-m1)階回歸系數(shù)矩陣,Ψζ為m1×m1階對角正定矩陣,Ξ >0.
推論2.3假定模型(2.11)中的ωi={ηi,ξi}滿足(2.15)-(2.16).若Λ滿足二指標準則,Ψδ=Ip,B為下三角均陣, 則似然(2.3)完全由參數(shù)μ,Λ,B,Γ,Ψζ和Ξ確定.
證很顯然, 在(2.15)-(2.16)假定下,ωi ~N(0,Φ), 其中,
B0=Im1-B.不難驗證, 若B為下三角陣(注意其對角線元素為0), 則Φ關(guān)于B,Γ,Ψζ和Ξ確定.由推論2.1, 結(jié)論立得.證畢.
關(guān)于Φ確定性的一個具體例子為
此時,
顯然,Φ關(guān)于ξ是確定的; 其次注意到
由此可知Φ對Γ11,ψζ1,β21,Γ21,ψζ2確定, 從而對B,Γ,Ψζ,Ξ確定.證畢.
注意, 當推論2.3中B=0時結(jié)論自然成立, 這是無遞推結(jié)構(gòu)方程模型.
將多重二分變量推廣為多重次序變量, 則得到帶有多元次序變量的潛變量模型.為簡單起見, 設yi= (yi1,··· ,yip)為p維觀測向量, 其中yij均為取值于{0,1,··· ,K}(K ≥1)的次序變量.K=1即為二分變量.需要指出是, 式(2.1)式中0為的門限值并非必要.事實上, 0可以用本節(jié)的αj替代.為方便起見, 本節(jié)假定K ≥2.在潛變量模型框架內(nèi), 假定yi聯(lián)系一個p維的連續(xù)潛變量(μ,Σ), 使得
其中,-∞=αj0<αj1<···<αjK <αjK+1=+∞為用來界定類的門限值.記
則似然函數(shù)為
其中,
是由yi確定的積分區(qū)域.
與二分變量類似, 似然(3.3)對α,μ,Σ存在不可識別性.
定理3.1若存在{α(1),μ(1),Σ(1)},{α(2),μ(2),Σ(2)}滿足
當且僅當存在一個對角正定矩陣D=diag{d1,··· ,dp}(dj >0), 使得
其中α?為α的第?列.
證類似地, 我們考慮n=1.令首先考慮必要性.注意到y(tǒng)i的邊際分布為
其中,Φ(·)為標準正態(tài)分布函數(shù).由(3.4)可知, 對?=1,··· ,K,j=1,··· ,p,
其次, 注意到
其中R為Σ的相關(guān)系數(shù)矩陣.(3.4),(3.7)及上式蘊含R(1)=R(2).
令T(j)=則T(2)=DT(1).又因為
從而Σ(2)=DΣ(1)DT, 因此式(3.5)成立.
反之, 若(3.5)成立, 則在(3.4)的左邊積分中令(1)=D-1((2))立得右式.證畢.
定理3.1表明似然函數(shù)Lp是在參數(shù)的仿射變換(等價類)意義下唯一確定.同樣地, 在實際應用中, 為了破壞這種同變性, 通常采用約束參數(shù)的辦法, 這導致如下結(jié)果.
定理3.2當(μ,Σ)時, 若下列條件之一成立:
1) 若對j=1,··· ,p, 約束αj1,αjK為固定值;
2) 若對某個?, 約束α?為固定值, 且Σ為相關(guān)系數(shù)矩陣;
3) 若約束μ為固定值,Σ為相關(guān)系數(shù)矩陣;
4) 若對某個?, 約束α?為固定值, 且μ為固定值.
則邊際似然(3.3)關(guān)于自由未知參數(shù)是可識別的.
證由定理3.1可知,若(3.4)成立,則存在一個對角正定矩陣D=diag{d1,··· ,dp}(dj >0),使得
1) 由假設可知
由上述定理可知, 為了保證似然Lp對未知參數(shù)的可識別性, 至少需要在門限值、均值、協(xié)方差矩陣三組參數(shù)中約束兩組參數(shù).在回歸分析領域中, 文獻上常采用定理3.2中的約束1)或2)[14-15]; 這就需要事先知道門限的具體位置.一個可行的做法是: 令αj1=Φ-1αjK=Φ-1(, 其中fj1,fjK分別為yij <1 和yij <K的頻率,Φ-1(·)為標準正態(tài)分布函數(shù)的反函數(shù).
類似地, 我們將模型(3.1)中的推廣為因子模型(2.11), 此時Σ=ΛΦΛT+Φ.與前面二分變量類似, 此時邊際似然存在兩方面不確定性.我們依然假定Λ,Ψδ,Φ滿足兩指標準則.
推論3.1假定模型(2.11)中的Λ,Ψδ和Φ滿足兩指標準則, 且下列條件之一成立:
1) 若對j=1,··· ,p, 約束αj1,αjK為固定值;
2) 若對某個?, 約束α?為固定值, 且Ψδ=Ip;
3) 若約束μ為固定值, 且Ψδ=Ip;
4) 若對某個?, 約束α?為固定值, 且μ為固定值.則邊際似然(3.3)關(guān)于α,μ,Λ,Ψδ,Φ是可識別的.
證首先, 兩指標準則保證因子模型(2.11)是可識別的.
1) 由定理3.2的1), 立得結(jié)論;
2) 由定理3.1可知,Ψδ=Ip蘊含(3.5)中的D=Ip.再由定理3.2中2)可知似然函數(shù)關(guān)于均值參數(shù)和門限值是可識別的;
3) 同2);
4) 由定理3.2的4), 結(jié)論成立.
證畢.
類似地, 若ωi滿足結(jié)構(gòu)方程(2.15)-(2.16), 則有下列結(jié)果:
推論3.2假定模型(2.11), (2.15)中的Λ,Ψδ和Φ滿足兩指標準則,B為下三角陣, 且下列條件之一:
1) 若對j=1,··· ,p, 約束αj1,αjK為固定值;
2) 若對某個?, 約束α?為固定值, 且Ψδ=Ip;
3) 若約束μ為固定值, 且Ψδ=Ip;
4) 若對某個?, 約束α?為固定值, 且μ為固定值.
則邊際似然(3.3)關(guān)于α,μ,Λ,Ψδ,B,Γ,Ψζ,Φ是可識別的.
證結(jié)合推論2.3和定理3.2, 不難得出上述結(jié)論.證畢.
名義變量又稱為無次序變量.與次序變量類似, 名義變量取值依然表現(xiàn)為多岐性, 但此時yij ∈{0,1,··· ,K}的取值僅僅代表類別, 而無次序含義.譬如, 在若干種商品組成的選項中, 很難界定一種商品比另一種商品優(yōu)或劣, 這時就表現(xiàn)出名義屬性來.此時用潛變量模型(3.1)來界定這樣的類并不恰當, 但可以借助于該思想, 對每個yij, 引入一個K維連續(xù)潛在向量使得
其中,
μ為pK×1維截距向量,Σ >0為pK×pK階正定協(xié)方差矩陣.在某些情形下, 為了降低參數(shù)維數(shù), 可以取Σ=U ?V, 其中U,V分別為p×p和K ×K階正定矩陣, 這導致服從矩陣正態(tài)分布.
此時似然(4.3)完全由參數(shù){μjk/σjk,σjk/σj?,Rjk}或等價地由參數(shù){μjk/σj1,σjk/σj1,Rjk}確定.因此, (4.4)蘊含著
與多元次序變量潛變量模型識別性類似, 可以考慮限制參數(shù)來保證似然對參數(shù)的可識別性.
推論4.2對于模型(4.1)和(4.2), 記
若限制第?(= 1,··· ,K)列μ(?)元素為不為0的固定值或?qū)= 1,··· ,p, 限制Σjj的某個對角元素為1, 或trΣjj=dj0>0為常數(shù), 則似然(4.3)關(guān)于未知自由參數(shù)是確定的.
我們首先考慮模型(4.1), (4.11)似然的可識別性.
定理4.2考慮因子模型(4.11).若Λj,Ψδj,Φ滿足兩指標準則, 且對j=1,··· ,p,ψδj,11=1, 則似然(4.3)對參數(shù)μj,Λj,Ψδj,Φ可識別.
證由定理4.1可知,若(4.4)成立,則存在一個對角正定矩陣D=diag{d1,··· ,dp}(dj >0),使得
特別地,
類似于定理2.2證明, 可以調(diào)整Λ(1)和Φ(1)使得
證畢.
定理4.2要求(4.11)中Λj,Φ,Ψδj都滿足二指標準則, 這在實際應用中往往難以實現(xiàn).例如m=1, 至少K=2 當m=2時,K至少要等于3.可以將上述條件稍微放寬一點, 得到如下結(jié)果.
定理4.3考慮因子模型(4.11).記
若Λ,Φ,Ψδ滿足二指標準則, 且對j=1,··· ,p,ψδj,11=1, 則似然(4.3)對參數(shù)μj,Λj,Ψδj,Φ可識別.
證由定理4.1可知, 存在D使得
類似與定理2.2證法, 我們有
一個符合定理4.3但不符合定理4.2的例子為: 考慮p=K=m=2,
顯然,Λj并不符合兩指標準則, 但Λ卻是符合的.
不難驗證,Σ關(guān)于λjk,φjk和ψδj是確定的.
我們按照上述模型產(chǎn)生數(shù)據(jù)集.總體參數(shù)真實值設置為:μ= 0.8×18,λjk= 0.8,ψδj=1.0, (αj1,αj2,αj3)=(-1.6,0.0,1.4)(j=3,4),
對于當前模型而言, 由于共計存在6層2×2×4×4×3×3=576個格子, 為了避免格子中的樣本稀疏, 我們?nèi)颖救萘繛?000, 平均到每個格子的頻數(shù)約為10.
我們對上述模型進行貝葉斯推斷.與頻率推斷相比, 貝葉斯方法不必依賴于大樣本理論,且計算簡單.考慮如下先驗:
為了保證模型的可識別性, 我們將Ψδ取定為單位矩陣.在計算上, 我們執(zhí)行馬爾可夫鏈蒙特卡洛(MCMC)抽樣方法[19].馬爾可夫鏈蒙特卡洛要求從p(μ|···),p(Λ|···),p(α|···) 以及p(Φ|···)中抽樣.可以仿照[7], 不難得出這些條件分布的具體形式, 這里從略.我們考慮三組不同的初始值來確定估計的收斂性.收斂性通過EPSR值[18]來判斷.圖5.1分別給出了各個參數(shù)在先驗I及不同初始值下EPSR值對迭代次數(shù)的關(guān)系圖.由此圖看出, 在1000步以內(nèi), 所有的參數(shù)的EPSR值都小于1.2.我們截取3000步以后的樣本來計算估計偏差、均方誤和標準誤差.結(jié)果由表5.1給出.從表5.1可以看出, 兩者估計差別區(qū)別并是不是很大, 這說明估計對超參數(shù)值的選擇具有一定的穩(wěn)健性, 但Λ12和Φ11估計的均方誤和標準誤差較大, 這主要是因為二分數(shù)據(jù)提供的總體信息較少.我們將樣本量提高到10000, 則結(jié)果明顯改善.為節(jié)省篇幅, 計算結(jié)果不再一一列出.
模型或似然的可識別問題并不僅僅限于本文所討論的范圍, 在諸如回歸分析、方差分析、缺失數(shù)據(jù)分析等領域都存在一定的模型確定性問題.本文主要是針對多重分類數(shù)據(jù)的潛變量模型的可識別性問題進行了討論, 給出了若干使用方便的充分條件.這些條件可視為將因子分析模型的可識別性和分類數(shù)據(jù)的潛變量模型的可識別性結(jié)合起來, 但也并不僅僅是簡單組合,而是力求從模型結(jié)構(gòu)本身去提出條件.盡管這些只是充分條件而非必要的, 但它們在模型的統(tǒng)計計算方面提供了較大的便利.
圖5.1 先驗I下各參數(shù)EPSR值對迭代次數(shù)的關(guān)系圖: Ψδ =I8
表5.1 兩種先驗下各參數(shù)估計: 樣本量N =6000, Ψδ =I8
不可識別的模型并非要被棄用的模型.模型可識別性只是對參數(shù)估計構(gòu)成影響, 并不影響模型對數(shù)據(jù)擬合評價, 這從似然的不變性不難看出.不可識別的模型雖然對某些參數(shù)估計的確構(gòu)成困難, 但它們的某些函數(shù)卻是可估的.例如不確定的因子分析模型雖然對Λ,Φ,Ψδ估計造成麻煩, 但并不影響Σ=ΛΦΛT+Ψδ的估計.有些情形下, 不可識別的模型可能有助于快速找到模型解, 如正交因子模型中的因子旋轉(zhuǎn).特別在計算上, 著名的PXEM算法(PXDA)算法正是利用模型的不確定性來擴大解的搜索范圍從而便于快速地進行求解(見文[20]).
最后需要指出的是, 對參數(shù)約束只是為了保證非約束參數(shù)的估計能夠到相合到唯一值, 但這并不意味著得到的估計就一定相合到參數(shù)真實值.實際上, 對于不可識別模型而言, 模型只能夠識別到可識別的那些參數(shù).例如, 對于正態(tài)模型N(α+β,1)而言, 模型只能對α+β識別.為了識別α, 可以將β固定成0, 也可以固定為其它值, 但這兩種不同約束導致α的估計相合到的結(jié)果一般并不相同.對于那些非約束參數(shù)而言, 不同的約束實際上代表不同的模型機制; 估計對約束值也相當敏感, 一般并不具有穩(wěn)健性.這就引起一個問題: 如何選擇一個較為適宜的約束.在本文中, 我們盡管討論了約束某些參數(shù)可以保證模型是確定的, 但沒有指明這些約束值是否一定合理, 如何約束需要考慮到問題的實際背景.比如推論2.1中, 將協(xié)方差陣約束為相關(guān)系數(shù)矩陣, 這不并影響潛變量關(guān)性的界定.在定理2.2、推論3.1和定理4.2中, 我們將Ψδ約束為一個單位矩陣, 但在實際問題中如果潛變量的協(xié)方差陣Σ=ΛΦΛT+Ψδ特征根過小, 上述約束可能導致ΛΦΛT奇異, 其結(jié)果是Λ,Φ中非約束參數(shù)可能出現(xiàn)不合理的解.一個較好的做法是將Ψδ約束為c0I形式, 其中c0=0.1或0.01.如何對約束參數(shù)賦值留作進一步的研究和討論.