何玲玲,林澤榕,張子明,徐常青
(蘇州科技大學 數(shù)理學院,江蘇 蘇州 215009)
高斯分布作為一類連續(xù)概率分布在概率統(tǒng)計學中的重要地位不言而喻,其重要性主要是因自然界中大樣本的普遍性以及大樣本遵從高斯分布的趨勢性。從過去已知的各類隨機變量的大樣本研究以及自然現(xiàn)象規(guī)律性研究中,可看出人類對從隨機現(xiàn)象中的規(guī)律性汲取無法離開這種高斯分布的假設。隨著人類科技進步和信息技術的發(fā)展,人們獲取的信息數(shù)據(jù)開始趨向于超高維(階)和超大樣本集合,這時,傳統(tǒng)的數(shù)據(jù)統(tǒng)計分析和數(shù)據(jù)分布的概率模型假設似乎出現(xiàn)了一些問題。
矩陣高斯(正態(tài))分布是多元正態(tài)分布到隨機矩陣變量正態(tài)分布的推廣。多元高斯分析誕生于20 世紀20 年代后期。1928 年,Wishart 研究了多元正態(tài)總體樣本協(xié)方差的精確分布,這是多元統(tǒng)計分析的開端,Wishart 還首次提出了多元正態(tài)分布的概念。1987 年,張洪青等人刻畫了矩陣高斯分布[1]。
筆者將研究多維(高階)隨機張量的分布。張量為矩陣在高階情形下的推廣,它可視為由多個矢量空間的張量積。最初主要用于力學、計量化學和計量心理學等方面。近10 年來,張量開始在數(shù)據(jù)挖掘[2]、圖像與信號處理[3]、計算機視覺[4]等領域得到應用。近幾年,開始有人將張量運用于模[5-6]。事實上,由于科學技術的發(fā)展,現(xiàn)代化方法采集得到的高維大數(shù)據(jù)集合已非常普遍。這類數(shù)據(jù)的傳統(tǒng)處理方法是將這些高維數(shù)據(jù)平面化,即轉化為矩陣形式,這一方面破壞了數(shù)據(jù)原本的相關結構,也可能會使數(shù)據(jù)矩陣的維數(shù)變得異常龐大,以至于對應的矩陣分解無法實現(xiàn)或分解毫無意義,而高階張量較好保持了數(shù)據(jù)結構。
與一個隨機變量分布不同的是,一個隨機矩陣的分布由行向量組的隨機分布和列向量組的隨機分布組成,且一般情形下對應行(列)向量組具有相同的分布模型(如正態(tài)分布),且協(xié)方差矩陣相同。同樣,一個三階隨機張量的分布由第一個方向的向量組的隨機分布和第二個方向的向量組的隨機分布以及第三個方向的向量組的隨機分布組成,且對應的第一(第二或者第三)個方向的向量組具有相同的分布模型,且協(xié)方差矩陣相同。
定義1[7]一個隨機向量x∈Rn的特征函數(shù)定義為
這里 t∈Rn。類似,一個隨機矩陣 X∈Rm×n的特征函數(shù)定義為
其中 T∈Rm×n。
定義 2(1)稱一個隨機矩陣 Z=(zij)∈Rm×n服從標準正態(tài)矩陣分布,記 Z~Nm,n(0,Im,In),若滿足以下兩條:Zi·′~Nn(0,In),?i=1,2,…,m;Z·j~Nm(0,Im),?j=1,2,…,n。其中 Zi·,Z·j分別表示矩陣 Z 的第i 個行向量和第j 個列向量,In表示n 階單位矩陣。
(2)稱一個隨機矩陣 Y 服從正態(tài)分布,記作 Y~Nm,n(M,Ξ,Σ),若滿足以下條件:Y·j=colj(Y)~Nn(M·j,Ξ),?j=1,2,…,p;Yi·=(rowi(Y))′~Np(Mi·,Σ),?i=1,2,…,n。其中 Ξ∈Rn×n,Σ∈Rp×p,M·j表示 M 的第j 列,Mi·表示 M 的第i 行。
引理 1[7]若隨機矩陣 Y∈Rm×n服從高斯分布,則記為 Y~Nm,n(M,Ξ,Σ)當且僅當
引理 2[7]若 X~Nn1,p1(M,Ξ,Σ),A∈Rn×n1≠0,B∈Rp1×p≠0,C∈Rn×p是常數(shù)矩陣,那么
引理 3[8](1)若隨機向量 x~Nm(0,Im),則其特征函數(shù)為
它的密度函數(shù)為
(2)若隨機矩陣 X~Nm,n(0,Im,In),則它的特征函數(shù)為
密度函數(shù)為
(3)若隨機矩陣 Y~Nm,n(U,Ξ,Σ),Ξ,Σ 都是正定矩陣,那么 Y 的密度函數(shù)為
張量切片是張量矩陣化的降維表示。圖1 給出了一個3 階張量X∈RI×J×K的三種不同方向上的切片方式,即水平切片(horizontal slice)、左右切片(lateral slice)和前后切片(frontal slice)。類似矩陣 A 的行表示法A(i,:)和列表示法 A(:,j),用表示 m 階張量 X 沿方向 k 的第i 張切片,如 X(i,:,:)表示 3階張量 X 模-1 方向的第i 張切片,X(:,j,:)表示 lateral 切片(模-2 方向)的第j(j=1,…,J)個切片,X(:,:,k)表示 frontal 切片(模-3 方向)的第k(j=1,…,K)個切片。
圖1 3 張量在3 個不同方向上的切片
定義 3設有 m 階實張量則兩者內積定義為
定義 4[9](張量-矩陣積) 一個 m 階張量與矩陣 U∈RJ×In沿模-n 的乘積為大小 I1×…×In-1×J×In+1×…×Im的 m 階張量相應元素定義為