鮑世杰
摘 ?要:隨著經(jīng)濟的發(fā)展,假幣逐漸滲入到人們的生活中。貨幣的真?zhèn)闻袛鄻?biāo)準(zhǔn)復(fù)雜,貨幣造假情況多種多樣,應(yīng)用主成分分析法達到降維的目的來更高效地區(qū)分貨幣的真?zhèn)?。該文運用典型相關(guān)分析原理融合特征級數(shù)據(jù),并給出最終識別效果。實驗結(jié)果發(fā)現(xiàn),采取主成分分析法在充分提取貨幣樣本特征的基礎(chǔ)上,能夠和特征向量達到很好的融合效果,識別率為92.983。
關(guān)鍵詞:貨幣識別 ?主成分分析法 ?假幣識別
中圖分類號:P618 ? 文獻標(biāo)識碼:A 文章編號:1672-3791(2019)12(c)-0165-02
貨幣是在人們的生活中扮演著特殊等價物的一種媒介,與人們的日常生活息息相關(guān)。近年來,隨著人們對物質(zhì)生活和精神生活的需求越來越高,貨幣流動性也隨著越來越高,無論在商品購買、民間借貸,還是分發(fā)工資、節(jié)日相互贈送中,都能夠發(fā)現(xiàn)假幣的身影,可以說偽鈔滲透到了社會生活中的每個環(huán)節(jié)、每個方面,嚴(yán)重地影響了貨幣的價值穩(wěn)定,導(dǎo)致貨幣的信譽受到了損害,違背了法律對公民的民事活動要求的誠實信用原則。該文將多個原始貨幣特征變量轉(zhuǎn)換成幾個獨立且不相關(guān)的綜合性貨幣特征變量,僅利用幾個重要的主成分就能夠代表多個貨幣特征變量之間的變化規(guī)律,這樣就可以盡量減少信息的損失。從而能夠比較有效地判別假幣。
1 ?數(shù)據(jù)來源及處理
研究樣本來自弗洛里(Flury)和里德威爾(Riedwyl)于1998年調(diào)查的瑞士銀行1000法郎紙幣的真幣和假幣的數(shù)據(jù)。根據(jù)對貨幣的觀察資料,采集了貨幣的主要信息貨幣的邊長,左側(cè)高度,右側(cè)高度,圖廓的上邊距和圖廓的下邊距。
樣本的每個變量都能在不同程度上反映對于紙幣真假區(qū)分判斷的問題,但變量維數(shù)太高太多,往往會增加分析過程的復(fù)雜性。實踐證明,高的變量維數(shù)未必會有高的分析精度,有時甚至?xí)鸬较喾吹男Ч?。因此,在進行主成分分析之前,選擇樣本變量的維數(shù)十分重要。SPSS軟件可以對原始數(shù)據(jù)進行自動化處理計算出數(shù)據(jù)的標(biāo)準(zhǔn)化標(biāo)準(zhǔn)差,消除指標(biāo)量綱以及數(shù)量級的影響。Matlab軟件可以給數(shù)據(jù)的主成分的得分及特征值進行繪圖,讓我們更直觀地看到各個主成分之間的關(guān)系以及對主成分的選取。
2 ?分析數(shù)據(jù)
2.1 相關(guān)系數(shù)矩陣
由于因子分析是基于相關(guān)矩陣進行的,即要求各指標(biāo)之間具有一定的相關(guān)性,求出相關(guān)矩陣是必要的。首先,通過SPSS的Data下拉菜單中的Re duction中的Factor命令進行因子分析,應(yīng)用主成分分析法來抽取公共因子,并依據(jù)特征值大于1來確定因子數(shù)目。KMO統(tǒng)計量是0.649且Bartlett球體檢驗值為508.979,卡方統(tǒng)計值的顯著水平為0.000小于0.01,綜合總體數(shù)據(jù),從各方面都說明各個指標(biāo)之間具有較高相關(guān)性,因此文章數(shù)據(jù)適用于因子分析。因為數(shù)據(jù)的測度相同,所以選擇協(xié)方差分析。
相關(guān)的結(jié)果和分析,如表1所示。
2.2 主成分表達式
成分矩陣表中給出了標(biāo)準(zhǔn)化原始變量用求得的主成分線性表示的近似表達式,以表2中的左側(cè)高度為例用Prin1、Prin2、Prin3來表達各個主成分,由成分矩陣表可以得到:
標(biāo)準(zhǔn)化的左側(cè)高度差≈0.538×Prin1-0.191×Prin2+0.3
54×Prin3
依據(jù)計算結(jié)果,主成分Y1、Y2、Y3,的累積方差貢獻率達到92.983%。因此,利用Y1、Y2、Y3這3個主成分變量,即可表達原始樣本6個參數(shù)所涵蓋的主要信息。成分矩陣(表2)反映了公因子與原始變量之間的相關(guān)程度,而主成分的系數(shù)矩陣并不反映公因子與原始變量之間的相關(guān)程度,故不能直接用表2中的數(shù)據(jù)表示。對成分矩陣表中的第i列的每個元素除以第i個特征根的平方根,得到主成分分析的第i個主成分的系數(shù)。根據(jù)數(shù)據(jù)可得到3個主成分的線性組合方程如下:
式中:1*、2*、3*、4*、5*、6*分別表示貨幣的長度、左側(cè)高度、右側(cè)高度圖、廓下邊距、圖廓上邊距和對角線長度標(biāo)準(zhǔn)化之后的數(shù)據(jù)。
由以上3個表達式,將標(biāo)準(zhǔn)化之后的變量代入計算之后得到Y(jié)1、Y2、Y3的數(shù)值,再將其對應(yīng)的特征值在總體主成分中所占據(jù)的比例作為權(quán)重計算成分綜合模型,即將第一主成分Y1中的每一個系數(shù)乘以第一主成分對應(yīng)的貢獻率之后除以3個主成分的貢獻率之和,之后加上第二主成分Y2中的每個系數(shù)乘以對應(yīng)貢獻率除以3個主成分貢獻率之和,最后加上第三主成分Y3中每一個系數(shù)乘以對應(yīng)貢獻率除以3個主成分貢獻率之和,就可以得到主成分的綜合得分模型如下:
綜合得分模型Z=(w1Y1+w2Y2+w3Y3)/w
其中w1、w2、w3分別是Y1、Y2、Y3的方差貢獻率,w是3個主成分的貢獻率之和。依據(jù)綜合得分模型,就可以對數(shù)據(jù)從大到小進行排序,就可以對所有的貨幣信息進行排序,進行分析和探討。
參考文獻
[1] 周游,張廣智,高剛,等.核主成分分析法在測井濁積巖巖性識別中的應(yīng)用[J].石油地球物理勘探,2019,54(3):667-675.
[2] 劉毅,陸正元,呂晶,等.主成分分析法在泥頁巖地層巖性識別中的應(yīng)用[J].斷塊油氣田,2017,24(3):360-363.
[3] 尹帥,丁文龍,湯婕,等.主成分分析法在致密碎屑巖儲層有效裂縫識別中的應(yīng)用[J].油氣地質(zhì)與采收率,2016,23(6):1-7.