• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于B-樣條基底展開的曲線聚類方法

    2013-05-12 10:21:58黃恒君
    統(tǒng)計與信息論壇 2013年9期
    關(guān)鍵詞:樣條基底導(dǎo)數(shù)

    黃恒君

    (蘭州商學(xué)院a.統(tǒng)計學(xué)院;b.甘肅省經(jīng)濟發(fā)展數(shù)量分析研究中心,甘肅 蘭州 730020)

    基于B-樣條基底展開的曲線聚類方法

    黃恒君a,b

    (蘭州商學(xué)院a.統(tǒng)計學(xué)院;b.甘肅省經(jīng)濟發(fā)展數(shù)量分析研究中心,甘肅 蘭州 730020)

    隨著大數(shù)據(jù)時代的來臨,近年來函數(shù)型數(shù)據(jù)分析方法成為研究的熱點問題,針對曲線的聚類分析方法引起了學(xué)界的關(guān)注。給出一種曲線聚類的方法:以L2距離作為親疏程度的度量,在B-樣條基底函數(shù)展開表述下,將曲線本身信息、曲線變化信息引入聚類算法構(gòu)建,并實現(xiàn)了曲線聚類與傳統(tǒng)多元統(tǒng)計聚類方法的對接。作為應(yīng)用,以城鄉(xiāng)收入函數(shù)聚類實例驗證了該曲線聚類方法,結(jié)果表明,在引入曲線變化信息的情況下,比僅考慮曲線本身信息能夠取得更好的聚類效果。

    函數(shù)型數(shù)據(jù);大數(shù)據(jù);曲線聚類;B-樣條

    一、問題的提出

    在統(tǒng)計研究和統(tǒng)計工作中,人們經(jīng)常面臨截面數(shù)據(jù)、時序數(shù)據(jù),以及相對復(fù)雜的面板數(shù)據(jù)、縱向數(shù)據(jù)的處理和分析問題。隨著大數(shù)據(jù)時代的來臨,在統(tǒng)計數(shù)據(jù)結(jié)構(gòu)越來越復(fù)雜的同時,數(shù)據(jù)采集的密集化程度也越來越高,隨之出現(xiàn)了一種有別于傳統(tǒng)形式、具有明顯函數(shù)特征的數(shù)據(jù)類型。如心理學(xué)研究中的腦電信號數(shù)據(jù)、生物技術(shù)中的基因微序列數(shù)據(jù)、化學(xué)計量中的光譜分析數(shù)據(jù)、經(jīng)濟研究中的股票分時成交價數(shù)據(jù)、地區(qū)的人均收入水平數(shù)據(jù)等,都表現(xiàn)出明顯的函數(shù)特征。當(dāng)前文獻中將這種數(shù)據(jù)類型稱為函數(shù)型數(shù)據(jù)[1]1-18。

    對于這種數(shù)據(jù)類型,人們通常能夠采用傳統(tǒng)的統(tǒng)計工具(如多元統(tǒng)計方法)進行分析。但由于未能考慮到數(shù)據(jù)的函數(shù)特性,傳統(tǒng)統(tǒng)計工具除了計算過程中可能伴隨奇異矩陣處理的技術(shù)問題外,更加重要的是,函數(shù)信息丟失使得使用傳統(tǒng)統(tǒng)計工具不利于函數(shù)型數(shù)據(jù)中所包含信息的全面挖掘,因而往往不能取得很好的分析效果。

    為此,人們有針對性地開發(fā)函數(shù)型數(shù)據(jù)分析方法[2-3]。就目前的研究來看,函數(shù)型數(shù)據(jù)分析的大多數(shù)研究內(nèi)容可以看成是有限維多元分析方法向無限維函數(shù)的延伸和拓展:一方面,從延伸性角度講,對函數(shù)型數(shù)據(jù)進行分析的過程中,往往要將無限維對象投影到有限維空間進行分析,多元統(tǒng)計中的絕大多數(shù)方法都能在函數(shù)型數(shù)據(jù)場合找到類似模型。另一方面,從拓展性視角看,正是由于數(shù)據(jù)本身的函數(shù)特征,函數(shù)型數(shù)據(jù)分析中許多內(nèi)容,諸如數(shù)據(jù)平滑處理技術(shù)(通常表現(xiàn)為非參數(shù)回歸)、泛函分析工具運用(通常表現(xiàn)為Hilbert空間上的線性算子)以及針對函數(shù)的一些假定(如平方可積性)等,是多元統(tǒng)計分析無法涉及的。

    聚類分析作為一種重要的多元統(tǒng)計方法,在許多領(lǐng)域得到廣泛的應(yīng)用,其基本思想是依據(jù)數(shù)據(jù)之間的親疏程度,對樣品或變量進行歸類。經(jīng)典的聚類算法包括系統(tǒng)聚類、動態(tài)聚類等[4]228-252。依據(jù)前面的描述,可以將多元統(tǒng)計中聚類分析的思想推廣到函數(shù)型數(shù)據(jù)的情形。當(dāng)前研究中,曲線聚類的方法引起了人們的研究興趣,包括曲線的分割歸類和曲線的整體聚類[5]。本文針對后者進行討論。

    無論數(shù)據(jù)本身是否具有函數(shù)特征,其觀測值往往是離散的。在曲線得到擬合的基礎(chǔ)上,目前對曲線聚類主要包括兩種做法:一是在對所擬合曲線協(xié)方差算子譜分解(Karhumen-Loêve)展開)的基礎(chǔ)上,進行降維聚類算法構(gòu)建[6];二是將無限維函數(shù)投影到基底函數(shù)張成的有限維空間,進而采用多元統(tǒng)計中的方法進行聚類[7-8]。Abraham C等提出了后面一種思路,并探討了以對基底函數(shù)系數(shù)聚類代替直接對曲線聚類的做法;王惠文等研究了這種做法在正交基底表述的表現(xiàn)[9]。這種基底表述法的優(yōu)點在于較好地實現(xiàn)了無限維數(shù)據(jù)對象與有限維統(tǒng)計方法的對接,使得多元統(tǒng)計中的聚類算法基本上都能適用于函數(shù)型數(shù)據(jù)的聚類研究。

    但應(yīng)當(dāng)注意到,基底表述法構(gòu)建的聚類算法也存在可擴展的方面。首先,基底函數(shù)系數(shù)并未包含函數(shù)所提供的全面信息,諸如曲線的變化率、變動速度特征(表現(xiàn)為導(dǎo)數(shù)函數(shù))等,在該算法中也未體現(xiàn)這些信息。其次,在非正交基底表述的情況下,曲線之間的距離為基底函數(shù)系數(shù)加權(quán)歐氏距離,直接對基底函數(shù)系數(shù)套用基于非加權(quán)歐氏距離的聚類算法也是欠妥的。

    為此,本文試圖根據(jù)Abraham C等的研究成果,以對基底函數(shù)系數(shù)聚類代替曲線聚類為基本思路,以B-樣條基底為基礎(chǔ),以范數(shù)L2作為曲線親疏程度度量,對曲線聚類算法進行以下擴展研究:第一,討論了L2距離在B-樣條基底表述下的非加權(quán)距離形式構(gòu)造,這種做法使得多元聚類算法可以直接用于函數(shù)型數(shù)據(jù)。第二,將曲線的變化特征(各階導(dǎo)數(shù)函數(shù))納入曲線聚類算法,并在統(tǒng)一的框架下討論曲線聚類問題,這種做法更加有利于函數(shù)特征的全面提取。在曲線聚類算法的基礎(chǔ)上,最后給出一個收入函數(shù)的應(yīng)用實例,用以驗證本文方法的聚類效果。

    二、曲線聚類分析方法構(gòu)建

    根據(jù)前面的敘述,本文討論的曲線聚類方法主要包含三個方面:第一,由觀測離散數(shù)據(jù)生成函數(shù)數(shù)據(jù)(曲線),為了便于后續(xù)分析,這里采用B-樣條基底表述的方法。第二,構(gòu)造曲線之間、導(dǎo)數(shù)函數(shù)之間的“距離”的表述,并通過用B-樣條基底系數(shù)及其差分,將曲線距離、導(dǎo)數(shù)函數(shù)“距離”轉(zhuǎn)化為傳統(tǒng)歐氏距離。第三,以所構(gòu)造的距離作為親疏程度度量,將曲線聚類問題轉(zhuǎn)化為多元統(tǒng)計聚類問題進行分析。

    (一)函數(shù)數(shù)據(jù)生成

    其中 Xi(t)為待估曲線,ti=[ti1,ti2,…,timi]T為自變量t在區(qū)間D=[a,b]中mi個離散點形成的列向量,εi=[εi1,εi1,…,εimi]T中的元素為服從零均值同方差的獨立同分布隨機變量。模型(1)是一個一般形式回歸模型[10]1-21。進一步假定曲線 Xi(t)可由某個既定空間的一組基底函數(shù){φi1(t),φi2(t),…}表述,即:

    則將這種做法稱為基底函數(shù)法,它是將離散觀測數(shù)據(jù)轉(zhuǎn)化為曲線的常用平滑技術(shù)。對Xi(t)的估計通??梢圆捎媒財嗟男问?,將式(2)中的無限維問題轉(zhuǎn)為有限維度下的估計,即:

    第一,對不同曲線Xi(t)(i=1,2,…,n)采用相同基底表述;

    第二,基底函數(shù)制定為等距節(jié)點B-樣條基底。

    在上述設(shè)定的情況下,式(2)可通過如下截斷形式估計:

    在式(4)表述的基礎(chǔ)上,對參數(shù)αi的估計大致可分為回歸樣條和懲罰樣條兩大類,并主要采用最小二乘思路進行估計,具體的估計方法有很多[10]1-21[12-13][14]5-20。這些估計方法都可用于本文曲線聚類方法的構(gòu)建,這里不展開討論。下面分析中,假定已經(jīng)通過某種方法得到參數(shù)αi的估計,方便起見,估計量仍記為αi。

    (二)基底函數(shù)表述的曲線距離

    1.函數(shù)距離

    式(6)的距離公式表述,實際上就是多元統(tǒng)計中的加權(quán)歐氏距離,權(quán)重矩陣為L。由此看出,James G M和Sugar C A算法所采用的距離公式:

    并不適用于非正交基底函數(shù)的情形(如本文采用的B-樣條基底函數(shù))。應(yīng)當(dāng)注意到,式(7)的表述形式簡潔,更加易于實現(xiàn)曲線聚類對多元統(tǒng)計聚類算法的直接套用。為了實現(xiàn)這種對接,對實對稱矩陣L作楚列斯基分解(Cholesky Decomposition),有:

    在上述表述情況下,曲線聚類問題轉(zhuǎn)化為傳統(tǒng)多元統(tǒng)計分析中對系數(shù)向量的聚類問題。任何基于非加權(quán)歐氏距離的傳統(tǒng)聚類方法都可以直接應(yīng)用到曲線聚類分析中。

    2.導(dǎo)數(shù)“距離”

    在上述距離定義的情況下,可以根據(jù)距離公式,運用傳統(tǒng)多元統(tǒng)計聚類算法對曲線進行聚類分析。然而,僅對基底函數(shù)系數(shù)進行分析,實際上并未完全挖掘出曲線內(nèi)部的信息。例如,在對收入函數(shù)的分析中(見下文的實例應(yīng)用),除了曲線本身的差異外,還有必要分析收入增長模式的異同,這就需要將收入的增長速度等函數(shù)特征引入分析,這些特征可以表現(xiàn)為各階導(dǎo)數(shù)曲線。這里僅僅分析B-樣條基底函數(shù)的情況。

    假定式(4)采用B-樣條函數(shù)逼近,并已經(jīng)得到系數(shù) αi的估計。根據(jù) de Boor C 的研究成果[11]115-120,有B-樣條基底函數(shù)的導(dǎo)數(shù)為:

    若采用等距節(jié)點的設(shè)置,上式可以簡化為:

    為(L-2)×(L-1)的一階差分矩陣,則根據(jù)式(11)可以得到一階導(dǎo)數(shù)函數(shù)“距離”公式為:

    式(12)可以作為曲線變遷速度特征的刻畫,當(dāng)式(12)的計算結(jié)果越小,則可以判斷兩個曲線的發(fā)展速度模式越相似①在式(12)中,d2(1)(i,j)=0并不意味著 Xi(t)和 Xj(t)幾乎處處相等。因此,嚴(yán)格來講,式(12)不滿足距離定義,只能算是半距離。作為區(qū)分,這種情況下所謂的“距離”,本文用引號標(biāo)出。。類似于將距離式(6)簡化表述為式(9),式(12)同樣可以作相應(yīng)的簡化,令Dαi=,并對L(1)作楚列斯基分解:

    實際上,繼續(xù)對式(10)求導(dǎo)數(shù),并采用上面相同的分析思路,通過遞歸還可以得到Xi(t)各階導(dǎo)數(shù)表述(假定可導(dǎo)的情況下)。這里僅給出二階導(dǎo)數(shù)函數(shù)的表述:

    其中L(2)=∫DBM-2(t)BM-2(t)Tdt。同樣地,式(17)也可以寫成簡化非加權(quán)歐氏距離的形式,思路與式(12)的推理相同,這里不再贅述。

    (三)曲線聚類算法步驟

    在前面關(guān)于曲線距離的表述下,對曲線的聚類分析問題實際上轉(zhuǎn)化為傳統(tǒng)多元統(tǒng)計中的聚類問題,常用的多元統(tǒng)計聚類方法均可以直接移植到對函數(shù)數(shù)據(jù)的分析中來。具體來講,若研究興趣在于曲線本身,可以采用曲線距離公式(式(9))構(gòu)建聚類分析;若關(guān)注于曲線的變化發(fā)展速度,則可以采用曲線的導(dǎo)數(shù)“距離”公式(式(14))構(gòu)建聚類分析;若希望將曲線本身、曲線的變化特征進行綜合考察,則可以將式(9)、式(14)中的向量bi、b(1)i按照一定的尺度進行拼接,以達(dá)到利用曲線本身特征、曲線變動速度特征等較為全面的信息,對曲線進行聚類的目的。具體算法步驟如下:

    步驟一:選擇擬合的B-樣條空間,即選擇內(nèi)部節(jié)點數(shù)量K和樣條階數(shù)M;

    對于上述聚類分析步驟,需要進一步說明的是:

    第一,在上述算法中,本文僅考慮了曲線本身及一階導(dǎo)數(shù)函數(shù)的情形。當(dāng)然,這種分析容易推廣到更高階導(dǎo)數(shù)函數(shù),思路和做法是一致的。

    第二,對于步驟一、二,本文討論中采用等距節(jié)點設(shè)置的做法,具體參見Eilers P H C和 Marx B D的研究成果[12]。更加一般的設(shè)置可參見de Boor的專著[11]94-106,131-142。

    第三,對于步驟三的估計,主要有回歸樣條和懲罰樣條兩種方式,估計方法多采用最小二乘法,不同的做法可參見Euban K R L、Eilers P H C、O'Sulliv an F、Wahba G等的相關(guān)研究。

    三、實例應(yīng)用

    根據(jù)經(jīng)濟發(fā)展特征,中國城鄉(xiāng)二元結(jié)構(gòu)在經(jīng)濟領(lǐng)域的各個方面都是比較明顯的,居民收入水平的城鄉(xiāng)界限也是相對明確的。利用這種經(jīng)濟發(fā)展過程中的特點,可以驗證本文給出聚類算法的適用性:若上文給出的聚類算法能夠明確區(qū)分城鄉(xiāng)收入函數(shù),則該算法是恰當(dāng)?shù)摹?/p>

    為了對本文聚類算法進行驗證,并將這種聚類算法用于收入函數(shù)的分析,本文采用B-樣條基底函數(shù),以采用回歸樣條的方式擬合了1985—2011年中國大陸各省份的城鎮(zhèn)居民可支配收入、農(nóng)村居民純收入面板數(shù)據(jù)①數(shù)據(jù)來源為歷年各地區(qū)統(tǒng)計年鑒,由于數(shù)據(jù)缺失原因,不包括重慶和西藏。原始數(shù)據(jù)的處理方式為:分別根據(jù)城市居民消費價格指數(shù)和農(nóng)村居民消費價格指數(shù)進行調(diào)整(2009年價格指數(shù)為100)。,擬合結(jié)果按照時間排列生成收入時間序列曲線族[15]。由于涉及收入函數(shù)本身及其導(dǎo)數(shù)函數(shù),為了保證擬合結(jié)果的光滑性,樣條基底函數(shù)階數(shù)定為M=5;內(nèi)部節(jié)點采用等距節(jié)點的設(shè)置方式,節(jié)點數(shù)量的選擇采用廣義交叉驗證(GCV)準(zhǔn)則,最終確定等距內(nèi)部節(jié)點個數(shù)為K=5作為最優(yōu)曲線擬合。本文的運算采用R軟件編程實現(xiàn),代碼可向筆者索取。

    根據(jù)前面的聚類算法,首先采用式(9)的距離公式,對收入函數(shù)本身進行聚類分析,全部收入函數(shù)分為2類①需要說明的是,本文采用的k-Means算法,初始值隨機生成,然后進行一次k-Means聚類(最大迭代次數(shù)為40次),在得到一輪聚類結(jié)果的基礎(chǔ)上,將聚類中心作為下一輪k-Means迭代的初始值,最大迭代次數(shù)為10次。。為了結(jié)果清晰起見,這里將聚類結(jié)果按照自然對數(shù)尺度繪制成圖1。

    圖1 城鄉(xiāng)收入函數(shù)簇聚類結(jié)果圖(函數(shù)本身,自然對數(shù)尺度)

    圖1給出了城鄉(xiāng)收入函數(shù)的聚類結(jié)果(上)及相應(yīng)的函數(shù)類中心(下)。需要指出的是,在圖1(上)中,本文以顏色區(qū)分城鄉(xiāng)天然分類,黑色曲線代表天然農(nóng)村收入時間序列曲線簇,灰色曲線代表天然城鎮(zhèn)收入時間序列曲線簇。以曲線類型區(qū)分聚類結(jié)果,實線表示聚類算法歸類為城鎮(zhèn),虛線表示聚類算法歸類為農(nóng)村。因此,在圖1(上)中,黑色虛線和灰色實線為正確的聚類結(jié)果;黑色實線為錯誤的聚類結(jié)果。需要說明的是,對于兩條錯誤聚類的曲線(黑色實線),位置居上的一條曲線為上海地區(qū)農(nóng)村收入函數(shù),位置居下的一條曲線為北京地區(qū)農(nóng)村收入函數(shù),按照收入函數(shù)本身的聚類算法,本文結(jié)果錯誤地將上海(上)和北京(下)的農(nóng)村收入函數(shù)歸入城鎮(zhèn)收入函數(shù)。當(dāng)然,從圖1(上)的結(jié)果看,由于上海(上)和北京(下)的農(nóng)村收入函數(shù)很難從城鎮(zhèn)收入函數(shù)中分離出來,因此,這種錯誤聚類的結(jié)果應(yīng)該是可以接受的,并不能說明聚類方法失效。但我們?nèi)韵M麑垲惤Y(jié)果進行改進。

    應(yīng)當(dāng)注意到,對于錯誤分類的上海(上)和北京(下)農(nóng)村收入函數(shù),雖然曲線本身難以從城鎮(zhèn)收入函數(shù)中區(qū)分出來,但是這些曲線卻存在不同的動態(tài)走勢,即兩者在斜率上存在差異。為此,我們利用導(dǎo)數(shù)函數(shù)“距離”公式(式(14))進行聚類分析,得到聚類結(jié)果如圖2所示。

    圖2 城鄉(xiāng)收入函數(shù)簇聚類結(jié)果圖(導(dǎo)數(shù)函數(shù),自然對數(shù)尺度)

    從圖2可以看出,當(dāng)將收入函數(shù)的發(fā)展速度(導(dǎo)數(shù)函數(shù))納入分析后,聚類分析的效果有所提高。直觀上看,上海農(nóng)村收入函數(shù)具有向農(nóng)村收入函數(shù)類靠攏的趨勢,得到正確的歸類。而北京農(nóng)村收入函數(shù)具有向城鎮(zhèn)收入函數(shù)類接近的趨勢,因此,仍然未能正確分類。雖然仍存在誤分類,但是總的來講,本文的聚類算法能夠明確區(qū)分城鄉(xiāng)收入函數(shù)特征。

    四、結(jié) 語

    隨著大數(shù)據(jù)時代的來臨,近年來函數(shù)型數(shù)據(jù)分析方法成為研究的熱點問題,而針對函數(shù)數(shù)據(jù)的聚類分析方法也引起了人們的關(guān)注。本文以L2距離作為親疏程度的度量,在B-樣條基底函數(shù)展開表述下,將曲線本身信息、曲線變化信息引入分析,構(gòu)建一種曲線聚類方法,并實現(xiàn)了曲線聚類與傳統(tǒng)多元統(tǒng)計聚類方法的對接,并以城鄉(xiāng)收入函數(shù)的二元結(jié)構(gòu)特征驗證了本文的曲線聚類方法,取得了較好的分類結(jié)果。

    筆者認(rèn)為,本文的曲線聚類方法適用于一類具有時間特征的連續(xù)發(fā)展變化事物的分類研究,在聚類分析的基礎(chǔ)上,還可以分析各類內(nèi)部的特征以及類間的發(fā)展模式差異。例如,這種特征在收入函數(shù)實例應(yīng)用的圖1、圖2中初步直觀顯示出來。鑒于本文的目的,這里不再展開論述。

    當(dāng)然,本文的方法也存在可擴展的方面,由于曲線之間距離、各階導(dǎo)數(shù)函數(shù)之間的距離在數(shù)量級上可能存在差異,如何進行量綱處理,將曲線的各種特征整合起來并納入聚類分析算法,這有待今后進一步的客觀界定研究。

    [1] Ramsay J O,Silverman B W.Functional Data Analysis[M].2ed.New York:Springer,2005.

    [2] Ramsay J O,Dalzell C J.Some Tools for Functional Data Analysis[J].Journal of the Royal Statistical Society:Series B,1991,53(3).

    [3] Ramsay J O.When the Data are Functions[J].Psychometrika,1982,47(4).

    [4] 高惠璇.應(yīng)用多元統(tǒng)計分析[M].北京:北京大學(xué)出版社,2005.

    [5] 翁金鐘,曾玉鈺.函數(shù)數(shù)據(jù)聚類分析方法探析[J].統(tǒng)計與信息論壇,2007,22(5).

    [6] Chiou J M,Li P L.Functional Clustering and Identifying Substructures of Longitudinal Data[J].Journal of the Royal Statistical Society:Series B,2007,69(4).

    [7] James G M,Sugar C A.Clustering for Sparsely Sampled Functional Data[J].Journal of the American Statistical Association,2003,98(2).

    [8] Abraham C,Cornillon P A,Matzner-Lber E,et al.Unsupervised Curve Clustering Using B-Splines[J].Scandinavian Journal of Statistics,2003,30(3).

    [9] 王惠文,王劼,黃可飛.一種函數(shù)型數(shù)據(jù)的聚類分析方法[J].?dāng)?shù)理統(tǒng)計與管理,2009,28(5).

    [10]Eubank R L.Nonparametric Regression and Spline Smoothing[M].2ed.New York:Marcel Dekker,Inc.,1999.

    [11]de Boor C.A Practical Guide to Splines[M].Revised ed.New York:Springer,2001.

    [12]Eilers P H C,Marx B D.Flexible Smoothing with B-splines and Penalties[J].Statistical Science,1996,11(2).

    [13]O'Sullivan F.A Statistical Perspective on Ill-posed Inverse Problems[J].Statistical Science,1986,1(4).

    [14]Wahba G.Spline Models for Observational Data[M].Society for Industrial Mathematics,1990.

    [15]黃恒君.收入不平等變遷特征的探索性分析——基于洛倫茲曲線的動態(tài)分解[J].統(tǒng)計與信息論壇,2012,27(10).

    Curves Clustering Using B-splines Expansion

    HUANG Heng-juna,b
    (a.School of Statistics;b.Quantitative Analysis Center of Gansu Economic Development,Lanzhou University of Finance and Economics;Lanzhou 730020,China)

    With the coming age of big data,functional data analysis as well as curves clustering aroused lots of concern in recent years.Using L2distance as the closeness measurement,a curve clustering approach was proposed in this paper,the curve and it's change was considered in our clustering algorithm,which were approximated by B-splines functions expansion,and the L2distance was reduced to traditional Euclidean distance,so the curves clustering was becoming multivariate clustering algorithm.As an application,urban and rural income function clustering instance was included in this paper,and the result shows that including of the curve change information could obtain a better clustering effect than only the curve itself was considered.

    functional data;big data;curves clustering;B-splines

    O212.4

    A

    1007-3116(2013)09-0003-06

    2013-04-21;修復(fù)日期:2013-06-18

    國家社會科學(xué)基金項目《中國現(xiàn)行社會福利保障制度下城鎮(zhèn)貧困人口的統(tǒng)計研究》(11BTJ002)

    黃恒君,男,浙江溫州人,經(jīng)濟學(xué)博士,副教授,研究方向:調(diào)查技術(shù)與統(tǒng)計分析。

    (責(zé)任編輯:張治國)

    猜你喜歡
    樣條基底導(dǎo)數(shù)
    一元五次B樣條擬插值研究
    《我要我們在一起》主打現(xiàn)實基底 務(wù)必更接地氣
    中國銀幕(2022年4期)2022-04-07 21:28:24
    解導(dǎo)數(shù)題的幾種構(gòu)造妙招
    三次參數(shù)樣條在機床高速高精加工中的應(yīng)用
    三次樣條和二次刪除相輔助的WASD神經(jīng)網(wǎng)絡(luò)與日本人口預(yù)測
    軟件(2017年6期)2017-09-23 20:56:27
    基于樣條函數(shù)的高精度電子秤設(shè)計
    關(guān)于導(dǎo)數(shù)解法
    可溶巖隧道基底巖溶水處理方案探討
    導(dǎo)數(shù)在圓錐曲線中的應(yīng)用
    磁共振顯像對老年椎基底動脈缺血的診斷價值
    海门市| 泌阳县| 迁西县| 安新县| 军事| 渝北区| 惠东县| 克什克腾旗| 潞城市| 渝北区| 博爱县| 桃园市| 阿图什市| 武宁县| 乡城县| 永州市| 广灵县| 惠水县| 南和县| 全南县| 大理市| 涞源县| 桂东县| 瓦房店市| 邹城市| 东兰县| 富平县| 资溪县| 渑池县| 惠州市| 贵德县| 新绛县| 灵丘县| 如皋市| 洪湖市| 曲松县| 乌鲁木齐县| 阳原县| 达拉特旗| 淮南市| 英吉沙县|