鄒曉輝
3結(jié)束語(yǔ)
Logistic回歸是最基本的分類算法之一,算法簡(jiǎn)單且時(shí)間復(fù)雜度低,適合解決線性分類問(wèn)題。機(jī)器學(xué)習(xí)中有“Occam's Razor”原理,即“簡(jiǎn)單有效原理”。如果能用簡(jiǎn)單模型解決問(wèn)題,則不使用更復(fù)雜模型。當(dāng)代數(shù)據(jù)科學(xué)是涵蓋了統(tǒng)計(jì)學(xué)、數(shù)學(xué)、信息學(xué)、優(yōu)化理論以及其它各門(mén)學(xué)科在內(nèi)的交叉學(xué)科,要從大量數(shù)據(jù)中挖掘出有用的知識(shí)和模式,非常重要的一個(gè)問(wèn)題是數(shù)據(jù)的預(yù)處理。從數(shù)據(jù)中提取有用特征,去除冗余信息和噪聲,進(jìn)行特征選擇[5-6]、特征組合、特征降維、特征映射、特征表示等,統(tǒng)計(jì)學(xué)習(xí)算法和模型就是建立在數(shù)據(jù)的特征維度上。高效的目標(biāo)函數(shù)優(yōu)化算法也是數(shù)據(jù)建模領(lǐng)域的重要研究方向。
[J(下轉(zhuǎn)第143頁(yè))
參考文獻(xiàn):[HT]
劉紅巖, 陳劍, 陳國(guó)青. 數(shù)據(jù)挖掘中的數(shù)據(jù)分類算法綜述[J]. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版), 2002, 42(6):727-730.
[2] 李航. 統(tǒng)計(jì)學(xué)習(xí)方法[M]. 北京: 清華大學(xué)出版社, 2012.
[3] 約翰·內(nèi)特. 應(yīng)用線性回歸模型[M]. 北京: 中國(guó)統(tǒng)計(jì)出版社, 1990.
[4] 王濟(jì)川. Logistic回歸模型:方法與應(yīng)用[M]. 北京: 高等教育出版社, 2001.
[5] 姜百寧. 機(jī)器學(xué)習(xí)中的特征選擇算法研究[D]. 青島: 中國(guó)海洋大學(xué), 2009.
[6] 陳鐵明,馬繼霞,HUANG S H. 一種新的快速特征選擇和數(shù)據(jù)分類方法[J]. 計(jì)算機(jī)研究與發(fā)展, 2012, 49(4):735-745.