• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于CART的人力資源管理研究

      2015-09-14 08:26:48豐,胡蕙,胡
      中國(guó)管理信息化 2015年24期
      關(guān)鍵詞:剪枝決策樹(shù)人力

      吳 豐,胡 蕙,胡 芳

      (1.湖北航天計(jì)量測(cè)試技術(shù)研究所,湖北 孝感 432000;2.航天重型工程裝備有限公司,湖北 孝感 432000)

      基于CART的人力資源管理研究

      吳 豐1,胡 蕙1,胡 芳2

      (1.湖北航天計(jì)量測(cè)試技術(shù)研究所,湖北 孝感 432000;
      2.航天重型工程裝備有限公司,湖北 孝感 432000)

      未來(lái)是信息化的時(shí)代,對(duì)高技術(shù)人才的需求越來(lái)越緊迫,企業(yè)管理者所制定的企業(yè)發(fā)展戰(zhàn)略的有效執(zhí)行需要高素質(zhì)人才的支撐,企業(yè)人力資源管理逐步從過(guò)去的開(kāi)放式管理模式逐步向定量評(píng)價(jià)管理發(fā)展,本文根據(jù)Gini指數(shù)建立了人力資源分類樹(shù)CART模型,為企業(yè)建立了一套信息評(píng)價(jià)、過(guò)濾和供給體系,通過(guò)量化評(píng)價(jià)的方式合理安排人員工作,提升了人力資源管理效率,促進(jìn)企業(yè)戰(zhàn)略的順利實(shí)施。通過(guò)測(cè)試表明,該模型能以較簡(jiǎn)單的量化評(píng)價(jià)模式為人力資源管理者提供參考意見(jiàn)。

      人力資源;數(shù)據(jù)挖掘;CART模型;發(fā)展戰(zhàn)略

      人力資源審核即是衡量企業(yè)對(duì)人力資源的掌握程度的重要標(biāo)志,也是評(píng)估管理質(zhì)量、水平和效率的重要依據(jù)。對(duì)于一個(gè)有近千人的企業(yè)來(lái)講,人力資源數(shù)據(jù)量是龐大的,從表面上看這些數(shù)據(jù)只是些毫不相關(guān)的數(shù)字,但從這些海量的數(shù)據(jù)中,卻可以提煉出存在的關(guān)系和規(guī)則,可根據(jù)現(xiàn)有的數(shù)據(jù)預(yù)測(cè)未來(lái)的發(fā)展趨勢(shì)。

      對(duì)于人力資源管理而言,一個(gè)企業(yè)人力資源管理是和一個(gè)企業(yè)的經(jīng)營(yíng)戰(zhàn)略、組織結(jié)構(gòu)體系與文化價(jià)值觀緊密聯(lián)系的,具有獨(dú)特個(gè)性。一個(gè)成功企業(yè)的人力資源管理往往是最難復(fù)制和模仿的,如何通過(guò)人力資源管理來(lái)取得競(jìng)爭(zhēng)優(yōu)勢(shì)成為了企業(yè)競(jìng)爭(zhēng)的重要部分。

      本文是以某企業(yè)人力資源數(shù)據(jù)為依據(jù),建立人力資源數(shù)據(jù)倉(cāng)庫(kù),利用決策樹(shù)中的CART算法對(duì)所建立的數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行深入分析,得出有用結(jié)論。CART決策樹(shù)算法是目前應(yīng)用最廣泛的預(yù)測(cè)技術(shù),它主要由決策節(jié)點(diǎn)、分支和葉子3部分組成。對(duì)數(shù)據(jù)集合中具有最大信息字段創(chuàng)建決策樹(shù)節(jié)點(diǎn),并根據(jù)其節(jié)點(diǎn)字段的差值建立決策樹(shù)分支。在每個(gè)分支中重復(fù)上述過(guò)程,逐步建立樹(shù)的下層節(jié)點(diǎn)和分支,最終可以生成反映一定規(guī)則的決策樹(shù)。

      1 數(shù)據(jù)挖掘的發(fā)展歷史及國(guó)內(nèi)外現(xiàn)狀

      隨著數(shù)據(jù)庫(kù)技術(shù)的日益成熟,以及在相關(guān)領(lǐng)域的應(yīng)用,人們收集了海量的數(shù)據(jù)。面對(duì)大數(shù)據(jù)的挑戰(zhàn),傳統(tǒng)的數(shù)據(jù)分析方法難以應(yīng)對(duì)海量數(shù)據(jù)的挑戰(zhàn)。為了有效的對(duì)數(shù)據(jù)隱含的信息進(jìn)行分析,需要有新的數(shù)據(jù)分析手段。與此同時(shí),人工智能技術(shù)取得了跨越式的發(fā)展。經(jīng)歷了博弈時(shí)期、自然語(yǔ)言理解、知識(shí)工程等階段的探索與發(fā)展,人工智能在機(jī)器學(xué)習(xí)領(lǐng)域取得了重大成就。因此,利用機(jī)器學(xué)習(xí)的方法來(lái)對(duì)數(shù)據(jù)庫(kù)的數(shù)據(jù)進(jìn)行高效分析,發(fā)現(xiàn)大量數(shù)據(jù)背后隱含的知識(shí),稱為知識(shí)發(fā)現(xiàn)(Knowledge Discovery in Databases,KDD)。數(shù)據(jù)發(fā)現(xiàn)涉及機(jī)器學(xué)習(xí)、模式識(shí)別、高性能計(jì)算、統(tǒng)計(jì)學(xué)等多個(gè)領(lǐng)域。將海量數(shù)據(jù)中提取有效的、具有潛在價(jià)值的知識(shí)應(yīng)用于信息管理,科研等領(lǐng)域,為企業(yè)的發(fā)展提供決策。

      知識(shí)發(fā)現(xiàn)(KDD)這個(gè)術(shù)語(yǔ)最早出現(xiàn)在美國(guó)召開(kāi)的第十一屆國(guó)際人工智能聯(lián)合會(huì)議。隨著人工智能領(lǐng)域的飛速發(fā)展,會(huì)議的連續(xù)召開(kāi),原本的專題討論會(huì)已經(jīng)發(fā)展成為國(guó)際性的學(xué)術(shù)會(huì)議。通過(guò)多學(xué)科之間的互相融合,從原本的多策略多技術(shù)轉(zhuǎn)變?yōu)椴呗耘c技術(shù)之間的集成,發(fā)現(xiàn)方法轉(zhuǎn)向了系統(tǒng)應(yīng)用。

      2 CART算法

      分類回歸樹(shù)(Classification And Regression Tree,CART)算法,它采用自上而下的遞歸方法對(duì)數(shù)據(jù)進(jìn)行歸納,從無(wú)次序、無(wú)規(guī)則的數(shù)據(jù)中獲得相應(yīng)的分類規(guī)則,尤其對(duì)非數(shù)值性數(shù)據(jù)有著較好的處理能力。本文將CART算法應(yīng)用于人力資源分析中,起到輔助決策者分析的作用。CART算法是一種二分遞歸分割技術(shù),將新樣本劃分為兩個(gè)子樣本,并使得生成的每個(gè)非葉子結(jié)點(diǎn)都有兩個(gè)分支,因此CART決策樹(shù)是結(jié)構(gòu)簡(jiǎn)潔的二叉樹(shù)。由于CART算法構(gòu)成的二叉樹(shù)在每一步的決策時(shí)只有2個(gè)分支,即使一個(gè)分段取有多個(gè)值,也只能把數(shù)據(jù)分為兩部分。而構(gòu)建CART決策樹(shù)主要分為兩個(gè)步驟。

      3 將樣本遞歸劃分進(jìn)行建樹(shù)過(guò)程

      3.1用驗(yàn)證數(shù)據(jù)進(jìn)行剪枝

      3.1.1CART模型建立

      CART算法核心是對(duì)每個(gè)節(jié)點(diǎn)上要測(cè)試的屬性進(jìn)行選取,其劃分點(diǎn)是一對(duì)連續(xù)變量屬性值的中點(diǎn)。假設(shè)M個(gè)樣本的集合一個(gè)屬性有m個(gè)連續(xù)的值,那么則會(huì)有m-1個(gè)分裂點(diǎn),每個(gè)分裂點(diǎn)為相鄰兩個(gè)連續(xù)值的均值。每個(gè)屬性根據(jù)能減少的雜質(zhì)的量來(lái)進(jìn)行排序劃分,而減少量為劃分前減去劃分后的每個(gè)節(jié)點(diǎn)的雜質(zhì)質(zhì)量所占比率之和。而雜質(zhì)度量方法常用Gini(Gini Coefficient)指標(biāo),假設(shè)一個(gè)樣本共有C類,則一個(gè)節(jié)點(diǎn)A的Gini不純度可定義為:

      其中Pi表示屬于i類的概率,當(dāng)GiniA=0時(shí),所以樣本屬于同類,所有類在節(jié)點(diǎn)中以等概率出現(xiàn)時(shí),Gini(A)最大化,此時(shí):

      如果當(dāng)前節(jié)點(diǎn)的所有樣本都不屬于同一類或者只剩下一個(gè)樣本,那么此節(jié)點(diǎn)為非葉子節(jié)點(diǎn),所以會(huì)嘗試樣本的每個(gè)屬性以及每個(gè)屬性對(duì)應(yīng)的分裂點(diǎn),嘗試找到雜質(zhì)變量最大的一個(gè)劃分,該屬性劃分的子樹(shù)即為最優(yōu)分支。

      3.1.2CART樹(shù)剪枝

      通過(guò)CART剛生成的決策樹(shù)記為T(mén)0,然后從T0的底端開(kāi)始剪枝,直到根節(jié)點(diǎn)。在剪枝的過(guò)程中,計(jì)算損失函數(shù):

      Ca(T)=C(T)+a|T|

      a≥0,C(T)為訓(xùn)練數(shù)據(jù)的預(yù)測(cè)誤差,|T|為模型的復(fù)雜度。對(duì)于一個(gè)固定的a,在T0中一定存在一顆樹(shù)Ta使得損失函數(shù)Ca(T)最小。將a在其取值空間內(nèi)劃分為一系列區(qū)域,在每個(gè)區(qū)域都取一個(gè)a然后得到相應(yīng)的最優(yōu)樹(shù),最終選擇損失函數(shù)最小的最優(yōu)樹(shù)。其中CART剪枝算法步驟如下。

      (1)設(shè)K=0,T=T0,a=+∞

      (2)自下向上地對(duì)各內(nèi)部節(jié)點(diǎn)進(jìn)行遍歷,計(jì)算C(Tt),|Tt|及g(t),得到:

      (3)自上向下訪問(wèn)各內(nèi)部節(jié)點(diǎn)t,若g(t)=a,則進(jìn)行剪枝,并對(duì)t以多數(shù)表決的方式?jīng)Q定其類,得到樹(shù)T。

      (4)若T不是由根節(jié)點(diǎn)單獨(dú)構(gòu)成的樹(shù),則重復(fù)步驟(3)得到一系列的子樹(shù)。

      (5)最后使用交叉驗(yàn)證的方式從子樹(shù)序列中選取最優(yōu)子樹(shù)。

      3.2人力資源數(shù)據(jù)測(cè)試研究

      3.2.1數(shù)據(jù)選擇

      數(shù)據(jù)選擇是指從數(shù)據(jù)本身和發(fā)現(xiàn)目標(biāo)出發(fā),尋找依賴于發(fā)現(xiàn)目標(biāo)特征數(shù)據(jù)的過(guò)程。通過(guò)數(shù)據(jù)選擇有利于減少數(shù)據(jù)量,縮小目標(biāo)數(shù)據(jù)范圍,從而在保證數(shù)據(jù)原貌的前提下對(duì)數(shù)據(jù)進(jìn)行篩選。通過(guò)數(shù)據(jù)抽取使得數(shù)據(jù)具有更加明顯的規(guī)律和特征。通過(guò)對(duì)人才綜合能力定性分析,構(gòu)成了由知識(shí)水平、思想個(gè)性、基本素質(zhì)、個(gè)人能力和業(yè)績(jī)成果5個(gè)基本要素組成的人才評(píng)價(jià)指標(biāo)。經(jīng)過(guò)選取有用的數(shù)據(jù),去掉原數(shù)據(jù)其中噪聲數(shù)據(jù)和一些無(wú)關(guān)的數(shù)據(jù),建立相對(duì)應(yīng)的數(shù)據(jù)表(見(jiàn)表1)。

      表1 人才標(biāo)準(zhǔn)評(píng)價(jià)指標(biāo)表

      3.2.2數(shù)據(jù)規(guī)范

      針對(duì)異構(gòu)數(shù)據(jù)源中數(shù)據(jù)的不規(guī)范性、重復(fù)性和不完整性等問(wèn)題進(jìn)行清理,達(dá)到將數(shù)據(jù)去除噪聲和糾正錯(cuò)誤的目的,提高數(shù)據(jù)質(zhì)量,符合分析要求。因此,數(shù)據(jù)規(guī)范需要對(duì)數(shù)據(jù)做出以下操作。

      員工信息由唯一編號(hào)代替。分別對(duì)5個(gè)基本要素進(jìn)行評(píng)價(jià),其中知識(shí)水平對(duì)應(yīng)A-D(A學(xué)歷層次,B任職資歷,C知識(shí)結(jié)構(gòu),D特殊技能),思想個(gè)性對(duì)應(yīng)E-G(E職業(yè)道德,F(xiàn)合作意識(shí),G工作作風(fēng)),基本素質(zhì)對(duì)應(yīng)H-J(H語(yǔ)言表達(dá),I文字水平,J健康狀況),個(gè)人能力對(duì)應(yīng)K-L(K組織能力,L實(shí)踐能力),業(yè)績(jī)成果對(duì)應(yīng)M-N (M工作效益,N工作獎(jiǎng)項(xiàng))。

      每項(xiàng)要素每當(dāng)達(dá)成一個(gè)評(píng)價(jià)指標(biāo)便累計(jì)加一,最后合計(jì)當(dāng)前要素點(diǎn)的總分。

      分為三種類型的人才,分別為類型ω1、類型ω2和類型ω3。

      通過(guò)對(duì)企業(yè)提供的數(shù)據(jù)進(jìn)行抽樣,選取其中20名員工進(jìn)行測(cè)試,按照數(shù)據(jù)規(guī)范及評(píng)價(jià)指標(biāo)表的要求進(jìn)行,得到測(cè)試數(shù)據(jù)表如表2所示。

      利用Matlab軟件,構(gòu)建人力資源分類樹(shù)CART模型,利用訓(xùn)練樣本所得到的決策樹(shù)見(jiàn)圖1。

      4 結(jié) 語(yǔ)

      本文以某企業(yè)為例,提出了利用數(shù)據(jù)挖掘技術(shù)來(lái)克服在當(dāng)前的人力資源管理中遇到的問(wèn)題,提高管理質(zhì)量。在具體應(yīng)用中,主要利用的是數(shù)據(jù)挖掘中的CART算法,詳細(xì)介紹了CART算法在人力資源分析挖掘中的全過(guò)程。在CART樹(shù)模型的建立過(guò)程中,應(yīng)用算法對(duì)不同類型的人力資源進(jìn)行分析,找出影響的潛在因素,為企業(yè)管理者有針對(duì)性提高管理質(zhì)量提供有利的數(shù)據(jù)支持,使員工能夠較好地保持良好的工作狀態(tài),從而為企業(yè)管理者提供了決策支持信息,促使更好地開(kāi)展管理工作,提高管理質(zhì)量。

      表2 測(cè)試數(shù)據(jù)表

      圖1 生成的CART樹(shù)

      主要參考文獻(xiàn)

      [1]王董雨.如何構(gòu)建企業(yè)人力資源發(fā)展戰(zhàn)略模型[J].上海汽車(chē),2005(3).

      [2]陶宇.人力資源管理團(tuán)隊(duì)績(jī)效評(píng)價(jià)與對(duì)策——基于人力資源審核模型[J].企業(yè)經(jīng)濟(jì),2013(3).

      [3]韓起云.一種基于CART算法的移動(dòng)通信客戶流失預(yù)測(cè)模型[J].科技通報(bào),2012(2).

      [4]駱盈盈,王柯玲,陳川,等.結(jié)合遞增式學(xué)習(xí)的CART算法改進(jìn)[J].計(jì)算機(jī)工程與設(shè)計(jì),2007(7).

      [5]邢周凌.高績(jī)效人力資源管理系統(tǒng)的演變與形成——基于中國(guó)創(chuàng)業(yè)板上市公司的案例研究[J].企業(yè)經(jīng)濟(jì),2012(8).

      10.3969/j.issn.1673 - 0194.2015.24.101

      F272.92

      A

      1673-0194(2015)24-0123-02

      2015-11-19

      猜你喜歡
      剪枝決策樹(shù)人力
      人到晚年宜“剪枝”
      人事檔案管理在人力資源管理中的作用
      人力資源管理促進(jìn)企業(yè)績(jī)效提升
      基于YOLOv4-Tiny模型剪枝算法
      海外并購(gòu)中的人力資源整合之道
      一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹(shù)算法
      決策樹(shù)和隨機(jī)森林方法在管理決策中的應(yīng)用
      電子制作(2018年16期)2018-09-26 03:27:06
      剪枝
      為健康中國(guó)提供強(qiáng)大的人力支撐
      基于決策樹(shù)的出租車(chē)乘客出行目的識(shí)別
      包头市| 平泉县| 云浮市| 白河县| 贵州省| 新乡县| 卫辉市| 富源县| 浪卡子县| 沙河市| 呼和浩特市| 额济纳旗| 博爱县| 霍林郭勒市| 衡阳市| 额尔古纳市| 融水| 徐水县| 揭西县| 襄垣县| 吉林市| 永城市| 湖州市| 阿鲁科尔沁旗| 磴口县| 兴安盟| 扶余县| 上蔡县| 广河县| 中西区| 元朗区| 会宁县| 潼关县| 滦平县| 彭山县| 富民县| 罗平县| 五河县| 枣阳市| 祁东县| 原平市|