韓王瑩
(陜西職業(yè)技術學院陜西西安710100)
隨著現(xiàn)代信息技術的發(fā)展,數(shù)據挖掘被應用在各個不同的領域,從而實現(xiàn)對大量信息的有效挖掘。作為企業(yè)人力管理,如何借助數(shù)據挖掘技術實現(xiàn)對企業(yè)管理的科學化、合理化,并從大量的數(shù)據中挖掘中有利于企業(yè)決策的信息,成為當前思考的重要問題。對此,本文通過構建決策樹算法,并對其在人力資源管理中的應用進行了詳細的分析。
決策樹主要被運用于分類的一種樹結構。它是一個以樹狀結構表示的分類器,并通過大量的訓練樣本來產生。在樹狀結構當中,每個不同的節(jié)點都是對屬性的判斷,整個樹狀結構中葉子的節(jié)點則成為分類的最終的結果。其每個內部的節(jié)點代表對屬性的測試,一條線則代表一個測試的結果。最上面的節(jié)點為根結點。
決策樹算法進行分類主要分為兩部分,一部分是通過訓練集建立決策樹模型,另一部分則是對數(shù)據的輸入。在對決策樹建立的過程中,包括兩個階段:第一為建樹;第二為剪枝。建樹則是遞歸的過程,剪枝則是對決策樹進行適當?shù)男拚?。而ID3算法作為決策樹中的典型算法,其原理則是利用信息增量值對節(jié)點的最佳分裂指標質量進行衡量。
假設H=F1*F2*…*Fn為n為有窮向量空間,其中Fi的表示為又窮離散符號集合,H當中的元素e=<V1,V2,…Vn>為例子,其中Vi∈Fi,i=1,2,…n。假設PE和NE表示為E中的兩例子集,成為正例集與反例集。PE和NE的大小分別用p和n進行表示,并假設在向量空間H上的決策樹對其中任意的例子進行分類的概率和H當中的正反例概率是保持一致的,并且通過決策樹可作出正確的判斷的信息量為:
如以其中的屬性A作為該決策樹的一個根,則A具有Vv(v=1,2,…,v)個不同的值,由此通過該信息可以得到決策樹可以將H分為v個不同的子集,由此可以得到子集Hi的信息熵E(Hi):
通過公式(2)以A作為根節(jié)點的信息增益的值:
對人力資源的數(shù)據挖掘很多,如優(yōu)秀專業(yè)技術技術模型、員工忠誠度等。以優(yōu)秀專業(yè)技術人才為例,該模型主要根據人力資源管理模型當中所建立的相關人才指數(shù)體系的內容對具體的屬性進行選取,其中的人才指數(shù)包括學歷、職稱、年齡和職位等。因此,通過決策樹算法,則構成系統(tǒng)數(shù)據挖掘模型。
通過對企業(yè)人力資源管理的調查發(fā)現(xiàn),在當前的人力資源管理中,很多企業(yè)的人力資源管理集中在人事管理和檔案管理。同時對人力資源數(shù)據庫進行的挖掘,通常為企業(yè)人力部門提供相關的決策信息。因此,結合企業(yè)的實際需求,本文將該系統(tǒng)分為人事管理、數(shù)據挖掘管理兩個子系統(tǒng)的獨立的應用程序。其中人事管理根據要求分為人事管理、資料管理、系統(tǒng)設置、查詢統(tǒng)計、員工考核與培訓等功能。其具體的功能如圖1所示。
圖1 系統(tǒng)功能設計Fig.1 System function design
人力資源管理子系統(tǒng)中,包括人事檔案、系統(tǒng)管理、查詢、培訓考核、工資等功能。人事檔案管理主要實現(xiàn)對企業(yè)員工基本信息的管理,包括姓名、年齡、職稱等綜合情況,并可對其中的信息進行修改、添加和刪除;系統(tǒng)管理功能對系統(tǒng)的相關功能參數(shù)、數(shù)據備份、日志管理和系統(tǒng)的權限進行管理;查詢管理包括查詢和統(tǒng)計兩大功能。其中查詢功能主要對系統(tǒng)相關信息進行查詢統(tǒng)計,包括個人基本信息查詢、工資查詢、考勤查詢等;培訓考核主要根據企業(yè)人力資源管理制度對員工進行培訓和相關指標的綜合考核。如指定部門培訓計劃、月度培訓計劃、培訓指標設定等;工資則主要對員工的應發(fā)工資、實發(fā)工資、公積金、保險等內容的管理。數(shù)據挖掘子系統(tǒng)包括員工忠誠度挖掘、優(yōu)秀人才挖掘、人才招聘挖掘等。
結合系統(tǒng)功能的需求,本文選擇B/S訪問模式對系統(tǒng)進行布局。其主要的原因在于傳統(tǒng)C/S結構在系統(tǒng)數(shù)據維護和更新方面比較麻煩,并且維護的成本也通常比較高。而B/S模式其典型的優(yōu)點在于應用程序和數(shù)據庫的獨立性,使得對應用程序的修改不需要再根據以往的C/S模式一樣,需要對系統(tǒng)數(shù)據庫進行更新。在客戶端的選擇方面,用戶只需要根據安裝web瀏覽器即可實現(xiàn)對系統(tǒng)的訪問和數(shù)據的挖掘,從而給用戶帶來很大的方便,提高了系統(tǒng)的實用性。對此,本系統(tǒng)其具體的架構如圖2所示。
圖2 系統(tǒng)整體架構Fig.2 Overall system architecture
應用層:用戶通過互聯(lián)網對功能的請求,將請求首先傳送給應用服務器,并通過頁面中的ASP腳本實現(xiàn)應用層和業(yè)務層的響應。
業(yè)務層:該層作為該系統(tǒng)的邏輯控制中樞,負責對客戶請求進行邏輯處理。該層分為應用服務器和應用程序。通過應用服務器對請求的分配,從而傳遞給不同的應用程序,并通過業(yè)務層中的COM組件實現(xiàn)與數(shù)據層的響應。
數(shù)據層:通過ADO.NET組件實現(xiàn)與數(shù)據庫的連接。包括connection對象、command對象等。
整體系統(tǒng)的工具采用VS2005,并以SQL server 2008作為數(shù)據庫。
結合人力資源管理系統(tǒng)的相關情況,本文對數(shù)據挖掘系統(tǒng)的整體挖掘設計則如圖3所示。
系統(tǒng)登錄的流程主要包括以下步驟:第一,打開功能界面;第二,輸入用戶名和密碼;第三步,系統(tǒng)匹配。匹配成功,進入第四步;匹配錯誤,則提示“用戶名或密碼錯誤”;第五步,進入功能界面并結束登陸流程。其功能界面如圖4所示。
該界面其具體實現(xiàn)代碼如下:
procedure TLOGIN.BitBtn1Click(Sender:TObject);
var
s,str1,str2,str3:string;
b:Int64;
i:integer;
begin
str1:=dblookupcombobox1.Text;
str2:=trim(edit2.Text);
if adoquery1.Locate('username',str1,[])=true then
begin
str3:=adoquery1.Fieldbyname('password').AsString;
圖3 DM系統(tǒng)總體結構Fig.3 DMsystem architecture diagram
圖4 登陸界面Fig.4 Login screen
if str3=trim(str2)then
begin
userid:=adoquery1.Fieldbyname('id').AsString;
username:=adoquery1.Fieldbyname('username').
AsString;
hide;
jhgy.ShowModal;
close;
end
else messagebox(0,'密碼錯誤,請重新輸入!','錯誤',mb_ok);
end
else
messagebox(0,'操作員不存在,請重新選擇!','錯誤',mb_ok);
end;
4.2.1 接口的實現(xiàn)
為實現(xiàn)數(shù)據挖掘系統(tǒng)中的決策樹算法與其他接口的連接,本系統(tǒng)對該系統(tǒng)的文件進行統(tǒng)一規(guī)定,主要包括Names文件、Data文件、Tcshow和Rcshow文件等。
4.2.2 屬性定義
該模塊主要給用戶提供自定義屬性的功能。在數(shù)據挖掘中包含很多的屬性,因此,為挖掘的需要,本文在系統(tǒng)中輸入不同的屬性,如職稱、姓名、職位等。同時針對不同屬性,提供屬性合并的方式,“大專、大本”進行合并,都統(tǒng)稱為“一般學歷”。
4.2.3 數(shù)據抽取
采用隨機抽取的方法對數(shù)據進行抽取。其步驟為:系統(tǒng)自動將帶入到隨機產生的哈希函數(shù)當中。從而得到其地址。如果大于抽取的記錄或者是發(fā)生沖突的時候,則采用開放地址IFA重新生成函數(shù),直到該過程合適位置,最后將所有的數(shù)據都存入到RecPos()當中。
4.2.4 決策樹生成
Step1:從name、data等文件中國獨處相關的數(shù)據,并將其分別存儲到rec、target等數(shù)組當中;Step2:處理連續(xù)性屬性;Step3:生成TreeRec;Step4:生成決策樹;Step5:剪枝.
4.2.5 數(shù)據挖掘結果
本文以46例優(yōu)秀技術員數(shù)據作為樣本,選擇性別、年齡、職稱、學歷、婚姻和黨派作為關聯(lián)屬性,通過挖掘可以得到職稱作為員工的一個重要的評價。高職稱大多為優(yōu)秀人才,中低職稱當中的優(yōu)秀的人才則很少。
文中以數(shù)據挖掘在人力資源管理系統(tǒng)中應用和系統(tǒng)的設計作為研究內容,構建了對企業(yè)優(yōu)秀人才、員工招聘和員工忠誠度的挖掘系統(tǒng),同時實現(xiàn)了基礎的人力資源管理功能,更好的輔助企業(yè)做好對人力資源管理的日常工作和決策,從而使得該系統(tǒng)具有很大的實用價值。
[1] 王雙苗.我國企業(yè)人力資源管理現(xiàn)狀及發(fā)展趨勢分析[J].生產力研究,2012(2):210-211,251.WANG Shuang-miao.HRMsituation and development trend analysis of China’s enterprises[J].Productivity Research,2012(2):210-211,251.
[2]李旭軍.計算機信息管理系統(tǒng)設計原理探究[J].咸寧學院學報,2012(8):139-140.LI Xu-jun.Computer information management system design principles to explore[J].Xianning College,2012(8):139-140.
[3] 謝楓平.數(shù)據分類中決策樹算法的一些改進[J].龍巖學院學報,2009(2):22-26.XIE Feng-ping.Some improvements in data classification decision tree algorithm[J].Longyan University,2009(2):22-26.
[4] 楊靜,張楠男,李建,等.決策樹算法的研究與應用[J].計算機技術與發(fā)展,2010(2):114-116,120.YANG Jing,ZHANG Nan-nan,LI Jian.Research and application of decision tree algorithm[J].Computer Technology and Development,2010(2):114-116,120.
[5] 汪海銳,李偉.基于關聯(lián)規(guī)則的決策樹算法[J].計算機工程,2011(9):104-106,109.WANG Hai-rui,LI Wei.Decision tree algorithm based on association rules[J].Computer Engineering,2011(9):104-106,109.
[6] 朱前飛,高芒.COM組件和ActiveX技術在B/S體系結構中的應用[J].計算機工程與設計,2011(9):104-106,109.ZHU Qian-fei,GAO Mang.COMcomponents and ActiveX technology in the B/S architecture application[J].Computer Engineering and Design,2011(9):104-106,109.
[7] 劉澤洪,于洪鵬.基于多Agent的分布式數(shù)據庫管理系統(tǒng)[J].電子科技,2011,24(4):50-53.LIU Ze-hong,YU Hong-peng.Multi-Agent based distributed database management system[J].Electronic Science and Technology,2011,24(4):50-53.
[8] 吳楠,高佳.基于ArcEngine的信息管理系統(tǒng)關鍵技術研究[J].現(xiàn)代電子技術,2013(12):74-77.WU Nan,GAO Jia.Key technology research information management system based ArcEngine[J].Modern Electronics Technique,2013(12):74-77.