楊運強 吳進
摘要:當前很多高校在學生就業(yè)工作中采用的方式通常有兩種,一種是企業(yè)到校進行宣講,另一種是企業(yè)集中到校開招聘會,這樣會帶來兩個問題,一是所有的企業(yè)宣講或者招聘學生都要參與,浪費了學生和企業(yè)的寶貴時間,二是隨著學校就業(yè)工作的開展,對接的企業(yè)資源庫越來越多,這種招聘形式無法滿足所有企業(yè)的到校招聘需求,通過Mahout機器學習算法,基于學生的專業(yè)技能特點,在企業(yè)資源庫中推薦與學生技能特征相匹配的就業(yè)信息,能夠很好的解決畢業(yè)生和企業(yè)崗位的對接。
關鍵詞:Mahout機器學習 專業(yè)技能特點 企業(yè)資源庫
中圖分類號:A 文獻標識碼:A 文章編號:(2022)-13-
一、智能推薦崗位的技術框架
隨著大數(shù)據(jù)思想實施的落地,推薦系統(tǒng)也開始倍受關注。不光是電商,各種互聯(lián)網(wǎng)應用都開始應用推薦系統(tǒng),像搜索,社交網(wǎng)絡,音樂,餐飲,地圖服務等等。在以前,沒有使用推薦算法的時候,是通過設置各種約束條件,匹配數(shù)據(jù)的自然屬性呈現(xiàn)給用戶,這種就是基于規(guī)則的系統(tǒng),然爾推薦算法從另一角度入手,解決了基于規(guī)則設置的問題。
論文介紹一種基于Mahout的就業(yè)崗位智能推薦系統(tǒng),首先需要將學生的平時測試成績、期中期末考試成績、技能大賽成績、綜合題目測試成績收集到Hadoop大數(shù)據(jù)系統(tǒng)中,使用算法分析出每個學生的專業(yè)技能特點,然后輸入推薦規(guī)則到Hadoop大數(shù)據(jù)系統(tǒng),使用Mahout機器學習算法為每個同學推薦三個就業(yè)企業(yè)崗位信息,最后使用網(wǎng)站平臺顯示給用戶。
二、核心算法
1.回歸分析
通過Stepwise Regression逐步式回歸算法,對學生專業(yè)測試數(shù)據(jù)進行回歸分析,揭示出專業(yè)技能數(shù)據(jù)之間關系,從數(shù)據(jù)量上研究專業(yè)技能的提升關系。
2.聚類分析
通過k-means聚類算法對每個學生、每個專項技能數(shù)據(jù)進行聚類計算和分析。
3.關聯(lián)分析
通過 Apriori算法,對專業(yè)技能和推薦規(guī)則之間進行關聯(lián)分析,從集中和離中趨勢兩個方面進行分析,揭示出兩者關系。
4.相關性分析
通過 Eclat算法,根據(jù)知識相關程度和學生在對于每個知識模塊的掌握情況。
5.貢獻度分析
使用帕累托算法,根據(jù)專業(yè)知識重要性和學生學習掌握情況,進行學生專業(yè)技能畫像。
三、推薦核心代碼
FastByIDMap userData = new FastByIDMap();
for (Map
{ int id = Integer.parseInt((String) jobmes.get(“id”));
String sk = (String) jobmes.get(“sk”);
String[] skills_ = skill.split(","); // 技能轉換id
int[] skillids = getSkillIDs(totalSkills, sk_); // 技能對應權重
double[] weightsparam = new double[skillids.length];
String weight_ = (String) jobmes.get(“weight”);
String[] weights_ = weight_.split(","); // mongodb 崗位庫的崗位技能
GenericPreference[]genericPreferences=new GenericPreference[skillids.length];
for (int i = 0; i < skillids.length; i++)
{ ?genericPreferences[i] = new GenericPreference(id, skillids[i], Float.parseFloat(weights_[i]));
}
主要參考文獻
[1] 趙瑩.大數(shù)據(jù)分析在工程力學課程教學中的應用[J].現(xiàn)代職業(yè)教育;2021年07期:22-23.
[2] 李陽陽.云計算技術與應用專業(yè)的探索與實踐[J].天津職業(yè)院校聯(lián)合學報;2020年03期:68-69.
[3] 劉亞鵬.大數(shù)據(jù)技術在高職院校的應用發(fā)展探究[J].網(wǎng)絡安全技術與應用;2020年10期:125-127.課題來源:本論文為中國(北方)現(xiàn)代林業(yè)職業(yè)教育集團2021年度林業(yè)職業(yè)教育教學改革課題研究成果 課題編號LZJB2021JY012
課題來源:本論文為2020-2021年度遼寧省職業(yè)技術教育學會科研規(guī)劃項目課題研究成果 課題編號:LZY20508
作者簡介:
楊運強 ?1979年出生 ? 遼寧生態(tài)工程職業(yè)學院 ?計算機專業(yè)副教授
吳進 ? ?1980年出生 ? 遼寧生態(tài)工程職業(yè)學院 ?計算機專業(yè)副教授