劉西祥
(永州職業(yè)技術(shù)學(xué)院 湖南省永州市 425100)
目前,全國(guó)共有高等職業(yè)院校1344 所,在校學(xué)生人數(shù)和畢業(yè)學(xué)生人數(shù)逐年大幅增長(zhǎng),國(guó)家就業(yè)形勢(shì)異常嚴(yán)峻,高職學(xué)生的就業(yè)壓力越來(lái)越大。
筆者發(fā)現(xiàn),目前很多高職院校畢業(yè)生就業(yè)工作模式還比較簡(jiǎn)單,大部分還是以傳統(tǒng)的現(xiàn)場(chǎng)招聘會(huì)形式為主,輔以微信公眾號(hào)等互聯(lián)網(wǎng)形式開展就業(yè)推薦工作,阻礙了畢業(yè)生就業(yè)工作的發(fā)展。本文通過(guò)對(duì)永州職業(yè)技術(shù)學(xué)院畢業(yè)生就業(yè)市場(chǎng)的調(diào)查分析,設(shè)計(jì)并開發(fā)了“高職院校畢業(yè)生就業(yè)推薦系統(tǒng)”,每一名應(yīng)屆畢業(yè)生可以使用電腦或手機(jī)登錄該系統(tǒng)并完善自己的個(gè)人信息,系統(tǒng)通過(guò)推薦算法對(duì)應(yīng)屆畢業(yè)生學(xué)生數(shù)據(jù)庫(kù)、往屆畢業(yè)生學(xué)生數(shù)據(jù)庫(kù)和用人單位數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)分析,從而為每一名應(yīng)屆畢業(yè)生提供一份比較可靠的就業(yè)推薦信息,節(jié)省了就業(yè)花費(fèi)的時(shí)間和精力。
高職院校畢業(yè)生就業(yè)推薦系統(tǒng)不同于一般的畢業(yè)生管理系統(tǒng),它不僅提供了常規(guī)的就業(yè)管理功能,更重要的是實(shí)現(xiàn)了在線就業(yè)推薦功能。
本系統(tǒng)從實(shí)際需求出發(fā),功能上不僅實(shí)現(xiàn)了就業(yè)推薦功能,還能作為就業(yè)管理系統(tǒng)實(shí)現(xiàn)就業(yè)管理各方面的功能,主要包括用戶登錄模塊、管理員模塊、畢業(yè)生模塊和用人單位模塊。其整體框架如圖1所示。
1.2.1 系統(tǒng)登錄模塊
本系統(tǒng)采用同一界面進(jìn)行登錄,根據(jù)不同的用戶類型跳轉(zhuǎn)至不同的用戶主頁(yè)。用戶登錄時(shí)必須先選擇用戶類型,輸入正確的用戶名和登錄密碼并加入驗(yàn)證碼才能登錄成功。登錄時(shí)輸入驗(yàn)證碼是為了增加系統(tǒng)登錄安全性,防止自動(dòng)批量注冊(cè)、登錄。
1.2.2 管理員模塊
管理員模塊的管理人員分為系統(tǒng)管理員和就業(yè)工作管理員。系統(tǒng)管理員主要負(fù)責(zé)系統(tǒng)維護(hù)、數(shù)據(jù)備份和就業(yè)工作管理員權(quán)限的分配和管理。就業(yè)工作管理員主要是指學(xué)校就業(yè)部門的工作人員以及各學(xué)院負(fù)責(zé)就業(yè)工作的相關(guān)人員,主要負(fù)責(zé)最新就業(yè)政策等新聞信息的發(fā)布以及對(duì)招聘信息、就業(yè)新聞、畢業(yè)生信息、求職信息、企業(yè)用戶信息、在線咨詢、查詢統(tǒng)計(jì)、就業(yè)管理、檔案管理等的統(tǒng)一管理,提高就業(yè)工作的效率,保證就業(yè)工作的順利開展。
1.2.3 畢業(yè)生模塊
畢業(yè)生模塊主要功能包括個(gè)人信息管理、就業(yè)推薦、在線查詢、在線咨詢等功能,學(xué)生通過(guò)個(gè)人信息管理可以查詢自己個(gè)人的基本信息,包括學(xué)習(xí)成績(jī)、專業(yè)考證、職業(yè)素養(yǎng)、是否學(xué)生干部、獲獎(jiǎng)情況、綜合評(píng)定、個(gè)人簡(jiǎn)歷等,學(xué)生可以通過(guò)在線咨詢向?qū)W校就業(yè)指導(dǎo)老師或企業(yè)了解就業(yè)相關(guān)信息和求職經(jīng)驗(yàn)等。
1.2.4 用人單位模塊
圖1:高職院校畢業(yè)生就業(yè)推薦系統(tǒng)整體框架圖
本模塊主要有用人單位信息管理和畢業(yè)生搜索兩大模塊。用人單位信息管理主要包括企業(yè)基本信息管理、招聘信息發(fā)布、修改、更新等功能。畢業(yè)生搜索主要實(shí)現(xiàn)企業(yè)查詢符合本單位招聘崗位需要的應(yīng)屆畢業(yè)生等功能,為招聘工作的開展提供一些參考和依據(jù)。
推薦算法是整個(gè)推薦系統(tǒng)中最核心、最關(guān)鍵的部分。由于高職院校不同于普通高校,學(xué)生素質(zhì)和就業(yè)能力主要體現(xiàn)在專業(yè)技能、職業(yè)素養(yǎng)和適應(yīng)環(huán)境等方面,畢業(yè)生就業(yè)專業(yè)比較對(duì)口,應(yīng)屆畢業(yè)生就業(yè)單位參照往屆畢業(yè)生簽約單位較多,而可選擇的企業(yè)或公司職位也具有一定的代表性?;谶@種情況,本系統(tǒng)關(guān)鍵推薦算法使用改進(jìn)的基于內(nèi)容和歷史信息的組合推薦算法,保證了推薦的成功率。
高職院校畢業(yè)生就業(yè)推薦系統(tǒng)主要功能是根據(jù)高職院校畢業(yè)學(xué)生就業(yè)的特定性和特殊性設(shè)計(jì)并使用一些改進(jìn)推薦算法,其主要流程如下:
(1)根據(jù)收集的資料和應(yīng)屆畢業(yè)學(xué)生、用人單位登錄系統(tǒng)完善相關(guān)信息兩條途徑構(gòu)建學(xué)生數(shù)據(jù)庫(kù)和企業(yè)數(shù)據(jù)庫(kù),其中學(xué)生數(shù)據(jù)庫(kù)又分為應(yīng)屆畢業(yè)學(xué)生數(shù)據(jù)庫(kù)和往屆畢業(yè)學(xué)生數(shù)據(jù)庫(kù)兩個(gè)數(shù)據(jù)庫(kù);
(2)根據(jù)應(yīng)屆和往屆畢業(yè)學(xué)生數(shù)據(jù)庫(kù)中的數(shù)據(jù)獲得應(yīng)屆畢業(yè)學(xué)生和往屆畢業(yè)學(xué)生之間的相似度;
(3)根據(jù)企業(yè)數(shù)據(jù)庫(kù)中的數(shù)據(jù)計(jì)算企業(yè)之間的相似度,得到往屆畢業(yè)學(xué)生對(duì)應(yīng)的簽約企業(yè)與其他企業(yè)間的相似度;
(4)將(2)、(3)的結(jié)果相結(jié)合,根據(jù)應(yīng)屆畢業(yè)學(xué)生與往屆畢業(yè)學(xué)生對(duì)相關(guān)企業(yè)間的關(guān)注程度,進(jìn)行相關(guān)企業(yè)的推薦;
(5)在(4)已經(jīng)得出的與該學(xué)生相似度最高的往屆畢業(yè)學(xué)生對(duì)應(yīng)的排名靠前的相關(guān)企業(yè)中,把推薦結(jié)果按降序排列,取排名靠前的Top-N 個(gè)企業(yè)按先后順序推薦給該應(yīng)屆畢業(yè)生,即完成就業(yè)推薦功能。
本模塊的主要設(shè)計(jì)思路是針對(duì)“學(xué)生數(shù)據(jù)庫(kù)”(包括應(yīng)屆和往屆)中的任意兩名應(yīng)、往屆學(xué)生,通過(guò)最合適的推薦算法計(jì)算出他們之間的相似度。高職院校不同于普通高校,學(xué)生組成更有針對(duì)性,學(xué)生素質(zhì)和就業(yè)能力主要體現(xiàn)在專業(yè)技能、職業(yè)素養(yǎng)和適應(yīng)環(huán)境等方面,影響他們之間的相似度主要有學(xué)生的專業(yè)名稱、學(xué)習(xí)成績(jī)、專業(yè)考證、職業(yè)素養(yǎng)、是否學(xué)生干部、綜合評(píng)定和畢業(yè)時(shí)間等指標(biāo),這些指標(biāo)都是文字內(nèi)容或具體數(shù)值的形式,而目前對(duì)文本內(nèi)容或具體數(shù)值進(jìn)行特征提取的方法比較成熟,所以可以采用最簡(jiǎn)單有效的方法來(lái)計(jì)算應(yīng)、往屆畢業(yè)學(xué)生間的相似度。當(dāng)然,學(xué)生特征的提取也有主次之分,對(duì)于一些直接影響就業(yè)企業(yè)和崗位的重要學(xué)生信息要重點(diǎn)考慮,加大權(quán)值,如專業(yè)名稱、專業(yè)考證、職業(yè)素養(yǎng)、綜合評(píng)定等指標(biāo)。根據(jù)實(shí)際情況,本系統(tǒng)選擇改進(jìn)的基于內(nèi)容的推薦算法,對(duì)應(yīng)、往屆畢業(yè)學(xué)生之間相似度的計(jì)算方法如公式(1)所示。
在公式(1)中,Simstu(x,y)表示應(yīng)屆畢業(yè)學(xué)生x 與往屆畢業(yè)學(xué)生y 之間的相似度,fk(x1,y1)可認(rèn)為是應(yīng)屆畢業(yè)學(xué)生x 與往屆畢業(yè)學(xué)生y 之間第k 個(gè)特征(文本內(nèi)容)屬性的匹配度,如果兩人的這一屬性值相同,我們認(rèn)為他們的這一屬性完全相似,則fk(x1,y1)=1,反之則完全不相似,則fk(x1,y1)=0;則認(rèn)為是應(yīng)屆畢業(yè)學(xué)生x 與往屆畢業(yè)學(xué)生y 之間第i 個(gè)特征(具體數(shù)值)屬性的匹配度,如果兩人的這一屬性值為1,我們認(rèn)為這一屬性完全相似,如果兩人的這一屬性值為0,我們認(rèn)為這一屬性完全不相似。由于各特征屬性有主次之分,其影響二者之間相似度重要性不盡相同,公式中θk和θi表示第k 和i 個(gè)特征屬性在相似度計(jì)算過(guò)程中所占的權(quán)重,實(shí)際取值時(shí)務(wù)必滿足θk+θi=1。表示畢業(yè)時(shí)間影響應(yīng)、往屆畢業(yè)生相似度的權(quán)值,Yx代表應(yīng)屆畢業(yè)學(xué)生的畢業(yè)年份,Yy代表往屆畢業(yè)學(xué)生的畢業(yè)年份,t 代表數(shù)據(jù)庫(kù)中所有畢業(yè)生的屆數(shù),φ 表示畢業(yè)時(shí)間的影響因子。
由于我們推薦給應(yīng)屆畢業(yè)學(xué)生的企業(yè)不能局限是一家企業(yè),所以我們必須找出各企業(yè)間的關(guān)系,即計(jì)算出企業(yè)間的相似度。
通過(guò)調(diào)查發(fā)現(xiàn),高職院校的畢業(yè)生就業(yè)專業(yè)對(duì)口且就業(yè)單位和崗位相對(duì)穩(wěn)定,我們可以充分利用往年的就業(yè)信息來(lái)計(jì)算歷年招聘企業(yè)間的相似度,除考慮企業(yè)固有的屬性特征外,還同時(shí)重點(diǎn)考慮企業(yè)歷年招聘學(xué)生的相關(guān)信息,故推薦算法選擇基于歷史信息的協(xié)同過(guò)濾推薦算法。
影響企業(yè)間相似度計(jì)算的因素主要有兩種。一種是可以進(jìn)行量化和比較的特征屬性,如性別、專業(yè)課成績(jī)、是否學(xué)生干部、綜合評(píng)定等,這些特征屬性的不同取值都代表一種不同的情況,所以與這些特征屬性相關(guān)的企業(yè)相似度可以通過(guò)簡(jiǎn)單的歐幾里德距離公式計(jì)算來(lái)實(shí)現(xiàn)。另一種是不可進(jìn)行量化和比較的特征屬性,如招聘專業(yè),兩個(gè)招聘專業(yè)之間的相似性是無(wú)法直接進(jìn)行比較的。所以,為了更加科學(xué)、合理計(jì)算企業(yè)間的相似度,我們把企業(yè)間的相似度分成兩部分來(lái)進(jìn)行計(jì)算,一部分由可以進(jìn)行量化和比較的特征屬性來(lái)決定的,另一部分則是由不可以進(jìn)行量化和比較的特征屬性決定的。得到如下公式(2):
在以上公式(2)中,必須滿足Px+Py=1,其中,sim(c1,c2)表示企業(yè)C1、C2 之間的相似度,而simx(c1,c2)表示由可以進(jìn)行量化和比較的那部分特征屬性決定的企業(yè)C1、C2 之間的相似度分量,simy(c1,c2)表示由不可以進(jìn)行量化和比較的那部分特征屬性來(lái)決定的企業(yè)C1、C2 之間的相似度分量,Px和Py分別表示這兩部分相似度在總的相似度中所占的權(quán)重,而權(quán)重值是否合理分配將嚴(yán)重影響相似度結(jié)果的準(zhǔn)確性。
由于權(quán)重值將直接影響相似度計(jì)算結(jié)果的準(zhǔn)確性,所以我們?cè)诖_定權(quán)值的時(shí)候一定要結(jié)合實(shí)際,多調(diào)查,多收集相關(guān)單位的建議和意見。以永州職業(yè)技術(shù)學(xué)院為例,我們通過(guò)分析認(rèn)為我們學(xué)校的畢業(yè)生就業(yè)專業(yè)比較對(duì)口,近兩年都在80%以上,而且就業(yè)專業(yè)對(duì)口率還在上升。這就表明專業(yè)因素這個(gè)分量對(duì)計(jì)算企業(yè)相似度的影響很大,而學(xué)生性別、專業(yè)成績(jī)、是否考證、是否學(xué)生干部等因素對(duì)計(jì)算企業(yè)相似度的影響相對(duì)較小,所以這里我們權(quán)重和分別取值為0.2 和0.8。也就是說(shuō),在本系統(tǒng)計(jì)算招聘企業(yè)間相似度過(guò)程中,可進(jìn)行量化和比較的特征屬性對(duì)其影響較小,而不可進(jìn)行量化和比較的特征屬性,即專業(yè)因素對(duì)最終的推薦結(jié)果影響程度較大。
本系統(tǒng)采用永州職業(yè)技術(shù)學(xué)院近三年的畢業(yè)生數(shù)據(jù)和用人單位數(shù)據(jù)進(jìn)行測(cè)試,共計(jì)一萬(wàn)多名學(xué)生,涉及各行各業(yè)的近五百家企業(yè)單位。測(cè)試過(guò)程中,選擇推薦準(zhǔn)確率和RMSE(均方根誤差)作為評(píng)價(jià)系統(tǒng)的指標(biāo),其計(jì)算方法如公式(3)和公式(4)所示。
公式(3)中R(u) 表示學(xué)生在訓(xùn)練集上的行為給學(xué)生做出的推薦列表,T(u)為學(xué)生在測(cè)試集上的行為列表。
公式(4)中用rsc表示學(xué)生S 對(duì)企業(yè)C 的真實(shí)評(píng)分,r'sc表示學(xué)生S 對(duì)企業(yè)C 的預(yù)測(cè)評(píng)分。
通過(guò)測(cè)試結(jié)果分析,該系統(tǒng)為應(yīng)屆畢業(yè)生推薦的就業(yè)單位符合該生的實(shí)際潛在就業(yè)意向單位,縮小了學(xué)生了解招聘企業(yè)單位的范圍,節(jié)省了就業(yè)的時(shí)間和經(jīng)濟(jì)成本,具有一定的實(shí)際應(yīng)用價(jià)值。
本文選擇改進(jìn)的基于內(nèi)容的推薦算法和基于歷史信息的協(xié)同過(guò)濾推薦算法來(lái)計(jì)算學(xué)生之間的相似度和企業(yè)之間的相似度,設(shè)計(jì)的公式中分別包括文本屬性特征和數(shù)值屬性特征的計(jì)算,考慮了學(xué)生畢業(yè)時(shí)間對(duì)相似度的影響,不同畢業(yè)時(shí)間設(shè)置不同的權(quán)值,同時(shí)重點(diǎn)考慮了就業(yè)歷史信息對(duì)就業(yè)推薦算法的影響,保證了計(jì)算的準(zhǔn)確性和結(jié)果的可靠性。當(dāng)然,由于目前該就業(yè)推薦系統(tǒng)還不夠成熟和完善,研究的算法還有待優(yōu)化,測(cè)試的數(shù)據(jù)還不夠全面,通用性還無(wú)法確定,系統(tǒng)的操作界面也還缺乏美觀,需要再花大量的時(shí)間對(duì)它進(jìn)行修改、調(diào)試和改進(jìn),希望能夠通過(guò)自己的不懈努力,盡快完善系統(tǒng)的功能和算法,早日讓該推薦系統(tǒng)得到應(yīng)用和推廣,為高職院校的畢業(yè)生就業(yè)工作貢獻(xiàn)力量。