高境辰,丁樂,王琦
(南京工程學(xué)院 計(jì)算機(jī)工程學(xué)院,江蘇 南京 211167)
當(dāng)今社會(huì)經(jīng)濟(jì)發(fā)展迅速,就業(yè)難的情況已經(jīng)較為嚴(yán)重。一方面求職者不清楚自己的需求,盲目跟風(fēng)進(jìn)行求職,導(dǎo)致一些職位供不應(yīng)求,但是有些職位又出現(xiàn)了人才短缺的情況;另外一方面是有些職位對求職者的水平要求較高,一部分求職者不能滿足職位的要求,浪費(fèi)了寶貴的求職時(shí)間[1]。對于已經(jīng)就業(yè)的求職者,又表現(xiàn)出就業(yè)滿意度低等情況[2],這是崗位匹配度較低的表現(xiàn)。此種背景下,需要一個(gè)就業(yè)推薦系統(tǒng)來提高就業(yè)的成功率及滿意度。
在推薦系統(tǒng)領(lǐng)域,傳統(tǒng)的個(gè)性化推薦方案主要以協(xié)同過濾,基于內(nèi)容的推薦,混合型推薦為主,推薦系統(tǒng)主要從用戶的信息,推薦內(nèi)容的信息中提取有用的部分進(jìn)行推薦。這些算法主要把推薦轉(zhuǎn)化成預(yù)測用戶評分的問題,對預(yù)測分?jǐn)?shù)較高的內(nèi)容進(jìn)行排序并進(jìn)行推薦。傳統(tǒng)的推薦算法往往只考慮單方面的需求,導(dǎo)致評分預(yù)測較為主觀?;セ萃扑]算法同時(shí)考慮雙方偏好,對用戶的評分預(yù)測相比傳統(tǒng)的推薦算法較為客觀。本文主要對求職者和企業(yè)建立互惠推薦模型,把求職者對職位的滿意度分成主觀滿意度和客觀滿意度兩種,使用隨機(jī)森林模型進(jìn)行回歸預(yù)測,在一定程度上提高了評分預(yù)測的精度。
隨機(jī)森林模型是由Breiman和Adele研究的一種集成學(xué)習(xí)的算法[3],隨機(jī)森林利用決策樹作為基礎(chǔ)的學(xué)習(xí)器,并在眾多決策樹的基礎(chǔ)上使用隨機(jī)的屬性選擇,通過多個(gè)決策樹進(jìn)行投票的方式進(jìn)行最后的決策。隨機(jī)森林每一次構(gòu)建樹的過程具有隨機(jī)性,所以各棵CART決策樹的結(jié)構(gòu)也是隨機(jī)的。隨機(jī)森林算法的概念較為簡單,在算法實(shí)現(xiàn)上比較容易,模型的泛化能力較強(qiáng),對噪聲和異常數(shù)據(jù)的容忍度較強(qiáng),回歸的精度較高,且支持增量學(xué)習(xí),但是起始性能較差[4]。
互惠推薦算法是一種同時(shí)考慮用戶的偏好和物品偏好的一種推薦算法,互惠推薦依賴于雙邊興趣的表達(dá),適用于推薦次數(shù)較少,并且推薦準(zhǔn)確率較高的場景。
互惠推薦系統(tǒng)當(dāng)且僅當(dāng)推薦的雙方的滿意度都比較高時(shí),系統(tǒng)認(rèn)為推薦的雙方是匹配的。而傳統(tǒng)的推薦系統(tǒng)的滿意度僅取決于用戶的滿意度[5-6]。
表1 傳統(tǒng)推薦算法與互惠推薦算法的對比
在招聘領(lǐng)域中,傳統(tǒng)的推薦算法沒有綜合考慮求職者和職位之間的關(guān)系,在招聘領(lǐng)域,求職者對算法的使用次數(shù)少,如果僅考慮單方面因素進(jìn)行推薦,容易導(dǎo)致能力較低的求職者匹配到要求較高的企業(yè),為了提高求職者投遞簡歷的成功率,同時(shí)減少求職者投遞簡歷失敗次數(shù),我們應(yīng)該同時(shí)考慮求職者和企業(yè)雙方的意愿。對于求職者,求職者希望能夠找到待遇較好的公司,同時(shí)也受城市等地理位置因素影響,我們應(yīng)該給求職者推薦符合其能力,也迎合求職者的自身意愿的職位。對于企業(yè),企業(yè)想招收的是有一定經(jīng)驗(yàn)的,高學(xué)歷,高素質(zhì)的人才,我們應(yīng)該推薦的求職者應(yīng)該是符合企業(yè)的需求的,有價(jià)值的人才。
由于總滿意度受求職者和企業(yè)雙方的制約,同時(shí)考慮雙方的滿意度,定義求職者滿意度為S1,企業(yè)滿意度為S2,總滿意度為S。
定義總滿意度S,用戶滿意度模型的權(quán)重為w1,企業(yè)滿意度的權(quán)重為w2,S的表達(dá)式為:
根據(jù)熊凱[7],白爭輝[8]和涂曉明[9]對求職者滿意度影響因素的研究,我們可以將求職者自身的一些特征進(jìn)行提取。我們將求職者的滿意度分為求職者的主觀滿意度和客觀滿意度。主觀滿意度和求職者自身的屬性相關(guān),主要表現(xiàn)為求職者容易得到滿足,客觀滿意度和職位的屬性相關(guān),影響求職者入職后的滿意度。
表2 求職者主觀滿意度變量的選取與說明
表3 求職者客觀滿意度變量的選取與說明
根據(jù)劉興林[10]的研究,企業(yè)的滿意度主要表現(xiàn)為以下幾個(gè)方面:薪資水平,單位類型,政治面貌,學(xué)歷。其中,企業(yè)發(fā)布崗位的薪資越高,企業(yè)對求職者能力的期望越高,對求職者滿意度的標(biāo)準(zhǔn)變高。一些特殊企業(yè),如政府機(jī)關(guān),事業(yè)單位,對員工的政治面貌有一定的要求,期望求職者的政治面貌為黨員。企業(yè)會(huì)優(yōu)先錄取擁有較高學(xué)歷的求職者,學(xué)歷越高企業(yè)的滿意度越高。
表4 企業(yè)滿意度變量的選取與說明
評價(jià)一個(gè)推薦系統(tǒng)的好壞的方法可以使用預(yù)測準(zhǔn)確度來衡量。
RMSE的定義為:
MAE的定義為:
本文使用通過問卷調(diào)查獲得的自定義數(shù)據(jù)集,本文算法的RMSE的比較如圖1所示,隨著用戶數(shù)量的增長,兩種模型的RMSE都在趨于下降,并在最后有穩(wěn)定的趨勢,互惠推薦算法的RMSE較低,相比傳統(tǒng)的基于內(nèi)容的算法有一定程度上的優(yōu)勢。本文互惠推薦算法的MAE的比較如圖2所示,MAE同樣有下降的趨勢,用戶數(shù)量的增加,數(shù)據(jù)稀疏的問題得到了解決,MAE趨于穩(wěn)定。綜合兩種評估方法,互惠推薦系統(tǒng)在測試數(shù)據(jù)集上的預(yù)測準(zhǔn)確度相較普通的基于內(nèi)容的算法是較好的。
圖1 互惠推薦和基于內(nèi)容的推薦RMSE對比
圖2 互惠推薦和基于內(nèi)容的推薦MAE對比
本文實(shí)現(xiàn)了一種基于隨機(jī)森林模型的互惠就業(yè)推薦算法,通過將用戶和職位的信息進(jìn)行建模,對求職者信息和招聘崗位信息分別選取特征,并對模型進(jìn)行了訓(xùn)練,實(shí)驗(yàn)表明本文所述的模型在測試集上有比較好的表現(xiàn)。