郭潔暢 杜鵬 杭州電子科技大學(xué)數(shù)字媒體與藝術(shù)設(shè)計(jì)學(xué)院
大學(xué)生兼職電商平臺(tái)工作推薦系統(tǒng)的實(shí)現(xiàn)
郭潔暢 杜鵬 杭州電子科技大學(xué)數(shù)字媒體與藝術(shù)設(shè)計(jì)學(xué)院
本文所介紹的是一款作為招聘網(wǎng)站的一個(gè)重要組成部分,根據(jù)用戶信息提取標(biāo)簽并智能匹配推送適合工作的功能網(wǎng)站。該網(wǎng)站主要通過對(duì)用戶基本信息、發(fā)布的簡(jiǎn)歷或是工作信息、收藏瀏覽信息監(jiān)督等方面提取個(gè)人標(biāo)簽,智能地為應(yīng)聘者與招聘企業(yè)實(shí)時(shí)智能地推送合適的信息,把握最新消息,快速找到合適的工作與人才。
招聘平臺(tái) 標(biāo)簽提取 智能推送
現(xiàn)代大學(xué)生缺乏對(duì)職業(yè)生涯規(guī)劃的認(rèn)知,導(dǎo)致他們普遍缺乏職業(yè)生涯規(guī)劃意識(shí)。不明白自身優(yōu)勢(shì)與特征,也缺乏對(duì)具體職業(yè)的利弊判斷,導(dǎo)致找工作困難,同時(shí)企業(yè)也難以招聘到合適的人才充實(shí)空閑的崗位。企業(yè)與個(gè)人之間缺少一道相互介紹的橋梁,用以智能提取雙方特征并且實(shí)時(shí)交換信息,而這是當(dāng)前許多招聘網(wǎng)站沒有做到的。
招聘網(wǎng)站的出現(xiàn)為企業(yè)與個(gè)人提供了一個(gè)信息交流平臺(tái),但是個(gè)人或單個(gè)組織在平臺(tái)海量信息的淹沒下,可以說很難快速有效地找到自己需要的信息。并且出于對(duì)自身認(rèn)知的缺陷角度,即使找到一些自認(rèn)為合適的信息,也有很大可能并不是真的符合個(gè)人特征。
在此研究背景下開發(fā)擁有識(shí)別標(biāo)簽的智能工作推薦系統(tǒng),本文開發(fā)一款適用于各類招聘網(wǎng)站的工作、人才推送系統(tǒng),集信息采集、標(biāo)簽提取、匹配計(jì)算、實(shí)時(shí)推送更新功能于一體,是一個(gè)招聘網(wǎng)站的重要組成部分。
本系統(tǒng)作為網(wǎng)絡(luò)求職平臺(tái)的一部分,合理繼承了網(wǎng)絡(luò)求職平臺(tái)“簡(jiǎn)單”、“快速”、“高效”、“貼心”的設(shè)計(jì)服務(wù)思想,追求簡(jiǎn)單清爽的頁面布局與設(shè)計(jì)思路,砍掉了許多不必要的功能,使得服務(wù)對(duì)象明顯,頁面操作簡(jiǎn)單。
本系統(tǒng)將招聘者與應(yīng)聘者功能模塊幾乎完全分開,方便用戶使用,分別略去了大量單獨(dú)用戶難以使用到的功能,如招聘者的簡(jiǎn)歷設(shè)計(jì)功能、工作檢索功能等。
本系統(tǒng)主要特色在于“智能”、“個(gè)性”二詞,為了達(dá)到這兩點(diǎn)的要求,本系統(tǒng)作出了如下設(shè)計(jì):首先,所有的標(biāo)簽均來自用戶自身的設(shè)定、選擇和行為抽取,完全是針對(duì)每一個(gè)用戶獨(dú)立打造推送通道,絕不會(huì)有除此之外的別的因素影響匹配結(jié)果。真正地為用戶考慮,突出用戶個(gè)性;其次,用戶在本系統(tǒng)中僅僅需要完成與一般網(wǎng)絡(luò)招聘平臺(tái)一樣的用戶資料填寫與簡(jiǎn)歷完善操作,不需要任何額外的特殊操作,系統(tǒng)將會(huì)從用戶的日常操作中智能提取標(biāo)簽詞,真正做到便捷、高效、貼近用戶,減少用戶負(fù)擔(dān),智能打造招聘、求職服務(wù)通道。
眾所周知的是,歐美文字是字母語言的代表,其文字特征明顯,可以較為簡(jiǎn)單的通過空格來區(qū)分開詞語。但是,作為世界最復(fù)雜的語言的中文,我們并不能簡(jiǎn)單地通過空格來區(qū)分開中文詞組,更為復(fù)雜的是,中文存在大量的同義詞、歧義詞,如何區(qū)分短語和實(shí)現(xiàn)分詞一直都是中文分詞的難點(diǎn)。目前世界上比較流行的是兩種匹配分詞算法:至上而下的掃描學(xué)習(xí)算法與基于大數(shù)據(jù)庫的分詞算法。本系統(tǒng)作為一個(gè)標(biāo)簽匹配的應(yīng)用系統(tǒng),并不打算開發(fā)出新的分詞算法,因此,本系統(tǒng)采用的是目前較為容易實(shí)現(xiàn)的基于大數(shù)據(jù)庫的分詞算法。
基于大數(shù)據(jù)庫的中文標(biāo)簽分詞算法,首要的就是需要有一個(gè)含有大量標(biāo)簽詞的數(shù)據(jù)庫,并且將標(biāo)簽集分為:性格、專業(yè)、能力、城市、工作、其他等數(shù)個(gè)類別。本系統(tǒng)將會(huì)在不同的特定的區(qū)域掃描不同的標(biāo)簽,除非使用戶自我添加的標(biāo)簽詞,否則用戶的標(biāo)簽詞只會(huì)由系統(tǒng)指定的數(shù)據(jù)庫中產(chǎn)生。并且,每一個(gè)區(qū)域所能產(chǎn)生的標(biāo)簽種類也是固定的。所有的標(biāo)簽數(shù)據(jù)均來自于大數(shù)據(jù)收集網(wǎng)站所提供的各大招聘網(wǎng)站的爬取數(shù)據(jù),保證了可用性與覆蓋性。
無論我們的標(biāo)簽庫初始設(shè)置時(shí)時(shí)有多么龐大、詳細(xì),總會(huì)有許多關(guān)鍵詞我們是無法掃描出來的,因此,本系統(tǒng)就需要一個(gè)能夠自主學(xué)習(xí)填充標(biāo)簽庫的算法。與其說這是一個(gè)算法,不如說是一種思想。首先,我們需要確定哪些部分的新的關(guān)鍵詞會(huì)是我們需要的;其次,這些地方所產(chǎn)生的關(guān)鍵詞所形成的標(biāo)簽應(yīng)該歸屬到哪一個(gè)區(qū)域中去;最后,考慮到新增標(biāo)簽詞的關(guān)系,我們需要篩除一部分冗余的標(biāo)簽詞。
本文介紹了一款作為招聘網(wǎng)站的一個(gè)重要組成部分,根據(jù)用戶信息提取標(biāo)簽并智能匹配推送適合工作的功能網(wǎng)站。在系統(tǒng)附加功能上難免會(huì)有一些不完善的地方。比如在簡(jiǎn)歷與工作發(fā)布上,存在填寫內(nèi)容較為簡(jiǎn)單的現(xiàn)象,需要對(duì)填寫內(nèi)容做進(jìn)一步的優(yōu)化。此外,本系統(tǒng)的標(biāo)簽數(shù)據(jù)庫數(shù)據(jù)還遠(yuǎn)遠(yuǎn)不夠支撐一款正式推送系統(tǒng)運(yùn)行,因此,優(yōu)化填寫內(nèi)容和充實(shí)標(biāo)簽數(shù)據(jù)庫將是下一步工作重點(diǎn)。
[1]何仕.大學(xué)生求職心理障礙及其對(duì)策研究[J],沈陽農(nóng)業(yè)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2007,9(3):361-364