• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于機(jī)器學(xué)習(xí)的招聘信息中就業(yè)技能提取的應(yīng)用分析

    2019-01-08 03:16:09趙力衡陳虹君
    電腦知識(shí)與技術(shù) 2019年33期
    關(guān)鍵詞:應(yīng)聘者分詞職位

    趙力衡 陳虹君

    摘要:應(yīng)聘者,特別是剛進(jìn)入職場(chǎng)的學(xué)生,如果在就業(yè)前一段時(shí)間就能了解到自己掌握的技能與公司職位招聘信息中所要求的技能是否吻合,就能幫助應(yīng)聘者在應(yīng)聘前有更多的準(zhǔn)備。為分析招聘信息中的就業(yè)技能,從招聘信息中提取就業(yè)技能詞匯就顯得很有必要了。鑒于此,提出使用機(jī)器學(xué)習(xí)中使用FP關(guān)聯(lián)規(guī)則模型和語(yǔ)義分詞法來(lái)實(shí)現(xiàn)對(duì)招聘信息中的就業(yè)技能的提取。實(shí)驗(yàn)結(jié)果表明,所提方法能較準(zhǔn)確地分析并提取出招聘信息中的技能詞匯,可作為就業(yè)技能提取的有效依據(jù),也可為文本關(guān)鍵詞組提取提供參考。

    關(guān)鍵詞:大數(shù)據(jù);機(jī)器學(xué)習(xí);就業(yè);技能;FP

    中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A

    文章編號(hào):1009-3044(2019)33-0211-02

    當(dāng)前很多應(yīng)聘者,特別是初人職場(chǎng)的學(xué)生,在就業(yè)時(shí)常常不知道自己能勝任什么樣的工作,因此幫助應(yīng)聘者分析自己所掌握的技能和工作所需技能的差異就顯得很有價(jià)值。為了解決這個(gè)問(wèn)題,首先要做的就是從眾多的招聘信息中識(shí)別出被普遍要求的就業(yè)技能詞匯。

    本文從分析招聘信息內(nèi)容出發(fā),通過(guò)機(jī)器學(xué)習(xí)和語(yǔ)義分詞方式從招聘信息文本中識(shí)別出其中被普遍引用的就業(yè)技能詞匯和詞匯組,從而提供了從招聘文本信息中提取技能詞匯和詞匯組的一種實(shí)現(xiàn)方法。

    1就業(yè)技能提取問(wèn)題分析

    在明確應(yīng)聘者技能是否與職位匹配時(shí),首先需要明確應(yīng)聘者所掌握的技能和不同職位所需的技能有哪些。前者可以通過(guò)應(yīng)聘者的技能調(diào)查準(zhǔn)確獲知,后者的數(shù)據(jù)則分散于各個(gè)招聘信息中,這就需要使用爬蟲(chóng)等工具來(lái)采集、整合這些數(shù)據(jù)。因時(shí)間有限,本文僅關(guān)注了計(jì)算機(jī)行業(yè)相關(guān)的職位。在采集職位數(shù)據(jù)時(shí)發(fā)現(xiàn)了以下問(wèn)題:

    1)招聘信息中對(duì)技能的描述不是單獨(dú)的,通常是嵌套在一條或多條完整的語(yǔ)句中,以Java工程師為例:

    21不同公司對(duì)同一職位所需技能的要求存在著不同,如圖1所示的脫敏后不同公司對(duì)Java工程師的不同要求。

    2就業(yè)技能提取模型分析

    分析多個(gè)招聘信息發(fā)現(xiàn),同一職位的技能要求中,部分技能是在多數(shù)公司的招聘信息中都出現(xiàn)的,比如表1中的Hiber-nate、Oracle等,這些技能文中稱為該職位的通用技能;另一些技能,則僅在少數(shù)公司的招聘信息中出現(xiàn),這部分技能通常是公司或項(xiàng)目所特需的技能。

    其中,前者具有應(yīng)聘職位的普遍性,掌握后能符合多數(shù)招聘信息需求,也是應(yīng)聘者就業(yè)技能分析應(yīng)當(dāng)關(guān)注的;而后者通常僅在少數(shù)公司的招聘信息中出現(xiàn),大多是該公司因業(yè)務(wù)需求所特有的技能需求,應(yīng)聘者即便掌握,符合的招聘信息也不多,因此這部分技能并不需要應(yīng)聘者普遍掌握。

    在應(yīng)聘一個(gè)職位時(shí),應(yīng)聘者也并不需要掌握該職位所有的通用就業(yè)技能,而是只需要掌握這個(gè)招聘信息中要求的通用技能即可,即這次應(yīng)聘所需的通用技能組。

    因此,實(shí)現(xiàn)對(duì)就業(yè)技能的分析時(shí)需要解決以下兩個(gè)問(wèn)題:

    1)從招聘信息中提取出相關(guān)的就業(yè)技能;

    2)識(shí)別出其中被同一職位廣泛引用的通用技能和通用技能組。

    2.1技能提取

    提取技能詞匯的第一步就是分詞。本文采用了語(yǔ)義分詞與分詞工具結(jié)合的方法實(shí)現(xiàn)分詞。這里語(yǔ)義分詞實(shí)現(xiàn)方式是將描述信息按“謂詞一賓語(yǔ)”的語(yǔ)義分詞方法,先定義了以謂語(yǔ)表示的“特征謂詞”和以賓語(yǔ)表示的“后綴停詞”詞典,然后使用正則表達(dá)式進(jìn)行分詞。先使用分詞工具分詞,分詞工具的分詞結(jié)果較粗,因此再將分詞工具的結(jié)果再使用語(yǔ)義分詞,從而能較精確地將就業(yè)技能從招聘信息中提取出來(lái),如下圖所示:

    2.2通用就業(yè)技能組分析

    就業(yè)技能提取完成后,對(duì)每一個(gè)職位創(chuàng)建一個(gè)表格,將該職位的每一則招聘信息中提取出來(lái)的就業(yè)技能詞匯填入同一行中。以表2中的招聘信息為例,如下表所示:

    如果同一職位中一個(gè)就業(yè)技能的支持度超過(guò)50%,則設(shè)定該技能在這個(gè)職位中是一個(gè)通用技能。找出通用技能后,在尋找通用就業(yè)技能組時(shí)還需要找出同一則招聘信息中同時(shí)出現(xiàn)的通用技能,這就需要用到數(shù)據(jù)關(guān)聯(lián)分析模型。因此可以用FP Growth關(guān)聯(lián)模型對(duì)該表數(shù)據(jù)建模。

    在FP模型中設(shè)定最小支持度參數(shù)為0.5,就能同時(shí)得到該職位支持度超過(guò)50%的通用技能及通用技能組。下圖展示了FP Growth模型分析的部分結(jié)果:

    上圖中一行記錄表示一則招聘信息,該記錄中的工作要求則是這條招聘信息中保留的在該職位中支持度超過(guò)50%的技能,這些就是在該職位的大多招聘信息中都要求了的通用技能。此外,從圖中可以看出同一條招聘記錄中的全部通用技能就是這條招聘信息中要求的一組相關(guān)就業(yè)技能,它們就構(gòu)成了一個(gè)通用技能組。至此,就將招聘信息中的通用技能和技能組提取了出來(lái),可以用于應(yīng)聘者就業(yè)技能畫(huà)像了。

    3結(jié)束語(yǔ)

    從結(jié)果來(lái)看,方法所提出的模型能較準(zhǔn)確地從不同的招聘信息的職位描述中識(shí)別出技能相關(guān)詞匯,并提取出該職位相關(guān)的通用就業(yè)技能和技能組,從而有效解決了嵌入在招聘信息這樣的文本中的技能詞匯識(shí)別和通用技能提取的問(wèn)題,為文本分析中使用機(jī)器學(xué)習(xí)方法實(shí)現(xiàn)詞匯識(shí)別和關(guān)鍵詞提取提供了一個(gè)可行的思路。

    實(shí)驗(yàn)結(jié)果表明,所提方法能較準(zhǔn)確地從招聘信息中識(shí)別并提取該職位所需的通用就業(yè)技能和技能組,可作為招聘信息分析中就業(yè)技能提取的有效手段,并為文本關(guān)鍵詞組分析提供了一個(gè)可行的思路。

    猜你喜歡
    應(yīng)聘者分詞職位
    領(lǐng)導(dǎo)職位≠領(lǐng)導(dǎo)力
    面試好難
    37°女人(2020年2期)2020-03-12 10:47:38
    把降落傘賣給農(nóng)夫
    結(jié)巴分詞在詞云中的應(yīng)用
    職位之謎與負(fù)謗之痛:柳治徵在東南大學(xué)的進(jìn)退(1916—1925)
    值得重視的分詞的特殊用法
    電話預(yù)約技巧知多少
    人力資源(2016年8期)2016-10-18 09:59:53
    美最高就業(yè)率地鐵圈
    海外星云 (2014年22期)2015-01-19 09:34:28
    收入性別歧視的職位差異
    高考分詞作狀語(yǔ)考點(diǎn)歸納與疑難解析
    重庆市| 彰化市| 新安县| 永和县| 邵阳市| 盐山县| 弋阳县| 惠安县| 彭山县| 连山| 寿阳县| 青田县| 马山县| 太谷县| 澄江县| 晴隆县| 云南省| 若羌县| 镇原县| 施甸县| 巢湖市| 杨浦区| 多伦县| 浮山县| 延安市| 阳江市| 苍溪县| 上饶市| 铜山县| 巴林左旗| 游戏| 福泉市| 呼伦贝尔市| 海兴县| 将乐县| 英吉沙县| 普宁市| 高安市| 塘沽区| 石屏县| 长治市|