王 密
河南牧業(yè)經濟學院,河南 鄭州 450046
在大數據這一時代背景下,社會中任意事物均可以被數據化,而數據化事物可以被進一步研究、預測、應用,為精準個性化服務實現提供支持。這種情況下,在大數據背景下,如何恰當利用大數據技術,為大學生提供更加精準、個性化的就業(yè)指導,降低大學生在人才市場中碰壁風險,幫助大學畢業(yè)季擺脫最難就業(yè)季厄運,就成為大學院校面臨的重要任務。
大數據采集、大數據計算是大數據背景下大學生個性化就業(yè)指導主要用技術。
一方面,大數據采集具有采集渠道廣泛、數據資源收集便捷、數據庫容量大、數據庫保存時間長等優(yōu)良特點。通過從多個渠道收集信息,可以保證創(chuàng)業(yè)指導方向、就業(yè)指導方向客觀、全面性,為教師授課、學生學習提供實際價值較高的預測方案[1]。
另一方面,大數據計算具有容錯能力強、計算速度快、誤差分析處理效率高等優(yōu)良特點。通過大數據分析計算,可以搭建較為恰當、科學的數學模型,還原真實就業(yè)情況,保證大學生就業(yè)指導數字預測、評估的準確性[2]。
大數據背景下的大學生個性化就業(yè)指導平臺本質上為一個基于Hadoop平臺的大學生個性化就業(yè)指導系統(tǒng)。其可以將第三方就業(yè)信息服務網絡搜集整理,結合大學生求職簡歷,為其分析個人偏好、專業(yè)水平,隨后為其推薦恰當的招聘信息。
基于大數據背景下的大學生個性化就業(yè)指導平臺主要包括基礎數據層、個性化指導層、系統(tǒng)展現層三個部分。其中基礎數據層主要是利用分布式數據庫HBASE,實現數據存儲。其可以存放全部從互聯網爬取的就業(yè)信息、指導結果、學生信息、學生反饋信息等,上述信息均是由分布式爬蟲Nutch,爬取第三方就業(yè)服務網站就業(yè)信息并進行網頁解析,最終儲存在分布式數據庫內;個性化指導層(邏輯層)主要是依托個性化指導引擎及Mahout、MapReduce,對數據層大量數據進行分析、計算、推理,針對每一位大學生特點,為其推薦個性化信息;系統(tǒng)展現層(表示層)主要包括大學生注冊、登錄、信息反饋列表等幾個部分,學生可以根據個性化指導信息,結合自身興趣度評分結果,選擇恰當方案,并反饋結果,為個性化就業(yè)指導平臺改進提供依據。
個性化指導引擎及策略是大數據背景下大學生個性化就業(yè)指導核心,因此,為了從根本上克服個性化指導系統(tǒng)在實際運行中遇到的問題,可以將整個個性化指導策略劃分為離線指導部分、在線指導部分兩個部分。依據離線指導為主,在線指導為輔的原則,相輔相成,對基于內容的指導方案進行改革優(yōu)化,保證離在線并行式混合指導工作順利開展[3]。
第一,在僅考慮就業(yè)信息內容本身的情況下,可以摒棄歷史評分數據,制定基于內容的分布式指導策略。即針對就業(yè)信息庫內以文本形式存儲的信息,利用TF-IDF方法,剔除高頻詞匯后,將其轉化為向量空間模型。隨后作為LDA(線性判別分析)輸入數據輸出主題集合,分別將每一條就業(yè)信息、求職信息映射到一個主題向量上。最終得到的主題向量就是大學生偏好向量,在大學生偏好向量明確之后,可以利用余弦相似性計算方法,分別對就業(yè)信息主題向量、學生求職信息主題向量進行分析。
確定大學生、就業(yè)信息相似度,根據相似度大小次序,將就業(yè)信息添加到指導方案中。
第二,除基于就業(yè)內容的指導方案外,也可以選擇基于物品的協同過濾指導方法。即提取大學生對已指導信息表達興趣度評分,以URL(統(tǒng)一資源定位系統(tǒng))的形式,將數據庫中數據形成一條記錄。隨后構建物品的共現矩陣(部分評分列表中每一物品共同出現的次數矩陣)。綜合考慮對某一就業(yè)信息進行過評分的學生數量共現次數、對某一就業(yè)信息進行過評分的學生數量共現次數等因素,將上述因素與學生偏好向量相乘,獲得指導方案。
第三,在指導策略確定后,結合大數據背景下學生個性化就業(yè)指導需求,可以在NoSQL數據庫框架確定的基礎上,僅設計RowKey(行鍵)一個索引。依據字典順序,進行儲存,提高索引速度。同時將索引字段放在列族中,允許適當數據冗余。
個性化就業(yè)指導平臺實現主要是通過路由器,將各個節(jié)點連接。隨后依托Web服務器,在學生端、教師端搭建信息交互橋梁。這種情況下,學生可以通過訪問Web服務器,將個人情況、反饋信息提交至Hadoop集群中。系統(tǒng)計算指導方案可以通過Web服務器傳遞給教師,為教師離線或在線指導提供幫助。同時基于Nutch的分布式爬蟲、離線指導,可以每間隔一定時期在Hadoop集群中運行爬取最新信息,更新每一位學生指導方案。
個性化指導平臺主要應用于往屆大學生就業(yè)情況分析、現階段就業(yè)市場情況分析、大學生就業(yè)情況分析幾個方面。
第一,往屆大學畢業(yè)生就業(yè)情況分析,明確往屆大學畢業(yè)生就業(yè)指導信息,可以為本屆大學生個性化就業(yè)指導方案優(yōu)化提供依據。因此,院校應注意依托大數據平臺,對每一條往屆大學生興趣度評分、指導方案評價信息進行匯總,并將其儲存在專門的數據庫中。
第二,現階段就業(yè)市場情況分析,為了解現階段就業(yè)市場實際情況,學校應依托大數據技術,摒棄抽樣調查的方法,依托廣泛數據樣本,掌握現階段就業(yè)市場發(fā)展動態(tài)。并對當年學院各專業(yè)對口用人企業(yè)招聘人才傾向進行分析,結合本屆用人企業(yè)要求,為畢業(yè)生提供個性化就業(yè)指導。
第三,大學生專業(yè)及自身能力分析,學生專業(yè)及自身能力分析是大數據背景下大學生個性化就業(yè)指導工作開展的前提。因此,在基于大數據的大學生個性化就業(yè)指導方案應用的基礎上,院校應從大學生專業(yè)、個人介紹、求職意向、實踐經歷、實習經歷、求職信息等方面。結合系統(tǒng)計算的大學生特征向量信息,制定個性化就業(yè)指導策略方案。
大數據背景下大學生個性化就業(yè)指導應注意避免大數據與大學生個體脫鉤、大數據與社會實際脫鉤、大數據與真實性脫鉤等問題出現[4]。
第一,為保證大數據與大學生個體相符性,應明晰大數據背后隱藏的大學生真實行為習慣、思維方式,以引導大學生樹立正確就業(yè)觀、人生觀為核心,進行數據模型構建。
第二,基于大學生獲取信息量大、信息價值密度低、信息獲取速度快的特點,為避免大學生在互聯網中即興發(fā)布言論對個性化服務指導真實性造成影響,應注意從客觀入手,篩選較為準確、真實的大學生信息,保證大數據分析價值效應[5]。
綜上所述,大數據是一個系統(tǒng)性概念,在指導大學生個性化就業(yè)方面,大數據技術的優(yōu)勢主要表現在大數據采集、大數據分析計算等模塊。因此,大學院校應正確認識大數據技術在大學生個性化就業(yè)指導中應用優(yōu)勢,結合本院校各專業(yè)大學畢業(yè)生就業(yè)需求,搭建適應性、個性化的大學生個性化就業(yè)指導平臺。依托大數據技術,通過廣泛數據樣本收集、計算、分析、展現,為大學生提供個性化就業(yè)指導,幫助大學生順利實現更高質量的就業(yè)。