郜攀峰
摘? 要: 在高校畢業(yè)就業(yè)情況分析的過程中,由于數(shù)據(jù)量過于龐大,原有分析方法的分析結(jié)果精度較差。因而,文中提出基于大數(shù)據(jù)分析技術(shù)的高校畢業(yè)就業(yè)分析方法。采用大數(shù)據(jù)網(wǎng)絡(luò)設(shè)定數(shù)據(jù)獲取渠道完成數(shù)據(jù)采集工作,統(tǒng)一數(shù)據(jù)樣本格式,制定數(shù)據(jù)處理流程,獲得處理后的數(shù)據(jù)樣本。采用大數(shù)據(jù)分析技術(shù)中的關(guān)聯(lián)性分析方法,完成對(duì)高校畢業(yè)就業(yè)情況的分析工作。至此,基于大數(shù)據(jù)分析技術(shù)的高校畢業(yè)就業(yè)狀況分析方法設(shè)計(jì)完成。設(shè)計(jì)調(diào)查問卷,選擇數(shù)據(jù)處理設(shè)備,得到問卷調(diào)查結(jié)果,通過原有方法與此方法獲得問卷分析結(jié)果。與原有分析方法相比,所設(shè)計(jì)方法分析精度更高。綜上所述,此方法更適用于就業(yè)分析工作。
關(guān)鍵詞: 高校畢業(yè); 就業(yè)分析; 大數(shù)據(jù)分析; 數(shù)據(jù)采集; 關(guān)聯(lián)性分析; 云計(jì)算
中圖分類號(hào): TN919?34; TP391? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼: A? ? ? ? ? ? ? ? ? ? ?文章編號(hào): 1004?373X(2020)18?0047?03
Abstract: As the amount of data is vast in the process of analyzing the employment situation of college graduates, resulting in the poor accuracy of analysis results in the original analysis methods, a method of the college graduates employment analysis based on big data analysis technology is proposed. The big data network is used to set the data acquisition channel, so as to accomplish data acquisition, unify data sample format, lay down data processing process, and obtain the processed data sample. The correlation analysis method in the big data analysis technology is adopted to complete the analysis of employment situation of college graduates. So far, the design of college graduates employment analysis method based on the big data analysis technology is completed. The questionnaire was designed and data processing equipment was selected to obtain the questionnaire results. The questionnaire analysis results are obtained by means of the original method and this method. This method has higher analysis accuracy in comparison with the original analysis method. To sum up, the designed method is more suitable for the employment analysis.
Keywords: college graduates; employment analysis; big data analysis; data collection; correlation analysis; cloud computing
0? 引? 言
分析高校畢業(yè)生就業(yè)狀況,對(duì)于我國經(jīng)濟(jì)發(fā)展與就業(yè)市場的宏觀調(diào)控至關(guān)重要。以高校就業(yè)情況為基礎(chǔ)制定未來就業(yè)調(diào)控是維持我國就業(yè)市場規(guī)范化的重要手段[1?3]。
就目前畢業(yè)生數(shù)目龐大的現(xiàn)狀,大數(shù)據(jù)分析最為適合分析畢業(yè)生就業(yè)情況。通過采用常用的軟件對(duì)畢業(yè)生就業(yè)信息進(jìn)行捕捉、管理以及處理,以此分析出畢業(yè)生的就業(yè)狀況、就業(yè)方向以及決定就業(yè)的因素。在分析的過程中,采用大規(guī)模并行處理技術(shù)、數(shù)據(jù)挖掘方法、分布式文件管理、綜合性數(shù)據(jù)庫、云計(jì)算等技術(shù),提高大數(shù)據(jù)分析的速度與質(zhì)量,由此保證畢業(yè)生就業(yè)狀況分析的精度與準(zhǔn)確度[4?6]。
1? 大數(shù)據(jù)分析技術(shù)的高校畢業(yè)就業(yè)狀況分析方法
就高校畢業(yè)就業(yè)狀況而言,每年高校畢業(yè)生數(shù)目龐大。采用普通的數(shù)據(jù)采集與處理手段無法對(duì)龐大的數(shù)據(jù)群進(jìn)行精確分析。因而,采用大數(shù)據(jù)技術(shù)中的關(guān)聯(lián)性以及大數(shù)據(jù)網(wǎng)絡(luò)完成數(shù)據(jù)收集處理過程,并根據(jù)處理結(jié)果,完成對(duì)高校畢業(yè)就業(yè)的分析工作。就業(yè)狀況分析流程如圖1所示。
采用上述流程完成就業(yè)情況分析方法的設(shè)計(jì)工作,在設(shè)計(jì)中注重?cái)?shù)據(jù)采集的完整度以及數(shù)據(jù)整合的規(guī)范性,以此為數(shù)據(jù)分析提供基礎(chǔ)。
1.1? 高校畢業(yè)就業(yè)狀況數(shù)據(jù)采集
在此利用數(shù)據(jù)網(wǎng)絡(luò)采集到的數(shù)據(jù)與各院校之間的公開數(shù)據(jù)庫或大數(shù)據(jù)平臺(tái)進(jìn)行數(shù)據(jù)交換,豐富數(shù)據(jù)網(wǎng)絡(luò)的數(shù)據(jù)內(nèi)容。構(gòu)建大數(shù)據(jù)網(wǎng)絡(luò)中的信息挖掘數(shù)據(jù)庫,對(duì)數(shù)據(jù)庫內(nèi)的信息處理整合。形成相應(yīng)的數(shù)據(jù)樣本,并對(duì)其進(jìn)行輸出匯總。大部分的就業(yè)信息通過專線完成數(shù)據(jù)的獲取與交換。在此過程中,需運(yùn)用眾多渠道,其中包括政府公共數(shù)據(jù)發(fā)布、高等院校數(shù)據(jù)公開[7]、學(xué)信網(wǎng)數(shù)據(jù)統(tǒng)計(jì)畢業(yè)生就業(yè)協(xié)議數(shù)量及報(bào)道地點(diǎn)信息。部分信息獲取渠道列舉如圖2所示。
科學(xué)應(yīng)用上述渠道完成信息獲取,通過采用其他方式采集來自其他系統(tǒng)的海量畢業(yè)生信息,設(shè)定相同的表名,保存至數(shù)據(jù)庫中,結(jié)合由專線獲取到的基礎(chǔ)就業(yè)信息,作為高校畢業(yè)就業(yè)狀況基礎(chǔ)數(shù)據(jù)。
1.2? 就業(yè)狀況數(shù)據(jù)統(tǒng)計(jì)與處理
在此次數(shù)據(jù)處理的過程中,以數(shù)據(jù)庫中的數(shù)據(jù)項(xiàng)為基礎(chǔ)。由于就業(yè)狀況的數(shù)據(jù)項(xiàng)較為復(fù)雜,采用數(shù)據(jù)項(xiàng)的基本項(xiàng),描述畢業(yè)生就業(yè)的情況與方向。在數(shù)據(jù)項(xiàng)設(shè)計(jì)中需包含大量的畢業(yè)生個(gè)人信息,為保證處理后的信息符合此次設(shè)計(jì),就數(shù)據(jù)項(xiàng)所含內(nèi)容進(jìn)行設(shè)定。具體內(nèi)容如表1所示。
采用上述數(shù)據(jù)項(xiàng)設(shè)定后,對(duì)數(shù)據(jù)庫內(nèi)信息進(jìn)行處理整合。通過數(shù)據(jù)清洗[8?9]、數(shù)據(jù)集成、數(shù)據(jù)變換[10]以及數(shù)據(jù)規(guī)約完成數(shù)據(jù)預(yù)處理。在預(yù)處理過程中,著重注意數(shù)據(jù)變換工作,將數(shù)據(jù)庫中的多個(gè)數(shù)據(jù)源整合為一個(gè)數(shù)據(jù)形式,應(yīng)用數(shù)據(jù)規(guī)范化處理,對(duì)數(shù)據(jù)庫內(nèi)的無效、錯(cuò)誤數(shù)據(jù)清除,保證數(shù)據(jù)樣本的有效性。
1.3? 實(shí)現(xiàn)就業(yè)狀況分析
通過上述的信息數(shù)據(jù)的預(yù)處理結(jié)果,采用大數(shù)據(jù)分析技術(shù)實(shí)現(xiàn)大學(xué)畢業(yè)就業(yè)狀況分析。分析過程除大數(shù)據(jù)分析技術(shù)外,還需相應(yīng)的設(shè)備實(shí)現(xiàn)分析工作,通過服務(wù)器獲取數(shù)據(jù)庫內(nèi)部信息。在分析設(shè)備內(nèi)安裝多核處理器[11?13],實(shí)現(xiàn)數(shù)據(jù)的高度運(yùn)轉(zhuǎn)分析。采用此設(shè)備完成獲取數(shù)據(jù)庫信息及大數(shù)據(jù)中的關(guān)聯(lián)性分析,并完成就業(yè)情況研究。應(yīng)用關(guān)聯(lián)性分析中的因子[14]分析方式研究其情況,將數(shù)據(jù)庫中相關(guān)性高的數(shù)據(jù)構(gòu)成一個(gè)基本分析結(jié)構(gòu),即公共分析因子。使用此因子可以得到數(shù)據(jù)關(guān)聯(lián)的線性組合,即:
對(duì)式(2)進(jìn)行轉(zhuǎn)化,可知在就業(yè)情況分析的過程中分析因子與信息量之間的關(guān)系。
式中:[C]為變量矩陣;[χ]為特殊分析因子[15]。采用上述公式,完成對(duì)高效畢業(yè)就業(yè)狀況信息的分析工作。至此,基于大數(shù)據(jù)分析技術(shù)的高校畢業(yè)就業(yè)狀況分析方法完成。
2? 實(shí)例論證分析
2.1? 實(shí)驗(yàn)準(zhǔn)備過程
在此次的實(shí)例分析中,采用問卷調(diào)查的形式完成分析方法研究過程。調(diào)查問卷的設(shè)計(jì)除常用的信息外,增加就業(yè)方面的相關(guān)問題,以此作為評(píng)定2種分析方法區(qū)別的重要樣本數(shù)據(jù)之一。調(diào)查問卷采用紙質(zhì)問卷與電子問卷相結(jié)合的方式。將問卷發(fā)放1 000份,并積極回收。將回收到的數(shù)據(jù)進(jìn)行處理分析得出相應(yīng)的結(jié)果。為有效控制實(shí)驗(yàn)過程,設(shè)定使用的設(shè)備與軟件。具體參數(shù)如表2所示。
采用上述問卷以及數(shù)據(jù)處理設(shè)備完成對(duì)原有方法與本文設(shè)計(jì)方法之間的對(duì)比分析結(jié)果研究,將結(jié)果通過表格描述。
2.2? 實(shí)驗(yàn)結(jié)果分析
根據(jù)上述內(nèi)容,完成此次實(shí)例分析。將處理后的數(shù)據(jù)通過表格顯示,具體內(nèi)容如表3所示。
將問卷數(shù)據(jù)整理結(jié)果作為實(shí)驗(yàn)樣本,采用原有方法與本文方法對(duì)其分析,得出相應(yīng)分析結(jié)果如表4所示。
在此次問卷設(shè)計(jì)中,共發(fā)放問卷1 000份,回收問卷950份,有效問卷950份。其中,男性為450人,女性為500人,年齡大部分為25~45歲之間,問卷的受訪人群多來自東南沿海城市。采用原有方法與本文方法對(duì)數(shù)據(jù)進(jìn)行分析得出每一個(gè)問題的分析精度。從結(jié)果可以看出,使用本文方法對(duì)數(shù)據(jù)的分析結(jié)果精度均高于原有方法。在分析過程中,本文方法的數(shù)據(jù)處理過程可以有效剔除無用的信息,提高分析能力,保證分析結(jié)果的精度。綜上所述,本文設(shè)計(jì)方法在分析效果以及使用性能上都優(yōu)于原有方法,應(yīng)對(duì)其普及推廣。
3? 結(jié)? 語
采用大數(shù)據(jù)分析技術(shù)對(duì)高校畢業(yè)就業(yè)情況加以分析,可有效提升使用者的用戶體驗(yàn)以及分析方法的分析能力。在原有分析方法的基礎(chǔ)上,增加數(shù)據(jù)采集的來源與預(yù)處理的方式,提升海量數(shù)據(jù)的分析處理速度。此次方法設(shè)計(jì)的重點(diǎn)在于數(shù)據(jù)的分析,應(yīng)用大數(shù)據(jù)技術(shù)中的分析控制理論完成此工作。通過實(shí)例分析可知,本文設(shè)計(jì)方法優(yōu)于原有方法。因而,將其推廣應(yīng)用可提升對(duì)就業(yè)情況的研究與發(fā)展。
參考文獻(xiàn)
[1] 李端超,王松,黃太貴,等.基于大數(shù)據(jù)平臺(tái)的電網(wǎng)線損與竊電預(yù)警分析關(guān)鍵技術(shù)[J].電力系統(tǒng)保護(hù)與控制,2018,46(5):143?151.
[2] 楊彬.大數(shù)據(jù)分析技術(shù)的研究[J].電子測試,2017(21):123?124.
[3] 杜若,謝川,吳群艷.電力環(huán)保大數(shù)據(jù)平臺(tái)開發(fā)及智能運(yùn)用[J].電力大數(shù)據(jù),2017,20(8):64?67.
[4] 門威,丹國萍.智慧校園環(huán)境下的學(xué)生軌跡數(shù)據(jù)分析技術(shù)[J].漯河職業(yè)技術(shù)學(xué)院學(xué)報(bào),2017,16(5):7?9.
[5] 趙丹.基于大數(shù)據(jù)分析的運(yùn)動(dòng)損傷估計(jì)模型設(shè)計(jì)[J].現(xiàn)代電子技術(shù),2017,40(17):101?104.
[6] 葉潤國,吳迪,韓曉露.地理信息大數(shù)據(jù)安全保障模型和標(biāo)準(zhǔn)體系[J].科學(xué)技術(shù)與工程,2017,17(36):105?111.
[7] 聶瑞華,王欣明,李卓越.從概念走向?qū)嵺`:基礎(chǔ)教育大數(shù)據(jù)的框架與實(shí)現(xiàn)研究[J].中國電化教育,2017(3):70?75.
[8] 季惠斌.大數(shù)據(jù)時(shí)代思想政治教育思維方式的轉(zhuǎn)變[J].東北師大學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2017(1):150?155.
[9] 蔡雄飛,王濟(jì),梅再美,等.環(huán)境科學(xué)碩士研究生就業(yè)分析及培養(yǎng)模式探討:以貴州師范大學(xué)環(huán)境科學(xué)專業(yè)為例[J].廣東化工,2018,45(5):257?259.
[10] 王瑩瑩.勞動(dòng)力空間集聚的就業(yè)效應(yīng):基于中國城市面板數(shù)據(jù)的經(jīng)驗(yàn)分析[J].云南財(cái)經(jīng)大學(xué)學(xué)報(bào),2018,34(2):36?47.
[11] 張帆,向首艷,陳敏,等.醫(yī)科大學(xué)營養(yǎng)學(xué)專業(yè)本科生就業(yè)情況分析[J].中華醫(yī)學(xué)教育探索雜志,2018,17(6):645?648.
[12] 胡明月,張?jiān)?,陳東明.護(hù)理科學(xué)學(xué)位和專業(yè)學(xué)位碩士研究生同向性就業(yè)現(xiàn)狀分析[J].護(hù)理學(xué)雜志,2017,32(4):64?67.
[13] 吳林陽,羅蓉,郭雪婷,等.CPU和DRAM加速任務(wù)劃分方法:大數(shù)據(jù)處理中Hash Joins的加速實(shí)例[J].計(jì)算機(jī)研究與發(fā)展,2018,55(2):289?304.
[14] 李剛,黃斌,顏耀,等.基于云計(jì)算的海洋綜合性試驗(yàn)船大數(shù)據(jù)處理模式探討[J].艦船科學(xué)技術(shù),2018,40(3):90?95.
[15] 李炎,馬俊明,安博,等.一個(gè)基于Web的輕量級(jí)大數(shù)據(jù)處理與可視化工具[J].計(jì)算機(jī)科學(xué),2018,45(9):60?64.