• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      大數(shù)據(jù)背景下高校招生策略預(yù)測(cè)

      2020-09-06 13:24:37朱莉
      數(shù)碼世界 2020年8期
      關(guān)鍵詞:大數(shù)據(jù)

      摘要:現(xiàn)如今,各高校招生計(jì)劃不斷擴(kuò)大,招生的辦法也越來越多樣,各地區(qū)高校之間招生競(jìng)爭(zhēng)也越來越激烈。為了保證生源數(shù)量和質(zhì)量,高校把招生前的宣傳工作作為吸引生源的主要方法,這就需要高校在網(wǎng)絡(luò)高速發(fā)展的今天,以大數(shù)據(jù)為依托。首先定位生源對(duì)象,再結(jié)合云計(jì)算技術(shù)中的計(jì)算模型和框架來分析高校過去年份招收的生源對(duì)象情況,可以利用并行隨機(jī)森林來預(yù)測(cè)招生的策略,這種方法在數(shù)據(jù)的采集上要比一般的預(yù)測(cè)樹更加優(yōu)越。

      關(guān)鍵詞:大數(shù)據(jù);高校招生;策略預(yù)測(cè)

      在高校招生信息多元化、生源招生日趨激烈、計(jì)算機(jī)技術(shù)高速發(fā)展的今天,想要確定一個(gè)準(zhǔn)確適宜的招生策略,需要大量數(shù)據(jù)的整合與支持,但是當(dāng)今所能參考的信息有一個(gè)數(shù)量龐大的數(shù)據(jù)庫,統(tǒng)稱為招生信息大數(shù)據(jù),且這些數(shù)據(jù)已經(jīng)不足以滿足日益增長(zhǎng)的信息需求,這就需要對(duì)高校招生進(jìn)行策略預(yù)測(cè),在眾多專業(yè)學(xué)者的研究下,我國總結(jié)提出了高校招生策略的預(yù)測(cè)方法,本文就通過Hadoop平臺(tái)來分析隨機(jī)森林算法這一有效利用方法。

      在云計(jì)算的所有應(yīng)用技術(shù)中,Hadoop是最準(zhǔn)確最先進(jìn)的技術(shù),是管理大數(shù)據(jù)和實(shí)現(xiàn)數(shù)據(jù)并行處理的最主要技術(shù)。它是一個(gè)開源式軟件構(gòu)架,它的焦點(diǎn)內(nèi)容是分布式文件系統(tǒng)和并行式計(jì)算模型。

      根據(jù)云計(jì)算技術(shù)的構(gòu)造和數(shù)據(jù)處理的具體工具,再利用高校實(shí)際招生的數(shù)據(jù)資料,按照以保存、分析、計(jì)算為主的模式來創(chuàng)建高校招生數(shù)據(jù)云平臺(tái),其中包括數(shù)據(jù)的采集、保存、整理計(jì)算以及再應(yīng)用等幾個(gè)系統(tǒng),它是Hadoop技術(shù)的具體體現(xiàn)形式,通過建立大數(shù)據(jù)存儲(chǔ)系統(tǒng)和內(nèi)存并行計(jì)算技術(shù),共同組成數(shù)據(jù)分析計(jì)算系統(tǒng),能夠迅速又合理地對(duì)高校招生數(shù)據(jù)進(jìn)行計(jì)算與評(píng)估。

      該系統(tǒng)主要把高校的招生數(shù)目、學(xué)生畢業(yè)分?jǐn)?shù)、專業(yè)分類等所有來源不盡相同、數(shù)據(jù)種類不一、模態(tài)也完全不同的招生數(shù)據(jù)作為數(shù)據(jù)的子集,構(gòu)成了大量的異構(gòu)數(shù)據(jù)。再通過數(shù)據(jù)整合技術(shù),把這些數(shù)據(jù)移動(dòng)到Hadoop的集群中,把所有數(shù)據(jù)進(jìn)行統(tǒng)一的存檔與分類管理。

      數(shù)據(jù)倉庫中的所有數(shù)據(jù)資料都存儲(chǔ)于Hadoop的集群當(dāng)中。它首先要對(duì)搜集到的所有高校往年的招生數(shù)據(jù)進(jìn)行原始數(shù)據(jù)的階段處理,包括清理、抽取、整合等環(huán)節(jié),待把這些預(yù)處理工作完成后,再把數(shù)據(jù)分門別類提取到數(shù)據(jù)倉庫,此過程能夠進(jìn)一步保證數(shù)據(jù)倉庫里的所有數(shù)據(jù)都是分類明確的全局信息。

      云平臺(tái)主要運(yùn)用并行化計(jì)算模型MapReduce對(duì)招生數(shù)據(jù)進(jìn)行挖掘并合理分析,它能夠?yàn)槭褂谜哒故境龃罅吭O(shè)計(jì)性強(qiáng)的并行計(jì)算軟件結(jié)構(gòu),能夠在集群中利用計(jì)算任務(wù)將數(shù)據(jù)自動(dòng)分類再把集群中的所有數(shù)據(jù)資源完成自動(dòng)任務(wù)分配,而且還可以自動(dòng)完成監(jiān)控任務(wù),最后再把集群中的所有計(jì)算結(jié)果統(tǒng)一收集起來進(jìn)行存儲(chǔ)。所以,此種計(jì)算模型把數(shù)據(jù)的計(jì)算與存儲(chǔ)、數(shù)據(jù)的通信、數(shù)據(jù)的容錯(cuò)率等這些操作困難的細(xì)枝末節(jié)全部集中在軟件上解決,大大減輕了軟件的開發(fā)困難,提高了用戶的辦公效率。緊接著,另一個(gè)并行化計(jì)算模型Spark再對(duì)龐大的數(shù)據(jù)進(jìn)行迭代式計(jì)算,它主要是以內(nèi)存集群和Hadoop為基礎(chǔ)再經(jīng)過改良演變而成的集群計(jì)算系統(tǒng)。在這其中,所有運(yùn)行過的中間數(shù)據(jù)都統(tǒng)一在內(nèi)存中進(jìn)行存檔處理,這對(duì)于迭代式計(jì)算方法完成的更好具有很大的用處。

      云服務(wù)計(jì)算平臺(tái)中提到:用戶應(yīng)用就要為用戶提供優(yōu)質(zhì)服務(wù),并以應(yīng)用即為服務(wù)的原則作為支撐,數(shù)據(jù)應(yīng)用系統(tǒng)在實(shí)踐中主要體現(xiàn)在為高校招生預(yù)測(cè)提供優(yōu)質(zhì)的服務(wù),主要有:利用文件夾的方法為各個(gè)地區(qū)的高校招生計(jì)劃發(fā)送數(shù)據(jù)一覽表、為高校專業(yè)分類提供建議、招收學(xué)生所在地選取、招生宣傳攻略等眾多應(yīng)用服務(wù)。

      在當(dāng)前大數(shù)據(jù)的運(yùn)用階段,主要運(yùn)用決策樹等不同計(jì)算預(yù)測(cè)進(jìn)行分析整理,其中決策樹這一方法近些年來得到了細(xì)致分析與研究,且應(yīng)用效果也絕佳。隨之演變出來的隨機(jī)森林預(yù)測(cè)計(jì)算方法,綜合了不同分類的回歸樹進(jìn)行集中分類預(yù)測(cè)計(jì)算,為隨機(jī)森林算法做到并行化數(shù)據(jù)提供了重要條件。每當(dāng)輸入一個(gè)樣本數(shù)據(jù),不同的決策樹會(huì)產(chǎn)生很多個(gè)計(jì)算結(jié)果,再通過軟件內(nèi)部投票形式對(duì)所有計(jì)算結(jié)果進(jìn)行集中分類得出結(jié)論。隨機(jī)森林的最大優(yōu)點(diǎn)就是使并行化實(shí)現(xiàn)更加便捷,它集中了決策樹的所有優(yōu)點(diǎn),使計(jì)算效率提高了很多倍,更增強(qiáng)了算法對(duì)數(shù)據(jù)整理的獨(dú)特處理能力。

      多個(gè)決策樹的集合為隨機(jī)森林算法的應(yīng)用實(shí)現(xiàn)提供了前提條件。與此同時(shí),袋裝算法和隨機(jī)子空間思想也為它提供了具體的理論基礎(chǔ)。其中,袋裝算法主要通過概率分布的原理對(duì)數(shù)據(jù)進(jìn)行集中抽樣并放回,在進(jìn)行數(shù)據(jù)抽樣時(shí),設(shè)定有三分之一的數(shù)據(jù)不可被抽到,這些數(shù)據(jù)無法進(jìn)行數(shù)據(jù)計(jì)算訓(xùn)練,剩余的部分主要是為數(shù)據(jù)的泛化能力做進(jìn)一步實(shí)驗(yàn)使用。袋裝算法能夠使隨機(jī)森林算法并行完成計(jì)算全過程。而隨機(jī)子空間思想則是指在決策樹進(jìn)行不同節(jié)點(diǎn)的各個(gè)屬性抽樣時(shí),能夠在不被其他因素的影響下把所需要的樣本快速提煉出來,過程非常隨機(jī)化,所以數(shù)據(jù)可以同時(shí)并行地被抽取,從而讓幾個(gè)決策樹一起生成。這兩者使隨機(jī)森林算法同時(shí)進(jìn)行計(jì)算生成,且預(yù)測(cè)更加準(zhǔn)確、迅速,對(duì)于數(shù)據(jù)的處理能力非常強(qiáng)大。

      在大數(shù)據(jù)研究的背景下,通過國內(nèi)外研究學(xué)者的實(shí)驗(yàn)結(jié)果可以得出,對(duì)于高校招生的大量數(shù)據(jù),通過Hadoop并行式隨機(jī)森林算法模型來對(duì)這些數(shù)據(jù)進(jìn)行分類整理計(jì)算,能夠令數(shù)據(jù)分析速度和大數(shù)據(jù)處理能力迅速提高,預(yù)測(cè)性也更強(qiáng),能夠?qū)Ω咝U猩呗赃M(jìn)行準(zhǔn)確預(yù)測(cè)。

      參考文獻(xiàn):

      [1]于春,柳柳,徐曉麗.在讀大學(xué)生在高校招生宣傳體系中的獨(dú)特優(yōu)勢(shì)及策略研究——以南京農(nóng)業(yè)大學(xué)大學(xué)生回訪母校為例[J].教育教學(xué)論壇,2020(17):35-36.

      [2]唐玉生.基于考生反饋的高校招生宣傳策略研究[J].湖南科技大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2020,23(02):164-169.

      [3]王金超,李佳思,曹建民.高校大類招生模式實(shí)踐運(yùn)行中存在的問題及其優(yōu)化策略[J].輕紡工業(yè)與技術(shù),2020,49(02):102-103.

      [4]蔡何智.高職院校招生工作的創(chuàng)新策略探討[J].創(chuàng)新創(chuàng)業(yè)理論研究與實(shí)踐,2019,2(17):168-169.

      朱莉(1976.10.23),女,漢族,江蘇省明達(dá)職業(yè)技術(shù)學(xué)院,招生就業(yè)處,郵編224300,研究方向:高校招生工作和行政管理工作。

      猜你喜歡
      大數(shù)據(jù)
      基于在線教育的大數(shù)據(jù)研究
      “互聯(lián)網(wǎng)+”農(nóng)產(chǎn)品物流業(yè)的大數(shù)據(jù)策略研究
      基于大數(shù)據(jù)的小微電商授信評(píng)估研究
      大數(shù)據(jù)時(shí)代新聞的新變化探究
      商(2016年27期)2016-10-17 06:26:00
      淺談大數(shù)據(jù)在出版業(yè)的應(yīng)用
      今傳媒(2016年9期)2016-10-15 23:35:12
      “互聯(lián)網(wǎng)+”對(duì)傳統(tǒng)圖書出版的影響和推動(dòng)作用
      今傳媒(2016年9期)2016-10-15 22:09:11
      大數(shù)據(jù)環(huán)境下基于移動(dòng)客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
      新聞世界(2016年10期)2016-10-11 20:13:53
      基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
      科技視界(2016年20期)2016-09-29 10:53:22
      數(shù)據(jù)+輿情:南方報(bào)業(yè)創(chuàng)新轉(zhuǎn)型提高服務(wù)能力的探索
      中國記者(2016年6期)2016-08-26 12:36:20
      新竹县| 双峰县| 石景山区| 镇原县| 穆棱市| 潜山县| 开封县| 通榆县| 昌乐县| 边坝县| 禹城市| 筠连县| 连城县| 宜章县| 自治县| 盐亭县| 疏勒县| 资溪县| 浦县| 湛江市| 赤城县| 尖扎县| 华宁县| 洪雅县| 辽宁省| 丘北县| 嘉兴市| 隆安县| 长子县| 交城县| 临安市| 石首市| 永顺县| 竹溪县| 株洲市| 宁乡县| 蒙阴县| 息烽县| 博白县| 维西| 邯郸市|