• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    新高考志愿推薦算法研究

    2023-04-12 00:00:00王柏琦付立軍周曉磊高思達張永宏
    中國教育信息化 2023年4期

    摘 " 要:新高考政策的推行和逐步落實,使志愿填報由以往院校為主體且志愿可服從調劑、變?yōu)椤皩I(yè)+院?!苯M合更突出專業(yè)的模式。目前實行新高考的省份可填志愿數(shù)為80個、96個或112個,而且志愿間不再存在服從調劑選項。針對新高考志愿填報要求,以考生分數(shù)能否被院校專業(yè)錄取作為評價標準,結合專業(yè)類型、選科要求、院校屬性、學費等多維數(shù)據(jù),使用長短時記憶網(wǎng)絡算法,可以預測出該分數(shù)在當年錄取位次,再根據(jù)一定報考規(guī)則形成志愿填報方案。使用考生報考當年前3年的專業(yè)錄取位次和當年錄取位次作為輸入,得到當年考生被各專業(yè)的錄取概率,并基于該錄取概率為考生進行志愿推薦。在河北省2021年新高考中,使用該算法進行志愿填報實踐,結果表明:基于長短時記憶網(wǎng)絡的新高考預測算法,為新高考考生志愿填報提供了有效支持,既幫助其進行專業(yè)選擇,又能很好地發(fā)揮其考分的價值,做到科學填報。該研究可以為新高考考生個性化填報提供有益幫助,幫助實行新高考省份的學校對學生進行科學填報指導。

    關鍵詞:長短時記憶網(wǎng)絡;LSTM;志愿推薦;新高考;推薦算法

    中圖分類號:G434 " " " " 文獻標志碼:A " " " " 文章編號:1673-8454(2023)04-0112-09

    一、 引言

    2014 年,國務院印發(fā)《國務院關于深化考試招生制度改革的實施意見》。至此,中國高考開始進行改革,并進入新高考階段。新高考政策實施后,考生要填報的志愿數(shù)量急劇上升。例如,在2020、2021年分別首次采取新高考志愿填報的山東、河北兩個高考大省,考生最多可以填報96個志愿。

    新高考采取“專業(yè)+院校”組合的志愿模式,即“1個專業(yè)+1個院?!睘橐粋€志愿項,且平行志愿間不可調劑,在進行投檔時按照志愿順序依次進行。這種方法改變了傳統(tǒng)以“院校+多個該院校專業(yè)”,且專業(yè)間可選擇服從調劑的模式。這種以專業(yè)為牽引的志愿模式,有助于增強考生興趣能力與專業(yè)的匹配,從志愿填報角度來看,意味著對專業(yè)投檔線的預測需要更精準,并進行科學排序,才能既達到專業(yè)投檔線,又滿足學生的個性化需求。

    在新高考志愿填報時,還要根據(jù)考生選科的不同對專業(yè)進行篩查[1]。新高考采取自主選科的方式,即除語文、數(shù)學、外語三科外,學生根據(jù)各省的要求,在物理、化學、生物、地理、歷史、政治這6門課程中進行選擇。例如,山東省采取“3+3”模式、河北采取“3+1+2”模式,因此帶來了少則12種、多則20種的選科組合。高校的每個專業(yè)有對應的選科要求,不滿足選科要求的考生,在填報志愿時不能選擇該專業(yè)。因此,學生應按照與選科匹配的專業(yè)進行填報。

    而在劃取分數(shù)線的方法上,也有相應的變化。由于在專業(yè)志愿填報的模式下,無法面對所有專業(yè)統(tǒng)一劃定一條本科線和專科線,因此將本科、??品謹?shù)線改為劃分一段線、二段線。以山東省為例,在原有的政策下,沒有達到本科線是無法填報本科院校專業(yè)的;而在新的劃線辦法下,分數(shù)未達到一段線的考生,雖然不能參加第一次本科志愿填報,但是可以參與第二次、第三次志愿填報,選報剩余本科計劃以及填報??朴媱?。

    二、新高考志愿填報存在的問題

    高考政策的變化導致新高考志愿填報存在以下問題:一是新高考填報數(shù)量大幅增加,考生在選擇志愿時需要選擇大量院校和專業(yè);二是新高考是按照專業(yè)招生,考生沖擊某一個院校的難度會更加大,這樣能夠引導考生選擇自己喜歡的專業(yè);三是對于第一年執(zhí)行新高考的省份,一些院校的錄取分數(shù)會有較大的變動,給考生帶來較大的填報風險。

    為解決高考志愿填報的問題,于超等人基于大數(shù)據(jù)技術,使用支持向量機(Support Vector Machine, 簡稱SVM)、最近鄰集合、灰色關聯(lián)分析法等方法,通過對考生的一百一十道問答題目答案收集,找出考生答案的最近鄰集合,進而,通過支持向量機計算構建高考志愿填報模型,從而大大提高志愿推薦的準確性[2];余奎鋒等人提供了一個基于C均值模糊聚類分析法的多特征權重模糊均值聚類算法,該方法考慮了院校的歷年投檔線對應到省排位次、院校的社會影響力排序等各種因素,而這些因素均可能影響院校投檔線的變動,同時也充分考慮了考生個性化特征權重選取,利用C均值模糊聚類分析法,形成沖、穩(wěn)、保三種推薦結果,最后基于提出的算法,建立了一個能將分數(shù)最大化利用、并滿足個性化的志愿需求的高考志愿推薦系統(tǒng)[3];劉福偉等人運用人工智能等技術,使用BP神經(jīng)網(wǎng)絡模型,利用近三年院校專業(yè)的錄取分數(shù),預測當年院校專業(yè)的錄取位次,再通過測評得到考生的偏好信息,利用這些信息構造出考生的興趣特征向量表,運用基于考生的協(xié)同過濾推薦算法,對考生進行志愿推薦[4];王宏利等人進行了基于長短時記憶網(wǎng)絡(long short-term memory, 簡稱LSTM)的高校錄取分數(shù)預測研究,將LSTM與線差法、平均排位法進行對比,發(fā)現(xiàn)LSTM在進行高考分數(shù)預測時表現(xiàn)更好[5];魏然等人提出針對新高考模式的數(shù)據(jù)合并方案,以招生人數(shù)作為權重,將院校專業(yè)文理分科歷史數(shù)據(jù)合并,并利用線性回歸模型來預測專業(yè)錄取分數(shù)[6][7]。

    因此,針對上述新高考存在的問題,結合現(xiàn)有針對高考志愿填報的研究,本文提出一種基于LSTM的新高考志愿推薦方法,以解決考生無法準確利用分數(shù),以及無法準確選擇專業(yè)等問題。

    三、長短時記憶網(wǎng)絡特點分析

    SVM算法能夠解決基于超平面分類的二分類問題。在高考預測中,使用SVM算法區(qū)分能否被錄取則可以看為一個二分類問題[8]。LSTM是一種特殊類型的RNN,可以學習長期依賴信息,作為一種特殊存在的循環(huán)網(wǎng)絡結構,它能夠較好地處理神經(jīng)網(wǎng)絡中的長期依賴情況。

    與使用SVM、最近鄰集合、灰色關聯(lián)分析法等方法相比,獲取最近鄰集合需要人工標注大量數(shù)據(jù),工作量較大且依賴人工數(shù)據(jù)準確性?;疑P聯(lián)分析法具有主觀性強的特點,對各項指標的最優(yōu)值需要實時進行確定,而且一些指標難以確定最優(yōu)值。與聚類算法相比,使用LSTM模型進行位次預測時,對于同一年份數(shù)據(jù),只需要進行一次訓練,保存模型后可以重復預測,減少了訓練量。模型訓練時將學校位次與學生高考位次整合后映射為N維的向量,將兩位次的關系進行高維表示,計算時信息更加豐富。在位次預測問題中,位次與年份關聯(lián)較大,年份順序中包含位次變化趨勢等信息。LSTM擅長處理時序信息[9],相較于其他模型,更能捕捉到位次變化的時序信息[10],即變化趨勢。與其他模型相比,LSTM具有依賴數(shù)據(jù)量少、訓練簡便、泛化性好、捕捉時序信息能力強的優(yōu)勢,更適合被用于高考院校位次預測。

    上文中研究使用的數(shù)據(jù)集,多為第三方網(wǎng)站的數(shù)據(jù),數(shù)據(jù)來源并非第一手數(shù)據(jù),所以并不能保證數(shù)據(jù)的準確性。在創(chuàng)建預測模型時,引入多個對高校錄取投檔線有影響的參數(shù)。例如,院校歷史分數(shù)線、專業(yè)投檔線,以及各個專業(yè)錄取分數(shù)和對應的省排名;院校屬性以及院校的綜合實力等。但非官方數(shù)據(jù)集具有不準確性,會存在數(shù)據(jù)缺失或數(shù)據(jù)不準確的情況,導致預測算法的訓練不準確。因此,本文使用基于行為模擬的數(shù)據(jù)采集平臺,從省考試院以及各高校官方網(wǎng)站獲取數(shù)據(jù),并結合人工校驗來確保數(shù)據(jù)的準確性。

    目前,針對高考志愿推薦算法的研究大都針對傳統(tǒng)高考,相關算法的研究、預測的粒度基本在院校層級。新高考志愿填報更加注重引導考生選擇自己喜歡的專業(yè),因此對于志愿的推薦需進一步細化到專業(yè)層級。如果考生選擇的專業(yè)為熱門專業(yè)或高分專業(yè),單獨看某個院校的投檔線會導致意向專業(yè)無法被投檔,因此,需將志愿推薦的粒度細化到專業(yè)層級,這樣可以更加精準地為考生推薦出符合意向的志愿填報方案。

    四、數(shù)據(jù)采集與治理

    本研究使用山東和河北兩省的數(shù)據(jù)。數(shù)據(jù)均從省招生考試院以及各高校招生網(wǎng)站上獲?。徊捎米匝袛?shù)據(jù)采集和標注平臺,使用Selenium模擬考生行為批量采集官方數(shù)據(jù),并進行統(tǒng)一入庫處理。

    本研究構建出以下數(shù)據(jù)集:選科要求共75481條;一分一段表7858條;2018—2021年招生計劃,共計300366條;2017—2020年錄取分數(shù),共計198873條;全國各高校數(shù)據(jù)2942條,包含院校類型、院校等級(985、211、雙一流)、辦學性質等多個數(shù)據(jù)維度;專業(yè)分類等相關數(shù)據(jù)??倲?shù)據(jù)量近60萬條。

    (一)數(shù)據(jù)預處理

    1.歸一化處理

    本研究采集到的數(shù)據(jù)格式有PDF、圖片以及表格。以表格形式直接發(fā)布的數(shù)據(jù),可以直接入庫;以PDF格式發(fā)布的數(shù)據(jù)無法直接進行使用,可先使用識別工具IrfanView將PDF識別為圖片;以圖片形式發(fā)布的數(shù)據(jù)可以使用工具將多余的信息進行裁剪,只留核心數(shù)據(jù)。最后,使用OCR技術將帶有核心數(shù)據(jù)的圖片轉換為表格,再將所有數(shù)據(jù)歸一化處理為表格形式,以便有序使用。

    2.關鍵信息抽取

    招生考試院發(fā)布的招生計劃專業(yè)名后方帶有多種附加信息。其中,大類招生以及試驗班類的專業(yè)會標注包含哪些具體專業(yè);醫(yī)學、化學生物學等相關專業(yè)會限制不招色覺異常(含色盲、色弱)考生;中外合作辦學專業(yè),以及收費過高專業(yè)會進行標注;分校區(qū)的學校,招生專業(yè)會標注授課校區(qū);一些語言類相關的專業(yè),會限制考生的外語為英語或俄語等,且對于外語的分數(shù)會有要求;對于一些地方專項計劃,僅限于部分考生才能夠報考,也會進行標注。這些信息在推薦過程中,都會作為一個數(shù)據(jù)維度進行使用,因此,需要將這些附加信息從專業(yè)名中進行抽取標注,以方便后續(xù)利用這些數(shù)據(jù)進行推薦。

    3.數(shù)據(jù)合并

    全國高校的選科要求數(shù)據(jù)同樣來自各省的招生考試院,且選科要求根據(jù)不同省份的考試模式進行劃分。在“3+3”模式下,選科要求是直接給出的,而在“3+1+2”模式下,選科要求是按照首選要求和再選要求給出。各個高校根據(jù)招生省份的招生政策以及招生考試院提出的要求,向各省提交其針對該省招生計劃的選科要求。因此,需要將選科要求數(shù)據(jù)與招生計劃按照省份進行對應,保證后續(xù)推薦的所有志愿都滿足考生的選考科目。

    依據(jù)各省的政策情況對歷年錄取分數(shù)進行處理。對于剛執(zhí)行新高考的省份,歷史錄取分數(shù)是劃分文理科的,且因為文理科試卷不同、報考人數(shù)不同,歷史錄取分數(shù)及其位次,在文理科之間都有一定的差距。而新高考不區(qū)分文理科,因此需要將文理科的歷史錄取分數(shù)進行合并,進而預測出最新一年的錄取分數(shù)及位次。

    針對“3+3”以及“3+1+2”兩種選科模式,也要進行區(qū)分。以河北的“3+1+2”為例,由于考生需要在物理和歷史兩科中選考其中一科,且之前的理科專業(yè)一般都會限制選考物理,而文科專業(yè)一般都會限制選考歷史,因此對于這些專業(yè),可以直接使用過去幾年的文理科錄取分數(shù)進行預測。而對于選考物理和歷史均可的專業(yè),則需要對應到過去的文理科分數(shù)及位次進行合并。而對于“3+3”選科模式來說,需要將文理科分數(shù)及位次,以文理科考生的人數(shù)比例為權重,將過去歷年的錄取分數(shù)進行合并,最終預測出最新一年的錄取分數(shù)和錄取位次。

    此外,很多高校會采用大類招生,或通過文科、理科試驗班來進行招生,而在學生入學半年或一年后再進行細分專業(yè)。因此,對于剛剛執(zhí)行大類招生或者試驗班招生的專業(yè),一條招生計劃會對應多條歷史招生專業(yè)。這些專業(yè)的錄取分數(shù),需要以一對多的方式來對應,這樣進行大類招生以及試驗班招生專業(yè)的歷年分數(shù)才能夠準確。數(shù)據(jù)預處理后的結果如圖1、圖2所示。

    本研究在預測最新一年錄取分數(shù)及位次時,使用歷史三年的錄取分數(shù)數(shù)據(jù)。通過分析采集的歷史數(shù)據(jù)發(fā)現(xiàn),錄取分數(shù)存在大小年的情況,如果使用錄取分數(shù)作為預測數(shù)據(jù)的話,會不準確。鑒于一分一段表的考生總量整體平穩(wěn),因此先分別根據(jù)歷年的一分一段表,將錄取分數(shù)轉換為錄取位次。在數(shù)據(jù)年份跨度的選擇上,如果使用年份較少的話,可能會有一些專業(yè)的錄取結果存在偶然性,導致最終的預測結果不夠準確。由于高考數(shù)據(jù)具有時效性,具體專業(yè)的錄取分數(shù)會隨著教學水平、教育水平以及相關行業(yè)發(fā)展的情況有對應變化,所以如果使用比較久遠的歷史數(shù)據(jù),會導致預測結果的時效性難以保證,進而也不夠準確。綜上情況分析,本研究在參考一些歷史填報經(jīng)驗以及相關統(tǒng)計結果的基礎上,最終使用三年、兩年、一年前的錄取分數(shù),以1∶2∶3的比例作為權重,將三年的歷史分數(shù)取加權平均值,將平均值作為最新一年的預測的錄取分數(shù)及位次。

    五、算法設計與實驗

    新高考的志愿清單由100個左右院校專業(yè)組成,且院校數(shù)量和專業(yè)數(shù)量都沒有限制,即考生可以每個志愿都填報不同院校、不同專業(yè);或院校很少,而每個院校都填報很多專業(yè)。傳統(tǒng)高考中,考生如果想填報某個學校,可以僅關注院校的最低分,同意專業(yè)調劑,則可以被錄取到該學校;而新高考專業(yè)不能夠調劑,因此需要細化到專業(yè)分數(shù)的預測。

    本研究的專業(yè)推薦算法分為召回和排序兩個部分。根據(jù)山東和河北兩省的新高考政策,最終填報時需要填寫96個專業(yè)志愿,因此專業(yè)推薦算法的目標就是得出一個包含96個專業(yè)的志愿填報清單。

    1.召回

    在召回階段,首先根據(jù)考生的分數(shù)和位次,得出一個位次范圍,預測位次在此范圍內的招生計劃,該考生都有一定的概率能夠錄取。若高于這個范圍,則考生錄取概率過低,會浪費志愿,而如果低于這個范圍,則會導致浪費分數(shù)。位次范圍的確定,也需要根據(jù)分數(shù)、位次的高低進行調整。通過分析歷年發(fā)布的一分一段表可以得出:對于高分段,每一分的考生分布較少,考生相差一分所帶來的位次變化也相對較小,因此,高分段在確定位次范圍時,上下限對應的分數(shù)差會較大;對于中低分段的考生,一分的分差會帶來近千人的位次差距,因此在確定位次范圍時,上下限對應的分數(shù)差也會較小。

    在得到位次范圍后,則從預測位次在此范圍內的招生計劃中,根據(jù)考生的條件進行篩選。篩選條件包括考生選考科目、考生專業(yè)意向、院校意向、省份意向、學費高低等。以上工作可以得到一個基礎的專業(yè)推薦池。

    2.專業(yè)相關性推薦

    以上根據(jù)考生意向推薦出來的專業(yè),在新高考中可能會導致專業(yè)數(shù)量不足96個,因此需要根據(jù)專業(yè)相關性為學生推薦出更多的專業(yè)。

    一方面,本研究從語義分析的角度,得出各個學科的相關專業(yè)。此外,根據(jù)國家頒布的《學位授予和人才培養(yǎng)學科目錄》,本研究根據(jù)考生的意向專業(yè),會推薦出與意向專業(yè)同屬一個一級學科的二級學科。以表1中的一級學科哲學為例,若考生的意向專業(yè)中包含中國哲學,則會為其推薦馬克思主義哲學、外國哲學等同屬哲學(一級學科)的專業(yè)。

    另一方面,本研究依據(jù)各個專業(yè)的授課教程,以及專業(yè)的就業(yè)崗位,將授課教程相似、就業(yè)崗位相似的專業(yè)定義為相似專業(yè)。還可以根據(jù)相似專業(yè),為考生推薦更多專業(yè)。表2為進行專業(yè)相關性推薦后得出的專業(yè)相關性示例。

    以上專業(yè)相關性推薦,僅限于考生意向較少,或考生所處分數(shù)段招生專業(yè)較少,導致僅根據(jù)考生意向無法推薦出96個志愿,則會根據(jù)專業(yè)相關性為考生推薦更多專業(yè),保證能夠推薦96個志愿,方便考生進行志愿填報。

    3.排序

    排序階段需要訓練LSTM模型[11]。首先將2020年的錄取專業(yè)進行數(shù)據(jù)制作,對于每個專業(yè)的錄取位次,分別向上向下以位次的2%為間隔,作為學生當年位次,并將錄取標簽標注,能錄取為1,不能錄取為0,將每條錄取專業(yè)擴展成10條訓練數(shù)據(jù)。2017—2019年的錄取位次數(shù)據(jù),用學生位次/專業(yè)位次;2020年的錄取位次數(shù)據(jù),用專業(yè)位次/學生位次。最終形成的X為n*4*1的三維數(shù)據(jù)。而錄取標簽形成的Y為n*1的2維數(shù)據(jù)。將X、Y放入LSTM模型中,并劃分訓練集/驗證集為4∶1進行訓練。

    訓練完成后,使用LSTM模型[12]進行考生錄取概率預測,模型如圖3所示。pass_input的輸入為2018—2020年的專業(yè)錄取位次,分別為考生當年的位次/歷史錄取位次;curr_input的輸入為當年預測位次/學生當年位次。通過LSTM進行計算,并將最后一個LSTM單元的隱藏層輸出,得到近三年院校錄取位次的100維特征向量;通過Dense全連接層,將學生位次表示(近三年院校平均位次/學生位次)映射為100維的特征向量。Subtract層將兩個n*100的向量相減,并最終通過Dense層將n*100的數(shù)據(jù)映射為n*1的數(shù)據(jù)。Dense層的輸出表示考生當年位次與預測位次的差距,將所得的位次差距輸入sigmoid函數(shù)。

    之后,使用Sigmoid函數(shù),將學生位次與專業(yè)位次的差距,映射為0-1之間的數(shù)值,也就是最終給出的錄取概率,數(shù)值越接近1表示被錄取的概率越大,越接近0表示被錄取的概率越小。

    以考生為50000名為例,最終對于不同專業(yè)位次的錄取概率進行預測??梢园l(fā)現(xiàn),專業(yè)位次越大(分數(shù)越低),考生的錄取率越高;專業(yè)位次越?。ǚ謹?shù)越高),考生錄取概率越低。而在50000名附近,錄取概率在50%左右。

    六、實踐驗證

    依據(jù)基于LSTM的推薦算法,本研究建設實現(xiàn)了一套志愿填報平臺[13],并在河北省進行填報實踐驗證??忌M行志愿填報的最終結果如表3所示。

    通過分析全部真實填報案例,錄取專業(yè)在志愿表單中的位置分布較為平均,且最大值為75,所有考生都被成功錄取。雖有個別同學按照意愿調整了部分志愿,但都根據(jù)系統(tǒng)所推薦出的志愿清單進行優(yōu)化。

    將該算法真正投入使用,從真實使用結果,可以得出該算法的可行性以及優(yōu)勢,以便于后續(xù)的優(yōu)化。

    七、結論與展望

    研究和實踐顯示,本研究的方法為新高考考生的志愿填報提供了有效支持,既幫助其進行專業(yè)選擇,又能很好地發(fā)揮其考分的價值,達到了科學填報的目的。

    后續(xù)工作中,針對不同考生對填報風險策略及錄取風險的需求不同,系統(tǒng)可以在現(xiàn)有基礎上,對更多條件進行篩選,包括健康狀況、外語語種的選擇、院校與考生家庭之間的距離等多種條件,針對不同的填報需求,給出不同的志愿清單,使其更加智能化。

    參考文獻:

    [1]劉海峰.高考改革新方案的頂層設計與實踐推進[J].中國教育學刊,2019(6):1-5.

    [2]于超,劉國柱.基于大數(shù)據(jù)分析的高考志愿填報算法[J].青島科技大學學報(自然科學版),2020,41(2):113-118.

    [3]余奎鋒,段桂華,時翔.基于多特征權重模糊聚類的高考志愿推薦算法[J].中南大學學報(自然科學版),2020,51(12):3418-3429.

    [4]劉福偉.高考志愿智能填報系統(tǒng)設計與實現(xiàn)[D].杭州:浙江理工大學,2020.

    [5]王宏利,邊帥,孫全亮,等.基于LSTM的高校高考錄取分數(shù)預測研究[J].經(jīng)濟師,2020(2):160-162.

    [6]邊帥,王宏利,呂震宇,等.基于異常剔除平均排位法的高校錄取分預測[J].經(jīng)濟師,2019(11):179-180,182.

    [7]魏然,孫全亮,呂震宇.新高考“6選3”模式下預測高校錄取分數(shù)的方法[J].現(xiàn)代信息科技,2021,5(2):188-190,195.

    [8]金秀玲,卓艷如.基于遺傳算法和支持向量機模型的高考成績預測[J].河南工程學院學報(自然科學版),2020,32(2):62-65.

    [9]HOCHREITER S, SCHMIDHUBER J. Long Short-Term memory[J]. Neural Computation, 1997,9(8):1735-1780.

    [10]白盛楠,申曉留.基于LSTM循環(huán)神經(jīng)網(wǎng)絡的PM_(2.5)預測[J].計算機應用與軟件,2019,36(1):67-70,104.

    [11]HUANG L, WANG D, LIU X, et al. Double LSTM structure for network traffic flow prediction[C]. ICPCSEE Steering Committee.Abstracts of the 6th International Conference of Pioneering Computer Scientists,Engineers and Educators(ICPCSEE 2020)Part I, 2020.9.

    [12]LI Y R. Data prediction model in wireless sensor networks based on bidirectional LSTM[J]. Eurasip Journal on Wireless Communications and Networking, 2019(1):1-12.

    [13]李順,林建棟,楊明霞.高考改革環(huán)境下志愿填報平臺的新設計構想[J].信息系統(tǒng)工程, 2018(10):11-16.

    Algorithm for New College Entrance Examination Volunteer Recommendation

    Baiqi WANG1,2, Lijun FU1,3, Xiaolei ZHOU1,2, Sida GAO1,2, Yonghong ZHANG3

    (1.Shenyang Insitute of Computing Technology, Chinese Academy of Science, Shenyang 110168, Liaoning;

    2.University of Chinese Academy of Science, Beijing 100049;

    3.Artificial Intelligence and Cognitive Intelligence Laboratory, Shan Dong University, Jinan 250100, Shandong)

    Abstract: The introduction and gradual implementation of the new college entrance examination policy has changed the pattern of “major + college” into one where the major is more prominent, instead of the former one that colleges are the main body and the voluntary application is subject to adjustment. In provinces where the new college entrance examination is currently implemented, the number of applicants for the new college entrance exam is 96 or 112 , and there is no longer need to be subject to adjustment. Based on the new college entrance examination volunteer reporting, the article uses the candidates’ scores as the evaluation criteria to be admitted to the major of the college. Combined with multi-dimensional data such as major types, subject selection requirements, college attributes, tuition fees, etc., the long Short-Term Memory (LSTM) algorithm is used to predict the results. The score is in the admission ranking of the year, and then a volunteer reporting plan is formed according to certain application rules. The article uses the admission ranking of majors in the past three years and the admission ranking of candidates in the current year as input to obtain the admission probability of candidates for each major in the current year, and based on the admission probability, it makes volunteer recommendations for candidates. In the new college entrance examination in Hebei Province in 2021, this algorithm was used for volunteer reporting. The practical results showed that the new college entrance examination prediction algorithm based on LSTM performed well in the field. The research can not only provide useful help for students’ personalized application, but also help schools provide scientific guidance for students of the new college entrance examination candidates.

    Keywords: Long short-term memory; Volunteer recommendation; New college entrance examination; Recommendation algorithm

    編輯:王曉明 "校對:李曉萍

    DOI: 10.3969/j.issn.1673-8454.2023.04.014

    作者簡介:王柏琦,中國科學院大學沈陽計算技術研究所碩士研究生(遼寧沈陽 110168); 付立軍,通訊作者,山東大學大數(shù)據(jù)技術與認知智能實驗室主任,中國科學院沈陽計算技術研究所研究員(山東濟南 250100);周曉磊,中國科學院大學沈陽計算技術研究所研究員(遼寧沈陽 110168); 高思達,中國科學院大學沈陽計算技術研究所碩士研究生(遼寧沈陽 110168);張永宏,山東大學大數(shù)據(jù)技術與認知智能實驗室工程師(山東濟南 250100)

    抚松县| 靖边县| 平阴县| 鄱阳县| 民丰县| 济源市| 金寨县| 阿拉善左旗| 邵阳县| 平顺县| 基隆市| 峨眉山市| 延寿县| 宁国市| 临猗县| 哈尔滨市| 瓮安县| 进贤县| 荔波县| 信丰县| 绩溪县| 屏山县| 栾川县| 钦州市| 六安市| 双柏县| 礼泉县| 同德县| 融水| 江门市| 沙湾县| 朔州市| 凉山| 蓬溪县| 沽源县| 金昌市| 江门市| 海宁市| 仪陇县| 繁峙县| 深水埗区|