葛曉濱
(安徽財(cái)貿(mào)職業(yè)學(xué)院雪巖貿(mào)易學(xué)院,安徽 合肥 230601)
目前,全球?qū)W術(shù)界對用戶畫像有各不相同的定義。北京郵電大學(xué)經(jīng)濟(jì)管理學(xué)院亓叢、吳俊[1]提出了用戶畫像方法、工具,比較互聯(lián)網(wǎng)領(lǐng)域用戶畫像的主要應(yīng)用場景、常用畫像方法;中國科學(xué)技術(shù)大學(xué)郭光明[2]基于社交網(wǎng)絡(luò)理論對用戶行為模式進(jìn)行研究;中國科學(xué)技術(shù)大學(xué)馬超[3]提出:用戶畫像是推斷用戶特征的過程、手段和方法,他采用精確的標(biāo)簽對基于用戶個(gè)性化信息實(shí)現(xiàn)一系列實(shí)際應(yīng)用;武昌理工學(xué)院周鮮子[4]在大數(shù)據(jù)背景下,從用戶畫像建模技術(shù)出發(fā),分析了電商在大數(shù)據(jù)下是如何構(gòu)建用戶畫像的技術(shù);浙江大學(xué)楊潔[5]將研究中心聚焦在全景用戶畫像和模型預(yù)測上,實(shí)現(xiàn)企業(yè)的精細(xì)化運(yùn)營。桂林理工大學(xué)姜建武等[6]在大數(shù)據(jù)理論基礎(chǔ)上提出了一種基于用戶畫像的智能信息推送方法;云南電信大數(shù)據(jù)運(yùn)營中心劉光榕、任建濤[7]根據(jù)用戶訪問網(wǎng)絡(luò)偏好,形成了豐富的用戶網(wǎng)絡(luò)標(biāo)簽和畫像,利用用戶畫像對用戶進(jìn)行分類;成都信息工程大學(xué)統(tǒng)計(jì)學(xué)院曾鴻、吳蘇倪[8]構(gòu)建用戶畫像模型,描述企業(yè)用戶群體行為特征,實(shí)現(xiàn)精準(zhǔn)營銷;首都經(jīng)濟(jì)貿(mào)易大學(xué)李映坤[9]從用戶畫像的用戶屬性、用戶流失、用戶行為三個(gè)主要方面進(jìn)行了研究。
綜合以上的研究成果,本文在傳統(tǒng)用戶畫像的基礎(chǔ)上,以高等職業(yè)教育的學(xué)生為對象進(jìn)行用戶畫像技術(shù)的研究,旨在通過這種畫像技術(shù)的研究,做到精準(zhǔn)的學(xué)情分析,提升于高校學(xué)生管理工作的水平和精準(zhǔn)度。
學(xué)生的用戶畫像是通過系統(tǒng)地收集與分析學(xué)生的學(xué)習(xí)、生活、消費(fèi)行為等主要信息數(shù)據(jù),抽象出該學(xué)生在某個(gè)特定領(lǐng)域中的全貌。從而有助于學(xué)校管理者通過學(xué)生的用戶畫像識別和判斷學(xué)生在這個(gè)特定領(lǐng)域中的潛在或明確的特質(zhì)。
學(xué)生的用戶畫像一般是采用高校數(shù)據(jù)中心提供的標(biāo)準(zhǔn)化行為與內(nèi)容數(shù)據(jù),這些數(shù)據(jù)包括學(xué)生課程成績、教師的平時(shí)考評、圖書借閱情況、輔導(dǎo)員考評、校園一卡通消費(fèi)等數(shù)據(jù),運(yùn)用大數(shù)據(jù)分析手段,量化學(xué)生在規(guī)律性、努力程度、學(xué)習(xí)技能、經(jīng)濟(jì)狀況、社交關(guān)系等多維度的特性,揭示學(xué)生成長軌跡,基于預(yù)測模型對學(xué)生的學(xué)業(yè)成績、就業(yè)傾向、心理狀況等進(jìn)行預(yù)測,為學(xué)校對學(xué)生進(jìn)行個(gè)性化與精準(zhǔn)化的教育管理與引導(dǎo)提供重要依據(jù)。
通常,一個(gè)學(xué)生基礎(chǔ)知識的掌握好壞可以影響到學(xué)生在相關(guān)課程中的成績。在學(xué)生畫像技術(shù)的實(shí)現(xiàn)上,我們借助高校數(shù)據(jù)中心整合的學(xué)生信息,基于矩陣分解的降維技術(shù),可以分析出學(xué)生對具體基礎(chǔ)知識的掌握程度,并獲得每門課程所含有的知識體系。基于這些信息,通過學(xué)生畫像不僅可以預(yù)測出每個(gè)學(xué)生在其他課程的得分,也可以預(yù)測出這個(gè)學(xué)生在其他課程的掛科可能性,而且為教師在課程教學(xué)中有針對性進(jìn)行課程教學(xué)的調(diào)整提供了依據(jù)。
在學(xué)生畫像的算法上,以學(xué)生學(xué)習(xí)成績畫像為例,我們采用的設(shè)計(jì)思想是通過分析課程之間在知識體系上的相關(guān)性來進(jìn)行相關(guān)的預(yù)測。比如某學(xué)生在以往課程中學(xué)習(xí)的科目Ⅰ成績不好,那么當(dāng)他在修讀科目Ⅰ的延伸課程科目Ⅱ的時(shí)候,預(yù)警系統(tǒng)就會預(yù)警該學(xué)生的掛科可能性比較大,提示教育者及早發(fā)現(xiàn)問題并進(jìn)行干預(yù),盡可能避免掛科問題。因而,掛科預(yù)警實(shí)現(xiàn)了從后置性應(yīng)急管理轉(zhuǎn)變?yōu)榍爸眯灶A(yù)警引導(dǎo)。在現(xiàn)實(shí)運(yùn)作過程中,由于課程成績數(shù)據(jù)更新頻率低,掛科預(yù)警無法實(shí)時(shí)更新預(yù)測結(jié)果。為此,我們輔助疊加學(xué)生學(xué)習(xí)努力程度因子、生活行為習(xí)慣因子等,提升學(xué)生畫像系統(tǒng)的實(shí)時(shí)性。學(xué)生在校園內(nèi)的行為習(xí)慣的變化是可以實(shí)時(shí)監(jiān)測的,對于預(yù)測成績的變化非常有價(jià)值,在學(xué)生學(xué)習(xí)努力程度因子上我們以到課率、晚自習(xí)率、出入圖書館的次數(shù)度量等度量;在生活行為習(xí)慣因子上,我們以生活規(guī)律性(包括學(xué)生出入宿舍、吃早飯、洗澡等行為習(xí)慣數(shù)據(jù))、在教學(xué)樓打水次數(shù)等對學(xué)生進(jìn)行刻畫學(xué)生努力程度。最后,我們基于努力程度、生活規(guī)律性、基礎(chǔ)知識以及興趣愛好這些特性,設(shè)計(jì)多任務(wù)遷移學(xué)習(xí)算法來對學(xué)生未來成績進(jìn)行預(yù)測。該算法不僅通過多任務(wù)特性考慮了特征相關(guān)性在學(xué)院之間的差異性,而且還通過遷移學(xué)習(xí)特點(diǎn)考慮了不同學(xué)期之間相關(guān)性的變化。得出學(xué)生的成績預(yù)測分析,能很好地反映出學(xué)生成績的未來走勢。
學(xué)生畫像的基礎(chǔ)在于標(biāo)簽的構(gòu)建。標(biāo)簽應(yīng)是對學(xué)生的高度精煉的特征標(biāo)識。根據(jù)高校學(xué)生的特質(zhì),我們在標(biāo)簽的設(shè)計(jì)思路可以分別采用基本標(biāo)簽和擴(kuò)展標(biāo)簽?;緲?biāo)簽是對學(xué)生基本情況和特征的描述,包括學(xué)生的基礎(chǔ)特征、學(xué)習(xí)特征、生活特征、環(huán)境特征等;擴(kuò)展標(biāo)簽在基本標(biāo)簽基礎(chǔ)上建立的學(xué)生深層次特征的描述標(biāo)簽,包括偏好、思維、愛好、行為、人際交往等。這些標(biāo)簽可以再進(jìn)行一定程度的細(xì)分,形成多級標(biāo)簽。如表1和表2所示。
表1 學(xué)生畫像的數(shù)據(jù)化基本標(biāo)簽
表2 學(xué)生畫像的數(shù)據(jù)化擴(kuò)展標(biāo)簽
在標(biāo)簽化的基礎(chǔ)上,我們實(shí)現(xiàn)對學(xué)生的用戶畫像技術(shù)的實(shí)施,按照用戶畫像的常規(guī)方法,我們通過原始數(shù)據(jù)采集、標(biāo)準(zhǔn)化清洗、建立數(shù)據(jù)模型和算法、數(shù)據(jù)運(yùn)算分析、可視化呈現(xiàn)等步驟實(shí)現(xiàn)對學(xué)生的畫像。主要的技術(shù)流程如圖1所示。
圖1 學(xué)生畫像的技術(shù)主要流程
第一步:原始數(shù)據(jù)采集
依托數(shù)字校園的基礎(chǔ),通過物聯(lián)網(wǎng)和大數(shù)據(jù)系統(tǒng),我們可以獲得豐富的學(xué)生數(shù)據(jù)資源,這些數(shù)據(jù)是構(gòu)建學(xué)生畫像的核心依據(jù)。我們在這些原始數(shù)據(jù)的基礎(chǔ)上,采用標(biāo)簽分類技術(shù),依據(jù)畫像的需要,對數(shù)據(jù)進(jìn)行分類篩選。(如圖2)
數(shù)字校園
圖2 原始數(shù)據(jù)采集
第二步:標(biāo)準(zhǔn)化清洗
在標(biāo)簽化的數(shù)據(jù)源中,因?yàn)閿?shù)據(jù)采集的環(huán)境或其他各種原因,會導(dǎo)致一部分無用、冗余、異常等狀況的“雜質(zhì)”數(shù)據(jù)源,比如成績?nèi)笔?、性別缺失,年齡異常等雜質(zhì)數(shù)據(jù),需要采用一定的數(shù)據(jù)規(guī)則通過計(jì)算機(jī)或計(jì)算機(jī)輔助人工進(jìn)行篩選,將符合學(xué)生實(shí)際情況的數(shù)據(jù)留存,剔除那些無用、冗余、異常等狀況的雜質(zhì)數(shù)據(jù),這就是標(biāo)準(zhǔn)化清洗。
第三步:數(shù)據(jù)模型和算法
在獲取到較為可靠的數(shù)據(jù)源基礎(chǔ)上,根據(jù)學(xué)生畫像的目標(biāo),對數(shù)據(jù)建立加工模型,采用具備優(yōu)化能力的算法,提煉出學(xué)生畫像的關(guān)鍵要素,實(shí)現(xiàn)對數(shù)據(jù)的可操作性。
對學(xué)生的畫像進(jìn)行刻畫的常見方法有多種:(1)普通的統(tǒng)計(jì)法;(2)貝葉斯網(wǎng)絡(luò)法;(3)神經(jīng)網(wǎng)絡(luò)法;(4)主題模型法;(5)數(shù)據(jù)挖掘的聚類分析法等。
鑒于用戶畫像的表示方式、關(guān)注點(diǎn)各不相同,用戶畫像建模方法可分為以下幾大類,即面向用戶行為的用戶畫像模型、基于本體的用戶畫像模型、融合用戶興趣的畫像模型等。
在學(xué)生用戶畫像的數(shù)據(jù)模型和算法上:
(1)利用校園一卡通和學(xué)生本體屬性的模型來預(yù)測經(jīng)濟(jì)困難學(xué)生的狀況,也可以作為學(xué)生行為畫像的重要數(shù)據(jù)來源;
(2)利用圖書館管理系統(tǒng)的信息統(tǒng)計(jì)學(xué)生的閱讀時(shí)間和訪問行為等來構(gòu)建了學(xué)生閱讀行為畫像和檔案信息,同時(shí)基于學(xué)生閱讀行為畫像可以用來預(yù)測學(xué)生的學(xué)習(xí)情況和成績等;
(3)通過收集學(xué)生的行為歷史數(shù)據(jù),包括圖書館借閱信息,學(xué)生以前歷史成績信息、以及通過課程歷史成績信息確定難易程度等,來進(jìn)行多元回歸分析,構(gòu)建了一個(gè)貝葉斯網(wǎng)絡(luò)模型,預(yù)測學(xué)生在某門課程的能否通過概率;
(4)利用校園網(wǎng)門戶網(wǎng)站的數(shù)據(jù)信息分析學(xué)生活動規(guī)律、興趣偏好等幾方面信息構(gòu)建學(xué)生狀態(tài)畫像。
第四步:數(shù)據(jù)運(yùn)算分析
在數(shù)據(jù)模型基礎(chǔ)上,依據(jù)學(xué)生的標(biāo)簽,從基本標(biāo)簽和擴(kuò)展標(biāo)簽兩個(gè)方面進(jìn)行運(yùn)算分析,得出學(xué)生畫像的基態(tài)數(shù)據(jù)。
第五步:可視化呈現(xiàn)
在學(xué)生畫像的基態(tài)數(shù)據(jù)基礎(chǔ)上,需要采用直觀的方式,呈現(xiàn)目標(biāo)結(jié)果。包括應(yīng)用各種圖形(餅圖、柱狀圖、點(diǎn)狀圖)以及原態(tài)標(biāo)注畫像直觀地呈現(xiàn)學(xué)生畫像效果。
在這個(gè)技術(shù)流程環(huán)節(jié)中,主要的技術(shù)核心在于學(xué)生基礎(chǔ)信息收集、學(xué)生行為建模、學(xué)生畫像三個(gè)步驟,如圖3所示。
圖3 學(xué)生畫像的主要技術(shù)環(huán)節(jié)
對學(xué)生用戶畫像的技術(shù)實(shí)踐,需要結(jié)合學(xué)校管理的實(shí)際需求,分析出與需求關(guān)聯(lián)的學(xué)生數(shù)據(jù)實(shí)體,以數(shù)據(jù)實(shí)體為中心規(guī)約數(shù)據(jù)維度類型和關(guān)聯(lián)關(guān)系,形成符合學(xué)校管理實(shí)際需要的建模體系。在維度分解上,需要以學(xué)生、課程等數(shù)據(jù)實(shí)體為中心,進(jìn)行數(shù)據(jù)維度分解和列舉。根據(jù)相關(guān)性原則,選取和學(xué)生畫像目的需求相關(guān)的數(shù)據(jù)維度,避免產(chǎn)生過多無用數(shù)據(jù)干擾分析過程。在數(shù)據(jù)源的獲取以及數(shù)據(jù)整理上,學(xué)生畫像的數(shù)據(jù)來源于學(xué)校的數(shù)據(jù)系統(tǒng)日常積累的各類數(shù)據(jù)系統(tǒng),技術(shù)上一般通過Sqoop導(dǎo)入HDFS,也可以用代碼來實(shí)現(xiàn),比如Spark的JDBC連接校園數(shù)據(jù)庫進(jìn)行數(shù)據(jù)的Cache。還有一種方式,可以通過將數(shù)據(jù)寫入本地文件,然后通過Spark SQL的Load或者Hive的Export等方式導(dǎo)入 HDFS。通過Hive編寫UDF或者HiveQL根據(jù)業(yè)務(wù)邏輯拼接ETL,使用戶對應(yīng)上不同的用戶標(biāo)簽數(shù)據(jù),生成相應(yīng)的源表數(shù)據(jù),以便于后續(xù)用戶畫像系統(tǒng),通過不同的規(guī)則進(jìn)行標(biāo)簽的生成。在學(xué)生畫像計(jì)算的框架上,一般選用Spark以及RHadoop進(jìn)行,Spark的用途一是對于數(shù)據(jù)處理與上層應(yīng)用所指定的規(guī)則的數(shù)據(jù)篩選過濾;另一個(gè)是服務(wù)于上層應(yīng)用的Spark SQL。RHadoop的應(yīng)用主要是利用協(xié)同過濾算法等各種推薦算法對數(shù)據(jù)進(jìn)行各方面評分。
下面通過兩個(gè)由表及里的代表性技術(shù)實(shí)例研究,說明學(xué)生畫像的技術(shù)實(shí)現(xiàn)。限于篇幅,本文不對標(biāo)簽技術(shù)及數(shù)據(jù)呈現(xiàn)技術(shù)做深入探討。
以某校的學(xué)生畫像為例,首先對相關(guān)數(shù)據(jù)源中的數(shù)據(jù)信息進(jìn)行收集整理,主要來自于下面表3中的數(shù)據(jù)庫系統(tǒng)。這些數(shù)據(jù)庫系統(tǒng)中的信息,我們側(cè)重點(diǎn)在于通過數(shù)據(jù)分析研究得出學(xué)生畫像。
表3 來自校園內(nèi)部不同系統(tǒng)的原始數(shù)據(jù)量
根據(jù)原始數(shù)據(jù),我們對學(xué)生畫像定義的標(biāo)簽信息包括:學(xué)生基本信息、學(xué)習(xí)用功度、成績狀況、生活規(guī)律性、興趣愛好等畫像的信息,如圖4所示。
圖4 學(xué)生張軍的畫像信息
這些信息的具體表達(dá)如下:
學(xué)生基本信息:姓名、性別、年齡、……;
學(xué)習(xí)用功度:刻苦、一般、懶散;
成績狀況:優(yōu)秀、良好、一般、差;
生活規(guī)律性:早起早睡、晚睡晚起、正常規(guī)律、沒有規(guī)律;
興趣愛好:科技、運(yùn)動、文藝、娛樂、時(shí)尚、游戲、旅游、音樂、其它。
畫像流程:
1、從教務(wù)數(shù)據(jù)庫中獲取基本信息標(biāo)簽。這個(gè)標(biāo)簽的信息不需要太復(fù)雜的操作或計(jì)算,只是簡單直接提取相關(guān)信息。
2、從圖書管理系統(tǒng)中獲取用功度信息。用功度信息一般是主觀性比較大的信息,我們從學(xué)生停留在圖書館學(xué)習(xí)的時(shí)間、借閱上課相關(guān)書籍的次數(shù)和人為問卷(輔導(dǎo)員或第三者填寫問卷)等數(shù)據(jù)進(jìn)行評價(jià)。
3、從網(wǎng)絡(luò)中心系統(tǒng)和校園卡的用餐信息中獲取生活規(guī)律性信息。規(guī)律性的四類信息:早起早睡、晚睡晚起、正常規(guī)律、沒有規(guī)律(其它三項(xiàng)中的時(shí)間段占比不超過60%),如表4分析。
表4 生活規(guī)律性標(biāo)簽信息
4、從教務(wù)數(shù)據(jù)庫中獲取學(xué)生學(xué)習(xí)成績狀況信息。通過學(xué)生過去學(xué)習(xí)過的課程考試成績和學(xué)分績點(diǎn)來判斷學(xué)生的成績狀況。
5、從圖書管理系統(tǒng)和網(wǎng)絡(luò)中心系統(tǒng)中獲取學(xué)生的興趣愛好信息。提取比率最高的相關(guān)興趣關(guān)鍵詞共八大類:科技、運(yùn)動、文藝、娛樂、時(shí)尚、游戲、旅游、音樂、其它。
對上述信息整合,可以生成學(xué)生初步狀態(tài)信息畫像。
學(xué)生成績與多重要素相關(guān),從數(shù)字校園可以獲取多種學(xué)生的數(shù)據(jù)。在具體的處理環(huán)節(jié)上,我們一般把這些數(shù)據(jù)劃分直接相關(guān)數(shù)據(jù)和間接相關(guān)數(shù)據(jù)。
直接相關(guān)數(shù)據(jù)是學(xué)生直接的學(xué)習(xí)狀態(tài)數(shù)據(jù),包括學(xué)生學(xué)習(xí)狀態(tài)、以往的考試成績、對基礎(chǔ)知識掌握程度等。學(xué)生畫像技術(shù)可以借助以往課程成績信息,分析學(xué)生對具體基礎(chǔ)知識的掌握程度?;谶@些信息,可以預(yù)測每個(gè)學(xué)生在課程中掛科的可能性。
間接相關(guān)數(shù)據(jù)是學(xué)生的學(xué)習(xí)和生活狀態(tài)數(shù)據(jù)。教育學(xué)者普遍認(rèn)為,良好的行為習(xí)慣與學(xué)習(xí)成績是呈正相關(guān)的。通過采集學(xué)生在校內(nèi)行為,并將這些行為轉(zhuǎn)化為可存儲量化的標(biāo)簽化數(shù)據(jù),這些行為數(shù)據(jù)包括:學(xué)生就寢時(shí)間、就餐規(guī)律性、校園購物頻次及金額、打水規(guī)律、圖書館進(jìn)出頻次和停留時(shí)間、圖書借閱數(shù)量和閱讀時(shí)間、宿舍門禁進(jìn)出規(guī)律等。我們對這些數(shù)據(jù)分析就能發(fā)現(xiàn),學(xué)習(xí)好的學(xué)生與一般學(xué)生在學(xué)習(xí)生活軌跡上有明顯的不同。
通過貝葉斯網(wǎng)絡(luò)構(gòu)建的學(xué)生成績預(yù)警模型,依據(jù)直接相關(guān)數(shù)據(jù)和間接相關(guān)數(shù)據(jù),可以預(yù)警學(xué)習(xí)狀態(tài)不佳,或者個(gè)體的自律與自控能力較差的學(xué)生。學(xué)??梢杂嗅槍π缘蒯槍@些學(xué)生進(jìn)行輔導(dǎo)和溝通,以提高學(xué)生的成績。圖5是數(shù)據(jù)結(jié)構(gòu)課程成績預(yù)測模型的貝葉斯網(wǎng)絡(luò)圖。
圖5 數(shù)據(jù)結(jié)構(gòu)課程成績預(yù)測模型的貝葉斯網(wǎng)絡(luò)圖
利用貝葉斯網(wǎng)絡(luò),可以進(jìn)行推理,對學(xué)生成績預(yù)警。在貝葉斯網(wǎng)絡(luò)中,根據(jù)常見的變量定義,分為:
●證據(jù)變量集E={E1,E2,…,Em}— 特定事件e
●查詢變量X
●非證據(jù)變量集—Y隱變量(Hidden variable)={Y1,Y2,…,Yn}
●全部變量的集合U={x}∪E∪Y
貝葉斯推理即在一組證據(jù)變量Ei∈E={E1,E2,…,Em}時(shí),推理計(jì)算查詢變量的后驗(yàn)概率(條件概率)分布。即計(jì)算在特定事跡e給點(diǎn)的時(shí)候,X的后驗(yàn)概率(即條件概率)分布 P(X∣e)。
在本例的貝葉斯網(wǎng)絡(luò)中,我們首先統(tǒng)計(jì)計(jì)算出借閱圖書相關(guān)性BR、學(xué)習(xí)用功度LH的數(shù)據(jù)信息,而先導(dǎo)課程成績OBP和學(xué)習(xí)成績狀況L則從學(xué)生個(gè)人畫像標(biāo)簽中直接獲得數(shù)據(jù)信息。那么根據(jù)貝葉斯定理有:
P(CP|BR,LH,OBP,L)*[P(BR)*P(LH)*P(OBP)*P(L)]
=P(BR|CP)*P(LH|CP)*P(OBP|CP)*P(L|CP)*P(CP)
在上述取得數(shù)據(jù)過程中,需要對相關(guān)數(shù)據(jù)和課程通過的數(shù)據(jù)進(jìn)行歸一化。根據(jù)對相關(guān)歷史數(shù)據(jù)統(tǒng)計(jì)獲得如下的數(shù)據(jù)信息。具體見表5-表10。
表5 數(shù)據(jù)結(jié)構(gòu)(不)通過率表
表6 數(shù)據(jù)結(jié)構(gòu)(不)通過情況下的借閱圖書相關(guān)性概率表
表7 數(shù)據(jù)結(jié)構(gòu)(不)通過情況下學(xué)習(xí)用功度概率表
表8 數(shù)據(jù)結(jié)構(gòu)(不)通過情況下學(xué)習(xí)成績狀況概率表
表9 數(shù)據(jù)結(jié)構(gòu)(不)通過情況下先導(dǎo)課程C語言(不)通過概率表
表10 三名學(xué)生的后驗(yàn)概率示例數(shù)據(jù)表
在對數(shù)據(jù)信息進(jìn)行分析后,我們發(fā)現(xiàn):學(xué)生A數(shù)據(jù)結(jié)構(gòu)課程通過概率是不通過概率的1422倍,學(xué)生B的課程通過概率是不通過概率的79倍,而學(xué)生C的不通過概率是通過概率的4.5倍。
用戶畫像技術(shù)是一種較為復(fù)雜的應(yīng)用技術(shù),而采用用戶畫像技術(shù)對學(xué)生進(jìn)行精準(zhǔn)分析的探索也面臨著諸多的難點(diǎn)和挑戰(zhàn)。本文通過學(xué)生畫像初始技術(shù)、成績預(yù)警技術(shù)等重點(diǎn)技術(shù)的分析,試圖解析這一技術(shù)的實(shí)施和應(yīng)用要點(diǎn)。但是這種探索和嘗試也存在數(shù)據(jù)的分析精度不夠等問題,這是我們未來需要努力的方向。但我們也同時(shí)看到基于數(shù)字化校園的寬域、多載荷數(shù)據(jù)為構(gòu)建有價(jià)值的大數(shù)據(jù)應(yīng)用提供了良好機(jī)遇和寬廣的應(yīng)用空間,這為我們采用畫像技術(shù)為學(xué)校的管理者切實(shí)做好學(xué)生管理工作提供有力的環(huán)境支持。未來,這一領(lǐng)域有更加廣泛的應(yīng)用空間及價(jià)值發(fā)現(xiàn)。