張揚(yáng)武
摘要:教學(xué)評價在促進(jìn)課堂教學(xué)方面所起到的作用越來越重要,學(xué)生的主觀評價內(nèi)容往往過于繁雜,而且主題分散,不容易形成中心聚焦。針對教學(xué)評價中的內(nèi)容分散,難以凝聚情感傾向的問題,本文提出一種基于主題模型的教學(xué)評價方法,根據(jù)貝葉斯概率理論,學(xué)生評價語句是學(xué)生對教師教學(xué)效果的情感主題的分布,然后在一定主題下的詞語分布中產(chǎn)生一個詞語,這個產(chǎn)生過程通過發(fā)現(xiàn)潛在主題分布,獲得有價值的主題。實(shí)驗(yàn)結(jié)果表明,主題模型教學(xué)評價比傳統(tǒng)方法更能獲得真實(shí)有效的評價數(shù)據(jù),幫助教師提升教學(xué)質(zhì)量。
關(guān)鍵詞:教學(xué)評價;主題模型;LDA
中圖分類號:TP183 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2019)07-0032-03
Abstract:Teaching evaluation plays a more and more important role in promoting teaching.Aiming at the problem of scattered content and difficult to condense emotional tendency in teaching evaluation, this paper proposes a teaching evaluation method based on topic model.According to Bayesian probability theory, the evaluation sentences are the distribution of emotional topics of students' teaching effect to teachers, and then a word is generated in the distribution of words under certain themes. The experimental results show that the model of teaching evaluation can obtain more real and effective evaluation data than traditional methods, and help teachers to improve the quality of teaching.
Key words: Teaching evaluation; Topic model; LDA
1 引言
隨著以計算機(jī)技術(shù)為代表的因特網(wǎng)的快速發(fā)展,數(shù)據(jù)生產(chǎn)涉及社會各個方面,其中包括社交、學(xué)習(xí)和工作等。數(shù)據(jù)訪問具有移動、存儲量大和帶寬高等特點(diǎn),因此,對數(shù)據(jù)的存儲、訪問以及使用將會越來越困難,也將越來越迫切。在海量分布的數(shù)據(jù)中發(fā)現(xiàn)有用的模式,以及如何對數(shù)據(jù)進(jìn)行挖掘成為當(dāng)前技術(shù)研究的熱點(diǎn)和應(yīng)用場景的要求。主題模型(Latent Dirichlet Allocation, LDA)是主題模型領(lǐng)域非常著名的算法,由David M. Blei等人于2003年提出的[1]。LDA模型是一種基于概率的非監(jiān)督機(jī)器學(xué)習(xí)方法,可以識別大規(guī)模文檔集或語料庫中潛在的隱藏信息。文檔中的詞語是有背后隱藏主題隨機(jī)抽取出來的,因此,LDA可以說是由文檔產(chǎn)生主題分布,由主題產(chǎn)生詞分布的概率生成模型,在文本分類、話題跟蹤、數(shù)據(jù)挖掘和情感發(fā)現(xiàn)等領(lǐng)域有著廣泛地應(yīng)用。
教學(xué)評價是為了激發(fā)和調(diào)動學(xué)生學(xué)習(xí)的積極性,引導(dǎo)教師開展課堂教學(xué)活動,促進(jìn)學(xué)校教育教學(xué)質(zhì)量的提升,落實(shí)教學(xué)中心地位[2]。依據(jù)教學(xué)目標(biāo)對課堂實(shí)施過程進(jìn)行教學(xué)評價,評價結(jié)果用來服務(wù)提升教學(xué)質(zhì)量的教學(xué)決策。很多學(xué)校開始逐漸從代替?zhèn)鹘y(tǒng)的紙質(zhì)方式過渡到網(wǎng)絡(luò)方式開展對課堂的教學(xué)評價。建立合理的教學(xué)評價機(jī)制是衡量教學(xué)水平的重要標(biāo)志,評價結(jié)果可讀性是發(fā)揮教學(xué)評價機(jī)制作用的前提和保障。提高結(jié)果可讀性需要從大量評價數(shù)據(jù)中搜索隱藏其中的重要信息,通過規(guī)則和統(tǒng)計規(guī)律獲得可解釋的內(nèi)容,主題模型就是一種統(tǒng)計模型。
2 相關(guān)工作
LDA模型已經(jīng)被學(xué)術(shù)界廣泛接受,給應(yīng)用帶來前所未有的啟發(fā)和高度,能夠滿足大數(shù)據(jù)需求,適用各種文本生產(chǎn),解決用戶生成數(shù)據(jù)問題。LDA主題模型是一種多項(xiàng)式分布的概率生成模型,可以上溯到巴塞爾問題,歐拉在解決巴塞爾問題的同時,發(fā)現(xiàn)了gamma函數(shù),被廣泛應(yīng)用在概率論。解析數(shù)論的創(chuàng)建者Dirichlet提出了Dirichlet分布。二項(xiàng)分布的參數(shù)符合Beta分布,而多項(xiàng)式分布的參數(shù)符合Dirichlet分布,并且后驗(yàn)分布和先驗(yàn)分布是一對共軛分布。后來,Blei發(fā)展了PLSA模型,在Dirichlet分布的基礎(chǔ)上,結(jié)合貝葉斯先驗(yàn)概率,提出了LDA模型。LDA模型隱含變量和參數(shù)非常多,求解問題十分復(fù)雜,最初用EM變分方法訓(xùn)練,后來使用吉布斯采樣來求解[3]。在主題模型中,每個詞的產(chǎn)生過程屬于獨(dú)立同分布的重復(fù)實(shí)驗(yàn)。當(dāng)一個詞被產(chǎn)生時,根據(jù)貝葉斯假設(shè)的概率選擇某個主題,繼而以另一個假設(shè)概率在該主題下產(chǎn)生某個詞典中的詞[4],周而復(fù)始地重復(fù)此過程便產(chǎn)生了語料集。獨(dú)立同分布的主題分布,根據(jù)文檔和頻率學(xué)派,生成潛在主題分布和觀察結(jié)果的詞,這是一種詞袋模型[5]。教學(xué)評價中的詞主觀性強(qiáng)、上下文強(qiáng)和多義性強(qiáng)等特點(diǎn),如果只是簡單分類,將會導(dǎo)致主題分布具有一定的局限性[6]。很顯然,在教學(xué)評價文本中,在統(tǒng)計概率模型上進(jìn)行分類和發(fā)現(xiàn)。本文提出一種主題模型的教學(xué)評價分類方法,在詞與詞之間發(fā)現(xiàn)背后的主題聯(lián)系,按照主題進(jìn)行分類和排序。
3 教學(xué)評價主題模型
3.1 LDA模型
對于數(shù)據(jù)集中的每一篇文檔,文檔生成過程分為三步[7],其過程如圖1所示。方框表示獨(dú)立重復(fù)實(shí)驗(yàn)次數(shù),也就是采樣次數(shù)。因此,M為文檔總數(shù),也就是M框圖里的步驟重復(fù)次數(shù)。N為文檔中單詞數(shù)量[8],主題數(shù)量為K。
3.2 評價主題模型
中文詞語與英文單詞不一樣,英文單詞用空格分開間隔,而中文句子之間才有標(biāo)點(diǎn)符號,句子內(nèi)部詞語之間并沒有確定的間隔標(biāo)識,此外,還要考慮到中文詞匯的復(fù)雜上下文環(huán)境,詞語的歧義和多義性。因此,中文文本在預(yù)處理階段需要分詞,并且還需要進(jìn)行去除標(biāo)點(diǎn)符號、刪除高頻詞和過濾停止詞等等操作[12]。
根據(jù)教學(xué)評價指標(biāo)和教學(xué)質(zhì)量管理決策領(lǐng)域,設(shè)定主題數(shù)目K。依據(jù)先驗(yàn)參數(shù)經(jīng)驗(yàn),設(shè)置文檔到主題分布的超參數(shù)α,以及主題到詞分布的超參數(shù)β。對應(yīng)語料集和詞典數(shù)量,分配隱含主題Ζ矩陣和初始化LDA教學(xué)評價模型。然后,設(shè)置迭代次數(shù),進(jìn)行吉布斯采樣。達(dá)到停止條件后,輸出各個詞的主題編號Ζ矩陣,生成tassgin文件。輸出文檔到主題的分布θ矩陣,生成theta文件,M行K列。輸出文檔到主題的分布φ矩陣,生成phi文件,K行V列。教學(xué)評價主題模型框架如圖2所示。
吉布斯采樣是一種統(tǒng)計學(xué)中用于馬爾科夫蒙特卡洛(MCMC)的算法,在難以直接采樣時,從某一多變量概率分布中近似抽取樣本序列,然后用后驗(yàn)概率偽隨機(jī)數(shù)來估計變量,該序列可用于近似聯(lián)合分布、部分變量的邊緣分布或計算積分,吉布斯采樣偽代碼如圖3所示。
4 實(shí)驗(yàn)結(jié)果
實(shí)驗(yàn)語料集選自教學(xué)管理系統(tǒng),評價數(shù)為686篇,經(jīng)過分詞后的詞典中詞數(shù)為1783,主題數(shù)量設(shè)置如表1所示。設(shè)置文檔到主題分布超參數(shù)α為0.5,設(shè)置主題到詞分布超參數(shù)β也為0.5,迭代次數(shù)為1000,各個主題下排序的詞數(shù)為5。
將上述參數(shù)值更新到配置文件setting.conf中,讀取語料集文件train.dat。按照迭代次數(shù)進(jìn)行吉布斯采樣,完成后輸出4個文件,分別是model_theta、model_phi、model_tassign和model_twords文件。model_theta是文檔到主題的分布,model_phi是主題到詞的分布,model_tassign是詞的隱含主題編號,model_twords是每個主題下按分布概率進(jìn)行排序并且位置靠前的詞,排序情況如表2所示。
5 結(jié)束語
教學(xué)評價越來越重視主觀評價,評價用語越來越傾向網(wǎng)絡(luò)語言化趨勢,有著與普通文本不同的特征。針對學(xué)生的主觀評價內(nèi)容分散和不容易形成突出點(diǎn),本文提出一種基于主題模型的教學(xué)評價方法,通過中文文本預(yù)處理,將分詞詞語輸入到教學(xué)評價模型,根據(jù)參評學(xué)生數(shù)量合理設(shè)置主題數(shù)量,然后在貝葉斯概率模型和Dirichlet分布的基礎(chǔ)上進(jìn)行吉布斯抽樣,輸出詞語的主題分布情況。實(shí)驗(yàn)結(jié)果表明,主題模型教學(xué)評價比傳統(tǒng)方法可以獲得更好的分類效果和主題推薦詞,為教育教學(xué)決策活動提供有效支持。
參考文獻(xiàn):
[1] David M. Blei, Andrew Y. Ng, Michael I. Jordan. Latent Dirichlet Allocation[J]. Journal of Machine Learning Research,2003(3):993-1022.
[2] 李民.強(qiáng)化教學(xué)評價機(jī)制推動臨床醫(yī)學(xué)教學(xué)質(zhì)量提升[J].重慶醫(yī)學(xué),2011,40(11):1131-1133.
[3] David M. Blei, J. Lafferty. Correlated Topic Models. The Proceeding of International Conference on Machine Learning, 113-120, 2006.
[4] David M. Blei, J. Lafferty, D. John. Dynamic Topic Models. The Proceedings of the International Conference Machine Learning, 113-120, 2006.
[5] Y. Yao, Q. Li. Term Weighting Schemes for Emerging Event Detection. The IEEE International Conference on Web Intelligence & Intelligent Agent Technology, Vol.1:105-112, 2013.
[6] P. A. Chew. Terms Weighting Schemes for Latent Dirichlet Allocation. The Proceeding of the North American Chapters of the Association for Computation Linguistics, 2010(3):465-473.
[7] 徐戈, 王厚峰. 自然語言處理中主題模型的發(fā)展[J].計算機(jī)學(xué)報, 2011,34(8) .
[8] 張晨逸,孫建伶. 基于MB-LDA模型的微博主題挖掘[J].計算機(jī)研究與發(fā)展,2011,48(10).
[9] 郭藍(lán)天,李揚(yáng)等.一種基于LDA主題模型的話題發(fā)現(xiàn)方法[J].西北工業(yè)大學(xué)學(xué)報,2016,34(4):697-701.
[10] 石晶,胡明,石鑫.基于LDA模型的文本分割[J].計算機(jī)學(xué)報,2008,31(10).
[11] 李文波, 孫樂.基于Labeled-LDA模型的文本分類新算法[J].計算機(jī)學(xué)報,2008,31(4).
[12] 王和勇,崔蓉.在線用戶評論的主題研究[J].現(xiàn)代情報,2015,35(5).