周夏冰 陳飛
摘要:隨著人工智能領域的快速發(fā)展,機器學習作為其核心技術,也逐漸成為各大高校人才培養(yǎng)極為重視的教學課程之一。機器學習作為一門多領域交叉學科,具有內(nèi)容多、難度大、更新快等特點。傳統(tǒng)的教學模式存在學生知識掌握不夠全面,模型原理不夠透徹以及解決實際問題困難等缺陷。文章針對機器學習課程特點及現(xiàn)有教學存在的問題,探索課程實施新方案,設計教學方式、教學內(nèi)容以及考核模式,對學生進行循序漸進地引導,從而提高學生學習興趣以及分析問題、解決問題的能力。
關鍵詞:機器學習;人工智能;教學探索;混合式教學;實踐教學
中圖分類號:G642? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2020)30-0129-03
Abstract: With the rapid development of the field of artificial intelligence, machine learning, as its core technology, has gradually become one of the most important teaching courses in Colleges and universities. Machine learning, as a multi field interdisciplinary subject, has many characteristics, including more contents, difficulty, fast update and so on. The traditional teaching mode has some defects, such as students' knowledge is not comprehensive enough, the principle of the model is not thorough enough, and it is difficult to solve practical problems. According to the characteristics of machine learning course and the existing problems in teaching, this paper explores the new scheme of course implementation, designs teaching methods, teaching contents and assessment modes, and guides students step by step, so as to improve students' interest in learning and their ability to analyze and solve problems.
Key words: machine learning; artificial intelligence; teaching exploration; blending learning; practical teaching
1 引言
2017年,國務院正式印發(fā)《新一代人工智能戰(zhàn)略規(guī)劃》,明確了我國新一代人工智能發(fā)展的戰(zhàn)略目標[1]。近年來,人工智能技術在社會各領域中的地位顯著提升,迫切需要高效培養(yǎng)社會新型人才。機器學習是計算機科學和人工智能中非常重要的一個研究領域,不僅在計算機科學的眾多領域中大顯身手,還成為一些交叉學科的重要技術支持 [2]。因此,如何培養(yǎng)專業(yè)素質過硬,實踐能力強,以及能夠適應快速發(fā)展的時代需求的學生,是作為計算機專業(yè)課程教師急需思考的問題。
機器學習通過構建模型來解析歷史經(jīng)驗數(shù)據(jù),從中學習,然后對真實世界中的事件做出決策和預測。機器學習課程融合了統(tǒng)計學、微積分、線性代數(shù)等多學科知識,并且其發(fā)展也在不斷地吸納其他學科的知識,因此需要學生具有良好的數(shù)學理論基礎和計算機程序實踐能力[3]。機器學習課程的核心是如何培養(yǎng)學生對實際問題的分析能力和解決能力,應用到人工智能領域,故本課程的施教過程中,既需要兼顧理論知識,包括理論推導證明,同時需要培養(yǎng)學生實際編程能力,包括大數(shù)據(jù)的處理和模型算法的編寫等,將數(shù)學和計算機專業(yè)的內(nèi)容緊密地結合在一起。
目前,線下機器學習課程的開設普遍性還遠不如傳統(tǒng)核心課程,而近幾年國內(nèi)外大型開放式網(wǎng)絡課程卻迅猛發(fā)展,如MOOC和SPOC等線上教學在社會上開始流行并取得了較大的成功。線上和線下課程有著各自的優(yōu)缺點,線下課程方便師生互動,線上課程方便學生時間管理,隨時可以進行多次反復觀看學習。尤其最近全世界受到COVID-19的影響,學生無法進行課堂學習,線上上課優(yōu)勢凸顯。隨著日前課程不斷改革,提倡線上和線下的教學融合,該融合對于學生和教師都是一種新的學習理念,改變學生的認知方式,影響教師的教學模式,提高教學效果[4]。然而,對于機器學習課程,目前線下課程由于缺乏普遍性,大多教師喜歡直接采用線上視頻進行教學,而線上視頻由于拍攝的局限性,缺乏教學協(xié)作性,以及重要教學原理的指導,從而在一定程度上影響教學效果。因此,本文將從機器學習課程特點出發(fā),討論目前存在的問題,從而針對目前存在的問題,提出改進課程實施方案。
2 課程特點及存在的問題
2.1 機器學習課程特點
機器學習是一門多領域交叉學科,涉及概率論、統(tǒng)計學、凸分析、計算機編程等多門學科,重點研究計算機如何模擬或實現(xiàn)人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能[5]。機器學習是人工智能的核心,是解決計算機如何具有智能的根本途徑。機器學習課程具有如下特點:
1) 前瞻性。近年來人工智能領域快速發(fā)展,機器學習的新模型、新算法也層出不窮,會議、期刊的相關論文數(shù)量每年呈遞增趨勢。圖1展示了近年來人工智能和機器學習兩大國際頂會(ICML:機器學習國際會議;AAAI:美國人工智能協(xié)會人工智能會議)論文投遞數(shù)量。由此可見,機器學習課程具有很強的新穎性和前瞻性,需要能夠適應快速發(fā)展的技術需求。
2) 難度大。由于該課程是一門綜合性學科,尤其涉及了數(shù)學的一些基礎知識,包括高等數(shù)學、線性代數(shù)、概率統(tǒng)計等。同時,機器學習中模型和算法的實現(xiàn)也需要熟練掌握計算機編程。這就要求當面對不同程度的學生時,如何因材施教。
3) 理論與實踐結合性。機器學習課程往往不同于普通的傳統(tǒng)課程,大多數(shù)學生學習這門課程都具有實際的需求,如就業(yè)、讀研、發(fā)表高水平論文等,因此,對于機器學習課程,理論和實踐是必不可少,缺一不可。理論反映了模型或算法的本質,是新模型新算法提出的基礎條件。實踐是模型應用的根本,沒有實踐只有理論,也無法完成真正的應用。
基于機器學習課程的三個特點,在開展教學過程中,相應的問題也隨之浮現(xiàn)。
2.2 目前課程教學存在的問題
2.2.1教材單一
目前雖然市面關于機器學習課程教材很多,但大多集中在經(jīng)典模型的介紹,并且教學一般只采取以單一教材為主,存在覆蓋性低、缺乏前沿性等問題,容易與現(xiàn)實脫節(jié)。機器學習的模型算法發(fā)展很迅速,除了掌握必要的經(jīng)典模型外,一些模型的延伸、最新流行的模型算法介紹也必不可少,是學生能夠緊跟研究趨勢的必要條件。此外,教材結構單一,容易造成學生缺乏興趣,使得學生對課程失去信心,對今后繼續(xù)深造和就業(yè)有著很大的影響。
2.2.2教學形式單一
當前大部分機器學習課程采用課堂教學或者學生線上視頻自主學習。對于大部分高校開展機器學習課程,依舊是課堂教學為主流方式。而對于很多沒有開展機器學習課程的學校,學生通過網(wǎng)絡資源自主學習。課堂教學以老師為教學主體,以傳授式為主要模式,教學節(jié)奏、內(nèi)容均由老師來主導,這樣難以取得理想的教學效果,并且還影響到學生的創(chuàng)新、創(chuàng)造思維的發(fā)展[6]。線上學習雖然比較自由,學生可以自主選擇自己喜歡的內(nèi)容,并且可以根據(jù)時間自由安排,同時能夠反復觀看相應的內(nèi)容。但是,正如2.1節(jié)所述,機器學習課程具有難度大的特點,會造成線上自主學習的困難性,很多內(nèi)容只能掌握一個大概,不能進行深入探索。并且,因為每位同學程度不同,線上學習也很難因材施教。
2.2.3 理論與實踐結合不緊密
機器學習作為人工智能的根本解決途徑之一,其實踐性占了很大的比重。傳統(tǒng)的教學模式以教材內(nèi)容為主,將理論知識作為重點,大量推導公式,證明定理,很容易導致學生眼高手低,不知道如何應用模型解決實際問題。而現(xiàn)在,越來越多的教師關注實踐教學[7-9],增加了實驗課的比重。但在機器學習課程中,大部分實踐課又缺乏理論基礎的教授,以同學已完全具備相關基礎的假設條件下,缺乏循序漸進的教學模式。
3 課程實施方案
針對機器學習課程及目前教學存在的問題,結合學習經(jīng)驗和上課教學經(jīng)驗,可以從以下方面進行課程實施。圖2展示了機器學習課程實施方案。
3.1 混合式教學設計
傳統(tǒng)的課堂教學模式以老師教授為主,學生在規(guī)定的時間上課,上課的節(jié)奏和內(nèi)容以教師為主導。隨著網(wǎng)絡信息化的發(fā)展,越來越多的老師利用慕課、微課等方式,進行線上授課,使得學生可以根據(jù)自己的興趣來選擇對應的老師和內(nèi)容[10]。雖然傳統(tǒng)的課堂教學存在一定的弊端,但對于機器學習這門課程,該教學模式是不能完全被取代的。同樣,僅僅只利用課堂教學,也會導致學生在課堂上缺乏積極主動性,枯燥乏味。因此,混合式教學方式對機器學習課程的教學效果會有顯著提高。
機器學習課程的內(nèi)容多、難度大,往往只依靠課堂老師教授或者線下視頻自主學習,無法讓學生完全掌握知識點。例如,機器學習課程中的支持向量機(SVM),最大期望算法(EM),隱馬爾科夫模型(HMM)等,涉及大量的公式推導,只依靠單一教學模式很難完全熟練地掌握。混合教學可以通過:1)開課之初,教師給出“線上”視頻參考資料,學生通過視頻進行初步的學習,并記錄其中遇到的問題和難點;2) 課堂教學,教師根據(jù)內(nèi)容的深淺進行調(diào)整,遇到相對于簡單的模型,如線性回歸、感知機、K近鄰等,可將重點內(nèi)容進行總結供學生學習。當遇到復雜的模型,涉及數(shù)學內(nèi)容較多時,結合板書進行詳細展開,使得學生不僅對模型算法的原理有更加清楚的認識,而且也逐漸體會如何構建一個新的模型;3)協(xié)作式課程交互,促進教師與學習者之間的交流和討論[11]。由于課程難度較大,每位同學程度不一樣,在機器學習課程當中,一定要有教師與學生之間的互動,既可以幫助不同同學解決自身碰到的難題,同時通過交流也促進學生在學習過程中的興趣; 4) 課后教師總結學生掌握較差的內(nèi)容,明確對應線上課程,便于學生復習、鞏固所學知識。
3.2 豐富教學內(nèi)容
傳統(tǒng)的機器學習課程教學內(nèi)容局限在教材范圍,而面對不斷出現(xiàn)的各種新技術新方法,仍然靠學生自主學習。因此,從教師的角度,該課程要求教師對機器學習領域的前沿技術有所了解,能夠有一定的研究經(jīng)驗。機器學習方法在眾多領域中均有應用,如語音識別、圖像處理、自然語言處理等等,教師能夠結合領域前沿技術,在教材經(jīng)典模型的基礎上,擴展加入新的模型和新的算法。
具體來說,大多教材在介紹貝葉斯方法(Bayesian)時,只講了樸素貝葉斯(Naive Bayesian)的相關內(nèi)容,雖然樸素貝葉斯在某些應用中仍然能夠獲得良好的性能,但由于其假設所有特征條件獨立,使得某些實際場景無法直接使用。而隨著概率圖模型的推廣,貝葉斯網(wǎng)絡(Bayesian Network)有著廣泛的應用,包括靜態(tài)貝葉斯和動態(tài)貝葉斯模型,以及貝葉斯網(wǎng)絡變種,慢慢被學者提出,從而獲得更加優(yōu)秀的性能。同樣,神經(jīng)網(wǎng)絡作為機器學習課程中的一個模型,大多只介紹了BP神經(jīng)網(wǎng)絡的相關內(nèi)容。隨著深度神經(jīng)網(wǎng)絡(Deep Learning)的逐漸發(fā)展,傳統(tǒng)的BP神經(jīng)網(wǎng)絡已經(jīng)被更復雜更先進的網(wǎng)絡模型所替代,例如卷積神經(jīng)網(wǎng)絡(CNN),長短時記憶網(wǎng)絡(LSTM),以及近幾年流行起來的對抗神經(jīng)網(wǎng)絡(GAN)、圖卷積神經(jīng)網(wǎng)絡(GCN)和預訓練模型Transformer和BERT等。
融合一些最新的流行的模型的介紹,既可以讓學生跟得上研究趨勢,同時結合最新的研究成果及應用,使得學生對該課程更加有興趣。
3.3 理論與實踐相結合
機器學習課程的核心是培養(yǎng)學生面對實際情況分析問題、解決問題的能力。因此,該課程應該采用理論和實踐相結合的教學方式。目前大部分機器學習課程是一頭熱,以理論為主的教學在實踐方面涉及的非常少,以實踐為主的會忽略大量理論內(nèi)容,只介紹簡單的模型形式。理論和實踐相結合的教學模式要求1)課堂以理論教學為主,重點講解模型原理,讓學生理解模型的目標函數(shù)是怎么推導過來的,以及如何求解目標函數(shù);2)課后通過結合實驗來體會模型的特點。教師通過發(fā)布數(shù)據(jù)集和應用問題,讓學生根據(jù)課堂學習的知識進行模型構建,解決問題。
在結合實踐的過程中,需要注意兩個問題:(1)實驗難度。由于機器學習難度大,要求學習者具備一定的數(shù)學及計算機編程的基礎,故導致每個學生的程度不一致。如果一直以一個標準來布置實驗,則可能導致有的學生無從下手,有的學生則覺得太簡單,提不起興趣。因此,可以通過循序漸進的方式布置實驗,開始采用數(shù)據(jù)量較小、特征維度小的數(shù)據(jù)進行嘗試,并在課堂上進行演示。然后逐步擴大數(shù)據(jù)量,提高實驗的復雜度,并通過分解實驗步驟來引導學生解決復雜問題。例如,“基于文本數(shù)據(jù)的情感識別”這樣一個實驗,可以分解為①文本數(shù)據(jù)特征提取;②數(shù)據(jù)向量化;③數(shù)據(jù)預處理;④分類模型訓練。(2)實驗設計。機器學習的模型從應用角度主要分類三大類,包括分類模型、回歸模型和結構學習,其中分類和回歸模型是最常用的兩大類。以分類模型為例,具體又包括感知機、支持向量機、決策樹、邏輯回歸、貝葉斯等,如何通過實驗讓學生理解各個模型的特點和性能,在設計實驗的時候,可以采用同一組數(shù)據(jù)同一個應用問題下,比較不同模型,從而讓學生體會到不同模型擅長解決哪種類型的問題。
3.4 改進考核方式
機器學習課程由于其獨特的課程特點,傳統(tǒng)的試卷考核方式對其適應性并不好。死記硬背對機器學習課程沒有任何意義,重點是學生是否真正掌握了分析問題、解決問題的方法。因此,對本門課程應當設置多元化的考核方式。除了傳統(tǒng)的課程出勤和隨堂作業(yè)之外,可以融合學習成果匯報及項目開發(fā)、學科競賽等方式。學習成果匯報以課堂PPT展示為主,學生可以通過匯報學習成果和收獲來進行分享,包括閱讀的新論文、實驗的新結果等等,畢竟一個人的精力有限,互相共享互相交流更有助于知識面的覆蓋。項目開發(fā)可以促進學生學習的興趣,學生通過自主選擇人工智能領域應用場景(面部識別、推薦系統(tǒng)、問答系統(tǒng)等),結合學習到的技術和模型,進行設計和開發(fā)。同時,現(xiàn)在相關的競賽也越來越多,如相關會議的評測、高校的創(chuàng)新創(chuàng)業(yè)大賽等等,也可以結合競賽調(diào)動學生的積極性。
4 結論
隨著人工智能領域的不斷發(fā)展,機器學習作為其核心課程,其教學效果直接影響著學生今后繼續(xù)深造和就業(yè)。文章通過分析機器學習課程特點及目前教學存在的問題,探討了該課程教學實施方案。通過從教學方式、教學內(nèi)容以及考核方式的改進,能夠最大程度地發(fā)揮教學者的主導型與學習者的主觀能動性,使得學生在學習的過程中不再枯燥乏味,以及出現(xiàn)眼高手低的情況。機器學習課程作為較為創(chuàng)新的課程逐漸出現(xiàn)在各大高校,也仍在不斷地探索當中,希望在今后的教學實踐與探索,能夠不斷完善教學手段和方式,使得培養(yǎng)出的學生學術眼界更加寬廣,具備運用專業(yè)知識解決實際需求的能力以及科研創(chuàng)新的能力。
參考文獻:
[1] 馮驥. 人工智能課程教學實踐與探索研究[J]. 電腦知識與技術, 2019,15(17):126-127+136.
[2] 周志華,楊強. 機器學習及其應用[M]. 北京:清華大學出版社,2011.1-10
[3] 胡春龍,吳陳,左欣,陳建軍,王長寶. 研究生“機器學習”課程教學改革研究[J]. 教學教育論壇, 2019,3(10):99-100.
[4] 李禮,李瓊. 大數(shù)據(jù)背景下線上課堂與線下課堂融合的相關研究[J].電腦知識與技術,2019,15(30):121-122.
[5] 李昊朋. 基于機器學習方法的智能機器人探究[J]. 通訊世界, 2019(4):241-242.
[6] 曾小龍. 高校數(shù)學教育應用現(xiàn)代教育信息技術探析[J]. 電腦知識與技術, 2019,15(30):93-94.
[7] 周玲芳,米成全,李政峰. 《數(shù)據(jù)結構與算法》實踐教學現(xiàn)存的問題及應對策略[J]. 電腦知識與技術, 2019,15(30):106-107.
[8] 邵攀,董婷. 對分課堂在“算法設計與分析”課程的教學實踐[J]. 教育教學論壇, 2020,5(20):268-269.
[9] 徐艷群,張斌. 《編譯原理》課程設計實踐教學改革探索[J]. 科技展望, 2016(27):178-179.
[10] 王建東,鄒惠. 計算機組成原理課程的混合式教學法研究[J]. 福建電腦, 2019,35(10):46-47.
[11] 蔣雙雙,王衛(wèi)軍. 協(xié)作式在線課程交互設計研究[J]. 中國遠程教育, 2018(5):35-44.
【通聯(lián)編輯:王力】