• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      一種學(xué)習(xí)路徑規(guī)劃的模型及方法

      2017-05-04 04:05:05陳霞羅晨希張立波闞成章羅鐵堅(jiān)
      關(guān)鍵詞:維基百科學(xué)習(xí)者概念

      陳霞,羅晨希,張立波,闞成章,羅鐵堅(jiān)

      1. 國(guó)家新聞出版廣電總局信息中心,北京 100053

      2. 中國(guó)科學(xué)院軟件所,北京 100190

      3. 中國(guó)科學(xué)院大學(xué),北京 100049

      引言

      人類的學(xué)習(xí)過程,主要有兩種比較典型學(xué)習(xí)途徑:專家、教師的預(yù)設(shè)課程和以問題為導(dǎo)向的自主學(xué)習(xí)。預(yù)設(shè)課程依靠專家經(jīng)驗(yàn),難以對(duì)整個(gè)知識(shí)體系清晰掌握,也無法隨時(shí)洞察最新的知識(shí)發(fā)展;大部分自主學(xué)習(xí)者由于經(jīng)驗(yàn)有限,缺乏對(duì)整個(gè)知識(shí)體系的了解,因此在尋找知識(shí)資源的過程中,往往不能在短時(shí)間內(nèi)找到循序漸進(jìn)的學(xué)習(xí)路徑。國(guó)內(nèi)外學(xué)者普遍認(rèn)為,建立知識(shí)網(wǎng)絡(luò)和優(yōu)化學(xué)習(xí)路徑的任務(wù)可以通過對(duì)人類產(chǎn)生的大規(guī)模知識(shí)庫(kù)進(jìn)行語義分析和知識(shí)表示,利用具有優(yōu)化學(xué)習(xí)路徑功能的智能導(dǎo)學(xué)系統(tǒng),從而提高人類學(xué)習(xí)效率和效果。人工智能技術(shù)不斷發(fā)展,在海量數(shù)據(jù)中找到知識(shí)點(diǎn)之間的規(guī)律,并最優(yōu)化地匹配給學(xué)習(xí)者,成為可能。

      在現(xiàn)實(shí)生活中,根據(jù)當(dāng)前位置來尋找去往目的地的路徑,可以通過全球定位系統(tǒng)輕松實(shí)現(xiàn)。在物理空間中,GPS 技術(shù)能夠幫助人類精確地進(jìn)行位置感知和路徑尋找,在信息空間和知識(shí)空間中,是否能夠建立類似的技術(shù),用以幫助學(xué)習(xí)者在知識(shí)的海洋中找到準(zhǔn)確的航向呢?近些年中,人工智能的飛速發(fā)展帶動(dòng)了知識(shí)空間的研究,從詞匯關(guān)系圖和語義相關(guān)性到對(duì)知識(shí)本體、語義網(wǎng)以及信息分類的相關(guān)研究成為熱點(diǎn)[1]?;谶@些研究,能夠解決學(xué)習(xí)者在知識(shí)空間中的學(xué)習(xí)路徑規(guī)劃問題。人類所進(jìn)行的學(xué)習(xí)、工作和娛樂等活動(dòng),都可以視為在信息和知識(shí)空間的節(jié)點(diǎn)中的游走過程。人類知識(shí)總量不斷增加,信息量迅速膨脹的,單單依靠個(gè)體無法對(duì)知識(shí)的某一個(gè)領(lǐng)域做到精確把握,傳統(tǒng)教育中的決策問題大多由經(jīng)驗(yàn)豐富的人類教育者決定,缺乏普適性和客觀性。另一方面,由于學(xué)習(xí)者個(gè)人經(jīng)驗(yàn)和學(xué)習(xí)能力的區(qū)別,一種學(xué)習(xí)模式無法做到因人而異。因此在構(gòu)建知識(shí)網(wǎng)絡(luò)的基礎(chǔ)上,利用人工智能相關(guān)技術(shù)形成個(gè)性化的學(xué)習(xí)路徑,對(duì)提高學(xué)習(xí)效率和制定學(xué)習(xí)策略意義重大。

      傳統(tǒng)知識(shí)的載體主要依靠各類紙質(zhì)或電子書籍、材料,它們?cè)趯W(xué)術(shù)性和權(quán)威性上得到了保證,但是由于知識(shí)更新周期緩慢,具有很大的局限性?;ヂ?lián)網(wǎng)及其相關(guān)技術(shù)的發(fā)展加速了人類對(duì)知識(shí)傳遞、存儲(chǔ)、處理和展示等一系列研究進(jìn)程,例如知識(shí)圖譜、語義網(wǎng)等。知識(shí)圖譜和語義網(wǎng)在特定的知識(shí)領(lǐng)域取得了廣泛的應(yīng)用,為解決自然語言處理的各類問題提供了理論依據(jù),例如在語義相關(guān)性、機(jī)器翻譯、問答系統(tǒng)等方面有了很大突破。但是,現(xiàn)有的知識(shí)圖譜和語義網(wǎng)都是依靠大量人類專家編撰形成,只在一些小的領(lǐng)域形成了系統(tǒng)數(shù)據(jù)庫(kù),目前無法遷移到所有知識(shí)領(lǐng)域。全人類智慧形成的知識(shí)庫(kù)具有更新速度快、參與人數(shù)多、覆蓋范圍廣等顯著優(yōu)點(diǎn),為自動(dòng)化地生成適應(yīng)每位學(xué)習(xí)者的學(xué)習(xí)路徑提供了可能。在本文的研究中,我們選擇了具有代表性的知識(shí)庫(kù)百科全書。百科全書是目前人類形成的最大的知識(shí)載體,其中,影響最大的是大英百科全書和維基百科全書,大英百科全書始于 1768 年,目前經(jīng)歷了 15 個(gè)版本,包含約 10 萬詞條,全部由專家梳理和編撰而成。相比大英百科,維基百科在保證了同等正確率的同時(shí),具有涉及范圍廣、參與人數(shù)多和更新速度快的優(yōu)勢(shì),從 2001 年發(fā)展至今,已經(jīng)包含約 500 萬詞條。

      在構(gòu)建知識(shí)網(wǎng)絡(luò)的基礎(chǔ)上,我們主要通過解決 3個(gè)問題來完成學(xué)習(xí)路徑的優(yōu)化:(1) 建立知識(shí)中概念的網(wǎng)路拓?fù)浣Y(jié)構(gòu)。知識(shí)單元之間不是相互孤立的,不同概念之間存在著千絲萬縷的聯(lián)系,這些聯(lián)系映射到網(wǎng)絡(luò)中,就是兩個(gè)概念之間存在的通路關(guān)系,如何準(zhǔn)確度量和刻畫它們的網(wǎng)絡(luò)關(guān)系,是后續(xù)工作的重要基礎(chǔ);(2) 結(jié)合學(xué)習(xí)者的知識(shí)狀態(tài)生成一個(gè)自適應(yīng)的學(xué)習(xí)計(jì)劃,即概念序列?;貧w到學(xué)習(xí)者的日常學(xué)習(xí)中,學(xué)習(xí)形式總是以知識(shí)點(diǎn)或概念的先后順序進(jìn)行排列的,因此能夠很好地用一個(gè)概念序列進(jìn)行抽象表示學(xué)習(xí)進(jìn)程。自適應(yīng)地生成學(xué)習(xí)序列,是考慮到每個(gè)學(xué)習(xí)者的知識(shí)狀態(tài)和學(xué)習(xí)效率不同,無法找到一個(gè)普適的學(xué)習(xí)路徑。只有在對(duì)學(xué)習(xí)者的初始知識(shí)狀態(tài)和學(xué)習(xí)能力的準(zhǔn)確評(píng)估基礎(chǔ)上,才能因地制宜地為每個(gè)學(xué)習(xí)者制定出一套符合其自身需要和高效的學(xué)習(xí)計(jì)劃。(3) 我們考慮到在學(xué)習(xí)時(shí)存在的間隔效應(yīng),這是指學(xué)習(xí)者在進(jìn)行某個(gè)知識(shí)點(diǎn)的學(xué)習(xí)之后,如果不及時(shí)復(fù)習(xí)或沒有與其相關(guān)的知識(shí)點(diǎn)的影響,對(duì)這個(gè)知識(shí)點(diǎn)理解和記憶會(huì)隨著時(shí)間的增長(zhǎng)衰減,最終完全遺忘。在本文設(shè)計(jì)的學(xué)習(xí)序列中,對(duì)每個(gè)概念的重要性和復(fù)習(xí)周期進(jìn)行評(píng)估,并基于評(píng)估結(jié)果,在學(xué)習(xí)新知識(shí)的同時(shí),穿插地重新復(fù)習(xí)一些概念。

      1 相關(guān)工作

      隨著信息時(shí)代知識(shí)總量的不斷增加,傳統(tǒng)的課堂教育已經(jīng)難以滿足學(xué)習(xí)者的教育需求,自 2012 年以來,大規(guī)模在線課程 (MOOCs) 推出,反映了人們對(duì)教育方式變革的需求和動(dòng)力。伴隨而來的,是能夠?yàn)閷W(xué)習(xí)者提供定制、有效和創(chuàng)新的學(xué)習(xí)工具。在這些工具中,為了獲得學(xué)習(xí)實(shí)踐的最佳效果,需要對(duì)學(xué)習(xí)者的初始狀態(tài)和目標(biāo)狀態(tài)進(jìn)行評(píng)估,并考慮如何使記憶更持久,即使得遺忘最小化。Novikoff 等人提出了一套人類知識(shí)學(xué)習(xí)模型,用于學(xué)習(xí)時(shí)間表的規(guī)劃[2],但是提出的方法認(rèn)為知識(shí)一旦學(xué)習(xí)后就會(huì)產(chǎn)生終身記憶,不會(huì)被遺忘,并且在提出的方法中,將知識(shí)通過獨(dú)立的單元來表示,然而在現(xiàn)實(shí)情況中必須考慮這些知識(shí)單元的相關(guān)性。在知識(shí)網(wǎng)絡(luò)中使用網(wǎng)絡(luò)模型進(jìn)行分析處理可以追溯到 20 世紀(jì) 60 年代,Collins 等人提出一種連續(xù)記憶模型,通過概念圖來表示學(xué)習(xí)的內(nèi)容[3-4]。近些年,復(fù)雜的網(wǎng)絡(luò)方法已經(jīng)被廣泛使用,例如,利用復(fù)雜網(wǎng)絡(luò)對(duì)語義進(jìn)行更深層次的理解和表達(dá)[5-6],并且能夠?qū)W(wǎng)絡(luò)的成長(zhǎng)機(jī)制進(jìn)行建模[7]。隨后,人類認(rèn)知過程的動(dòng)力學(xué)模型在網(wǎng)絡(luò)理論的框架內(nèi)得到解決。通過復(fù)雜網(wǎng)絡(luò)能夠?qū)υ~語在圖形上的語義相似性關(guān)系進(jìn)行提取[8],并結(jié)合類似 PageRank 算法進(jìn)行預(yù)測(cè)分析[9]。Baronchelli 等人對(duì)復(fù)雜網(wǎng)絡(luò)的相關(guān)研究進(jìn)行了一個(gè)全面的概述和總結(jié),這對(duì)后續(xù)的知識(shí)網(wǎng)絡(luò)和語言學(xué)的發(fā)展提供了很大幫助。

      在本文的研究中,我們的首要任務(wù)是對(duì)學(xué)習(xí)者的初始知識(shí)狀態(tài)進(jìn)行評(píng)估,通過刻畫初始狀態(tài)和后續(xù)知識(shí)之間的關(guān)系網(wǎng)絡(luò),評(píng)估在復(fù)雜網(wǎng)絡(luò)中,知識(shí)點(diǎn)之間的相互影響關(guān)系。我們認(rèn)為在不同部分知識(shí)之間存在著強(qiáng)弱不同的鏈接關(guān)系,這些鏈接可以表示增強(qiáng)或阻礙信息的獲取和保留,從而決定學(xué)習(xí)效率。我們?cè)O(shè)計(jì)了一種生成學(xué)習(xí)路徑的算法,這里的路徑被定義為對(duì)網(wǎng)絡(luò)節(jié)點(diǎn)訪問的有序集合,即能夠?yàn)閷W(xué)習(xí)者提供概念在學(xué)習(xí)時(shí)先后順序的有序序列。在整個(gè)過程中,我們充分考慮在引入的新概念和已掌握概念集合之間的相互影響,同時(shí)也考慮學(xué)習(xí)過程中,掌握的知識(shí)隨著時(shí)間的衰減特性。我們的工作建立在認(rèn)知科學(xué)的一些研究結(jié)果基礎(chǔ)之上[2],Ebbinghause 等人介紹了人類記憶中的間隔效應(yīng)[10],研究發(fā)現(xiàn),隨著時(shí)間推移,逐步進(jìn)行知識(shí)單元學(xué)習(xí)要比短時(shí)間內(nèi)集中學(xué)習(xí)更使人記憶持久,其中交叉學(xué)習(xí)單元之間的間隔可以是空的,也可以穿插其他的學(xué)習(xí)項(xiàng)。一些學(xué)者對(duì)學(xué)習(xí)心理機(jī)制進(jìn)行了總結(jié),并給出了有關(guān)間隔效應(yīng)的相關(guān)實(shí)驗(yàn)證據(jù)[11-12],另外研究已經(jīng)證明,間隔一段時(shí)間對(duì)已經(jīng)掌握的內(nèi)容進(jìn)行復(fù)習(xí)能夠增強(qiáng)記憶,并且對(duì)于不同的學(xué)習(xí)內(nèi)容,它們所需的復(fù)習(xí)間隔是不同的[13-14]。

      在前人的工作基礎(chǔ)上,我們提出的學(xué)習(xí)路徑優(yōu)化算法考慮了對(duì)不同的概念給出不同的復(fù)習(xí)間隔評(píng)估,并對(duì)概念之間的相互作用作了計(jì)算。研究發(fā)現(xiàn),基礎(chǔ)的知識(shí)網(wǎng)路拓?fù)浣Y(jié)構(gòu)能夠?yàn)榫唧w學(xué)習(xí)路徑的制定提供重要的參考,并且概念節(jié)點(diǎn)之間的語義相關(guān)性對(duì)學(xué)習(xí)者的記憶能夠產(chǎn)生強(qiáng)化作用。通過平衡新概念的引入和舊概念的復(fù)習(xí),本文提出了一種基于維基百科知識(shí)網(wǎng)絡(luò)的學(xué)習(xí)路徑優(yōu)化算法,通過對(duì)學(xué)習(xí)者的測(cè)試,驗(yàn)證了算法的有效性。

      2 學(xué)習(xí)路徑和知識(shí)網(wǎng)絡(luò)建模

      2.1 學(xué)習(xí)過程模型

      人類的學(xué)習(xí)過程可以視為知識(shí)狀態(tài)從初始概念集合 Kbegin向目標(biāo)概念集合 Klearn不斷擴(kuò)充的結(jié)果,其中Kbegin、Klearn組成總的學(xué)習(xí)知識(shí)集合 K。知識(shí)中最小的組成單元是概念[15],因此,我們可以將需要學(xué)習(xí)的知識(shí)視為概念組成的相互連接的節(jié)點(diǎn),而學(xué)習(xí)路徑是學(xué)習(xí)者對(duì)這些概念節(jié)點(diǎn)不斷訪問構(gòu)成的序列,每一次將有一個(gè)新的概念或者已經(jīng)掌握的概念進(jìn)入序列。通過將初始概念集合 Kbegin和目標(biāo)概念集合 Klearn映射到維基百科概念之間的鏈接構(gòu)成的網(wǎng)絡(luò),能夠得到概念之間的連接關(guān)系。概念之間的關(guān)系有很多種評(píng)估方法,例如頁面的鏈入度、鏈出度、余弦相似度等,在這里,我們使用概念之間的跳轉(zhuǎn)路徑長(zhǎng)度作為衡量標(biāo)準(zhǔn)。

      在維基百科構(gòu)成的知識(shí)網(wǎng)絡(luò)中,兩個(gè)概念之間(例如概念 A 和概念 B) 之間的路徑,從 A 向 B 跳轉(zhuǎn)的次數(shù),和從 B 向 A 跳轉(zhuǎn)的次數(shù)并不一致,因此我們根據(jù)正向距離LF和反向距離LB的平局值L來度量待研究的概念ci之間的關(guān)系。

      基于之前的研究,我們得到兩個(gè)重要結(jié)論:一是在維基百科概念構(gòu)成的網(wǎng)絡(luò)中,概念之間具有普遍連通性,即在維基百科中任意選擇一個(gè)起點(diǎn)概念和終點(diǎn)概念,總能找到一條路徑使它們連結(jié);二是維基百科網(wǎng)絡(luò)中存在最小世界現(xiàn)象,即每?jī)蓚€(gè)概念之間的跳轉(zhuǎn)形成的通路不大于 7,進(jìn)一步地,我們得到了一個(gè)平均路徑長(zhǎng)度為 3.84[16]。在此基礎(chǔ)上,我們限定距離概念節(jié)點(diǎn)ci路徑長(zhǎng)度平局值L≤4 的節(jié)點(diǎn)形成鄰居集合為Ni。學(xué)習(xí)過程的每一次迭代,都產(chǎn)生概念進(jìn)入原有序列,如何選擇加入序列的概念是優(yōu)化學(xué)習(xí)路徑的關(guān)鍵。

      為了解決這個(gè)問題,我們引入知識(shí)強(qiáng)度Si(t),通過知識(shí)強(qiáng)度來輔助概念的選擇,它代表了在當(dāng)前學(xué)習(xí)者已經(jīng)掌握的概念集合狀態(tài)下,序列中出現(xiàn)的下一個(gè)概念對(duì)學(xué)習(xí)者的障礙程度。在實(shí)際的學(xué)習(xí)過程中,學(xué)習(xí)者不斷學(xué)習(xí)新的概念構(gòu)成的知識(shí),但這些知識(shí)中難免涉及到已經(jīng)掌握的概念;另外,人類的大腦擁有遺忘機(jī)制,會(huì)隨著時(shí)間的推移忘記和弱化已經(jīng)掌握的概念。因此我們?cè)谏筛拍顚W(xué)習(xí)序列時(shí),主要考慮四個(gè)因素:(1) 序列中同一概念ci前后兩次出現(xiàn)的時(shí)間間隔ti;(2) 在序列中兩個(gè)全新概念的時(shí)間間隔tnew;(3) 概念節(jié)點(diǎn)重要程度 imp(c);(4) 知識(shí)強(qiáng)度Si(t)。通過考慮這四個(gè)因素,我們提出了一種學(xué)習(xí)路徑優(yōu)化算法,來確定概念條目形成的學(xué)習(xí)序列。

      首先,在將要學(xué)習(xí)的概念集合中,應(yīng)當(dāng)選擇更重要和更基礎(chǔ)的概念進(jìn)行優(yōu)先學(xué)習(xí),我們通過重要程度imp(c) 來刻畫,它是反映概念c重要程度的無量綱的參量。我們根據(jù)圖論引入概念c的鏈出數(shù) hout(c) 和鏈入數(shù) hin (c) 兩個(gè)參量,分別定義為有向概念拓?fù)鋱D中c對(duì)應(yīng)的頂點(diǎn)的出度和入度,其實(shí)際意義分別為指向概念c和從概念c指出的超鏈接數(shù)。一個(gè)概念節(jié)點(diǎn)頁面在網(wǎng)絡(luò)中具有更大的鏈接數(shù),表明它與更多概念有著緊密聯(lián)系,而鏈入數(shù)越大說明概念越廣闊,鏈出數(shù)對(duì)概念重要性的貢獻(xiàn)則次之。由于從知識(shí)網(wǎng)絡(luò)上納入待研究集合的都是有效的概念,故而排除了無意義詞條的干擾。我們給出概念節(jié)點(diǎn)c重要程度的計(jì)算公式:

      Si(t) 是概念條目ci關(guān)于時(shí)間t的知識(shí)強(qiáng)度函數(shù),具體組成如下:

      它由三個(gè)部分組成:

      (1)kistart是起始知識(shí)強(qiáng)度,代表了插入概念時(shí),學(xué)習(xí)者已掌握的概念集合與插入概念的相關(guān)程度,當(dāng)引入概念ci時(shí),它便獲得起始知識(shí)值ki0,這個(gè)值取決于其鄰域已知概念數(shù)量的多少,代表了已有知識(shí)背景對(duì)學(xué)習(xí)新詞條的幫助程度。kistart的計(jì)算公式如下:

      其中,int[]為取整函數(shù),nni intro為Ni中已被學(xué)習(xí)的概念節(jié)點(diǎn)數(shù)目,snni為Ni中已被學(xué)習(xí)的概念節(jié)點(diǎn)的凈增知識(shí)強(qiáng)度:

      即我們認(rèn)為兩個(gè)概念之間的正向距離 LF 和反向距離 LB 的平均值更能夠準(zhǔn)確刻畫它們之間的關(guān)系。

      (2)ki(t) 是概念條目ci被學(xué)習(xí)以來的累積重復(fù)記憶次數(shù),也即在每次概念條目ci不遺忘地被重復(fù)時(shí),其知識(shí)強(qiáng)度加 1。

      (3)kiinter(t) 是所學(xué)習(xí)新條目時(shí)對(duì)其相關(guān)條目的反饋增益分量,即當(dāng)每次概念條目ci不遺忘地被重復(fù)時(shí),其引入的鄰居集合Ni中的節(jié)點(diǎn)將得到知識(shí)加強(qiáng)。我們首先定義詞條ci的學(xué)習(xí)對(duì)其鄰居集合Ni知識(shí)強(qiáng)度的整體增量參數(shù)α,其值應(yīng)當(dāng)小于詞條ci自身的知識(shí)強(qiáng)度增量,即α<1。在本文所有的模擬情況中α= 0.5。進(jìn)一步,我們根據(jù)鄰居集合Ni中各節(jié)點(diǎn)的權(quán)值wij來計(jì)算各節(jié)點(diǎn)ci的知識(shí)強(qiáng)度增量kj inter。在本文的算法中,我們令:

      設(shè)定初始情況為:

      初始概念集kbegin中每個(gè)節(jié)點(diǎn)Si(0) =1;

      目標(biāo)概念集klearn中每個(gè)節(jié)點(diǎn)Si(0) =0。

      2.2 學(xué)習(xí)路徑中的拓?fù)浣Y(jié)構(gòu)

      在具體的學(xué)習(xí)序列生成過程中,我們首先將知識(shí)集合K中的概念映射維基百科知識(shí)網(wǎng)絡(luò)中,如圖 1 (a)所示,展示了維基網(wǎng)絡(luò)中概念構(gòu)成的網(wǎng)絡(luò)結(jié)構(gòu),其中紅色的點(diǎn)是知識(shí)集合 K 中的概念,即 A~H,而黑色的點(diǎn)代表不在 K 集合中的概念。從圖中可以看出,維基網(wǎng)絡(luò)中概念頁面之間的超鏈接網(wǎng)絡(luò)作為有向圖,兩點(diǎn)間雙向路徑是不同的,例如,從 A 到 C 需要 2步,而從 C 到 A 只需要 1 步。隨后,去除不在 K 集合中的概念,并計(jì)算出 K 集合中概念之間邊的權(quán)重關(guān)系,如圖 1 (b) 所示為節(jié)點(diǎn)i鄰域內(nèi)學(xué)習(xí)中涉及的概念知識(shí)網(wǎng)絡(luò)局部,圖中各概念節(jié)點(diǎn)間已標(biāo)明了由路徑長(zhǎng)度平均值計(jì)算出的邊的權(quán)重。之后,依據(jù)我們的限定條件,即選擇四步之內(nèi)的點(diǎn)為根據(jù)本文算法選擇出的 i 的鄰居集合Ni局部拓?fù)鋱D,如圖 1 (c) 所示,即去除 G 點(diǎn)。在得到概念的拓?fù)浣Y(jié)構(gòu)之后,我們開始進(jìn)行序列中的概念插入。假設(shè)學(xué)習(xí)者的初始知識(shí)狀態(tài)kbegin={A, B, C, E, F, H},目標(biāo)學(xué)習(xí)知識(shí)klearn={D},如圖1 (d) 所示,紅色表示在原有知識(shí)狀態(tài)中新插入的概念 D,在它周圍是學(xué)習(xí)者已經(jīng)掌握的概念集合 A,B,C,E,F(xiàn),H,其中藍(lán)色表示與 D 關(guān)系緊密的概念即 A,B,C,E,灰色表示關(guān)系疏遠(yuǎn)的概念即 F,H。圖中說明的是由于概念之間的相關(guān)性,在學(xué)習(xí)新的概念時(shí),已經(jīng)掌握的概念集合有一定的基礎(chǔ)意義,會(huì)對(duì)新概念的學(xué)習(xí)產(chǎn)生促進(jìn)作用,如圖中紅線所示;同時(shí),掌握新概念之后,對(duì)其他已掌握概念會(huì)有鞏固作用。

      圖1 概念網(wǎng)絡(luò)拓?fù)鋱D. (a) 維基百科中的概念網(wǎng)絡(luò). (b) 目標(biāo)學(xué)習(xí)集合在維基百科網(wǎng)絡(luò)中的映射. (c) 新插入概念與原有知識(shí)狀態(tài)集合的作用. (d) 掌握新概念后對(duì)已掌握概念的作用Fig. 1 Topology for concepts network

      2.3 學(xué)習(xí)遺忘刻畫

      在學(xué)習(xí)過程中,隨著時(shí)間的增加,人會(huì)出現(xiàn)遺忘現(xiàn)象,因此,需要對(duì)遺忘機(jī)制進(jìn)行刻畫和建模,如圖2 所示。我們將每個(gè)概念的學(xué)習(xí)都分為兩個(gè)階段:準(zhǔn)備復(fù)習(xí)階段和遺忘階段。其中,準(zhǔn)備復(fù)習(xí)階段是概念學(xué)習(xí)之后,在被遺忘之前,能夠隨時(shí)進(jìn)行鞏固復(fù)習(xí)的階段;遺忘階段是概念已經(jīng)被徹底被遺忘,只能重新進(jìn)行學(xué)習(xí)的階段。當(dāng)某個(gè)概念出現(xiàn)在序列中進(jìn)行學(xué)習(xí)后,就立即進(jìn)入準(zhǔn)備復(fù)習(xí)階段,隨著時(shí)間的增加,這個(gè)概念需要復(fù)習(xí)的概率逐漸趨近于 1,超過閾值將會(huì)產(chǎn)生遺忘。因此,在序列生成過程中,必須在概念到達(dá)遺忘階段前,進(jìn)行一次復(fù)習(xí)。

      我們定義Kbegin(t) 為已學(xué)習(xí)節(jié)點(diǎn)的集合,Klearn(t)為待學(xué)習(xí)節(jié)點(diǎn)的集合,它們所包含的概念元素將隨時(shí)間t的推移狀態(tài)不斷更新。在每個(gè)離散時(shí)間點(diǎn)t,對(duì)于在調(diào)度中已經(jīng)引入概念中的概念節(jié)點(diǎn)ci,估計(jì)其距離其上次出現(xiàn)的時(shí)間間隔 Δit= (t-ti),其中ti是概念ci最后一次被引入序列的時(shí)間。Δit越大,代表特定概念前后出現(xiàn)的時(shí)間間隔越大,則概念節(jié)點(diǎn)ci越可能被遺忘。根據(jù)認(rèn)知心理學(xué)研究成果,記憶持續(xù)時(shí)間mSi(t)與知識(shí)強(qiáng)度有近似指數(shù)關(guān)系:

      我們近似地將人類對(duì)知識(shí)點(diǎn)的記憶時(shí)間作為準(zhǔn)備復(fù)習(xí)階段和遺忘階段的臨界點(diǎn),如果 Δit>mSi,則認(rèn)為學(xué)習(xí)者已經(jīng)遺忘這個(gè)概念,需要將其重新放入待學(xué)習(xí)集合Klearn中,并且其知識(shí)強(qiáng)度Si被重置為零。如果Δit≤mSi,則該概念未被遺忘,繼續(xù)處于待復(fù)習(xí)狀態(tài)。

      人類會(huì)產(chǎn)生遺忘,因此要對(duì)已經(jīng)學(xué)過的內(nèi)容進(jìn)行復(fù)習(xí),但是同時(shí)必須考慮是否所有的概念都需要進(jìn)行復(fù)習(xí)。我們需要評(píng)估概念ci的復(fù)習(xí)價(jià)值,用V i rep(t) 表示 t 時(shí)刻概念節(jié)點(diǎn)ci復(fù)習(xí)價(jià)值的評(píng)分公式,這是樣做有兩點(diǎn)原因:(1) 人類的知識(shí)是不斷發(fā)展和變化的,每一個(gè)概念的外延和內(nèi)涵都會(huì)隨著人類對(duì)世界更多的探索而產(chǎn)生變化,伴隨著的是這個(gè)概念的重要性隨著時(shí)間不斷產(chǎn)生的變化。因此,時(shí)間一定時(shí)不同概念在知識(shí)網(wǎng)絡(luò)中的重要性程度會(huì)有區(qū)別,并且同一概念在不同時(shí)間時(shí)重要性程度也會(huì)有不同。例如,有些已經(jīng)過時(shí)和陳舊的知識(shí)沒有反復(fù)復(fù)習(xí)的價(jià)值。(2) 在人類的學(xué)習(xí)過程中,有一些知識(shí)為了是為了對(duì)真正學(xué)習(xí)的內(nèi)容進(jìn)行鋪墊和引入,這些內(nèi)容往往過于簡(jiǎn)單,在復(fù)習(xí)中應(yīng)當(dāng)舍去。另外每個(gè)概念的記憶持續(xù)時(shí)間都是不同的,這就意味著每個(gè)概念都有不同的復(fù)習(xí)臨界點(diǎn)。為了充分利用認(rèn)知心理學(xué)記憶機(jī)制中的滯后效應(yīng),需要使復(fù)習(xí)盡量發(fā)生在接近臨界點(diǎn)mSi(t)的時(shí)刻。我們定義ψSi(Δit) 為概念 i 的復(fù)習(xí)函數(shù),它是 Δit的單調(diào)非遞減函數(shù),且與mSi(t)和Si(t) 相關(guān),來度量在時(shí)間 t重復(fù)引入節(jié)點(diǎn)ci的緊迫性,緊迫性是指該概念容易遺忘,應(yīng)該具有更短的復(fù)習(xí)周期和更高的復(fù)習(xí)優(yōu)先級(jí)。對(duì)任意學(xué)習(xí)項(xiàng)ci,其定義式為:

      圖2 學(xué)習(xí)遺忘規(guī)律刻畫Fig. 2 Illustrations for forgeting mechanism in learning

      在這個(gè)定義中,我們引入LC作為唯一的自由參數(shù),它與學(xué)習(xí)者自身的特點(diǎn)有關(guān)并修正函數(shù)斜率,即LC代表了學(xué)習(xí)者的學(xué)習(xí)方式和學(xué)習(xí)效率。在本文的討論中,不失一般性地我們?cè)O(shè)LC= 23。

      另外,在序列中插入的是新概念而不是重復(fù)引入概念的可能性,取決于距離上一次引入新概念經(jīng)過的時(shí)間間隔。前文定義過,tnew是上一次引入一個(gè)全新學(xué)習(xí)項(xiàng)的時(shí)刻,引入一個(gè)新概念時(shí),若是存儲(chǔ)在遺忘隊(duì)列中的最舊的概念被重新引入,則不更新tnew;如果遺忘隊(duì)列為空,則將新的節(jié)點(diǎn)引入學(xué)習(xí)計(jì)劃表,并且更新tnew。我們用ωnew(t) 來度量在序列中引入新概念的可能性:

      在此基礎(chǔ)上,從當(dāng)前序列最后一個(gè)概念e的鄰居集合中尚未引入的概念條目進(jìn)行選擇。此處考慮到在學(xué)習(xí)后期,前文定義四步之內(nèi)的集合可能已被完全覆蓋,故可將范圍進(jìn)一步擴(kuò)充,直到出現(xiàn)e的第k級(jí)鄰接點(diǎn)未被學(xué)習(xí)。此時(shí)定義e的學(xué)習(xí)鄰居集Nek-th,其中有待學(xué)習(xí)的概念節(jié)點(diǎn)數(shù)為nek-th。

      基于前文給出的概念節(jié)點(diǎn)重要程度 imp(c),我們給出 i 的學(xué)習(xí)鄰居集Nek-th中的歸一化學(xué)習(xí)評(píng)價(jià)權(quán)重Pei,ci為Nek-th中的概念節(jié)點(diǎn)。

      基于在以上討論,我們給出歸一化評(píng)分公式:

      我們選擇t時(shí)刻引入的概念ci,使得V ci(t) 最大,或逐步生成學(xué)習(xí)序列。

      3 實(shí)驗(yàn)過程和效果評(píng)價(jià)

      為了驗(yàn)證提出模型及方法的有效性,我們?cè)O(shè)計(jì)了三種實(shí)驗(yàn)對(duì)提出的學(xué)習(xí)路徑優(yōu)化方法進(jìn)行評(píng)估,評(píng)估主要考慮三個(gè)方面:全面性、一致性和準(zhǔn)確性。其中,全面性測(cè)試為了考察形成的學(xué)習(xí)路徑能否對(duì)所需學(xué)習(xí)的知識(shí)內(nèi)容進(jìn)行較為全面的覆蓋,盡量減少知識(shí)點(diǎn)的遺漏;一致性測(cè)試是通過優(yōu)化后的學(xué)習(xí)路徑與專家路徑進(jìn)行對(duì)比,觀察是能夠盡量貼合人類專家設(shè)計(jì)的學(xué)習(xí)方式;準(zhǔn)確性測(cè)試是通過幾種不同的學(xué)習(xí)方式,最后對(duì)學(xué)習(xí)效果進(jìn)行評(píng)估,觀察學(xué)習(xí)者的最終學(xué)習(xí)效果。

      3.1 全面性測(cè)試

      在全面性測(cè)試中使用的數(shù)據(jù)集是 ACM 課程指導(dǎo)大綱,ACM 與 IEEE 針對(duì)計(jì)算機(jī)相關(guān)課程,從 1968年開始發(fā)布課程指導(dǎo)大綱,至今已經(jīng)發(fā)布了 13 個(gè)版本,共涵蓋計(jì)算機(jī)科學(xué)、信息系統(tǒng)、計(jì)算機(jī)工程、信息技術(shù)和軟件工程五個(gè)學(xué)科,如表 1 所示,我們選擇每個(gè)學(xué)科的最新版本作為數(shù)據(jù)集。每個(gè)學(xué)科的指導(dǎo)大綱都由一些知識(shí)單元組成,在知識(shí)單元中,又包含了需要學(xué)習(xí)的核心概念數(shù)量,例如,計(jì)算機(jī)學(xué)科中包含了 84 個(gè)知識(shí)單元,其中核心概念為 1124 個(gè)。

      通過模型方法對(duì)五個(gè)計(jì)算機(jī)學(xué)科的學(xué)習(xí)路徑進(jìn)行推薦,將生成的概念序列與原始知識(shí)單元和核心概念進(jìn)行比對(duì),結(jié)果顯示優(yōu)化后的學(xué)習(xí)路徑能夠覆蓋100% 知識(shí)單元的內(nèi)容,并且都能夠獲得 85% 以上的概念覆蓋率,這表明提出的算法能夠涵蓋所需要學(xué)習(xí)的知識(shí)集合中大部分核心內(nèi)容。

      3.2 一致性測(cè)試

      在一致性測(cè)試測(cè)試中,我們選擇了在高校中被普遍被使用的 C 語言教科書《Programming C》作為數(shù)據(jù)集。我們從中選擇了 3 個(gè)知識(shí)單元,即數(shù)組、指針和循環(huán)語句。對(duì)于每個(gè)知識(shí)單元,我們?nèi)斯さ爻槿〕鲚^為核心的概念,例如我們?cè)诮炭茣P(guān)于數(shù)組一節(jié)中抽取出 31 個(gè)需要學(xué)習(xí)的核心概念,隨后我們請(qǐng)計(jì)算機(jī)專家對(duì)所需學(xué)習(xí)的核心概念進(jìn)行一個(gè)排序,我們稱之為專家排序,專家排序代表了在這個(gè)知識(shí)單元中較為合理和準(zhǔn)確的學(xué)習(xí)路徑。

      我們通過三種方式來生成學(xué)習(xí)路徑的概念序列:(1) 隨機(jī)學(xué)習(xí),對(duì)所需學(xué)習(xí)的概念集合隨機(jī)地生成一個(gè)學(xué)習(xí)序列;(2) 順序?qū)W習(xí),通過概念在原教科書中出現(xiàn)的先后順序生成學(xué)習(xí)序列;(3) 通過本文算法,評(píng)估概念在知識(shí)網(wǎng)絡(luò)中的基礎(chǔ)程度和重要性程度,并結(jié)合已掌握知識(shí)狀態(tài)和新引入概念的網(wǎng)絡(luò)關(guān)系生成學(xué)習(xí)路徑。對(duì)于三種不同方式生成的學(xué)習(xí)路徑,我們使用三種評(píng)價(jià)指標(biāo),即 MAP (Mean Average Precision)[17]、NDCG (Normalized Discounted Cumulative Gain)[18]和MRR (Mean Reciprocal Rank)[19]進(jìn)行評(píng)估,評(píng)估得分在 0~1 之間,越趨近于 1 表明與專家路徑的誤差越小。評(píng)估結(jié)果如表 2 所示,本文算法最高能夠達(dá)到0.94,在與專家建議的學(xué)習(xí)路徑符合程度上明顯高于隨機(jī)學(xué)習(xí)和順序?qū)W習(xí)。

      3.3 準(zhǔn)確性測(cè)試

      在準(zhǔn)確性測(cè)試中,我們將 20 個(gè)未接觸過 C 語言課程的本科生分為 4 組,每組 5 人,分別學(xué)習(xí)數(shù)組、指針和循環(huán)語句這 3 個(gè)知識(shí)單元的內(nèi)容:第一組采用隨機(jī)學(xué)習(xí)的方式,從所需學(xué)習(xí)的概念集合中隨機(jī)地選擇概念進(jìn)行學(xué)習(xí);第二組采用順序?qū)W習(xí)的方式,按照教課書中概念出現(xiàn)的先后順序進(jìn)行學(xué)習(xí);第三組采用本文提出的方法進(jìn)行學(xué)習(xí),不考慮概念的復(fù)習(xí)因素;第四組仍然使用本文提出的學(xué)習(xí)方法,并結(jié)合每個(gè)概念的重要性程度和復(fù)習(xí)周期進(jìn)行復(fù)習(xí)。通過以上四種方式進(jìn)行學(xué)習(xí)后,在整個(gè)學(xué)習(xí)周期結(jié)束后進(jìn)行一次試題測(cè)試,試題涵蓋這 3 個(gè)知識(shí)單元中所有概念內(nèi)容。如表 3 所示為通過不同學(xué)習(xí)方式得到的最后測(cè)試的平均得分,從結(jié)果可以發(fā)現(xiàn),本文算法相比按照教科書中概念出現(xiàn)的先后進(jìn)行順序?qū)W習(xí),得到了更好的學(xué)習(xí)效果,另外,考慮復(fù)習(xí)策略能夠得到更高的得分,這也驗(yàn)證了知識(shí)具有遺忘性,進(jìn)行間隔性地復(fù)習(xí)能夠鞏固和提高學(xué)習(xí)效果。

      表1 生成學(xué)習(xí)路徑與目標(biāo)學(xué)習(xí)集合的全面性測(cè)試Table 1 The comprehensive test with comparing generated learning path and expected outcomes

      表2 生成學(xué)習(xí)路徑與專家路徑的一致性測(cè)試Table 2 Consistence test with generated learning path and human experts' suggestion

      表3 通過四種不同方式學(xué)習(xí)的學(xué)習(xí)效果比較Table 3 Learning outcomes comparing by four different learning style

      4 結(jié)論

      本文利用維基網(wǎng)絡(luò)中概念的鏈接關(guān)系,建立了知識(shí)網(wǎng)絡(luò)中節(jié)點(diǎn)的相互作用,結(jié)合新概念與學(xué)習(xí)者當(dāng)前狀態(tài)集合的節(jié)點(diǎn)關(guān)系,提出了一種學(xué)習(xí)路徑的優(yōu)化模型及方法。提出的方法考慮了學(xué)習(xí)者隨著時(shí)間產(chǎn)生的遺忘機(jī)制,并對(duì)每個(gè)概念重要性進(jìn)行評(píng)估后給出不同的復(fù)習(xí)周期。在測(cè)試中,優(yōu)化后的學(xué)習(xí)路徑能夠覆蓋超過 85% 的知識(shí)點(diǎn),生成的概念序列與專家序列的吻合度最高達(dá)到 96.3%,學(xué)習(xí)者通過優(yōu)化后的學(xué)習(xí)路徑進(jìn)行學(xué)習(xí),取得了良好的學(xué)習(xí)效果。

      [1]張立波, 張飛, 羅鐵堅(jiān). 計(jì)算機(jī)科學(xué)知識(shí)體系演化與評(píng)估方法[J]. 中國(guó)科學(xué)院大學(xué)學(xué)報(bào), 2016, 33(6): 844-850.

      [2]Novikoff T P, Kleinberg J M, Strogatz S H. Education of a model student[J]. Proceedings of the National Academy of Sciences of the United States of America, 2012, 109(6):1868.

      [3]Collins A M, Quillian M R. Facilitating retrieval from semantic memory: The effect of repeating part of an inference [J]. Acta Psychologica, 1970, 33(368): 304-314.

      [4]Collins A M, Loftus E F. A Spreading-Activation Theory of Semantic Processing[J]. Psychological Review, 1988,82(6): 126-136.

      [5]PIETRO GRAVINO, VITO D. P. SERVEDIO, ALAIN BARRAT, et al. COMPLEX STRUCTURES AND SEMANTICS IN FREE WORD ASSOCIATION[J].Advances in Complex Systems, 2012, 15(03n04):1250054-1-1250054-22.

      [6]Cancho R F I, Solé R V. The small world of human language[J]. Proceedings Biological Sciences, 2001,268(1482):2261.

      [7]Swadesh M. The large-scale structure of semantic networks: statistical analyses and a model for semantic growth[J]. Cognitive Science, 2005, 29(1):41.

      [8]Borge-Holthoefer J, Javier Borge@urv Cat.Navigating word association norms to extract semantic information[J]. Chinese Journal of Chemistry, 2009,28(2): 269-272.

      [9]Griffiths T L, Steyvers M, Firl A. Google and the mind:Predicting fluency with PageRank[J]. Psychological Science, 2007, 18(12): 1069-1076.

      [10]Ebbinghaus H. Memory: a contribution to experimental psychology[J]. Annals of neurosciences, 2013, 20(4): 155-156.

      [11]Principles of learning and memory[M]. Birkh?user, 2012.

      [12]Hintzman D L. Theoretical implications of the spacing effect[J]. 1974.

      [13]Bahrick H P, Hall L K. The importance of retrieval failures to long-term retention: A metacognitive explanation of the spacing effect[J]. Journal of Memory and Language, 2005,52(4): 566-577.

      [14]Cepeda N J, Pashler H, Vul E, et al. Distributed practice in verbal recall tasks: A review and quantitative synthesis[J].Psychological bulletin, 2006, 132(3): 354.

      [15]Luo T, Zhang L, Yang L, et al. TACE: A Toolkit for Analyzing Concept Evolution in Computing Curricula[C]//The, International Conference on Software Engineering and Knowledge Engineering, SEKE. 2016.

      [16]張立波, 孫一涵, 羅鐵堅(jiān). 一種基于大規(guī)模知識(shí)庫(kù)的語義相似性計(jì)算方法 [J]. 計(jì)算機(jī)研究與發(fā)展, 2018.

      [17]Liu L, ?zsu M T. Mean Average Precision[M]. Springer US, 2009.

      [18]Busa-Fekete R, Szarvas G, éltetho T, et al. An appleto-apple comparison of Learning-to-rank algorithms in terms of Normalized Discounted Cumulative Gain[C]//ECAI-12 Workshop, Preference Learning: Problems and Applications in AI. 2012.

      [19]Craswell N. Mean Reciprocal Rank[M]. Springer US,2009.

      [20]楊林, 張立波, 羅鐵堅(jiān), 萬啟陽, 武延軍. 一種基于鏈接和語義關(guān)聯(lián)的知識(shí)圖示化方法 [J]. 計(jì)算機(jī)研究與發(fā)展,2017 Vol. 54 (8): 1655-1664.

      [21]張立波. 知識(shí)網(wǎng)絡(luò)學(xué)習(xí)路徑圖的優(yōu)化, 中國(guó)科學(xué)院大學(xué)博士論文, 2017 年.

      猜你喜歡
      維基百科學(xué)習(xí)者概念
      維基百科影響司法
      英語世界(2023年10期)2023-11-17 09:18:46
      Birdie Cup Coffee豐盛里概念店
      維基百科青年
      英語文摘(2021年8期)2021-11-02 07:17:46
      你是哪種類型的學(xué)習(xí)者
      幾樣概念店
      十二星座是什么類型的學(xué)習(xí)者
      學(xué)習(xí)集合概念『四步走』
      聚焦集合的概念及應(yīng)用
      漢語學(xué)習(xí)自主學(xué)習(xí)者特征初探
      APP
      沂南县| 呼和浩特市| 正宁县| 慈利县| 南靖县| 峡江县| 钟山县| 沂源县| 嘉禾县| 胶南市| 英山县| 古丈县| 自治县| 恩施市| 玉龙| 策勒县| 九龙县| 峨眉山市| 若羌县| 仁寿县| 鄢陵县| 曲阜市| 禹城市| 台南县| 正安县| 高密市| 保山市| 济宁市| 江口县| 永康市| 油尖旺区| 淮阳县| 东丽区| 扶沟县| 兴义市| 金溪县| 宁河县| 和龙市| 玛多县| 营口市| 华容县|