• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基礎教育課程知識圖譜構建技術框架研究

    2019-09-10 07:22:44朱曉悅杜雨雯王家若
    南北橋 2019年18期
    關鍵詞:知識圖譜基礎教育

    朱曉悅 杜雨雯 王家若

    【摘? ? 要】基礎教育知識圖譜能體現出知識之間的聯系,以可視化方式向教師與學生反饋結構化知識,進行教學支架服務,輔助學生進行知識管理和教師教與學的設計。本文從基礎教育知識圖譜構建的框架出發(fā),分實體抽取和實體關系抽取兩個角度研究知識圖譜構建的技術路徑,并生成高中數學必修二的知識圖譜。

    【關鍵詞】知識圖譜? 實體抽取? 實體關系抽取? 基礎教育

    中圖分類號:G4? ? ? 文獻標識碼:A DOI:10.3969/j.issn.1672-0407.2019.18.007

    一、緒論

    (一)研究背景與意義

    在課堂教學過程中,教師通過圖像、視頻、互動軟件等多媒體教學載體的應用,教學知識的表達有了越來越多圖形化、生動化的展現方式。隨著大數據與機器學習的深入發(fā)展,通過數據挖掘的方式能夠發(fā)現更深層次的知識聯系。知識圖譜就是其中一種表達方式,知識圖譜是結構化的語義知識庫,用于以符號形式描述物理世界中的概念及其相互關系:實體間通過關系相互聯結,構成網狀的知識結構。

    (二)國內研究現狀

    知識圖譜的應用領域一般具有“新”或“熱”的特征,旨在通過對目標領域的分析把握其發(fā)展態(tài)勢。因此,統計并梳理知識圖譜應用領域的新關鍵詞,可以窺見我國各時間段的研究重點及整體趨勢。1.研究重點。從關鍵詞來看,我國知識圖譜應用較多的是對某學科和某主題進行知識圖譜分析。如學科知識圖譜:王琪等以1991-2009年間與“體育”相關的博士論文為數據,深入探討了科學知識圖譜在體育學科研究中的應用前景。如主題知識圖譜:王晴用CitespaceⅢ分析2015年以前的“慕課”研究相關文獻,發(fā)現當前我國“慕課”研究的熱點集中在技術支持、教學效果、教學活動、教學模式等問題。2.整體趨勢。時代化。通過觀察知識圖譜應用領域的相關關鍵詞發(fā)現,從“數據挖掘”到“云計算”再到“慕課”,知識圖譜的研究對象一直緊跟時代、與時俱進。通過研讀論文發(fā)現,目前中國在學科知識圖譜方面的研究還是比較缺乏的,而本項目的研究內容就關注于基礎教育學科的知識數據庫的建立,并通過知識圖譜建立一個知識框架,以作為一個學科標準對照。

    二、知識圖譜構建技術框架

    (一)實體抽取

    實體抽取是圖譜構建中最關鍵的步驟,它是決定了圖譜質量的關鍵。簡單來說實體抽取就是從文本中抽取關鍵詞,實體抽取流程大致如圖2-1所示,將文本切分成獨立的詞,并對詞進行分析(本質是聚類分析),常見方法有機器學習分析、統計分析與語義分析,由于技術水平等限制,我們采用了統計分析方式。

    1.分詞。分詞是將連續(xù)字符串切分成詞的過程,為避免漏詞,本項目使用ansj分詞工具中的最小顆粒度分詞再進行復合詞拼接,將文本中的內容切分成獨立的詞,并進行詞性標注。同時在分詞結果中進行詞性過濾,考慮到漢語語法,作為關鍵詞只保留動詞相關、名詞相關等詞性。2.復合詞拼接。需要將分割后的詞拼接,以達到較高的召回率,本項目采用基于統計的規(guī)則進行拼接,主要體現在兩點上:互信息與信息熵。這里簡單介紹:互信息體現兩個變量的相互依賴程度,常用定義如下:

    其中X、Y表示相鄰詞語,該公式為相鄰詞出現的概率與作為單獨詞出現的概率之比的對數,數值越大則說明二者作為一個詞的概率較大信息熵主要是用詞語的左邊界熵和右邊界熵,用來判斷兩個詞出現的順序可能性。3.關鍵詞抽取。在得到候選復合詞之后,需要進行進一步處理得到關鍵詞。關鍵詞作為一篇文章中重要的詞,其特點是出現頻率高并且與其他文章相關度不高,綜合考慮下,本項目使用簡單的TF-IDF算法進行關鍵詞抽取,TF-IDF算法用以評估某詞對文檔集的重要程度。計算公式如:TF-IDF=TF*IDF

    (二)實體關系抽取

    在提取完實體后,需要進行實體間關系的抽取。本文中,分類關系和非分類關系是兩種主要的實體關系類型。分類關系中最典型的是上下位關系,它表明了上位詞和下位詞之間的層次關系,例如銳角與三角形。而非分類關系體現了實體之間的關聯性,實體間沒有層次之分,例如銳角與鈍角。在獲得實體間分類關系的過程中,我們利用字符串匹配法。即通過字符串匹配遍歷列表中的詞,提取概念之間的詞串包含關系,這種概念之間的分類關系是顯而易見的。在獲取實體間非分類關系的過程中,本項目采用了Apriori算法。通過計算支持度(support)、置信度(confidence)和提升度,找出數據中的頻繁項集,從而挖掘出數據間的關聯規(guī)則。

    三、結果分析

    按照上述流程,采用手動+自動結合的方式,以人教版高中數學必修一為例,提取教案、課本、教材等57個純文本文件作為語料,手動設置閾值,將最終得到的實體與實體關系通過網頁D3.js展現出如下圖所示結果:

    由于是人工評測(實際應為由現有語料庫自動評測,但限于項目人工調整閾值等因素,采用專家評估),單就實體抽取來說結果如下:抽取詞共37個,實際應有實體98個,錯誤1個

    P=97.3%? R=36.7%? F=53.2%

    總的來看:我們過于追求準確而丟失了很多數據,導致F值有點低,且由于是人工調整閾值效率極低,需要改進方法。

    參考文獻

    [1]劉嶠等:《知識圖譜構建技術綜述》,《計算機研究與發(fā)展》2016年第三期.

    [2]王琪,徐成立.知識圖譜視野下我國體育科學研究的發(fā)展路徑——基于1991~2009年體育學博士論文關鍵詞共詞網絡的可視化分析[J].體育學刊,2010,17(12):118-125.

    猜你喜歡
    知識圖譜基礎教育
    國內圖書館嵌入式服務研究主題分析
    現代情報(2016年10期)2016-12-15 12:32:46
    國內外政府信息公開研究的脈絡、流派與趨勢
    現代情報(2016年10期)2016-12-15 12:27:57
    近十五年我國小學英語教學研究的熱點、問題及對策
    基于知識圖譜的產業(yè)集群創(chuàng)新績效可視化分析
    智富時代(2016年12期)2016-12-01 16:28:41
    河南省基礎教育信息化現狀調查
    基于知識圖譜的智慧教育研究熱點與趨勢分析
    高等師范??茖W校兒童水墨畫課程教材研發(fā)的必要性
    藝術科技(2016年9期)2016-11-18 16:06:11
    改革開放以來我國基礎教育課程政策話語的遷嬗
    科教導刊(2016年25期)2016-11-15 17:35:04
    教育均衡發(fā)展:現代教育發(fā)展的新境界
    人間(2016年28期)2016-11-10 22:22:42
    “中國夢”之中國“自主高考”夢
    文教資料(2016年19期)2016-11-07 10:58:38
    盱眙县| 桑日县| 仙桃市| 渑池县| 尚志市| 苍梧县| 高安市| 阜康市| 扎鲁特旗| 安新县| 定襄县| 滦南县| 耒阳市| 积石山| 贡嘎县| 方城县| 兴国县| 兴城市| 阳曲县| 吴江市| 太仆寺旗| 揭阳市| 象山县| 临朐县| 和林格尔县| 韶关市| 栾城县| 嵊州市| 深州市| 石狮市| 邯郸市| 盐津县| 澎湖县| 绥中县| 建始县| 县级市| 北宁市| 浦东新区| 巴塘县| 宁津县| 四平市|