【摘要】 隨著計算機技術的發(fā)達,遠程教育已經成為現代教育的重要方式之一。智能在線答疑系統(tǒng)能夠實現教育資源的優(yōu)化共享,并且為學生提供教學輔導和交流機會,因此具有積極意義。但其數據挖掘的設計還存在一定的技術問題,為了解決這一問題,文章將我國遠程教育智能在線答疑系統(tǒng)的數據挖掘設計過程進行了具體的闡述和分析。
【關鍵詞】 遠程教育 智能答疑系統(tǒng) 數據挖掘 設計 網絡日志
遠程教育已經得到越來越多教育者的認可,其優(yōu)勢在于提高了教學效率,節(jié)約了時間,并且解決了空間上的問題。但學員分散,問題不集中是主要問題。因此建立在線答疑系統(tǒng)并實現其智能化十分重要。遠程教育答疑系統(tǒng)經歷了多個階段的發(fā)展,目前已經取得了一定的成就。其中,數據挖掘技術的提高是其關鍵點,個性化學習導航的設計在這個過程中起到了積極的作用。
一、基于網絡日志的數據挖掘方法
智能在線答疑系統(tǒng)由持久數據與即時數據組成。前者支持在線答疑涉及的資料和數據庫。后者是對讀者信息的記錄,產生于操作者的系統(tǒng)應用過程中。根據即時信息可了解學習者狀態(tài),學習行為以及出現問題的信息記錄,尤其是用來分析用戶的特定知識理解能力。為了確保導航系統(tǒng)的高效性,數據挖掘應采取分層信息資源記錄方式。通過這些信息,學習者的學習狀態(tài),存在問題清晰可見。學??蔀閷W生解決其提問頻率相對較高的內容。以Web服務器日志訪問為例,被訪問的服務器會產生相應的系統(tǒng)日志,這些日志就是用戶的主要表現。其主要內容包括:訪問者的網絡IP 、時間戳、訪問方法、被訪問文件的URL及其協(xié)議、狀態(tài)請求、數字傳輸的字節(jié)等。Web服務器將完整的記錄用戶的登錄信息,因此其設計方法應考慮對日志的預處理后的結果。其中,請求頁面和服務器提問頁面將保存用戶信息?;谖墨I提出方法,對用戶日志文件進行處理,對原始Web日志產生的數據進行處理,使其能夠與數據挖掘方法相適應,以便于實現網絡日志數據挖掘的實施。其流程主要包括:
(1)數據凈化:即過濾Web日志提供的有效數據,以便于對用戶狀態(tài)進行分析。其中包括:登錄者的IP與ID、用戶申請和瀏覽的頁面以及訪問實踐和內容以及錯誤代碼在內。但文章所研究的數據挖掘實際上只與用戶的IP地址、登錄ID和瀏覽頁面具有直接關系,也就是其訪問的信息,與網頁本身的性能和產生的錯誤信息無關,因此可單獨研究與其相關的用戶訪問記錄。通過數據凈化,刪除與用戶數據挖掘無關的信息,實現快速數據挖掘,解決網絡用戶的問題。
(2)用戶識別:用戶識別具有多種方法,其中包括:根據IP的變化判斷新舊用戶,從而確定用戶的基本信息。在IP地址相同的前提下, 則查找操作系統(tǒng)或者用戶端瀏覽器軟件是否發(fā)生變化,如果并未發(fā)生任何變化,則認定為同一用戶,反之則認定為用戶更改。另外,還可通過站點拓撲來判斷是否為新用戶,判斷標準為用戶所請求的頁面是否能從已訪問的頁面到達,如不能,則判定為用戶改變。
(3)用戶會話識別:會話識別的目的在于拆分用戶訪問記錄,使其成為單獨的多個對話。不同的訪問頁面則劃分為不同的會話。但存在相同用戶的較長時間訪問,則采用超時方法設定一定的時間界限,超過這個界限則視為新的會話。
(4)提問模式識別:提問模式識別即提取用戶提問模式特征。智能在線答疑系統(tǒng)多存在于受限領域中, 因此具有局限性。因此我們定義如下文法規(guī)則:
::=[V]+E+Z+D|[V]+D+Z+E|
V::=[<查詢動詞>]
D::=[<查詢副詞>]
Z::=[<謂詞>|<助詞>]
E::=<名詞>E是能夠在領域知識庫中識別的關鍵詞。
根據上述規(guī)則,可建立用戶問題模擬系統(tǒng)。從而尋找最佳問題,實現數據挖掘。
二、遠程教育智能答疑系統(tǒng)中的數據挖掘設計結構分析
在數據預處理過程中,通過對用戶提問的數據處理獲得數據特征,并通過與原系統(tǒng)數據的對比構建智能在線答疑框架,實現知識庫更新。資源庫與知識庫之間具有一定的關系,這決定了其需要不斷的更新和調整,以滿足對方的特征,為用戶提供更豐富的途徑。文章所構建的遠程在線答疑系統(tǒng)屬于智能個性化系統(tǒng),能夠滿足不同的行為特征。本系統(tǒng)通過數據挖掘模塊的增加, 并針對用戶的提問記錄進行更新,能夠滿足多用戶的需求,運行效率較高,因此具有較大的優(yōu)勢。
三、總結
通過對遠程教育智能在線答疑系統(tǒng)中的數據挖掘設計進行分析,實現新的智能在線答疑數據庫。遠程教育的廣泛應用使得其在線答疑系統(tǒng)的數據挖掘設計十分重要。為了明確這一問題,文章針對智能答疑系統(tǒng)中用戶訪問日志等問題進行了具體的分析,設計了基于網絡日志數據挖掘的智能答疑系統(tǒng)。并且分析了這一系統(tǒng)的優(yōu)越性和缺陷,以便于進一步改善這一技術,提高我國遠程教育的效率,實現教育形勢的改革,滿足社會的需求。
參 考 文 獻
[1]李曉晨,宋正江.基于網絡學習的智能答疑系統(tǒng)的研究[J].科技風,2010(14).
[2]李思.數據挖掘在學科建設中的應用研究[J].科學大眾(科學教育), 2012(9).
[3]杜芳芳.數據挖掘技術在遠程教學輔助系統(tǒng)中的應用研究[J].河南科技,2011(12).
[4]王夙娟.數據挖掘自動答疑系統(tǒng)數據倉庫的設計與研究[J].黑龍江科技信息,2012(23).