薛靜 程達(dá)
摘 要:在線練習(xí)是在線教育的必備一環(huán),但從傳統(tǒng)線下教育轉(zhuǎn)到線上教育時(shí)需要將往年積累的海量習(xí)題導(dǎo)入在線教育配套的數(shù)據(jù)庫中。這一過程會消耗大量的人力、財(cái)力,出現(xiàn)效率低、出錯(cuò)率等一系列問題。針對這些問題,文章提出一種基于神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn)模型。
關(guān)鍵詞:題目解析;在線教育;TensorFlow;神經(jīng)網(wǎng)絡(luò)
0? ? 引言
該研究目標(biāo)是改變?nèi)肆χ祁}導(dǎo)題,實(shí)現(xiàn)全自動化解析處理。目前,市場上人力導(dǎo)題的普遍方法是,首先下載電子版試題,然后在每一題的指定位置上以人工的方式加入試題所需標(biāo)記,然后計(jì)算機(jī)遍歷試題文檔,按指定的標(biāo)記解析出對應(yīng)的題目、題型與題號等數(shù)據(jù)。
1? ? 基于神經(jīng)網(wǎng)絡(luò)的軟件系統(tǒng)設(shè)計(jì)
整套軟件系統(tǒng)由服務(wù)端與測試客戶端(demo)組成,并提供可用于第三方集成的SDK。
1.1? 服務(wù)端設(shè)計(jì)
1.1.1? 服務(wù)端架構(gòu)
服務(wù)端采用的是SOA架構(gòu),由Service Interface層、Service Bus層和 Persistence層組成。使用的技術(shù)框架包括:Flask與TensorFlow。ServiceInterface與ServiceBus由Flask框架+TensorFlow框架結(jié)合RabbitMQ實(shí)現(xiàn),其中識別處理與模型訓(xùn)練由TensorFlow實(shí)現(xiàn)[1]。Persistence由MySQL實(shí)現(xiàn)。
1.1.2? 服務(wù)端模塊
服務(wù)端由服務(wù)接口層、服務(wù)總線層、數(shù)據(jù)持久化層組成。服務(wù)接口層是面向用戶或者二次開發(fā)人員的endpoint,提供的接口有4個(gè)。
(1)用戶注冊接口。
用戶注冊接口主要用于注冊使用的用戶,請求地址為 IP/reg,請求參數(shù)如表1所示。
(2)題目上傳接口。
題目上傳接口用于用戶提交試題文檔,請求參數(shù)如表2所示。
(3)題目解析接口。
題目解析接口用于用戶獲取題目的智能解析結(jié)果,請求參數(shù)如表3所示,返回參數(shù)如表4所示。
另外,還有識別處理模塊及模型訓(xùn)練模塊的設(shè)計(jì),識別處理模塊的目標(biāo)是識別出文檔中的所有試題,并且做到準(zhǔn)確拆分試題,之后識別題型,從而生成標(biāo)準(zhǔn)化試題[2]。根據(jù)特征識別試題的偏移量就成為拆分試題文檔的關(guān)鍵。模型訓(xùn)練模塊是提升試題識別能力的關(guān)鍵。其分為題型模型、題號模型與題干模型等。前文已經(jīng)論述如何提取題號偏移量,最終達(dá)到提取試題的目的。因此,提升題號識別能力,訓(xùn)練題號模型就成為提高拆分試題準(zhǔn)確率的核心。
2? ? 實(shí)驗(yàn)結(jié)果
點(diǎn)擊“解析試卷”后,從服務(wù)器返回的結(jié)果可以清楚看到所用時(shí)間情況和試題的解析情況。原試卷是一套完整的帶標(biāo)準(zhǔn)答案的初中數(shù)學(xué)試卷,其中包含選擇、填空和解答三種題型,沒有做任何的標(biāo)記處理。經(jīng)服務(wù)端解析后,進(jìn)行了準(zhǔn)確的切分,從試卷中提取出每個(gè)試題,并識別出對應(yīng)的題型。
實(shí)驗(yàn)過程中用一套完整的初中數(shù)學(xué)試卷作為實(shí)驗(yàn)用例,試卷中包含選擇題12道、填空題4道、計(jì)算題6道。人力制題,用時(shí)48分鐘,平均每題用時(shí)約2.2分鐘,折合132秒。利用該軟件制題,用時(shí)7.35秒,平均每題0.33秒。由此可見,制題效率得到極大的提升,實(shí)現(xiàn)了本文的研究目標(biāo)。
3? ? 結(jié)語
本文的研究是在充分調(diào)研在線教育行業(yè)現(xiàn)狀的基礎(chǔ)上展開的。首先,針對目前基于word人工制作可用于大數(shù)據(jù)學(xué)情分析的標(biāo)準(zhǔn)化試題的現(xiàn)狀,本文提出了完整的提升效率的方案。其次,研究并建設(shè)了完整的軟件實(shí)驗(yàn)環(huán)境。最后,用相同的一套試題分別測試了人工制題和AI制題的效率,測試結(jié)果充分證明了該研究的必要性和重要性。
[參考文獻(xiàn)]
[1]朱溦.神經(jīng)網(wǎng)絡(luò)結(jié)合平均影響值方法篩選變量[J].產(chǎn)業(yè)與科技論壇,2017(1):78-79.
[2]俞頌華.卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展與應(yīng)用綜述[J].信息通信,2019(2):39-43.
(編輯 王永超)