劉強 鄧曉衡
【摘 要】文章分析了高校當前本科畢業(yè)設計管理的現(xiàn)狀,基于畢業(yè)設計的動態(tài)管理過程,將原本復雜繁瑣的過程進行優(yōu)化,通過互聯(lián)網(wǎng)技術(shù)實現(xiàn)使其簡單化、智能化。文章對畢業(yè)設計管理平臺相關功能進行了分析,并對核心功能選題模塊中用到的Gale-Shapley婚姻匹配算法、相似度檢測模塊中涉及的網(wǎng)絡爬蟲、正文提取算法、分詞算法、相似度檢測算法進行了論述。系統(tǒng)基于B/S模式架構(gòu),并通過設計移動APP,使用戶可以通過各類終端提交畢業(yè)設計過程資料,極大地方便了畢業(yè)設計管理工作。
【關鍵詞】畢業(yè)設計管理;婚姻匹配;網(wǎng)絡爬蟲;相似度檢測
【中圖分類號】TP311.52 【文獻標識碼】A 【文章編號】1674-0688(2016)11-0037-03
0 引言
進入21世紀以來,互聯(lián)網(wǎng)技術(shù)迅速發(fā)展,給各類產(chǎn)業(yè)實現(xiàn)信息化提供了必要條件。作為走在時代前沿的高等學校,信息化建設步伐也相對較快,寬帶校園、數(shù)字化校園、移動校園、智慧校園等信息化建設項目應運而生[1]。
畢業(yè)設計作為高校必備的教學環(huán)節(jié)之一,如何實現(xiàn)信息化已經(jīng)受到各高校的重視。由于畢業(yè)設計持續(xù)周期較長,中間環(huán)節(jié)多而雜;再者,在當前就業(yè)形式下,學生在畢業(yè)設計期間基本要在參加招聘會和畢業(yè)設計之間來回奔波,由于學生所在地的不確定,加上當前互聯(lián)網(wǎng)技術(shù)日益發(fā)達,采用B/S結(jié)構(gòu)的軟件實現(xiàn)畢業(yè)設計全過程的監(jiān)控管理,有著迫切的需求和較好的實用價值[2-3]。
同時,由于互聯(lián)網(wǎng)技術(shù)的發(fā)展,網(wǎng)絡共享資源日益豐富,學生接觸的信息面越來越廣,網(wǎng)絡文檔對畢業(yè)設計各環(huán)節(jié)的影響也越來越大,甚至有學生直接下載論文應付了事。面對這些學術(shù)不端行為,如何進行管控,也需要信息化手段進行輔助[4]。
設計實現(xiàn)一個畢業(yè)設計管理平臺,并引入移動互聯(lián)網(wǎng)應用,使教師、學生、管理員通過系統(tǒng)完成畢業(yè)設計全階段的工作,對畢業(yè)設計監(jiān)控管理有著現(xiàn)實的意義,對提高高校教學水平、提高畢業(yè)生質(zhì)量有著重要的意義[5]。
1 系統(tǒng)分析
1.1 系統(tǒng)總體架構(gòu)
畢業(yè)設計管理系統(tǒng)主要是針對畢業(yè)設計全過程的監(jiān)控,并且設置不同的角色來進行分類管理。系統(tǒng)充分利用互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)的優(yōu)勢,使管理過程實現(xiàn)網(wǎng)絡化、智能化。
平臺主要使用PHP完成服務器端腳本的編寫,使用MYSQL數(shù)據(jù)庫對畢業(yè)設計期間產(chǎn)生的各種數(shù)據(jù)進行分析和管理??紤]到當前移動互聯(lián)網(wǎng)的發(fā)展狀況,以及畢業(yè)設計期間學生找工作對畢業(yè)設計工作的影響,平臺設計實現(xiàn)了一個基于android平臺的移動APP,方便學生和教師隨時隨地了解畢業(yè)設計信息。移動APP由JAVA開發(fā),而為了實現(xiàn)數(shù)據(jù)的統(tǒng)一性,移動APP對系統(tǒng)數(shù)據(jù)訪問仍舊采用PHP編寫的API完成。利用PHP編寫API也為后期實現(xiàn)IOS應用提供了方便[5]。
1.2 功能需求分析
畢業(yè)設計網(wǎng)絡化管理平臺設計是面向全校的一個開放式畢業(yè)設計管理,因此畢業(yè)設計平臺包含的角色有學生、教師、系部管理員、院管理員、超級管理員。因為平臺是基于Web模式的,所以學生和老師在具備Internet訪問條件的任何地點都可以訪問系統(tǒng)。
1.3 業(yè)務流程分析
系統(tǒng)是根據(jù)教師和學生在整個畢業(yè)設計過程中所經(jīng)歷的階段和各階段工作任務的特點而開發(fā)的,并根據(jù)信息系統(tǒng)特點,對部分流程進行了優(yōu)化。優(yōu)化后畢業(yè)設計流程如圖1所示。
畢業(yè)設計工作的14個環(huán)節(jié)首先從發(fā)布畢業(yè)設計通知、啟動畢業(yè)設計系統(tǒng)開始,按照執(zhí)行的先后次序,依次被分為選題階段的教師資格申報、課題申報、選題、下達任務、開題報告;其次是整個畢業(yè)設計中間環(huán)節(jié)的檢查,包括前期、中期、提交、檢測、評閱等;最后階段則是論文答辯、論文修改和各類材料的歸檔。當學生完成開題,畢業(yè)設計課題即成為貫穿畢業(yè)設計過程的主線[6]。
2 系統(tǒng)設計與實現(xiàn)
2.1 系統(tǒng)功能設計
根據(jù)對畢業(yè)設計的總體調(diào)研及分析,將畢業(yè)設計系統(tǒng)分為基礎信息管理、參數(shù)設置、教師信息管理、學生信息管理、課題信息管理、分組信息管理、文檔管理、數(shù)據(jù)管理、相似度檢測、評閱管理、新聞管理11個功能模塊[6],畢業(yè)設計系統(tǒng)總體功能模塊圖如圖2所示。
畢業(yè)設計管理平臺采取分角色的權(quán)限控制,對不同的功能模塊,不同的用戶進入之后,將具有不同的訪問權(quán)限和不同的結(jié)果顯示。
2.2 系統(tǒng)實現(xiàn)相關算法
2.2.1 自動分組
指導教師通過導師資格審核、完成課題申報,且經(jīng)過系管理員審核通過后,學生即可進行課題的選擇。在課題選擇和分組時,考慮到大多數(shù)高校都要求一人一題,因此我們優(yōu)先采用了一對一匹配算法,也就是一個學生可以選擇一位最滿意的教師,而教師也可以選擇自己心儀的學生,有人把這種算法稱之為Gale-Shapley算法,也稱之為婚姻匹配算法[7]。
婚姻匹配算法并不能直接應用于畢業(yè)設計系統(tǒng),必須進行相應的改進。這是因為在選題和分組時,假設把學生看成“男方”N,課題看成“女方”M,通過選題過程后,會出現(xiàn)N對M有滿意度,但是M對N卻沒有滿意度,因此無法直接進行婚姻匹配。這就需要考慮只利用N對M的滿意度程度對課題志愿進行排序,然后完成課題的自動分配[7]。
課題選擇時,每個學生最多可以選擇3個課題,學生可以根據(jù)自己的意愿對課題進行排序,分別設置為第一、二、三志愿,當進行課題分組時,首先依據(jù)課題,得到課題選擇的滿意度序列,以滿意度序列作為分組順序。當出現(xiàn)多個學生都很中意某個課題時,而引入第二個排序種子——選題時間,如果選題時間排序也無法區(qū)分,則系統(tǒng)產(chǎn)生“隨機數(shù)”種子,輔助排序來完成課題的分配。如果自動分組完成,仍有學生沒有分配到課題,則由管理員手動調(diào)劑志愿,保證每個學生都能夠選擇到課題。
2.2.2 網(wǎng)絡爬蟲的設計
在畢業(yè)設計系統(tǒng)中引入網(wǎng)絡爬蟲是基于相似度檢測的需要。同時,因為本系統(tǒng)設計的服務對象是高校內(nèi)部師生,所以不需要高強度的網(wǎng)絡爬取。當指導老師申報完成課題之后,系統(tǒng)設計的分詞算法對畢業(yè)設計課題進行分詞,提取其中的關鍵字。通過這些關鍵字把與課題相關的資源都爬取下來。爬蟲在爬取網(wǎng)頁時,找到最匹配的網(wǎng)頁,比如直接有對課題相關描述的網(wǎng)頁,然后依此網(wǎng)頁為種子,只要是跟該網(wǎng)頁URL地址有聯(lián)系(超級鏈接)的網(wǎng)頁都一一收集過來,再以收集到的網(wǎng)頁為種子,收集其他網(wǎng)頁,周而復始,把所有的網(wǎng)頁都收入庫中。
2.2.3 構(gòu)建論文檢測庫
(1)構(gòu)建網(wǎng)頁庫。畢業(yè)設計系統(tǒng)中的爬蟲程序有專門的線程負責將網(wǎng)頁存取到磁盤,而且會對每一個抓取的網(wǎng)頁給予一個計算出的簽名,該簽名是唯一的。爬蟲網(wǎng)頁存入磁盤,構(gòu)建一個網(wǎng)頁庫WEBpages,而且把系統(tǒng)所用的URL地址、網(wǎng)頁相關參數(shù)等保存進數(shù)據(jù)庫。
(2)歷年論文入庫。本系統(tǒng)在設計過程中,除了對互聯(lián)網(wǎng)數(shù)據(jù)進行收集入庫外,還把近年所有學生的畢業(yè)設計論文、開題報告等文檔資料入庫。學生通過本系統(tǒng)提交論文時,將進行一次內(nèi)部檢測,避免學生出現(xiàn)交叉抄襲的情況出現(xiàn)。
2.2.4 正文提取
在相似度檢測時,WORD文檔、PDF文檔、網(wǎng)頁中的有些標記是不被識別的,或者說沒有存在的實際意義。因此,在進行檢測時要把腳本程序、樣式表等去掉,例如把網(wǎng)頁中的HEAD、div等使用正則表達式去掉,同時替換些標記,從而取得網(wǎng)頁的正文,這樣可以很方便地進行分詞,進而完成相似度對比。
2.2.5 分詞的功能的設計與實現(xiàn)
畢業(yè)設計系統(tǒng)中的相似度檢測主要是對中文進行比對,因此側(cè)重點也是中文分詞。中文分詞則是指按照一定的規(guī)則將一個中文語句串分割成若干個關鍵詞的過程。關于分詞技術(shù),算法眾多,在畢業(yè)設計管理平臺中我們選取了基于字典的分詞技術(shù),就是獲取一段文字后先進行分割,分成N個小段,比如以“,”或者“。”作為分割條件,然后再對每一段進行處理。處理的過程比較簡單,使用正向匹配,從第一個字開始,然后查字典,如果字典存在這個字,就表示分詞成功;如果不存在,則指針向后一位再查字典,直到整句話分詞完成。
2.2.6 相似度識別功能的設計與實現(xiàn)
中文字符串分詞及相似度匹配的算法形式有很多。在畢業(yè)設計系統(tǒng)的相似度識別中,為了得到2個字符串的相似程度,我們采用二元變量來判斷與比較。首先對學生提交的論文進行分詞處理,然后把處理完成的數(shù)據(jù)與論文檢測庫的分詞結(jié)果集進行匹配,最后得到相似的程度。
3 結(jié)論
在系統(tǒng)設計過程中,我們參考了各類畢業(yè)設計的通用流程,最后結(jié)合湖南工業(yè)大學對畢業(yè)設計過程的全部需求定制開發(fā)而成,同時對部分流程根據(jù)信息化的需求進行了優(yōu)化,并且已經(jīng)在實際的操作中運行了4年,在這4年中,根據(jù)技術(shù)的進步和管理需要,我們對系統(tǒng)進行了部分優(yōu)化。系統(tǒng)目前已經(jīng)基本滿足了高校畢業(yè)設計管理的全過程需求,對畢業(yè)設計管理工作起到了很好的規(guī)范作用。
參 考 文 獻
[1]徐莉.信息化已經(jīng)上升為國家戰(zhàn)略[J].中國教育信息化,2013(7):6-10.
[2]梁金明.基于WEB的畢業(yè)設計管理與監(jiān)控系統(tǒng)設計[J].四川理工學院學報(自然科學版),2011(5):537-540.
[3]初作瑋.畢業(yè)設計選題系統(tǒng)[D].長春:吉林大學,2010.
[4]龔云飛.本科畢業(yè)設計學術(shù)不端防治體系的構(gòu)建[J].黑龍江教育(高教研究與評估),2014(10):79-80.
[5]王爽.高校網(wǎng)站站群管理系統(tǒng)的設計[J].西安文理學院學報(自然科學版):2011(4):77-79.
[6]廖成香.基于Web的畢業(yè)設計信息管理系統(tǒng)設計開發(fā)[D].廣州:廣東工業(yè)大學,2005.
[7]鄧蔚之,劉強,等.優(yōu)化的Gale-Shapley算法在學生選課問題中的應用[J].湖南工業(yè)大學學報,2013(1):22-24.
[責任編輯:鐘聲賢]