許悅
摘要:高等職業(yè)教育是我國高等教育的重要組成部分,高校科研活動和教育教學(xué)形式逐步信息化。在新時代的社會發(fā)展要求下,高等職業(yè)教育要更加注重培養(yǎng)高級技能型、實用型和創(chuàng)新型人才,這就對教師的科研能力提出了高質(zhì)量的要求。科研考核的目的是為了調(diào)動教職員工的科研積極性和促進(jìn)學(xué)??蒲邪l(fā)展,發(fā)現(xiàn)影響學(xué)??蒲邪l(fā)展的因素,發(fā)現(xiàn)影響教職員工從事科研活動的原因,發(fā)現(xiàn)具有科研潛力的教師,從而有的放矢的制訂學(xué)校的科研政策和開展學(xué)校的科研管理工作。高??蒲锌己耸呛饬拷處熆蒲谐晒捅O(jiān)督教師科研活動的一個重要評價方式,擁有一個適合的科研考核系統(tǒng)至關(guān)重要。文中針對遼寧工程職業(yè)學(xué)院的科研現(xiàn)狀和科研考核政策,設(shè)計了基于.NET和數(shù)據(jù)挖掘的科研考核系統(tǒng)。
關(guān)鍵詞:科研考核;關(guān)聯(lián)分析;面向?qū)ο?/p>
中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2018)24-0048-03
高職教師的科研質(zhì)量直接影響高校對高級技能型、應(yīng)用型和創(chuàng)新型人才的培養(yǎng)。建立基于B/S結(jié)構(gòu)的科研考核系統(tǒng),能有效節(jié)省人力資源,大幅度提升工作效率,有利于推動科研管理的“無紙化辦公”進(jìn)程,進(jìn)而應(yīng)用Weka數(shù)據(jù)挖掘工具對科研信息進(jìn)行關(guān)聯(lián)分析,為學(xué)校制訂科研獎勵激勵政策提供參考。
1 高職院??蒲泄芾憩F(xiàn)狀及發(fā)展方向
高校的科研活動涉及眾多人員參與其中,同時科研活動的有效開展需要規(guī)范化的制度和科學(xué)化的管理。目前,高??蒲泄芾碇饕袃煞N形式,一種是傳統(tǒng)的人工紙張辦公,一種是網(wǎng)絡(luò)平臺無紙化辦公,前者占主要部分,后者雖然大大提高了科研管理水平,但為了使大量的科研信息發(fā)揮更大的作用,充分發(fā)揮起預(yù)警和決策功能,對學(xué)校今后的發(fā)展起到指引作用,可以將數(shù)據(jù)挖掘技術(shù)應(yīng)用于科研信息管理系統(tǒng)中,使數(shù)據(jù)分析智能化,這也是目前研究的方向。
遼寧工程職業(yè)學(xué)院是由六所中職學(xué)校合并而成,校齡短、師資弱,在以往的教育教學(xué)中,對科研管理工作一直采用人工管理辦法。近幾年,“大眾創(chuàng)業(yè)、萬眾創(chuàng)新”成為新常態(tài)形勢下的國家戰(zhàn)略,學(xué)院更加重視培養(yǎng)高級技能型、應(yīng)用型和創(chuàng)新型人才,并將這一培養(yǎng)目標(biāo)作為學(xué)校發(fā)展的重要戰(zhàn)略。在此發(fā)展背景下,學(xué)院不斷改革、創(chuàng)新和發(fā)展科研管理工作,從多方面鼓勵教師積極開展科研活動,對有科研成果在各層次獲獎的教師給予表彰和獎勵,此外,將教師的科研工作量完成情況,作為教師評定職稱,年終評先選優(yōu)的重要依據(jù),將科研工作作為學(xué)院創(chuàng)新發(fā)展的主要動力之一。在政策的引導(dǎo)下,學(xué)院教師的各類科研成果,包括科研橫縱項目、論文、專利等越來越豐富。如何管理學(xué)院教師的科研信息,如何考核各部門乃至教職員工的科研業(yè)績,如何分析各部門和各類人員的科研狀況及潛在的科研能力和水平,是學(xué)院考核各部門及教職員工科研能力的重要方面,也是學(xué)校提高科研總體實力的關(guān)鍵。
基于以上所述,筆者設(shè)計開發(fā)了基于.net和數(shù)據(jù)挖掘的科研管理系統(tǒng),下面將簡單介紹系統(tǒng)的開發(fā)過程,主要闡述如何將數(shù)據(jù)挖掘技術(shù)應(yīng)用于科研信息管理之中。
2 基于ASP.NET技術(shù)的科研管理系統(tǒng)設(shè)計
科研考核系統(tǒng)采用Visual Studio 2010進(jìn)行前臺網(wǎng)頁設(shè)計,以B/S結(jié)構(gòu)為編程模型,以ASP.NET為開發(fā)平臺,以C#為開發(fā)語言,使用SQL Server 2008作為后臺數(shù)據(jù)庫來完成系統(tǒng)的設(shè)計和實現(xiàn)。
2.1 相關(guān)技術(shù)介紹
2.1.1 ASP.NET技術(shù)
ASP.NET是微軟公司研發(fā)的.NET平臺的一部分,是一種動態(tài)的Web技術(shù),該技術(shù)提供了新的Web應(yīng)用程序編程模式,以Microsoft .NET Framework為開發(fā)基礎(chǔ),使開發(fā)人員能更加高效便捷地對web程序進(jìn)行開發(fā)。[1]ASP.NET技術(shù)是實現(xiàn)B/S編程模型的重要技術(shù)工具,是實現(xiàn)科研考核系統(tǒng)重要的開發(fā)工具。
2.1.2 SQL Server 2008數(shù)據(jù)庫
SQL Server 2008是微軟公司最經(jīng)典的數(shù)據(jù)庫管理系統(tǒng),它由眾多組件相互協(xié)作組成,能最大化地滿足企業(yè)數(shù)據(jù)處理系統(tǒng)和Web站點的數(shù)據(jù)分析和處理任務(wù),擁有非常豐富的特性,SQL Server 2008通過ADO.NET技術(shù)與前端Web請求交換數(shù)據(jù),開發(fā)工具Visual Basic、Visual C、Visual C++和開發(fā)平臺.NET都支持運用ADO組件進(jìn)行數(shù)據(jù)庫的訪問。[2]
2.2 科研考核系統(tǒng)的需求分析
通過前期調(diào)查研究,確定科研管理考核系統(tǒng)的總體開發(fā)目標(biāo)是依據(jù)“適用、夠用、實用、好用”的原則,并且綜合考慮開發(fā)實力、開發(fā)的難度和實際需求等因素,功能開發(fā)應(yīng)側(cè)重于科研信息的分類管理、信息錄入、教師檢索和審核反饋等。系統(tǒng)將減少科研處在科研信息管理工作中的工作量,主要任務(wù)是實現(xiàn)教師個人信息、論文、論著、學(xué)術(shù)著作、專利、獲獎、專業(yè)職稱、科研工作量統(tǒng)計、教師科研能力等科研內(nèi)容的信息化管理。在逐步開發(fā)的同時,對科研信息進(jìn)行關(guān)聯(lián)性分析,將數(shù)據(jù)挖掘技術(shù)應(yīng)用到科研信息管理數(shù)據(jù)中,為學(xué)校科研決策提供參考。
2.3 科研考核系統(tǒng)的功能模塊設(shè)計
科研考核系統(tǒng)提供的主要功能一是教師登錄系統(tǒng)后上傳科研信息和材料、瀏覽修改刪除個人尚未被審核的科研信息和個人資料、查閱被審核的結(jié)果;二是審核員在線查詢教師科研信息、進(jìn)行教師科研信息的審核,并給出意見;三是管理員能夠可視化地對各種新增或錯誤數(shù)據(jù)等進(jìn)行維護(hù);四是進(jìn)行簡單的統(tǒng)計分析,以便為數(shù)據(jù)挖掘準(zhǔn)備數(shù)據(jù)來源。科研考核系統(tǒng)的主要模塊包括:
1)用戶以不同身份登錄模塊
2)教師模塊:修改個人信息;在線提交、查詢、修改論文、專利、科技獎項信息;在線提交、查詢各階段項目被審核信息。
3)審核人模塊:修改個人信息;審核各階段所提交的所有資料;按多種方式查詢統(tǒng)計、打印匯總數(shù)據(jù)、科研信息關(guān)聯(lián)性模塊。
4)管理員模塊:添加、修改、刪除用戶權(quán)限;查詢、添加、修改、刪除論文、專利、科技獎項、項目等相關(guān)的數(shù)據(jù)信息。
2.4 系統(tǒng)的數(shù)據(jù)庫設(shè)計
科研考核系統(tǒng)數(shù)據(jù)庫的設(shè)計包括概念結(jié)構(gòu)設(shè)計和邏輯結(jié)構(gòu)設(shè)計。根據(jù)遼寧工程職業(yè)學(xué)院科研考核系統(tǒng)的需求,得出科研考核系統(tǒng)中的實體聯(lián)系圖如圖1所示。
3 基于數(shù)據(jù)挖掘技術(shù)的科研管理系統(tǒng)設(shè)計
數(shù)據(jù)挖掘技術(shù)是指將數(shù)據(jù)庫技術(shù)和人工智能、機(jī)器學(xué)習(xí)等多學(xué)科相融合的產(chǎn)物,最終達(dá)到在大量的有噪聲的、模糊的、隨機(jī)數(shù)據(jù)中提取隱含、事先未知但又有用的信息,即從海量數(shù)據(jù)中發(fā)現(xiàn)隱含的、有意義的知識。
3.1 Weka軟件
科研考核系統(tǒng)關(guān)聯(lián)分析模塊的實現(xiàn)借助Weka數(shù)據(jù)挖掘軟件,通過科研考核信息的報表統(tǒng)計功能導(dǎo)出科研信息數(shù)據(jù),經(jīng)過對科研信息數(shù)據(jù)預(yù)處理操作后進(jìn)行數(shù)據(jù)的關(guān)聯(lián)規(guī)則提取,從而分析學(xué)院教師科研考核信息的關(guān)聯(lián)性。在本例中,首先在系統(tǒng)中生成了一個頁面,里面包含所有“科研項目”的數(shù)據(jù)記錄集,然后執(zhí)行相應(yīng)代碼,得到一個包含所有符合條件的數(shù)據(jù)的記錄集,最后把此記錄集中的數(shù)據(jù)導(dǎo)出,另存為CSV格式文件。Weka同時也支持?jǐn)?shù)據(jù)預(yù)處理功能,因為Weka對ARFF格式的文件支持最好,所以通常將經(jīng)過預(yù)處理后的數(shù)據(jù)集保存為ARFF格式。
3.2 利用Apriori算法進(jìn)行科研考核信息關(guān)聯(lián)分析
當(dāng)教師將科研信息在線錄入平臺后,科研考核管理人員將科研信息數(shù)據(jù)導(dǎo)出并進(jìn)行預(yù)處理操作,利用科研考核信息的關(guān)聯(lián)規(guī)則Apriori算法對科研信息數(shù)據(jù)進(jìn)行關(guān)聯(lián)性分析,以教師類別為出發(fā)點,以其科研、論文發(fā)表、專利、專著、科技獎項、項目等級狀況等為基礎(chǔ),對不同職稱教師的科研能力和相關(guān)的政策制度做出關(guān)聯(lián)性分析,為學(xué)院科研工作量化考核提供科學(xué)依據(jù),同時給出相應(yīng)的建議用以作為科研制度進(jìn)一步完善的依據(jù)。
3.2.1 科研考核信息關(guān)聯(lián)分析
Apriori算法是提取關(guān)聯(lián)規(guī)則的經(jīng)典算法之一,Apriori算法通過掃描數(shù)據(jù)集產(chǎn)生候選項集,并依據(jù)給定的最小支持度閾值和最小置信度閾值得到頻繁項集。
科研考核信息的關(guān)聯(lián)分析算法是改進(jìn)Apriori算法并借助Weka平臺實現(xiàn)的,其中Weka平臺中實現(xiàn)關(guān)聯(lián)規(guī)則分析的主要參數(shù)為car、classindex、delta等。在Weka中實現(xiàn)科研考核信息的關(guān)聯(lián)分析Apriori算法主要包括步驟讀取數(shù)據(jù)集,并提取樣本集,離散化屬性,創(chuàng)建Apriori關(guān)聯(lián)規(guī)則模型,輸出大頻率項集和關(guān)聯(lián)規(guī)則集四個步驟,其中創(chuàng)建分類器時,需要調(diào)整參數(shù)。[3]
科研考核信息數(shù)據(jù)中存在很多的噪聲數(shù)據(jù),因此需要對科研考核系統(tǒng)中導(dǎo)出的數(shù)據(jù)進(jìn)行整理和歸集。對于遼寧工程職業(yè)學(xué)院科研考核系統(tǒng)的信息數(shù)據(jù)中,姓名、額定分值、聘任情況、成果名稱、成果類別、成果時間、統(tǒng)計年份和分項得分為不必要分析數(shù)據(jù),需要從數(shù)據(jù)中刪除。本文對科研考核信息數(shù)據(jù)的分析所使用的屬性為教師年齡、學(xué)歷、學(xué)位、職稱、省級以上論文數(shù)量、省級科研項目數(shù)量、專著數(shù)量和專利數(shù)量,為了便捷和高效的分析數(shù)據(jù),對以上屬性進(jìn)行預(yù)處理操作。
3.2.2 科研考核信息的關(guān)聯(lián)規(guī)則分析
通過科研考核系統(tǒng)關(guān)聯(lián)分析工具Weka中的Apriori算法進(jìn)行分析,關(guān)聯(lián)規(guī)則的提取結(jié)果會產(chǎn)生一維、二維、三維和四維關(guān)聯(lián)規(guī)則。關(guān)聯(lián)分析如下:
在對教師基本信息及所有科研信息作了關(guān)聯(lián)挖掘之后,發(fā)現(xiàn)教師職稱為初級的與科研工作類別里的論文關(guān)聯(lián)度高。經(jīng)分析,原因為:首先是學(xué)院在科研工作評價得分設(shè)置里對論文設(shè)置的得分權(quán)重比較高,其次是具有初級職稱的教師一般很難參與到其他科研項目中去,對于他們來說,發(fā)表論文相對比較容易,因此為了完成額定工作量,大多數(shù)具有初級職稱的教師更傾向于在一般刊物上發(fā)表論文。
因此,可以建議未來的科研工作量統(tǒng)計中,要對一般論文的得分權(quán)重有所降低,但不改變高級別論文的得分權(quán)重。并且建議院系未來在落實課題項目和其他相關(guān)科研項目中適當(dāng)增加初級職稱教師的數(shù)量,而且需要分配實質(zhì)性的工作來提高初級職稱教師的科研能力。
通過關(guān)聯(lián)挖掘,發(fā)現(xiàn)對于職稱相同的教師,近年新進(jìn)教師的科研得分與科研得分為“高”的關(guān)聯(lián)度比較高,而原學(xué)院教師的科研得分與科研得分為“低”的關(guān)聯(lián)度比較高。經(jīng)分析,原因是:其一,近年新進(jìn)教師基本上均是具有碩士學(xué)歷或?qū)W位,其理論水平比較高,且動手能力比較強(qiáng);其二,原學(xué)院科研能力比較薄弱,特別是當(dāng)升格為高職后,教師很多原來擅長的領(lǐng)域及專業(yè)均被取消,從而導(dǎo)致有些教師即使科研能力比較強(qiáng),也難有用武之地。
針對該數(shù)據(jù)挖掘結(jié)果,可以建議學(xué)院重點培養(yǎng)近年來新引進(jìn)的具有高學(xué)歷的教師,因為從數(shù)據(jù)挖掘結(jié)果中看出,這部分教師雖然職稱比較低,但是卻體現(xiàn)出了比較高好的科研能力,具備很強(qiáng)的科研潛力。這也再次證實了學(xué)校引進(jìn)人才的方向是正確的。但需要注意的是,不應(yīng)該放棄科研得分較低的群體,而是要通過正確引導(dǎo),為他們開辟新的科研空間。
4 結(jié)束語
因為本系統(tǒng)使用時間不長,數(shù)據(jù)量比較小,所以數(shù)據(jù)挖掘的基礎(chǔ)條件有欠缺之處,再加上對數(shù)據(jù)挖掘理論知識的認(rèn)識還不夠深入,所以得到的數(shù)據(jù)挖掘結(jié)果不一定能夠精準(zhǔn)地反映客觀現(xiàn)實。但是總體來說,所得到的數(shù)據(jù)挖掘結(jié)果基本均是基于正式的數(shù)據(jù)挖掘方法的,雖然結(jié)果會有偏差,但整體上仍較能反映實際情況,給科研工作提供了參考。
今后,可以進(jìn)一步優(yōu)化代碼,對于隨時發(fā)現(xiàn)的缺陷及時改進(jìn)、解決,采取更多更優(yōu)的數(shù)據(jù)挖掘方法進(jìn)行挖掘和分析。
參考文獻(xiàn):
[1] 李雪婷.基于ASP.NET的高??蒲谐晒芾硐到y(tǒng)的設(shè)計與實現(xiàn)[D].廈門:廈門大學(xué),2013.
[2] 田衛(wèi)東,陳浩.一種精簡的關(guān)聯(lián)規(guī)則表示模型[J].計算機(jī)應(yīng)用研究,2015,32(3):658-661.
[3] 田苗鳳.大數(shù)據(jù)背景下并行動態(tài)關(guān)聯(lián)規(guī)則挖掘研究[D].銀川:蘭州交通大學(xué),2015.
【通聯(lián)編輯:代影】