◆張辰枝
?
大數(shù)據(jù)環(huán)境下基于數(shù)據(jù)挖掘技術(shù)的高??蒲泄芾硐到y(tǒng)的設(shè)計研究
◆張辰枝
(上海電子信息職業(yè)技術(shù)學(xué)院 上海 200032)
在大數(shù)據(jù)背景下,大數(shù)據(jù)技術(shù)被應(yīng)用在各行各業(yè)中,借助數(shù)據(jù)庫中含有的關(guān)聯(lián)性信息,能有效提升科研水平和綜合實踐能力。因此,為了進一步優(yōu)化高校科研管理系統(tǒng)的實際價值,要著重利用數(shù)據(jù)挖掘技術(shù),提高高??蒲泄芾硭?。本文對數(shù)據(jù)挖掘技術(shù)的結(jié)構(gòu)、使用工具等進行了簡要分析,并集中討論了高??蒲泄芾硐到y(tǒng)應(yīng)用數(shù)據(jù)挖掘技術(shù)的設(shè)計流程,以供參考。
大數(shù)據(jù);高??蒲泄芾硐到y(tǒng);數(shù)據(jù)挖掘技術(shù);設(shè)計
所謂數(shù)據(jù)挖掘技術(shù),就是在海量數(shù)據(jù)中建立知識提取模式,從而有效使用動態(tài)信息,按照標(biāo)準(zhǔn)化分類標(biāo)準(zhǔn)對典型數(shù)據(jù)挖掘系統(tǒng)予以分析,其主要組成部分包括以下幾點:
第一,數(shù)據(jù)庫、數(shù)據(jù)/信息庫。
第二,數(shù)據(jù)庫服務(wù)器,能結(jié)合用戶的實際數(shù)據(jù)請求,提取有效的數(shù)據(jù)和信息,然后直接推送[1]。
第三,知識庫,會將相關(guān)聯(lián)的功能模塊結(jié)合在一起,保證指導(dǎo)搜索和評估結(jié)果分析的實效性,也能對用戶興趣度進行匯總。
第四,數(shù)據(jù)挖掘引擎,能對特征化、關(guān)聯(lián)化信息進行分類和聚合,并且深度研究數(shù)據(jù)之間的演變,建立系統(tǒng)性偏差分析機制。
第五,模式評價模塊。主要是借助相關(guān)技術(shù)對用戶的興趣度進行度量和分析,從而建構(gòu)數(shù)據(jù)各個挖掘模塊之間的聯(lián)系,確保用戶交互工作和搜索項目的完整性。
第六,圖形管理,主要是對用戶和數(shù)據(jù)挖掘系統(tǒng)予以判定,并且整合各個部分之間存在的關(guān)聯(lián)度。
數(shù)據(jù)挖掘技術(shù)系統(tǒng)示意圖,如下圖1:
圖1 數(shù)據(jù)挖掘技術(shù)系統(tǒng)示意圖
在關(guān)聯(lián)規(guī)則中,要對項集、支持度和關(guān)聯(lián)規(guī)則進行系統(tǒng)化分析。
在高??蒲许椖坎粩喟l(fā)展的背景下,要想有效對科研項目和相關(guān)數(shù)據(jù)容量體系予以分析,就要對其中含有的信息進行深度管控和整理,利用數(shù)據(jù)挖掘技術(shù)對高校科研發(fā)展結(jié)構(gòu)展開全面的管理。在數(shù)據(jù)挖掘技術(shù)應(yīng)用的過程中,要想保證設(shè)計體系的完整性,就要對設(shè)計依據(jù)予以標(biāo)準(zhǔn)化處理,從而建立相關(guān)關(guān)聯(lián)參數(shù)的設(shè)置體系,維護項目運維設(shè)計結(jié)構(gòu)的基本質(zhì)量。在設(shè)計項目開始前,要對以下幾點進行參數(shù)設(shè)置和匯總[3]。
第一,科研項目名稱,確定立項。第二,判定立項時間,并且對項目的起止時間進行有效確定。第三,確認經(jīng)費,保證數(shù)據(jù)挖掘技術(shù)結(jié)構(gòu)能在完整資金鏈支持下,有效發(fā)揮其實際價值,維護高??蒲许椖抗芾硐到y(tǒng)的運行水平。第四,關(guān)鍵詞,對于立項而言,關(guān)鍵詞尋找和確認十分關(guān)鍵,也是整個系統(tǒng)的根本參數(shù)。綜上所述,在標(biāo)準(zhǔn)化數(shù)據(jù)分析后,能有效建立科研數(shù)據(jù)收集和比對分析機制,確保整理信息和數(shù)據(jù)挖掘技術(shù)體系之間的聯(lián)動性符合高??蒲泄芾眄椖繑?shù)據(jù)管控技術(shù)的要求。
借助數(shù)據(jù)挖掘技術(shù)對高??蒲泄芾硐到y(tǒng)進行整合,要保證功能模塊的完整性,從而提高整體數(shù)據(jù)處理和應(yīng)用效果,也為后續(xù)建立更加系統(tǒng)化數(shù)據(jù)整合機制奠定堅實基礎(chǔ),針對不同模塊的差異化功能,開展相應(yīng)的技術(shù)管控活動[4]。
(1) 項目申報模塊。要對高校內(nèi)要完成的科研項目進行申報處理,借助審核機制、評審措施以及立項管理功能等完成項目最終申報。
(2) 項目管理模塊。在申報結(jié)束后,就要對相關(guān)管理信息進行錄入和查詢,并且集中優(yōu)化相關(guān)項目維護,能對項目出現(xiàn)的暫停、終止以及結(jié)題等予以處理,并且整合數(shù)據(jù)分析框架,確保最終的數(shù)據(jù)統(tǒng)計結(jié)構(gòu)和項目科研經(jīng)費管理結(jié)構(gòu)的完整性。需要注意的是,在科研經(jīng)費管理項目中,也要對科研經(jīng)費的進賬數(shù)量、提取出量、支出數(shù)量和結(jié)轉(zhuǎn)數(shù)量等予以判定。
(3) 成果管理模塊。對于高??蒲许椖慷?,最終的計量結(jié)果和數(shù)據(jù)分析結(jié)論十分關(guān)鍵,能借助數(shù)據(jù)直觀的體現(xiàn)出高??蒲兴?。因此,在成果管理模塊中,會對高校教職員工的著作、論文以及專利等項目展開深度判定。
(4) 學(xué)習(xí)交流模塊。主要是建立在學(xué)術(shù)交流基礎(chǔ)上,能對訪問考察、學(xué)術(shù)會議以及講學(xué)等內(nèi)容進行集中匯總。
(5)系統(tǒng)管理模塊。主要是針對高??蒲泄芾聿块T開設(shè)的相關(guān)模塊體系,要求相關(guān)部門對科研項目給予一定的支持,無論是科室管理人員還是部門管理人員,都要對系統(tǒng)運行結(jié)構(gòu)和管控措施予以分析。另外,借助實時監(jiān)控系統(tǒng)也能對具體問題進行及時記錄,保證系統(tǒng)相關(guān)參數(shù)、開關(guān)結(jié)構(gòu)以及用戶權(quán)限設(shè)置的完整性。在用戶數(shù)據(jù)和系統(tǒng)日志方面也能發(fā)揮其維護和管理作用,確保集中審核具體問題后,積極建構(gòu)完整的處理機制和控制體系[5]。
在數(shù)據(jù)挖掘算法選取的過程中,要結(jié)合高校實際要求對分析項目予以監(jiān)督,并且結(jié)合NET技術(shù)服務(wù)項目和模式運行處理技術(shù)。在系統(tǒng)后臺建立科研和成果數(shù)據(jù)庫,采取數(shù)據(jù)設(shè)計和存儲工作機制,有效展開數(shù)據(jù)分析和整理,從而生成數(shù)據(jù)分析報告。應(yīng)用關(guān)聯(lián)算法時,能建立單獨維度、單層結(jié)構(gòu)以及布爾關(guān)聯(lián)體系,保證預(yù)測模型的完整性和對象值映射管理的完整性,全面完成推理和決策任務(wù),維護數(shù)據(jù)關(guān)聯(lián)性處理和分析效果的完整性,整合深度挖掘機制,確保高校科研管理工作得以有效落實和發(fā)展。在利用關(guān)聯(lián)規(guī)則進行實務(wù)處理的過程中,也要結(jié)合支持度和置信度參數(shù)。
挖掘關(guān)聯(lián)規(guī)則中,不能對每個可能性的規(guī)則進行置信度測定,這就需要對閾值進行判定,針對有價值的信息和數(shù)據(jù)予以處理,減少浪費時間的計算過程,從根本上提高設(shè)計算法的針對性。一方面,要集中鎖定頻繁項集,并且結(jié)合項集對最下支持度閾值進行判定。另一方面,也要結(jié)合規(guī)則對發(fā)現(xiàn)的頻繁項集進行最下置信度閾值的提取,維護規(guī)則的完整性和實效性[6]。
總而言之,在高??蒲泄芾硐到y(tǒng)設(shè)計過程中,要結(jié)合大數(shù)據(jù)背景,積極應(yīng)用數(shù)據(jù)挖掘技術(shù),維護關(guān)聯(lián)性應(yīng)用價值和實際效果,從不同層面分析具體數(shù)據(jù)后,按照不同挖掘算法對科研數(shù)據(jù)予以系統(tǒng)化管理,整合后集中在固定的數(shù)據(jù)集合中,為高校日后科研項目的有序開展提供基礎(chǔ)數(shù)據(jù)資料和信息,保證分析數(shù)據(jù)管理的有效性,落實技術(shù)支撐價值和算法實踐管理,升級決策任務(wù),也能集中解決信息孤島問題。
[1]朱慧爽.關(guān)聯(lián)規(guī)則在高??蒲泄芾砉ぷ髦械膽?yīng)用[J].濰坊學(xué)院學(xué)報,2015.
[2]劉占波,王立偉,王曉麗.大數(shù)據(jù)環(huán)境下基于數(shù)據(jù)挖掘技術(shù)的高校科研管理系統(tǒng)的設(shè)計[J].電子測試,2017.
[3]朱金龍.大數(shù)據(jù)環(huán)境下高??蒲泄芾砉ぷ鞯乃伎糩J].江蘇科技信息,2017.
[4]王貞,符天.基于互聯(lián)網(wǎng)的高??蒲泄芾硐到y(tǒng)的構(gòu)建[J]. 電腦編程技巧與維護,2016.
[5]史子靜.高??蒲泄芾硐到y(tǒng)中計算機數(shù)據(jù)挖掘技術(shù)的運用研究[J].科技資訊,2017.
[6]楊麗莎.高??蒲泄芾硐到y(tǒng)的設(shè)計與算法實現(xiàn)[D].湖南大學(xué),2015.