吳娜 王媛
【摘要】高校管理決策支持的宗旨是輔助管理者作出合理、科學(xué)的決策。高校檔案記載著豐富的教學(xué)、科研和管理信息,是高校歷史真實(shí)、全面的反映,是規(guī)范管理的基礎(chǔ)。本文研究如何挖掘檔案數(shù)據(jù)價(jià)值,為高校管理決策支持服務(wù)。
【關(guān)鍵詞】高校管理;決策支持;檔案;數(shù)據(jù)挖掘
高校管理是對(duì)學(xué)校教育、教學(xué)、科研、后勤和師生員工等各項(xiàng)工作進(jìn)行計(jì)劃、組織、協(xié)調(diào)和控制的活動(dòng)。通過(guò)管理,把各項(xiàng)工作及其組成要素結(jié)合起來(lái),發(fā)揮整體功能,以實(shí)現(xiàn)其對(duì)學(xué)生的培養(yǎng)目標(biāo)和各項(xiàng)工作目標(biāo)。高校管理決策是高校管理的基礎(chǔ)和行為指南,決策的合理性、科學(xué)性對(duì)高校管理工作是至關(guān)重要的。
一、高校管理決策支持的特點(diǎn)和優(yōu)勢(shì)
高校管理決策支持的宗旨是輔助高校管理者作出合理、科學(xué)的決策,而非代替管理者作決策。高校管理科學(xué)化就是高校管理層在制定決策和執(zhí)行決策的過(guò)程中,運(yùn)用科學(xué)的管理理論和大量的基礎(chǔ)數(shù)據(jù),做出可行的、合理的決策。
高校管理決策支持是輔助決策者通過(guò)數(shù)據(jù)、模型和知識(shí),以人機(jī)交互方式進(jìn)行半結(jié)構(gòu)化或非結(jié)構(gòu)化決策的應(yīng)用。它為決策者提供分析問(wèn)題、建立模型、模擬決策過(guò)程和方案的環(huán)境,調(diào)用各種信息資源和分析工具,輔助解決各類決策問(wèn)題,幫助決策者提高決策水平和質(zhì)量。
隨著數(shù)據(jù)倉(cāng)庫(kù)(Data Warehouse,DW)、聯(lián)機(jī)分析處理(On-Line Analysis Processing,OLAP)和數(shù)據(jù)挖掘(Data Mining,DM)新技術(shù)的出現(xiàn),DW+OLAP+DM逐漸形成決策支持的新概念,其特點(diǎn)是從數(shù)據(jù)中獲取輔助決策信息和知識(shí),實(shí)現(xiàn)更有效的輔助決策。
二、高校檔案數(shù)據(jù)的特點(diǎn)和價(jià)值
信息性是檔案本質(zhì)屬性中一項(xiàng)重要屬性,檔案具有“信息價(jià)值”。數(shù)據(jù)是信息世界的基礎(chǔ)性資源,從數(shù)據(jù)層面來(lái)挖掘檔案的價(jià)值,我們會(huì)發(fā)現(xiàn)檔案的“數(shù)據(jù)價(jià)值”。檔案的“數(shù)據(jù)價(jià)值”為檔案工作創(chuàng)新實(shí)踐提供了指引,檔案信息化的最終目的是挖掘檔案的數(shù)據(jù)價(jià)值。
高校檔案記載著豐富的教學(xué)、科研和管理信息,是高校歷史真實(shí)、全面的反映,是規(guī)范管理的基礎(chǔ),是積累和傳播知識(shí)、經(jīng)驗(yàn)等的重要載體,是文化建設(shè)的重要素材,是寶貴的歷史記憶。從時(shí)效性來(lái)看,檔案數(shù)據(jù)都屬于靜態(tài)數(shù)據(jù),有定性和定量?jī)蓚€(gè)特點(diǎn)。定性數(shù)據(jù)表示數(shù)據(jù)對(duì)象的抽象特征,如取得圓滿成功、得到了進(jìn)一步發(fā)展等。定量數(shù)據(jù)反映數(shù)據(jù)對(duì)象的具體數(shù)量特征,如在校生數(shù)、招生數(shù)、職工數(shù)、發(fā)文數(shù)等。通過(guò)高校檔案數(shù)據(jù)挖掘,可以為高校決策提供科學(xué)的依據(jù),加強(qiáng)高校管理決策的合理性和科學(xué)性。
三、基于高校管理決策支持的檔案數(shù)據(jù)挖掘
提高決策的科學(xué)化、民主化水平,是實(shí)踐科學(xué)發(fā)展觀的先決條件。國(guó)家檔案局多次提出要加強(qiáng)檔案信息資源體系建設(shè),將“檔案庫(kù)”變成“思想庫(kù)”,努力成為服務(wù)領(lǐng)導(dǎo)決策的重要參謀和助手。高等學(xué)校肩負(fù)著人才培養(yǎng)、科學(xué)研究、社會(huì)服務(wù)、文化傳承創(chuàng)新、國(guó)際交流合作的重要使命。要讓高校檔案成為高校管理的思想庫(kù)和資源庫(kù),更好地實(shí)現(xiàn)高校管理決策支持。
如何將“檔案庫(kù)”變成“思想庫(kù)”,筆者認(rèn)為可以通過(guò)檔案數(shù)據(jù)挖掘來(lái)實(shí)現(xiàn)。檔案數(shù)據(jù)挖掘是從大量的、模糊的、隨機(jī)的檔案數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過(guò)程,可通過(guò)以下流程來(lái)實(shí)現(xiàn)。
(一)業(yè)務(wù)理解。本階段的主要任務(wù)是把高校管理的目標(biāo)需求轉(zhuǎn)化為檔案數(shù)據(jù)問(wèn)題的定義和實(shí)現(xiàn)這些目標(biāo)的初步計(jì)劃,并確定對(duì)檔案數(shù)據(jù)挖掘結(jié)果進(jìn)行評(píng)價(jià)的標(biāo)準(zhǔn)。1.確定目標(biāo)。數(shù)據(jù)挖掘分析人員從高校管理決策支持角度全面理解用戶的問(wèn)題,發(fā)現(xiàn)其真實(shí)需求,清晰明確地定義用戶的目標(biāo)和成功的標(biāo)準(zhǔn)。2.形勢(shì)評(píng)估。詳細(xì)了解用戶所具有的檔案資源、需求、假定和限制等因素,為下一步確定數(shù)據(jù)挖掘目標(biāo)和制定項(xiàng)目實(shí)施計(jì)劃做準(zhǔn)備。3.確定數(shù)據(jù)挖掘目標(biāo)并制定數(shù)據(jù)挖掘成功標(biāo)準(zhǔn)。例如,一個(gè)業(yè)務(wù)目標(biāo)是“合理設(shè)置各專業(yè)招生人數(shù)”,其相應(yīng)的數(shù)據(jù)挖掘目標(biāo)是“對(duì)過(guò)去五年的各專業(yè)招生人數(shù)和就業(yè)率進(jìn)行分析,預(yù)測(cè)招生人數(shù)”。4.制定實(shí)施計(jì)劃。制定完成數(shù)據(jù)挖掘任務(wù)的項(xiàng)目計(jì)劃,包括項(xiàng)目執(zhí)行的階段,每階段時(shí)間,所需的資源、工具等。
(二)數(shù)據(jù)理解。本階段的主要任務(wù)是完成對(duì)檔案數(shù)據(jù)資源的認(rèn)識(shí)和清理,是數(shù)據(jù)處理的核心。主要包括下面幾個(gè)方面。1.數(shù)據(jù)的初步收集。數(shù)據(jù)初步收集的內(nèi)容包括數(shù)據(jù)源、存儲(chǔ)方式、表數(shù)、記錄數(shù)、字段數(shù)、使用限制等多方面。2.數(shù)據(jù)描述。從總體上描述所獲得數(shù)據(jù)的屬性,包括數(shù)據(jù)格式、數(shù)據(jù)質(zhì)量、數(shù)據(jù)出處、收集時(shí)間頻度等多方面,并檢查數(shù)據(jù)是否能夠滿足相關(guān)要求。3.數(shù)據(jù)的探索性分析。包括關(guān)鍵屬性分布、屬性之間的關(guān)系、數(shù)據(jù)簡(jiǎn)單的統(tǒng)計(jì)結(jié)果、重要子集的屬性和簡(jiǎn)單的統(tǒng)計(jì)分析等,這些分析可能直接達(dá)到了某些數(shù)據(jù)挖掘目標(biāo),也可能豐富或細(xì)化數(shù)據(jù)描述和質(zhì)量報(bào)告,或者為將來(lái)的數(shù)據(jù)轉(zhuǎn)換和其他數(shù)據(jù)處理工作做準(zhǔn)備。4.數(shù)據(jù)質(zhì)量檢驗(yàn)。檢驗(yàn)數(shù)據(jù)是否滿足數(shù)據(jù)挖掘的要求,如數(shù)據(jù)是否完整;是否具有缺失性和缺失屬性。
(三)數(shù)據(jù)準(zhǔn)備。此步驟同樣是數(shù)據(jù)處理的核心,是建立模型之前的最后一步,其任務(wù)是將原始檔案數(shù)據(jù)轉(zhuǎn)化為適合數(shù)據(jù)挖掘工具處理的目標(biāo)數(shù)據(jù),主要包括下列步驟:1.選擇數(shù)據(jù)。制定數(shù)據(jù)進(jìn)入、剔除的標(biāo)準(zhǔn),決定分析所要用到的數(shù)據(jù)。2.數(shù)據(jù)清洗。保證數(shù)據(jù)值的準(zhǔn)確性和一致性,解決數(shù)據(jù)缺失問(wèn)題,將數(shù)據(jù)質(zhì)量提高到能滿足分析精度的要求。3.數(shù)據(jù)構(gòu)建。通過(guò)一個(gè)或幾個(gè)已有屬性構(gòu)建新的屬性數(shù)據(jù)。4.數(shù)據(jù)整合。將來(lái)自不同表或記錄的數(shù)據(jù)合并起來(lái)以產(chǎn)生新的紀(jì)錄或?qū)傩灾?,涉及?duì)沖突和不一致的數(shù)據(jù)進(jìn)行一致化。5.數(shù)據(jù)格式化。對(duì)數(shù)據(jù)進(jìn)行語(yǔ)法上的修改,以滿足建模的需求。
(四)建立模型。選擇和應(yīng)用多種不同的數(shù)據(jù)挖掘技術(shù),調(diào)整它們的參數(shù)使其達(dá)到最優(yōu)值。同一個(gè)問(wèn)題,會(huì)有很多種可以使用的數(shù)據(jù)挖掘技術(shù),但每一種挖掘技術(shù)對(duì)數(shù)據(jù)有不同的限制及要求,就需要回到數(shù)據(jù)準(zhǔn)備階段重新進(jìn)行數(shù)據(jù)的選擇、清洗、轉(zhuǎn)換等活動(dòng)。該階段主要包括下列步驟:1.選擇建模技術(shù)。了解相應(yīng)的建模技術(shù)的特點(diǎn)及該技術(shù)對(duì)數(shù)據(jù)的假定要求。2.生成檢驗(yàn)設(shè)計(jì)。分析如何對(duì)模型的效果進(jìn)行檢驗(yàn)。3.建立模型。設(shè)定模型參數(shù),在備好的數(shù)據(jù)集上建立模型,記錄和描述構(gòu)建的模型。4.評(píng)估模型。包括根據(jù)數(shù)據(jù)挖掘的成功標(biāo)準(zhǔn)評(píng)價(jià)模型的使用和模型參數(shù)的調(diào)整。
(五)模型評(píng)估。由業(yè)務(wù)人員和領(lǐng)域?qū)<覐臉I(yè)務(wù)角度全面評(píng)價(jià)所得到的模型,確定模型是否達(dá)到業(yè)務(wù)目標(biāo),最終作出是否應(yīng)用數(shù)據(jù)挖掘結(jié)果的決策,主要包括下列步驟:1.評(píng)估結(jié)果。評(píng)估產(chǎn)生的數(shù)據(jù)挖掘模型滿足業(yè)務(wù)目標(biāo)的程度,篩選出被認(rèn)可的數(shù)據(jù)挖掘模型。2.數(shù)據(jù)挖掘過(guò)程回顧。查找數(shù)據(jù)挖掘過(guò)程中是否存在疏忽和遺漏之處。3.確定下一步。列出所有可能的行動(dòng)方案,根據(jù)評(píng)估結(jié)果和數(shù)據(jù)挖掘過(guò)程回顧,確定項(xiàng)目下一步如何進(jìn)行。
(六)發(fā)布。發(fā)布是運(yùn)用數(shù)據(jù)挖掘結(jié)果解決現(xiàn)實(shí)業(yè)務(wù)問(wèn)題,實(shí)現(xiàn)數(shù)據(jù)挖掘的價(jià)值。主要包括計(jì)劃實(shí)施、計(jì)劃監(jiān)測(cè)和維護(hù)、生成最終報(bào)告、項(xiàng)目回顧。
高校檔案記載著豐富的教學(xué)、科研和管理信息,本文從高校檔案的“數(shù)據(jù)價(jià)值”出發(fā),探討如何把數(shù)據(jù)挖掘技術(shù)應(yīng)用于檔案數(shù)據(jù)價(jià)值發(fā)現(xiàn),最終為高校管理提供決策支持。
【參考文獻(xiàn)】
[1]鄭金月.數(shù)據(jù)價(jià)值:大數(shù)據(jù)時(shí)代檔案價(jià)值的新發(fā)現(xiàn)[J].浙江檔案,2015(12):11-14.
[2]石路,馮賢杰.檔案資政:服務(wù)決策的重要方式[J].中國(guó)檔案,2012(04):28-29.