賓揚帆
(湖南環(huán)境生物職業(yè)技術(shù)學(xué)院,湖南 衡陽 421005)
自從我國全面建成小康社會以來,不僅在經(jīng)濟建設(shè)上取得了巨大的成果,還將高校教育提上了改革計劃的日程。高校教育的目的就是培養(yǎng)出源源不斷的人才,為建設(shè)國家和服務(wù)社會提供人力資源。
目前我國高校教育中缺乏系統(tǒng)的資源管理,高校核算教育成本時通常采用較為粗糙的計算方法。這就導(dǎo)致核算值與實際應(yīng)用值存在較大差別,使資源分配不均勻、資源浪費的情況時常發(fā)生。雖然在高校教育中投入了很多資源,但是效果卻不盡人意。高校教育成本核算方法成了研究的熱門話題。
隨著經(jīng)濟的不斷發(fā)展,科學(xué)技術(shù)也在不斷創(chuàng)新發(fā)展。其中計算機科學(xué)的發(fā)展成果尤其顯著。計算機科學(xué)中的大數(shù)據(jù)分析技術(shù)被廣泛運用到生活中。大數(shù)據(jù)具有信息多樣性、能夠快速分析計算且數(shù)據(jù)庫規(guī)模較大的特點。大數(shù)據(jù)分析與信息融合技術(shù)的應(yīng)用為人們的工作和生活帶來了很大的便利。
該文在此基礎(chǔ)上提出了大數(shù)據(jù)分析技術(shù)在高校教育成本核算中的應(yīng)用。利用大數(shù)據(jù)技術(shù)優(yōu)化高校教育成本核算方法,設(shè)計出更加科學(xué)合理的核算方法,以提高核算精確度,為高校管理者提供精準(zhǔn)信息,為高校教育的管理提供依據(jù)。
在建模前要對所收集的高校教育成本數(shù)據(jù)文件信息進行預(yù)先處理,篩選出條件穩(wěn)定的數(shù)據(jù)作為建模的基礎(chǔ)數(shù)據(jù)后再進行建模。具體的建模步驟如下。1)挑選數(shù)據(jù)試驗集合和練習(xí)集合。通常用于建模的數(shù)據(jù)分為2個不同的類型:第1種是對模型進行練習(xí)的數(shù)據(jù)集合,模型能夠在這個類型的數(shù)據(jù)集合中通過不斷學(xué)習(xí)優(yōu)化出最適合的數(shù)據(jù),并抓取數(shù)據(jù)中有用的信息進行標(biāo)記,同時學(xué)習(xí)數(shù)據(jù)行為,將信息的輸入和輸出行為進行優(yōu)化,構(gòu)建相對穩(wěn)定的行為習(xí)慣,再通過學(xué)習(xí)與帶有問題的數(shù)據(jù)進行對比,對整體數(shù)據(jù)庫的性能進行優(yōu)化操作。第2種數(shù)據(jù)是試驗集合,當(dāng)模型通過學(xué)習(xí)完成自我優(yōu)化后,經(jīng)過該數(shù)據(jù)集合能夠?qū)δP偷臄?shù)據(jù)全面性進行優(yōu)化。所以,采集數(shù)據(jù)時要關(guān)注這2種數(shù)據(jù)集合的樣本質(zhì)量和個數(shù)。該文對模型進行設(shè)計時使用試錯的方法對第1種數(shù)據(jù)集合進行設(shè)置,利用對2種數(shù)據(jù)集合的設(shè)置使建模數(shù)據(jù)更加完整,強化了模型性能。2)對所采集的基本數(shù)據(jù)進行歸一化操作。對所采集的基本數(shù)據(jù)進行預(yù)處理在構(gòu)建模型的前期準(zhǔn)備中是十分重要的一步。由于基本數(shù)據(jù)是從不同的高校采集來的,所以數(shù)據(jù)的范圍和標(biāo)準(zhǔn)也不同,倘若直接將這些收集來的基本數(shù)據(jù)用于構(gòu)建模型,會因為標(biāo)準(zhǔn)和數(shù)據(jù)范圍的不同而使模型在核算成本時不穩(wěn)定,不能準(zhǔn)確公平地進行成本核算。因此建模時要先進行預(yù)處理,將數(shù)據(jù)進行歸一化操作,統(tǒng)一數(shù)據(jù)的量綱和標(biāo)準(zhǔn),減少數(shù)據(jù)之間的誤差。
在對所采集的高校教育成本基本數(shù)據(jù)進行歸一化處理時需要運用最大、最小化進行計算,如公式(1)所示。
式中:y為歸一化后的樣本數(shù)據(jù)值;y和y分別為歸一化后的樣本數(shù)據(jù)值的最大值和最小值;x為原始樣本數(shù)據(jù)值;和分別為原始樣本數(shù)據(jù)序列中的最小值和最大值。
將高校教育成本數(shù)據(jù)進行線性化操作,一方面能夠大大增強模型的計算能力,當(dāng)所要計算的高校成本教育數(shù)據(jù)信息過于龐大時,該操作能夠保證模型正常運行。另一方面,可避免計算時產(chǎn)生較大誤差,能夠有效提升模型的穩(wěn)定性和準(zhǔn)確性。該文運用核函數(shù)對高校教育成本數(shù)據(jù)進行處理,模型的核函數(shù)所在使用位置見表1。
表1 核函數(shù)設(shè)置表
核函數(shù)中的參數(shù)是核函數(shù)本身自帶的,核函數(shù)參數(shù)的取值規(guī)則是定義核函數(shù)最重要的標(biāo)準(zhǔn)。該文分別使用了2種不同的核函數(shù)進行模型的構(gòu)建,能夠增強模型的穩(wěn)定性和計算的準(zhǔn)確性,避免模型在進行大數(shù)據(jù)計算時產(chǎn)生誤差。
構(gòu)建高校教育成本核算模型時需要運用靈活性較強的算法,這個算法需要效率高、計算精準(zhǔn),以保證模型的穩(wěn)定性。選擇合適的算法來構(gòu)建模型十分重要,該文采用人工蜂群算法來確定模型參數(shù)。人工蜂群算法在每次計算參數(shù)的過程中都會進行2次計算,一次是全面計算,一次是局部計算。2種計算方法相結(jié)合能夠更快更穩(wěn)定地將模型參數(shù)計算出來,并能保證參數(shù)的誤差在合理的范圍內(nèi)。該文所設(shè)計的模型需要在所收集的基本數(shù)據(jù)中挑選出相對較小的數(shù)據(jù)作為樣本構(gòu)建模型。為了使構(gòu)建模型時所用的參數(shù)更加合理、全面,需要對所收集來的數(shù)據(jù)信息進行全方位篩選。
該文所運用的人工蜂群算法中的偵察蜜蜂可通過不斷擴大偵查范圍、減小數(shù)據(jù)的極值誤差來提高算法的性能。在最開始的原始數(shù)據(jù)階段,新產(chǎn)生的資源會替代舊資源,以此來形成循環(huán)。這種方法雖然大大減少了數(shù)據(jù)計算的任務(wù)量,但是被替代的舊資源中還存在一部分對模型有用的數(shù)據(jù),這就導(dǎo)致模型的基本數(shù)據(jù)不完善,形成參數(shù)時也不能保證參數(shù)的準(zhǔn)確性,進而使模型在計算高校教育成本時出現(xiàn)誤差,削弱了模型的計算性能。
根據(jù)以上算法分析可知,使用人工蜂群算法時要對新產(chǎn)生的資源和被替代的資源都進行數(shù)據(jù)分析,以確保模型數(shù)據(jù)信息的完整性。所以該文引入Levy飛行算法與人工蜂群算法相結(jié)合的方法來計算數(shù)據(jù)信息。Levy飛行算法能夠在直線前進的計算路徑中找到一個直角的支線計算路徑,能夠保證數(shù)據(jù)信息在篩選、分析的過程中不落下任何信息點,確保模型基本樣本數(shù)據(jù)的全面性和完整性。同樣,2種算法相結(jié)合能夠很好地解決人工蜂群算法的局限性,將被替代的數(shù)據(jù)資源中的重要信息節(jié)點保存下來,并進行整合。一方面能保證數(shù)據(jù)信息都能夠被很好地利用,另一方面也加快了數(shù)據(jù)篩查、分析的速度,縮短分析的時間,提高了工作效率。2種算法相結(jié)合后的計算方法與之前單獨使用人工蜂群算法相比,不同的地方就在于偵察蜜蜂的步驟上,改變后的算法如公式(2)所示。
式中:u為任意路徑點的選擇;、、分別為路徑點的坐標(biāo)號,其中為選定路徑點,和為隨機路徑點,∈{1,2,…,},且≠,NS為資源的最大數(shù)量,∈{1,2,…,},為人工設(shè)定的邊界;()是一個隨機數(shù),由Mantegna計算得到,如公式(3)所示。
式中:σ和σ分別為函數(shù)分布的離散量,Γ() =(-1)!。
這2種算法相結(jié)合能夠較好地計算出模型構(gòu)建時所用到的參數(shù)。利用參數(shù)能夠分析出高校教育成本的特點,然后根據(jù)不同高校所設(shè)置的規(guī)范對高校教育成本的影響因素進行具體分析,將這些影響因素整合處理,得到不同因素所占的比例,計算出這些因素的影響因子,輸入模型中,以保證模型在核算時能夠針對不同的高校進行個性化處理。
該文所設(shè)計的高校教育成本核算模型的具體構(gòu)建流程如圖1所示。首先,將所采集的數(shù)據(jù)進行歸一化的預(yù)處理,形成模型基本數(shù)據(jù)。其次,將數(shù)據(jù)輸入模型中,使用試錯的方法對第1種練習(xí)數(shù)據(jù)集合進行設(shè)置,利用練習(xí)數(shù)據(jù)集合和試驗數(shù)據(jù)集合的設(shè)置使建模數(shù)據(jù)更加完整,強化模型性能。再次,確立核函數(shù)及核函數(shù)參數(shù),進行模型的構(gòu)建,增強模型的穩(wěn)定性和計算的準(zhǔn)確性,避免模型在進行大數(shù)據(jù)計算時產(chǎn)生誤差。最后,利用算法計算出合適的模型參數(shù),將參數(shù)帶入模型中完成構(gòu)建。最后根據(jù)指標(biāo)評價對模型的性能進行評價。
圖1 基于大數(shù)據(jù)技術(shù)的高校教育成本核算模型構(gòu)建流程
為了驗證該文所設(shè)計的基于大數(shù)據(jù)技術(shù)的高校教育成本核算方法能否準(zhǔn)確地將高校教育成本計算出來,該文選取了某高校作為試驗對象,收集該高校的教育成本作為建立模型的基礎(chǔ)數(shù)據(jù)。
首先,基于大數(shù)據(jù)技術(shù)對高校教育成本數(shù)據(jù)進行處理,為了保證高校教育成本的核算精確度,減小誤差,需要對高校教育的開支進行全面了解,將每項數(shù)據(jù)都記錄下來。教育成本中最難計算的就是高校固定資產(chǎn)的折舊。通過對該高校的資料收集可以看出該高校的固定資產(chǎn)包括教學(xué)樓、宿舍樓和辦公樓等各種建筑資產(chǎn),計算機、電教設(shè)備、空調(diào)、實驗室儀器和體育教學(xué)用品等教學(xué)用具。根據(jù)這些固定資產(chǎn)的使用時間和未來價值進行評估計算,能夠得到固定資產(chǎn)的基本數(shù)據(jù)。再通過對這些固定資產(chǎn)進行評估和折舊處理,將其轉(zhuǎn)換為一定數(shù)量的金錢,作為數(shù)據(jù)輸入模型中,能夠減少核算誤差。
其次,對各初步確定的成本影響因素進行因子分析,以選擇的公因子的累計貢獻率超過80%為標(biāo)準(zhǔn)提取公因子。該文中不探討新的公因子的含義,只根據(jù)公因子系數(shù)的相對大、小判斷各初步確定的成本影響因素的重要程度,采用單因素敏感性分析方法,使各成本影響因素變動20%,計算出該影響因素的敏感性系數(shù),判斷各影響因素對成本影響程度的相對大、小,同時計算各初步確定的成本影響因素的成本占比,將其作為篩選過程的輔助參考。根據(jù)資源的性質(zhì)可以看出有一部分資源耗費與成本對象有可劃分的直接的關(guān)系,劃分標(biāo)準(zhǔn)就是資源動因,可以通過確定各個作業(yè)中心的資源動因數(shù)量對各個作業(yè)中心應(yīng)分?jǐn)偟某杀緮?shù)進行劃分。
某些類別的資源花費是專門屬于某一個作業(yè)的,這些類別的資源花費直接歸納到專屬的作業(yè)中心中,就能避免選擇相應(yīng)的資源動因?qū)ζ浼毞帧?/p>
在高校的教、職工人員中,崗位劃分十分細致,不同崗位的教、職工人員的工資開銷也有所不同。所以要根據(jù)人數(shù)和工資,對不同崗位的教、職工人員進行單獨成本核算。不同崗位的教職工人員所占資源的分配見表2。
表2 分配率統(tǒng)計表
最后,提取其中的關(guān)鍵成本影響因子作為模型的輸入向量,采用經(jīng)大數(shù)據(jù)技術(shù)調(diào)諧得到的正則化參數(shù)C和核函數(shù)參數(shù)σ的取值,并將不敏感系數(shù)ε=0.00作為模型的參數(shù),完成高校教育成本核算模型設(shè)計。將測試集數(shù)據(jù)輸入高校教育成本核算模型得到各部分的成本核算值,比較成本實際核算值與該文的該文模型核算值,對比結(jié)果見表3。
根據(jù)表3可知,測試集中各樣本的成本估算值與實際值較為相近,而傳統(tǒng)方法核算出的數(shù)值與實際數(shù)值相差較大,說明利用該問所設(shè)計的基于大數(shù)據(jù)技術(shù)的高校教育成本核算模型具有較好的預(yù)測精度。該模型改善了傳統(tǒng)方法中高校教育成本核算值與實際值相差較大的問題。
表3 成本實際核算值與該文模型核算值的對比結(jié)果
該文利用大數(shù)據(jù)技術(shù)設(shè)計出高校教育成本核算方法。通過大數(shù)據(jù)技術(shù)精確處理高校成本數(shù)據(jù),確定成本核算數(shù)據(jù)核函數(shù)及核參數(shù),構(gòu)建高校教育成本核算模型。根據(jù)試驗結(jié)果可知,運用該文所設(shè)計的核算方法能夠大大降低核算誤差,提高核算的精確度,有助于高校的教育資源管理,為高校管理者提供了科學(xué)合理的成本核算方法。但由于時間限制,該文沒有對多個高校進行成本核算試驗,還需要在今后的研究中進一步完善。