鄭建鋒,王應(yīng)明
福州大學(xué) 經(jīng)濟(jì)與管理學(xué)院,福州350108
在管理學(xué)中,效率是指在特定的時(shí)間內(nèi),一個(gè)組織投入與產(chǎn)出的比值關(guān)系,能夠反映這個(gè)組織在各個(gè)方面的能力,進(jìn)行效率分析顯得尤為重要。效率分析是對(duì)各個(gè)組織的效率進(jìn)行測(cè)度與評(píng)價(jià)的一種方法,在目前國(guó)內(nèi)外研究中,主要是利用數(shù)據(jù)包絡(luò)分析(DEA)或者將數(shù)據(jù)包絡(luò)分析與其他模型結(jié)合等方法對(duì)效率進(jìn)行評(píng)價(jià)。效率評(píng)價(jià)在近幾十年的發(fā)展,已經(jīng)發(fā)展得越來(lái)越成熟了,然而對(duì)效率進(jìn)行預(yù)測(cè)仍停留在探索階段。李果等人[1]用神經(jīng)網(wǎng)絡(luò)的方法進(jìn)行DEA 有效預(yù)測(cè),證實(shí)了效率預(yù)測(cè)的可行性。之后的幾年,一些學(xué)者通過DEA 和神經(jīng)網(wǎng)絡(luò)的方法對(duì)各個(gè)不同行業(yè)的效率進(jìn)行評(píng)價(jià)并預(yù)測(cè),如體現(xiàn)在物流聯(lián)盟伙伴選擇[2],不同高??蒲心芰υu(píng)估[3],美國(guó)鐵路性能測(cè)量和預(yù)測(cè)[4],基坑施工評(píng)價(jià)[5]等方面。可見DEA 與神經(jīng)網(wǎng)絡(luò)模型在效率評(píng)價(jià)與預(yù)測(cè)能力上,具有科學(xué)性、廣泛性。但是由于評(píng)估某個(gè)決策單元的效率時(shí),受到許多因素的影響,除了投入與產(chǎn)出之外,還有很多復(fù)雜的環(huán)境因素,所以增加了效率準(zhǔn)確預(yù)測(cè)的困難。區(qū)間預(yù)測(cè)就解決了點(diǎn)預(yù)測(cè)給決策者帶來(lái)的不確定性。區(qū)間預(yù)測(cè)是在收集到的數(shù)據(jù)基礎(chǔ)之上,通過一系列的學(xué)習(xí)優(yōu)化,給出的一個(gè)參數(shù)范圍。本文在前人研究的基礎(chǔ)上,繼續(xù)沿用DEA 與神經(jīng)網(wǎng)絡(luò)結(jié)合對(duì)效率進(jìn)行評(píng)級(jí)與預(yù)測(cè)的方法,提出效率置信區(qū)間預(yù)測(cè)模型。首先,利用DEA方法,對(duì)決策單元的效率進(jìn)行評(píng)價(jià),得出各個(gè)單元的效率值;其次,對(duì)BP 神經(jīng)網(wǎng)絡(luò)進(jìn)行模型參數(shù)修改,結(jié)合student 學(xué)生式分布得到預(yù)測(cè)區(qū)間模型,詳見第1 章模型構(gòu)建。對(duì)決策單元的效率進(jìn)行區(qū)間預(yù)測(cè),并按區(qū)間進(jìn)行分類,然后采用預(yù)測(cè)區(qū)間覆蓋率(Prediction Interval Coverage Probability,PICP)、歸一化平均預(yù)測(cè)區(qū)間寬度(Normalized Mean Prediction Interval Length,NMPIL)和區(qū)間分?jǐn)?shù)(Interval Score,IS)等指標(biāo)對(duì)預(yù)測(cè)結(jié)果進(jìn)行評(píng)價(jià),根據(jù)最后不同類別的決策單元分析原因。
數(shù)據(jù)包絡(luò)分析(Data Envelopment Analysis,DEA),是交叉了包括數(shù)學(xué)、管理科學(xué)、系統(tǒng)工程學(xué)等學(xué)科,而形成的一個(gè)新的領(lǐng)域[6],是由Charnes等人[7]于1978年提出并命名的。DEA是使用線性規(guī)劃等數(shù)學(xué)規(guī)劃模型對(duì)具有多輸入和多輸出的決策單元(DMU)進(jìn)行效率評(píng)估的。關(guān)于對(duì)DEA 的研究,已經(jīng)有上千位學(xué)者對(duì)它進(jìn)行了深入的研究,并把DEA 用來(lái)評(píng)估供應(yīng)商、銀行、保險(xiǎn)公司、高校等地方的效率。在對(duì)DEA的研究中,許多學(xué)者將DEA 與其他模型結(jié)合起來(lái),對(duì)決策單元的效率進(jìn)行評(píng)估。實(shí)證結(jié)果表明,這些結(jié)合起來(lái)的模型,在評(píng)估效率時(shí)表現(xiàn)出比單純使用DEA 來(lái)評(píng)估,具有更好的性能,特別是當(dāng)遇到比較復(fù)雜、比較大的數(shù)據(jù)量的問題時(shí)。DEA進(jìn)行效率評(píng)價(jià)時(shí),有著自身獨(dú)特的優(yōu)點(diǎn),可以在很大程度上避免了人為因素的干擾,使評(píng)價(jià)的結(jié)果更加客觀、科學(xué)。但是DEA也存在不足的地方,如不能實(shí)現(xiàn)進(jìn)一步的預(yù)測(cè)和仿真效率值。
本文先采用DEA 對(duì)決策單元進(jìn)行效率評(píng)價(jià),DEA方法主要有兩個(gè)基本模型:CCR 模型和BCC 模型。這兩者方法之間主要的區(qū)別是CCR 假設(shè)規(guī)模收益不變,而BCC 是假設(shè)存在規(guī)模收益可變。1978 年,Charnes等[7]給出了第一個(gè)DEA 模型CCR。CCR的基本原理是假設(shè)共有n個(gè)決策單元DMU,每個(gè)決策單元中具有m種投入和s種產(chǎn)出,評(píng)價(jià)第j個(gè)決策單元(DMUj,1 ≤j≤n)的技術(shù)有效與規(guī)模有效,在CCR模型基礎(chǔ)之上加上就得到BCC 模型[8]。在BCC 模型中技術(shù)有效決策單元是在最優(yōu)前沿面上的,但BCC 模型卻不考慮規(guī)模報(bào)酬變化。在實(shí)際的應(yīng)用中,DEA 模型往往是以CCR 模型為基礎(chǔ),基于投入型CCR 模型可得出不同DMU 的效率值。含有非阿基米德無(wú)窮小的CCR 模型線性規(guī)劃對(duì)應(yīng)的對(duì)偶規(guī)劃表示為:
(3)如果θ0<1,被評(píng)價(jià)的決策單元無(wú)效。
人工神經(jīng)網(wǎng)絡(luò)(ANN)是模擬大腦活動(dòng),是對(duì)人的大腦中神經(jīng)網(wǎng)絡(luò)的基本特性進(jìn)行抽象和模擬,具有非線性逼近、分布式并行信息處理、自訓(xùn)練學(xué)習(xí)、自組織等能力[9]。
人工神經(jīng)網(wǎng)絡(luò)在組合優(yōu)化、預(yù)測(cè)等領(lǐng)域得到了廣泛地應(yīng)用。BP神經(jīng)網(wǎng)絡(luò)是一種多層網(wǎng)絡(luò)學(xué)習(xí)的誤差發(fā)現(xiàn)傳播算法,在目前對(duì)人工神經(jīng)網(wǎng)絡(luò)的研究中,有80%~90%的模型采用BP 神經(jīng)網(wǎng)絡(luò)或者它的變形形式[10]。因此,采用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)研究具有可操作性。
圖1 顯示了簡(jiǎn)單的BPNN 模型,典型的BPNN 模型具有多層結(jié)構(gòu),包括輸入層、隱含層、輸出層。
圖1 三層BPNN模型
如圖1所示,相鄰的兩個(gè)層中的神經(jīng)元通過高度互連的權(quán)重連接在一起。wni是指從輸入層單元到隱含層單元的權(quán)重,wij是指從隱含層到輸出層的權(quán)重。輸入層的加權(quán)輸入總和,作為第i個(gè)隱含層的輸入,通過傳遞函數(shù)的作用轉(zhuǎn)化成隱含層的輸出,激活函數(shù)選擇常用的Sigmoid函數(shù),則有接著輸出層的輸出單元輸出先是由隱含層單元Hi的加權(quán)總和,然后通過再一次的傳遞函數(shù)(Sigmoid 函數(shù))得到。在神經(jīng)網(wǎng)絡(luò)模型中,需要訓(xùn)練網(wǎng)絡(luò)來(lái)確定最佳的權(quán)重,達(dá)到滿足訓(xùn)練數(shù)據(jù)的基本特征。反向傳播算法通過使所有訓(xùn)練集中的目標(biāo)輸出gJ與實(shí)際輸出yJ之間的誤差項(xiàng)最小化,得到下面的公式:
盡管神經(jīng)網(wǎng)絡(luò)相對(duì)于其他傳統(tǒng)的回歸技術(shù)具有優(yōu)越性,但是在進(jìn)行預(yù)測(cè)時(shí),調(diào)試誤差的精度仍是一個(gè)難點(diǎn);另一方面,神經(jīng)網(wǎng)絡(luò)的點(diǎn)預(yù)測(cè)性能隨著數(shù)據(jù)來(lái)源的復(fù)雜性和不確定性的增加而顯著下降。因此,本文采用構(gòu)造置信區(qū)間的技術(shù)來(lái)進(jìn)行神經(jīng)元模型的區(qū)間預(yù)測(cè)。
對(duì)于給定的輸入為x,輸出為y的系統(tǒng),系統(tǒng)模型用來(lái)表示。其中,θ*代表系統(tǒng)模型中參數(shù)θ的真實(shí)值。假設(shè)誤差ε是系統(tǒng)的實(shí)際輸出與觀測(cè)輸出的差值,并且誤差ε服從于均值為0,方差為σ2的正態(tài)分布,該分布表示為:ε~(0,σ2)。所以系統(tǒng)可以表示為:
通過公式(4),來(lái)使得誤差最小化,得到θ*的最小二乘估計(jì)量為。
通過使用公式(2)、(6)、(7),來(lái)計(jì)算真實(shí)值y與預(yù)測(cè)值之間的差值,公式(8)表示的是差值之間的期望:
置信區(qū)間用t-分布表示為:
代替?zhèn)鹘y(tǒng)的驗(yàn)證模型,如平均百分比誤差(MAPE)、均方誤差(MSE)的傳統(tǒng)標(biāo)準(zhǔn),本文使用預(yù)測(cè)區(qū)間概率和預(yù)測(cè)區(qū)間平均寬度來(lái)驗(yàn)證預(yù)測(cè)結(jié)果。對(duì)于每個(gè)點(diǎn)輸出的預(yù)測(cè)區(qū)間,本文將通過計(jì)算區(qū)間的概率和寬度來(lái)進(jìn)行預(yù)測(cè)區(qū)間改正,而不是僅僅通過減少基于誤差的度量。根據(jù)文獻(xiàn),將預(yù)測(cè)區(qū)間覆蓋概率PICP定義為[11]:
同樣,歸一化平均預(yù)測(cè)區(qū)間寬度NMPIL定義為[11]:
其中,tmax、tmin分別是樣本中的最大值和最小值。如果NMPIL的值足夠大時(shí),則可以包含所有的真實(shí)值,但是這樣就完全沒有意義了。所以構(gòu)造預(yù)測(cè)區(qū)間的驗(yàn)證標(biāo)準(zhǔn)是在PICP足夠大的前提下,NMPIL足夠小。然而,在理論上這兩個(gè)目標(biāo)函數(shù)是有沖突的,概率越高區(qū)間寬度自然會(huì)越大;區(qū)間寬度越小概率自然越小。為了解決這個(gè)問題,提出綜合評(píng)價(jià)指標(biāo)(Coverage Lengthbased Criterion,CLC)[12]:
其中,μ=1-α,η稱為懲罰參數(shù),綜合評(píng)價(jià)指標(biāo)CLC越小越好。
以“一帶一路”經(jīng)濟(jì)帶沿途的中國(guó)18個(gè)省市為決策單元。所有的評(píng)價(jià)指標(biāo)來(lái)源于2017 年的《中國(guó)統(tǒng)計(jì)年鑒》《中國(guó)建設(shè)統(tǒng)計(jì)年鑒》《中國(guó)旅游統(tǒng)計(jì)年鑒》,目的是針對(duì)這18 個(gè)省市的旅游效率評(píng)估。參考已有的文獻(xiàn)[13],選用3 個(gè)輸入指標(biāo)、2 個(gè)輸出指標(biāo)進(jìn)行評(píng)價(jià)。通過模型(1)計(jì)算,結(jié)果如表1所示。
從表1 的第8 列θ值的結(jié)果可以看出,只有3 個(gè)省市(上海、福建、海南)的旅游效率是DEA 有效的,而剩下的省市的旅游效率全部都是無(wú)效,為了分析無(wú)效的原因,首先要對(duì)這些省市進(jìn)行分類。文獻(xiàn)[14]認(rèn)為可以將DEA 得出的效率分為4 類:S1∈(0.98, ]1 為強(qiáng)相對(duì)有效,這一類中的單元只要稍微修改,就能達(dá)到最佳的組合配置;S2∈(0.8, ]0.98 為相對(duì)有效,這一類的單元除了需要修改資源的利用,還需要花上一點(diǎn)的時(shí)間;為相對(duì)低效區(qū)間,這一類的單元需要重新調(diào)整資源配置或者產(chǎn)出標(biāo)準(zhǔn),同時(shí)需要一段時(shí)間來(lái)適應(yīng);S4∈(0, ]0.5 為非常低效區(qū)間,這一區(qū)間內(nèi)的單元,需要大幅度地修改投入和產(chǎn)出,還要投入大量的時(shí)間進(jìn)行不斷調(diào)整。
由于DEA 計(jì)算的結(jié)果屬于后評(píng)價(jià)的范圍,評(píng)價(jià)的結(jié)果不能夠完全說(shuō)明結(jié)果,要想準(zhǔn)確地將結(jié)果進(jìn)行分類,需要通過神經(jīng)網(wǎng)絡(luò)模型進(jìn)行區(qū)間預(yù)測(cè),如果預(yù)測(cè)的結(jié)果正好完全落在Si中,可以認(rèn)為該單元屬于這個(gè)區(qū)間;如果預(yù)測(cè)結(jié)果部分落在某個(gè)Si中,可以通過公式判斷。以分別落在S1、S2區(qū)間的預(yù)測(cè)區(qū)間為例。
表1 18個(gè)省市旅游效率結(jié)果
表2 真實(shí)值與預(yù)測(cè)區(qū)間比較
基于1.3 節(jié)的相關(guān)模型和相關(guān)公式,利用Matlab編程求解,并且令置信水平分別為80%、90%、95%、99%。圖2 顯示了BP 神經(jīng)網(wǎng)絡(luò)經(jīng)過多次訓(xùn)練好的預(yù)測(cè)圖。在置信水平為80%的置信區(qū)間內(nèi),共有15 個(gè)樣本點(diǎn)落在置信區(qū)間內(nèi)。當(dāng)置信水平為90%、95%、99%時(shí),預(yù)測(cè)的結(jié)果明顯比置信水平為80%的結(jié)果差很多,主要原因是樣本的容量較少,但在一定程度上能夠說(shuō)明BP神經(jīng)網(wǎng)絡(luò)在效率區(qū)間預(yù)測(cè)上的可行性。
圖2 BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)區(qū)間結(jié)果
旅游效率為無(wú)效的省市效率點(diǎn)轉(zhuǎn)化為效率區(qū)間的結(jié)果如表2所示,一共有15個(gè)樣本點(diǎn)。
所有樣本點(diǎn)的預(yù)測(cè)區(qū)間,利用公式(15)~(17)進(jìn)行驗(yàn)證檢驗(yàn),結(jié)果如表3 所示。結(jié)果顯示,CLC 的值低于0.5,具有較好的預(yù)測(cè)性能,所以可以利用區(qū)間數(shù)來(lái)說(shuō)明樣本的效率值。根據(jù)公式(18)對(duì)12個(gè)落在預(yù)測(cè)區(qū)間內(nèi)的樣本進(jìn)行分類,結(jié)果如表4 所示,真實(shí)值和預(yù)測(cè)區(qū)間之間分類的結(jié)果會(huì)存在少量的差異。
表3 驗(yàn)證模型結(jié)果
表4 真實(shí)值與預(yù)測(cè)區(qū)間的分類結(jié)果
可以發(fā)現(xiàn),如果按真實(shí)的效率值和預(yù)測(cè)區(qū)間進(jìn)行分類,結(jié)果是存在差異的,主要因?yàn)闃颖鞠到y(tǒng)的復(fù)雜性和不確定性造成。對(duì)于這樣的差異,該選擇哪一種分類方式,本研究通過分析差異點(diǎn)來(lái)探討此問題,同樣以這些點(diǎn)為例分析無(wú)效點(diǎn)改進(jìn)的方法。由結(jié)果可以看出,M7為樣本的差異點(diǎn)。
M7代表著是黑龍江省。黑龍江省作為中國(guó)最北的省份,被大家譽(yù)為“冰雪之城”。但是哈爾濱商業(yè)大學(xué)的研究團(tuán)隊(duì)在做黑龍江省的旅游業(yè)景氣指數(shù)研究時(shí)[15],指出黑龍江省旅游行業(yè)的許多問題:經(jīng)營(yíng)項(xiàng)目雷同、旅行社不正當(dāng)競(jìng)爭(zhēng)、宰客現(xiàn)象嚴(yán)重等一系列問題。這就導(dǎo)致通過訓(xùn)練得出M7的預(yù)測(cè)區(qū)間下限到達(dá)非常低的位置,導(dǎo)致預(yù)測(cè)區(qū)間劃分到S4,本文認(rèn)為可以將M7劃分到S4集合中。
對(duì)于落在S4中黑龍江省的旅游效率問題,提出以下幾點(diǎn)建議:(1)根據(jù)表1 的計(jì)算結(jié)果本文認(rèn)為,可以減少或者停止對(duì)土地要素和資本要素的投入,即減少綠地面積和住宿業(yè)、餐飲業(yè)的投入,同時(shí)管控住宿業(yè)和餐飲業(yè)亂收費(fèi)的現(xiàn)象,讓旅客且真實(shí)地感受旅游市場(chǎng)的公平;(2)大力構(gòu)建旅游品牌,增強(qiáng)旅游競(jìng)爭(zhēng)力,吸引游客的流入;(3)拓寬國(guó)際旅游業(yè)務(wù),由于黑龍江的地理位置優(yōu)越,位于中國(guó)邊境地帶,可以推進(jìn)境外游,吸納境外游客來(lái)黑龍江旅游。分析結(jié)果表明黑龍江的旅游效率比較低,需要黑龍江省投入大量的時(shí)間和精力來(lái)改善現(xiàn)狀。
本文研究的主要目的是找出一個(gè)最佳的神經(jīng)網(wǎng)絡(luò)模型進(jìn)行效率區(qū)間預(yù)測(cè),雖然神經(jīng)網(wǎng)絡(luò)模型不是一個(gè)新的概念,但還是有很多問題沒有解決,這也對(duì)本文的模型精度產(chǎn)生了影響。隨機(jī)過程和復(fù)雜系統(tǒng)的不確定性的不斷積累會(huì)導(dǎo)致神經(jīng)網(wǎng)絡(luò)點(diǎn)預(yù)測(cè)的性能,特別是在進(jìn)行效率預(yù)測(cè)時(shí)。針對(duì)此問題,本文假設(shè)樣本真實(shí)值與預(yù)測(cè)值的誤差成正態(tài)分布,采用Delta 方法對(duì)每一個(gè)點(diǎn)預(yù)測(cè)構(gòu)建預(yù)測(cè)區(qū)間。因?yàn)樵谟?xùn)練神經(jīng)網(wǎng)絡(luò)時(shí),只需要計(jì)算一次雅可比矩陣,所以計(jì)算難度大大下降。在驗(yàn)證預(yù)測(cè)區(qū)間結(jié)果方面,采用新的測(cè)度模型,比傳統(tǒng)的驗(yàn)證標(biāo)準(zhǔn)更具有說(shuō)服力[11]。最后在利用18 個(gè)省市的旅游效率進(jìn)行預(yù)測(cè),驗(yàn)證結(jié)果誤差較小,包括有效點(diǎn)在內(nèi)總有15個(gè)樣本真實(shí)值點(diǎn)在預(yù)測(cè)區(qū)間內(nèi),誤差為16.7%,CLC 低于0.5,說(shuō)明了預(yù)測(cè)區(qū)間具有較好的可靠性。由于本文所給的樣本數(shù)量少,指標(biāo)選擇具有主觀性等問題,所以本文研究仍需要進(jìn)一步的改進(jìn)。
未來(lái)研究改進(jìn)方向:(1)在保證精度的前提下,考慮加入含有噪聲的統(tǒng)計(jì)數(shù)據(jù);(2)將本文的模型用于更加復(fù)雜、模糊的系統(tǒng)中,對(duì)其效率進(jìn)行區(qū)間預(yù)測(cè)。