周欣
(深圳市建設(shè)工程交易服務(wù)中心 廣東省深圳市 518000)
深圳建設(shè)工程招投標(biāo)市場(chǎng)從2000年至今已累計(jì)近20000 多家投標(biāo)企業(yè),企業(yè)分布覆蓋全國(guó)各地區(qū)。本文嘗試從深圳建設(shè)工程招投標(biāo)市場(chǎng)投標(biāo)企業(yè)市場(chǎng)行為分析入手,參考投標(biāo)企業(yè)活躍度數(shù)據(jù),定
義企業(yè)流失判定標(biāo)準(zhǔn);并選取合理算法模型,對(duì)鎖定范圍的投標(biāo)企業(yè)進(jìn)行企業(yè)流失重大影響因子分析;全面科學(xué)的展示了深圳建設(shè)工程招投標(biāo)市場(chǎng)投標(biāo)企業(yè)流失傾向性與企業(yè)數(shù)量分布情況,為市場(chǎng)主管部門提供了立體、客觀的數(shù)據(jù)說明,期望能在市場(chǎng)健康監(jiān)督及科學(xué)發(fā)展引導(dǎo)中發(fā)揮積極的推進(jìn)作用。
本文以深圳市建設(shè)工程交易市場(chǎng)從2000-2020年的相關(guān)數(shù)據(jù)為基礎(chǔ)數(shù)據(jù)源(以下簡(jiǎn)稱“基礎(chǔ)數(shù)據(jù)源”),并基于此完成相關(guān)研究并實(shí)現(xiàn)結(jié)果輸出。
本文選取企業(yè)投標(biāo)活躍度來作為“企業(yè)流失判定”輔助數(shù)據(jù)指標(biāo)。
企業(yè)的投標(biāo)行為時(shí)間間隔,是其活躍度的重要指標(biāo)。我們通過分析所有投標(biāo)企業(yè)的最大投標(biāo)間隔天數(shù),也就是所有企業(yè)在歷史中的投標(biāo)間隔天數(shù)的最大值,來實(shí)現(xiàn)市場(chǎng)投標(biāo)企業(yè)活躍特征的擬合。在數(shù)據(jù)源完成基礎(chǔ)清洗后,使用SPSS 軟件進(jìn)行統(tǒng)計(jì)分析,輸出圖形展示:深圳建設(shè)工程市場(chǎng)投標(biāo)2 次及以上投標(biāo)企業(yè)的總體活躍特征有呈現(xiàn)長(zhǎng)尾特性的趨勢(shì),但總體數(shù)據(jù)仍是集中在1000 天以內(nèi)。
根據(jù)圖1 和圖2 中投標(biāo)企業(yè)的活躍特征,我們初步設(shè)定,當(dāng)投標(biāo)企業(yè)的最大投標(biāo)間隔天數(shù)達(dá)到1000 天以上,即認(rèn)定該企業(yè)進(jìn)入“小概率”期間,意味著該企業(yè)對(duì)于當(dāng)前市場(chǎng)已經(jīng)流失,基于此設(shè)定對(duì)流失企業(yè)具體判定標(biāo)準(zhǔn)進(jìn)行選定及認(rèn)證。
我們分別選取深圳投標(biāo)企業(yè)的活躍度排名前90%樣本群、前85%樣本群和前80%樣本群進(jìn)行分析,分別得到排名前90%、85%、80%條件下的投標(biāo)企業(yè)最大投標(biāo)間隔天數(shù)閾值,數(shù)據(jù)如表1。
同時(shí)根據(jù)“基礎(chǔ)數(shù)據(jù)源”分析可得,深圳投標(biāo)企業(yè)歷史平均投標(biāo)間隔天數(shù)13.4 天和歷史平均投標(biāo)次數(shù)56.3 次;將此作為深圳投標(biāo)企業(yè)“基準(zhǔn)投標(biāo)間隔天數(shù)”和“基準(zhǔn)投標(biāo)次數(shù)”。由此為參考原點(diǎn),計(jì)算出在前90%樣本群的閾值天數(shù)內(nèi),對(duì)應(yīng)樣本群每家企業(yè)有66.8 次投標(biāo)行為,相比“基準(zhǔn)投標(biāo)次數(shù)”56.3 次明顯溢出;在前85%樣本群的閾值天數(shù)內(nèi),對(duì)應(yīng)樣本群每家企業(yè)有42.4 次投標(biāo)行為,相對(duì)“基準(zhǔn)投標(biāo)次數(shù)”有75%以上的行為覆蓋;在前80%樣本群的閾值天數(shù)內(nèi),將會(huì)發(fā)生27.9次投標(biāo)行為,對(duì)“基準(zhǔn)投標(biāo)次數(shù)”覆蓋性略有不足。
綜合考慮樣本群覆蓋率和平均投標(biāo)行為覆蓋率,我們最終選定85%樣本群的閾值天數(shù)(即567 天)作為投標(biāo)企業(yè)的生命周期天數(shù)。超過該閾值天數(shù)都未發(fā)生再次投標(biāo)行為的企業(yè),我們將認(rèn)定該企業(yè)已經(jīng)從當(dāng)前市場(chǎng)中流出?;谇笆?5%樣本群的閾值天數(shù)為567 天,本文將投標(biāo)人退出定義為最后一次投標(biāo)時(shí)間在2018年12月11日前投標(biāo)為流出。本文數(shù)據(jù)時(shí)間段為2000年1月1日-2020年6月30日,共有19575 家企業(yè)進(jìn)行投標(biāo)。
表1:投標(biāo)企業(yè)不同樣本群投標(biāo)間隔閾值
圖1:最大投標(biāo)間隔企業(yè)分布情況(條形圖)
圖2:最大投標(biāo)間隔企業(yè)分布情況(柱狀圖)
圖3:歷年投標(biāo)人流入流出對(duì)比圖
圖4:歷年凈流入企業(yè)情況
圖5:不同流失傾向性企業(yè)數(shù)量分布
具體模型如下:
其中i為某投標(biāo)企業(yè),dx為當(dāng)前日期,dyi為該企業(yè)最近投標(biāo)日期。
運(yùn)用以上投標(biāo)企業(yè)流失判定模型,獲得深圳市場(chǎng)歷史投標(biāo)企業(yè)的流失企業(yè)名單,進(jìn)一步研究流失企業(yè)的總體特征情況及重大影響因子,建立最終的市場(chǎng)流失企業(yè)識(shí)別模型,完成市場(chǎng)流失傾向性企業(yè)情況展示與企業(yè)分布情況展示及分析。
某企業(yè)歷史上首次在本市場(chǎng)進(jìn)行投標(biāo)活動(dòng)時(shí),我們定義首次投標(biāo)的時(shí)間節(jié)點(diǎn)為該投標(biāo)企業(yè)流入深圳市場(chǎng)的時(shí)間點(diǎn)。
表2:二分類logistic 回歸模型中的變量
對(duì)“基礎(chǔ)數(shù)據(jù)源”分析并圖標(biāo)展示,深圳市場(chǎng)歷年投標(biāo)企業(yè)的流入與流失數(shù)量呈倒金字塔結(jié)構(gòu)分布,即投標(biāo)人的流入與流出數(shù)量總數(shù)隨時(shí)間推移在不斷增多,側(cè)面佐證近年深圳工程建設(shè)的迅猛發(fā)展。
基于圖3 數(shù)據(jù),計(jì)算可得歷年的投標(biāo)企業(yè)凈流入數(shù)據(jù)。
由數(shù)據(jù)可得,深圳招投標(biāo)市場(chǎng)每年凈流入企業(yè)數(shù)呈正向發(fā)展;但2011年、2017年-2018年的流出企業(yè)數(shù)量大于流入企業(yè)數(shù)量,且2002年、2010年、2012年、2013年凈流入企業(yè)數(shù)量較少,市場(chǎng)競(jìng)爭(zhēng)相對(duì)平和。對(duì)此,我們做進(jìn)一步分析研究。如圖4所示。
我們基于市場(chǎng)交易數(shù)據(jù)、投標(biāo)企業(yè)基本信息和投標(biāo)行為數(shù)據(jù),對(duì)影響企業(yè)流失的可能因素展開分析。
(1)企業(yè)自身因素:含“注冊(cè)區(qū)域、注冊(cè)時(shí)長(zhǎng)、專業(yè)資質(zhì)、規(guī)模等級(jí)、業(yè)務(wù)類型”自身差異性因子5 個(gè)。
(2)企業(yè)中標(biāo)與否及相關(guān)因素:含“中標(biāo)率、累計(jì)中標(biāo)金額區(qū)間、中標(biāo)次數(shù)區(qū)間”中標(biāo)相關(guān)因子3 個(gè)。
(3)企業(yè)投標(biāo)行為因素:含“投標(biāo)次數(shù)等級(jí)、投標(biāo)頻次、投標(biāo)規(guī)模偏好、投標(biāo)類型偏好、抽簽抽中率”行為相關(guān)因子4 個(gè)。
(4)其他因素:含“進(jìn)入市場(chǎng)時(shí)間、首末次投標(biāo)時(shí)間間隔”相關(guān)因子2 個(gè)。
通過進(jìn)一步量化計(jì)算,得出二分類logistic 回歸模型。
Y= a + b1X1 + b2X2 + b3X3 .....+ bnXn
Y 為統(tǒng)計(jì)中的預(yù)測(cè)目標(biāo)(留存1,流失0),X1~Xn 為最終確定的n 個(gè)影響權(quán)重較大的因子,b1~ bn 分別為標(biāo)準(zhǔn)化處理后的各個(gè)因子的影響系數(shù),a 為調(diào)整常數(shù)。
將前文所述的影響因子均作為自變量使用全部進(jìn)入法分別加入回歸模型,同時(shí)對(duì)回歸方程各影響因子進(jìn)行合理性檢驗(yàn)。經(jīng)過殘差分析和擬合度進(jìn)行驗(yàn)證,排除掉非重要的因子,最終得到影響企業(yè)留存與流失的影響因素回歸模型。表2 中,Sig 系數(shù)≤0.05 為重要因子的檢驗(yàn)值,Wals則為各因子的重要性評(píng)估數(shù)值越大重要性越強(qiáng)。
經(jīng)確定五個(gè)影響權(quán)重較大的因子分別為“規(guī)模等級(jí)、投標(biāo)頻次、中標(biāo)情況、注冊(cè)時(shí)長(zhǎng)、注冊(cè)區(qū)域”,方程中n=5,b1~ b5分別為標(biāo)準(zhǔn)化處理后的各個(gè)因子的影響系數(shù),a 為調(diào)整常數(shù)。
經(jīng)數(shù)據(jù)帶入,最終的回歸模型為:
Y=0.163X1+0.765X2-0.129X3+0.562X4+0.397X5-3.945
又根據(jù)企業(yè)的流失傾向性P 值與回歸方程Y 值有如下關(guān)系:
所以最終的市場(chǎng)流失企業(yè)識(shí)別模型為:
其中P 為企業(yè)的流失傾向性,X1~X5為規(guī)模等級(jí)、投標(biāo)頻次、中標(biāo)情況、注冊(cè)時(shí)長(zhǎng)、注冊(cè)區(qū)域五項(xiàng)因素。
通過識(shí)別模型,代入每家投標(biāo)企業(yè)的相關(guān)因子數(shù)據(jù),得出各企業(yè)的流失傾向性和整個(gè)深圳市場(chǎng)投標(biāo)企業(yè)的流失傾向特征(圖5),直觀展示了當(dāng)前市場(chǎng)的流失傾向性特征,并給市場(chǎng)主管部門進(jìn)行市場(chǎng)發(fā)展引導(dǎo)提供數(shù)據(jù)支撐。
4.1.1 企業(yè)投標(biāo)頻次
由模型可知,投標(biāo)頻次是影響最大的因子,且投標(biāo)頻次與企業(yè)留存呈現(xiàn)正相關(guān)關(guān)系,投標(biāo)活動(dòng)越是頻繁,越不可能流失。
4.1.2 企業(yè)規(guī)模等級(jí)
此因子為正向因子:企業(yè)的規(guī)模越大,在市場(chǎng)中的留存概率也越高,即大企業(yè)在市場(chǎng)中更不容易流失。市場(chǎng)中流失的主體是規(guī)模偏小,扛風(fēng)險(xiǎn)能力較弱,對(duì)市場(chǎng)政策變化較為敏感的企業(yè)。
4.1.3 企業(yè)注冊(cè)區(qū)域
同為正向因子:本地企業(yè)相較于外地企業(yè)留存概率更高。
4.1.4 企業(yè)注冊(cè)時(shí)長(zhǎng)
同樣是影響投標(biāo)企業(yè)留存的一個(gè)正向因子,注冊(cè)時(shí)間長(zhǎng)的企業(yè)相較新企業(yè)在深圳市場(chǎng)的留存率也更高。
4.1.5 企業(yè)的中標(biāo)情況
此因子是一個(gè)反向因子。我們常識(shí)認(rèn)知的是,中標(biāo)率越高的企業(yè)越容易在當(dāng)前市場(chǎng)留存,可實(shí)際是中標(biāo)率高的企業(yè)比中標(biāo)率低的企業(yè)在市場(chǎng)中的流失概率要更大。
造成這種現(xiàn)象的深層原因主要是:留存的企業(yè)因自身規(guī)模等多項(xiàng)因素,能支撐較多次數(shù)的投標(biāo)行為,而流失企業(yè)由于投標(biāo)成本或者其他因素,可能一次中標(biāo)后,就未繼續(xù)發(fā)生大量投標(biāo)行為,導(dǎo)致中標(biāo)率搞得企業(yè)反而留存率并不一定高。
例如,某工程有限公司,該企業(yè)的累計(jì)投標(biāo)次數(shù)為2862 次,在深圳市場(chǎng)月均投標(biāo)17 次,月均中標(biāo)0.8 次。較高的投標(biāo)數(shù)量導(dǎo)致了留存企業(yè)中標(biāo)率僅為常規(guī)流出企業(yè)的30%。
由此總結(jié),深圳市場(chǎng)中企業(yè)成立時(shí)間、規(guī)模等級(jí)、投標(biāo)頻次和注冊(cè)時(shí)長(zhǎng)與企業(yè)留存呈正向關(guān)系,且注冊(cè)地址為本地的企業(yè)更易留存,以上與我們經(jīng)驗(yàn)常識(shí)相吻合;而企業(yè)中標(biāo)率與企業(yè)留存呈反向關(guān)系,這與我們常規(guī)認(rèn)知存在一定差異。
深圳市場(chǎng)企業(yè)流失傾向性:在5%和82%位置企業(yè)流失數(shù)量分別形成兩個(gè)不同大小的峰值;特別是76%~90%流失傾向性之間的企業(yè)數(shù)量占比近15%,此現(xiàn)象特別值得思考及進(jìn)一步挖掘分析。深圳市場(chǎng)大部分企業(yè)還是處于13%~75%流失傾向性之間,且企業(yè)數(shù)量分布在此區(qū)間較為均勻。
本文應(yīng)用大數(shù)據(jù)技術(shù)對(duì)建設(shè)工程招投標(biāo)市場(chǎng)投標(biāo)企業(yè)流失情況分析進(jìn)行初探,但也存在很多分析不夠透徹深入的情況,這些需要在未來不斷完善并加深研究,實(shí)現(xiàn)大數(shù)據(jù)為工程建設(shè)招投標(biāo)提供更好的應(yīng)用服務(wù)。