• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      一種非平衡樣本集的PPP 可落地性評(píng)價(jià)算法研究

      2021-03-12 07:00:48沈俊鑫王曉萍
      軟件導(dǎo)刊 2021年2期
      關(guān)鍵詞:落地分類器分類

      沈俊鑫,程 墻,王曉萍

      (1.昆明理工大學(xué) 管理與經(jīng)濟(jì)學(xué)院;2.昆明理工大學(xué) 創(chuàng)新發(fā)展研究院,云南昆明 650093)

      0 引言

      政府與社會(huì)資本合作(Public-private Partnership,PPP)是在基礎(chǔ)設(shè)施及公共服務(wù)領(lǐng)域建立的一種長(zhǎng)期合作關(guān)系[1]。作為新型融資模式,PPP 模式已成為解決政府技術(shù)實(shí)力薄弱、提升科技項(xiàng)目運(yùn)營(yíng)效率、激發(fā)民間投資的重要政策工具,有利于加快公共產(chǎn)品和服務(wù)供給側(cè)結(jié)構(gòu)性改革,充分發(fā)揮市場(chǎng)在資源配置中的決定性作用,防范地方政府債務(wù)風(fēng)險(xiǎn)及促進(jìn)新型城鎮(zhèn)化建設(shè),已被廣泛應(yīng)用于交通、市政工程等領(lǐng)域。近年來,中國(guó)PPP 模式出現(xiàn)爆炸式增長(zhǎng),截至2020 年6 月底,財(cái)政部政府和社會(huì)資本合作中心(China Public-private Partnership Center,CPPPC)綜合信息平臺(tái)管理庫(kù)入庫(kù)項(xiàng)目總計(jì)9 626 個(gè),投資額高達(dá)14.8 萬億元,但累計(jì)開工項(xiàng)目?jī)H3 927 個(gè),其中2020 年上半年新增落地項(xiàng)目?jī)H216 個(gè),退庫(kù)項(xiàng)目高達(dá)296 個(gè)。

      根據(jù)CPPPC 定義,PPP 項(xiàng)目落地率指處于執(zhí)行階段和移交階段項(xiàng)目數(shù)與總?cè)霂?kù)項(xiàng)目數(shù)的比值,公私雙方簽署PPP 合同,成立項(xiàng)目公司是PPP 項(xiàng)目成功落地的重要標(biāo)志。PPP 項(xiàng)目通常存在再融資行為,因此評(píng)價(jià)PPP 是否成功執(zhí)行可分為合同簽署和再融資交割兩個(gè)階段。可落地性通?;谏鐣?huì)資本視角,即評(píng)價(jià)PPP 項(xiàng)目是否對(duì)社會(huì)資本有吸引力;而可落地性通常基于金融機(jī)構(gòu)視角,即金融機(jī)構(gòu)對(duì)于PPP 項(xiàng)目還本付息能力的判斷?!奥涞仉y”問題已經(jīng)成為阻礙政府有效投資的主要限制之一[2]。落地率低、再融資難等問題持續(xù)制約我國(guó)PPP 健康發(fā)展[3]。投資收益率較低、風(fēng)險(xiǎn)分擔(dān)不合理、投資周期長(zhǎng)等導(dǎo)致社會(huì)資本參與率持續(xù)不高等問題嚴(yán)重影響了項(xiàng)目落地執(zhí)行[4]。王嶺等[1]通過城市面板數(shù)據(jù)開展PPP 落地率與財(cái)政負(fù)擔(dān)關(guān)系實(shí)證分析,發(fā)現(xiàn)PPP 落地率與財(cái)政負(fù)擔(dān)緊密相關(guān);徐玖玖[5]認(rèn)為公私合作制的發(fā)展困境實(shí)質(zhì)上源于制度供給與需求的錯(cuò)配;張雅璇等[6]提出需重建PPP 項(xiàng)目產(chǎn)權(quán)制度,以克服PPP 合伙契約局限性;吳義東等[7]認(rèn)為地方政府公信力與當(dāng)?shù)豍PP 項(xiàng)目投資額之間存在顯著的正相關(guān)關(guān)系。PPP 相關(guān)研究雖已取得豐富成果,但鮮有開展可落地性研究,本文基于CPPPC 發(fā)布相關(guān)數(shù)據(jù),運(yùn)用機(jī)器學(xué)習(xí)方法開展PPP 可落地性評(píng)價(jià)研究。

      1 基于非平衡樣本集的集成學(xué)習(xí)模型構(gòu)建

      1.1 問題分析

      由于CPPPC 大部分項(xiàng)目為優(yōu)質(zhì)項(xiàng)目,案例樣本數(shù)據(jù)存在明顯不平衡性,正面案例遠(yuǎn)大于負(fù)面案例,機(jī)器學(xué)習(xí)輸入樣本中負(fù)例樣本較少,這將導(dǎo)致結(jié)果偏向正例,引起過擬合現(xiàn)象。運(yùn)用機(jī)器學(xué)習(xí)方法開展PPP 可落地性評(píng)價(jià)面臨的最大難題是原始數(shù)據(jù)集不平衡性。針對(duì)非平衡樣本集問題,Chawla 等[8]提出SMOTE 算法,借助少數(shù)樣本以及鄰域樣本生成新樣本,具備較好的抗噪性能;SMOTE 算法為解決數(shù)據(jù)不平衡問題提供了重要思路,但SMOTE 算法合成樣本較為粗放,未能針對(duì)實(shí)際樣本空間分布合成數(shù)據(jù),可能造成分類樣本合成錯(cuò)誤或冗余。因此有學(xué)者針對(duì)SMOTE 缺陷開展算法優(yōu)化研究,例如Wang 等[9]和Molinari等[10]分別提出Borderline-SMOTE、ADASYN 等改進(jìn)算法,對(duì)合成少數(shù)類樣本進(jìn)行精化處理,通過改善樣本合成機(jī)制,降低合成樣本帶來的噪音影響;陳思等[11]、李衛(wèi)紅等[12]通過聚類算法對(duì)合成結(jié)果進(jìn)行欠采樣,刪除新樣本集中的冗余數(shù)據(jù);Friedman 等[13]提出Adaboost 集成算法,將弱可學(xué)習(xí)分類器轉(zhuǎn)換為強(qiáng)可學(xué)習(xí)分類器;劉玉峰等[14]使用sub?agging 算法結(jié)合傳統(tǒng)分類器訓(xùn)練評(píng)價(jià)模型,結(jié)果表明subag?ging 比bagging評(píng)價(jià)效果更佳;部分學(xué)者[15-16]針 對(duì)SMOTE算法缺陷,對(duì)SMOTE 算法進(jìn)行迭代,且僅選擇上次迭代中被錯(cuò)分的樣本,從而有效降低SMOTE 帶來的噪音影響;李毅 等[17]、朱安安[18]使用隨機(jī)過采樣、隨機(jī)欠采樣和SMOTE3 類方法處理不平衡數(shù)據(jù)集,綜合比較發(fā)現(xiàn)過采樣方法效果更佳。

      即使PPP 項(xiàng)目經(jīng)歷了爆發(fā)式增長(zhǎng),但CPPPC 入庫(kù)項(xiàng)目總數(shù)仍不到一萬,上述優(yōu)化方法均無法避免欠擬合或過擬合現(xiàn)象。因此,本文綜合樣本合成算法與集成算法的優(yōu)點(diǎn),提出SMOTE-Bagging 算法,通過合理合成樣本實(shí)現(xiàn)正負(fù)樣本平衡,構(gòu)成基分類器訓(xùn)練集以提高Bagging 算法基分類器多樣性,保證模型準(zhǔn)確性、性能和泛化能力。

      1.2 算法設(shè)計(jì)

      傳統(tǒng)解決數(shù)據(jù)集非平衡問題主要采用過采樣和欠采樣兩種方法。過采樣方法指直接復(fù)制多份小種類樣本,實(shí)現(xiàn)正負(fù)樣本平衡,經(jīng)該方法處理后,樣本集在高維空間上的樣本點(diǎn)位置并沒有發(fā)生任何變化。例如采用SVM 算法分類時(shí),目的是在樣本集中找出可以劃分正負(fù)樣本的最大間隔分離超平面,因此傳統(tǒng)過采樣不會(huì)對(duì)最終結(jié)果產(chǎn)生任何影響。相比過采樣,欠采樣則直接刪除樣本量較多類的數(shù)據(jù),以達(dá)到正負(fù)樣本平衡,雖然不會(huì)帶來過擬合問題,但由于損失大量數(shù)據(jù),可能導(dǎo)致欠擬合。故直接使用過采樣或欠采樣均不適用于基于CPPPC 數(shù)據(jù)集。

      本文集成人工合成與機(jī)器學(xué)習(xí)兩種方法,解決樣本數(shù)據(jù)集非平衡問題。首先,采用人工合成數(shù)據(jù),實(shí)現(xiàn)正負(fù)樣本平衡;然后采用集成學(xué)習(xí)算法進(jìn)行模型訓(xùn)練。集成學(xué)習(xí)算法不會(huì)引入噪聲,保證訓(xùn)練集樣本均能被模型學(xué)習(xí),由于訓(xùn)練集被分成多個(gè)子集,模型結(jié)果偏向正例樣本的問題也能得到緩解。集成算法采用Bootstrap 對(duì)原始數(shù)據(jù)集進(jìn)行上采樣或者下采樣,上采樣容易導(dǎo)致樣本丟失而失真,下采樣則容易重復(fù)采用少類樣本造成過擬合。而SMOTE 算法雖然在訓(xùn)練集上能實(shí)現(xiàn)正負(fù)樣本平衡,但該算法新增數(shù)據(jù)本質(zhì)上是虛構(gòu)的,這部分合成數(shù)據(jù)可能給模型帶來噪聲。因此,將SMOTE 算法和Balance Bagging 算法結(jié)合,訓(xùn)練集樣本采用SMOTE 算法進(jìn)行訓(xùn)練,實(shí)現(xiàn)正負(fù)樣本比例平衡,隨機(jī)放回地從中抽取的子集不會(huì)出現(xiàn)正例樣本過多的情況,避免結(jié)果偏向正樣本。同時(shí),由于訓(xùn)練集被n次有放回采樣,SMOTE 算法帶來的噪音問題影響也大幅度下降。通過SMOTE 算法人工合成數(shù)據(jù),分析少數(shù)類樣本,采用人工合成方法將新樣本添加到數(shù)據(jù)集中,算法思路為:①對(duì)于每個(gè)少數(shù)類樣本Xi,以歐氏距離為標(biāo)準(zhǔn)計(jì)算Xi到少數(shù)類樣本集中所有樣本的距離,得到其k近鄰;②根據(jù)樣本不平衡比例設(shè)置采樣比例,并據(jù)此確定采樣倍率N,對(duì)于每一個(gè)少數(shù)類樣本Xi,從其k近鄰中隨機(jī)選擇若干個(gè)樣本,假設(shè)選擇的近鄰為x(1),x(2),…,x(N);③對(duì)于每一個(gè)隨機(jī)選出的近鄰x(i)(i=1,2,…,N),分別與原樣本按照公式(1)構(gòu)建新的樣本。

      采用Balance Bagging 集成學(xué)習(xí)算法,其算法思路[19]為:①?gòu)挠?xùn)練集樣本隨機(jī)抽出x條樣本用來訓(xùn)練,生成一個(gè)基學(xué)習(xí)器;②有放回地從訓(xùn)練集中隨機(jī)抽出x條樣本用于訓(xùn)練,生成一個(gè)基學(xué)習(xí)器;③以步驟②的方式隨機(jī)抽取n次,共計(jì)生成n個(gè)基學(xué)習(xí)器;④用這n個(gè)基學(xué)習(xí)器對(duì)測(cè)試集的每一個(gè)樣本以投票的方式進(jìn)行測(cè)試,從而得到測(cè)試樣本集預(yù)測(cè)結(jié)果。如果一個(gè)樣本被這n個(gè)基學(xué)習(xí)器投票,即預(yù)測(cè)分類,被分為1 的票數(shù)有m票,被分為0 的有n-m票,通過比較n和n-m的大小可以完成樣本預(yù)測(cè)。

      通過集成SMOTE 算法與Balance Bagging 算法,設(shè)計(jì)SMOTE-Bagging 算法思路為:①用Bootstrap 方法從訓(xùn)練集S 中抽取樣本,構(gòu)成Sk;②在Sk的基礎(chǔ)上使用SMOTE 算法生成新的少類樣本,直到兩類樣本數(shù)量相對(duì),構(gòu)成Sk’;③以Sk’為訓(xùn)練集,訓(xùn)練基分類器Ck;④k 個(gè)基分類器采用多數(shù)投票的方式得到測(cè)試集中每個(gè)樣本所屬類別。

      1.3 模型評(píng)價(jià)標(biāo)準(zhǔn)

      對(duì)于二分類問題,可將樣例根據(jù)真實(shí)——預(yù)測(cè)組合劃分為真正例(true positive,TP)、假正例(false positive,F(xiàn)P)、真反例(true negative,TN)、假反例(false negative,F(xiàn)N)4 種情形。令TP、FP、TN、FN 分別表示對(duì)應(yīng)的樣例數(shù),顯然這4種情形之和為樣例總數(shù),分類結(jié)果混淆矩陣如表1 所示。

      Table 1 Confusion matrix表1 混淆矩陣

      本文將PPP 可落地性強(qiáng)的項(xiàng)目定義為正例,可落地性弱的項(xiàng)目定義為負(fù)例。非平衡樣本數(shù)據(jù)集評(píng)價(jià)算法性能通常采用準(zhǔn)確率(Precision)、召回率(Recall)、G-均值(Gmean)、F 值(F-measure)等指標(biāo)進(jìn)行算法評(píng)價(jià)。

      準(zhǔn)確率又稱為正確率,反映正確分類的少數(shù)類樣本數(shù)占所有被分為少數(shù)類樣本數(shù)的比例;召回率反映被正確分類的少數(shù)類樣本數(shù)占所有少數(shù)類樣本數(shù)的比例;G-mean綜合考慮正類分類和負(fù)類分類準(zhǔn)確率,表示正例分類準(zhǔn)確率和負(fù)例分類準(zhǔn)確率均衡值;F-measure值是準(zhǔn)確率和召回率的加權(quán)調(diào)和平均。本文采用的是當(dāng)參數(shù)β=1 時(shí)的F-mea?sure值,即最常見的F1 值。F1 值綜合了準(zhǔn)確率和召回率的結(jié)果,當(dāng)F1 值較高時(shí)說明算法分類結(jié)果比較理想。

      2 實(shí)驗(yàn)與分析

      本文基于財(cái)政部政府與企業(yè)合作中心PPP 項(xiàng)目庫(kù),通過人工收集與爬蟲的方式獲取項(xiàng)目管理庫(kù)和項(xiàng)目?jī)?chǔ)備清單中所有行業(yè)數(shù)據(jù)。從項(xiàng)目本身和地方政府兩個(gè)維度,分析PPP 可落地性評(píng)價(jià)特征,建立標(biāo)簽,構(gòu)建基于社會(huì)資本視角的PPP 可落地性評(píng)價(jià)模型。一方面,為社會(huì)資本投資決策提供參考;另一方面,針對(duì)可落地性較差的項(xiàng)目,幫助政府進(jìn)行優(yōu)化調(diào)整。用于建模的項(xiàng)目分為落地性強(qiáng)(用1 表示)和落地性弱(用0 表示)兩種,從本質(zhì)上而言,可落地性評(píng)價(jià)問題即傳統(tǒng)意義上的分類問題。對(duì)原始數(shù)據(jù)進(jìn)行缺失值處理等數(shù)據(jù)預(yù)處理后,總樣本數(shù)量為10 848 條,其中落地性強(qiáng)的數(shù)據(jù)有7 445 條,落地性弱的數(shù)據(jù)有3 403 條。如圖1 所示,CPPPC 分類的19 個(gè)行業(yè)均存在數(shù)據(jù)不平衡情況,各個(gè)行業(yè)落地性強(qiáng)的樣本數(shù)量均遠(yuǎn)高于落地性弱的樣本數(shù)量。因此,要對(duì)PPP 項(xiàng)目進(jìn)行有效的可落地性評(píng)價(jià)必須解決正負(fù)樣本不平衡問題。

      2.1 特征選取

      本文在借鑒相關(guān)文獻(xiàn)研究的基礎(chǔ)上,建立PPP 可落地性評(píng)估模型的評(píng)價(jià)指標(biāo)體系。目前,學(xué)術(shù)界對(duì)于PPP 項(xiàng)目可落地性評(píng)估指標(biāo)的研究非常少見。在現(xiàn)有的研究中,胡恒松等[20]從經(jīng)濟(jì)社會(huì)發(fā)展?fàn)顩r、所在行業(yè)發(fā)展?fàn)顩r、政府方及國(guó)有出資人代表、項(xiàng)目質(zhì)量、社會(huì)資本方基本情況、風(fēng)險(xiǎn)及增信情況以及其他多個(gè)維度提出PPP 項(xiàng)目可落地性評(píng)估指標(biāo)體系。基于社會(huì)資本視角,且受限于數(shù)據(jù)可獲取性,本文通過對(duì)CPPPC 公開數(shù)據(jù)爬取分析,從項(xiàng)目本身和地方政府兩個(gè)維度選取評(píng)價(jià)特征,結(jié)果如表2 所示。

      Table 2 Characteristics of PPP landing evaluation表2 PPP 可落地性評(píng)價(jià)特征

      由表2 可知,樣本集共有24 個(gè)特征(標(biāo)簽),去除部分不需要參與計(jì)算特征,仍有18 個(gè)特征作為模型輸入指標(biāo)。但訓(xùn)練集中并非輸入特征越多模型性能越好,相反和可落地性相關(guān)性較小的指標(biāo)反而會(huì)給模型帶來噪音。為了避免這種情況,如表2 所示,本文計(jì)算出其余指標(biāo)和可落地性之間的相關(guān)性系數(shù),按相關(guān)性系數(shù)絕對(duì)值大小排序,最終選出排名前10 的指標(biāo)作為模型輸入指標(biāo)(表2 粗體數(shù)據(jù))。在使用相關(guān)系數(shù)法得出的前10 個(gè)重要性變量中,項(xiàng)目和政府相關(guān)指標(biāo)基本各占一半,其中包含項(xiàng)目基本特征、地方政府財(cái)政實(shí)力以及地方政府清廉程度。

      2.2 評(píng)價(jià)結(jié)果與分析

      將市政工程PPP 項(xiàng)目作為原始訓(xùn)練數(shù)據(jù),為驗(yàn)證本文算法優(yōu)越性,對(duì)原始數(shù)據(jù)預(yù)處理后,將數(shù)據(jù)按3∶2 的比例劃分為訓(xùn)練集和測(cè)試集。在實(shí)證研究前,首先對(duì)訓(xùn)練集數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,消除量綱對(duì)參數(shù)估計(jì)的影響。對(duì)于不平衡樣本問題,傳統(tǒng)算法預(yù)測(cè)結(jié)果一般會(huì)偏向多數(shù)類樣本集。

      在實(shí)證研究前,本文首先對(duì)訓(xùn)練集數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,消除量綱對(duì)參數(shù)估計(jì)的影響。使用傳統(tǒng)分類算法(邏輯回歸模型、支持向量機(jī)模型、決策樹模型)對(duì)訓(xùn)練集進(jìn)行學(xué)習(xí),模型測(cè)試結(jié)果如表3 所示。

      Table 3 Test results of traditional algorithm表3 傳統(tǒng)算法測(cè)試結(jié)果

      由表3 可知,邏輯回歸的Precision 較低,這意味著該算法測(cè)試結(jié)果中FP 較多,即對(duì)正樣本識(shí)別能力較差。SVM 算法相較另外兩類算法效果較好,但這在現(xiàn)實(shí)應(yīng)用中毫無意義,仍無法對(duì)可落地性樣本進(jìn)行有效分類。此外3 類算法Recall 低于60%,這3 種算法對(duì)負(fù)樣本的識(shí)別能力相當(dāng),但均不強(qiáng)。綜上所述,傳統(tǒng)分類算法建立PPP 可落地性評(píng)價(jià)模型效果不佳。

      為驗(yàn)證對(duì)比SMOTE-Bagging 算法與其他算法之間的性能差距,在保證相同數(shù)據(jù)預(yù)處理?xiàng)l件下,設(shè)定固定的ran?dom_state 值。對(duì)訓(xùn)練集進(jìn)行SMOTE 算法處理后,結(jié)合部分傳統(tǒng)分類器,對(duì)SMOTE-LR、SMOTE-SVM、SMOTE-DT、Bagging、SMOTE-Bagging 共5 類算法進(jìn)行測(cè)試,分別計(jì)算出Precision、Recall、G-mean、F-measure 等指標(biāo),用以評(píng)估算法性能。

      Table 4 Test results of the algorithms表4 算法測(cè)試結(jié)果

      根據(jù)算法預(yù)測(cè)結(jié)果顯示,傳統(tǒng)分類算法在SMOTE 處理后,新的測(cè)試結(jié)果均有小幅度提升,但在實(shí)際運(yùn)用中效果仍然較差。集成算法Bagging 的多項(xiàng)指標(biāo)相較前3 類算法較為理想,但Recall 和G-mean 分別僅為0.844 4 和0.750 3,說明該算法對(duì)于負(fù)例樣本的識(shí)別性能依舊不夠優(yōu)秀,驗(yàn)證了前文分析,即Bagging 算法在每次重復(fù)采樣時(shí),原始樣本集本身存在不平衡問題,重復(fù)采樣僅能部分解決這類負(fù)面影響。

      從4 類評(píng)價(jià)指標(biāo)來看,SMOTE-Bagging 表現(xiàn)均最為理想,從表4 可知,Bagging 或SMOTE-Bagging 這類集成算法分類性能優(yōu)于單分類器分類性能。SMOTE-Bagging 算法Recall 和G-mean 值分別為0.888 9、0.831 5,與Bagging 相比分別提高了4.45%和8.12%,說明SMOTE-Bagging 算法識(shí)別負(fù)例樣本性能得到了明顯提升。通過以上分析可知,SMOTE-Bagging 算法解決非平衡樣本集的效果最好,在使用SMOTE 算法降低下采樣帶來的過擬合的同時(shí),能夠減少SMOTE 帶來的噪聲?,F(xiàn)實(shí)中,PPP 項(xiàng)目會(huì)長(zhǎng)時(shí)間面臨樣本量較少且樣本集不平衡問題,該模型對(duì)解決現(xiàn)實(shí)問題具有一定參考意義。

      2.3 SMOTE-Bagging 算法模型應(yīng)用分析

      為驗(yàn)證本文SMOTE-Bagging 算法在新樣本中的預(yù)測(cè)性能以及模型泛化能力,本文選取另外6 個(gè)領(lǐng)域項(xiàng)目投資金額最高的行業(yè)PPP 項(xiàng)目作為訓(xùn)練集,采用隨機(jī)抽樣的方式選取樣本。其中可落地性弱和可落地性強(qiáng)的項(xiàng)目數(shù)量占比為1∶1。選擇與市政工程相同的輸入指標(biāo),將新的測(cè)試集樣本輸入已封裝的SMOTE-Bagging 算法模型,最終測(cè)試結(jié)果如圖1 所示。

      Fig.1 Test results of new sample圖1 新樣本測(cè)試結(jié)果

      使用SMOTE-Bagging 算法測(cè)試新樣本4 項(xiàng)評(píng)估指標(biāo)均大于0.7,這表明該算法泛化能力較優(yōu),能夠在一定的誤差范圍內(nèi)對(duì)PPP 項(xiàng)目可落地性進(jìn)行有效評(píng)估,也說明SMOTE-Bagging 算法可以提高非平衡樣本集分類有效性,證明了該算法在PPP 項(xiàng)目其他行業(yè)中的泛化可行性。

      3 結(jié)語

      本文根據(jù)CPPPC 各行業(yè)PPP 項(xiàng)目數(shù)據(jù),綜合比較多類機(jī)器學(xué)習(xí)算法,建立PPP 可落地性評(píng)價(jià)模型。研究結(jié)果表明,SMOTE-Bagging 算法效果最佳,該算法能有效解決非平衡樣本集帶來的偏向問題,同時(shí)最大限度削弱了SMOTE 算法帶來噪音的不良影響,且在新的數(shù)據(jù)集上表現(xiàn)出良好的泛化能力。

      基于大數(shù)據(jù)時(shí)代背景下,使用機(jī)器學(xué)習(xí)方法開展PPP項(xiàng)目可落地性評(píng)價(jià)研究具有可行性。近年來PPP 項(xiàng)目庫(kù)日益完善,數(shù)據(jù)來源、準(zhǔn)確度、數(shù)據(jù)獲取難易程度以及信息時(shí)效性相較以往均有明顯提升。結(jié)合SMOTE 和Bagging 等集成算法,可對(duì)PPP 可落地性進(jìn)行較為全面的評(píng)估。實(shí)驗(yàn)結(jié)果表明使用SMOTE-Bagging 算法可對(duì)非平衡PPP 項(xiàng)目樣本集落地率進(jìn)行有效分類和評(píng)估。

      SMOTE-Bagging 模型分類性能較其他算法更佳。通過對(duì)原始數(shù)據(jù)集進(jìn)行SMOTE 處理,得到新的平衡樣本集,選擇準(zhǔn)確率、召回率、G-均值、F 值作為模型分類性能的評(píng)估標(biāo)準(zhǔn),發(fā)現(xiàn)SMOTE-Bagging 算法性能最佳,將該算法應(yīng)用至新的樣本集時(shí),也取得了較為理想的測(cè)試結(jié)果。

      針對(duì)非平衡樣本集開展PPP 可落地性評(píng)價(jià)對(duì)地方政府和社會(huì)資本均有重要的實(shí)踐意義。對(duì)地方政府而言,識(shí)別落地性差的項(xiàng)目可以及時(shí)發(fā)現(xiàn)項(xiàng)目問題,對(duì)劣質(zhì)項(xiàng)目進(jìn)行改進(jìn),規(guī)范項(xiàng)目前期評(píng)估論證,提高“落地率”,推動(dòng)PPP 健康持續(xù)發(fā)展;對(duì)社會(huì)資本而言,由于PPP 項(xiàng)目歷時(shí)周期長(zhǎng)、資金需求量大,PPP 可落地性評(píng)價(jià)模型可實(shí)現(xiàn)推薦功能,輔助社會(huì)資本篩選優(yōu)質(zhì)項(xiàng)目。

      猜你喜歡
      落地分類器分類
      分類算一算
      分類討論求坐標(biāo)
      數(shù)據(jù)分析中的分類討論
      美聯(lián)儲(chǔ)加息終落地滬指沖高震蕩走低
      BP-GA光照分類器在車道線識(shí)別中的應(yīng)用
      教你一招:數(shù)的分類
      加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
      結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機(jī)的TSK分類器
      化繁為簡(jiǎn),醫(yī)保支付價(jià)可“落地”
      基于LLE降維和BP_Adaboost分類器的GIS局部放電模式識(shí)別
      香格里拉县| 仁化县| 灵武市| 揭阳市| 彭泽县| 珲春市| 太康县| 合川市| 云林县| 滦南县| 勃利县| 英山县| 长寿区| 墨江| 彭阳县| 黄浦区| 疏勒县| 遵义县| 鄂托克前旗| 共和县| 镇远县| 衢州市| 盖州市| 佛冈县| 施秉县| 稷山县| 紫阳县| 南京市| 岳普湖县| 河源市| 合川市| 松溪县| 蛟河市| 固阳县| 铜川市| 闽清县| 凌海市| 祁阳县| 樟树市| 梨树县| 郑州市|