• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于決策判別樹和ASVM的自適應支持向量混合信譽度評價模型研究

    2016-05-19 14:21:30趙福壯
    電腦知識與技術 2016年8期

    趙福壯

    摘要:本文在分析了國內外關于信譽評價的研究現狀后,結合我國企業(yè)發(fā)展的情況,創(chuàng)造性地提出了基于決策分類樹與ASVM的混合企業(yè)信譽度評價模型。較好地滿足了預先設定的要求為我國企業(yè)信譽度評價領域增添了一種新的方法。該模型既解決了決策分類樹在面對連續(xù)屬性的缺陷和多分類時出錯概率增加的問題,又解決了ASVM無法進行多分類的問題。混合信譽度評價模型中以ASVM作為決策分類樹中分支節(jié)點的判別模型。并且通過實驗發(fā)現組合核函數的ASVM模型相對于RBF核函數的ASVM模型在信譽危機判別應用中準確率有一定的提升。最終的混合信譽度評價模型采用了組合核函數的ASVM模型作為分支節(jié)點的判別模型。經過最終的實驗對比發(fā)現,該模型在解決企業(yè)信譽多分類問題中具有較高的準確率,具有較高的實用性

    關鍵詞:信譽度評價指標;決策分類樹;自適應支持向量機;組合核函數;混合模型

    中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2016)08-0253-05

    Abstract: After analyzing the present situation of the domestic and international credit evaluation research field,and combined with the situation of our country's enterprise development, A hybrid enterprise reputation evaluation model based on decision classification tree and ASVM is proposed.This model meets the requirements of the pre and adds a new credit model for our country. Which not only solves the problem of the increase of the error probability of the decision tree in the face of the defect of the continuous attributes,but also resolves the problem that ASVM cant make a multi classification.In mixed reputation evaluation model,ASVM with combination kernel function is more accurate compared to ASVM with RBF kernel function.So the new the mixed credit evaluation model has a high practicability.

    Key words:Index of credit evaluation decision tree ASVM Combined kernel

    信用評價是在市場經濟環(huán)境下針對企業(yè)、債券發(fā)行單位、金融機構等市場參者未來按期償還債務的能力及償還債務的程度進行綜合評價的業(yè)務行為。在市場經濟的大環(huán)境下,信用評級起到十分重要的作用。它有利于降低交易風險成本,全面展示企業(yè)或債務發(fā)行單位的信用風險;有利于降低社會信息獲取成本,能夠協(xié)助政府部門進行市場監(jiān)管,防范預測金融風險,同時也是經濟全球化發(fā)展的必然要求。為了進一步發(fā)展經濟,使中國走向世界,習近平總書記提出了一代一路建設,并在十三五規(guī)劃中大力提倡中國創(chuàng)造2025計劃,從中國制造轉向中國創(chuàng)造。企業(yè)走出去作為國家的名片,其信譽形象的好壞,更是直接影響著一個國家的總體形象。因此我國政府相關部門也開始重視并加快了信用制度的建設。我國企業(yè)征信管理中心借鑒國際先進的征信理念、科學的征信機制、時時海量信用信息等優(yōu)勢,建立了涵蓋各級政府職能部門、社會團體、行業(yè)協(xié)作、媒體、金融機構以及廣大消費者評價意見的信用評級標準,對企業(yè)進行信譽度評價,建立企業(yè)信譽檔案,規(guī)范企業(yè)發(fā)展。

    然而就實際情況來看,我國征信體系相對于西方發(fā)達國家而言起步較晚。西方征信體系已有上百年的歷史,并且有很多相關領域學者或機構根據自己國家企業(yè)的不同情況進行了針對性研究??傮w而言,我國信用評級機構整體來說表現為以下特點[1]:

    1)評級機構總量大、規(guī)模小、實力相對較弱。

    2)信用評級機構的專業(yè)性不夠強。

    3)市場上信用評級機構對企業(yè)的信譽評級結果表現出可信度低,利用率低,對社會影響較小特點。

    4)企業(yè)對信用記錄的重視程度還不夠,存在造假現象。

    由以上四點可以看出一個好的信譽評價機構必須本著公平,公正的原則對受評企業(yè)進行信譽評價。只有真實反映出企業(yè)的信譽狀況,才能取得公眾的信任,并為各方所接受。當然準確反映企業(yè)信譽狀況是以一套科學的企業(yè)信譽評價體為前提的。信譽評價領域的相關研究人員對此也做了大量研究。就目前來看,一個良好的信譽評價體系需要做一下兩方面的工作[3]:1)評價指標體系的選取問題;2)信譽評價模型的構建問題。

    1信譽評價指標的體系的選取

    在分析了國內外企業(yè)信譽度評級因素的內容和特點,結合中國上市企業(yè)的特征,綜合評估我國上市企業(yè)信用等級,本文將評級因素劃分為 企業(yè)文化、盈利能力、償債能力、經營能力、資本構成、行業(yè)前景共6個大類一級因素,每一類因素又包含有若干個二級因素[4]。具體如表1所示。

    上述初始擬定的評價指標是通過查閱大量文獻,進行全面分析,以詳盡和完備的原則建立而成的,其中包含了財務指標和非財務指標兩大類[2]。從信譽度評價的本質來講,評價者只需要找到較為關鍵的指標即可對企業(yè)進行信譽評價,從而也降低了評價成本。如果評價指標體系過大,會相應稀釋影響企業(yè)信譽對應指標的關鍵因素的影響力,此外還會大大增加信譽評價模型的復雜性程度。因此需要對上述指標體系進行一定的篩選,剔除影響因子相對較小的指標。在維護評價指標體系全面性的前提下,降低評價模型的復雜程度。

    本文采用專家意見法來確定企業(yè)信譽評價的指標體系,剔除一些影響力較小的指標。我們知道金融領域的專家,經過多年的實踐研究,對企業(yè)信譽風險評價有著較為深刻的認知。他們可以利用專業(yè)知識,工作經驗,從評價指標的實際意義來考慮其在企業(yè)信譽評價中的重要性。

    通過根據專家的打分統(tǒng)計對信譽評價指標進行排序,剔除得分較低的幾個指標。專家們的統(tǒng)一判斷,行業(yè)前景權重較弱,對公司的信譽級別影響較小,因此對其中的產品銷售前景、行業(yè)整體發(fā)展前景和國家政策支持三個指標進行剔除。雖然剔除了行業(yè)前景中的三個指標,但剩余評價指標集合與實際的關鍵指標集合整體還是保持一致的。根據前人的研究可知,企業(yè)遭受信用危機,影響信譽度的關鍵因素主要為企業(yè)的流動比率、資產周轉率、利潤率,并且這幾個指標專家統(tǒng)一給出的分值都比較高,剩余的評價指標集合相對全面地覆蓋了影響企業(yè)信譽的指標集。最終建立包含X1-X15共15個變量的信譽評價指標體系。

    2決策判別樹在信譽判別中應用優(yōu)缺點分析

    決策樹是一種人們?yōu)榱藢δ臣虑檫M行決策而進行的一系列判斷過程的樹形圖,由決策節(jié)點、分支和葉子三個部分組成?;舅枷胧抢糜柧殧祿詣拥臉嬙鞗Q策樹,然后根據建立的決策樹對任意實例進行判定,它往往向人們展示的是各因素之間的交互作用。

    決策樹與其他分類算法相比存在的缺陷是當類別很多時,它的分類錯誤率就可能增大。而且對于連續(xù)的屬性字段比較困難做出準確的預測。判別節(jié)點通常是根據一個屬性來進行分類的。上述缺點,判別樹在企業(yè)信譽判別中也是存在的。

    1)企業(yè)信譽級別判別屬于多分類問題,企業(yè)信譽級別通常分為多個層次,面對這種情況,判別樹錯分的幾率將會大大增加。信譽危機判別或貸款決策中通常是二分類問題,即企業(yè)是否出現危機或是否給申請貸款對象貸款,運用判別樹則比較合適。

    2)企業(yè)信譽度判別指標體系中,占很大一部分指標比例都是連續(xù)的字段。判別樹在面對連續(xù)屬性時,往往也表現出其中的不足,很難做出準確的預測,解決的方法通常是數據預處理期間對數據進行分段處理。

    3)判別樹在判別分類時屬于以此遞進的過程,每個判別節(jié)點只用一個基本屬性字段進行最大限度分類。然而在現實分類情況中不一定存在這種遞進式的分類關系。

    需要綜合所有指標才能進行分類。在企業(yè)信譽多等級評價時也會出現這種情況。

    通過以上決策樹在企業(yè)信譽度評價中的應用缺陷總結,能否找到一種新的判別模型用作判別樹中分支節(jié)點的判別模型,消除上述3點的不利影響有待研究。

    3ASVM在信譽判別中的應用及優(yōu)缺點分析

    3.1 ASVM原理介紹[5][6]

    首先引入分類錯誤率、決策損失函數、樣本偏斜度的概念并進行說明:

    1)分類錯誤率

    在公式(7)中,[λ]作為平衡因子來平衡決策損失最小化和分類間隔最大化目標。此外在模型中加入了決策損失函數來同步決策評價與學習過程,使得學習過程與風險偏好一致。[mj]用來反應樣本的偏斜程度,使模型對樣本偏斜度有自適應能力,[Cj]分類錯誤代價反應了決策者的風險偏好,決策者通過這一參數的調節(jié),對分類器結構進行干預,使模型具有交互能力。此外[mj],[Cj]還具有調整最優(yōu)分類超平面的作用。上述自適應支持向量機自動的賦予了兩類分類錯誤不同的懲罰參數值,某類的分類錯誤比率越大或該類的樣本總數越小,對應的懲罰參數越大。分類器將向著該分類錯誤的方向變化。不同的偏斜情況和分類錯誤對應著不同的分類器,使得分類器具備了動態(tài)特征。因此,該模型具有數據不平衡特性和決策風險偏好適應性,稱之為自適應支持向量機模型。

    關于自適應支持向量機的求解中,由于該模型在分類方法中加入了分類錯誤最小化目標函數,可以看出(7)問題為NP完全問題。通過凸規(guī)劃方法和二次規(guī)劃方法是無法求解的。在上述模型中,采用的是樣本點到分類邊界距離的(0-1)階梯函數來判斷產生分類錯誤與否。由于階梯函數的不可導性??刹捎霉剑?)。

    3.2核函數的選擇問題

    核函數的選擇對SVM的性能起到至關重要的作用,尋找一個適合的核函數是SVM算法的核心,但是截至目前,相關研究領域還沒有給出合適的理論依據去選擇優(yōu)質的核函數。

    目前學術界把支持向量機的核函數分為兩類:全局性的核函數和局部性的核函數??梢酝ㄟ^在matlab中運用方陣核函數曲線了解對應的核函數是局部的還是全局的。局部核函數僅對測試點附近的小范圍數據有影響,而全局核函數能提取樣本全局特征,插值能力比較弱。對測試點近距離數據和遠距離數據都有一定影響。

    經過實驗驗證采用高斯核函數的ASVM模型較普通SVM模型在準確率上有一定的提升。但考慮到企業(yè)信譽度評價樣本集的廣泛性,及樣本記錄屬性的多樣性,本文提出采用組合核函數的ASVM模型進行信譽風險評估與預測。通過分析全局核函數和局部核函數的優(yōu)缺點以及核函數的性質,構造組合核函數如公式(10)

    3.3實驗對比分析

    為保證實驗的可對比性,本文實驗參數設置與陳思鳳、Lin等人的設置是一致的。實驗數據采用機器學習網站UCI提供的澳大利亞信用支持Statlog(Australian)Data 數據集和德國Statlog(German)Data數據。其中澳大利亞信用數據集,總共包含690條數據,記錄中包含14條屬性。Y=1的記錄包含307條記錄,Y=-1的記錄包含383條。分別占比44.5%和55.5%。德國信用數據總共包含1000條記錄,記錄中包含20條屬性,一類記錄包含474條,二類記錄包含526條,分表分別占比47.4%和52.6%。

    陳思風的實驗表明運用粒子群優(yōu)化參數的自適應支持向量機能獲得更適合的SVM參數。本文對RBF核函數的ASVM和采用(10)式的組合核函數的ASVM分別在上述兩個數據集上進行了實驗對比。由于只考慮樣本不平衡的情況,不考慮決策損失問題,所以此實驗的分類錯誤代價[C1=C2],下表給出了兩種核函數的實驗結果的準確率。

    由表2可以看出,采用粒子群算法進行參數選擇的ASVM在上述兩個數據集樣本偏斜的情況下都達到了較高的分類準確率。采用組合核函數的ASVM與采用RBF高斯核函數的ASVM相比,在準確率上有相應的提高。主要原因在于RBF核函數屬于局部核函數,而新提出的組合核函數考慮到了信譽風險預測樣本集的廣泛性與樣本記錄中屬性的多樣性,結合了局部核函數與全局核函數的優(yōu)缺點。所以組合核函數ASVM更適合用來進行信譽評級。

    4 混合企業(yè)信譽度評價模型

    本文采用國際通用標準,將信用評估等級劃分為AAA、AA、A、BBB、BB、B、CCC、CC、C、D四等10級。其中A類信用等級又分為AAA、AA、A三類檔次,分別代表AAA級優(yōu)秀信用企業(yè)、AA級優(yōu)良信用企業(yè)和A級良好信用企業(yè);B類信用等級同樣劃分為BBB、BB、B三類檔次,信譽分數逐級遞減,代表一般信譽企業(yè);C類信譽等級包含CCC、CC、C三類檔次,代表信譽較差企業(yè);D類信譽不再進行細分,直接代表信譽極差企業(yè)。

    4.1建立信譽判樹

    在二叉判定樹中,成功的二分查找出走一條從根節(jié)點到被查找到節(jié)點的路徑。不成功的查找則走了一條從根節(jié)點到葉子節(jié)點的路徑。本文提出的信譽決策分類樹不滿足上述規(guī)則。利用建好的信譽決策分類樹模型進行企業(yè)信譽判定時,走的必須從根節(jié)點到葉子節(jié)點的一條路徑,不會出現中途結束的情況。圖1給出一個簡單的四分類混合信譽度評價模型樹。

    樹中的每一個判別節(jié)點都的判別模型為本文第三部分提到的組合核函數ASVM。

    各個判別節(jié)點判別模型的訓練過程具體如下:

    1)選定支持向量機的訓練集合[Vn],[n]代表有[n]條記錄即:[X1,X2,X3...Xn],集合中每個等級信譽度的企業(yè)都要包含一定的量。這樣訓練出來的超平面才更具代表性。[Xi=(xi1,xi2,xi3...Xim,y)],每條記錄有m個變量。[y]代表該條記錄在某一個判定節(jié)點上的值,[y=1-1]。標簽劃分根據判別節(jié)點的左右孩子節(jié)點進行劃分。父節(jié)點集合[Sf]與左右孩子集合[Sl,Sr]滿足關系[Sf=Sl?Sr,Sl?Sr=Φ]。在某一個節(jié)點上進行模型訓練時,需要對樣本標簽[y]進行賦值。[Sf]中樣本分配到左分支集合[Sl]時該樣本標簽[y=-1],否則樣本被分配到右分支孩子節(jié)點集合[Sr],該樣本標簽為[y=1]。標簽賦值確定之后即可運用支持向量機方法進行訓練,并用測試集進行測試。如果樣本數量不充足可采用交叉驗證法對訓練出的模型進行測試驗證。

    2)根據(1)中的說明,初始訓練集[Vn],從根節(jié)點開始依據左右分支劃分的集合給記錄中的y進行賦值,左分支集合y=-1,屬于又分支的集合y=1。

    3)利用訓練集合進行訓練得到[F(x)=i=1mwiφi(x)+b=wTφi(x)+b=0]一個超平面,記錄該判定節(jié)點的ASVM模型Model,對模型進行測試驗證。

    4)根據(3)中分割的兩個子集合,遞歸繼續(xù)重復(2)(3)兩步驟,直到樣本記錄落在葉子節(jié)點集合里結束。訓練出全部判別節(jié)點的判別模型,混合企業(yè)信譽判別模型建立完成,產生一個二叉信譽決策分類樹。

    按照此方式建立了四等十級混合企業(yè)信譽度評價判別樹模型如圖2所示。

    圖2中包含9個圓節(jié)點和10個方形節(jié)點。9個圓型判別節(jié)點,每個節(jié)點都對應一個判ASVM決策模型。10個方形節(jié)點,即10個細分信譽級別。每個圓形節(jié)點中包含了相應的集合,意思是,從根節(jié)點開始到達該節(jié)點經過多次二分類ASVM判別剩下的集合。樣本企業(yè)所屬級別就包含在該集合里。直到從根節(jié)點到方形節(jié)點,一條路徑走完,樣本企業(yè)落到具體的信譽級別下結束。不再采用根據信譽評價因素進行綜合打分的方式來評定企業(yè)信譽級別。

    4.2實驗對比分析

    本文數據主要來自于國泰君安官方網站上提供的上市企業(yè)2014年度相關數據。根據第1節(jié)中本文建立的信譽評價指標體系進行數據規(guī)整和預處理。把預處理后的數據作為模型的輸入,最后把第3節(jié)中的組合核函數ASVM和RBF核函數ASVM分別作為4.1節(jié)企業(yè)信譽決策分類樹中判別節(jié)點的判別模型進行訓練實驗。并對兩種混合信譽度判別模型的結果進行了對比。結果如表3所示。

    由表3可以看出本文提出的組合核函數ASVM模型與陳思風提出的RBF核函數ASVM模型相比,建立的企業(yè)信譽度判別模型分類正確率上有一定的提高。且兩種混合信譽度評價模型都在企業(yè)信譽預測時都具有較高的準確率,有很高的實用價值。在運用時,可以根據具體場景的要求選擇不同的SVM作為混合模型中信譽決策分類樹分支節(jié)點的判別模型。且本文作者還進行了相關實驗發(fā)現在調解ASVM中的錯誤分類代價[Cj]時,能很好的調節(jié)模型,使得結果向決策者的偏好方向移動。通過這種方式可以達到混合信譽度評價模型

    5結束語

    通常前人的研究都是對影響企業(yè)信用的指標進行分別打分,再加權求和,根據最后得分來給企業(yè)評分[7]?;蛘咄ㄟ^建模對企業(yè)進行分類判斷企業(yè)是否存在風險,但只能進行二分類。本文創(chuàng)造性的提出采用決策分類樹與ASVM結合的方法構造出混合企業(yè)信譽評級模型,較好的滿足了預先設定的要求,為我國企業(yè)信譽度評價建立了一種新的方法。具體主要做了一下幾方面的工作:

    1)企業(yè)信譽評價變量的選取。為了保證評級指標選取的全面、準確性,本文列出18個因素變量,通過專家權重打分,最終選擇15個指標作為信譽評級的輸入變量。

    2)首先決策分類樹的優(yōu)缺點分析,以及在信譽判別領域中的應用研究,并提出疑問。

    3)ASVM在信譽判別中的應用及優(yōu)缺點分析

    4)基于決策分類樹和ASVM的混合企業(yè)信譽評級模型。該信譽評級模型不采用打分法對企業(yè)信譽進行評級,而是根據企業(yè)樣本數據特征進行評級。經過實驗發(fā)現該混合信譽評級模型具有較高的準確率。并解決了決策分類樹在面對連續(xù)屬性和多分類問題中的不足。同樣避免了SVM在多分類問題上的缺陷。

    當然該模型還存在有待改進的地方。例如:企業(yè)樣本數據是一個動態(tài)產生的過程,本文的企業(yè)信譽判別采用數據為上市企業(yè)年度數據。缺乏動態(tài)預測。更全面的方法是根據企業(yè)的多階段歷史數據進行信譽預測。例如按時間順序,獲取企業(yè)每一季度的相關數據,根據數據的動態(tài)變化趨勢對企業(yè)信譽進行預測,將會更加科學全面。作者也會在后面的工作中進行相關研究。

    參考文獻:

    [1] 諸小麗,梁柱.企業(yè)信用等級綜合評判評分體系[J].中國科技信息,2005(23):293.

    [2] 喬薇.中小企業(yè)信用評級模型及其應用[D].河南大學,2008.

    [3] 詹世鴻.信用風險模型及信用評級綜述[D].吉林大學,2007.

    [4] 李萬慶,張立寧,孟文清. 企業(yè)信用的綜合評價[J]. 統(tǒng)計與決策,2005,11:23-24.

    [5] 丁子春.基于支持向量機的多領域自適應分類方法研究[D].武漢理工大學,2009.

    [6] 陳思鳳.基于ASVM的創(chuàng)業(yè)板上市企業(yè)風險評估研究[D].合肥工業(yè)大學,2012.

    [7] Leonard K J. A fraud alert model for credit cards during the authorization process[J]. IMA Journal of Mathematics Applied in Business and Industry.19934(5):57-62

    罗源县| 舞钢市| 榕江县| 隆昌县| 建瓯市| 四会市| 中宁县| 黎平县| 明水县| 江永县| 芦溪县| 花垣县| 襄汾县| 枣强县| 梅州市| 梧州市| 柳河县| 普格县| 诸暨市| 自治县| 蓬溪县| 吉安市| 岳阳县| 天长市| 崇义县| 根河市| 栾城县| 德清县| 南郑县| 沈丘县| 上高县| 昆明市| 云南省| 蓝山县| 巫溪县| 新疆| 泾川县| 辽宁省| 江山市| 宁远县| 余干县|