• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于BP神經(jīng)網(wǎng)絡(luò)的醫(yī)保欺詐識(shí)別①

      2018-06-14 08:48:36祝錫永
      關(guān)鍵詞:欺詐科室神經(jīng)網(wǎng)絡(luò)

      劉 崇,祝錫永

      (浙江理工大學(xué) 經(jīng)濟(jì)管理學(xué)院,杭州 310018)

      我國(guó)醫(yī)療保險(xiǎn)制度經(jīng)過(guò)幾十年的建設(shè)和改革,覆蓋人員總數(shù)已經(jīng)超過(guò)了13億.然而自城鎮(zhèn)職工基本醫(yī)療保險(xiǎn)和新型農(nóng)村合作醫(yī)療制度實(shí)施以來(lái),騙取醫(yī)保基金的行為不斷出現(xiàn).醫(yī)保欺詐是欺詐相關(guān)人員通過(guò)參?;蛱摌?gòu)、夸大保險(xiǎn)傷害等方法騙取保險(xiǎn)賠償,具有故意和有目的性、侵犯他人利益、嚴(yán)重的社會(huì)危害性等特征.常見(jiàn)的欺詐手段有就醫(yī)資格作假、病因作假、票據(jù)作假、處方作假、醫(yī)療文書(shū)作假等.醫(yī)保欺詐已對(duì)醫(yī)保基金安全構(gòu)成了重大的威脅,嚴(yán)重妨礙了我國(guó)醫(yī)療保險(xiǎn)政策的長(zhǎng)期可持續(xù)發(fā)展.

      由于醫(yī)保欺詐中行為主體的復(fù)雜性和實(shí)施手段的隱蔽性,使得欺詐行為很難通過(guò)直觀判斷發(fā)現(xiàn).但醫(yī)保數(shù)據(jù)客觀反映了參保人的行為,對(duì)海量的醫(yī)療結(jié)算信息進(jìn)行數(shù)據(jù)分析,尋找醫(yī)保欺詐潛在的行為規(guī)律,識(shí)別其中的欺詐行為,能有效避免醫(yī)?;饟p失.舊有的基于數(shù)據(jù)統(tǒng)計(jì)方法的分析工具已經(jīng)無(wú)法有效地違規(guī)數(shù)據(jù)進(jìn)行識(shí)別,而數(shù)據(jù)挖掘和人工智能技術(shù)的發(fā)展為醫(yī)療保險(xiǎn)欺詐識(shí)別提供了新的方法和途徑.運(yùn)用數(shù)據(jù)挖掘和人工智能方法從海量的醫(yī)保數(shù)據(jù)中發(fā)現(xiàn)潛在的違規(guī)信息,是醫(yī)保欺詐問(wèn)題識(shí)別的重要研究方向.

      1 研究現(xiàn)狀

      保險(xiǎn)欺詐識(shí)別的研究根據(jù)方法和工具大致可以劃分為三個(gè)階段:

      第一個(gè)階段對(duì)保險(xiǎn)欺詐識(shí)別的研究方法以統(tǒng)計(jì)回歸為主,核心是建立回歸分析模型以查找關(guān)于欺詐問(wèn)題的關(guān)鍵指標(biāo),并賦予相應(yīng)的權(quán)重,以此實(shí)現(xiàn)對(duì)保險(xiǎn)欺詐的識(shí)別與審核.該階段多采用二元離散選擇模型作為進(jìn)行欺詐識(shí)別:Artis,Ayuso和Guillen[1]采用logit離散模型對(duì)西班牙機(jī)動(dòng)車(chē)保險(xiǎn)索賠數(shù)據(jù)進(jìn)行欺詐分析,并針對(duì)數(shù)據(jù)值缺失的情況建立了改進(jìn)的AAG模型統(tǒng)計(jì),得到眾多業(yè)界同行的認(rèn)可.除了離散模型,Brockett,Derring[2]采用對(duì)比思想建立了PRIDIT模型,用以研究欺詐概率;Pinquet[3]設(shè)計(jì)了消除偏差的兩方程模型,對(duì)比單方程模型,該模型較好的消除了理賠樣本選擇偏差對(duì)審計(jì)結(jié)果的影響.國(guó)內(nèi)相關(guān)的實(shí)證研究文獻(xiàn)較少,葉明華[4,5]采用logit模型建立欺詐識(shí)別的指標(biāo)體系,借助平安保險(xiǎn)的機(jī)動(dòng)車(chē)索賠數(shù)據(jù)進(jìn)行實(shí)證研究.

      第二階段是運(yùn)用數(shù)據(jù)挖掘理論對(duì)保險(xiǎn)欺詐進(jìn)行研究.Viveros[6]使用關(guān)聯(lián)規(guī)則和神經(jīng)元分割對(duì)醫(yī)療保險(xiǎn)數(shù)據(jù)進(jìn)行分析,用以發(fā)現(xiàn)未知行為模式;Chiu[7]用改進(jìn)的Apriori算法構(gòu)建了欺詐識(shí)別模型,可以識(shí)別特定醫(yī)療服務(wù)中的疑似欺詐數(shù)據(jù);何俊華[8]基于垂直數(shù)據(jù)格式的頻繁模式發(fā)掘,設(shè)計(jì)了CBM和MaxCBM算法用于檢測(cè)騙保行為;陳亞琳[9]采用聚類(lèi)分析和分類(lèi)決策樹(shù)算法建立預(yù)測(cè)模型,用于識(shí)別某位病人在一段時(shí)間內(nèi)是否存在保險(xiǎn)欺詐行為;唐暻宜[10]將主成分分析引入聚類(lèi)分析,結(jié)合兩種方法對(duì)醫(yī)保數(shù)據(jù)進(jìn)行綜合評(píng)價(jià).

      第三階段是人工智能技術(shù)階段.人工智能技術(shù)的引入使得保險(xiǎn)欺詐識(shí)別的研究取得重要突破,尤其是神經(jīng)網(wǎng)絡(luò)技術(shù)的應(yīng)用.澳大利亞醫(yī)療保險(xiǎn)委員會(huì)的Hubick[11]首次在保險(xiǎn)欺詐識(shí)別中應(yīng)用BP神經(jīng)網(wǎng)絡(luò),為后來(lái)者提供了新的研究思路;Hawkins等[12]用改進(jìn)的三層BP神經(jīng)網(wǎng)絡(luò)改善了保險(xiǎn)欺詐的識(shí)別精度;Lious等[13]用神經(jīng)網(wǎng)絡(luò)、邏輯回歸合分類(lèi)樹(shù)對(duì)臺(tái)灣健康保險(xiǎn)系統(tǒng)中數(shù)據(jù)進(jìn)行實(shí)證研究,實(shí)證表明3種方法在保險(xiǎn)欺詐的識(shí)別中都有不錯(cuò)的表現(xiàn),其中神經(jīng)網(wǎng)絡(luò)方法識(shí)別能力最優(yōu);Maes[14]等分別采用神經(jīng)網(wǎng)絡(luò)和貝葉斯網(wǎng)絡(luò)進(jìn)行欺詐識(shí)別,其中貝葉斯網(wǎng)絡(luò)識(shí)別更為精準(zhǔn).

      綜上所述,早期關(guān)于保險(xiǎn)欺詐的研究集中在統(tǒng)計(jì)回歸方法的應(yīng)用上,能在特征明顯的數(shù)據(jù)上取得不錯(cuò)的識(shí)別效果.但隨著欺詐手段的復(fù)雜化、多樣化、隱蔽化,用該方法很難達(dá)成預(yù)期的識(shí)別效果,尤其是基于單因子的識(shí)別方法局限更為明顯.數(shù)據(jù)發(fā)掘的方法應(yīng)用上,利用孤立點(diǎn)方法挖掘異常數(shù)據(jù)等方法為欺詐識(shí)別提供了有效的途徑,但數(shù)據(jù)挖掘方法是基于大量的原始資料的收集與分析,從中提煉出有價(jià)值的信息,在數(shù)據(jù)體量和分析成本上要求較高.神經(jīng)網(wǎng)絡(luò)方法因具備自我調(diào)節(jié)能力,使得模型更夠適應(yīng)新的數(shù)據(jù)和欺詐手段,在保險(xiǎn)欺詐識(shí)別上取得較為廣泛的應(yīng)用,具有不錯(cuò)的借鑒意義,但模型的訓(xùn)練受數(shù)據(jù)樣本選擇影響較大,若樣本訓(xùn)練不當(dāng),難以達(dá)到預(yù)期效果.

      考慮現(xiàn)實(shí)因素,國(guó)外保險(xiǎn)行業(yè)信息化、商業(yè)化程度較高,較多研究成果已經(jīng)取得了不錯(cuò)的應(yīng)用.而國(guó)內(nèi),大部分醫(yī)院雖已實(shí)現(xiàn)信息化建設(shè),但是彼此數(shù)據(jù)是獨(dú)立的,并未打通;各省市醫(yī)保信息也彼此獨(dú)立、互不聯(lián)網(wǎng);商業(yè)化保險(xiǎn)的發(fā)展也存在不足.又出于個(gè)人信息隱私和商業(yè)機(jī)密保護(hù)的考慮,實(shí)際可獲得的研究樣本有限,這一系列因素制約了國(guó)內(nèi)關(guān)于醫(yī)保欺詐實(shí)證研究的發(fā)展.此外,國(guó)內(nèi)外醫(yī)療保障制度和社會(huì)經(jīng)濟(jì)環(huán)境也存在差異,因此不能完全照搬國(guó)外的方法.針對(duì)我國(guó)醫(yī)療保險(xiǎn)的現(xiàn)狀,克服實(shí)證方法的缺乏和數(shù)據(jù)的限制,構(gòu)建一個(gè)穩(wěn)定的欺詐識(shí)別模型對(duì)我國(guó)醫(yī)療保險(xiǎn)事業(yè)健康發(fā)展有積極意義.

      2 算法選擇

      本研究的主要目的是通過(guò)模型來(lái)識(shí)別用戶(hù)是否存在欺詐行為,被解釋變量是一個(gè)布爾形變量,本研究期望建立一個(gè)有監(jiān)督的二分類(lèi)模型用于欺詐識(shí)別.

      醫(yī)保欺詐涉及騙保人的心理、技術(shù)手段等眾多因素及其相互作用,具有高度非線(xiàn)性的特征.這使得傳統(tǒng)的利用指標(biāo)加權(quán)重的傳統(tǒng)分析方法如主成分分析、因子分析等很難獲得較好的識(shí)別效果.而B(niǎo)P神經(jīng)網(wǎng)絡(luò)在自適應(yīng)性、自組織上表現(xiàn)突出,具備良好的學(xué)習(xí)、容錯(cuò)及抗干擾能力,自變量可以是連續(xù)的,也可以是離散的,可以識(shí)別復(fù)雜變量間的非線(xiàn)性關(guān)系,因此選擇BP神經(jīng)網(wǎng)絡(luò)進(jìn)行醫(yī)保欺詐識(shí)別具備可行性.

      BP神經(jīng)網(wǎng)絡(luò)是一種按照逆向傳播算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò),由信號(hào)的正向傳播與誤差的反向傳播兩個(gè)過(guò)程組成.正向傳播的過(guò)程中,輸入樣本從輸入層傳入,經(jīng)過(guò)多層隱層處理后,傳向輸出層.其中每一層神經(jīng)元的狀態(tài)只受相連的上一層神經(jīng)元狀態(tài)影響.若網(wǎng)絡(luò)的實(shí)際輸出和期望輸出不符,則再進(jìn)行誤差的反向傳播.反向傳播過(guò)程中,誤差信號(hào)按照原路逆向傳播,在傳至隱層時(shí),對(duì)隱層各個(gè)神經(jīng)元的權(quán)值進(jìn)行修正,使得最后的誤差達(dá)到最小.

      但考慮到基于經(jīng)驗(yàn)分析選擇的欺詐因子存在主觀性,在實(shí)際中可能不是判斷欺詐與否的顯著因素.通過(guò)Logistic回歸分析先行檢驗(yàn)欺詐因子的有效性,精煉解釋變量以減少噪聲的干擾,或可以提高神經(jīng)網(wǎng)絡(luò)識(shí)別的精準(zhǔn)度.因此,本文利用BP神經(jīng)網(wǎng)絡(luò)和Logistic回歸分析方法的互補(bǔ)性和相互糾錯(cuò)性,使之有效融合,提出一種基于BP神經(jīng)網(wǎng)絡(luò)和Logistic回歸分析結(jié)合的醫(yī)療保險(xiǎn)欺詐識(shí)別方法.經(jīng)驗(yàn)證,該方法能有效的識(shí)別醫(yī)療保險(xiǎn)欺詐數(shù)據(jù),且結(jié)合回歸模型剔除弱因子在一定程度上可以提升BP神經(jīng)網(wǎng)絡(luò)的精確度.

      3 模型的搭建

      3.1 欺詐因子確定

      本文數(shù)據(jù)來(lái)源自深圳市南山、蛇口、西麗三家醫(yī)院信息系統(tǒng)采集的病人和費(fèi)用核算信息,數(shù)據(jù)集中包含索賠人信息、索賠信息、治療情況,例如身份證號(hào)、醫(yī)療手冊(cè)號(hào)、性別、購(gòu)藥單價(jià)、總價(jià)、醫(yī)囑類(lèi)及醫(yī)囑子類(lèi)等.

      首先將性別作為醫(yī)保欺詐識(shí)別的考慮因素.有統(tǒng)計(jì)資料顯示保險(xiǎn)公司的欺詐案件中,性別比存在較大差異:性別導(dǎo)致不同的風(fēng)險(xiǎn)傾向,男性冒險(xiǎn)意愿強(qiáng)于女性.此外,年齡的不用往往也影響欺詐概率,不同年齡層次的人在面對(duì)社會(huì)壓力和疾病發(fā)生概率上都有差異,因此將年齡也納入欺詐識(shí)別的考慮因素之一.

      再對(duì)比研究數(shù)據(jù)和欺詐方法,可以發(fā)現(xiàn)醫(yī)保欺詐行為反映在數(shù)據(jù)上有以下幾個(gè)明顯特征:不滿(mǎn)足醫(yī)療保險(xiǎn)號(hào)與身份證的唯一識(shí)別、單張?zhí)幏劫M(fèi)用特別高、同一病人買(mǎi)藥頻率過(guò)高、在不同醫(yī)院和醫(yī)生處重復(fù)配藥.因此,可以考慮將買(mǎi)藥頻率、買(mǎi)藥總花費(fèi)、買(mǎi)藥總數(shù)量、醫(yī)囑項(xiàng)作為欺詐因子.

      在某些情況下,科室可以通過(guò)與參保人串謀偽造病歷和票據(jù),以騙取醫(yī)保基金,因此可將科室作為欺詐與否判斷的參考因素.因研究數(shù)據(jù)涉及科室相關(guān)數(shù)據(jù)有下囑科室、執(zhí)行科室、病人科室三項(xiàng),在此都納入欺詐因子的考慮中.

      基于以上幾點(diǎn),本研究設(shè)定了9個(gè)欺詐因子作為欺詐指標(biāo),并通過(guò)BP神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行判定其設(shè)定的合理性,9個(gè)神經(jīng)網(wǎng)絡(luò)輸入因子分別為性別、年齡、買(mǎi)藥品頻率、買(mǎi)藥總花費(fèi)、買(mǎi)藥總數(shù)量、下囑科室、執(zhí)行科室、病人科室和醫(yī)囑重復(fù)因子.其中,性別可用0和1表示;年齡可以做分段量化處理;買(mǎi)藥頻率、花費(fèi)和數(shù)量可以原始數(shù)據(jù)統(tǒng)計(jì)得到;科室字段可用科室ID代替;因同一個(gè)病人可以對(duì)應(yīng)多個(gè)醫(yī)囑項(xiàng),故醫(yī)囑項(xiàng)不能直接作為輸入因子,可用醫(yī)囑重復(fù)因子替代表示,計(jì)算公式為:醫(yī)囑重復(fù)因子=醫(yī)囑項(xiàng)總數(shù)/醫(yī)囑種類(lèi)數(shù),當(dāng)該因子越小時(shí),表示該病人的相對(duì)重復(fù)率也高,涉嫌醫(yī)保欺詐的可能性也越高.

      經(jīng)過(guò)數(shù)據(jù)預(yù)處理,用統(tǒng)計(jì)學(xué)的方法建立識(shí)別模型.對(duì)于欺詐數(shù)據(jù)和非欺詐數(shù)據(jù),可以分別賦予期望1和0.以此將總體樣本劃分為欺詐樣本數(shù)據(jù)(Y類(lèi))和正常樣本數(shù)據(jù)(N類(lèi)).

      3.2 BP神經(jīng)網(wǎng)絡(luò)的構(gòu)建

      對(duì)于一般的模式識(shí)別問(wèn)題,三層網(wǎng)絡(luò)即可很好的達(dá)成識(shí)別問(wèn)題任務(wù).本研究選取一層隱含層,即采用三層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行欺詐識(shí)別.隱層節(jié)點(diǎn)根據(jù)經(jīng)驗(yàn)公式:n2=2×n1+1(ni是第i層網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)),確定數(shù)量為19個(gè)[15].

      最后的網(wǎng)絡(luò)輸出層是由是否欺詐(0和1)組成的一維矩陣,0代表沒(méi)有欺詐,1代表欺詐.值越高,表明該記錄欺詐可能性越高.最終建立的神經(jīng)網(wǎng)絡(luò)如圖1所示.

      圖1 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖

      3.3 BP神經(jīng)網(wǎng)絡(luò)模型測(cè)試

      從初步篩選階段所劃分的欺詐類(lèi)和疑似欺詐類(lèi)中分別隨機(jī)抽取2000個(gè)樣本組合作為BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本,并分別賦予期望值0和1.BP神經(jīng)網(wǎng)絡(luò)的運(yùn)算采用matlab軟件.在BP神經(jīng)網(wǎng)絡(luò)的建立中,隱含層采用正切函數(shù)“tansig”作為激活函數(shù),輸出層采用對(duì)數(shù)函數(shù)“l(fā)ogsig”作為激活函數(shù),以保證最后的輸出結(jié)果值域在0到1范圍內(nèi).考慮到LM算法在穩(wěn)定性等方面表現(xiàn)優(yōu)良,本文采用LM算法的trainlm函數(shù)對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練.設(shè)定最大循環(huán)次數(shù)5000次,目標(biāo)誤差0.001,最小梯度1e-20.

      對(duì)訓(xùn)練樣本數(shù)據(jù)建立的神經(jīng)網(wǎng)絡(luò)如圖2所示.

      圖2 Matlab構(gòu)建的BP神經(jīng)網(wǎng)絡(luò)圖

      樣本的訓(xùn)練經(jīng)過(guò)86次迭代,用未加入噪聲的訓(xùn)練樣本檢測(cè)BP神經(jīng)網(wǎng)絡(luò),將輸出的結(jié)果與未加入噪聲的訓(xùn)練樣本進(jìn)行匹配.經(jīng)程序運(yùn)行檢驗(yàn),訓(xùn)練樣本數(shù)據(jù)的識(shí)別準(zhǔn)確率達(dá) 93%.

      通過(guò)圖3可以直觀的發(fā)現(xiàn),期望輸出的‘o’與檢測(cè)時(shí)的實(shí)際輸出‘*’基本吻合,而只有極少數(shù)的點(diǎn)出現(xiàn)了誤判,從而說(shuō)明該神經(jīng)網(wǎng)絡(luò)是可靠的.

      3.4 模型的改進(jìn)

      本研究初步選用了9個(gè)欺詐因子作為模型的輸入(如表1所示),但是其中各因子對(duì)結(jié)果的影響程度是不用的,通過(guò)引入Logistic回歸分析剔除一些影響較弱的因子.若用p來(lái)表示欺詐事件發(fā)生的概率,同時(shí)將p看做自變量x的函數(shù),則因子變量和自變量識(shí)別因子的關(guān)系保持傳統(tǒng)回歸模式.

      圖3 BP神經(jīng)網(wǎng)絡(luò)欺詐預(yù)測(cè)結(jié)果

      表1 9個(gè)欺詐因子

      本文用SPSS Statistics 22對(duì)輸入因子進(jìn)行Logistic回歸分析,提取其中的顯著因子,分析結(jié)果如表2.

      分析可得,總的預(yù)測(cè)準(zhǔn)確率為94.1%,其中,買(mǎi)藥總花費(fèi)和買(mǎi)藥頻率作為主要影響因子,醫(yī)囑重復(fù)因子、年齡、買(mǎi)藥總數(shù)是次要影響因子,而下囑科室、病人科室、執(zhí)行科室以及性別幾乎對(duì)模型無(wú)影響,可以作為無(wú)效因子剔除,從而提高輸出結(jié)果的準(zhǔn)確度.

      表2 Logistic回歸分析結(jié)果

      此外,上文研究是用欺詐數(shù)據(jù)Y和正常數(shù)據(jù)N共同訓(xùn)練神經(jīng)網(wǎng)絡(luò).但是考慮到樣本數(shù)據(jù)的稀缺,以及實(shí)際情況下,醫(yī)保欺詐數(shù)據(jù)在海量數(shù)據(jù)中只占很小的比重,因此本文采用一個(gè)新的角度,只用正常數(shù)據(jù)N來(lái)訓(xùn)練神經(jīng)網(wǎng)絡(luò).

      BP神經(jīng)網(wǎng)絡(luò)有一個(gè)很重要的特性:BP神經(jīng)網(wǎng)絡(luò)能夠模擬任何連續(xù)曲線(xiàn).因此,如果只用正常數(shù)據(jù)來(lái)訓(xùn)練神經(jīng)網(wǎng)絡(luò),模型預(yù)期將穩(wěn)定的輸出0.模型訓(xùn)練好后,用待測(cè)的數(shù)據(jù)輸入,神經(jīng)網(wǎng)絡(luò)會(huì)輸出趨近于0的數(shù)據(jù).如果輸入的是符合常規(guī)情況的數(shù)據(jù),則輸出的結(jié)果與期望值0的誤差會(huì)小于神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)時(shí)的誤差,若輸入的是疑似欺詐的數(shù)據(jù),則輸出結(jié)果與期望值0的誤差會(huì)成倍增加.這種方式可以很好的解決大部分?jǐn)?shù)據(jù)不存在欺詐的問(wèn)題,同時(shí)也降低了復(fù)雜度.

      用正常數(shù)據(jù)作為訓(xùn)練樣本、經(jīng)過(guò)回歸分析剔除弱因子后剩余的5個(gè)因子作為輸入因子按照上文步驟重新訓(xùn)練網(wǎng)絡(luò),設(shè)定目標(biāo)誤差為0.001.表3是將測(cè)試數(shù)據(jù)輸入訓(xùn)練后的網(wǎng)絡(luò)模型得到的計(jì)算結(jié)果.

      表3 測(cè)試數(shù)據(jù)計(jì)算結(jié)果表

      由表3可見(jiàn),大部分的數(shù)據(jù)的實(shí)際輸出誤差小于0.001,表明該神經(jīng)網(wǎng)絡(luò)能夠較好的模擬正常情況下的醫(yī)保消費(fèi).其中,ID為680538、484621、190777的病人的誤差絕對(duì)值超過(guò)了0.001,其中ID為680538的病人誤差絕對(duì)值最大,對(duì)這幾項(xiàng)數(shù)據(jù)進(jìn)行進(jìn)一步審核,發(fā)現(xiàn)符合醫(yī)保欺詐特征,可見(jiàn)該神經(jīng)網(wǎng)絡(luò)對(duì)一些明顯的醫(yī)保欺詐具有較好的識(shí)別性.

      只用正常數(shù)據(jù)訓(xùn)練網(wǎng)絡(luò)的方法對(duì)于醫(yī)保欺詐的識(shí)別有重要參考價(jià)值.尤其是在欺詐識(shí)別應(yīng)用初建,對(duì)欺詐數(shù)據(jù)樣本積累不足的情況下.BP神經(jīng)網(wǎng)絡(luò)運(yùn)算結(jié)果受數(shù)據(jù)樣本選取的影響較大,若訓(xùn)練樣本選取不當(dāng),可能很難達(dá)到預(yù)期效果.因此,若欺詐樣本積累不足,用傳統(tǒng)方法訓(xùn)練網(wǎng)絡(luò)最終的識(shí)別效果可能不佳.本文方法適合在醫(yī)保欺詐識(shí)別工作開(kāi)展的初期,加快對(duì)欺詐數(shù)據(jù)的篩選工作,可以大幅降低人工審核篩選樣本的工作.待欺詐樣本累計(jì)一定程度后,可以考慮選擇用常規(guī)的欺詐和非欺詐樣本訓(xùn)練網(wǎng)絡(luò)或其他更優(yōu)方法進(jìn)行欺詐識(shí)別.

      4 結(jié)語(yǔ)

      本文對(duì)比眾多保險(xiǎn)欺詐識(shí)別的研究,采用Logistic回歸和BP神經(jīng)網(wǎng)絡(luò)相結(jié)合的方式構(gòu)建模型,并只用正常數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)模擬函數(shù)曲線(xiàn)的方式來(lái)進(jìn)行醫(yī)療保險(xiǎn)欺詐的識(shí)別.該方法剔除了對(duì)欺詐識(shí)別弱影響的因子,解決了欺詐數(shù)據(jù)稀缺對(duì)模型訓(xùn)練的影響.實(shí)證表明,該模型具有較高的準(zhǔn)確性,應(yīng)用該方法進(jìn)行醫(yī)保欺詐識(shí)別是可行的.

      但研究中還存在一些不足.模型的影響因子還不夠健全,從而影響模型的識(shí)別效果.此外數(shù)據(jù)來(lái)源的有限性也導(dǎo)致模型泛化能力欠佳.對(duì)以上方面的改進(jìn)將能進(jìn)一步提升BP神經(jīng)網(wǎng)絡(luò)對(duì)醫(yī)療保險(xiǎn)欺詐的識(shí)別效果.

      1 Artís M,AyusoM,Guillén M.Detection of automobile insurance fraud with discrete choice models and misclassified claims.The Journal of Risk and Insurance,2002,69(3):325-340.[doi:10.1111/1539-6975.00022]

      2 Brockett PL,Derrig RA,Golden LL,et al.Fraud classification using principal component analysis of RIDITs.The Journal of Risk and Insurance,2002,69(3):341-371.[doi:10.1111/1539-6975.00027]

      3 Pinquet J,Ayuso M,Guillén M.Selection bias and auditing policies for insurance claims.The Journal of Risk and Insurance,2007,74(2):425-440.[doi:10.1111/jori.2007.74.issue-2]

      4 葉明華.構(gòu)建我國(guó)機(jī)動(dòng)車(chē)保險(xiǎn)欺詐識(shí)別的指標(biāo)體系——基于江、浙、滬機(jī)動(dòng)車(chē)保險(xiǎn)索賠樣本數(shù)據(jù).保險(xiǎn)研究,2010,(4):83-87.

      5 葉明華.基于BP神經(jīng)網(wǎng)絡(luò)的保險(xiǎn)欺詐識(shí)別研究——以中國(guó)機(jī)動(dòng)車(chē)保險(xiǎn)索賠為例.保險(xiǎn)研究,2011,(3):79-86.

      6 Viveros MS,Nearhos JP,Rothman MJ.Applying data mining techniques to a health insurance information system.International Conference on Very Large Data Bases.Morgan Kaufmann Publishers Inc.1996.286-294.

      7 Chiu CC,Tsai CY.A web services-based collaborative scheme for credit card fraud detection.IEEE International Conference on E-Technology,E-Commerce and E-Service.IEEE,2004.177-181.

      8 何俊華,張靜誼,熊赟,等.醫(yī)保就醫(yī)聚集行為挖掘.計(jì)算機(jī)應(yīng)用與軟件,2011,28(7):79-81.

      9 陳亞琳,王旭明.基于數(shù)據(jù)挖掘的醫(yī)保欺詐預(yù)警模型研究.電腦知識(shí)與技術(shù),2016,12(11):1-4.

      10 唐璟宜,孫有坤,周海林.醫(yī)保欺詐行為的主動(dòng)發(fā)現(xiàn).合作經(jīng)濟(jì)與科技,2016,(16):188-190.[doi:10.3969/j.issn.1672-190X.2016.16.091]

      11 Maier HR,Dandy GC,Burch MD.Use of artificial neural networks for modelling cyanobacteria Anabaena,spp.in the River Murray,South Australia.Ecological Modelling,1998,105(2):257-272.

      12 林源.國(guó)內(nèi)外醫(yī)療保險(xiǎn)欺詐研究現(xiàn)狀分析.保險(xiǎn)研究,2010,(12):115-122.

      13 Liou FM,Tang YC,Chen JY.Detecting hospital fraud and claim abuse through diabetic outpatient services.Health Care Manag Sci,2008,11(4):353-358.

      14 Maes S,Tuyls K,Vanschoenwinkel B,et al.Credit card fraud detection using Bayesian and neural networks.In:Maciunas RJ,ed.Interactive Image-guided Neurosurgery.American Association Neurological Surgeons.1993.261-270

      15 CSDN.BP神經(jīng)網(wǎng)絡(luò)算法學(xué)習(xí)——基礎(chǔ)理論1.http://blog.csdn.net/fuwenyan/article/details/53893817.[2016-12-27].

      猜你喜歡
      欺詐科室神經(jīng)網(wǎng)絡(luò)
      關(guān)于假冒網(wǎng)站及欺詐行為的識(shí)別
      關(guān)于假冒網(wǎng)站及欺詐行為的識(shí)別
      科室層級(jí)護(hù)理質(zhì)量控制網(wǎng)的實(shí)施與探討
      神經(jīng)網(wǎng)絡(luò)抑制無(wú)線(xiàn)通信干擾探究
      電子制作(2019年19期)2019-11-23 08:42:00
      警惕國(guó)際貿(mào)易欺詐
      愛(ài)緊張的貓大夫
      孩子(2019年5期)2019-05-20 02:52:44
      視歧——一位住錯(cuò)科室的患者
      “合作科室”為何被壞了名聲
      網(wǎng)購(gòu)遭欺詐 維權(quán)有種法
      基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
      尼木县| 方正县| 祁东县| 沿河| 百色市| 柳林县| 苏州市| 汕尾市| 潞城市| 金华市| 万年县| 理塘县| 奉节县| 马山县| 西乡县| 聂荣县| 鹿邑县| 盐边县| 岑溪市| 高碑店市| 甘孜| 马鞍山市| 桦甸市| 阜新| 剑阁县| 南昌市| 苏尼特左旗| 牙克石市| 玛沁县| 屏南县| 康保县| 姚安县| 枣阳市| 永川市| 萝北县| 白朗县| 宁海县| 库尔勒市| 高青县| 孟村| 永春县|