• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于數(shù)據(jù)挖掘的CDMA2000移動網(wǎng)絡(luò)防盜用技術(shù)

      2012-09-28 07:49:30張多英伍偉池焦文華
      電訊技術(shù) 2012年2期
      關(guān)鍵詞:分區(qū)表話單分析模型

      張多英,伍偉池,焦文華

      (1.暨南大學(xué) 信息科學(xué)技術(shù)學(xué)院 電子工程系,廣州510632;2.中國電信廣東互聯(lián)網(wǎng)及增值運營中心,廣州510080)

      1 引 言

      隨著3G業(yè)務(wù)的推廣和普及,移動互聯(lián)網(wǎng)時代已經(jīng)來臨,用戶可以隨時隨地、隨心所欲地訪問互聯(lián)網(wǎng),通過3G網(wǎng)絡(luò)享受各種增值服務(wù)。但與此同時,盜用問題也日益嚴(yán)重。自CDMA2000 EVDO(中國電信3G制式)系統(tǒng)應(yīng)用以來,利用運營商漏洞盜用他人數(shù)據(jù)信息、復(fù)制他人用戶識別模塊(User Identity Model,UIM)卡等盜用的行為頻頻發(fā)生,個別用戶被盜用的無線上網(wǎng)費甚至高達(dá)一個月3萬多元,這給用戶和運營商都帶來了極大的損失。維護人員也曾利用各網(wǎng)元平臺自身的一些功能對盜用行為進行限制和預(yù)警,但因相應(yīng)的功能作用有限,均收效甚微。因此,在用戶UIM卡信息被盜用后及時發(fā)現(xiàn)、及時預(yù)警,盡力避免用戶蒙受損失,提升用戶的滿意度,已經(jīng)成為中國電信運營3G業(yè)務(wù)重點關(guān)注的問題。由于各種制式的移動技術(shù)在網(wǎng)元設(shè)計和流程設(shè)計上都有不同,例如GSM技術(shù)里面就沒有AAA(Authentication,Authorization,Accounting)網(wǎng)元,其他運營商在處理相關(guān)問題時采用的方法也是不同的。而CDMA網(wǎng)絡(luò)在聯(lián)通運營時期,對于盜用行為也沒有太多的辦法,僅僅是采用上網(wǎng)費用減免的方式來處理。在中國電信承接CDMA網(wǎng)絡(luò)后,無線寬帶上網(wǎng)被盜用的問題再次凸顯出來。本文對盜用問題進行了專題分析和深入探討,最終確定了以AAA平臺為切入點,設(shè)計出相關(guān)功能模型,有效地解決了盜用問題。

      2 CDMA2000 EVDO網(wǎng)元局限性的分析

      為防止盜用問題的發(fā)生,CDMA2000分組域中的各個網(wǎng)元根據(jù)自身的功能和技術(shù)條件,制定了一些防盜用的策略,但實施后仍存在漏洞,有3個主要原因。

      (1)PDSN以集群的機制運行。廣東全省100多臺PDSN被劃分為3個集群,每個集群可視為一臺PDSN,在PDSN集群配置session限制策略,同一個號碼只允許一個session接入。這樣的設(shè)置有效地限制了省內(nèi)的盜號行為,但存在以下問題:第一,因為劃分了3個集群,故并不能100%地限制;第二,98%以上的盜用行為發(fā)生在外省,省內(nèi)PDSN的限制作用有限。

      (2)HLR對用戶鑒權(quán)時,需要校驗三碼,即IMSI、ESN和AKEY。當(dāng)用戶鑒權(quán)信息中的三碼與HLR保存的數(shù)據(jù)一致時,才被允許接入,但存在的問題有:IMSI和ESN號可以直接從UIM卡讀出的;AKEY雖保密性高,但不排除有人會泄漏用戶數(shù)據(jù);只有1X和CAVE算法的EVDO用戶才會到HLR鑒權(quán),MD5(Message-Digest Algorithm 5)算法的EVDO用戶不需要去HLR鑒權(quán),三碼校驗對MD5算法的EVDO用戶是無效的。

      (3)專業(yè)計費平臺根據(jù)出賬話單,剔除出超大流量、超大時長的話單,并根據(jù)計費規(guī)則進行“流量封頂”或“時長封頂”。存在的問題:此方法雖然能找出被盜用的號碼,并通過費用減免來降低用戶損失,但核查結(jié)果的時效性不高,高額的上網(wǎng)費用依然要由用戶和運營商來承擔(dān)。

      可以看出,PDSN、HLR和專業(yè)計費在對盜用行為的限制和預(yù)警方面雖然都有其積極的作用,但同時也存在局限性。結(jié)合上述網(wǎng)元的優(yōu)缺點,以C網(wǎng)分組域中AAA平臺作為切入點,深入了解無線寬帶的話單格式和字段含義,結(jié)合CDMA網(wǎng)絡(luò)承接期積累的故障處理經(jīng)驗,基于AAA[1]的原始計費話單提出話單分析模型,通過數(shù)據(jù)挖掘,找出可疑話單。

      3 無線寬帶原始計費話單的生成機制分析

      圖1為計費報文交互過程,當(dāng)用戶通過鑒權(quán)并建立起PPP會話后,PDSN向AAA發(fā)送Accounting-Start報文。AAA接收到Accounting-Start報文后,解析并提取出與計費相關(guān)的字段信息,如 IMSI、NAI、IP-Address等,然后根據(jù)話單規(guī)范將字段填充進話單中的對應(yīng)位置,生成一條上網(wǎng)話單。

      圖1 計費報文交互過程Fig.1 Billing message interaction process

      用戶下網(wǎng)時,PCF拆除與PDSN的PPP會話連接,同時PDSN向AAA發(fā)送Accounting-Stop報文。AAA接收到Accounting-Stop報文后,同樣進行解析和字段提取,并記錄進話單中,生成一條下網(wǎng)話單。與上網(wǎng)話單不同的是,下網(wǎng)話單記錄了用戶的累計上網(wǎng)時長和累計上網(wǎng)流量[2]。

      如果用戶持續(xù)在線并在一定時間范圍內(nèi)產(chǎn)生了數(shù)據(jù)流量,PDSN就會向AAA發(fā)送Interim-Update報文[3],用于記錄某個時間段內(nèi)用戶的上網(wǎng)行為,如該統(tǒng)計時間段內(nèi)用戶的激活時長以及上網(wǎng)流量。AAA接收到Interim-Update報文后,對應(yīng)生成一條中間話單。

      在理想的情況下,AAA在用戶的一次上網(wǎng)過程中會依次收到一個Accounting-Start報文和一個Accounting-Stop報文,或者收到一個Accounting-Start報文、若干個Interim-Update報文和一個Accounting-Stop報文。但是在現(xiàn)網(wǎng)環(huán)境中,因設(shè)備配置、網(wǎng)絡(luò)時延、用戶行為習(xí)慣等原因,會使情況變得復(fù)雜化。下面根據(jù)各種實際場景,列舉3種特殊的原始計費話單。

      (1)休眠話單

      在現(xiàn)網(wǎng)中當(dāng)用戶連續(xù)30 s沒有產(chǎn)生任何流量,PCF會緩存用戶的會話session,釋放空口資源,拆除與PDSN的PPP會話,此時PDSN會向AAA發(fā)送Ac-counting-Stop報文;當(dāng)用戶再次產(chǎn)生流量,PCF重新與PDSN建立PPP會話,PDSN會向AAA發(fā)送Accounting-Start報文。需要注意以下幾點:上下網(wǎng)產(chǎn)生的Accounting報文由Correlation ID進行標(biāo)識;休眠產(chǎn)生的Accounting報文由Account Session ID進行標(biāo)識;在一對上下網(wǎng)產(chǎn)生的Accounting報文中間,AAA可能會收到若干對休眠產(chǎn)生的Accounting報文;所有休眠產(chǎn)生的Accounting報文的Correlation ID與上下網(wǎng)產(chǎn)生的Accounting報文的Correlation ID一致;每一對休眠產(chǎn)生的Accounting報文的Account Session ID都是不相同的。

      (2)交叉話單

      用戶在跨地市、跨省份的時候,容易發(fā)生PDSN切換。此類切換屬于硬切換,切換時用戶網(wǎng)絡(luò)會發(fā)生中斷,需要重新?lián)芴柌拍艿顷懢W(wǎng)絡(luò)。例如用戶一開始接入PDSN-1,在移動過程中發(fā)生了切換,用戶斷網(wǎng)后重新?lián)芴柦尤隤DSN-2。此時PDSN-1的PPP會話仍然存在,PDSN-1未向AAA發(fā)送Accounting-Stop報文;而PDSN-2因PPP會話已經(jīng)建立成功,向AAA發(fā)送Accounting-Start報文;10 min后因用戶沒有產(chǎn)生任何流量,PDSN-1判斷用戶已斷線,主動拆除PPP會話并向AAA發(fā)送Accounting-Stop報文,這樣就產(chǎn)生了交叉話單。一般情況下交叉話單的交疊時長不會超過10 min。

      (3)重復(fù)話單

      因網(wǎng)絡(luò)時延大或者主機響應(yīng)時間超長,導(dǎo)致PDSN的Accounting-Request得不到及時響應(yīng),PDSN會向AAA重發(fā)Accounting報文[4],這樣就有可能導(dǎo)致AAA收到多條相同的Accounting報文。由于原始計費話單的寫入機制沒有去重功能,所以重復(fù)的報文也會被如實記錄進原始計費話單。

      AAA每10 min在指定目錄下生成原始計費話單文件,每個原始計費話單文件由一條或多條話單記錄組成。每條記錄占一行,記錄之間以換行符分隔。

      4 原始計費話單的字段說明

      AAA產(chǎn)生話單記錄的原則[5]:

      (1)所有話單記錄都是采用CDR(呼叫詳細(xì)記錄)格式產(chǎn)生;

      (2)所有話單記錄都是以ASCII編碼格式進行編碼,話單內(nèi)的字段域按順序排列;

      (3)各類話單記錄獨立為一個記錄,不同類的話單記錄不能合并生產(chǎn)。

      每個CDR記錄由多個域構(gòu)成,每個域?qū)?yīng)一個字段,域之間以“/t”分隔。字段可以有子類型,子類型之間以“ ”分隔。各字段及子類型按規(guī)范定義的順序排列,如果相應(yīng)的屬性值為空,則直接用分隔符分開,分隔符之間無其他符號。

      PDSN將UDR的信息通過RADIUS消息發(fā)給AAA,AAA產(chǎn)生原始計費話單。由于計費系統(tǒng)采集的是AAA產(chǎn)生的原始計費話單記錄,因此AAA產(chǎn)生的每一條原始計費話單必須符合《中國電信CDMA1x工程AAA話單格式》中的字段定義。

      根據(jù)《中國電信CDMA1x工程AAA話單格式》的描述,AAA的原始計費話單共包括59個字段。其中RoamFlag是由AAA收到PDSN的Accounting報文后,根據(jù)PDSN IP判斷用戶是否漫游,然后由AAA填充進原始計費話單中;PaidType和MDN是由AAA根據(jù)Accounting報文中的IMSI查詢AAA數(shù)據(jù)庫的IMSI關(guān)聯(lián)數(shù)據(jù)得到,并由AAA填充進原始計費話單中。其他字段均由AAA根據(jù)Accounting報文的內(nèi)容,直接填充進原始計費話單的對應(yīng)字段中。

      圖2是現(xiàn)網(wǎng)的原始計費話單,3條記錄從上到下依次為上網(wǎng)話單、下網(wǎng)話單和中間話單。從現(xiàn)網(wǎng)話單中可以看到,每一條記錄均不滿59個字段,這個與現(xiàn)網(wǎng)PCF、PDSN的配置有關(guān)。

      圖2 現(xiàn)網(wǎng)的原始計費話單記錄Fig.2 The original billing communication detail records

      5 數(shù)據(jù)挖掘技術(shù)的應(yīng)用

      上網(wǎng)費用異常的故障申告包括話單對應(yīng)的時間段內(nèi)用戶并沒有上網(wǎng)行為,多條話單記錄在時間上存在交疊部分,以及在一段時間話單記錄來自多臺PDSN等。

      每天5 000多萬條原始計費話單記錄,每條記錄有59個字段,數(shù)據(jù)量如此龐大的文本數(shù)據(jù),需要采用數(shù)據(jù)挖掘技術(shù)對數(shù)據(jù)進行分析和過濾。

      5.1 數(shù)據(jù)挖掘的含義

      數(shù)據(jù)挖掘就是從大量數(shù)據(jù)中獲取有效的、新穎的、潛在有用的、最終可理解的模式的非平凡過程。數(shù)據(jù)挖掘的廣義觀點:數(shù)據(jù)挖掘就是從存放在數(shù)據(jù)庫、數(shù)據(jù)倉庫或其他信息庫中的大量的數(shù)據(jù)中“挖掘”有趣知識的過程。數(shù)據(jù)挖掘又稱為數(shù)據(jù)庫中知識發(fā)現(xiàn)(Knowledge Discovery in Database,KDD)。

      5.2 數(shù)據(jù)挖掘技術(shù)中的神經(jīng)網(wǎng)絡(luò)算法

      神經(jīng)網(wǎng)絡(luò)是仿照生理神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的非線性預(yù)測模型,通過學(xué)習(xí)進行模式識別,它用一種較為簡單有效的方法解決了復(fù)雜度相對大的一些問題。它常用于兩類問題:分類和回歸。在結(jié)構(gòu)上,可以把一個神經(jīng)網(wǎng)絡(luò)劃分為輸入層、輸出層和隱含層。神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。輸入層的每個節(jié)點對應(yīng)一個個的預(yù)測變量。輸出層的節(jié)點對應(yīng)目標(biāo)變量,可有多個。在輸入層和輸出層之間是隱含層(對神經(jīng)網(wǎng)絡(luò)使用者來說不可見),隱含層的層數(shù)和每層節(jié)點的個數(shù)決定了神經(jīng)網(wǎng)絡(luò)的復(fù)雜度。

      除了輸入層的節(jié)點,神經(jīng)網(wǎng)絡(luò)的每個節(jié)點都與很多它前面的節(jié)點連接在一起,每個連接對應(yīng)一個權(quán)重。調(diào)整節(jié)點間連接的權(quán)重就是在建立神經(jīng)網(wǎng)絡(luò)時要做的工作。決定神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的是隱含層及其所含節(jié)點的個數(shù),以及節(jié)點之間的連接方式[8]。

      圖3 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖Fig.3 Schematic drawing of neural network structure

      5.3 數(shù)據(jù)挖掘技術(shù)中的決策樹算法

      決策樹是一個類似于流程圖的樹結(jié)構(gòu),其中每個非葉節(jié)點均表示考察數(shù)據(jù)項目的測試或決策,每個分枝代表一個測試輸出,而每個葉子節(jié)點代表類或類的分布。樹的最頂層節(jié)點是根節(jié)點。為了分類一個特定數(shù)據(jù)項目,我們從根節(jié)點開始,一直向下判定,直到達(dá)到一個葉子節(jié)點為止。這樣,一個決策樹就形成了。

      決策樹分類算法是應(yīng)用最廣的歸納推理算法之一,它是一種逼近離散值函數(shù)的方法,對噪聲數(shù)據(jù)有很好的健壯性。用決策樹算法進行分類要分兩個步驟:第一步是利用訓(xùn)練集建立并精簡一棵決策樹,建立決策樹模型,這個過程實際上是一個從數(shù)據(jù)中獲取知識,進行機器學(xué)習(xí)的過程;第二步是利用生成的決策樹模型對輸入的數(shù)據(jù)進行分類,對輸入的記錄,從根節(jié)點依次測試記錄的屬性值,直到到達(dá)某個葉子節(jié)點,從而找到該記錄所在的類。

      6 原始計費話單分析模型

      6.1 原始計費話單分析模型的構(gòu)建

      根據(jù)AAA原始計費話單生成的規(guī)則和特定情況下話單的生成規(guī)律,運用神經(jīng)網(wǎng)絡(luò)和決策樹的算法知識構(gòu)筑分類模型和判斷條件模型。

      以話單記錄的計費標(biāo)識為分類條件,對話單進行歸類分析。分析模型如圖4所示。

      (1)上、下網(wǎng)話單做為輸入項,通過特定條件進行合并,可以得到描述完整上網(wǎng)過程的話單;

      (2)以完整話單與上網(wǎng)話單作為輸入項,在設(shè)定的條件下進行比較,得到重疊話單;

      (3)最后通過特殊處理,得到異常話單作為結(jié)果輸出。

      圖4 神經(jīng)網(wǎng)絡(luò)分析模型Fig.4 Neural network analysismodel

      通過神經(jīng)網(wǎng)絡(luò)算法可以得到一個話單分析的基本過程,但如何對每個節(jié)點的產(chǎn)生進行條件限制,以使最終的輸出結(jié)果有較高的準(zhǔn)確率?這需要采用決策樹算法對規(guī)則條件進行補全。決策樹分析模型圖如圖5所示。

      圖5 決策樹分析模型Fig.5 The decision tree analysismodel

      通過上述數(shù)據(jù)挖掘算法得到的分析模型,可以構(gòu)建出原始計費話單分析模型如下。

      (1)創(chuàng)建分區(qū)表

      1)創(chuàng)建主分區(qū)表。主分區(qū)表中字段的名稱、類型和長度等定義與《中國電信CDMA 1x工程AAA話單格式》的字段定義保持一致。為了數(shù)據(jù)輸出后查看核對方便,在主分區(qū)表末尾增加一個時間戳的轉(zhuǎn)換字段。

      2)創(chuàng)建子分區(qū)表和復(fù)合分區(qū)表。以用戶類型、時間戳等字段為分類條件,創(chuàng)建子分區(qū)表和復(fù)合分區(qū)表,符合分類條件的話單記錄歸入對應(yīng)的表中,不符合條件的話單記錄歸入Default表中。

      (2)數(shù)據(jù)導(dǎo)入

      1)對原始計費話單進行預(yù)處理,清理掉話單記錄中的空字段,并將話單記錄轉(zhuǎn)化為可以導(dǎo)入數(shù)據(jù)庫的文本格式。使用腳本將處理后的原始計費話單導(dǎo)入數(shù)據(jù)庫的分區(qū)表中。

      2)將時間戳(Eventtime)轉(zhuǎn)換為時間串(Datestr)格式,導(dǎo)入到分區(qū)表的對應(yīng)字段中。

      (3)創(chuàng)建索引表空間和索引

      索引提供指針以指向存儲在表中指定列的數(shù)據(jù)值,然后根據(jù)指定的排序次序排列這些指針。數(shù)據(jù)庫使用索引的方式與使用書的目錄很相似:通過搜索索引找到特定的值,然后跟隨指針到達(dá)包含該值的行。通過建立索引,可以快速訪問數(shù)據(jù)庫表中的特定信息。

      (4)創(chuàng)建比對所需要的臨時表

      1)以IMSI、Correlation ID 和PDSN IP 為條件,對數(shù)據(jù)進行排序。

      2)以IMSI和Correlation ID為匹配條件,找出話單中Eventtime為最大值和最小值的記錄進行合單,并記錄到臨時表a和b中。

      (5)設(shè)定原始計費話單分析條件

      1)以IMSI為匹配條件,對臨時表 a、b中同一個IMSI的記錄進行比對;

      2)臨時表a和b的Correlation ID不一致。針對同一個IMSI,檢索出兩個表中在同一時間內(nèi)不同的上網(wǎng)過程,作為識別盜用行為的條件之一:

      情況一:話單包含。臨時表b的starttime大于(即晚于)臨時表a的starttime,臨時表b的endtime小于(即早于)臨時表a的 endtime。需要考慮因PDSN切換而導(dǎo)致的話單重疊;

      情況二:話單交叉。臨時表b的starttime大于(即晚于)臨時表 a的 starttime,臨時表 b的starttime小于(即早于)臨時a的endtime。需要考慮因PDSN切換而導(dǎo)致的話單重疊。

      6.2 原始計費話單分析腳本及實現(xiàn)步驟

      (1)在Oracle數(shù)據(jù)庫中創(chuàng)建一張有60個字段的分區(qū)表,該表最后一個字段是時間戳的轉(zhuǎn)換字段。格式是“yyyymmddhh24miss” ,例如“20090605094332”。其他字段請參照《中國電信CDMA 1x工程AAA話單格式》的字段定義。

      (2)將原始計費話單記錄轉(zhuǎn)換為可導(dǎo)入數(shù)據(jù)庫的文本格式,并對記錄中的空字段進行處理,去除噪聲數(shù)據(jù)。以2009年8月24日9點50分的話單為例,讀取此話單記錄,將其中的` t'字符全部找出來,并用分隔符`,'進行替換,最后輸出到文本文件aaa-200908240950.txt。程序代碼如下:

      more AAA-01-20090824-0950-2008.TXT tr′ t′′,′ sed′s/ $/,,/′>../aaa-200908240950.txt;

      (3)編輯數(shù)據(jù)導(dǎo)入控制文件。部分程序代碼如下:

      load data

      infile′aaa-200908240950.txt′//需要導(dǎo)入的文本文件名//

      append into table aaa-acct//被導(dǎo)入數(shù)據(jù)的分區(qū)表名//

      fields terminated by′,′//字段以′,′作為終結(jié)//

      (4)數(shù)據(jù)導(dǎo)入。

      sqlldraaa/aaa direct=y errors=99999999 control='aaa-acct.ctl';

      //調(diào)用控制文件aaa-acct.ctl對導(dǎo)入過程進行控制。參數(shù)項Direct=y獨占鎖表,可以使導(dǎo)入速度加快;參數(shù)項errors=99999999,可以忽略因文本文件中文件頭等格式不規(guī)則而引起的報錯//

      (5)創(chuàng)建轉(zhuǎn)換函數(shù),將數(shù)據(jù)庫的eventtimes(時間戳)的值轉(zhuǎn)換為“yyyymmddhh24miss”格式,并插入到分區(qū)表的datestr字段中。

      end to-oradate;//創(chuàng)建時間戳轉(zhuǎn)換函數(shù)//

      update aaa-acct set datestr=to-char(to-oradate(eventtime),′yyyymmddhh24miss′);

      //將轉(zhuǎn)換后的時間串插入到分區(qū)表的datestr字段中//

      (6)創(chuàng)建索引表空間和索引。

      CREATE TABLESPACE acct-idx//創(chuàng)建索引表空間//

      create index aaa-acct-idx1 on aaa-acct//創(chuàng)建索引//

      (7)執(zhí)行查詢、分析的SQL語句。

      6.3 原始計費話單分析模型的測試

      本文基于數(shù)據(jù)挖掘技術(shù)并通過編寫分析腳本設(shè)計了一種原始計費話單分析模型,為了評估本模型的效果,我們對其進行了測試。

      (1)在AAA隨機選取一段時間的話單進行分析:AAA-05-20090714-2*.TXT,選取時間為2009年7月14日20點00分至23點59分。

      轉(zhuǎn)換原始計費話單文件,并導(dǎo)入數(shù)據(jù)庫,過程見圖6,導(dǎo)入數(shù)據(jù)共764 115條。

      圖6 原始計費話單導(dǎo)入Fig.6 Import of original billing communication detail records

      (2)執(zhí)行設(shè)定的SQL語句,結(jié)果顯示“3820 rows selected.”。

      (3)實驗中,隨機抽取10個IMSI記錄進行檢查,結(jié)果見表1。

      表1 原始計費話單分析結(jié)果Table 1 The analysis results of original billing communication detail records

      (4)根據(jù)分析結(jié)果,省內(nèi)外的盜用行為都存在。省外的盜用特點是在線時間長,各盜用連接互有交疊。省內(nèi)的盜用行為多發(fā)生在不同PDSN集群之間,從在線時間的交叉以及在線時間不短可以判斷出來;也有發(fā)生在同一集群的,但從在線時間可以看出盜用者剛上線就立即被PDSN斷開了。

      測試結(jié)果表明,原始計費話單分析模型滿足設(shè)計預(yù)想,能夠完成原始計費話單的分析工作,并從中發(fā)現(xiàn)異常話單。

      7 結(jié)束語

      本文針對CDMA2000 EVDO移動網(wǎng)絡(luò)中的盜用問題,根據(jù)實際處理超量上網(wǎng)費用問題時積累的經(jīng)驗,采用數(shù)據(jù)挖掘的理論和技術(shù),通過編寫分析腳本,設(shè)計了一種基于AAA平臺原始計費話單分析的模型。利用廣東電信現(xiàn)網(wǎng)數(shù)據(jù)進行分析,對該模型進行了驗證。測試結(jié)果顯示,原始計費話單分析模型能夠完成原始計費話單的分析工作,并從中找出異常的話單,滿足設(shè)計預(yù)想。該模型能夠應(yīng)用于CDMA2000移動網(wǎng)絡(luò)中,可有效地發(fā)現(xiàn)省內(nèi)外的盜用行為,進一步提升網(wǎng)絡(luò)的安全性,但在未來工作過程中仍需要不斷優(yōu)化檢索語句。

      [1]RFC2903,Generic AAA Architecture[S].

      [2]RFC2865,Remote Authentication Dial In User Service(RADIUS)[S].

      [3]RADIUS Interim Update at Call Connect[S].

      [4]RFC1122,Requirements for Internet Hosts-Communication Layers[S].

      [5]中國電信CDMA 1x工程AAA話單格式[S].China telecom CDMA 1x engineering AAA single format[S].(in Chinese)

      [6]胡可云,田鳳占,黃厚寬.數(shù)據(jù)挖掘理論與應(yīng)用[M].北京:清華大學(xué)出版社,2008.HU Ke-yun,TIAN Feng-zhan,HUANG Hou-kuan.Data Mining Theory and Application[M].Beijing:Tsinghua U-niversity Press,2008.(in Chinese)

      [7]Han J W,Kamber M.數(shù)據(jù)挖掘概念與技術(shù)[M].范明,孟小峰,譯.北京:機械工業(yè)出版社,2007.Han J W,Kamber M.Data Mining Concepts and Techniques[M].Translated by FAN Ming,MENG Xiao-feng.Beijing:Mechanical Industry Press,2007.(in Chinese)

      [8]段云峰,吳唯寧,李劍威,等.數(shù)據(jù)倉庫及其在電信領(lǐng)域中的應(yīng)用[M].北京:電子工業(yè)出版社,2003:94-95.DUAN Yun-feng,WU Wei-ning,LI Jian-wei,et al.Data warehouse and the application in telecommunications[M].Beijing:Publishing House of Electronic Industry,2003:94-95.(in Chinese)

      [9]王曉龍.計算機自然語言處理[M].北京:清華大學(xué)出版社,2005:152-155.W ANG Xiao-long.Computer natural language processing[M].Beijing:T singhua University Press,2005:152-155.(in Chinese)

      [10]鄭巖.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘原理及應(yīng)用[M].北京:清華大學(xué)出版社,2011.ZHENG Yan.Datawarehouse and data mining principle and application[M].Beijing:Tsinghua University Press,2011.(in Chinese)

      猜你喜歡
      分區(qū)表話單分析模型
      2022中科院期刊分區(qū)表全球眼科學(xué)期刊分區(qū)及排名
      2022中科院期刊分區(qū)表全球眼科學(xué)期刊分區(qū)及排名
      2022中科院期刊分區(qū)表全球眼科學(xué)期刊分區(qū)及排名
      基于BERT-VGG16的多模態(tài)情感分析模型
      河北大名話單元音韻母、單字調(diào)及雙音節(jié)非輕聲詞連調(diào)的實驗語音學(xué)初探
      采用大數(shù)據(jù)技術(shù)的移動DPI關(guān)聯(lián)算法探索及實現(xiàn)
      層次分析模型在結(jié)核疾病預(yù)防控制系統(tǒng)中的應(yīng)用
      Oracle分區(qū)表技術(shù)在稅務(wù)系統(tǒng)中的應(yīng)用
      全啟發(fā)式語言分析模型
      IFC4結(jié)構(gòu)分析模型應(yīng)用技術(shù)
      安吉县| 称多县| 砀山县| 库车县| 南雄市| 沐川县| 嵩明县| 包头市| 威宁| 平顶山市| 探索| 武平县| 凤冈县| 承德市| 青阳县| 枣阳市| 泸定县| 门源| 买车| 福鼎市| 宜都市| 东丰县| 广丰县| 钟祥市| 乌鲁木齐市| 鸡西市| 江山市| 绵阳市| 城固县| 连南| 五家渠市| 白河县| 台中县| 陆良县| 富蕴县| 梁河县| 华容县| 绩溪县| 诸城市| 姜堰市| 德令哈市|