電信詐騙是指犯罪分子通過電話、短信和網(wǎng)絡(luò)方式,編造虛假信息,設(shè)置騙局,對受害人實(shí)施遠(yuǎn)程、非接觸式詐騙,誘使受害人給犯罪分子打款或轉(zhuǎn)賬的犯罪行為[1]。近幾年,隨著移動互聯(lián)網(wǎng)的迅速發(fā)展,利用電信網(wǎng)絡(luò)高科技手段實(shí)施犯罪行為呈逐年增長態(tài)勢。2011年全國電信詐騙案發(fā)10萬起,到2012年增至17萬,再到2013年案發(fā)30萬起,年增長率超過70%,而到2014年全國電信詐騙案發(fā)高達(dá)40萬起[2]。根據(jù)《騰訊2016年第二季度反電信網(wǎng)絡(luò)詐騙大數(shù)據(jù)報告》分析結(jié)果,電話詐騙從涉案金額上,已經(jīng)超過網(wǎng)絡(luò)詐騙和短信詐騙,成為案值最高的電信詐騙類型。其中,仿冒公檢法、仿冒熟人領(lǐng)導(dǎo)、仿冒客服三類詐騙涉案金額占電話詐騙總金額分別為23%、13%、12%,僅此三類電話詐騙類型造成的損失金額已接近整個電話詐騙的一半[3,4]。
電信詐騙主要呈現(xiàn)集團(tuán)作案、作案手段更新快、高科技技術(shù)應(yīng)用等特點(diǎn)[5],并且靈活運(yùn)用短信、微信、QQ、網(wǎng)絡(luò)電話、GOIP等技術(shù),甚至是模仿跨國電信詐騙團(tuán)伙慣用犯罪手段,使得詐騙可以在短時間內(nèi)廣泛蔓延并迅速造成難以估量的損失[6]。
目前,國內(nèi)外在對抗電信詐騙中的研究主要通過分析用戶通信行為、人工歸納規(guī)則來實(shí)現(xiàn)詐騙電話檢測[7]。Mohamed等提出一種基于反向傳播神經(jīng)網(wǎng)絡(luò)的詐騙電話檢測模型,基于本地通信信息服務(wù)的電信插值,將20 000個樣本隨機(jī)分成訓(xùn)練樣本和測試樣本,用于分析反向傳播神經(jīng)網(wǎng)絡(luò)性能[8]。Subudhi 等基于欺詐電話數(shù)據(jù),從呼叫持續(xù)時間、呼叫類型、呼叫頻率、呼叫位置等維度,利用支持向量機(jī)(SVM)分類器對用戶的欺詐行為進(jìn)行建模,并利用超球面支持向量機(jī)算法改進(jìn)模型性能,降低錯誤檢出率[9];國內(nèi)大連海事學(xué)院的劉道宏等,從通話話單中構(gòu)造欺詐用戶數(shù)和非欺詐用戶數(shù)的訓(xùn)練集,利用決策樹分類算法構(gòu)建詐騙預(yù)測模型,但該模型對詐騙電話識別性能有待進(jìn)一步研究[10]。浙江警察學(xué)院周國民等,基于用戶歷史通話CDR話單,從通話時間、通話間隔、同一對象通話次數(shù)、通話周期等維度,分析詐騙用戶特征,為后續(xù)詐騙電話識別模型的構(gòu)建提供了可行的思路[11]。湖南大學(xué)王丹陽,針對響鈴一聲掛斷這一類型詐騙電話,利用改進(jìn)的貝葉斯算法篩選此類數(shù)據(jù),再結(jié)合聚類挖掘技術(shù)建立詐騙電話識別模型[12]。中國電信廣東研究院張慧嫦等研究一種基于信令數(shù)據(jù)的詐騙電話行為檢測機(jī)制[13]。從詐騙電話業(yè)務(wù)特征中提取出識別模型的參數(shù),利用人工歸納規(guī)則的方法建立模型。
從當(dāng)前國內(nèi)外研究來看,一方面,對電信詐騙尤其是電話詐騙的研究集中在用戶通話行為分析及歸納上,需要大量的專家經(jīng)驗(yàn)積累,且在詐騙手段快速更新、詐騙號碼任意改號等場景中應(yīng)用時,效果將難以保證。另一方面,對詐騙人自身以及詐騙套路特征的研究還有待進(jìn)一步探索。
通過詐騙通話意圖理解進(jìn)行詐騙電話的精準(zhǔn)分析,通過詐騙人聲紋識別可以有效鎖定詐騙人員,因此,本研究以詐騙人員和詐騙內(nèi)容入手,創(chuàng)新性的基于智能語音技術(shù),針對詐騙人聲紋識別和詐騙通話意圖理解進(jìn)行詐騙電話的精準(zhǔn)挖掘預(yù)警,探索詐騙人電話詐騙有效檢測方法。
聲紋同人臉、虹膜、指紋、DNA、靜脈并稱生物六大特征,本身具有唯一性。聲紋識別技術(shù),又稱說話人識別技術(shù)(Speaker Recognition),是通過提取語音信號中代表不同說話人身份的相關(guān)固有特征,識別出說話人身份等方面的技術(shù)。由于聲紋特征反應(yīng)的是說話人的生理和行為特征,因而聲紋是和說話人綁定緊密的生物識別技術(shù),和說話人使用何種語種方言、語音內(nèi)容無關(guān)的。聲紋識別系統(tǒng)主要由聲紋識別和聲紋注冊兩大部分組成。
聲紋注冊指針對經(jīng)編輯處理后僅包含有目標(biāo)對象語音的數(shù)據(jù)進(jìn)行語音檢出、語音參數(shù)提取及聲紋注冊等模塊的處理,最終獲得當(dāng)前注冊語音所對應(yīng)的聲紋模型。當(dāng)前聲紋注冊主要有手動精標(biāo)注冊、系統(tǒng)輔助注冊、聲紋自動建庫三種方式。
(1)手動精標(biāo)注冊
對于詐騙人語音注冊樣本,通過新建人員信息,導(dǎo)入詐騙人電話信道語音。針對詐騙人電話信道的語音進(jìn)行語音預(yù)處理、說話人分離,當(dāng)語音經(jīng)過預(yù)處理并經(jīng)過質(zhì)量檢測之后,將電話信道的語音通過引擎標(biāo)注的語音粗標(biāo)結(jié)果,再通過手動精標(biāo)過程,將符合注冊條件的標(biāo)注結(jié)果送入到系統(tǒng)中,并直接調(diào)用聲紋注冊引擎,將符合聲紋注冊標(biāo)準(zhǔn)的音頻與注冊成功的聲紋存入數(shù)據(jù)庫,實(shí)現(xiàn)詐騙人數(shù)據(jù)聲紋注冊和分類建庫。
對合路語音系統(tǒng)無法分辨目標(biāo)對象是哪一面,通過人工聽音標(biāo)注確認(rèn)目標(biāo)對象語音;針對小于3條的分路語音,通過手動精標(biāo)選取合適目標(biāo)對象片段語音。
(2)系統(tǒng)輔助注冊
對于詐騙人語音注冊樣本,通過新建人員信息,導(dǎo)入詐騙人電話信道語音,系統(tǒng)自動對詐騙人的語音系統(tǒng)進(jìn)行語音預(yù)處理、說話人分離以及聲紋自動聚類技術(shù),采用系統(tǒng)注冊和人工輔助確認(rèn)形成聲紋模型的過程,將符合聲紋注冊標(biāo)準(zhǔn)的音頻與聲紋存入數(shù)據(jù)庫,實(shí)現(xiàn)數(shù)據(jù)聲紋注冊和分類建庫。
針對3條以上未標(biāo)注的一個或多個說話人的分路語音(明確這些數(shù)據(jù)中目標(biāo)對象有效語音量最多),系統(tǒng)通過自動聚類算法形成語音量最多的說話人聲紋。
(3)聲紋自動建庫
在聲紋自動建庫過程中,利用語音預(yù)處理,聲紋自動提取、聲紋自動聚類和聲紋自動建庫技術(shù),結(jié)合聲紋特點(diǎn)、聲紋質(zhì)量和其他信息資源,實(shí)現(xiàn)自動生成聲紋樣本、聲紋更新和變化檢測體系化過程。支持聲紋質(zhì)量自動評估以及樣本聽音和人工更新能力。相對于傳統(tǒng)人工注冊方式,聲紋自動建庫能力更加高效、簡單,適用于語音業(yè)務(wù)能力不高、海量號碼自動建庫等多種場景,以號碼或者唯一ID進(jìn)行聲紋自動建庫。
聲紋識別指對一個輸入數(shù)據(jù),依次進(jìn)行語音檢出、語音分離、語音參數(shù)提取、聲紋識別、得分規(guī)整等模塊處理。
聲紋識別流程如圖1所示,通過積累目標(biāo)對象語音,構(gòu)建目標(biāo)對象聲紋庫,用于識別待檢測語音數(shù)據(jù)中是否存在目標(biāo)對象語音,從而達(dá)到發(fā)現(xiàn)目標(biāo)對象目的。
圖1 聲紋識別流程示意圖
聲紋識別主要由以下幾個模塊組成:
(1)語音分離模塊:針對輸入的整段未知語音,首先使用基于能量及模型的VAD技術(shù)進(jìn)行分段,再采用基于模型的聚類技術(shù)對原始語音中的人聲、非語音、音樂、背景噪音等現(xiàn)象進(jìn)行自動判別及歸類,再進(jìn)一步針對不同說話人進(jìn)行聚類,為后續(xù)的語音識別做好準(zhǔn)備。
(2)前端特征提取模塊:針對分離后的語音提取對語音識別有效的、對噪聲魯棒性較好的聲學(xué)特征,例如常用的MFCC/PLP特征,并針對信道等因素進(jìn)行RSATA、CMN等規(guī)整。
(3)說話人模板提?。簩τ谔崛『玫哪繕?biāo)人特征,采用目前最主流的本征信道因子分析、聯(lián)合因子分析方法提取目標(biāo)說話人模板。
(4)聲紋識別引擎:針對電信語音數(shù)據(jù)中存在的跨信道情況,聲紋識別引擎采用最先進(jìn)的因子分析技術(shù)。
(5)得分規(guī)整:為了使不同目標(biāo)人、不同信道下的得分可比,采用ZNORM和TNORM等技術(shù)對得分進(jìn)行規(guī)整處理,并結(jié)合使用合作伙伴提出的INORM得分規(guī)整技術(shù)。
(6)結(jié)果處理:對海量待篩選數(shù)據(jù)與說話人模板的比較后的得分,通過閾值判斷、得分排序后給出識別結(jié)果。對得分的高的數(shù)據(jù)進(jìn)行預(yù)警,同時報出確認(rèn)結(jié)果中出現(xiàn)的新號碼。
通過對詐騙分子聲紋的研究,可以精準(zhǔn)定位海量電話數(shù)據(jù)場景下的詐騙通話,快速發(fā)現(xiàn)有害詐騙信息。具體過程如下:結(jié)合聲紋識別、聲紋聚類技術(shù),利用采集標(biāo)注的詐騙人有害話音集合,提取并存儲此類人員的聲紋特征,建立聲紋庫,新的通話接入時,經(jīng)過聲紋提取及聲紋比對,可以實(shí)現(xiàn)目標(biāo)通話中詐騙聲紋的檢出和發(fā)現(xiàn),如圖2所示。
圖2 基于聲紋識別電話詐騙檢測示意圖
取聲紋識別線上一個月的預(yù)警效果數(shù)據(jù),累計預(yù)警46 041條,平均每天產(chǎn)生有效預(yù)警約1 485條,平均預(yù)警準(zhǔn)確率可達(dá)98.53%,精準(zhǔn)度高,可滿足公安防范勸阻實(shí)戰(zhàn)應(yīng)用,如表1所示。
意圖理解技術(shù)主要對通話內(nèi)容進(jìn)行語義理解,從而識別通話主題。意圖理解主要由智能語音識別技術(shù)、語義理解技術(shù)兩大部分組成。
本文中,研究并綜合利用循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)以及長短時記憶(LSTM)神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)對聲學(xué)信息的建模,最終完成將語音轉(zhuǎn)成文字的目標(biāo)。智能語音識別技術(shù)流程如圖3所示,主要包含以下八個模塊:
表1 聲紋識別近一個月預(yù)警效果
圖3 智能語音識別技術(shù)框圖
(1)語音分割模塊:針對輸入的整段未知電話語音,通用的做法首先使用基于能量及模型的VAD技術(shù)進(jìn)行分段,再采用基于模型的聚類技術(shù)對原始電話語音中的人聲、非語音、音樂、背景噪音等現(xiàn)象進(jìn)行自動判別及歸類,再進(jìn)一步針對不同說話人進(jìn)行聚類,為后續(xù)的語音識別做好準(zhǔn)備。
(2)前端特征提取模塊:針對分割后的語音提取對語音識別有效的、對噪聲魯棒性較好的聲學(xué)特征,例如常用的MFCC/PLP特征,對于帶調(diào)的中文語音識別還需提取Pitch等特征,并針對信道等因素進(jìn)行初步的CMN/MSVN等規(guī)整。
(3)區(qū)分性特征提?。撼耸褂脗鹘y(tǒng)的MFCC等譜特征以外,基于神經(jīng)網(wǎng)絡(luò)的TANDEM區(qū)分性特征是當(dāng)今語音識別系統(tǒng)中的熱點(diǎn)之一,可以對傳統(tǒng)僅基于譜特征的語音識別性能起到很好的補(bǔ)充作用。
(4)特征規(guī)整模塊:為了消除不同說話人對識別效果的影響,首先會從特征域盡可能去除說話人的語音內(nèi)容信息,主流的特征域處理方式包括VTLN、HLDA、特征域SAT等技術(shù),通過這些關(guān)鍵技術(shù)的加入,可以獲得冗余信息更少、說話人語音內(nèi)容信息被去除的聲學(xué)特征。
(5)多遍解碼框架:為了將各語音轉(zhuǎn)寫關(guān)鍵技術(shù)點(diǎn)進(jìn)行更好的整合,并綜合考慮識別效果和識別效率等因素,使用如上圖所示的多編解碼技術(shù)框架,不僅能將各轉(zhuǎn)寫技術(shù)點(diǎn)的性能提升發(fā)揮出來,在效率上還有巨大的優(yōu)勢。
(6)聲學(xué)模型訓(xùn)練:為了配合上述多遍解碼框架和各特征域技術(shù)點(diǎn)的加入,需訓(xùn)練對應(yīng)的聲學(xué)模型,并相應(yīng)加入當(dāng)前主流語音識別系統(tǒng)中的關(guān)鍵技術(shù)點(diǎn)區(qū)分性訓(xùn)練以持續(xù)提高識別性能,在此過程中對區(qū)分性訓(xùn)練的準(zhǔn)則和參數(shù)優(yōu)化算法進(jìn)行研究。除此之外,如果針對海量訓(xùn)練數(shù)據(jù)(包括有監(jiān)督的和非監(jiān)督的)不斷提升訓(xùn)練效率,并在聲學(xué)模型中充分發(fā)揮海量數(shù)據(jù)對說話人、口音、方言等的覆蓋效果,也是本次訓(xùn)練的重點(diǎn)。
(7)語言模型訓(xùn)練:基于海量且話題廣泛的文本數(shù)據(jù)進(jìn)行超大規(guī)模語言模型訓(xùn)練,并進(jìn)行語言模型區(qū)分性訓(xùn)練以及基于類別的語言模型自適應(yīng)研究。
(8)置信度判決:連續(xù)語音識別系統(tǒng)中重要的后處理模塊,針對識別結(jié)果中可能出現(xiàn)的錯誤通過詞后驗(yàn)概率(WPP)等技術(shù)給出識別結(jié)果對應(yīng)的可信度得分,對可信度低的識別結(jié)果進(jìn)行智能拒識。
本文研究基于深度學(xué)習(xí)的語義理解技術(shù),采用多知識源特征對轉(zhuǎn)寫關(guān)鍵詞進(jìn)行置信度重估,并采用Word Embedding技術(shù)計算每個詞的詞向量,同時將關(guān)鍵詞的置信度作為該詞的權(quán)重對所有詞的詞向量進(jìn)行加權(quán)平均,得到整個文本文件的詞向量表示;最后,利用利用分類算法計算轉(zhuǎn)寫后文本與用戶興趣模型的相關(guān)度,得到最終的相關(guān)度得分并按照該得分對原始語音文件進(jìn)行排序,對文件得分劃定閾值,得到原始語音文件的重要性級別,將最終的語音排序結(jié)果和級別信息推薦給用戶,實(shí)現(xiàn)面向電話場景的語音意圖的理解識別與推薦。
傳統(tǒng)的文本分類方法有關(guān)鍵詞匹配、規(guī)則文法、神經(jīng)網(wǎng)絡(luò)等,其中關(guān)鍵詞匹配、規(guī)則文法依賴人工經(jīng)驗(yàn)歸納規(guī)則從而構(gòu)建模型;基于神經(jīng)網(wǎng)絡(luò)(如LSTM、CNN)的文本分類屬于深度學(xué)習(xí)方法的應(yīng)用研究。
3.2.1 基于組合關(guān)鍵詞匹配的文本意圖研究
在文本意圖分類中,通常是通過精確關(guān)鍵詞匹配來達(dá)到分類的目的。本文中對精確關(guān)鍵詞匹配技術(shù)進(jìn)行擴(kuò)充,不僅僅通過單個關(guān)鍵詞進(jìn)行匹配,而且通過定義組合關(guān)鍵詞,以及在組合關(guān)鍵詞上進(jìn)行多種模式的匹配來實(shí)現(xiàn)文本意圖分類。假設(shè)要識別文本意圖類別A,目前用到的匹配模式共有:
(1)與類別A正相關(guān)的組合關(guān)鍵詞
每一組關(guān)鍵詞都定義了多個關(guān)鍵詞,匹配時,如果該組關(guān)鍵詞都能被命中,則認(rèn)為正向匹配度加1;
(2)單個正相關(guān)關(guān)鍵詞,設(shè)定最少命中次數(shù)限制
每個單獨(dú)的關(guān)鍵詞,都設(shè)定最少命中次數(shù),只有當(dāng)輸入文本中含有該關(guān)鍵詞的次數(shù)超過最少命中次數(shù)時,正向匹配度加1;
共回收101份問卷,在課堂形式有趣、提高自主學(xué)習(xí)能力、增強(qiáng)邏輯思維能力、提高臨床問題解決能力,提高臨床閱片技能,提高溝通協(xié)作能力等6個方面,A組(教改組)學(xué)生認(rèn)為受益程度均高于B組(對照組),差異具有統(tǒng)計學(xué)意義(P<0.05),兩組全面的掌握知識方面比較,差異無統(tǒng)計學(xué)意義(P>0.05),見表2所示。
(3)負(fù)相關(guān)組合關(guān)鍵詞
每一組定義多個不同關(guān)鍵詞,同時設(shè)定在進(jìn)行該組關(guān)鍵詞匹配時,需要同時命中的關(guān)鍵詞數(shù)量,當(dāng)命中數(shù)不超過定義的關(guān)鍵詞數(shù),負(fù)向匹配度加1;
最終根據(jù)正向匹配度和負(fù)向匹配度得分聯(lián)合進(jìn)行A意圖類別的歸屬判別決策。整個過程如圖4所示:
圖4 意圖A關(guān)鍵詞判別過程
3.2.2 基于規(guī)則文法的文本意圖研究
文法的作用等同于正則表達(dá)式,每一個文法規(guī)則都定義了一個句子集合。在文本意圖研究中,通過將定義的分類目標(biāo)分解為小的目標(biāo)點(diǎn),分別針對每個目標(biāo)任務(wù)定義多個文法,用來匹配輸入,同時結(jié)合抽取的實(shí)體要素和關(guān)系等信息,通過統(tǒng)計匹配上的不同類別下的目標(biāo)點(diǎn)的情況來決策是否屬于某個定義的意圖分類類別,基于規(guī)則文法進(jìn)行意圖分類的整體過程,如圖5所示。
圖5 文法判別過程
3.2.3 基于神經(jīng)網(wǎng)絡(luò)的文本意圖研究
基于神經(jīng)網(wǎng)絡(luò)的文本意圖研究,主要利用卷積神經(jīng)網(wǎng)絡(luò)(CNN)及長短時記憶網(wǎng)絡(luò)(LSTM)兩種分類模型。典型的卷積神經(jīng)網(wǎng)絡(luò)(CNN)文本分類模型,如圖6所示。
圖6 CNN文本分類結(jié)構(gòu)
CNN文本分類結(jié)構(gòu)如下四個部分:
(1)輸入層:輸入層是句子中的詞語對應(yīng)的詞向量(word vector)依次(從上到下)排列的矩陣,假設(shè)句子有n個詞,vector的維數(shù)為k,那么這個矩陣就是n×k的(在CNN中可以看作高度為n、寬度為k的圖像)。這個矩陣的類型可以是靜態(tài)的(static),即word vector是固定不變,也可以是動態(tài)的(non static),動態(tài)則是在模型訓(xùn)練過程中,word vector也當(dāng)做是可優(yōu)化的參數(shù)。
(2)卷積層:輸入層通過卷積操作得到若干個Feature Map,卷積窗口的大小為 h×k ,其中h表示縱向詞語的個數(shù),而k表示word vector的維數(shù)。通過這樣一個大型的卷積窗口,將得到若干個列數(shù)為1的Feature Map。
(3)池化層:池化層用Max-over-time Pooling的方法,簡單地從之前一維的Feature Map中提出最大的值。這種Pooling方式可以解決可變長度的句子輸入問題,即不管Feature Map中有多少個值,只需要提取其中的最大值。最終池化層的輸出為各個Feature Map的最大值,即一個一維的向量。
(4)全連接+softmax層:池化層的一維向量通過全連接的方式,連接一個Softmax層,Softmax層可根據(jù)任務(wù)的需要設(shè)置,通常反映著最終類別上的概率分布。
而LSTM模型作為一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)結(jié)構(gòu),可以用來處理序列數(shù)據(jù)。RNN網(wǎng)絡(luò)會對前面的信息進(jìn)行記憶并應(yīng)用于當(dāng)前輸出的計算中,即隱藏層之間的節(jié)點(diǎn)不再無連接而是有連接的,并且隱藏層的輸入不僅包括輸入層的輸出還包括上一時刻隱藏層的輸出。LSTM網(wǎng)絡(luò)作為RNN的一種延伸,可以更好地利用文本中的詞序信息,文本分類中常用的LSTM網(wǎng)絡(luò)如圖7所示。
文本中的n+1個詞依次通過LSTM后,得到相應(yīng)的n+1個隱層神經(jīng)元向量將這些隱層向量求平均(mean pooling),即得到整個文本的分布式特征表示,然后緊接著是一個簡單的邏輯回歸層,得到一個類別分布概率。除了mean pooling,也可以使用max pooling,或者兩者同時使用并將兩者得到的h相拼接。
本文擬結(jié)合關(guān)鍵詞匹配、規(guī)則文法、神經(jīng)網(wǎng)絡(luò)三種方法進(jìn)行電話詐騙意圖識別。結(jié)合已有的和采集標(biāo)注的業(yè)務(wù)數(shù)據(jù),提取各類詐騙話音的語義特征,建立詐騙話音語料的語言模型和語義模型,實(shí)現(xiàn)有害詐騙電話的檢測,實(shí)現(xiàn)過程如圖8所示。
圖8 基于意圖理解的詐騙電話檢測示意圖
取意圖理解線上一個月的預(yù)警效果數(shù)據(jù),累計預(yù)警18 036條,平均每天產(chǎn)生有效預(yù)警約580條,平均預(yù)警準(zhǔn)確率可達(dá)96.94%,精準(zhǔn)度高,可滿足公安防范勸阻實(shí)戰(zhàn)應(yīng)用。如表2所示。
隨著移動互聯(lián)網(wǎng)技術(shù)的發(fā)展,電信詐騙帶來的危害和影響日益嚴(yán)重。電話詐騙作為電信詐騙的子類型,案發(fā)數(shù)量、涉案金額均占據(jù)非常高的比重,目前基于此方向的研究仍然處于起步階段,為此,本文分別從詐騙用戶自身的固有特征和詐騙主題內(nèi)容出發(fā),研究有效的詐騙電話檢測方法,并落地實(shí)戰(zhàn)應(yīng)用。后續(xù)研究將繼續(xù)深入分析詐騙電話特征,建立覆蓋度更完整的詐騙檢測機(jī)制,為防范和打擊電信詐騙提供更加有力的技術(shù)參考。
表2 意圖理解近一個月預(yù)警效果
隨著電話詐騙劇本套路的不斷變化,下一步將深入研究模型的自適應(yīng)訓(xùn)練技術(shù),不斷更新詐騙意圖理解模型,并持續(xù)構(gòu)建詐騙分子聲紋庫。同時,電話、短信、網(wǎng)絡(luò)多手段融合詐騙趨勢明顯,需深入研究多源數(shù)據(jù)融合分析實(shí)現(xiàn)電信類詐騙線索的預(yù)警分析,以保衛(wèi)人民群眾的財產(chǎn)安全和合法權(quán)益,維護(hù)社會誠信和社會秩序。