蔡立偉,梅 芳
(國家無線電監(jiān)測中心云南監(jiān)測站,昆明 650031)
近年來,伴隨科技高發(fā)展給我們帶來便利的同時,也給某些心懷不正的人以可乘之機,利用無線電進行考試作弊成為不公平考試的重要手段?,F(xiàn)階段,考試無線電作弊手段日趨先進,由原來的單純發(fā)送語音向發(fā)送文字轉(zhuǎn)變,由模擬信號開始向數(shù)字信號轉(zhuǎn)變。作弊信號發(fā)送時間更短,用于作弊的終端設(shè)備更微型化,由原來的錢包式、腰帶式,演變到現(xiàn)在的手表式、橡皮式。作弊人員變得更加專業(yè)化、團隊化,作弊成功率更高,造成的社會影響更惡劣,嚴重破壞考試公平性、公正性,給考試無線電安全保障工作帶來嚴峻挑戰(zhàn)。
面對嚴峻的無線電作弊新形勢,僅依靠人工或者半自動的監(jiān)測發(fā)現(xiàn)作弊信號,不僅效率低、實時性差,容易漏掉作弊信號,而且對數(shù)字信號的判別解碼基本束手無策,所以必須由監(jiān)測設(shè)備自動工作掃描識別,才能迅速、準確地識別考試無線電作弊信號,為逼近查找發(fā)射作弊信號源爭取寶貴的時間。在考試無線電保障過程中,最關(guān)鍵的是對無線電作弊信號的識別。[1]
考試無線電識別系統(tǒng)通常在自動模式下工作,可以大大節(jié)省人工成本,提高工作效率,而且設(shè)備易攜帶、環(huán)境適應性強。
通常系統(tǒng)偵測設(shè)備為雙通道接收機,偵測設(shè)備天線接收到信號后,將信號通過功分器分成兩路:一路掃描通道負責捕獲新出現(xiàn)的信號,一路分析通道負責信號解調(diào)和解碼。信號偵測設(shè)備開機后自動采集背景信號,形成環(huán)境樣本庫;用戶也可自己設(shè)置門限,對超過門限的新信號進行重點監(jiān)測識別。偵測設(shè)備搜索到可疑信號后,發(fā)送至云服務(wù)器進行性質(zhì)判定,并將結(jié)果發(fā)回至偵測設(shè)備控制端進行顯示。如果識別的結(jié)果為作弊信號,則設(shè)備保存該頻點信號,并持續(xù)關(guān)注監(jiān)測該頻點信號。
對于新出現(xiàn)的模擬信號,則解調(diào)出音頻,通過音頻語音識別其內(nèi)容,如果內(nèi)容中包含疑似作弊關(guān)鍵字則視為作弊信號,內(nèi)容為正常則忽略;對于新出現(xiàn)的數(shù)傳信號,對其解碼出文字內(nèi)容,并進行關(guān)鍵字匹配識別,根據(jù)內(nèi)容判別其是否為作弊信號。對于判定為作弊信號的頻點,控制終端告警,突出顯示。對于自動判定不正確的信號,可將其作為“誤報信號”反饋回云服務(wù),幫助改善自動判定的準確性,也可將此功能設(shè)為手動方式,人工判斷可疑信號是否為作弊信號。如圖1所示。
圖1 作弊信號識別原理圖
通常考試無線電作弊系統(tǒng)對采集的新信號進行調(diào)制識別,將信號分為模擬調(diào)制和數(shù)字調(diào)制兩類,然后對兩類信號進行識別,并對信號內(nèi)容進行解碼,最后判斷解碼內(nèi)容是不是作弊信號[2]。
當系統(tǒng)判別為語音信號時,首先對語音信號在云端語音識別引擎進行在線識別,將語音信號轉(zhuǎn)成文本內(nèi)容,然后對文本的關(guān)鍵字匹配并輸出識別結(jié)果。如圖2所示。
圖2 語音信號識別流程圖
(1)語音信號識別原理。語音識別是通過計算機算法對語音信號進行識別,并將其轉(zhuǎn)換為文本或者指令的技術(shù)。語音識別系統(tǒng)首先對收集到的語音信號進行預處理,預處理包含信號采樣濾波、減少個體發(fā)音差異,消除環(huán)境引起的噪聲影響等過程,預處理完成后系統(tǒng)提取語音信號特征,然后建立語音識別模板。系統(tǒng)根據(jù)對應的語音識別模型,用保存在服務(wù)器中的語音模板和預處理過的語音信號特征進行比較,按照算法設(shè)定的查詢和適應目標策略,尋找到與輸入語音匹配的最適合模板,根據(jù)匹配的模板計算出識別結(jié)果[3]。從語音識別過程可以看出,識別結(jié)果與選擇合適的語音模型有很大的關(guān)聯(lián)。語音識別系統(tǒng)構(gòu)建包括訓練和識別,把大量的音頻、語言數(shù)據(jù)庫進行信號處理和數(shù)據(jù)挖掘,從而建立系統(tǒng)的聲學模型和語言模型;識別是對接收的實時語音信號進行自動分析,通常系統(tǒng)可以自適應學習糾正聲學模型和語音模型,從而不斷提高識別系統(tǒng)準確率。如圖3所示。
圖3 語音信號識別原理圖
(2)語音識別算法。語音識別算法是語音識別技術(shù)的關(guān)鍵。語音識別系統(tǒng)聲學模型建模后,把語音輸入變化成聲學的數(shù)學函數(shù)輸出,按照統(tǒng)計學計算出語音信號的聲學概率。語言模型在聲學模型計算得到語音序列后,從系統(tǒng)的文字序列中找出概率最大的字符串序列,從而實現(xiàn)對語音信號的識別。下式為語音識別算法的經(jīng)典基本框架公式:
式中,W 代表文字序列;Y 代表語音輸入;P(Y|W)是文字序列出現(xiàn)語音的概率,代表語音識別中的聲學模型;P(W)是出現(xiàn)這個文字序列的概率,代表語音識別中的語言模型。
當系統(tǒng)判別為數(shù)字信號時,通過特征提取獲取信號的調(diào)制方式、通信體制等相關(guān)調(diào)制參數(shù),并對其進行解碼,解碼后對內(nèi)容進行關(guān)鍵字和特征匹配,判別內(nèi)容是否為作弊信息。主要流程包括:
(1)信號預處理:包括帶通信號采樣、模數(shù)A/D 轉(zhuǎn)換、對信號進行濾波。
(2)特征提?。簭脑夹盘栔型ㄟ^變換獲取信號特征參數(shù)。通常采用循環(huán)譜、高階統(tǒng)計量和小波變換等方法對數(shù)字調(diào)信號進行特征提取[4]。
(3)分類識別:特征提取后對信號進行分類識別,選擇判決方法和分類器結(jié)構(gòu)對識別結(jié)果影響很大。現(xiàn)如今主流的信號調(diào)制方式分類采用決策理論方法或基于統(tǒng)計模式方法,通常使用統(tǒng)計模式方法較多[5]。
(4)解碼:信號調(diào)制方式識別完成后,需要相應的解碼器或者解碼算法實現(xiàn)對信號進行解碼,解碼出信號內(nèi)容。
(5)關(guān)鍵字匹配:對解碼后的內(nèi)容進行關(guān)鍵字匹配識別,根據(jù)作弊信息特征判別作弊信號。作弊信號通常為A,B,C,D 或者1,2,3,4 等報送內(nèi)容,具有明顯的特征,可根據(jù)這個特征進行判別。
圖4 數(shù)字信號調(diào)制方式識別流程
市場上作弊設(shè)備層出不窮,對從圖5可以看出現(xiàn)階段常見的作弊設(shè)備型號主要是NF6、云六、TTO、南極光、Sunlips、云八、TK 等。圖6、圖7是現(xiàn)階段在考試保障中發(fā)現(xiàn)的典型作弊信號頻譜圖,作弊信號主要調(diào)制方式是2FSK 和LORA 信號。隨著技術(shù)發(fā)展,作弊設(shè)備發(fā)送的作弊信號頻段、信號類型也會變化,需不斷對作弊信號偵測識別系統(tǒng)進行迭代升級。
圖5 主流作弊設(shè)備頻段分布及調(diào)制方式
圖6 2FSK調(diào)制作弊信號頻譜圖
圖7 LORA調(diào)制作弊信號頻譜圖
本文根據(jù)對各大廠商考試無線電作弊信號的監(jiān)測采集、信號識別、解碼等工作流程進行研究,闡述了作弊信號識別原理相關(guān)的技術(shù)算法,對掌握和研究無線電作弊信號識別方法有一定參考價值。面對技術(shù)不斷發(fā)展的作弊信號,需要不斷改進和升級考試無線電偵測系統(tǒng)的識別算法。