潘吳斌
市場上手機(jī)廠商、手機(jī)型號以及硬件的差異,使得YouTube在傳輸視頻過程中需進(jìn)行視頻碼率、分辨率等方面的識別及適應(yīng),以DASH-APP,HLS-APP,HPD-APP三種傳輸模式為例,這3種傳輸模式的段數(shù)特征差異很大。因此,本文通過分析3種傳輸模式之間的差異性、加密算法及更換流等內(nèi)容,為進(jìn)行YouTube模式識別提供技術(shù)支撐。
移動(dòng)端加密視頻傳輸模式識別模型構(gòu)建
本文提出基于在線和離線2種模式的模式識別模型構(gòu)建,首先通過貝葉斯模型進(jìn)行離線訓(xùn)練,然后采用A-I-P-FP進(jìn)行在線識別。
樸素貝葉斯多項(xiàng)式模型
①貝葉斯分類器原理及流程
CountVecotrizer作用是特征向量化,特征向量化示例圖如圖2所示。。
MutinominalNB模塊的主要功能是基于樸素貝葉斯多項(xiàng)式模型算法。
A-I-P-FP方案
A-I-P-FP方案離線訓(xùn)練模塊的實(shí)現(xiàn)如圖3所示。Stream Filter模塊用于檢測客戶端到服務(wù)器端,并過濾出視頻樣本首部第一條視頻流F、和其后一條流F+1,2條有效的視頻流,此部分基于tshark實(shí)現(xiàn)。
實(shí)驗(yàn)與結(jié)果分析
數(shù)據(jù)集合描述
采用表1設(shè)備進(jìn)行數(shù)據(jù)集描述,共分為20和160,2次進(jìn)行YouTube熱門視頻采集。
實(shí)驗(yàn)評估
yi5樸素貝葉斯多項(xiàng)式模型實(shí)驗(yàn)評估
在數(shù)據(jù)集合中隨機(jī)選取200個(gè)視頻樣本,為分析T時(shí)間參數(shù)選擇對分類器的影響進(jìn)行了實(shí)驗(yàn),其D1準(zhǔn)確率、召回率與F1-score結(jié)果如表2所示。
圖4給出了這次實(shí)驗(yàn)的混淆矩陣,圖5展示了對樸素貝葉斯多項(xiàng)式模型構(gòu)建的分類器進(jìn)行了10次交叉驗(yàn)證的結(jié)果。由圖4和圖5可見其平均準(zhǔn)確率達(dá)到92.25 %。
A-I-P-FP方法實(shí)驗(yàn)評估
將500個(gè)視頻集合D2分為S2、T2兩個(gè)集合。訓(xùn)練集為80 %,測試集為20 %。表3用查準(zhǔn)率、查全率和F-score及其均值,展示了對方法的評估。
如表3結(jié)果所示,識別效果最好的2種模式是DASH-APP和HPD-APP。并且如圖6所示為對500個(gè)視頻進(jìn)行了10次交叉驗(yàn)證的結(jié)果??梢姳疚姆椒ň苋〉昧己玫淖R別效果。
為完成YouTube移動(dòng)端加密視頻流的識別、關(guān)聯(lián)以及傳輸模式的識別,研究了基于DASH,HLS,HPD等視頻傳輸模式在加密情況下的特征和區(qū)別,分析了在移動(dòng)App,PCWEB端進(jìn)行YouTube視頻傳輸模式的差異性和共同性,并深入分析了不同型號手機(jī)對視頻觀看的影響,最后提出了A-I-P-FP視頻傳輸加密方法,為在線識別YouTube視頻傳輸模式提供了一種高效、可行的解決方案。