• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      深度神經(jīng)網(wǎng)絡(luò)視頻新媒體短視頻個(gè)性化推薦系統(tǒng)研究

      2019-07-11 01:01:16高晨峰
      衛(wèi)星電視與寬帶多媒體 2019年5期
      關(guān)鍵詞:特征向量數(shù)據(jù)挖掘

      高晨峰

      【摘要】隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,新媒體短視頻不斷豐富著人們的生活。面對(duì)海量的新媒體短視頻,傳統(tǒng)基于協(xié)同過(guò)濾算法的視頻推薦系統(tǒng)已經(jīng)不能滿足人們的新媒體短視頻推薦需求。對(duì)此,本文利用深度學(xué)習(xí)和數(shù)據(jù)挖掘相關(guān)技術(shù),提出了一種基于深度神經(jīng)網(wǎng)絡(luò)模型的新媒體短視頻個(gè)性化推薦系統(tǒng),該推薦系統(tǒng)主要包括:數(shù)據(jù)采集處理模塊、用戶視頻建模模塊、神經(jīng)網(wǎng)絡(luò)訓(xùn)練模塊、推薦視頻生成模塊4個(gè)部分。通過(guò)對(duì)該推薦系統(tǒng)的實(shí)驗(yàn)分析發(fā)現(xiàn),通過(guò)深度神經(jīng)網(wǎng)絡(luò)模型的學(xué)習(xí)與訓(xùn)練,該推薦系統(tǒng)具備較高的推薦性能,能夠充分把握用戶對(duì)新媒體短視頻的興趣偏好,實(shí)用價(jià)值較高。

      【關(guān)鍵詞】新媒體短視頻;個(gè)性化推薦系統(tǒng);深度神經(jīng)網(wǎng)絡(luò)模型;數(shù)據(jù)挖掘;特征向量

      一、引言

      隨著互聯(lián)網(wǎng)通信與多媒體技術(shù)的發(fā)展,新媒體短視頻的播放量持續(xù)增長(zhǎng)。截止2018年,愛奇藝、騰訊視頻、抖音短視頻等客戶端的視頻總量達(dá)到了7000萬(wàn),月度活躍用戶更是高達(dá)2億,每天有接近10億的視頻播放量。面對(duì)如此海量的新媒體短視頻,傳統(tǒng)的協(xié)同過(guò)濾算法難以采取常規(guī)的手段來(lái)實(shí)現(xiàn)新媒體短視頻的內(nèi)容特征提取,也就無(wú)法對(duì)新媒體短視頻內(nèi)容的進(jìn)行準(zhǔn)確推薦。同時(shí),深度學(xué)習(xí)在自然語(yǔ)言處理、圖像處理和語(yǔ)音處理等領(lǐng)域取得了技術(shù)性突破,新媒體短視頻推薦技術(shù)應(yīng)運(yùn)而生。

      在此背景下,本文提出了一種基于深度神經(jīng)網(wǎng)絡(luò)模型的新媒體短視頻個(gè)性化推薦系統(tǒng),進(jìn)行用戶和新媒體短視頻建模及深度訓(xùn)練學(xué)習(xí),把握用戶興趣偏好與新媒體短視頻之間的內(nèi)在關(guān)系,實(shí)現(xiàn)新媒體短視頻的個(gè)性化推薦。

      二、新媒體短視頻個(gè)性化推薦系統(tǒng)設(shè)計(jì)

      (一)總體流程

      基于深度神經(jīng)網(wǎng)絡(luò)模型的新媒體短視頻個(gè)性化推薦系統(tǒng)的整體流程示意圖如圖1所示,從圖1可以看到,該系統(tǒng)基本涵蓋以下幾個(gè)模塊:

      (1)數(shù)據(jù)采集處理模塊。通過(guò)Hadoop大數(shù)據(jù)平臺(tái)獲取用戶的新媒體短視頻歷史操作數(shù)據(jù)和新媒體短視頻的文本描述數(shù)據(jù),完成兩部分?jǐn)?shù)據(jù)的預(yù)處理工作;

      (2)用戶視頻建模模塊。采用傳統(tǒng)的文本挖掘算法對(duì)新媒體短視頻的文本描述數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,獲得新媒體短視頻內(nèi)容的關(guān)鍵特征,結(jié)合用戶對(duì)新媒體短視頻的播放記錄,實(shí)現(xiàn)用戶和視頻建模;

      (3)神經(jīng)網(wǎng)絡(luò)訓(xùn)練模塊。以用戶和新媒體短視頻建模情況為深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本,將新媒體短視頻和用戶特征向量作為深度神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù),對(duì)深度神經(jīng)網(wǎng)絡(luò)進(jìn)行有監(jiān)督的訓(xùn)練。充分利用深度學(xué)習(xí)技術(shù)的特征提取優(yōu)勢(shì),把握新媒體短視頻與用戶的語(yǔ)義特征,挖掘用戶興趣偏好與新媒體短視頻之間內(nèi)在關(guān)系,構(gòu)建個(gè)性化推薦系統(tǒng);

      (二)數(shù)據(jù)采集處理模塊

      基于深度神經(jīng)網(wǎng)絡(luò)模型的新媒體短視頻個(gè)性化推薦系統(tǒng)執(zhí)行的第一步就是要獲取相關(guān)數(shù)據(jù)信息,這里的相關(guān)數(shù)據(jù)信息包括兩個(gè)方面:

      第一是新媒體短視頻的文本描述數(shù)據(jù)。新媒體短視頻與其他常規(guī)視頻一樣,其文本描述數(shù)據(jù)無(wú)外乎:視頻標(biāo)題、視頻基本內(nèi)容、視頻發(fā)布地區(qū)、視頻策劃、編劇和主演、視頻發(fā)布時(shí)間和發(fā)布作者等等。這些文本描述數(shù)據(jù)主要用于新媒體短視頻內(nèi)容的特征提取,為后續(xù)新媒體短視頻建模奠定基礎(chǔ)。

      第二是用戶對(duì)新媒體短視頻的歷史操作記錄。這里的操作可以理解為用戶打開新媒體短視頻,用戶打開視頻有兩種情況,情況一是用戶移動(dòng)視頻播放進(jìn)度條,粗略瀏覽新媒體短視頻,用戶實(shí)際觀看時(shí)長(zhǎng)小于視頻總時(shí)長(zhǎng),可能該用戶對(duì)此新媒體短視頻并不是真正感興趣;情況二是用戶完整地觀看了新媒體短視頻,沒(méi)有快進(jìn)瀏覽,用戶實(shí)際觀看時(shí)長(zhǎng)等于視頻總時(shí)長(zhǎng),可以認(rèn)為用戶對(duì)此視頻感興趣。因此,為了區(qū)分用戶對(duì)新媒體短視頻的兩種操作情況,在判斷用戶對(duì)新媒體短視頻操作是否有效時(shí)加入了新媒體短視頻播放時(shí)長(zhǎng)比這一指標(biāo),新媒體短視頻播放時(shí)長(zhǎng)比具體計(jì)算公式如下:

      其中,τia為用戶a觀看新媒體短視頻i的時(shí)長(zhǎng),Ti為新媒體短視頻i的總時(shí)長(zhǎng)。只有當(dāng)τia與Ti之比大于某個(gè)給定閾值時(shí),才能認(rèn)為用戶對(duì)新媒體短視頻操作是有效的,并進(jìn)行記錄。一般而言,新媒體短視頻實(shí)際閾值為0.3左右。至此得到用戶對(duì)新媒體短視頻的歷史操作記錄,得到用戶特征向量,為后續(xù)用戶建模奠定基礎(chǔ)。

      另外,在現(xiàn)有的網(wǎng)絡(luò)情況下,新媒體短視頻總是存在各種各樣的問(wèn)題,例如:數(shù)據(jù)缺失、數(shù)據(jù)冗余等。為了保證視頻數(shù)據(jù)的完整性和可靠性,在正式建模分析之前,需要對(duì)文本描述數(shù)據(jù)進(jìn)行預(yù)處理,預(yù)處理主要包括:視頻過(guò)濾和視頻融合。視頻過(guò)濾主要是去除部分重要文本信息缺失的新媒體短視頻。視頻融合主要是合并重要文本信息相似的新媒體短視頻。

      (三)用戶視頻建模模塊

      根據(jù)數(shù)據(jù)采集處理模塊對(duì)相關(guān)數(shù)據(jù)信息的獲取和預(yù)處理,利用深度學(xué)習(xí)和數(shù)據(jù)挖掘相關(guān)技術(shù)對(duì)視頻數(shù)據(jù)和用戶數(shù)據(jù)分別進(jìn)行建模。

      (1)視頻建模

      視頻建模的方法較多,基于新媒體短視頻的播放特點(diǎn),本文通過(guò)提取新媒體短視頻重要文本描述性關(guān)鍵詞作為視頻標(biāo)簽信息,由此進(jìn)行視頻建模。

      提取視頻關(guān)鍵詞的思路是分析一個(gè)詞語(yǔ)在視頻中的重要性。而一個(gè)詞語(yǔ)在視頻中的重要性取決于兩個(gè)方面:第一在視頻中出現(xiàn)的頻率,記作TF值。TF值在某種程度上可以直接體現(xiàn)出該詞語(yǔ)在該視頻中的重要程度,TF值越大,它的重要性越高;第二是這個(gè)詞語(yǔ)在所有新媒體短視頻庫(kù)中的出現(xiàn)的頻率,也叫作逆向視頻頻率,記作IDF值。TF值反映出這個(gè)詞語(yǔ)在整個(gè)視頻庫(kù)中的重要程度,如果一個(gè)詞語(yǔ)在整個(gè)視頻庫(kù)經(jīng)常出現(xiàn),那個(gè)用該詞語(yǔ)代表某個(gè)視頻的能力反而會(huì)下降,即這個(gè)詞語(yǔ)所提供的信息量減少。因此,當(dāng)一個(gè)詞語(yǔ)在整個(gè)視頻庫(kù)出現(xiàn)的頻率越高時(shí),對(duì)應(yīng)的IDF值就越小。

      當(dāng)對(duì)所有的新媒體短視頻文本內(nèi)容進(jìn)行提取視頻關(guān)鍵詞后,就可以量化各個(gè)關(guān)鍵詞在新媒體短視頻的重要程度。去除重要程度較小的關(guān)鍵詞,保留那些重要程度較大的關(guān)鍵詞,并作為該視頻的標(biāo)簽信息,從而描述整個(gè)視頻特征,完成視頻建模。另外,還需要對(duì)新媒體短視頻進(jìn)行關(guān)鍵詞統(tǒng)計(jì),建立視頻關(guān)鍵詞庫(kù),生成關(guān)鍵詞索引。

      猜你喜歡
      特征向量數(shù)據(jù)挖掘
      二年制職教本科線性代數(shù)課程的幾何化教學(xué)設(shè)計(jì)——以特征值和特征向量為例
      克羅內(nèi)克積的特征向量
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
      一類三階矩陣特征向量的特殊求法
      一類特殊矩陣特征向量的求法
      EXCEL表格計(jì)算判斷矩陣近似特征向量在AHP法檢驗(yàn)上的應(yīng)用
      基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      三維向量空間中線性變換的特征向量的幾何意義*
      宁海县| 五大连池市| 灵璧县| 蓬莱市| 平湖市| 衡山县| 丹江口市| 改则县| 台江县| 南昌市| 怀集县| 临泉县| 萝北县| 大同市| 中山市| 长春市| 勃利县| 霍邱县| 香河县| 项城市| 怀来县| 恩平市| 犍为县| 彰化市| 习水县| 星子县| 资阳市| 丘北县| 武平县| 砚山县| 怀宁县| 固镇县| 聂荣县| 文水县| 芜湖县| 建宁县| 饶平县| 北辰区| 枣庄市| 吉林省| 沙洋县|