• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于時(shí)間序列預(yù)測(cè)模型的電視劇收視率預(yù)測(cè)

      2018-01-26 04:58:04紹興市第一中學(xué)陸文昊
      電子世界 2018年1期
      關(guān)鍵詞:線性神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)

      紹興市第一中學(xué) 陸文昊

      1.前言

      電視劇的熱度是對(duì)其影響力和關(guān)注度的綜合衡量指標(biāo)。為了在目前“多屏模式”下找到電視劇熱度的影響因素,并且提出更綜合、客觀的衡量指標(biāo),國(guó)內(nèi)外專家學(xué)者進(jìn)行了很多針對(duì)性的研究。主要可以分為兩類:

      (1)單一預(yù)測(cè)模型,如:梁招娣等基于RBF神經(jīng)網(wǎng)絡(luò)對(duì)電視收視率進(jìn)行預(yù)測(cè)[1],汪洋等基于BP神經(jīng)網(wǎng)絡(luò)建立收視率預(yù)測(cè)模型[2],張春燕等利用ARMA模型對(duì)在線電視劇流行度進(jìn)行預(yù)測(cè)[3],毋世曉等人利用移動(dòng)平均法預(yù)測(cè)網(wǎng)站電視劇視頻點(diǎn)擊量[4]等等。

      (2)組合預(yù)測(cè)模型,如:張茜等基于TEI@I方法,提出了對(duì)綜藝節(jié)目收視率預(yù)測(cè)的研究框架,引入了新的解釋變量百度指數(shù)和新浪微指數(shù),并采用模型集成技術(shù)顯著提高了預(yù)測(cè)精度[5]。黃玲莉等基于ARIMA與BP神經(jīng)網(wǎng)絡(luò),建立了收視率組合預(yù)測(cè)模型[6]。

      對(duì)比前人的研究成果,我們發(fā)現(xiàn)組合模型的效果比單一模型更加出色。因此,本文在前人已有研究的基礎(chǔ)上,綜合運(yùn)用了多種機(jī)器學(xué)習(xí)模型,對(duì)影響電視劇熱度的因素進(jìn)行了系統(tǒng)的研究。

      2.收視率單一時(shí)序預(yù)測(cè)模型的構(gòu)建和優(yōu)化

      2.1 數(shù)據(jù)收集和預(yù)處理

      本研究選取了2015年到2017年期間首播的共23部完結(jié)的電視劇作為研究對(duì)象,這些電視劇包含了不同種類的收視率變化模式,均屬于該種類中較為典型的電視劇,可以比較全面的反應(yīng)不同的收視率變化情況,確保了模型的廣泛性與合理性。

      研究中所有的收視率數(shù)據(jù)均為索福瑞CSM52城收視率統(tǒng)計(jì)值,電視劇的基本信息(如首播日期、播出衛(wèi)視、每天播放集數(shù))等信息來(lái)源于百度百科,所有的原始數(shù)據(jù)都存儲(chǔ)在補(bǔ)充材料的excel表格中。

      2.2 建立AR(2)模型進(jìn)行預(yù)測(cè)

      首先,本文使用二階自回歸的時(shí)序預(yù)測(cè)模型,利用電視劇前 集的收視率數(shù)據(jù)來(lái)預(yù)測(cè)最后三集的收視率。其中該模型的基本假設(shè)為:

      (1)電視劇收視率變化平穩(wěn),不會(huì)因?yàn)橥饨缫蛩氐呐R時(shí)干擾而發(fā)生突變;

      (2)不同時(shí)間的電視劇收視率統(tǒng)計(jì)方法一致,能夠反映電視劇的受關(guān)注程度。

      本文基于以上的模型假設(shè),建立了二階自回歸模型,即AR(2)模型。若假設(shè) 代表第 集電視劇的收視率,那么該模型的表達(dá)式為:

      利用excel自帶的數(shù)據(jù)分析工具進(jìn)行擬合,此處以2017年收視率榜首電視劇《人民的名義》為例進(jìn)行模型的訓(xùn)練和求解。其中訓(xùn)練集和測(cè)試集分別為:

      (1)訓(xùn)練集:《人民的名義》前29天、共47集的收視率作為訓(xùn)練集。

      (2)測(cè)試集:《人民的名義》最后3天、共5集的收視率作為測(cè)試集。

      經(jīng)過(guò)excel的擬合分析,得到《人民的名義》二階自回歸擬合的表達(dá)式為:

      用同樣的方法,對(duì)其余的22部電視劇建立AR(2)模型,分別作出收視率的預(yù)測(cè)分析。結(jié)果發(fā)現(xiàn),對(duì)于部分電視劇來(lái)說(shuō),該模型的預(yù)測(cè)性能比較好,如《平凡的世界》RMSE=0.056,《北上廣不相信眼淚》RMSE=0.051,《外科風(fēng)云》RMSE=0.077。

      而對(duì)于另外一些電視劇,該模型的預(yù)測(cè)性能比較差,例如《孤芳不自賞》RMSE=0.534,《于成龍》RMSE=0.583,《親愛(ài)的翻譯官》RMSE=0.683。

      由此可見(jiàn),最簡(jiǎn)單的AR(2)時(shí)序預(yù)測(cè)模型僅能實(shí)現(xiàn)一定程度的預(yù)測(cè)功能,其局限性主要體現(xiàn)在以下兩個(gè)方面:

      (1)只能描述數(shù)據(jù)分布規(guī)律中的線性特征,而難以刻畫數(shù)據(jù)分布的非線性關(guān)系。這就使該模型對(duì)于基本符合線性增長(zhǎng)趨勢(shì)的電視劇收視率與測(cè)量好,而對(duì)于波動(dòng)性較大的電視劇收視率難以精準(zhǔn)預(yù)測(cè);

      (2)部分模型存在過(guò)擬合的問(wèn)題,將數(shù)據(jù)中的噪聲當(dāng)做了信號(hào)進(jìn)行處理,有些參數(shù)的p-value不能通過(guò)0.05顯著性水平檢測(cè)。

      2.3 對(duì)數(shù)據(jù)和模型進(jìn)行優(yōu)化處理

      2.3.1 對(duì)收視率數(shù)據(jù)異常點(diǎn)的處理

      通過(guò)對(duì)部分電視劇測(cè)試結(jié)果的深入研究,發(fā)現(xiàn)部分預(yù)測(cè)收視率與真實(shí)收視率差距較大的電視劇,都存在兩種不一樣的播放模式。例如《武媚娘傳奇》有單集播放的、也有三集連播的;《人民的名義》有單機(jī)播放的、也有兩集連播的。

      為確定“收視率異常下降”與“當(dāng)日單集播放”之間的關(guān)系,我們對(duì)23部電視劇中有不同播放模式的17部電視劇進(jìn)行了統(tǒng)計(jì)分析,得到了如表格1所示的結(jié)論。此處,“收視率異常下降”定義為“該天的收視率明顯小于本電視劇收視率的線性增長(zhǎng)趨勢(shì)”。

      表1 對(duì)17部電視劇“收視率異常下降”天數(shù)特征的統(tǒng)計(jì)分析

      由表格1可以非常明顯地看出,在所有的考察對(duì)象的單集播放日中,“收視率異常下降”事件出現(xiàn)的概率遠(yuǎn)遠(yuǎn)高于所有播放日的平均概率。所以我們認(rèn)為,“單集播放”是與“收視率異常下降”存在緊密的聯(lián)系。

      所以,我們首先對(duì)于研究對(duì)象電視劇的所有單集播放日中“收視率異常下降”的數(shù)據(jù)進(jìn)行了修正,采用均值插值的方法,替換掉原有的收視率異常點(diǎn)。修正后的收視率等于單集播放日前后的收視率平均值。

      2.3.2 將AR(2)模型優(yōu)化為ARMA(2,3)模型

      在完成對(duì)單集播放日異常點(diǎn)的修正后,部分電視劇依然存在比較大的波動(dòng)性。因此,進(jìn)一步優(yōu)化模型,引入移動(dòng)平均的優(yōu)化計(jì)算,對(duì)波動(dòng)劇烈的曲線進(jìn)行平滑濾波,從而降低波動(dòng)性帶來(lái)的影響,更容易地把握住數(shù)據(jù)分布的線性趨勢(shì)。因此進(jìn)一步將AR模型優(yōu)化為ARMA模型。

      在ARMA(p,q)的模型識(shí)別和定階過(guò)程中,我們以《人民的名義》電視劇為樣例,對(duì)p、q兩個(gè)參數(shù)采取逐步試探法以獲得最佳值。經(jīng)過(guò)多次嘗試,確定收視率預(yù)測(cè)的最佳模型為ARMA(2,3)。在對(duì)單集播放日的異常點(diǎn)修正后,利用matlab實(shí)現(xiàn)ARMA的預(yù)測(cè)功能,再次對(duì)表2-4中曾經(jīng)對(duì)AR(2)模型表現(xiàn)不佳的電視劇進(jìn)行預(yù)測(cè),得到新的預(yù)測(cè)結(jié)果為《孤芳不自賞》RMSE=0.235,《于成龍》RMSE=0.462,《親愛(ài)的翻譯官》RMSE=0.383.

      可以看出,經(jīng)過(guò)對(duì)數(shù)據(jù)集的修正和對(duì)模型的優(yōu)化之后,原先AR(2)預(yù)測(cè)表現(xiàn)不佳的電視劇預(yù)測(cè)性能都有了一定的提升。改變最大的電視劇《親愛(ài)的翻譯官》,其均方誤差降低了44%,其他電視劇的均方誤差也有10%-30%不等的下降。

      2.4 總結(jié)與討論

      本章節(jié)采用單一的時(shí)序預(yù)測(cè)模型,對(duì)23部研究對(duì)象電視劇進(jìn)行了逐一的預(yù)測(cè)。在AR(2)模型的基礎(chǔ)上,一方面深入分析了異常點(diǎn)的規(guī)律和特征,對(duì)異常點(diǎn)進(jìn)行了修正;另一方面在模型中加入了移動(dòng)平均的過(guò)程,將模型優(yōu)化為ARMA(2,3)。最終可以看到,ARMA(2,3)模型在修正后的數(shù)據(jù)集上,表現(xiàn)出的預(yù)測(cè)性能比AR(2)在原數(shù)據(jù)集上的性能要優(yōu)秀很多。

      雖然目前的預(yù)測(cè)模型得到了一定的優(yōu)化,例如《人民的名義》預(yù)測(cè)RMSE從0.3285降低到了0.2376,但該模型依舊存在一定的問(wèn)題。其最核心的問(wèn)題在于該模型依舊只能描述數(shù)據(jù)的線性變化趨勢(shì),對(duì)于變量之間非線性的變化關(guān)系十分無(wú)力。

      為了進(jìn)一步提高預(yù)測(cè)的精確程度,我們從前人的工作中得到啟發(fā),嘗試采用組合模型來(lái)進(jìn)行預(yù)測(cè),一方面利用ARMA模型的線性描述能力,另一方面利用BP神經(jīng)網(wǎng)絡(luò)的非線性預(yù)測(cè)能力,二者相結(jié)合地展開(kāi)后續(xù)的預(yù)測(cè)工作。

      3.ARMA-BP神經(jīng)網(wǎng)絡(luò)組合預(yù)測(cè)模型

      3.1 模型構(gòu)造思路

      經(jīng)過(guò)前文的分析和預(yù)測(cè),我們發(fā)現(xiàn)節(jié)目的收視率會(huì)受到很多因素的影響。哪怕對(duì)一些異常點(diǎn)進(jìn)行修正和調(diào)整,節(jié)目的收視率也會(huì)有一定的波動(dòng)性和無(wú)序性。所以,僅憑線性的模型是無(wú)論如何也無(wú)法進(jìn)行精準(zhǔn)擬合的。由于基于回歸的分析方法能夠提取出數(shù)據(jù)的線性特征,而神經(jīng)網(wǎng)絡(luò)對(duì)非線性關(guān)系有很強(qiáng)的逼近能力。所以我們?cè)谇叭搜芯康膯l(fā)之下,選擇使用ARMA模型與BP神經(jīng)網(wǎng)絡(luò)相結(jié)合,進(jìn)行收視率的預(yù)測(cè)分析。

      對(duì)目前要預(yù)測(cè)的收視率序列rate來(lái)說(shuō),每個(gè)數(shù)值都可以表示為:

      其中Lt表示該序列中規(guī)律的線性部分,對(duì)該部分ARMA模型有很好的擬合能力;而NLt表示該序列中的非線性部分,這部分能夠使用 BP神經(jīng)網(wǎng)絡(luò)來(lái)逼近求解,因此該組合模型的整體構(gòu)造思路分以下幾步:

      (1)用一個(gè)樣本電視劇確定ARMA(p,q)模型的階次,通過(guò)逐步試探的方法進(jìn)行識(shí)別、定階。在2.3.2節(jié)中,我們利用了《人民的名義》作為樣本電視劇,確定了該模型最佳的階次為 ARMA(2,3)。

      (2)用ARMA(2,3)模型進(jìn)行ratet預(yù)測(cè),假設(shè)預(yù)測(cè)的結(jié)果為。這代表了第 個(gè)點(diǎn)的預(yù)測(cè)值,而代表了該點(diǎn)的預(yù)測(cè)殘差。

      (4)利用ARMA(2,3)與BP神經(jīng)網(wǎng)絡(luò)兩種模型的預(yù)測(cè)結(jié)果組合后作為最終的預(yù)測(cè)結(jié)果,即在 點(diǎn)的預(yù)測(cè)結(jié)果為

      整體構(gòu)造過(guò)程如圖1所示。

      圖1 ARMA-BP神經(jīng)網(wǎng)絡(luò)構(gòu)造流程圖

      3.2 模型求解過(guò)程

      以《人民的名義》電視劇為例,利用1—26天的收視率作為訓(xùn)練集,27—29天的收視率作為測(cè)試集,檢驗(yàn)該模型的預(yù)測(cè)性能。

      首先利用2.3.2節(jié)中提到的ARMA(2,3)模型,用前26天的收視率進(jìn)行訓(xùn)練。利用matlab完成模型訓(xùn)練過(guò)程,計(jì)算出第5天至第26天的真實(shí)收視率與預(yù)測(cè)收視率。之后,將22個(gè)預(yù)測(cè)殘差作為BP神經(jīng)網(wǎng)絡(luò)的期望輸出。然后將原始收視率數(shù)據(jù)以最大收視率為基準(zhǔn)進(jìn)行歸一化處理,歸一化后的數(shù)據(jù)設(shè)為 。之后對(duì)歸一化后的數(shù)據(jù)進(jìn)行相空間重構(gòu),根據(jù)實(shí)際情況,確定重構(gòu)階數(shù)為5階,即通過(guò)生成一組5維的收視率空間向量。將重構(gòu)后的數(shù)據(jù)作為BP神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)輸入。

      利用matlab實(shí)現(xiàn)3層BP神經(jīng)網(wǎng)絡(luò),利用 newff 函數(shù)構(gòu)建網(wǎng)絡(luò),其中隱含層數(shù)目經(jīng)過(guò)多次試探驗(yàn)證設(shè)置為8。隱含層傳遞函數(shù)為tansig,輸出層的傳遞函數(shù)設(shè)為 purein,訓(xùn)練函數(shù)采用 trainm。經(jīng)過(guò)282次學(xué)習(xí)后,精度達(dá)到了預(yù)設(shè)的0.001的要求。

      將訓(xùn)練后的ARMA(2,3)模型和BP神經(jīng)網(wǎng)絡(luò)模型共同用于對(duì)《人民的名義》最后三天收視率的預(yù)測(cè),結(jié)果顯示組合模型能夠的均方誤差為 ,預(yù)測(cè)性能超過(guò)之前所有的單獨(dú)預(yù)測(cè)模型。由此可見(jiàn),ARMA-BP神經(jīng)網(wǎng)絡(luò)模型通過(guò)分別擬合線性部分和非線性部分,實(shí)現(xiàn)了更加精準(zhǔn)的預(yù)測(cè)性能,更適合用于電視劇的收視率預(yù)測(cè)中。

      [1]周小普,韓瑞娜,凌姝.多屏發(fā)展背景下網(wǎng)絡(luò)收視度的影響因素研究——以熱播電視劇為例[J].國(guó)際新聞界,2014,(12):114-129.

      [2]侯衛(wèi)星,高建中.基于因子分析法的城市低碳經(jīng)濟(jì)實(shí)證評(píng)價(jià)——以太原市為例[J].企業(yè)經(jīng)濟(jì),2012,(06):15-19.

      [3]張輝,王雯聰.基于多元統(tǒng)計(jì)分析方法研究電視劇收視特征及影響因素[J].現(xiàn)代傳播(中國(guó)傳媒大學(xué)學(xué)報(bào)),2011,(06):101-103+126.

      [4]耿金花,高齊圣,張嗣瀛.基于層次分析法和因子分析的社區(qū)滿意度評(píng)價(jià)體系[J].系統(tǒng)管理學(xué)報(bào),2007,(06):673-677.

      [5]何躍,蔡博馳.基于因子分析法的微博熱度評(píng)價(jià)模型[J].統(tǒng)計(jì)與決策,2016,(18):52-54.

      [6]劉志.模糊層次分析法在電視劇評(píng)價(jià)中的應(yīng)用[J].安徽廣播電視大學(xué)學(xué)報(bào),2014,(02):57-60.

      猜你喜歡
      線性神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)
      無(wú)可預(yù)測(cè)
      黃河之聲(2022年10期)2022-09-27 13:59:46
      漸近線性Klein-Gordon-Maxwell系統(tǒng)正解的存在性
      選修2-2期中考試預(yù)測(cè)卷(A卷)
      選修2-2期中考試預(yù)測(cè)卷(B卷)
      線性回歸方程的求解與應(yīng)用
      神經(jīng)網(wǎng)絡(luò)抑制無(wú)線通信干擾探究
      電子制作(2019年19期)2019-11-23 08:42:00
      二階線性微分方程的解法
      不必預(yù)測(cè)未來(lái),只需把握現(xiàn)在
      基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
      復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
      广元市| 永仁县| 大埔区| 铜陵市| 方城县| 即墨市| 张家港市| 张家口市| 成安县| 河间市| 平乐县| 华容县| 商丘市| 密山市| 桐城市| 友谊县| 莱西市| 鲁甸县| 津南区| 昌吉市| 虎林市| 高青县| 堆龙德庆县| 深州市| 和田市| 佳木斯市| 桓仁| 焦作市| 湖南省| 西藏| 呈贡县| 龙泉市| 营口市| 正镶白旗| 阜新| 江华| 习水县| 玉溪市| 博爱县| 大埔区| 奉贤区|