• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      網(wǎng)絡(luò)直播平臺數(shù)據(jù)挖掘與行為分析綜述*

      2020-04-27 08:19:40郭淑慧呂欣
      物理學(xué)報 2020年8期
      關(guān)鍵詞:直播間社群主播

      郭淑慧 呂欣

      (國防科技大學(xué)系統(tǒng)工程學(xué)院,長沙 410073)

      隨著移動通信和互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,網(wǎng)絡(luò)直播逐漸成為了新媒體環(huán)境下人們青睞的在線娛樂和信息傳播方式.目前廣泛應(yīng)用于課堂教學(xué)、真人秀、電競賽事、品牌營銷等方面.數(shù)百萬主播與數(shù)億計觀眾的活躍加入和互動,產(chǎn)生了豐富的在線人群行為活動數(shù)據(jù),為開展大規(guī)模人群行為動力學(xué)、平臺內(nèi)容推薦與檢測、在線社群演化等研究提供了豐富的實(shí)驗(yàn)場景.本文通過梳理國內(nèi)外網(wǎng)絡(luò)直播平臺數(shù)據(jù)挖掘與行為分析的相關(guān)研究文獻(xiàn),分析了直播平臺負(fù)載水平、觀眾行為、主播行為以及社群網(wǎng)絡(luò)的特征和變化規(guī)律,并對直播平臺中大規(guī)模人群行為表現(xiàn)出的時空規(guī)律和重尾效應(yīng)進(jìn)行了總結(jié).直播平臺中各種社群網(wǎng)絡(luò)的形成和演化機(jī)制、內(nèi)容推薦與檢測等是未來網(wǎng)絡(luò)直播領(lǐng)域研究的發(fā)展趨勢.

      1 引 言

      網(wǎng)絡(luò)直播是一種新型信息交流方式,可以讓觀眾收看到主播所處場景中正在進(jìn)行的音、視頻實(shí)況,同時觀眾可以通過打賞或發(fā)表評論的方式與主播進(jìn)行互動,相對于傳統(tǒng)信息傳播媒體來說有著互動性強(qiáng)、時空適應(yīng)性強(qiáng)等優(yōu)勢.網(wǎng)絡(luò)直播平臺則是由公司或組織管理的供主播發(fā)布直播以及觀眾收看直播的網(wǎng)站.隨著互聯(lián)網(wǎng)經(jīng)濟(jì)的發(fā)展,網(wǎng)絡(luò)直播日益火爆,斗魚TV、虎牙TV、抖音等網(wǎng)絡(luò)直播平臺在市場中異軍突起,以超低的門檻吸引了大量主播和觀眾,截至2019年6月,我國直播用戶規(guī)模已達(dá)4.33億[1].

      網(wǎng)絡(luò)直播目前的應(yīng)用領(lǐng)域比較廣泛,除了應(yīng)用于娛樂性的真人秀、電競賽事之外,還有課堂教學(xué)[2,3]、品牌營銷[4,5]、傳統(tǒng)文化與工藝技術(shù)傳承[6,7]、政務(wù)會議與庭審過程公開[8,9]等方面.不同領(lǐng)域的網(wǎng)絡(luò)直播和觀眾都會產(chǎn)生大量交互數(shù)據(jù),這些數(shù)據(jù)一方面可以用于挖掘直播平臺的負(fù)載變化模式和用戶參與及交互的內(nèi)在機(jī)制,探究用戶行為和偏好,進(jìn)而對相應(yīng)情境下的大規(guī)模人群行為進(jìn)行模式分析和規(guī)律挖掘[10-17].另一方面還可以基于直播平臺負(fù)載的測量結(jié)果及從中挖掘的用戶行為的特征和偏好,提升網(wǎng)絡(luò)直播平臺內(nèi)容推薦和內(nèi)容檢測水平[18-22].

      本文從國內(nèi)外網(wǎng)絡(luò)直播平臺用戶行為數(shù)據(jù)挖掘的研究入手,對直播平臺負(fù)載水平、觀眾行為、主播行為以及社群網(wǎng)絡(luò)的特征和變化規(guī)律進(jìn)行梳理和總結(jié),并討論網(wǎng)絡(luò)直播平臺研究在當(dāng)前面臨的問題和未來的研究方向.

      2 直播平臺負(fù)載研究

      網(wǎng)絡(luò)直播是通過網(wǎng)絡(luò)直播平臺進(jìn)行實(shí)時信息傳輸?shù)男旅襟w形式.隨著網(wǎng)絡(luò)的發(fā)展和普及,網(wǎng)絡(luò)直播作為一種學(xué)習(xí)、娛樂的便捷資源被人們越來越廣泛地使用.直播平臺負(fù)載的水平差異反映了直播平臺用戶的分布規(guī)律和使用偏好,對直播平臺的負(fù)載研究可以從整體上把握直播平臺的資源消耗與服務(wù)使用情況,對直播平臺優(yōu)化資源配置、提供經(jīng)濟(jì)穩(wěn)定的負(fù)載支持有指導(dǎo)意義.

      目前關(guān)于平臺負(fù)載研究主要是通過統(tǒng)計直播平臺的運(yùn)行負(fù)載,挖掘負(fù)載水平產(chǎn)生規(guī)律性差異的時間因素、空間因素以及其他影響因素,總結(jié)直播平臺情境下的大規(guī)模人群行為偏好和行為特征.

      2.1 時序特征

      受時間節(jié)律的影響,人類行為會在諸多方面不同程度地體現(xiàn)出日內(nèi)效應(yīng)(diurnal effect)、周內(nèi)效應(yīng)(weekly effect)等時序規(guī)律,如金融市場的流動性[23]、人類的情緒積極程度[24]、反應(yīng)靈敏度[25]、器官工作機(jī)能[26]等都會在一天內(nèi)不同時段表現(xiàn)出顯著差異,股市收益率和波動還存在明顯的周內(nèi)效應(yīng)[27].目前對直播平臺的負(fù)載研究大部分集中于從系統(tǒng)帶寬、主播規(guī)模、觀眾數(shù)量、打賞額和評論量等方面的時序變化規(guī)律中挖掘直播平臺負(fù)載的日內(nèi)效應(yīng)、周內(nèi)效應(yīng)和長期規(guī)律等時序特征.

      Veloso等[11]最早根據(jù)巴西某網(wǎng)絡(luò)電視直播平臺的網(wǎng)站日志對負(fù)載的時序特征進(jìn)行了研究.在2002年為期28天的統(tǒng)計中,用戶的訪問模式顯示出了明顯的日內(nèi)效應(yīng)和周內(nèi)效應(yīng),晝夜模式造成凌晨4:00—11:00在線觀眾數(shù)量偏低,峰值和谷值分別在3:00和9:00附近取得;雙休日的平均觀眾數(shù)量明顯高于工作日.盡管該直播平臺的用戶規(guī)模超過69萬、覆蓋65個國家,但受當(dāng)時的網(wǎng)絡(luò)發(fā)展水平限制,平臺使用的帶寬峰值僅僅為80 Mbps.

      隨著Twitch,YouTube Live等專門化網(wǎng)絡(luò)直播平臺的興起,Kaytoue等[28]根據(jù) 2011年末Twitch平臺的直播間數(shù)量和在線觀眾數(shù)量變化對直播平臺負(fù)載的周內(nèi)效應(yīng)進(jìn)行分析,發(fā)現(xiàn)Twitch平臺的雙休日負(fù)載明顯高于工作日(后續(xù)學(xué)者[29,30]也得出了一致結(jié)論),原因是Twitch平臺的主要直播內(nèi)容是電子競技,而大型電子競技的競賽通常在雙休日舉行.Pires和Simon[31]對比了Twitch平臺和YouTube Live平臺在2014年的系統(tǒng)帶寬和直播間數(shù)量發(fā)現(xiàn),兩個平臺的帶寬峰值都超過了1 Tbps,但Twitch平臺的帶寬水平更高,峰值超過了1.6 Tbps.兩個平臺在直播間的數(shù)量在雙休日都明顯高于工作日,但Twitch平臺和YouTube Live的日內(nèi)負(fù)載峰值分別在5:00和18:00附近取得,而且Twitch平臺在日內(nèi)和周內(nèi)負(fù)載變化模式的敏感度均低于YouTube Live.原因是Twitch平臺的開放時間較早,用戶在全球范圍內(nèi)的覆蓋范圍更廣,減弱了晝夜更替造成的時序差異.

      近年來逐漸出現(xiàn)了對國內(nèi)直播平臺負(fù)載的研究,Zhu等[32]通過收集國內(nèi)直播平臺斗魚TV在2016年12月為期14天的直播數(shù)據(jù),發(fā)現(xiàn)觀眾數(shù)量和主播數(shù)量在一天中顯示出幾乎一致的變化規(guī)律,都在21:00—8:00減少,8:00—21:00增加,在晚上9:00—10:00達(dá)到最高水平.Wang等[33]通過分析2016年9月起為期124天內(nèi)的斗魚TV主播開播數(shù)量、觀眾打賞總額和評論量來挖掘斗魚TV平臺負(fù)載的日內(nèi)效應(yīng)和周日效應(yīng),從觀眾的打賞總額、評論量和主播直播次數(shù)、直播時長分別展現(xiàn)觀眾和主播在一天之中的活躍程度變化趨勢.結(jié)果發(fā)現(xiàn)觀眾和主播的活動都表現(xiàn)出很強(qiáng)的晝夜規(guī)律,并且高度同步,任意兩個數(shù)據(jù)系列之間的皮爾遜相關(guān)系數(shù)都高于0.85.但觀眾活動的高峰時段出現(xiàn)在23:00—24:00,主播最活躍的時段是20:00—22:00,說明觀眾的活躍時間存在一定的時滯現(xiàn)象,與之前的研究結(jié)論[32]略有差異.

      總體上說,國內(nèi)外直播平臺負(fù)載在一天之中都呈現(xiàn)“倒N型”[34],直播平臺負(fù)載具有明顯的“日內(nèi)效應(yīng)”[25],負(fù)載水平在一天中呈現(xiàn)降低-升高-降低的循環(huán)模式(如圖1所示).

      圖1 國內(nèi)外直播平臺負(fù)載日內(nèi)效應(yīng)[30,32]Fig.1.The diurnal effects of domestic and foreign live streaming workloads[30,32].

      表1 不同直播平臺的負(fù)載時序特征Table 1.The workload changes of different live streaming platforms.

      但由于直播平臺的直播類型各有側(cè)重,而且直播平臺隨著時間在逐漸發(fā)展,即使是同一直播平臺在不同的統(tǒng)計期內(nèi)表現(xiàn)的平臺負(fù)載時序規(guī)律也不完全相同.多個直播平臺、不同時期的負(fù)載變化時序特征見表1.

      2.2 空間分布特征

      除了分析直播平臺負(fù)載的時序特征之外,部分研究通過分析主播、觀眾和直播平臺服務(wù)器的位置對直播平臺負(fù)載產(chǎn)生的影響來挖掘直播平臺負(fù)載的地理分布特征,進(jìn)而對直播負(fù)載的資源分配及優(yōu)化進(jìn)行指導(dǎo).

      Veloso等[11]對早期網(wǎng)絡(luò)電視直播平臺的觀眾數(shù)量和觀看次數(shù)在所覆蓋區(qū)域間的數(shù)量分布進(jìn)行了統(tǒng)計分析,發(fā)現(xiàn)觀眾數(shù)量和觀看次數(shù)在劃分的地理區(qū)塊之間的分布形式都近似Zipf分布[36]:

      其中參數(shù) r 代表地理區(qū)塊按照觀眾數(shù)量或觀看次數(shù)降序排列的排名,Z(r)則 代表排名為 r 的區(qū)域中的觀眾數(shù)量或者觀看次數(shù),α 的取值分別為1.29和1.49,展現(xiàn)了早期網(wǎng)絡(luò)電視直播的觀眾在地理分布上的不均勻現(xiàn)象.與之相對的,Li等[37]統(tǒng)計分析了PPTV直播頻道的觀眾地理分布熵(viewer geographical entropy)的累積分布函數(shù),發(fā)現(xiàn)大多數(shù)頻道的觀眾地理分布熵超過0.8,顯示了現(xiàn)代網(wǎng)絡(luò)直播平臺觀眾觀看者在地理位置上均勻分布.觀眾地理分布熵形式為

      ek是 直播間 k 的 觀眾地理分布熵,其中 N 是直播間全部觀眾所覆蓋區(qū)域的數(shù)量,pki代 表直播間 k 在區(qū)域 i 的觀眾數(shù)量占全部觀眾數(shù)量的比例.

      Kaytoue等[28]通過統(tǒng)計分析Twitch平臺的主播在不同時區(qū)的分布,表明平臺中的大多數(shù)主播都來自北美、歐洲和東亞,與Twitch平臺的服務(wù)器集中布置在北美、歐洲和亞洲的分布規(guī)律[38]相符合,反映了直播平臺負(fù)載的地理特征對直播平臺服務(wù)器設(shè)置的指導(dǎo)意義.

      Yan等[39]對比了用戶生成視頻、短視頻和直播視頻三種平臺的城市、郊區(qū)及整個區(qū)域的移動網(wǎng)絡(luò)用戶的觀眾地理分布熵,結(jié)果顯示無論市區(qū)、郊區(qū)還是整個區(qū)域,用戶生成視頻的熵都高于其他服務(wù),表明觀看直播的用戶比觀看用戶生成視頻的用戶在空間分布上更不均勻,主要原因是直播內(nèi)容通常耗費(fèi)的流量更多,用戶更傾向于在固定的場所使用WiFi或?qū)拵ЬW(wǎng)絡(luò)而不是移動流量來觀看直播.

      2.3 其他影響因素

      除了時空對直播平臺負(fù)載的影響之外,少量學(xué)者對主要直播電子競技內(nèi)容的直播平臺Twitch、斗魚TV的負(fù)載水平是否受到大型電子競技競賽項(xiàng)目直播的影響進(jìn)行了研究.Kaytoue等[28]通過觀察Twitch平臺在2011年12月29日到2012年1月9日每天的觀眾數(shù)量變化情況,發(fā)現(xiàn)在直播一些重要的電子競技比賽時,觀眾數(shù)量會出現(xiàn)明顯增加,說明了電子競技競賽項(xiàng)目直播對Twitch平臺的負(fù)載有強(qiáng)烈的刺激作用.類似地,Deng等[12]統(tǒng)計了Twitch平臺電子競技競賽項(xiàng)目直播吸引的觀眾占整個平臺觀眾的比例,結(jié)果顯示某些熱門的電子競技競賽項(xiàng)目直播所產(chǎn)生的觀眾數(shù)量能占直播平臺全部觀眾的30%以上,即使是不太流行的電子競技賽事的直播也能吸引大量觀眾,峰值超過全平臺觀眾10%.但Wang等[33]在對斗魚TV觀眾評論數(shù)以及打賞額在2016年為期124天的統(tǒng)計期中的變化中卻并未發(fā)現(xiàn)重大賽事對平臺負(fù)載產(chǎn)生的顯著影響,原因可能是斗魚TV存在大部分娛樂類直播,受電子競技競賽項(xiàng)目直播的影響并不明顯.

      3 觀眾行為分析

      直播平臺內(nèi)可能出現(xiàn)以下的一種或幾種觀眾行為: 選擇直播間進(jìn)行觀看、切換或退出直播間、在直播間中評論或打賞、以及觀眾觀看直播而引發(fā)的行為(如被主播引導(dǎo)購買商品).眾多學(xué)者對直播平臺觀眾行為中的觀看規(guī)律進(jìn)行分析和建模,研究觀眾各種行為以及背后的心理,對于理解用戶參與網(wǎng)絡(luò)直播的原因、提升用戶體驗(yàn)、為用戶提供更有價值的網(wǎng)絡(luò)直播服務(wù)有重要的決策價值.

      已有研究中對觀眾的觀看規(guī)律主要從觀眾的觀看次數(shù)與時長、頻道選擇與切換、觀眾評論與打賞等方面入手,從觀眾的觀看記錄中提取直播平臺中觀眾的各種觀看行為,挖掘其中觀眾的偏好及心理動機(jī),進(jìn)一步開展直播平臺觀眾的行為動力學(xué)建模和社群網(wǎng)絡(luò)演化研究.

      3.1 觀看次數(shù)與時長

      眾多研究結(jié)果表明,直播平臺內(nèi)觀眾的觀看時長、觀看次數(shù)呈現(xiàn)一定的重尾效應(yīng),即直播平臺中存在大量觀看次數(shù)很少、觀看時間非常短的用戶,但同時還有極少量用戶觀看直播的次數(shù)很高、觀看時長相對非常長.

      Veloso等[11]于2002年的研究結(jié)果顯示早期直播平臺中觀眾觀看次數(shù)分布近似Zipf分布,其中參數(shù) r 代表的是按照觀看次數(shù)降序排列的觀眾排名,Z(r)則 代表排名為 r 的觀眾的觀看次數(shù),參數(shù)α的取值為0.719;Li等[37]于2016年發(fā)現(xiàn)PPTV平臺內(nèi)觀眾觀看次數(shù)分布更符合互補(bǔ)Weibull分布而不是冪律分布,累計概率分布函數(shù)形式為

      其中參數(shù) c 為拉伸因子,x0為常數(shù)參數(shù).

      Sripanidkulchai等[40]則于2004年對早期直播平臺觀看時長分布進(jìn)行了探索,結(jié)果顯示不同直播間內(nèi)觀眾的觀看時長分布均近似Zipf分布,其中參數(shù) r 代表的是按照觀看時長降序排列的觀眾排名,Z(r)則 代表排名為 r 的觀眾的觀看時長,參數(shù)α的取值在0.7—2.0之間.而Tang等[41]于2006年發(fā)現(xiàn)CCTV多個直播頻道的觀眾觀看時長的概率密度函數(shù)形式符合對數(shù)正態(tài)分布:

      其中 f(x)是 觀看時長為 x 分鐘的概率密度函數(shù)值,μ和σ 的取值均在 4—5和1—2之間.Li等[37]于2016年對PPTV中觀眾觀看時長分布的概率密度函數(shù)進(jìn)行了研究,結(jié)果顯示觀眾觀看時長的概率密度函數(shù)形式為混合指數(shù)分布:

      其中 f(x)是 觀看時長為 x 分鐘的概率密度函數(shù)值,μi和αi是 第 i 個 指數(shù)分布的均值和權(quán)重,

      特別地,Tang等[41]通過分析觀眾觀看直播的時長記錄,發(fā)現(xiàn)觀眾已經(jīng)觀看直播的時長與繼續(xù)保持觀看的時長存在顯著的正相關(guān)關(guān)系,即觀眾如果已經(jīng)花費(fèi)了比其他觀眾長的時間觀看直播,則會更傾向于比其他觀眾花費(fèi)更長的時間繼續(xù)觀看直播.

      3.2 頻道選擇與切換行為規(guī)律

      如果在觀看直播的過程中發(fā)生網(wǎng)絡(luò)故障、主播關(guān)閉直播、不感興趣等情況,觀眾就有可能對當(dāng)前直播間進(jìn)行重新連線、切換到其他直播間或者直接退出直播平臺.目前已有相關(guān)研究對觀眾在觀看直播中的重連、切換、退出等進(jìn)行統(tǒng)計建模與系統(tǒng)分析,展現(xiàn)直播平臺內(nèi)觀眾流動的動態(tài)過程和內(nèi)在機(jī)理.

      Li等[37]對客觀原因造成直播中斷時的觀眾重連行為進(jìn)行了研究.由于觀看出現(xiàn)中斷的原因可能是網(wǎng)絡(luò)連接失敗等客觀問題,也可能單純是由于觀眾的興趣發(fā)生變化而主動退出直播間,所以作者首先定義了由客觀問題造成中斷的直播段特征,是觀眾在某直播間內(nèi)發(fā)出觀看請求之后的一小段時間之內(nèi)對該直播間重復(fù)發(fā)出了觀看請求.進(jìn)一步分別統(tǒng)計了觀眾對直播中斷次數(shù)的容忍程度和放棄觀看的概率分布,結(jié)果顯示隨著直播中斷次數(shù)的增加,觀眾放棄的概率遞增,但增幅在逐次減小.在移動網(wǎng)絡(luò)下觀看直播的觀眾在直播中斷時的耐心程度比在WiFi或者寬帶環(huán)境下的更高,在遇到2次連續(xù)的直播中斷時,放棄觀看的概率小于50%,甚至在某些情況下觀眾能忍受10次連續(xù)的直播中斷.

      Nascimento等[42]對Twitch平臺中的觀眾切換行為進(jìn)行了建模分析.作者首先定義了直播間共存在三種狀態(tài),分別是直播中、直播即將結(jié)束和直播結(jié)束(如圖2所示).由于主播下播之后直播間內(nèi)的觀眾并不會被強(qiáng)制清空,所以會出現(xiàn)主播已經(jīng)下播但觀眾數(shù)量不為0的情況.直播間三種狀態(tài)中的“直播即將結(jié)束”包含了主播即將關(guān)閉直播以及關(guān)閉直播后觀眾數(shù)量仍保持一定水平時期,“直播結(jié)束”指的是直播間內(nèi)觀眾數(shù)量非常低甚至為0的狀態(tài).

      圖2 直播間狀態(tài)演化圖[42]Fig.2.The graph of live streaming channel's state dynamics[42].

      由直播間的三種狀態(tài)任意組合可以歸納出觀眾切換行為共包含9種類型,通過統(tǒng)計觀眾不同類型切換行為的比例發(fā)現(xiàn)觀眾在頻道之間的切換行為中,大約20%的ON-ON切換(即從一個正在直播的直播間切換到另一個正在直播的直播間)和30%的OFF-OFF切換(即從一個未開播的直播間切換到另一個未開播的直播間)持續(xù)不到1 min,表明觀眾進(jìn)入直播間時并不事先知道他們想觀看的內(nèi)容.77%的切換行為是ON-X(X可能是ON或者OFF),這說明大部分的直播間切換是由于觀眾對切換前直播間的內(nèi)容不滿意.通過對比觀眾在ON-ON切換前后的觀看時長的分布,發(fā)現(xiàn)觀眾在切換后的直播間會觀看更長的時間,同樣驗(yàn)證了大部分觀眾是主動退出了之前不滿意的直播間.由于觀眾對直播間選擇的隨意性較強(qiáng)、滿意度較低,部分研究[18-20]設(shè)計了針對直播平臺的內(nèi)容推薦算法及系統(tǒng),為觀眾選擇直播頻道進(jìn)行個性化推薦.

      Li等[37]對直播節(jié)目中觀眾的進(jìn)入和退出過程進(jìn)行了建模和分析.通過統(tǒng)計直播過程中觀眾加入和離開的速率變化,發(fā)現(xiàn)在直播節(jié)目開始之前的一小段時間內(nèi)會出現(xiàn)觀眾大量進(jìn)入和立刻退出的現(xiàn)象,而且觀眾的加入和離開速率在很大程度上依賴于某些子事件的發(fā)生.考慮到以上因素,作者使用高斯徑向基函數(shù)(RBFs)之和來擬合直播過程中觀眾加入和離開行為,較低的RMSE值表明模型與實(shí)際過程相符.形如

      其中 Ti是 第 i 個 子事件發(fā)生的時刻,ai是 子事件i的影響權(quán)重.

      3.3 評論與打賞行為分析

      觀眾向直播間贈送虛擬禮物被稱之為“打賞”,已有研究對國內(nèi)直播平臺內(nèi)的打賞金額分布規(guī)律進(jìn)行挖掘.Zhao等[43]統(tǒng)計了映客平臺內(nèi)某些主播收到的打賞,結(jié)果顯示觀眾打賞的金額服從長尾分布.也就是說,極少比例的觀眾貢獻(xiàn)了大部分打賞,貢獻(xiàn)排名前20名的觀眾的打賞額占所有觀眾打賞的90%以上.相似地,Zhu等[32]通過統(tǒng)計斗魚TV中打賞額在主播之間的分布情況,發(fā)現(xiàn)打賞額在主播之間分布的冪律性,幾個最受歡迎的主播擁有非常高數(shù)量的打賞,其他頻道分享的很少,而且僅2.7%的打賞觀眾貢獻(xiàn)了80.2%的打賞額.蘭榮亨等[44]則根據(jù)觀眾的觀看、評論和打賞記錄對觀眾群體行為進(jìn)行特征構(gòu)建,成功對不同特征的觀眾群體進(jìn)行了聚類區(qū)分.

      Wang等[33]對打賞行為的時間規(guī)律進(jìn)行分析,發(fā)現(xiàn)不論是第一次打賞出現(xiàn)的時間還是打賞間隔時間的分布形式都高度符合Weibull分布,其累計分布函數(shù)形為

      其中 λ和k 是分布的尺度和形狀因子.擬合結(jié)果顯示兩個分布的形狀因子 k 均小于1,即說明直播平臺中主播已經(jīng)等待打賞的時間越長,那么后續(xù)打賞到來所需的等待時間越長.

      觀眾評論是觀眾利用文字和表情符號在直播間中進(jìn)行交流的一種方式,目前對觀眾評論的研究主要是對評論的情感、特征、觀眾交互進(jìn)行分析.Poyane[45]對Twitch平臺部分直播Dota2的直播間內(nèi)的觀眾評論文本數(shù)據(jù)進(jìn)行了情感分析,發(fā)現(xiàn)隨著直播間觀眾規(guī)模的增加,觀眾評論的消極色彩會相應(yīng)增強(qiáng).類似地,Nematzadeh等[46]也發(fā)現(xiàn)隨著觀眾數(shù)量的增加,評論區(qū)會由正常對話向過載的、不和諧對話轉(zhuǎn)變.

      Olejniczak[47]對Twitch平臺觀眾的評論內(nèi)容從語句特征上進(jìn)行了分析.發(fā)現(xiàn)觀眾更傾向于使用大量的表情符號和重復(fù)信息來表達(dá)態(tài)度,使用新穎的詞匯和獨(dú)特的表情符號來力求與眾不同.由于評論區(qū)只顯示最新的幾條評論內(nèi)容,評論長度會隨著觀眾數(shù)量增加而縮短.Li等[33]發(fā)現(xiàn)了觀眾評論與打賞的周內(nèi)模式存在很強(qiáng)的相關(guān)性(皮爾森相關(guān)系數(shù)超過0.85),且評論與視頻內(nèi)容同步性很強(qiáng),提出了根據(jù)評論情感標(biāo)注直播亮點(diǎn)的算法[48].周鈺淇[22]則提出了根據(jù)評論內(nèi)容對直播內(nèi)容是否合法進(jìn)行檢測的深度學(xué)習(xí)算法.

      4 主播行為分析

      直播平臺中的主播行為研究主要集中在主播的直播次數(shù)、直播時長以及流行度排名與預(yù)測三方面.通過分析主播群體獨(dú)特的行為模式,挖掘直播平臺內(nèi)主播直播規(guī)律和活動特征,對進(jìn)一步開展直播平臺內(nèi)大規(guī)模人群行為分析和研究、優(yōu)化直播平臺系統(tǒng)建設(shè)有重要意義.

      4.1 直播次數(shù)

      國內(nèi)外直播平臺的主播直播次數(shù)普遍呈現(xiàn)出一定程度的冪律分布特點(diǎn),即直播次數(shù)較少的主播占了很大部分,直播次數(shù)多的主播占比很少[14,32,35,42].

      對國外直播平臺的主播直播次數(shù)規(guī)律的研究中,Stohr等[35]挖掘Younow平臺的主播直播數(shù)據(jù)發(fā)現(xiàn),超過40%的主播只直播了一次,約10%的主播在一周內(nèi)直播了7次以上.這表明,有一小部分高度活躍主播愿意每天直播多次,而大多數(shù)主播僅進(jìn)行少量的直播.類似地,Nascimento等[42]發(fā)現(xiàn)Twitch平臺的少部分專業(yè)主播團(tuán)隊(duì)直播的次數(shù)達(dá)到每天19次,而大量主播(40%—50%)每天直播次數(shù)不超過1次,與Jia等[14]的結(jié)論基本一致.

      對國內(nèi)直播平臺的主播直播次數(shù)規(guī)律的研究中,Zhu等[32]通過統(tǒng)計14天內(nèi)斗魚TV主播開播天數(shù)的分布,發(fā)現(xiàn)約63%的主播每周直播的天數(shù)不超過1天,只有14%的主播在統(tǒng)計期中至少直播了一半的時間.大多數(shù)主播并不經(jīng)常直播,但整個平臺每天約有4%的主播會進(jìn)行直播.

      4.2 直播時長

      眾多研究表明主播在直播時長方面表現(xiàn)出重尾分布規(guī)律.Zhu等[32]通過收集斗魚TV主播在為期14天統(tǒng)計期內(nèi)的所有開播記錄來統(tǒng)計主播直播時長分布,發(fā)現(xiàn)70%以上的直播時長都小于200 min,但存在極少比例(小于1%)的主播直播時長達(dá)到1000 min.統(tǒng)計結(jié)果顯示斗魚TV主播的直播時長中位數(shù)是90 min,比Twitch平臺的45 min[28]更長,原因是相對于Twitch平臺主要針對游戲內(nèi)容進(jìn)行直播,斗魚TV的直播類型更多樣,許多直播間播放已經(jīng)制作好的視頻或大型活動,提高了直播的持續(xù)時間.類似地,對Younow[35]和Twitch平臺[14,30,42,49]的主播直播時長特征的研究結(jié)果均顯示主播直播時長分布呈現(xiàn)重尾效應(yīng).

      研究中通常以直播平臺內(nèi)所有主播直播時長的中位數(shù)作為衡量該直播平臺主播直播時長的指標(biāo),由于直播內(nèi)容和針對觀眾等方面的差異,各個直播平臺的直播時長中位數(shù)不盡相同.即使是相同的直播平臺,不同直播類別的直播時長中位數(shù)也會有一定的變化.部分結(jié)論總結(jié)如表2所列.

      表2 各個網(wǎng)絡(luò)直播平臺的直播時長中位數(shù)Table 2.Median live streaming duration of each live streaming platform.

      4.3 流行度排名和預(yù)測

      主播的“流行度”指的是主播吸引觀眾的能力.通過某些衡量指標(biāo)對主播吸引力進(jìn)行排名,排名越靠前則說明主播吸引觀眾的能力越強(qiáng)、主播流行度越高.這一排名在體現(xiàn)主播在直播平臺中的地位和水平的同時也反映出了觀眾的訪問模式.目前的研究中通常以粉絲或觀眾數(shù)量、打賞金額、評論數(shù)量作為衡量指標(biāo)來對直播平臺主播的流行度進(jìn)行排序.

      大量對主播流行度排名的研究顯示,主播流行度存在一定的重尾分布規(guī)律[12,14,30,35,40,43,45,49,50].Pires等[31,50]研究發(fā)現(xiàn)Twitch平臺的觀眾數(shù)量分布符合Zipf分布,且參數(shù) α 的值在1.0—1.5之間變動,說明大量觀眾在很少幾個直播間中聚集,少數(shù)主播吸引了絕大部分觀眾.Stohr等[35]對Younow平臺觀眾數(shù)量分布的研究也得出了類似的結(jié)論.但Zhang和Liu[49]則發(fā)現(xiàn)Twitch平臺的觀眾數(shù)量分布形式不是標(biāo)準(zhǔn)的冪律分布.由于著名主播通過直播吸引了極大比例的觀眾觀看,觀眾數(shù)量分布的尾部出現(xiàn)了明顯的下降,更符合Gamma分布或者Weibull分布的特點(diǎn),與Wang等[33]對斗魚TV內(nèi)評論數(shù)量和打賞金額分布形式一致.Arnett等[51]則對主播在社交平臺上的公開活動對主播流行度是否產(chǎn)生影響進(jìn)行了研究,并沒有發(fā)現(xiàn)主播的觀眾和粉絲數(shù)量變動與在社交平臺上的活動存在統(tǒng)計學(xué)上顯著的相關(guān)性.

      對主播流行度預(yù)測的研究中,Kaytoue等[28]分析線上內(nèi)容發(fā)布后短期和長期的流行度相關(guān)性,提出線性回歸模型,以此來通過前期觀眾數(shù)較準(zhǔn)確地預(yù)測后期觀眾數(shù).還提出了一種流行度的定義(不僅僅只比較在線人數(shù),還考慮上線時間的早晚等因素),并以此對主播進(jìn)行新的排序.基于主播流行度預(yù)測線性回歸模型,Netzorg等[52]提出了基于主播行為的主播未來流行度預(yù)測模型,發(fā)現(xiàn)主播的努力行為(如發(fā)布更多直播、定期直播、在其他社交媒體賬號上發(fā)布直播信息等)在提升主播流行度方面是有效的,而且職業(yè)主播比業(yè)余主播更受歡迎.類似地,Szabo等[53]用瀏覽次數(shù)代表視頻的流行度,從前期數(shù)據(jù)預(yù)測視頻未來長期的流行度.Zhu等[32]對直播間出現(xiàn)的總觀眾數(shù)和禮物總價值進(jìn)行線性相關(guān)分析,計算得出直播間內(nèi)觀眾總數(shù)和禮物總價相關(guān)系數(shù)是0.6421(p<0.001).Jia等[14]計算得出直播間在線人數(shù)和主播直播次數(shù)的相關(guān)系數(shù)也較高,即直播次數(shù)多的主播流行度可能更大.

      5 社群網(wǎng)絡(luò)分析

      網(wǎng)絡(luò)直播吸引了大量的主播與觀眾參與,直播平臺中大規(guī)模人群交互形成了很多獨(dú)具特色的社群現(xiàn)象.通過統(tǒng)計分析直播用戶的使用特征,識別和發(fā)現(xiàn)直播平臺內(nèi)的社群及社群網(wǎng)絡(luò),進(jìn)一步分析直播社群網(wǎng)絡(luò)的節(jié)點(diǎn)屬性、結(jié)構(gòu)特征以及形成、演化過程,開展對直播平臺大規(guī)模人群參與、流動及交互的規(guī)律挖掘和動力學(xué)研究,對信息傳播、網(wǎng)絡(luò)營銷、輿情監(jiān)測引導(dǎo)等策略的制定等都有參考和指導(dǎo)意義.

      5.1 社群發(fā)現(xiàn)與成員識別

      直播平臺具有的社交屬性使得其中存在大規(guī)模人群的交互關(guān)系,從而形成了多種類型的用戶關(guān)系復(fù)雜網(wǎng)絡(luò).而直播平臺用戶網(wǎng)絡(luò)的節(jié)點(diǎn)屬性、結(jié)構(gòu)和形成演變機(jī)制則體現(xiàn)了直播平臺情景下大規(guī)模人群活動的交互特征和選擇偏好.部分研究對用戶觀看、關(guān)注、評論、打賞等關(guān)系網(wǎng)絡(luò)中的社區(qū)發(fā)現(xiàn)[54]方法進(jìn)行了探索,通過識別用戶關(guān)系網(wǎng)絡(luò)中相似用戶形成的社區(qū)為直播平臺用戶關(guān)系網(wǎng)絡(luò)發(fā)展動態(tài)的研究奠定基礎(chǔ).

      Churchill和Xu[55]于2016年發(fā)表了首個對直播平臺用戶社區(qū)的研究并提出了社區(qū)發(fā)現(xiàn)和成員識別算法.該社區(qū)發(fā)現(xiàn)算法是通過可視化主播共享觀眾關(guān)系網(wǎng)絡(luò)實(shí)現(xiàn)主播社區(qū)識別.作者首先收集了游戲直播平臺Twitch的主播信息,包括主播直播的游戲類型及粉絲列表.進(jìn)一步地,作者構(gòu)建了以主播為節(jié)點(diǎn),共享觀眾關(guān)系為邊的主播關(guān)系網(wǎng)絡(luò),其中節(jié)點(diǎn)大小代表了主播擁有的粉絲數(shù)量,顏色代表主播的直播游戲類型,主播之間共享的粉絲數(shù)量越多,那么連邊越粗、節(jié)點(diǎn)之間的距離越短.通過可視化主播關(guān)系網(wǎng)絡(luò),根據(jù)節(jié)點(diǎn)顏色和距離的分布直觀分析主播之間聯(lián)系的緊密程度,實(shí)現(xiàn)主播關(guān)系網(wǎng)絡(luò)中的社區(qū)規(guī)模和結(jié)構(gòu)的識別.

      作者提出的社區(qū)成員識別算法則是根據(jù)主播與主播之間的關(guān)注關(guān)系,自動識別出社區(qū)成員.作者首先人工挑選出實(shí)際屬于Twitch平臺三大主流社區(qū)[56]的四位主播作為種子節(jié)點(diǎn),種子節(jié)點(diǎn)的關(guān)注者中粉絲量在28000以上的則被程序自動判定與該主播所屬同一社區(qū),從而實(shí)現(xiàn)了對主播所在社區(qū)成員的識別和發(fā)現(xiàn).識別結(jié)果與Gephi中的模塊化識別結(jié)果基本一致,說明了社區(qū)發(fā)現(xiàn)算法的有效性.類似地,Lykousas等[57]通過設(shè)定違規(guī)用戶作為種子節(jié)點(diǎn),從Live.me平臺和Loops Live平臺的觀看關(guān)系網(wǎng)絡(luò)中自動判定用戶是否違規(guī),實(shí)現(xiàn)了違規(guī)用戶所在社區(qū)的成員發(fā)現(xiàn).

      5.2 社群網(wǎng)絡(luò)節(jié)點(diǎn)重要性

      前文總結(jié)了直播平臺中觀眾數(shù)量、評論量和打賞金額在主播間的分布普遍呈現(xiàn)出重尾效應(yīng),說明以主播為節(jié)點(diǎn),以觀眾觀看、評論或打賞為節(jié)點(diǎn)重要性衡量指標(biāo)的網(wǎng)絡(luò)中,存在少量中心節(jié)點(diǎn),它們在整個主播社群網(wǎng)絡(luò)中的地位和重要性非常高.但由于網(wǎng)絡(luò)直播發(fā)展的時間較短,目前尚未出現(xiàn)對直播平臺主播社群網(wǎng)絡(luò)的節(jié)點(diǎn)性質(zhì)進(jìn)行專門分析的文獻(xiàn).

      在觀眾與主播共同形成的社群網(wǎng)絡(luò)中,由于觀眾對主播有天然的選擇權(quán)利,社群中的觀眾成員對主播的喜愛和認(rèn)可促使主播成為了社群的意見領(lǐng)袖和核心,研究普遍認(rèn)為主播促進(jìn)了整個社群建立和發(fā)展,對社群的發(fā)展方向起決定作用.William等[58]對Twitch平臺的主播和觀眾進(jìn)行訪談,發(fā)現(xiàn)直播間的社群氛圍折射了主播的品質(zhì)和態(tài)度,即主播成為了整個直播間的意見領(lǐng)袖.而且直播間內(nèi)的核心成員發(fā)揮吸引其他參與者、促進(jìn)互動以及緩和聊天的重要作用以建立社群,也即社群中的意見領(lǐng)袖促進(jìn)了整個社群建立和發(fā)展.莊慶玲和周麗[59]以斗魚游戲主播為例研究了彈幕式互動直播平臺主播和觀眾之間形成的社群,發(fā)現(xiàn)在直播間的互動中主播會成為意見領(lǐng)袖,與追隨者也就是觀眾基本屬于同一階層,擁有共同的興趣但意見領(lǐng)袖對該領(lǐng)域有更全面和深入的了解,依靠平臺進(jìn)行有償信息交流.

      5.3 社群網(wǎng)絡(luò)結(jié)構(gòu)特征

      研究復(fù)雜系統(tǒng)內(nèi)的社群網(wǎng)絡(luò)結(jié)構(gòu)有助于理解或預(yù)測系統(tǒng)的表現(xiàn)[60],少量研究對直播社群網(wǎng)絡(luò)的結(jié)構(gòu)特征進(jìn)行了描述,通過社群網(wǎng)絡(luò)的結(jié)構(gòu)性質(zhì)反應(yīng)直播社群的交互特點(diǎn),以解釋直播平臺中的社群表現(xiàn).

      Churchill和Xu[55]對Twitch平臺主播社群的網(wǎng)絡(luò)結(jié)構(gòu)性質(zhì)進(jìn)行了研究.發(fā)現(xiàn)主播直播的游戲相同或相似,那么他們擁有的粉絲相似度也很高,體現(xiàn)了觀眾對直播類型的偏好性.而且通過識別Twitch平臺中三大主流社區(qū)的成員,發(fā)現(xiàn)社區(qū)規(guī)模大小與直播難度相關(guān),成為該類主播的難度越大則該類主播數(shù)量越少.Lykousas等[57]通過對直播平臺違規(guī)用戶所形成的觀看網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行統(tǒng)計分析,對網(wǎng)絡(luò)的平均度、密度和相互性進(jìn)行分析發(fā)現(xiàn),違規(guī)用戶網(wǎng)絡(luò)的互惠性很差(reciprocity<0.15),即違規(guī)用戶社群網(wǎng)絡(luò)中節(jié)點(diǎn)與節(jié)點(diǎn)之間在互惠互利方面的表現(xiàn)并不好.

      6 討論與展望

      綜上所述,網(wǎng)絡(luò)視頻直播用戶行為挖掘的國內(nèi)外相關(guān)研究目前已取得一定的進(jìn)展.從大量相關(guān)文獻(xiàn)發(fā)現(xiàn),直播平臺負(fù)載、觀眾行為、主播行為和社群網(wǎng)絡(luò)是本領(lǐng)域的研究重點(diǎn).其中,直播平臺負(fù)載水平的變化模式體現(xiàn)出了明顯的日內(nèi)效應(yīng)和周內(nèi)效應(yīng),大規(guī)模人類行為在直播平臺中體現(xiàn)出明顯的重尾特征,如觀眾觀看次數(shù)與時長、打賞額和評論量、主播直播次數(shù)和時長、吸引觀眾的能力等分布均從不同程度上符合重尾分布.說明直播平臺內(nèi)人群分布的異質(zhì)性很強(qiáng),可以據(jù)此對直播平臺的經(jīng)營模式如用戶(觀眾、主播)激勵模式、虛擬禮物打賞機(jī)制等進(jìn)一步優(yōu)化.網(wǎng)絡(luò)直播平臺中大規(guī)模人群交互形成了多種用戶社群網(wǎng)絡(luò),識別用戶社群和分析社群網(wǎng)絡(luò)的結(jié)構(gòu)和屬性對優(yōu)化直播平臺的發(fā)展和應(yīng)用有重要意義.

      由于網(wǎng)絡(luò)直播以及相關(guān)研究發(fā)展的時間尚且較短,對網(wǎng)絡(luò)直播的研究廣度和深度有待進(jìn)一步探索.從研究主題發(fā)展軌跡和當(dāng)前研究重點(diǎn)可以預(yù)測,挖掘直播平臺中各種社群網(wǎng)絡(luò)的形成和演化機(jī)制、設(shè)計針對直播平臺的內(nèi)容推薦和檢測算法等是網(wǎng)絡(luò)直播領(lǐng)域研究的未來發(fā)展趨勢.

      猜你喜歡
      直播間社群主播
      “羲和號”開直播間
      我們的直播間
      第一次做小主播
      小鬼進(jìn)軍直播間
      進(jìn)軍營直播間
      社群短命七宗罪
      我是小主播
      我是小主播
      我是小主播
      母嬰電商的社群玩法
      张掖市| 皮山县| 施秉县| 松阳县| 延川县| 新源县| 东乡县| 定远县| 交口县| 方山县| 灵川县| 昌吉市| 乾安县| 文山县| 巧家县| 三明市| 阳山县| 衡山县| 张家港市| 高唐县| 泸州市| 会泽县| 安达市| 潼关县| 寻乌县| 金沙县| 林州市| 邯郸市| 安远县| 建德市| 琼中| 临颍县| 师宗县| 津南区| 阜康市| 开鲁县| 林西县| 佛冈县| 老河口市| 清水河县| 运城市|