檀杉
(國家新聞出版廣電總局五五四臺,河南滎陽450100)
大數(shù)據(jù)技術在廣電領域的應用探索
檀杉
(國家新聞出版廣電總局五五四臺,河南滎陽450100)
探討了大數(shù)據(jù)的概念,分析了大數(shù)據(jù)技術的構成,研究了廣電領域中大數(shù)據(jù)技術的應用。
大數(shù)據(jù)技術;廣電領域;應用
從大數(shù)據(jù)這一概念來看,它不斷演進和變化,具體來講,不能通過常規(guī)數(shù)據(jù)庫管理技術和軟件工具來完成處理,它需要采用一種新的處理方式并在特定時間內進行相應的采集、處理、儲存、管理以及分析等,以此來幫助企業(yè)實現(xiàn)經(jīng)營決策的多樣化,實現(xiàn)長遠穩(wěn)定發(fā)展。
大數(shù)據(jù)是隨著時代發(fā)展而出現(xiàn)的一種時代性趨勢,它指的是難以在特定時間內采用傳統(tǒng)數(shù)據(jù)庫軟件工具來完成對相應內容的抓取、管理以及處理的數(shù)據(jù)集合。這一概念形成經(jīng)歷了較長一段時間的探討和總結,數(shù)據(jù)量的增多必然要有一個相應的技術形式來實現(xiàn)對其高效化的處理,行業(yè)專家提出了云存儲解決方案,并且也隨之出現(xiàn)了云計算解決方案,但是在當前大數(shù)據(jù)愈加明顯的趨勢下,大數(shù)據(jù)開始受到了業(yè)內的普遍關注。
2.1 大數(shù)據(jù)平臺構建技術分析
大數(shù)據(jù)平臺構建技術并不是單一存在的,它涉及到諸多技術,例如云計算技術中的分布式文件系統(tǒng)技術、分布式數(shù)據(jù)庫技術等,其中很多是發(fā)揮基礎作用而存在的[1]。
1)分布式文件系統(tǒng)技術。服務器的大量存在可以滿足大數(shù)據(jù)存儲的基本要求,由此它的整體存儲能力也就得到了有效改善。利用分布式存儲方式來完成對海量數(shù)據(jù)的存儲管理,進而提供一個超大規(guī)模的文件存儲能力,同時按照冗余存儲的形式來確保數(shù)據(jù)存儲的可靠性和安全性。目前較為常見的分布式文件系統(tǒng)有Lustre、Hadoop、MogileFS、FreeNAS等。
2)分布式數(shù)據(jù)庫技術。這種技術形式是數(shù)據(jù)庫技術和網(wǎng)絡技術相融合的體現(xiàn),主要是存儲海量數(shù)據(jù)的。從實際運用來看,它的核心技術主要遵循了CAP定理,而且當前分布式數(shù)據(jù)庫技術也只保存了傳統(tǒng)數(shù)據(jù)庫的部分特性,因此,它的核心定位在鍵值對的快速存取中。目前較為常見的開源分布式數(shù)據(jù)庫平臺有Hbase、MongoDB等。
3)大數(shù)據(jù)處理技術形式。在實際運用中,大數(shù)據(jù)技術在多個領域中都有明顯體現(xiàn)。它主要涉及到三種基本類型,即批處理和分析、近實時分析以及實時流處理。
2.2 大數(shù)據(jù)挖掘技術分析
大數(shù)據(jù)挖掘技術是大數(shù)據(jù)技術的核心,它主要涉及到數(shù)據(jù)挖掘技術、數(shù)據(jù)分析技術以及數(shù)據(jù)倉庫技術三部分[2]。
1)大數(shù)據(jù)挖掘技術。這種技術在實際運用中一般是以分布式計算平臺為基礎存在的,在此基礎上完成對海量數(shù)據(jù)的挖掘算法,并為下一步的數(shù)據(jù)分析提供支持。它把傳統(tǒng)的數(shù)據(jù)挖掘算法進行有機整合后,按照底層計算平臺的要求進行并行化處理,特殊情況還可以進行適當?shù)暮喕?,從而盡可能滿足底層平臺的運行需求。
2)大數(shù)據(jù)分析技術。這種技術的運行基礎是在數(shù)據(jù)存儲、數(shù)據(jù)管理以及處理技術基礎之上,例如在實際中常見的文件屬性分析技術、日志分析技術、自然語言處理技術以及文本情感分析技術等。
3)數(shù)據(jù)倉庫技術。這種技術是把所搜集到的數(shù)據(jù)信息進行目的性處理,具體來講就是把搜集到的數(shù)據(jù)信息轉變?yōu)橛袃r值的分析和報表等應用程序中的信息,同時還可以通過多步進程來完成處理和分析等。這些進程包含數(shù)據(jù)信息的收集、數(shù)據(jù)信息的凈化以及數(shù)據(jù)信息的存儲等。
3.1 系統(tǒng)運行維護方面
在廣電領域中,傳統(tǒng)的廣播模式是制作、播出和存儲相互分開的,這樣的好處是可以第一時間發(fā)現(xiàn)問題所在,而當前采用的數(shù)字化模式,一旦出現(xiàn)異常就很難第一時間準確確定問題的發(fā)生位置,因此,基于這種形勢就可以實行以大數(shù)據(jù)為基礎的運維管理系統(tǒng),這樣可以實時化對整個系統(tǒng)的運行狀態(tài)進行檢查和分析,包括對系統(tǒng)設備運行性能的趨勢分析、系統(tǒng)設備負載能力分析,從而可以及時發(fā)現(xiàn)故障所在,以便于采取有效措施實現(xiàn)系統(tǒng)運行的穩(wěn)定可靠,保證節(jié)目的正常播出[3]。
3.2 商業(yè)運營數(shù)據(jù)分析方面
在大數(shù)據(jù)技術的應用下,廣播單位可以準確獲得用戶的收視場景、收視習慣以及收視偏好等信息,進而根據(jù)這些數(shù)據(jù)有針對性地投放內容,滿足用戶的收視需求。此外,在網(wǎng)絡視頻方面,采用大數(shù)據(jù)技術,一方面可以得到收視用戶的數(shù)量、收視時長、收視次數(shù)以及活躍率等的信息,另一方面還可以搜索引擎監(jiān)測、微博傳播監(jiān)測等的網(wǎng)絡維護,通過這些信息的獲得可以有效指導實際業(yè)務運營工作。
3.3 用戶行為數(shù)據(jù)分析方面
首先,在廣電網(wǎng)絡方面,它的核心數(shù)據(jù)信息主要從電視以及和用戶進行“交流”的雙向網(wǎng)絡中獲得,但是,當前對于用戶收視數(shù)據(jù)信息進行采集的廣電網(wǎng)絡少之又少,對于數(shù)據(jù)信息的采集和分析基本上是以采樣模式為主,這樣導致獲得的數(shù)據(jù)信息并不是真實的,很難準確反映用戶收視的基本情況。其次,現(xiàn)階段隨著移動智能設備的增多,很多用戶會通過手機、電腦等設備來觀看視頻,而這種行為所產(chǎn)生的收視數(shù)據(jù)并沒有納入到廣電系統(tǒng)的信息搜集系統(tǒng)中[4]?;诖耍瑢τ趶V電系統(tǒng)的數(shù)據(jù)分析來說,就不能僅僅局限于電視數(shù)據(jù),還要跟上時代步伐,重視網(wǎng)絡收視數(shù)據(jù)的搜集,從而實現(xiàn)多元數(shù)據(jù)的有機融合,這樣可以保證對用戶收視行為的準確分析。
在大數(shù)據(jù)背景下,廣電部門如何實現(xiàn)對海量收視數(shù)據(jù)的搜集和分析逐漸成為了廣電部門的重點工作。采用大數(shù)據(jù)技術,可以實現(xiàn)用戶收視數(shù)據(jù)的有機整合,把握用戶收視的習慣和規(guī)律,實現(xiàn)廣播節(jié)目和內容的針對性投放,從而穩(wěn)定客戶群體,實現(xiàn)自身長遠發(fā)展。
[1]崔靜.廣電行業(yè)中大數(shù)據(jù)的應用探索[J].數(shù)字傳媒研究,2016(5): 45-47.
[2]王巨森.大數(shù)據(jù)技術在廣電領域的應用探索[J].網(wǎng)絡安全技術與應用,2016(2):9-10.
[3]宋文娟.淺談大數(shù)據(jù)技術及在廣電系統(tǒng)中的應用[J].遼寧廣播電視技術,2014(4):13-15.
[4]石蓉蓉.論大數(shù)據(jù)在廣電系統(tǒng)中的應用——基于技術層面的思考[J].電視研究,2015(6):55-57.
(編輯:賈娟)
App lication of Big Data Technology in the Field of Radio and Television
Tan Bin
(554 Radio Station of State Adm inistration of Press,Publication,Radio,Film and Television of the Peop le's Republic of China,Xiangyang Henan 450100)
This paper discusses the conceptof big data,analyzes the composition ofbig data technology,and studies the application of big data technology in the field of radio and television.
big data technology;radio and television field;application
TP311.13
A
2095-0748(2016)23-0079-02
10.16525/j.cnki.14-1362/n.2016.23.37
2016-11-21
檀杉(1980—),男,河北安國人,本科,助理工程師,研究方向:廣播發(fā)送技術。