• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于大數(shù)據(jù)的多媒體輿情分析方法研究

    2019-09-16 04:30:10顏建弘
    科技傳播 2019年14期
    關(guān)鍵詞:大數(shù)據(jù)技術(shù)多媒體

    顏建弘

    摘要:網(wǎng)絡(luò)輿情研究的要點(diǎn)之一是如何在大數(shù)據(jù)時(shí)代從互聯(lián)網(wǎng)海量信息中及時(shí)發(fā)現(xiàn)輿情并進(jìn)行全面的分析,以判別輿情的性質(zhì)和發(fā)展趨勢(shì)并對(duì)癥下藥地加以管控。但在目前復(fù)雜的互聯(lián)網(wǎng)大數(shù)據(jù)環(huán)境下,網(wǎng)絡(luò)輿情通常包裹在各種多媒體形式的外殼中。文章在分析大數(shù)據(jù)及多媒體網(wǎng)絡(luò)輿情概念和特點(diǎn)的基礎(chǔ)上,將大數(shù)據(jù)處理技術(shù)應(yīng)用到多媒體網(wǎng)絡(luò)輿情分析中來,研究基于大數(shù)據(jù)的多媒體網(wǎng)絡(luò)輿情分析方法。

    關(guān)鍵詞:大數(shù)據(jù)技術(shù);輿情分析;多媒體

    中圖分類號(hào):TP3 文獻(xiàn)標(biāo)識(shí)碼A 文章編號(hào)1674-6708(2019)239-0100-02

    網(wǎng)絡(luò)輿論就是在互聯(lián)網(wǎng)上傳播的公眾對(duì)某一焦點(diǎn)所表現(xiàn)出的有一定影響力的、帶傾向性的意見或言論。截至2018年12月,我國(guó)網(wǎng)民規(guī)模達(dá)8.29億,普及率達(dá)59.6%,較2017年底提升3.8個(gè)百分點(diǎn),全年新增網(wǎng)民5653萬。其中手機(jī)網(wǎng)民規(guī)模達(dá)8.17億,網(wǎng)民通過手機(jī)接入互聯(lián)網(wǎng)的比例高達(dá)98.6%。在如今的大數(shù)據(jù)網(wǎng)絡(luò)資源環(huán)境下,各種網(wǎng)絡(luò)新業(yè)務(wù)和多媒體的發(fā)展普及為網(wǎng)民提供了更多樣的信息發(fā)布載體,微信、QQ、微博、新聞客戶端、直播平臺(tái)、短視頻平臺(tái)、知識(shí)問答平臺(tái)等使得網(wǎng)絡(luò)輿情的表現(xiàn)方式發(fā)展得更為多元化。

    1多媒體網(wǎng)絡(luò)輿情特點(diǎn)和研究現(xiàn)狀

    多媒體網(wǎng)絡(luò)輿情為社會(huì)公眾和政府、傳統(tǒng)媒體構(gòu)成的主體將對(duì)輿情客體的觀點(diǎn)和態(tài)度加工成多元外現(xiàn)的輿情本體,通過多媒體傳播通道在大數(shù)據(jù)網(wǎng)絡(luò)空問中進(jìn)行互動(dòng)的總和。多媒體輿情信息文件類型多樣,傳播快速而廣泛,在大數(shù)據(jù)環(huán)境下具有規(guī)模性、多樣性、變化快速性、價(jià)值等4個(gè)特征。多媒體輿情的復(fù)雜特性大大增加了以它為對(duì)象的輿情分析的難度和工作量,當(dāng)前對(duì)于多媒體輿情信息的分析研究大部分仍集中在對(duì)低維度文本輿情的分析上,而對(duì)于以圖片、音頻、視頻等多媒體形式為載體的高維度輿情信息的挖掘分析研究還比較少。針對(duì)目前多媒體輿情的復(fù)雜性,采用傳統(tǒng)輿情的識(shí)別分析方式不易獲得準(zhǔn)確有效的信息,需要對(duì)輿情信息的多媒體外殼在已有輿情分析研究方法的基礎(chǔ)上,結(jié)合大數(shù)據(jù)分析技術(shù)進(jìn)行處理。

    2多媒體網(wǎng)絡(luò)輿情大數(shù)據(jù)分析方法

    目前,使用大數(shù)據(jù)技術(shù)處理數(shù)據(jù)時(shí)最常使用Hadoop、MapReduce、Spark等分布式處理方式。而最常運(yùn)用的大數(shù)據(jù)分析方法主要分為兩種,第一種是基于人工經(jīng)驗(yàn)建立分析模型,這種方法對(duì)人力、物力資源的消耗較高,對(duì)數(shù)據(jù)的體量有限制,不能高效率地處理巨大量的數(shù)據(jù)且無法遷移。第二種是基于人工智能的大數(shù)據(jù)分析方法,其中最重要的技術(shù)包含有機(jī)器學(xué)習(xí)、聚類、關(guān)聯(lián)分析算法和卷積神經(jīng)網(wǎng)絡(luò)等,這些方法適合于大數(shù)據(jù)量的處理,且數(shù)據(jù)量越大精確度越高,但在提取分析動(dòng)態(tài)多媒體數(shù)據(jù)特征方面能力有限。目前較為新型高效的大數(shù)據(jù)分析方法是基于無限深度神經(jīng)網(wǎng)絡(luò)(infinite deep neural networks,infinite DNN s)的大數(shù)據(jù)分析,這是一種全互連的回復(fù)式神經(jīng)網(wǎng)絡(luò)(recurrentneural networks,RNN s)神經(jīng)元之問存在反饋連接,能夠處理動(dòng)態(tài)數(shù)據(jù)。深度神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)算法通過調(diào)節(jié)神經(jīng)元之問的網(wǎng)絡(luò)連接權(quán)值實(shí)現(xiàn),其中比較經(jīng)典實(shí)用的算法有基于反向傳播算法擴(kuò)展的訓(xùn)練前饋網(wǎng)絡(luò)BPTT算法,誤差從前向后傳播的RTRL(real-timer ecurrent learning)算法,以及Gers等人提出的改進(jìn)“長(zhǎng)短時(shí)記憶”(long short-termmemory)LsTM算法。本文主要以這種大數(shù)據(jù)分析方法將高維度的多媒體載體信息轉(zhuǎn)換為低維度的文本信息加以處理。具體分析處理方法如下:

    2.1視頻信息分析

    當(dāng)前流傳在網(wǎng)絡(luò)上的視頻信息多為短視頻形式,生產(chǎn)流程簡(jiǎn)單、制作門檻低、制作周期短、民眾參與性強(qiáng)、傳播度高。由于時(shí)長(zhǎng)較短且背景音樂多為網(wǎng)紅歌曲片段且與視頻內(nèi)容關(guān)聯(lián)不大,對(duì)短視頻輿情分析需側(cè)重于對(duì)視頻中的人物動(dòng)作表情和文字信息的識(shí)別提取。對(duì)于視頻中的人物動(dòng)作,可使用基于行為模板的方式獲取不同動(dòng)作的特征從而設(shè)立各自的模板,實(shí)際使用時(shí)將捕捉到的動(dòng)作與模板進(jìn)行匹配,以達(dá)到對(duì)各種行為進(jìn)行準(zhǔn)確地識(shí)別的效果。通過鏡頭分割與分幀技術(shù)、關(guān)鍵幀提取技術(shù)等將視頻節(jié)選為圖像。也可以使用基于LSTM的網(wǎng)絡(luò)模型處理復(fù)雜的視頻序列,從傳統(tǒng)的視覺特征或深度特征中學(xué)習(xí)動(dòng)態(tài)時(shí)序信息,然后識(shí)別視頻序列中的行為,并自動(dòng)生成一個(gè)不定長(zhǎng)的語句來正確地描述視頻內(nèi)容。

    2.2音頻信息分析簡(jiǎn)化

    網(wǎng)絡(luò)輿情分析中音頻的有效信息可分為人類語音信息和環(huán)境音。為更好地分析有用的音頻信息可使用Matlab的濾波器進(jìn)行降噪預(yù)處理,之后利用拉普拉斯變換、快速傅里葉變換等工具能對(duì)音頻信號(hào)進(jìn)行時(shí)頻分析;利用基于語音信號(hào)的梅爾頻譜倒譜系數(shù)對(duì)人類語音信息進(jìn)行特征提取;對(duì)于環(huán)境音可利用基于非平穩(wěn)信號(hào)的經(jīng)驗(yàn)?zāi)B(tài)分解法、局部均值分解、極點(diǎn)對(duì)稱模態(tài)分解等聲音特征提取方法達(dá)到特征提取的目的。在語音識(shí)別任務(wù)中,大數(shù)據(jù)技術(shù)在音頻轉(zhuǎn)換方面通常使用自動(dòng)語音識(shí)別技術(shù)和相關(guān)算法,針對(duì)視音頻處理模塊統(tǒng)一轉(zhuǎn)碼重采樣后的音頻流進(jìn)行智能識(shí)別,將其中的語音內(nèi)容轉(zhuǎn)換為計(jì)算機(jī)可以識(shí)別的文本字符信息。而無限深度神經(jīng)網(wǎng)絡(luò)不僅能夠記住上下文,有更高的識(shí)別精度,且抗噪性能更強(qiáng),能更為準(zhǔn)確高效地將語音傳譯為文字信息。

    2.3圖像信息分析簡(jiǎn)化

    目前網(wǎng)絡(luò)中的圖像信息多以新聞和自媒體文章插圖、電腦手機(jī)截屏圖片、各類表情包等形式存在,內(nèi)容多為人物、文字對(duì)話。圖像信息的分析識(shí)別主要在于圖像分割:通過對(duì)單個(gè)像素點(diǎn)或整個(gè)像素區(qū)域的分析提取出圖像的局部特征。傳統(tǒng)方法?;诰垲?、小波變換、閾值、區(qū)域等進(jìn)行圖像分割,由于關(guān)鍵信息比較復(fù)雜多變,以至處理效率不高?;诙啻睃c(diǎn)近鄰傳播聚類的MSMEAP算法,可以有效實(shí)現(xiàn)大數(shù)據(jù)圖像的快速分割。對(duì)于經(jīng)過分割處理后的圖像,無限深度神經(jīng)網(wǎng)絡(luò)的LSTM模型能學(xué)習(xí)將單張圖像的像素強(qiáng)度映射成一個(gè)語法正確的自然語句,再結(jié)合人物動(dòng)作、表情、文本、背景特點(diǎn)等信息將圖像賦予文本性質(zhì)的描述。

    2.4文本信息分析

    在網(wǎng)絡(luò)文本輿情分析方面,文獻(xiàn)提出了基于網(wǎng)絡(luò)日志數(shù)據(jù)挖掘的隱性輿情分析、基于社會(huì)網(wǎng)絡(luò)分析的輿情主體關(guān)系發(fā)現(xiàn)、關(guān)聯(lián)不同領(lǐng)域數(shù)據(jù)進(jìn)行輿情分析以及基于網(wǎng)絡(luò)民意調(diào)查的4種面向大數(shù)據(jù)的輿情分析方法。文本分布式預(yù)處理可利用MapReduce框架將文本集的分詞、停用詞去除以及文本內(nèi)的詞頻統(tǒng)計(jì)放置在Map階段,將構(gòu)造倒排索引文件的任務(wù)設(shè)置在Reduce階段以最大化實(shí)現(xiàn)并行。此外,分析文本可使用jieba分詞、THULAC工具包、NLPIR分詞系統(tǒng)等技術(shù)進(jìn)行分詞預(yù)處理,提高分析的效率和準(zhǔn)確率。在此基礎(chǔ)上,對(duì)輿情分析關(guān)鍵詞進(jìn)行檢索并通過結(jié)合上下文、挖掘詞語之間的聯(lián)系來較快定位推文所屬的范疇、解讀文本信息所包含的情感特征。從文本信息中識(shí)別出話題范疇、作者觀點(diǎn)情感,用戶情感態(tài)度等等。通過分詞技術(shù)和詞向量模型及其比較分析分析與誰相關(guān)、是否是輿情、是否是負(fù)面、是否具有敏感含義等。

    3總結(jié)

    目前的大數(shù)據(jù)環(huán)境為網(wǎng)絡(luò)輿情分析管理提供了創(chuàng)新高效的大數(shù)據(jù)技術(shù)和算法,同時(shí)也使網(wǎng)絡(luò)輿情分析面臨著更復(fù)雜的挑戰(zhàn)。在多媒體網(wǎng)絡(luò)輿情分析研究方面以應(yīng)用無限深度神經(jīng)網(wǎng)絡(luò)為主,其他大數(shù)據(jù)算法為輔的方式,將高維度的視頻、圖像、聲音信息轉(zhuǎn)化為低維度的文字信息進(jìn)行處理,實(shí)現(xiàn)語義密集度由低到高的轉(zhuǎn)變,從而實(shí)現(xiàn)多媒體網(wǎng)絡(luò)輿情分析的目的。當(dāng)前對(duì)于多媒體形式的輿情信息分析研究還主要集中在對(duì)于多媒體各個(gè)載體的單獨(dú)分析上,新興媒體平臺(tái)層出不窮,大數(shù)據(jù)技術(shù)對(duì)以多媒體為整體的輿情信息挖掘分析的應(yīng)用還有待于進(jìn)一步研究。

    猜你喜歡
    大數(shù)據(jù)技術(shù)多媒體
    借助多媒體探尋有效設(shè)問的“四度”
    多媒體在《機(jī)械制圖》課中的應(yīng)用
    大數(shù)據(jù)技術(shù)在電子商務(wù)中的應(yīng)用
    大數(shù)據(jù)技術(shù)對(duì)新聞業(yè)務(wù)的影響研究
    初中化學(xué)因多媒體而綻放光彩
    論大數(shù)據(jù)技術(shù)在智能電網(wǎng)中的應(yīng)用
    高校檔案管理信息服務(wù)中大數(shù)據(jù)技術(shù)的應(yīng)用
    大數(shù)據(jù)技術(shù)在電氣工程中的應(yīng)用探討
    大數(shù)據(jù)技術(shù)在商業(yè)銀行中的應(yīng)用分析
    巧用多媒體 讓課堂練筆更加有效
    东光县| 鲁山县| 巫溪县| 龙岩市| 宁都县| 玉树县| 无锡市| 隆回县| 额敏县| 孝昌县| 高要市| 中卫市| 北京市| 临城县| 长丰县| 米易县| 金昌市| 祁东县| 阿拉善左旗| 麻城市| 扎鲁特旗| 大姚县| 平顶山市| 新津县| 泗洪县| 呼图壁县| 陇南市| 合作市| 浮山县| 喀什市| 进贤县| 玛曲县| 疏附县| 青岛市| 东丽区| 大方县| 惠来县| 连州市| 竹山县| 札达县| 安丘市|