王志雄
(國(guó)家廣電總局291臺(tái),蘭州 730105)
隨著廣電總局對(duì)節(jié)目?jī)?nèi)容監(jiān)管力度的不斷強(qiáng)化,涉及節(jié)目?jī)?nèi)容的時(shí)長(zhǎng)監(jiān)管、播出數(shù)量監(jiān)管,以及節(jié)目違規(guī)內(nèi)容發(fā)現(xiàn)、節(jié)目播出情況的分析和研判等成為了內(nèi)容監(jiān)管重要工作。目前,針對(duì)廣播電視節(jié)目?jī)?nèi)容的監(jiān)管建立了一套統(tǒng)一采集、統(tǒng)一存儲(chǔ)、集中處理的軟件監(jiān)管平臺(tái),能夠?qū)V播電視節(jié)目進(jìn)行編目與檢索,對(duì)視音頻文件進(jìn)行自動(dòng)結(jié)構(gòu)化分析并拆分標(biāo)注形成全天的節(jié)目單,為節(jié)目?jī)?nèi)容監(jiān)管業(yè)務(wù)提供了技術(shù)保障。然而,隨著監(jiān)管數(shù)據(jù)的不斷增加和積累,違規(guī)節(jié)目視音頻及結(jié)構(gòu)化數(shù)據(jù)呈海量增長(zhǎng),急需提高廣播電視違規(guī)視音頻及數(shù)據(jù)的處理及管理能力[1]。
違規(guī)節(jié)目?jī)?nèi)容綜合管理系統(tǒng)旨在提出靈活、可擴(kuò)展、統(tǒng)一的視音頻多維度描述體系,從空間信息、視音頻信息、時(shí)間信息、采集來(lái)源、監(jiān)測(cè)研判、監(jiān)測(cè)人員等多個(gè)維度對(duì)視音頻違規(guī)內(nèi)容進(jìn)行標(biāo)注,能夠有效的解決數(shù)據(jù)孤島問(wèn)題,增強(qiáng)監(jiān)測(cè)數(shù)據(jù)的統(tǒng)計(jì)分析能力。通過(guò)自然語(yǔ)言處理技術(shù)與人工相結(jié)合的方式[2],能夠自動(dòng)識(shí)別并獲取與視音頻節(jié)目?jī)?nèi)容違規(guī)相關(guān)的違規(guī)標(biāo)簽,進(jìn)而能夠建立違規(guī)標(biāo)準(zhǔn)標(biāo)簽庫(kù)。同時(shí),在違規(guī)內(nèi)容的多維度標(biāo)簽標(biāo)引體系的基礎(chǔ)之上圍繞違規(guī)標(biāo)簽建立知識(shí)庫(kù),讓違規(guī)節(jié)目監(jiān)管工作更加有的放矢。
違規(guī)節(jié)目?jī)?nèi)容綜合管理系統(tǒng)基于媒體資料內(nèi)容多維度描述、存儲(chǔ)與檢索體系,實(shí)現(xiàn)廣播電視違規(guī)視音頻監(jiān)管數(shù)據(jù)更有效的管理,包括違規(guī)節(jié)目視音頻文件及監(jiān)看信息匯聚、多維度標(biāo)注、信息檢索、數(shù)據(jù)統(tǒng)計(jì)及分析管理等主要功能。在此基礎(chǔ)上,通過(guò)標(biāo)簽抽取和信息抽取技術(shù),對(duì)違規(guī)內(nèi)容業(yè)務(wù)庫(kù)的構(gòu)建進(jìn)行支撐。
違規(guī)節(jié)目?jī)?nèi)容綜合管理系統(tǒng)框圖如圖1所示。
違規(guī)節(jié)目?jī)?nèi)容綜合管理系統(tǒng)由以下幾個(gè)軟件組成:
(1)媒體資源匯聚軟件;
(2)違規(guī)節(jié)目?jī)?nèi)容綜合管理平臺(tái);
(3)多維度數(shù)據(jù)檢索展示系統(tǒng)。
在廣播電視節(jié)目?jī)?nèi)容監(jiān)管業(yè)務(wù)中,需要核查數(shù)量龐大的廣播電視節(jié)目,發(fā)現(xiàn)其中出現(xiàn)的虛假?gòu)V告、夸張宣傳、有害信息等違規(guī)內(nèi)容,并對(duì)違規(guī)信息進(jìn)行高效、準(zhǔn)確、及時(shí)的研判。在這個(gè)過(guò)程當(dāng)中積累形成海量的歷史監(jiān)管數(shù)據(jù),對(duì)于違規(guī)信息映射、數(shù)據(jù)檢索分析、視音頻文件管理等工作,僅靠人工錄入及人工數(shù)據(jù)關(guān)聯(lián)不現(xiàn)實(shí),并且形成不了宏觀的數(shù)據(jù)分析。媒體資源匯聚軟件就能解決這個(gè)問(wèn)題,它除了提供基本的監(jiān)測(cè)內(nèi)容管理標(biāo)注頁(yè)面外,還能夠?qū)崿F(xiàn)日常違規(guī)節(jié)目監(jiān)管任務(wù)中視音頻文件與違規(guī)描述信息文件(節(jié)目播出情況表)的關(guān)聯(lián)匯聚,并將匯聚數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫(kù)。并且根據(jù)視音頻描述的所屬維度,細(xì)化到標(biāo)簽名稱,將節(jié)目播出情況表中信息填入到映射字段中,然后實(shí)現(xiàn)監(jiān)測(cè)監(jiān)管內(nèi)容批量導(dǎo)入系統(tǒng),方便廣播電視違規(guī)節(jié)目的多維度管理、展示,以及宏觀的監(jiān)測(cè)監(jiān)管數(shù)據(jù)分析。
媒體資源匯聚軟件如圖2所示。
圖2 媒體資源匯聚軟件
違規(guī)節(jié)目?jī)?nèi)容綜合管理平臺(tái)建立一定的描述體系以系統(tǒng)化地存放數(shù)據(jù),能夠以預(yù)先設(shè)定好的維度描述體系對(duì)數(shù)據(jù)進(jìn)行統(tǒng)一描述,按照設(shè)定的一級(jí)描述維度(空間信息、視音頻信息、時(shí)間信息、采集來(lái)源、監(jiān)測(cè)研判、監(jiān)測(cè)人員)對(duì)違規(guī)視音頻內(nèi)容進(jìn)行詳細(xì)描述。上述六個(gè)維度都有子維度予以支撐,相當(dāng)于二級(jí)描述維度,可以完全描述違規(guī)視音頻節(jié)目的有用信息,對(duì)于描述信息不足的,可以人工補(bǔ)充。一、二級(jí)維度之間均可進(jìn)行維度描述的編輯管理,實(shí)現(xiàn)兩級(jí)維度描述之間的相互映射,并完成視音頻的播放以及描述維度的展示。
違規(guī)節(jié)目?jī)?nèi)容綜合管理平臺(tái)界面如圖3所示。
圖3 違規(guī)節(jié)目?jī)?nèi)容綜合管理平臺(tái)
違規(guī)節(jié)目?jī)?nèi)容綜合管理系統(tǒng)的主要內(nèi)容均存在數(shù)據(jù)庫(kù)中,除了系統(tǒng)管理人員等維護(hù)相關(guān)信息外,主要是建立視音頻文件的描述信息并進(jìn)行分類儲(chǔ)存和展示,可分類編輯和查看空間信息、視音頻信息、時(shí)間信息、采集來(lái)源、監(jiān)測(cè)研判、監(jiān)測(cè)人員等六大維度的信息。其中,空間信息包括國(guó)家/地區(qū)、省份/直轄市、市、區(qū)/縣等級(jí)別的信息,可對(duì)信息進(jìn)行配置及管理。視音頻信息包括節(jié)目名稱、所屬頻道、節(jié)目類別、內(nèi)容介紹、違規(guī)類型、記錄原因等信息,是對(duì)違規(guī)節(jié)目?jī)?nèi)容的主要研判數(shù)據(jù),并且可以根據(jù)實(shí)際業(yè)務(wù)需求增加和調(diào)整研判項(xiàng)目。時(shí)間信息包括違規(guī)節(jié)目的開(kāi)始時(shí)間、結(jié)束時(shí)間、視頻時(shí)長(zhǎng)、日期等信息,均設(shè)置為可配置項(xiàng),即名稱、數(shù)據(jù)類型都可在后臺(tái)配置,兼容文本輸入、日期等類型。采集來(lái)源信息主要針對(duì)不同的監(jiān)測(cè)監(jiān)管系統(tǒng)而言,如衛(wèi)星系統(tǒng)、有線電視系統(tǒng)、廣播監(jiān)測(cè)系統(tǒng)等。監(jiān)測(cè)研判信息包括任務(wù)來(lái)源、任務(wù)類型,主要標(biāo)明該任務(wù)是從上級(jí)哪個(gè)廣播電視監(jiān)測(cè)監(jiān)管部門下發(fā)的,以及是何種類型的監(jiān)測(cè)監(jiān)管任務(wù),以便后續(xù)的任務(wù)歸類和數(shù)據(jù)分析。監(jiān)測(cè)人員信息包括部門、職位、姓名,用于明確責(zé)任。該管理平臺(tái)可對(duì)視音頻文件點(diǎn)擊播放,并查看視音頻文件的詳細(xì)維度描述,如圖4所示。
圖4 多維度信息描述
多維度數(shù)據(jù)檢索展示系統(tǒng)能夠?qū)Υ鎯?chǔ)的視音頻及其描述信息進(jìn)行檢索與展示,支持按照省份、廣告類型、任務(wù)類型、時(shí)間進(jìn)行檢索,并具備一定的數(shù)據(jù)統(tǒng)計(jì)分析能力。其中,可按照甘肅、青海、寧夏三個(gè)省份進(jìn)行數(shù)據(jù)檢索及展示,并在節(jié)目列表當(dāng)中顯示相關(guān)視音頻文件詳細(xì)的違規(guī)類型和內(nèi)容描述??砂凑諒V告類型進(jìn)行數(shù)據(jù)檢索及展示,包括普通商業(yè)廣告、購(gòu)物短片廣告、醫(yī)藥廣告、收藏類廣告、招商加盟類廣告、微商廣告,并在節(jié)目列表當(dāng)中顯示相關(guān)視音頻文件詳細(xì)的違規(guī)類型和內(nèi)容描述??砂凑杖蝿?wù)類型進(jìn)行數(shù)據(jù)檢索及展示,包括付費(fèi)頻道監(jiān)看、購(gòu)物頻道監(jiān)看、節(jié)目?jī)?nèi)容核查,并在節(jié)目列表當(dāng)中顯示相關(guān)視音頻文件詳細(xì)的違規(guī)類型和內(nèi)容描述。所有檢索均需進(jìn)行時(shí)間段設(shè)置,并可獨(dú)立按照時(shí)間進(jìn)行數(shù)據(jù)檢索及展示。
多維度描述信息檢索與展示如圖5所示。
圖5 多維度描述信息檢索與展示
數(shù)據(jù)統(tǒng)計(jì)分析如圖6所示。
圖6 數(shù)據(jù)統(tǒng)計(jì)分析
廣播電視節(jié)目?jī)?nèi)容監(jiān)管工作的特點(diǎn)就是類型多樣、數(shù)據(jù)繁雜、千頭萬(wàn)緒,例如同一個(gè)頻道涉及多種類型的節(jié)目,相同的違規(guī)情況出現(xiàn)在不同的節(jié)目形態(tài)當(dāng)中,不同的業(yè)務(wù)對(duì)應(yīng)不同的上級(jí)主管部門,不同的業(yè)務(wù)類型有不同的監(jiān)管要求,不同的業(yè)務(wù)要在不同的軟件系統(tǒng)上完成,這些都導(dǎo)致廣播電視節(jié)目?jī)?nèi)容監(jiān)管工作的數(shù)據(jù)管理非常麻煩,人工操作費(fèi)時(shí)費(fèi)力。此外,違規(guī)節(jié)目的違規(guī)研判標(biāo)準(zhǔn)和項(xiàng)目也不盡相同,出現(xiàn)的違規(guī)情況也千差萬(wàn)別,這就需要軟件系統(tǒng)對(duì)違規(guī)信息進(jìn)行多維度的管理。通過(guò)違規(guī)節(jié)目?jī)?nèi)容綜合管理系統(tǒng),監(jiān)管人員只要對(duì)違規(guī)節(jié)目錄音錄像,進(jìn)行規(guī)范的視音頻取證,并且按照規(guī)范完整、詳細(xì)地填寫研判信息,最終將研判信息和違規(guī)節(jié)目視音頻文件匯聚導(dǎo)入,建立相互的映射關(guān)系,后續(xù)的數(shù)據(jù)管理工作都由系統(tǒng)完成。目前,違規(guī)節(jié)目?jī)?nèi)容綜合管理系統(tǒng)共匯聚違規(guī)節(jié)目?jī)?nèi)容描述信息1092條,違規(guī)節(jié)目視音頻157個(gè)。其中,部分違規(guī)節(jié)目存在重復(fù)播出的情況,在此將內(nèi)容相同的違規(guī)視音頻只選取一個(gè)進(jìn)行匯聚管理。通過(guò)多維度的管理廣播電視違規(guī)節(jié)目?jī)?nèi)容數(shù)據(jù),規(guī)范了信息格式,提高了工作效率,對(duì)于數(shù)據(jù)的檢索和分析也更加高效,對(duì)于違規(guī)節(jié)目規(guī)律性的問(wèn)題更容易把握,研判工作更加有的放矢。
基于實(shí)際工作要求,違規(guī)節(jié)目?jī)?nèi)容綜合管理系統(tǒng)進(jìn)行多維度的監(jiān)管,按照空間信息、視音頻信息、時(shí)間信息、采集來(lái)源、監(jiān)測(cè)研判、監(jiān)測(cè)人員六大維度進(jìn)行分類存儲(chǔ)。同時(shí),將敏感詞納入多維度描述體系當(dāng)中,依托標(biāo)簽語(yǔ)義體系模型構(gòu)建基礎(chǔ)關(guān)鍵詞庫(kù),建立違規(guī)節(jié)目?jī)?nèi)容語(yǔ)義標(biāo)簽庫(kù),方便數(shù)據(jù)的檢索。該系統(tǒng)能夠?qū)⒃确稚⑹酱鎯?chǔ)的研判數(shù)據(jù)按照多維度描述進(jìn)行匯聚描述、存儲(chǔ)及檢索,可對(duì)數(shù)據(jù)進(jìn)行深度挖掘分析,完成違規(guī)節(jié)目研判信息的抽取與沉淀。對(duì)不同渠道、不同形式的節(jié)目進(jìn)行長(zhǎng)期監(jiān)管,可以積累豐富的違規(guī)節(jié)目研判經(jīng)驗(yàn),利用該系統(tǒng)檢索獲得相應(yīng)歷史數(shù)據(jù)和研判信息,有對(duì)當(dāng)前業(yè)務(wù)也有很大的指導(dǎo)作用,利于違規(guī)節(jié)目研判知識(shí)的傳承,監(jiān)管人員研判能力的提高。目前,對(duì)于空間信息、視音頻信息、時(shí)間信息、采集來(lái)源、監(jiān)測(cè)研判、監(jiān)測(cè)人員等六大維度的信息檢索,基本可以覆蓋所有的業(yè)務(wù)內(nèi)容要求。面對(duì)今后的業(yè)務(wù)變更,系統(tǒng)也保留了擴(kuò)展功能,可以人工編輯維度信息,以適應(yīng)更加豐富的廣播電視節(jié)目?jī)?nèi)容監(jiān)管要求。
該系統(tǒng)能夠?qū)V播電視節(jié)目?jī)?nèi)容違規(guī)信息及數(shù)據(jù)進(jìn)行自動(dòng)化處理分析,對(duì)違規(guī)信息及數(shù)據(jù)進(jìn)行多維度的統(tǒng)計(jì)與展示,為節(jié)目?jī)?nèi)容監(jiān)管工作起到了有效的支撐。違規(guī)節(jié)目?jī)?nèi)容綜合管理系統(tǒng)支持按照省份、廣告類型、任務(wù)類型、時(shí)間進(jìn)行數(shù)據(jù)檢索與分析,并且從總體違規(guī)情況、頻道違規(guī)情況、節(jié)目類型違規(guī)情況、時(shí)間段違規(guī)情況等四個(gè)角度進(jìn)行違規(guī)節(jié)目數(shù)據(jù)展示和分析,以達(dá)到更加全面的數(shù)據(jù)分析統(tǒng)計(jì)。目前,系統(tǒng)可對(duì)已經(jīng)匯聚的甘肅、青海、寧夏三省廣播電視違規(guī)節(jié)目進(jìn)行數(shù)據(jù)分析,內(nèi)容涉及日常廣告、付費(fèi)頻道、購(gòu)物頻道等任務(wù)類型。其中,日常廣告涉及三省衛(wèi)視頻道、地面電視頻道、廣播頻率,廣告類型包括普通商業(yè)廣告、購(gòu)物短片廣告、醫(yī)藥廣告、微商廣告、招商加盟類廣告、收藏類廣告等。付費(fèi)頻道涉及8個(gè)頻道,違規(guī)節(jié)目信息334條,主要違規(guī)情況為播出商業(yè)廣告以及在節(jié)目中變相發(fā)布廣告。購(gòu)物頻道涉及2個(gè)頻道,違規(guī)節(jié)目信息29條,主要違規(guī)情況為夸大商品功能和效果、叫賣式宣傳等。
衛(wèi)視廣告違規(guī)信息統(tǒng)計(jì)如圖7所示。
圖7 衛(wèi)視廣告違規(guī)信息統(tǒng)計(jì)
違規(guī)節(jié)目?jī)?nèi)容綜合管理系統(tǒng)能夠完成視音頻違規(guī)內(nèi)容的資源匯聚、多維度描述、多維度存儲(chǔ)、多維度檢索及數(shù)據(jù)統(tǒng)計(jì)等功能,能夠滿足對(duì)視音頻違規(guī)節(jié)目?jī)?nèi)容信息的管理、檢索以及數(shù)據(jù)分析,有利于提高視音頻違規(guī)節(jié)目的日常監(jiān)管效率,對(duì)準(zhǔn)確、及時(shí)、全面了解廣播電視違規(guī)節(jié)目播出情況有很大幫助。