龔 坤,趙 時(shí)
(1.成都索貝數(shù)碼科技股份有限公司,四川 成都 610000;2.湖北省新聞出版廣電監(jiān)管中心,湖北 武漢 430000)
2020年,中共中央宣傳部等九部委聯(lián)合印發(fā)《全國有線電視網(wǎng)絡(luò)整合發(fā)展實(shí)施方案》,明確指出要加快推動(dòng)全國有線電視網(wǎng)絡(luò)整合,實(shí)現(xiàn)全國一網(wǎng)。廣電網(wǎng)絡(luò)生態(tài)在不斷升級的同時(shí),其管理、工作方法也在受到互聯(lián)網(wǎng)的沖擊。例如,海量制作素材難以篩選,播出內(nèi)容大量增加,這都給制作人員和審核人員帶來了巨大的壓力[1]。人工智能(Artificial Intelligence,AI)作為新一代信息技術(shù),已被廣泛應(yīng)用到交通、能源、醫(yī)療及工業(yè)生產(chǎn)等多個(gè)領(lǐng)域,并取得了不錯(cuò)的效果,能有效提升生產(chǎn)效率、減少人力成本。AI技術(shù)在廣電行業(yè)的發(fā)展趨勢,必將是以AI來代替大量繁雜的重復(fù)性人力勞動(dòng),研制出更為豐富的、針對廣電場景的專用AI模型,推動(dòng)AI在廣電行業(yè)的專業(yè)化應(yīng)用。因此,研究AI適用于廣電領(lǐng)域的哪些具體應(yīng)用場景,如何與廣電業(yè)務(wù)系統(tǒng)對接實(shí)現(xiàn)應(yīng)用落地,具有重要的價(jià)值。
選題策劃的痛點(diǎn)在于如何搜集各渠道信息并確定熱點(diǎn),快速策劃出滿足各類群體并能引導(dǎo)正能量內(nèi)容的節(jié)目、掌握輿論制高點(diǎn)。對此,利用AI和數(shù)字挖掘技術(shù),能夠?qū)ξ⒉?、抖音、快手等各渠道進(jìn)行信息搜集,并就輿情熱點(diǎn)、用戶喜好等關(guān)鍵因素進(jìn)行分析,通過人臉識(shí)別、OCR字符識(shí)別、語音識(shí)別、鏡頭聚類、模糊對齊等技術(shù)手段解讀新聞;根據(jù)分析結(jié)果推薦節(jié)目制作的話題和方向,自動(dòng)撰寫策劃文稿,幫助節(jié)目制作人員快速策劃出滿足用戶需求的節(jié)目。
媒資管理的痛點(diǎn)在于大規(guī)模、多模態(tài)的數(shù)字媒體如何快速檢索、編目。利用語音識(shí)別、圖像識(shí)別、視頻識(shí)別等智能識(shí)別技術(shù),可對視音頻內(nèi)的內(nèi)容進(jìn)行提??;通過自然語言理解、圖像語義分析、視頻語義分析等智能理解技術(shù),能將視音頻內(nèi)的人物、機(jī)構(gòu)等重要因素進(jìn)行智能標(biāo)簽,可實(shí)現(xiàn)智能化編目和智能化檢索,充分挖掘媒體資源的價(jià)值。
生產(chǎn)制作的痛點(diǎn)在于傳統(tǒng)媒體素材如何提升畫面質(zhì)量以及如何快速制作稿件。利用圖像、視頻超分辨率重建、去交錯(cuò)等AI技術(shù),可將視頻清晰度增強(qiáng)、變換視頻采樣格式,并通過對抗學(xué)習(xí)對畫面進(jìn)行修復(fù)。此外,利用圖像識(shí)別、OCR識(shí)別、視頻語義分析、自然語言理解等技術(shù),能根據(jù)輸入標(biāo)簽精準(zhǔn)提煉畫面、文字,形成專業(yè)多媒體稿,可有效提升生產(chǎn)效率,并且增強(qiáng)生產(chǎn)內(nèi)容的表現(xiàn)力與感染力。
分發(fā)傳輸?shù)耐袋c(diǎn)在于傳播渠道的格式多影響傳播速度以及如何將合適的內(nèi)容傳播給需要的觀眾。一方面,利用自然語言理解、語義分析、圖像識(shí)別、OCR識(shí)別等技術(shù),可實(shí)現(xiàn)智能格式修改,提升內(nèi)容傳播速度,掌握宣傳主動(dòng)權(quán);另一方面,通過分析用戶行為特征和業(yè)務(wù)偏好,基于海量內(nèi)容和用戶數(shù)據(jù),建立流行度管理和預(yù)測方法,利用用戶畫像等技術(shù),可進(jìn)行內(nèi)容推薦,提升內(nèi)容的傳播力和影響力。
廣播電視內(nèi)容安全關(guān)乎國家政治安全、文化信息安全以及意識(shí)形態(tài)安全。目前,內(nèi)容審核多采用人工方式進(jìn)行,但是新聞?lì)惡驮L談?lì)惞?jié)目中往往包含大量各級領(lǐng)導(dǎo)干部的影像、聲音、姓名等信息,審核人員難以辨識(shí)所有人物的身份和背景,同時(shí),面對互聯(lián)網(wǎng)產(chǎn)出的大量內(nèi)容,人工的低審核效率、長時(shí)間工作導(dǎo)致的狀態(tài)下降等問題愈發(fā)突出,播出事故頻頻發(fā)生[2]。利用智能識(shí)別技術(shù),可對敏感內(nèi)容和人物進(jìn)行標(biāo)記,從而有效輔助人工對視頻中的內(nèi)容進(jìn)行高效、全面的判斷,避免冗長的無效信息帶來的人力成本浪費(fèi)。
從上述分析可知,選題策劃、媒資管理、生產(chǎn)制作、分發(fā)運(yùn)輸以及內(nèi)容審核等廣電場景,都對AI有需求,且AI能夠有效地提升這些場景下的工作效率和效果。然而,這些場景通常要求多種AI原子能力組合應(yīng)用以解決問題,而AI原子能力由計(jì)算資源、訓(xùn)練數(shù)據(jù)、算法技術(shù)組合得到,因此,需要一個(gè)平臺(tái)來綜合提供這些底層資源和技術(shù),從而形成多個(gè)AI原子能力,進(jìn)而面向廣電場景實(shí)現(xiàn)應(yīng)用。
面向廣電場景的AI平臺(tái),應(yīng)該具有知識(shí)庫、大數(shù)據(jù)治理、AI管理等核心組件,同時(shí)需要規(guī)劃平臺(tái)的資源層、技術(shù)層、服務(wù)層等各層級模塊以及相互之間的關(guān)系,為未來進(jìn)行平臺(tái)落地建設(shè)提供新的思路和指導(dǎo)方案。
以湖北省新聞出版廣電監(jiān)管中心的AI平臺(tái)實(shí)際建設(shè)方案為例,平臺(tái)的資源層、技術(shù)層、服務(wù)層等各層級模塊以及相互之間的關(guān)系如圖1所示。
圖1 湖北省新聞出版廣電監(jiān)管中心面向廣電場景的AI平臺(tái)
資源層由計(jì)算服務(wù)器、網(wǎng)絡(luò)設(shè)備、存儲(chǔ)設(shè)備以及廣電場景目前逐漸應(yīng)用較多的移動(dòng)終端等設(shè)備組成。考慮到在全國一網(wǎng)的背景下,廣電領(lǐng)域有著海量的素材和復(fù)雜的應(yīng)用場景,對計(jì)算能力、精度及可擴(kuò)展性等性能要求很高,因此,資源由云服務(wù)提供商提供,以應(yīng)對突發(fā)情況下資源不足的問題。同時(shí),由于云服務(wù)具備彈性資源供給的特性,可以避免采購過多設(shè)備帶來的浪費(fèi)問題。
平臺(tái)核心組件包括知識(shí)庫組件、大數(shù)據(jù)治理組件以及AI管理組件。知識(shí)庫組件根據(jù)多年從業(yè)人員的輸入存儲(chǔ)了大量業(yè)務(wù)經(jīng)驗(yàn)和知識(shí),能支撐場景化AI原子能力的訓(xùn)練。比如,在智能導(dǎo)播算法的設(shè)計(jì)中,需要導(dǎo)播提供鏡頭語言、鏡頭切換時(shí)機(jī)、運(yùn)鏡方法等知識(shí);在敏感內(nèi)容識(shí)別中,需要有監(jiān)管人員界定涉黃、涉暴等內(nèi)容的相關(guān)邊界。除了專家的業(yè)務(wù)經(jīng)驗(yàn)之外,知識(shí)庫還可利用知識(shí)圖譜和數(shù)據(jù)治理相關(guān)技術(shù)對歷史生產(chǎn)數(shù)據(jù)進(jìn)行抽取,有助于收集易被忽視的信息,同時(shí)可以分析知識(shí)間的關(guān)系,明確不同知識(shí)在業(yè)務(wù)場景中的重要性[3]。
大數(shù)據(jù)治理組件具有可對用戶使用數(shù)據(jù)和內(nèi)部生產(chǎn)數(shù)據(jù)進(jìn)行采集的渠道,利用分布式數(shù)據(jù)庫、分布式計(jì)算引擎來構(gòu)成數(shù)據(jù)集成系統(tǒng)、數(shù)據(jù)資源池、數(shù)據(jù)服務(wù)系統(tǒng)以及數(shù)據(jù)共享系統(tǒng),并結(jié)合數(shù)據(jù)挖掘技術(shù)進(jìn)行數(shù)據(jù)管理和數(shù)據(jù)治理[4]。利用大數(shù)據(jù)治理組件,可以對用戶數(shù)據(jù)和歷史生產(chǎn)數(shù)據(jù)進(jìn)行有效管理和價(jià)值挖掘,并有助于知識(shí)庫進(jìn)行知識(shí)抽取,還能提供大量數(shù)據(jù)訓(xùn)練具有高泛化性的AI原子能力。
AI管理組件由大數(shù)據(jù)治理組件提供存儲(chǔ)資源,計(jì)算服務(wù)器提供CPU、GPU等計(jì)算資源進(jìn)行模型訓(xùn)練。通過分布式資源調(diào)度框架來調(diào)度各計(jì)算服務(wù)器的計(jì)算資源,以支持模型的分布式訓(xùn)練,并且可通過容器化的方式支撐多個(gè)AI框架,以保證AI原子能力之間互不沖突[5]。此外,還有能力庫可對各種訓(xùn)練好的AI原子能力進(jìn)行管理?;贏I管理組件,能夠有效利用各平臺(tái)資源來訓(xùn)練基礎(chǔ)和場景化的AI原子能力,可方便、快捷、高效地形成面向廣電行業(yè)的各項(xiàng)智能服務(wù)。
統(tǒng)一的接口規(guī)范定義了與AI平臺(tái)其他系統(tǒng)進(jìn)行數(shù)據(jù)交換的數(shù)據(jù)規(guī)范和報(bào)文規(guī)范。建立統(tǒng)一的接口規(guī)范,對各廠商AI能力進(jìn)行封裝,平臺(tái)只需要關(guān)注AI算法本身,對于各種應(yīng)用場景,無需再重復(fù)開發(fā)接口,能夠節(jié)約人力、時(shí)間成本。
平臺(tái)的算法技術(shù)層分為基礎(chǔ)算法和面向廣電業(yè)務(wù)場景的算法。基礎(chǔ)算法包括人臉識(shí)別、語音識(shí)別、自然語言處理、推薦算法以及知識(shí)圖譜構(gòu)建。在這些基礎(chǔ)算法上,通過融合推理,推出面向廣電業(yè)務(wù)場景的智能算法,包括鏡頭語言識(shí)別、智能剪輯技術(shù)以及視頻增強(qiáng)技術(shù)等。其中,視頻增強(qiáng)技術(shù)包括視頻超分、色彩變換及圖像修復(fù)等。
平臺(tái)的服務(wù)層主要是基于各項(xiàng)面向廣電業(yè)務(wù)場景的算法,為電視臺(tái)等廣電機(jī)構(gòu)提供智能編片、智能編目、智能拆條、智能審片、智能唱詞、智能抹標(biāo)、智能配音、智能修復(fù)、內(nèi)容推薦以及數(shù)據(jù)分析等智能服務(wù)。
本文詳細(xì)闡述了湖北省新聞出版廣電監(jiān)管中心建設(shè)面向廣電場景AI平臺(tái)的實(shí)踐中,人工智能可應(yīng)用于廣播電視行業(yè)的多個(gè)具體應(yīng)用場景。針對面向廣電場景的AI平臺(tái)進(jìn)行了探索和應(yīng)用,給出了平臺(tái)架構(gòu)和核心組件,有助于全國各級電視臺(tái)等廣電機(jī)構(gòu)建立自己的AI平臺(tái),以推進(jìn)智慧廣電服務(wù),滿足城市圈用戶多元化需求,全面增強(qiáng)媒體影響力。