【摘要】隨著人工智能技術的發(fā)展,可以利用人工智能技術實現(xiàn)短視頻云剪輯,以便更好地服務于商務會議,滿足商務會議的應用需求。本文首先分析了人工智能技術的基本原理和應用現(xiàn)狀,之后闡述了短視頻云剪輯的技術路線、結構及應用方法,最后分析了短視頻云剪輯的技術應用創(chuàng)新點和產(chǎn)業(yè)化的應用情況等。
【關鍵詞】商務會議;人工智能;短視頻;云剪
中圖分類號:TN92 ? ? ? ? ? ? ? ? ? ? ? 文獻標識碼:A ? ? ? ? ? ? ? ? ?DOI:10.12246/j.issn.1673-0348.2021.06.040
在基于人工智能技術的短視頻云剪輯技術中,也存在著一定的難點,如對普通視頻流處理目前仍需采用優(yōu)化算法。本文在分析了人工智能技術與短視頻云剪輯之間關聯(lián)的基礎上,詳細分析了商務會議場景下基于人工智能技術的短視頻云剪輯技術。
1. 人工智能技術與短視頻云剪輯
當前人工智能技術在社會中的應用領域較廣,也是目前的研究熱點問題之一,可以應用人工智能技術進行短視頻云剪輯。在短視頻云剪輯中,目前的版本AI截圖邏輯是每個人保留固定的幾張圖片,在下一個人臉出現(xiàn)時才會對上一個人臉的截圖做篩選,選出幾張比較優(yōu)質(zhì)的圖片,這樣的話就帶來了兩個問題:一是如果等到篩選完之后再向業(yè)務服務器發(fā)送圖片時效性較差。為了解決時效性,現(xiàn)有的方案是先提供兩張截圖等到篩選過后再提供一張,但這樣帶來的問題就是前面兩張的質(zhì)量無法保證,后面那張由于時效性基本不會被采用。二是由于人臉的對比僅限于跟上一張的對比就導致了有些反復上臺的人臉會被重復截取出來比如主持人,但是如果每一張人臉都跟之前的所有人臉去對比系統(tǒng)的性能方面又無法得到保證。
2. 基于人工智能技術的短視頻云剪輯
2.1 短視頻云剪輯的技術路線
對于短視頻云剪輯的技術路線主要有AI智能終端處理、AI云服務器處理兩種方式。根據(jù)商業(yè)應用場景不同選擇不同方式。全部交由智能終端處理對終端運算能力要求高,成本較高,可減輕云服務器運算壓力,但通用性較差。全部交由云服務器處理的場景接入通用性好,便于部署調(diào)試,適合平臺運作模式。本文主要研究通用視頻流接入云服務器場景下部署AI算法云服務器的技術路線。
2.2 短視頻云剪輯的系統(tǒng)結構
AI云剪輯是在云直播平臺上基于短視頻云剪輯系統(tǒng)結構上部署獨立AI算法服務器。包括客戶端、服務器端、數(shù)據(jù)庫、AI算法服務器等,如下圖1所示。
2.3 短視頻云剪輯的方法
在短視頻云剪輯的方法中,重要的是應具備“快速”、“智能”、“共享”這類智媒體視頻云技術,尤其是“共享”對實現(xiàn)成員間協(xié)作,可以解決媒體單位內(nèi)部音視頻編輯的痛點。剪輯應默認提供手工云剪輯處理界面,由人工觀看直播并給起始點打標記,生成短視頻。在開啟AI云剪輯功能后,則由AI算法服務器進行視頻流逐幀分析和模式識別,根據(jù)人物人臉在視頻中出現(xiàn)和消失的行為發(fā)生時機,自動將事件前后的一段視頻進行標識剪輯并存儲。系統(tǒng)應允許手工云剪輯仍然能起到輔助糾偏。圖2短視頻云剪輯軟件界面。
3 基于人工智能技術的短視頻云剪輯的應用
3.1 AI云剪輯算法的三種應用
AI算法服務器主要實現(xiàn)商務會議場景下對視頻流的逐幀分析、模式識別和,圖文和短視頻云剪輯。對于AI截圖應用:算法根據(jù)不同的商務會議場景,對現(xiàn)場演講嘉賓和投放PPT的視頻流做逐幀分析,實時按多個參數(shù)要求對每幀圖像做動態(tài)評估篩選,自動截取三張匹配圖片,并保留最佳圖片作為實時圖文播報。相關場景主要包括4種:一是會議場景:正面近景圖–根據(jù)單人的人臉識別和人物圖像占比觸發(fā);根據(jù)“抬頭、正面、近景、睜眼”的行為參數(shù)做篩選。二是培訓場景:根據(jù)PPT翻頁時前后畫面內(nèi)容變化超過某門限而觸發(fā)截取圖片,如圖片中有畫中畫人物,可忽略畫中畫人物變化。三是活動場景:多人集體圖-根據(jù)舞臺表演者的行為跟蹤,多人集體合影照觸發(fā)正面、側面各截圖2張。四是綜合場景:根據(jù)場景變化,須動態(tài)切換三類算法以匹配場景。
對于AI云剪輯應用:包括系統(tǒng)智能剪輯和手工智能剪輯兩種,分別適用于公開發(fā)布和私有發(fā)布。一是系統(tǒng)智剪:算法為識別演講者上臺的臉部特征向量進行動態(tài)存儲、跟蹤和比對,記錄人物入場和退場時間標記點,并自動生成播放鏈接和縮略圖,以便形成可精準分發(fā)的節(jié)目短視頻。二是手工智剪:觀眾在直播間回看時選中某個人物啟動智剪,算法標記出該人物所有出現(xiàn)過的片斷,自動生成短視頻預覽窗以快速定位,然后手工進行二次精彩片斷打標選取后生成短視頻播放鏈接,以便觀眾選擇自己感興趣的精準內(nèi)容分發(fā)。對于AI云輔助:根據(jù)算法獲取的人物信息匹配本場活動預存的該人物的圖文介紹資料,提取并實時動態(tài)顯示在視頻窗;通過童爬蟲提取該人物的相關網(wǎng)絡資源,動態(tài)顯示在相關信息欄目;通過AI將聲音轉文字,通過“時間戳”建立文字和音頻的同步機制,生成短視頻文字摘要。
3.2 AI云剪輯的產(chǎn)業(yè)化應用
AI短視頻云剪輯作為一種智媒體視頻云技術,它不僅能夠提升媒體服務人員的全媒體產(chǎn)品編輯能力和加工效率,而且能夠在團隊內(nèi)部實現(xiàn)圖文和視頻編輯共享融合,打造云端智能媒體編輯部。更具產(chǎn)業(yè)化的是平臺型應用,將AI短視頻云剪輯在商務直播場景下用作直播活動期間的實時精準內(nèi)容剪輯和H5云分發(fā),B端用戶的產(chǎn)品發(fā)布會、政策發(fā)布會場能獲得更好的宣傳,主辦方愿意為此付費,并且因平臺具備AI云服務器服務能力,可通過水平擴張?zhí)峁┮?guī)模化直播視頻流接入,形成客戶自助接入的平臺型產(chǎn)業(yè)。由于AI云剪輯技術完全采用H5界面交互和云端標記模式,平臺并不需要真正拷貝上傳下載視頻,只需生成H5的播放鏈接因而剪輯效率高、交互界面簡單易學,使得用戶也能夠參與云剪輯各取所需,能提供更好地商業(yè)媒體宣傳和裂變。
4 結論
隨著人工智能技術的發(fā)展和抖音等C端消費級APP中廣泛應用帶來的傳導效應,B端商務會議場景下的AI短視頻云剪輯技術也會逐步得到應用。本文所分析的商務會議場景下基于人工智能技術的短視頻云剪輯技術,已在VTC云直播場景中加以應用并獲得較好的效果??梢灶A見各類商務直播平臺將逐步AI賦能在場景算法上下功夫以提供更好更高效的平臺服務。
參考文獻:
[1]呂云玲,井佩光.短視頻內(nèi)容智能分析技術[J].電視技術,2019,043(005):16-18.
[2]王向陽.智媒體視頻云技術:開啟新聞傳播新紀元[J].傳媒,2018(1):15-16.
[3]牛嵩峰,唐煒.基于人工智能的中文語音文本智能編輯系統(tǒng)設計[J].廣播與電視技術,2018,45(4):56-61.
作者簡介:李燈,四川渠縣,碩士研究生,工程師,目前從事視頻直播終端和平臺軟件系統(tǒng)件架構相關工作。