摘 要:為了進一步整合學校視頻教學資源,提出一種基于關(guān)鍵幀技術(shù)的視頻資源檢索模式,通過對關(guān)鍵幀分析和提取技術(shù)的研究應(yīng)用,提高了視頻資源的利用效率,有效促進了教學和科研活動的開展。
關(guān)鍵詞:關(guān)鍵幀分析;關(guān)鍵幀提??;視頻資源
中圖分類號:TP391.41
在社會信息化程度日益高漲的今天,越來越多的教師通過校園網(wǎng)來開展教學和科研活動,其中很大部分需要用到多媒體資源。教育領(lǐng)域?qū)τ趥鹘y(tǒng)的多媒體教學資源的開發(fā)、應(yīng)用、組織與更新都提出了新的要求,數(shù)字化視頻無疑是優(yōu)化多媒體資源、實現(xiàn)教學改革的趨勢。構(gòu)建一個高效便捷的視頻資源管理系統(tǒng),使得師生可以快速檢索到自己所需的視頻資源,將會有效促進教學和科研活動的開展,充分提高教學資源的利用效率。
1 研究背景
隨著高校校園網(wǎng)絡(luò)和多媒體技術(shù)的快速發(fā)展,目前校園網(wǎng)內(nèi)的視頻資源主要存在以下問題:
(1)視頻資源分布非常分散、利用率極低,資源分布在各個部門,沒有專人統(tǒng)一管理。
(2)視頻資源的存儲方式多樣化,以硬盤、VCD、DVD等形式為主,還有一部分傳統(tǒng)的膠片、錄像帶等,沒有一個統(tǒng)一的多媒體資源庫。
(3)視頻資源只能通過制作日期或名稱來檢索,缺少編目和關(guān)鍵幀信息,一旦時間久遠就很難搜索到。
以上的問題均導致了視頻資源不能快速檢索、乃至不能得到利用,儼然成為制約高校教育現(xiàn)代化發(fā)展的重要因素。
2 關(guān)鍵幀技術(shù)
關(guān)鍵幀技術(shù)的應(yīng)用主要依靠關(guān)鍵幀的分析和提取。關(guān)鍵幀分析和提取技術(shù)主要使用在媒體資料的上載(上傳)和編目中,也包括對歷史庫存資料的批處理。
眾所周知,幀是視頻流中的一幅圖片或一組圖片,從視頻流中提取任意一幅圖片或指定的任意數(shù)量的圖片是成熟的普通技術(shù),技術(shù)的關(guān)鍵是如何識別一幅圖片為“關(guān)鍵性圖片”,也即關(guān)鍵幀。
關(guān)鍵幀(有時也稱代表幀)是用于描述一個鏡頭的關(guān)鍵圖像幀[1],關(guān)鍵幀主要用在視頻資源檢索和瀏覽中。一個關(guān)鍵幀代表一段視頻、一個場景或一個鏡頭的特征含義或標題性示意,它是一個鏡頭主要內(nèi)容的直接體現(xiàn)。根據(jù)鏡頭內(nèi)容的復(fù)雜程度不同,可以從中提取一個或多個關(guān)鍵幀。依靠關(guān)鍵幀可以大大減少視頻索引的計算量,同時也構(gòu)成了一個查詢和檢索視頻的基本框架,通過關(guān)鍵幀還可以建立一段視頻預(yù)覽,使得用戶通過預(yù)覽片段中的幾個有限的關(guān)鍵幀來快速檢索整段視頻。
2.1 關(guān)鍵幀分析和提取
人們可以通過對視頻主題的理解、個人經(jīng)驗、管理要求和個人工作狀態(tài)等來確定一幅圖片是不是關(guān)鍵圖片,而計算機只能根據(jù)圖片的變化、圖片的相似度和重復(fù)度、伴音的變化等因素來判斷一幅圖片是否關(guān)鍵幀。因此,分析和提取“關(guān)鍵性圖片”的能力成為關(guān)鍵幀技術(shù)的重要因素。當然,計算機找到初步的關(guān)鍵幀后還需由工作人員進行二次甄別和篩選,甚至是補充采集和提取一些圖片作為關(guān)鍵幀。所以,一個表現(xiàn)良好的關(guān)鍵幀分析和提取技術(shù)主要體現(xiàn)在以下兩方面:
(1)能夠準確的分析并提取出備選關(guān)鍵幀圖片。
(2)盡量減少工作人員二次提取的工作量。
2.2 關(guān)鍵幀分析
關(guān)鍵幀分析技術(shù)是快速獲取關(guān)鍵幀的前提,決定著所獲取關(guān)鍵幀的質(zhì)量和重要程度。在視頻資源素材入庫后,首先需要對視頻資源素材進行關(guān)鍵幀分析,為隨后進行的關(guān)鍵幀提取工作做好鋪墊。目前,關(guān)鍵幀的分析主要是通過對碼流的分析,圖片相似性和重復(fù)性的判斷,音頻的變化等幾方面來辨別關(guān)鍵幀[2]:
(1)碼流的變化分析。視頻資料通常進行壓縮后進行傳輸和存儲,相同大小但內(nèi)容不同的原始視頻經(jīng)過壓縮后具有不同的碼流。碼流的突然變化或長時間穩(wěn)定往往意味著關(guān)鍵幀的出現(xiàn)。如場景變化引起內(nèi)插幀的數(shù)據(jù)包突然變大,或一個鏡頭的背景長時間不變,相關(guān)內(nèi)插幀則可以視為一個或多個候選關(guān)鍵幀。
(2)圖片相似性和重復(fù)度判斷。在一段視頻素材中,如果一組相似的圖片在視頻中反復(fù)出現(xiàn),則改組或其中具有代表性的圖片則可以視為候選的關(guān)鍵幀圖片。所以,對圖片相似性的分析顯得尤為重要,故采用圖片相似性判斷算法不同可能產(chǎn)生不同的結(jié)果。
(3)音頻分析。音頻分析的思路與視頻碼流分析的思路基本相似。突然變化的音頻碼流也往往意味著出現(xiàn)新的場景,也往往意味著關(guān)鍵幀的出現(xiàn)。與視頻碼流分析相配合,可以較準確的定位一組關(guān)鍵幀。
2.3 關(guān)鍵幀提取
關(guān)鍵幀提取技術(shù)是獲取關(guān)鍵幀賴以實現(xiàn)的基礎(chǔ),決定著獲取關(guān)鍵幀的效率和準確性。在完成關(guān)鍵幀分析工作后,為方便用戶進行快捷的瀏覽和檢索,就需要對視頻資源素材進行關(guān)鍵幀提取工作,其原因是因為每段素材中有相當多的鏡頭都是在同一場景下拍攝(比如在同一間教師里完成拍攝的精品課程),勢必造成一段素材中具有許多重復(fù)信息的幀圖像。而一段視頻的關(guān)鍵幀是反映該鏡頭中主要內(nèi)容的一幀或若干幀圖像,所以關(guān)鍵幀的提取實現(xiàn)了對動態(tài)視頻的檢索轉(zhuǎn)換為對靜態(tài)圖像的檢索,形成一個含有重要信息的預(yù)覽圖片系列,達到快速檢索視頻資源的目的[3]。
首先,為了能夠更加準確的反映鏡頭中的主要內(nèi)容,對關(guān)鍵幀的描述和選取也必須盡量準確;其次,為了便于將來存儲、索引及檢索等后續(xù)處理,關(guān)鍵幀的數(shù)據(jù)量應(yīng)盡可能減小,且計算不宜太復(fù)雜。所以,采用關(guān)鍵幀技術(shù)對視頻素材進行存儲、索引及檢索,可以有效起到數(shù)據(jù)壓縮和提高檢索效率的作用。目前,關(guān)鍵幀提取技術(shù)主要包括以下四種[4]:
(1)提取鏡頭固定時間軸上的幀作為關(guān)鍵幀,如第一幀、中間幀或最后一幀,或者相隔固定幀數(shù)采樣一幀。這種方法實現(xiàn)起來極為簡單,但是比較呆板,只能適合一些固定時間、固定場景的鏡頭。但是,一旦鏡頭復(fù)雜多變,這種方法就將不能有效地反映鏡頭內(nèi)容。
(2)基于鏡頭活動性、內(nèi)容復(fù)雜性等特征來提取關(guān)鍵幀。相比第一種方法,這個方法較能準確有效地反映鏡頭內(nèi)容,但是還是依靠人們的經(jīng)驗判斷為主,而不是究其視頻本身屬性作出的關(guān)鍵幀。
(3)通過分析視頻視覺內(nèi)容(如顏色直方圖、運動信息等)隨時間的變化情況確定所需關(guān)鍵幀的數(shù)目,并按照一定的規(guī)則為鏡頭抽取關(guān)鍵幀。這種方法相對比較的科學,不以人們的主觀經(jīng)驗為判斷,而是建立在一定的算法基礎(chǔ)上,故實現(xiàn)成本相對較高。
(4)無監(jiān)督聚類技術(shù)。這種方法是一個相對成熟的算法,其優(yōu)點是能有效地消除鏡頭間的相關(guān)性,缺點是不能有效地保存遠鏡頭內(nèi)視頻幀的時間順序和動態(tài)信息。而且該算法比較復(fù)雜,實現(xiàn)起來有一定的困難,計算量較大。
4.結(jié)束語
本文通過對關(guān)鍵幀分析和提取技術(shù)的研究,并且完成關(guān)鍵幀技術(shù)在視頻資源管理中的應(yīng)用,以便滿足不同層次需要的教學和科研,充分實現(xiàn)資源的高效利用和共享,將對提高資源利用率,促進校園資源共享,實現(xiàn)教育技術(shù)現(xiàn)代化起到積極作用。
參考文獻:
[1]于俊清,彭丹霖.基于關(guān)鍵幀的視頻摘要研究[J].計算機工程與設(shè)計,2005(10):2598-2601.
[2]丁萍瑜.基于關(guān)鍵幀的動畫視頻檢索研究[J].計算機光盤軟件及應(yīng)用,2012(02):161-162.
[3]雷震,吳玲達,劉宇弛.基于事件的新聞報道分析技術(shù)研究進展[J].計算機應(yīng)用研究,2007(05):13-16.
[4]韓兵.新聞視頻故事單元關(guān)聯(lián)分析技術(shù)研究[D].國防科學技術(shù)大學,2010:11-12.
作者簡介:倪朔東(1981-),男,江蘇南通人,實驗師,碩士,研究方向:P2P網(wǎng)絡(luò)、流媒體;劉晶(1982-),男,江蘇南通人,實驗師,碩士,研究方向:多媒體技術(shù)。
作者單位:南通大學現(xiàn)代教育技術(shù)中心,江蘇南通 226000
基金項目:江蘇省現(xiàn)代教育技術(shù)研究2011課題(項目編號:2011-R-18957);南通大學自然科學科研基金項目(項目編號:13Z039)。