王亞玲
摘 要:多媒體數(shù)據(jù)挖掘技術(shù)是數(shù)字圖書(shū)館的核心技術(shù),可以幫助人們檢索到文本信息、視頻信息,能夠?yàn)樽x者提供更加優(yōu)質(zhì)的服務(wù)。 就多媒體數(shù)據(jù)挖掘技術(shù)的相關(guān)概念以及內(nèi)容進(jìn)行闡述,分析數(shù)字圖書(shū)館中多媒體數(shù)據(jù)挖掘技術(shù)系統(tǒng)結(jié)構(gòu),并探討多媒體數(shù)據(jù)挖掘技術(shù)的應(yīng)用,以便提高多媒體數(shù)據(jù)挖掘技術(shù)在數(shù)字圖書(shū)館中的應(yīng)用效率。
關(guān)鍵詞:數(shù)字圖書(shū)館;多媒體數(shù)據(jù)挖掘技術(shù);研究分析
在當(dāng)今信息時(shí)代發(fā)展中,世界逐漸進(jìn)入到數(shù)字化、網(wǎng)絡(luò)化的發(fā)展中,信息成為人們生活與工作中的重要部分。在獲取信息方面,可以通過(guò)互聯(lián)網(wǎng)絡(luò)渠道檢索出各自需要的信息。隨之?dāng)?shù)字圖書(shū)館逐漸發(fā)展起來(lái),在數(shù)字圖書(shū)館中,對(duì)信息的獲取可以通過(guò)多媒體數(shù)據(jù)挖掘技術(shù)來(lái)獲得。在數(shù)字圖書(shū)館中,如何更好的使用多媒體數(shù)據(jù)挖掘技術(shù)來(lái)獲取文本信息、視頻信息等是當(dāng)今急需要解決的問(wèn)題。
1 多媒體數(shù)據(jù)挖掘的相關(guān)概念以及內(nèi)容
1.1 多媒體數(shù)據(jù)挖掘技術(shù)的概念
多媒體數(shù)據(jù)挖掘技術(shù)是一種智能化的技術(shù),將以往的以信息存儲(chǔ)為主的多媒體技術(shù)處理和管理模式轉(zhuǎn)變?yōu)橐灾R(shí)獲取為主的模式,多媒體數(shù)據(jù)屬于非結(jié)構(gòu)化或半結(jié)構(gòu)化,其具有不同的特點(diǎn),并且存在不同的表達(dá)方式。各媒體數(shù)據(jù)不僅可以獨(dú)立表達(dá)信息,還可以共同表達(dá)相同事物的不同特點(diǎn),共同表達(dá)事物的發(fā)展過(guò)程及結(jié)果。因此,在多媒體數(shù)據(jù)中,存在信息主體特點(diǎn)、屬性,并且數(shù)據(jù)之間具有緊密的聯(lián)系。因此,多媒體數(shù)據(jù)挖掘主要指的是在多媒體數(shù)據(jù)的內(nèi)容特征前提下,通過(guò)多媒體技術(shù)將其數(shù)據(jù)中隱含的、有價(jià)值的可以理解的內(nèi)容挖掘出來(lái)。
1.2 多媒體數(shù)據(jù)挖掘技術(shù)的內(nèi)容
數(shù)字圖書(shū)館中的數(shù)據(jù)挖掘不能看作是簡(jiǎn)單的對(duì)數(shù)字圖書(shū)館信息的檢索,其主要是對(duì)以文本信息為主的數(shù)據(jù)挖掘,換句話而言,是對(duì)圖像、聲音、視頻、動(dòng)畫(huà)等為代表的連續(xù)媒體內(nèi)容進(jìn)行數(shù)據(jù)挖掘。由于多媒體數(shù)據(jù)中具有豐富多樣的內(nèi)容特點(diǎn),需要對(duì)這些信息特征進(jìn)行分析研究,對(duì)數(shù)據(jù)之間的關(guān)系以及模式進(jìn)行提取,以便獲取有價(jià)值的信息。
1.2.1圖像數(shù)據(jù)挖掘技術(shù)
數(shù)字圖書(shū)館中的圖像數(shù)據(jù)種類(lèi)繁多,其中包括圖畫(huà)、建筑物圖、CAT掃描圖、X線片、星球地圖、天文物體圖等。圖像具有豐富的視覺(jué)與空間特性,其中視覺(jué)特性指的是顏色、性狀、輪廓、紋理等特征,空間特性主要包括邊緣探測(cè)、目標(biāo)模式、邊緣提取、模式識(shí)別等。圖像數(shù)據(jù)挖掘需要從圖像中提取能夠代表以及區(qū)分該圖像的內(nèi)容特點(diǎn)信息,并且需要收集針對(duì)圖像處理和數(shù)據(jù)挖掘的知識(shí)內(nèi)容。當(dāng)圖像數(shù)據(jù)挖掘內(nèi)容確定之后,需要對(duì)圖像內(nèi)容進(jìn)行分析、分類(lèi)以及檢索等操作,對(duì)挖掘到的信息進(jìn)行解釋與表達(dá),從而獲取更深層的含義。
1.2.2視頻挖掘技術(shù)
視頻主要是由各種各樣的圖像幀序列組成的,其可以使用全局或者局部特征來(lái)表達(dá)。通過(guò)視頻處理技術(shù)將視頻的屬性進(jìn)行分割與分類(lèi),從而取得視頻結(jié)構(gòu)模式,并且可以從視頻中獲得視頻對(duì)象,對(duì)其運(yùn)行動(dòng)態(tài)進(jìn)行跟蹤。通過(guò)時(shí)間的特點(diǎn)分析視頻之間的關(guān)聯(lián)性,以便獲取更深層的事件內(nèi)容。
1.2.3聲音挖掘技術(shù)
聲音挖掘主要對(duì)象是語(yǔ)音中的聲音,通過(guò)對(duì)聲音數(shù)字化的處理后可以得出音頻。其中音頻的挖掘主要通過(guò)兩種方式來(lái)完成的。其一,使用語(yǔ)言知識(shí)識(shí)別技術(shù)將語(yǔ)音轉(zhuǎn)變成文字,將音頻挖掘改變成為文字挖掘。其二,通過(guò)直接法在音頻中獲取聲音的特點(diǎn),例如音調(diào)以及韻律、節(jié)奏等,通過(guò)聚類(lèi)分析法對(duì)聲音的模式進(jìn)行分析,從而分析音頻的基頻、能量分布特點(diǎn)等,以便獲取音頻中的對(duì)象結(jié)構(gòu),提取出內(nèi)在的信息與規(guī)律。
2 數(shù)字圖書(shū)館中多媒體數(shù)據(jù)挖掘技術(shù)的系統(tǒng)結(jié)構(gòu)
2.1 多媒體數(shù)據(jù)庫(kù)
在數(shù)字圖書(shū)館多媒體數(shù)據(jù)中,主要包括原始的數(shù)據(jù)庫(kù)和元數(shù)據(jù)庫(kù)。其中原始的數(shù)據(jù)庫(kù)指的是原始的多媒體數(shù)據(jù),例如各種圖像、視頻以及音頻等數(shù)據(jù)信息。這些數(shù)據(jù)的媒體結(jié)構(gòu)與元數(shù)據(jù)庫(kù)中的描述具有緊密的關(guān)聯(lián)性,可以通過(guò)可視化的方式進(jìn)行表達(dá)和存取。元數(shù)據(jù)庫(kù)指的是一種按照挖掘要求組成多維度、多層次以及多媒體的數(shù)據(jù)庫(kù)。其能夠有效的提高媒體數(shù)據(jù)挖掘的效率。
2.2 挖掘引擎
數(shù)字圖書(shū)館中多媒體數(shù)據(jù)挖掘引擎主要由一組快速的挖掘算法組成,其中涉及到數(shù)據(jù)的分類(lèi)、關(guān)聯(lián)分析、聚類(lèi)、總結(jié)等方面。數(shù)字圖書(shū)館多媒體數(shù)據(jù)挖掘系統(tǒng)可以根據(jù)具體的應(yīng)用情況,選擇一個(gè)或者多個(gè)挖掘算法,對(duì)數(shù)據(jù)進(jìn)行深入的挖掘。
2.3 數(shù)據(jù)預(yù)處理結(jié)構(gòu)
數(shù)字圖書(shū)館中多媒體數(shù)據(jù)預(yù)處理結(jié)構(gòu)主要是通過(guò)對(duì)多媒體數(shù)據(jù)進(jìn)行結(jié)構(gòu)化的處理,并對(duì)數(shù)據(jù)的特征進(jìn)行提取。在圖像數(shù)據(jù)預(yù)處理的過(guò)程中,需要對(duì)圖像中的信息進(jìn)行結(jié)構(gòu)化處理,并對(duì)其進(jìn)行分割研究。同時(shí),在視頻與音頻信息處理過(guò)程中,均需要通過(guò)這種方式來(lái)處理。另外,在處理的過(guò)程中,需要對(duì)事件進(jìn)行標(biāo)記,對(duì)其敘事結(jié)構(gòu)進(jìn)行組織,并分析其語(yǔ)義的關(guān)聯(lián)性。數(shù)據(jù)預(yù)處理結(jié)構(gòu)主要是以元數(shù)據(jù)的形式將其記錄在元數(shù)據(jù)庫(kù)中。
2.4 用戶挖掘數(shù)據(jù)接口
用戶挖掘數(shù)據(jù)的接口主要是對(duì)挖掘結(jié)果進(jìn)行解釋和呈現(xiàn)的界面,可以為用戶提供交互接口以及擴(kuò)展的挖掘語(yǔ)言。根據(jù)多媒體的視頻以及時(shí)空特點(diǎn)進(jìn)行分析,數(shù)據(jù)挖掘出來(lái)的結(jié)果需要通過(guò)新型的表達(dá)方式呈現(xiàn)出來(lái)。例如可以通過(guò)導(dǎo)航式的知識(shí)開(kāi)展與交互式的問(wèn)題求解過(guò)程來(lái)呈現(xiàn),并且可以為數(shù)據(jù)挖掘結(jié)果提供可視化的接口,方便用戶的查詢和了解。在數(shù)字化圖書(shū)館中,通過(guò)這種方式可以讓用戶更加便利的獲取自己所需要的信息資源。
3 數(shù)字圖書(shū)館中多媒體數(shù)據(jù)挖掘技術(shù)分析
3.1 相似搜索技術(shù)
傳統(tǒng)的數(shù)據(jù)庫(kù)搜索方式主要是通過(guò)關(guān)鍵字、詞的搜索來(lái)操作的。例如,在搜索圖像的時(shí)候,通過(guò)圖像的標(biāo)題、關(guān)鍵字以及尺寸進(jìn)行檢索。這些搜索均可以通過(guò)人工描述其信息特點(diǎn),并將其信息特點(diǎn)提交給搜索引擎,以便更好的查找所需要的資源。但是這種搜索方式所產(chǎn)生的結(jié)果質(zhì)量較差,這種檢索方式?jīng)]有統(tǒng)一的標(biāo)準(zhǔn)。目前基于內(nèi)容的搜索方式就是在這種背景下提出來(lái)的,其主要是通過(guò)視覺(jué)的特征來(lái)標(biāo)引圖像,并根據(jù)圖像的特征進(jìn)行相似性檢索。這種檢索方式能夠符合各種信息的檢索,其具有較好的檢索效果。
3.2 關(guān)聯(lián)挖掘技術(shù)
數(shù)字圖書(shū)館中的信息和數(shù)據(jù)涉及到各個(gè)方面,其中圖像、視頻、音頻等數(shù)據(jù)庫(kù)中涵蓋到多媒體數(shù)據(jù)對(duì)象的關(guān)聯(lián)規(guī)則有以下幾個(gè)方面。其一,圖像內(nèi)容與非圖像內(nèi)容之間的關(guān)系,視頻內(nèi)容與非視頻內(nèi)容之間的關(guān)系,音頻內(nèi)容與非音頻內(nèi)容之間的關(guān)系等。其關(guān)聯(lián)規(guī)則主要需要根據(jù)顏色、語(yǔ)調(diào)、尺寸、紋理等方面進(jìn)行分析,例如,在一張圖中,上半部分50%以上均為藍(lán)色,那么很有可能是表示天空。這些關(guān)聯(lián)的規(guī)則與知識(shí)庫(kù)具有較大的聯(lián)系。其二,與空間關(guān)系無(wú)關(guān)的內(nèi)容關(guān)聯(lián)性。例如,在一張圖片中,有兩個(gè)藍(lán)色的圓形,對(duì)其進(jìn)行推測(cè)可以看出很有可能在圖片中還存在一個(gè)紅色的正方形,同時(shí),在大多數(shù)知名品牌的商標(biāo)中,通常會(huì)出現(xiàn)各種特殊的圖案。通過(guò)這種思維模式的推測(cè),可以分析內(nèi)容的關(guān)聯(lián)性。其三,與空間有關(guān)的內(nèi)容關(guān)聯(lián)性。
3.3 多維分析
多維分析指的是多媒體數(shù)據(jù)通過(guò)組成立方體的數(shù)據(jù)庫(kù)來(lái)分析的,具有多維性特點(diǎn)。其多維內(nèi)容包括:圖像的尺寸以及視頻的節(jié)數(shù)、圖像與視頻的網(wǎng)絡(luò)狀況、視頻與圖像建立的時(shí)間等。這些多維層面的內(nèi)涵可以根據(jù)實(shí)際情況自行定義,多維的建立與分析有利于多媒體數(shù)據(jù)挖掘技術(shù)在視頻內(nèi)容以及圖像方面進(jìn)行深入的分析。但是在進(jìn)行多維分析的時(shí)候,需要考慮到維數(shù)建立的問(wèn)題,由于維數(shù)較大的數(shù)據(jù)立方體建立起來(lái)比較困難,因此需要制定出更便利的建立方案,以便為多維分析提供前提依據(jù)。
3.4 多媒體數(shù)據(jù)的表達(dá)方式
在數(shù)據(jù)挖掘技術(shù)的發(fā)展過(guò)程中,其底層多媒體數(shù)據(jù)的表達(dá)以及相關(guān)規(guī)定的重要性逐漸突顯出來(lái)。隨之多媒體內(nèi)容描述的相關(guān)接口研發(fā)出來(lái),之后又提出來(lái)一種多媒體內(nèi)容的標(biāo)準(zhǔn)化描述方案,這種方案能夠適用于現(xiàn)實(shí)生活的各個(gè)方面。通過(guò)對(duì)描述對(duì)象的各個(gè)特征進(jìn)行提取,并在此前提下,對(duì)數(shù)據(jù)挖掘技術(shù)中的數(shù)據(jù)庫(kù)、知識(shí)庫(kù)以及挖掘引擎等進(jìn)行設(shè)計(jì)與建設(shè),并為其提供相關(guān)的依據(jù)。在多媒體數(shù)據(jù)描述方案中,對(duì)多媒體數(shù)據(jù)挖掘技術(shù)的定義比較廣泛,其主要涉及到圖像、表格、音頻以及視頻等方面,同時(shí)對(duì)人的情感色彩、事物的發(fā)生過(guò)程、人的價(jià)值取向等進(jìn)行分析。并且通過(guò)各種元素的相互結(jié)合,組成標(biāo)準(zhǔn)的多媒體演示。其中標(biāo)準(zhǔn)的描述集合與描述定義語(yǔ)言主要是用來(lái)描述各種類(lèi)型的多媒體數(shù)據(jù),并根據(jù)相關(guān)指定要求形成各種描述方案。
4 結(jié)語(yǔ)
在當(dāng)今信息、網(wǎng)絡(luò)等技術(shù)的發(fā)展過(guò)程中,圖書(shū)館逐漸進(jìn)入到數(shù)字化、信息化發(fā)展模式中,在數(shù)字圖書(shū)館中,需要通過(guò)多媒體數(shù)據(jù)挖掘技術(shù)對(duì)信息資源進(jìn)行索取,為用戶提供更加便捷、人性化的搜索模式,以便提高信息獲取的效率。在多媒體數(shù)據(jù)挖掘技術(shù)中,還需要對(duì)各種技術(shù)與方法進(jìn)行優(yōu)化與完善,以便為用戶提供更加優(yōu)質(zhì)的服務(wù)。
參考文獻(xiàn)
[1]吉根林.Web挖掘技術(shù)研究[J].計(jì)算機(jī)工程,2012,14(1):25.
[2]鄭美英.新世紀(jì)對(duì)數(shù)字圖書(shū)館建設(shè)的要求[J].廈門(mén)科技,2011,12(3):64.