李艷紅
(西安外事學(xué)院,西安,710077)
傳統(tǒng)的關(guān)系數(shù)據(jù)庫管理系統(tǒng)只支持基本的規(guī)范數(shù)據(jù)類型。隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展和廣泛應(yīng)用,對(duì)計(jì)算機(jī)和數(shù)據(jù)庫提出了處理和管理各種表示復(fù)雜對(duì)象的不規(guī)則數(shù)據(jù)的要求,特別是圖像、聲音、動(dòng)態(tài)視頻等這樣的多媒體信息,數(shù)據(jù)類型不規(guī)則,數(shù)據(jù)的取值范圍不一致,數(shù)據(jù)的量級(jí)不相同。因此,就提出來了如何對(duì)這些多媒體信息進(jìn)行表示、組織、存儲(chǔ)、查詢和檢索的問題,多媒體數(shù)據(jù)庫技術(shù)應(yīng)運(yùn)而生。
媒體(Media)是信息的載體。多媒體是指多種信息媒體,例如圖形、圖像、聲音、視頻、文本、數(shù)字、字符等等復(fù)合體或有機(jī)集成。多媒體數(shù)據(jù)庫管理系統(tǒng)是指把不同媒體數(shù)據(jù)進(jìn)行一體化組織、存儲(chǔ)和管理的數(shù)據(jù)庫管理系統(tǒng)。由于多媒體數(shù)據(jù)庫需要同時(shí)管理規(guī)則數(shù)據(jù)(例如數(shù)字、字符等)和非規(guī)則數(shù)據(jù)(例如:圖形、圖像、聲音、視頻、文本等)。而非規(guī)則數(shù)據(jù)除了具有數(shù)據(jù)量大和處理復(fù)雜等特點(diǎn)外,其中的圖形和圖像等數(shù)據(jù)還具有空間特性,聲音和視頻等數(shù)據(jù)還具有時(shí)序特性。這些都給多媒體數(shù)據(jù)的處理和管理帶來了新的技術(shù)要求。
(1)多媒體數(shù)據(jù)的組織和存儲(chǔ)要求。由于某些多媒體數(shù)據(jù)的數(shù)據(jù)量巨大,按照傳統(tǒng)的方式是無法對(duì)其進(jìn)行組織和存儲(chǔ)管理的,所以除了需要為這類數(shù)據(jù)選擇專門的邏輯組織方式和物理方式外,還需要附加一些必要的處理操作。例如:對(duì)動(dòng)態(tài)視頻數(shù)據(jù)需要進(jìn)行專門的壓縮和解壓縮等。
(2)多媒體數(shù)據(jù)的處理要求。對(duì)多媒體數(shù)據(jù)支持的事實(shí)表明,系統(tǒng)中的媒體數(shù)據(jù)類型不僅增加較多,而且復(fù)雜媒體的數(shù)據(jù)類型和數(shù)據(jù)量的比例明顯增大。對(duì)于每一種媒體數(shù)據(jù)類型來說,都要求有適合于自己的數(shù)據(jù)結(jié)構(gòu)、存取方法、操作要求、基本功能和實(shí)現(xiàn)方法。這些都給多媒體數(shù)據(jù)的處理帶來了難度和困難,給系統(tǒng)的實(shí)現(xiàn)提出了更高的技術(shù)要求。
(3)多媒體數(shù)據(jù)的查詢要求。多媒體數(shù)據(jù)的引入使系統(tǒng)查詢方式呈現(xiàn)出多樣性。要求系統(tǒng)不僅要支持傳統(tǒng)的精確查詢方式,而且要支持非精確查詢、相似查詢、模糊查詢等。在以圖像處理為主要應(yīng)用目的的信息系統(tǒng)(圖像數(shù)據(jù)庫)中,一般要求系統(tǒng)具有基于內(nèi)容的檢索功能,比如按圖像的紋理特征、顏色特征、邊緣特征、形狀特征等進(jìn)行查詢。
(4)其它處理和管理要求。在多媒體數(shù)據(jù)的引入過程中還會(huì)出現(xiàn)其它一些要求。比如動(dòng)態(tài)視頻的播放可能需要幾個(gè)小時(shí),所以就需要系統(tǒng)提供長(zhǎng)事務(wù)支持功能。又比如,在復(fù)雜媒體數(shù)據(jù)描述問題時(shí),對(duì)系統(tǒng)的表現(xiàn)形式、表現(xiàn)質(zhì)量、系統(tǒng)效率等都是有一定要求的。因而對(duì)系統(tǒng)的有關(guān)實(shí)現(xiàn)技術(shù)都提出了更高的要求。
由于多媒體數(shù)據(jù)的多樣性,很難用同一的數(shù)據(jù)模型面向所有的媒體應(yīng)用需求。盡管有各種各樣的多媒體數(shù)據(jù)庫出現(xiàn),但目前還沒有一個(gè)得到公認(rèn)的多媒體數(shù)據(jù)模型,因而也沒有一個(gè)標(biāo)準(zhǔn)的多媒體數(shù)據(jù)庫體系結(jié)構(gòu)。本論文在分析目前的各種多媒體數(shù)據(jù)庫組織方式的基礎(chǔ)上,認(rèn)為目前的多媒體數(shù)據(jù)庫組織結(jié)構(gòu)主要有以下兩種實(shí)現(xiàn)方式。
這種組織結(jié)構(gòu)的基本思想是根據(jù)多媒體數(shù)據(jù)的多樣性特點(diǎn),分別為每一種媒體數(shù)據(jù)建立數(shù)據(jù)庫,分別為每一種媒體數(shù)據(jù)的數(shù)據(jù)庫建立相應(yīng)的數(shù)據(jù)關(guān)系系統(tǒng)。其組織結(jié)構(gòu)示意圖如下圖所示。
在這種結(jié)構(gòu)的多媒體數(shù)據(jù)庫系統(tǒng)中,可以利用各種單一的媒體數(shù)據(jù)庫的技術(shù)對(duì)各個(gè)媒體的數(shù)據(jù)庫進(jìn)行管理。各個(gè)單一媒體的數(shù)據(jù)庫管理系統(tǒng)及其數(shù)據(jù)庫雖然是相對(duì)獨(dú)立的,但它們之間是可以通過相互通信進(jìn)行一定的協(xié)調(diào)和執(zhí)行相應(yīng)的操作。用戶既可以對(duì)單一媒體的數(shù)據(jù)庫進(jìn)行訪問,也可以對(duì)多個(gè)媒體的數(shù)據(jù)庫進(jìn)行訪問。但從總體上來說,同時(shí)對(duì)多個(gè)媒體的數(shù)據(jù)庫進(jìn)行聯(lián)合查詢操作等是比較困難的。也就是說,這種組織結(jié)構(gòu)的多媒體數(shù)據(jù)庫中的各個(gè)不同媒體數(shù)據(jù)庫之間的協(xié)調(diào)是相當(dāng)有限的,用戶必須按照應(yīng)用要求,通過對(duì)不同媒體的數(shù)據(jù)庫管理系統(tǒng)和相應(yīng)的數(shù)據(jù)庫的操作和訪問實(shí)現(xiàn)相應(yīng)的應(yīng)用要求。所以用戶應(yīng)用程序的設(shè)計(jì)相對(duì)要復(fù)雜一些。
這種數(shù)據(jù)結(jié)構(gòu)的基本思想是,在各種不同媒體的數(shù)據(jù)庫管理系統(tǒng)(也即,DBMS)之上建立一個(gè)主數(shù)據(jù)庫管理系統(tǒng),通過主DBMS對(duì)各個(gè)從DBMS進(jìn)行管理和控制,從外部應(yīng)用的角度弱化多媒體數(shù)據(jù)的多樣性,降低用戶應(yīng)用程序設(shè)計(jì)的復(fù)雜性。但每一種媒體數(shù)據(jù)的數(shù)據(jù)庫仍然由各自的數(shù)據(jù)庫管理系統(tǒng)管理。其組織結(jié)構(gòu)示意圖如下圖所示。
在這種結(jié)構(gòu)的多媒體數(shù)據(jù)庫系統(tǒng)中,微觀上各個(gè)媒體數(shù)據(jù)庫的管理仍是由各種單一媒體的數(shù)據(jù)庫管理系統(tǒng)實(shí)現(xiàn)的⑥⑤。但在宏觀上,用戶對(duì)數(shù)據(jù)庫的訪問是由DBMS實(shí)現(xiàn)的,用戶對(duì)多種媒體數(shù)據(jù)的查詢結(jié)果的集成也是由主DBMS實(shí)現(xiàn)的。這樣用戶對(duì)多種媒體數(shù)據(jù)的綜合查詢對(duì)用戶來說是相對(duì)透明的,從而使用戶應(yīng)用程序的設(shè)計(jì)相對(duì)要簡(jiǎn)單一些。
當(dāng)前的各種商用數(shù)據(jù)庫管理系統(tǒng),例如Ingress,ORACLE,Sybase,DB2等都提供了對(duì)多媒體數(shù)據(jù)類型的支持,其支持方式主要是在系統(tǒng)中引入無結(jié)構(gòu)數(shù)據(jù)類型實(shí)現(xiàn)對(duì)多媒體數(shù)據(jù)的存儲(chǔ)。但總的來說它們對(duì)多媒體應(yīng)用的支持是有限的。在多媒體數(shù)據(jù)庫的研究和設(shè)計(jì)還有許多技術(shù)問題需要研究解決,這些問題主要是:①多媒體數(shù)據(jù)類型的研究;②多媒體數(shù)據(jù)庫的標(biāo)準(zhǔn)化查詢與操作語言研究;③多媒體數(shù)據(jù)庫的用戶接口技術(shù)研究;④多媒體數(shù)據(jù)庫的存取和組織技術(shù)研究;⑤多媒體數(shù)據(jù)庫的一體化管理技術(shù)研究;⑥多媒體數(shù)據(jù)庫的控制與并發(fā)機(jī)制研究等。
①基于內(nèi)容的檢索?;诙嗝襟w對(duì)象內(nèi)容的檢索要求用戶必須給出選擇條件。例如用戶可能使用諸如“找出與這個(gè)圖像類似的所有圖像”和“找出至少包含三個(gè)飛機(jī)的圖像”之類的查詢來查找需要的圖像。當(dāng)圖像插入到數(shù)據(jù)庫中時(shí),DBMS必須分析它們,同時(shí)自動(dòng)抽取特征,以利于基于內(nèi)容的查詢,這些信息用來搜索滿足給定查詢的圖像。另一個(gè)示例是,用戶可能使用信息檢索技術(shù)和關(guān)鍵詞搜索來查找感興趣的文檔。數(shù)據(jù)庫供應(yīng)商正在把這些技術(shù)結(jié)合到DBMS產(chǎn)品中。如果將這些特定領(lǐng)域的檢索和搜索技術(shù)與傳統(tǒng)的DBMS查詢有效的結(jié)合仍然不是很清楚。抽象數(shù)據(jù)類型和對(duì)象關(guān)系DBMS查詢處理的研究同樣只是一個(gè)開始,還有很多工作需要做。②管理大對(duì)象的倉庫。通常,DBMS的重點(diǎn)是包含有大量元組的表,每個(gè)元組相對(duì)較小。一旦諸如圖像、聲音片段和視頻這樣的多媒體對(duì)象存儲(chǔ)在數(shù)據(jù)庫中,就必須有效的處理這些非常大的對(duì)象。例如,可以將壓縮技術(shù)集成到DBMS環(huán)境中。另外,分布式DBMS必須開發(fā)一些技術(shù)以便有效的檢索這些對(duì)象。在分布式系統(tǒng)中,多媒體對(duì)象的檢索已經(jīng)在一定范圍內(nèi)被解決了,例如客戶/服務(wù)器系統(tǒng),但是還存在許多難題。③視頻點(diǎn)播。許多公司希望提供視頻點(diǎn)播服務(wù),這些服務(wù)能使用戶撥號(hào)到服務(wù)器,然后請(qǐng)求待定的視頻。視頻必須實(shí)時(shí)地、可靠地和便宜地分發(fā)到用戶計(jì)算機(jī)上,理想的情況是,用戶應(yīng)能夠執(zhí)行相類似VCR的功能,如果快進(jìn)和回放。從數(shù)據(jù)庫的角度講,服務(wù)器必須與規(guī)定的實(shí)時(shí)約束進(jìn)行競(jìng)爭(zhēng),考慮通信網(wǎng)絡(luò)的特征,服務(wù)器和客戶的視頻分發(fā)速率必須能夠同步。
目前,應(yīng)用較多、較成熟的多媒體數(shù)據(jù)庫都是通過對(duì)關(guān)系模型數(shù)據(jù)庫的擴(kuò)展來實(shí)現(xiàn)對(duì)多媒體數(shù)據(jù)的存儲(chǔ)與管理的,在未來的多媒體數(shù)據(jù)庫技術(shù)的發(fā)展中,面向?qū)ο蟮亩嗝襟w數(shù)據(jù)庫將以對(duì)象媒體數(shù)據(jù)模型來建構(gòu)多媒體數(shù)據(jù)庫,從而真正實(shí)現(xiàn)多媒體數(shù)據(jù)庫。
[1]舒涵.營(yíng)造海量多媒體數(shù)據(jù)的家[J].中國(guó) 計(jì)算機(jī)用戶,2003,(19)
[2]范振梅,王晨光,范振鈞.多媒體數(shù)據(jù)庫的實(shí)現(xiàn)[J].通化師范學(xué)院學(xué)報(bào),2004,(04)
[3]劉天惠.Visual Basic 程序設(shè)計(jì)教程[M].北京:清華大學(xué)出版社,2006
[4]周朋紅.多媒體技術(shù)與應(yīng)用[M].北京:中國(guó)水利水電出版社,2005
[5]胡松義.數(shù)據(jù)庫管理系統(tǒng)應(yīng)用教程[M].湖南:湖南人民出版社圖書發(fā)行部,2006
[6]徐蘭芳.數(shù)據(jù)庫設(shè)計(jì)與實(shí)現(xiàn)[M].上海:上海交通大學(xué)出版社,2006