魏衍君,鄭青碧,楊明莉
(商丘職業(yè)技術(shù)學院 計算機系,河南 商丘 476000)
自人類社會形成以來,人們對模擬人臉一直抱有濃厚的興趣。最初實現(xiàn)人臉模擬的方法包括美術(shù)繪畫、泥塑藝術(shù),隨著計算機技術(shù)的發(fā)展人臉建模技術(shù)的應用領域也日益廣泛,人們利用計算機優(yōu)良的數(shù)據(jù)計算和處理能力使人臉模擬技術(shù)日趨完善,不管是二維還是三維人臉圖像,都可以在計算機上進行模擬和演示。現(xiàn)在三維人臉建模技術(shù)已經(jīng)作為一個研究熱點而廣受關注。
當前雖然已經(jīng)在三維人臉重建方面取得了一些成就,但在實現(xiàn)完美的三維人臉構(gòu)建方面還存在有許多問題,從幾何結(jié)構(gòu)上來看,人臉表面具有極其復雜的外部輪廓曲線和紋理信息,只有利用精深的數(shù)學方法才能描繪這些特性。表情動作的仿真、頭發(fā)的模擬、光照強度的調(diào)整、真實感紋理映射等這些問題的徹底解決都有一定的難度,近些年來圖像圖形學專家一直致力于解決這些難題。
三維人臉建模雖然存在許多難以解決的問題,但很多學者專家還是在堅持不懈的致力于該方面的研究,主要有以下兩方面的原因:首先是現(xiàn)有的一些問題用二維圖像的方法不能很好地解決。在人臉識別方面,最終識別效果主要是由表情變化問題來決定,如果充分利用三維信息來識別三維人臉模型,將會大大提高人臉識別的準確率和魯棒性。其次,三維人臉模型被廣泛應用于社會生活的各個領域,具有廣闊的應用前景。目前,三維人臉模型已經(jīng)普遍應用于科教、娛樂、醫(yī)療和安全檢測等多個領域,而且隨著計算機技術(shù)和科學技術(shù)的發(fā)展,三維人臉模型將會有越來越廣闊的應用前景。
近年來,隨著計算機技術(shù)的進一步發(fā)展,一些科研機構(gòu)開始嘗試根據(jù)三維掃描儀獲得的人臉數(shù)據(jù)信息構(gòu)建三維人臉模型。該方法通常是首先對數(shù)據(jù)信息進行預處理,然后根據(jù)計算機圖形學方法對處理過的數(shù)據(jù)信息進行點云三角化,最后通過網(wǎng)格優(yōu)化策略構(gòu)建特定三維人臉模型。此方法適用于不要求結(jié)構(gòu)信息的建模。
三維數(shù)據(jù)信息可以通過物理設備激光掃描儀獲取。而且它可以同時獲取模型的幾何結(jié)構(gòu)信息和紋理信息,也是獲取距離數(shù)據(jù)的一個準確有效的手段,許多研究小組已經(jīng)開始使用此設備進行科學研究。德國學者Blanz和Vette[1]創(chuàng)建了一個包含三維距離信息和表面紋理信息的頭部數(shù)據(jù);康柏劍橋研究所的Waters[2]等人利用激光掃描系統(tǒng)獲取的三維數(shù)據(jù)信息進行三維頭部建模。多倫多大學的Lee[3]等人利用激光掃描儀獲取的三維幾何數(shù)據(jù)信息和紋理信息,通過變換標準人臉網(wǎng)格模型構(gòu)建特定人臉模型。國內(nèi)不少研究者也對人臉建模和動畫技術(shù)抱有濃厚的興趣,不同的研究機構(gòu)在該領域作了許多研究工作。中國科學技術(shù)大學、中國科學院計算技術(shù)研究所、清華大學、中國科學院自動化研究所和浙江大學等在獲取三維人臉數(shù)據(jù)和三維人臉建模方面都取得了一定的成就。中科院自動化研究所使用激光掃描儀獲取三維數(shù)據(jù),為后續(xù)建模工作奠定了基礎。根據(jù)三維數(shù)據(jù)創(chuàng)建的三維人臉模型具有較高的真實度,但該方法建模成本高,算法不容易實現(xiàn),同時對三維數(shù)據(jù)的精度要求很高,目前還沒有被普遍使用。
基于標準人臉模型建模,通常是利用普通相機拍攝的二維圖像為基礎進行三維人臉建模。特定三維人臉模型的構(gòu)建過程分為三個階段:三維標準人臉模型的選擇、特定三維人臉模型的變換、真實感紋理映射。華盛頓大學的Pinhin[4]等人采用多幅圖像變形三維標準人臉模型,他們使用的標準模型是Toronto大學的線框模型?;趫D像的三維人臉建模方法建模效率高,圖像容易獲取,雖然由于三維數(shù)據(jù)存在噪聲問題,降低了建模的精確度,但它的實用性更強,適用范圍更廣,也是目前研究的主流方向。
標準人臉模型通常是根據(jù)第三方建模軟件來獲取。一個特定人臉的建模過程是對標準人臉模型的修改過程。從標準人臉模型到特定人臉模型的變換分兩個步驟,第一步是整體變換,對標準人臉模型進行整體輪廓的調(diào)整,使其與特定人臉高度、寬度和深度相一致,且使臉部的五官位置相對應,實現(xiàn)模型的形似。第二步是局部變換,根據(jù)特定人臉的五官位置和形狀對模型進行進一步的細致調(diào)整,使其與特定人臉在具體的人臉五官的形狀和位置也相同,實現(xiàn)模型的神似。
基于一個標準模型的修改方法,為了控制和操作的可行性,試驗中只從照片上得到了模型上特征點的空間坐標。存在的基本問題是:如何通過特征點的運動來控制模型上非特征點的變化,即空間變形問題。現(xiàn)有變形方法的實現(xiàn)主要是散亂數(shù)據(jù)插值方法,即在三維標準人臉模型和特定人臉模型之間建立一個映射關系函數(shù)。根據(jù)該函數(shù)可以求出任意位置的函數(shù)值。插值算法的好壞直接關系到模型的精確度,插值函數(shù)的設計是插值算法的核心問題。下面介紹幾類常見的空間插值技術(shù)[5-7]:
1)最近鄰點插值法 最近鄰點插值法又被稱為泰森多邊形方法,它是一種最簡單的插值方法,該算法的基本原理是:每一個插值輸出像素的值就是在輸入圖像中與其最臨近的采樣點的值。
最近鄰點插值方法使用較為廣泛,不需其他附加條件,容易實現(xiàn),執(zhí)行速度快,而且由于它是均質(zhì)無變化的,如果被插值的數(shù)據(jù)是均勻間隔的話,用該方法進行插值很有效。但是如果被插值的數(shù)據(jù)不是均勻間隔的話,很多區(qū)域?qū)邢嗤暮瘮?shù)值,因而往往會導致變量值的錯誤估計,并且由該插值算法產(chǎn)生的表面很粗糙。
2)距離反比加權(quán)法 距離反比加權(quán)插值法是最早實現(xiàn)的計算機內(nèi)插方法。它的基本原理是假設平面上分布著若干個離散點,如果各個點的空間位置坐標 (Xi,Yi)和它們的屬性值Zi都是已知的,那么P點的屬性值可以利用周圍分布的離散點的屬性值,由距離加權(quán)插值算法求出。
距離反比加權(quán)插值法綜合了最近鄰點插值法和多元回歸法的漸變方法的優(yōu)點,能夠以精確、平滑的方式實現(xiàn)插值算法,而且方法簡便、易于實現(xiàn)。該算法的缺點是忽略了數(shù)據(jù)場在空間的分布情況,經(jīng)常會由于采樣點的分布不均而導致誤差,因而在理論上,它屬于一種純幾何性質(zhì)的加權(quán)運算技術(shù)。
3)趨勢面擬合法 趨勢面擬合法是一種被廣泛使用的整體插值算法,它能夠使用有限個觀測數(shù)據(jù)值對曲面進行擬合,從而完成對曲面的內(nèi)插,以達到最佳插值效果。其基本原理是現(xiàn)象特征的變化趨向利用函數(shù)代表的曲面來擬合。描繪長距離漸變特征的最容易的方法是多項式回歸分析。多項式回歸分析的基本原理是根據(jù)數(shù)據(jù)是一維還是二維選擇線或面的多項式,然后利用多項式表示的線或面按最小二乘法原理擬合數(shù)據(jù)點。
回歸函數(shù)的次數(shù)通常為2或3就行了,并不是越高越好。次數(shù)較高的多項式能夠很好對觀測點進行逼近擬合,但同時會加大計算量,提高計算的難度,并且會減弱插值的效果。趨勢面擬合方法不僅能夠?qū)崿F(xiàn)整體空間的孤立點內(nèi)插,而且還能夠?qū)^(qū)域中在趨勢規(guī)律之外的偏離部分展現(xiàn)出來。
4)樣條函數(shù)插值法 樣條函數(shù)插值算法具有穩(wěn)定和光滑的特性,它成為在已知點之間完成插值的一種有效方法。樣條函數(shù)的基本原理是己知數(shù)據(jù)點的逼近是通過分段多項式來實現(xiàn),而且又能確保在各段連接的地方具有一定的平滑性。
樣條函數(shù)適用于表面光滑的物體對象,而且要求樣條函數(shù)必須有連續(xù)的一階導數(shù)和二階導數(shù);樣條函數(shù)的優(yōu)點是二次樣條函數(shù)和三次樣條函數(shù)都可以得到了令人滿意的插值效果,該插值方法尤其適合大量密集點內(nèi)插等值線。樣條函數(shù)的不足是無法對誤差大小進行精確的估計,而且當點的分布比較稀疏時,不能達到令人滿意的效果。
三維人臉建模系統(tǒng)的選擇與其所面向的應用領域密切相關,不同的應用領域具有不同的選擇標準。三維人臉建模技術(shù)主要應用于以下幾個方面。
1)影視娛樂 專業(yè)的影視游戲制作人員一直在不斷尋找最優(yōu)的三維建模技術(shù),從而給觀眾帶來最佳的視覺盛宴。從幾年前我國的《寶蓮燈》到近期的《樂火男孩》,以及美國最近的電影《阿凡達》等,都充分體現(xiàn)了三維人臉建模技術(shù)的非凡魅力。
2)通訊領域 自從電話進入人們的生活后,給人們帶來很大的方便,它已經(jīng)成為人們?nèi)粘I畹囊粋€重要組成部分,但普通電話只是聲音的傳遞工具,隨著生活水平的提高,人們希望通話的同時可以看到對方。三維人臉建模技術(shù)可以滿足人們的這一需求。
3)醫(yī)學領域 在醫(yī)學領域中,三維人臉建模技術(shù)主要適用于心理與行為研究和面部美容手術(shù)整形治療等方面。不斷成熟的三維人臉建模技術(shù)為心理學家進行心理活動和面部運動的研究提供了實驗基礎。心理學家能夠在計算機上利用三維模型來完成他們的實驗,這比用真人進行研究更加方便快捷。
4)計算機輔助教學 三維人臉建模技術(shù)可以應用到計算機輔助教學中。學生可以隨時隨地與類似真人的虛擬老師進行互動學習,營造良好的學習氛圍,增強了學生的學習積極性。
5)人臉識別 人臉識別技術(shù)屬于生物特征識別技術(shù),是對生物體本身的特征來區(qū)分生物個體。經(jīng)過很多專家學者堅持不懈的努力,在人臉識別領域已經(jīng)取得了很大成就。特別是近些年來,三維人臉識別技術(shù)已經(jīng)逐漸成熟,與二維人臉識別相比,它具有更高的精確性和魯棒性,而且也具有更廣闊的應用前景和更大的市場潛力。
總之,作為計算機視覺領域倍受關注的熱點,真實感三維人臉建模技術(shù)的研究,不僅具有較高的理論研究價值,而且更具有潛在的實際應用價值。
近年來計算機技術(shù)的迅速發(fā)展及實際應用的需求推動了三維人臉建模技術(shù)的發(fā)展,但在該領域仍有許多問題尚待探索和解決。未來研究熱點將會集中在以下幾個方面:
1)利用單張二維圖像結(jié)合計算機視覺技術(shù)進行三維數(shù)據(jù)獲取。該技術(shù)是建模成本最為低廉,也是最為實用的一種建模方法。
2)構(gòu)建三維人臉動畫,豐富三維人臉表情,從而可以擴大使用范圍。
3)提高建立特定三維人臉模型的實時性。雖然近年來出現(xiàn)了一些較好的算法,但是距離實用化、自動化還有一段距離,由于問題本身的難度,此方向依然是今后研究的難點。
由于三維人臉模型的復雜性和趣味性,引起了許多學者的關注,并且在此投入很大的精力。隨著相關領域理論研究的迅猛發(fā)展,以及實際需求的推動和研究者的廣泛關注,三維人臉建模將會在理論和應用兩方面獲得重大突破。
[1]Blanz V,Vetter T.A morphable model for the synthesis of 3D face[C]//In:SIGGRAPH Proceedings Orlando, FL USA,1999:71-78.
[2]Waters K, Terzopoulos D.Modeling; and animating faces using scanned data[J].Visualization and Computer Animation,1991,2(4):23-128.
[3]Lee Y C,Terzopoulos D,Waters K.Realistic face modeling for animation[C]//In:SIGGRAPH Proceeding Los Angeles,CA.USA,1995:55-62.
[4]Pighin F, Heeker J, Lischinski D, et al.Synthesizing realistic facial expression from photographs[C]//In:SIGGRAPH Proceeding Orlando, FL.USA,1998:75-84.
[5]Colombo A,Cusano C,Schettini R.3D face detection using curvatureanalysis[J].PatternRecognition,2006,39(3):444-455.
[6]Gong X,Wang G.Automatic 3D face segmentation based on facialfeatureextraction[C]//In:Proc.ofthe IEEEConf.on Industrial Technology.Mumbai:IEEEComputerSociety,2006:1154-1159.
[7]Gong X,Wang G Y.A dynamic component deforming model forfaceshapereconstruction[C]//Proceeding of the International Symposium on Visual Computing, USA,2007:488-497.