申雪克
(南陽理工學院圖書館,河南 南陽 473061)
筆者基于對信息資源數(shù)字化生產項目的考察與分析,得出影響數(shù)字圖像質量的生產因素主要有掃描分辨率、位元深度、文件格式、圖像壓縮、圖像增強處理和數(shù)字化生產操作的人員等。
分辨率是一種識別空間細節(jié)的能力,是決定數(shù)字圖像質量的最重要因素之一。數(shù)字圖像采樣時所使用的空間頻率(采樣頻率)常常是分辨率的一個重要指標。因此,dpi(每英寸取樣的點數(shù))和ppi(每英寸取樣的像素數(shù))常常用來表示數(shù)字圖像的分辨率。通常情況下,增加采樣頻率有助于提高分辨率。但是,無論是多高的分辨率,圖像放大到一定程度后,仍可看到構成圖像的單個像素。
對于數(shù)字化掃描設備來說,掃描分辨率表示掃描儀在既定文檔中捕獲像素的模式與數(shù)量,它決定了從原始文獻中所采集信息的精細程度,掃描分辨率越高,所獲得的圖像越精細。掃描階段,應盡可能多地捕獲原始文獻信息,以便在后面的轉換處理、打印輸出過程中即使丟失部分信息,仍然可以保持一定的圖像信息總量,保證數(shù)字圖像的相應品質。
但是,提高分辨率有一個“度”的問題,當超過這個“度”時,分辨率的增加無助于數(shù)字圖像質量的提高,只能導致文件體積的增大,增加生產成本。關鍵問題在于尋找到抓取原始文獻所有有價值信息所需的分辨率。
事實上,不存在一個“完美無缺”的分辨率用來掃描所有類型的信息資源。因此,掃描分辨率的設置沒有統(tǒng)一的尺度,主要取決于被掃描的文獻原稿、掃描需求以及圖像處理要求等。一般認為,最佳掃描分辨率應該界定為,在輸出的數(shù)字圖像中,能夠保證最小字符或最有意義的信息清晰可讀。但這在實際工作中常常難以確定。首先,就最小字符而言,對于印刷文本,最小的字符常常是上標、腳注等,但手稿的最小字符就難以確定,影響手稿字跡清晰可讀的因素很多,如墨色濃淡、字跡大小等等。其次,最有意義的信息的確定取決于數(shù)字圖像的用途與用戶的主觀判斷。比如,對于照片、圖片和地圖等文獻,最有意義的信息就很難確定,一幅圖片上哪個信息更為重要,是隨使用目的(欣賞、作為證據(jù)、還是用于資料)以及用戶需求(普通用戶、研究人員、鑒賞家等)而變化的。
掃描分辨率的確定還得考慮輸出的圖像文件是否需要光學識別。分辨率設置不當,低版本的OCR可能根本無法識別文字材料。對于不同的掃描模式,OCR的識別能力與要求也不同。盡管目前OCR軟件一般都具有識別彩色稿件的功能,但從效果看,黑白掃描模式的識別率較高。對于大多數(shù)黑白掃描的印刷型文本,300dpi是可以進行OCR識別的最低值,若被掃描的文獻字體太小,分辨率就需增加,特別小的字體要增加到600dpi才可較好地進行OCR識別。反之,被掃描的字體大,分辨率可考慮減少。對于灰色模式的掃描,OCR對掃描分辨率的要求不宜低于200dpi。盡管今天的OCR技術還存在諸多不盡人意的地方,但光學字符識別代表了數(shù)字掃描與圖像處理同時進行的發(fā)展趨勢。
另外,在黑白掃描模式中,還有一個“閾值”的設定問題。不同的“閾值”點(0~256 之間,0 表示“黑”,256表示“白”)將決定捕捉到的灰度值是被轉換成黑像素還是白像素。所以,同一臺掃描儀以同樣的分辨率進行掃描,“閾值”的設定不同,掃描效果可能很不一樣。
位元深度是指定義每個像素所用的位數(shù)。位元深度值越大,能夠表現(xiàn)的色調數(shù)量就越多。位元深度直接影響數(shù)字圖像的形態(tài)。數(shù)字圖像的形態(tài)有黑白(或稱雙調)、灰色或彩色三種。
每個像素由一個位構成,而一個位可以表示兩種色調(一般是“黑”與“白”),如用 0表示黑,則 1表示白,反之亦然。
由多個位(一般是2~8個位或更多位)的信息所表現(xiàn)的像素所構成。比如,在一幅2位圖像中,有四種可能的組合:00、01、10、11。如果用“00”表示黑,“11”表示白,那么“01”便是深灰,“10”便是淺灰。位元深度為2,能夠表現(xiàn)的色調數(shù)量為22,即4。如果位元深度是8,則每個像素能夠有28(256)種不同的色調。
通常由8~24或更多的位來表現(xiàn)的圖像。就24位元深度的圖像(一般稱RGB)而言,位元常分為三組:8位紅、8位綠、8位藍。這些位組合起來表現(xiàn)相應的顏色。一幅24位的圖像,可以提供1670多萬(224)色調值。越來越多的掃描儀以每個頻道10或10以上的位元深度來捕獲圖像,但常常輸出是8位,以補償掃描儀中的“噪波”,輸出更接近人的視覺圖像。
文件格式中包括了文件信息和文件頭信息,這些信息給出對文件進行讀寫和解釋的方法。不同的文件格式在分辨率、位元深度、彩色功能以及對壓縮的支持和元數(shù)據(jù)的析出方法等方面會有所不同。
數(shù)字主文檔采用的文件格式應該支持所需的分辨率、位元深度、顏色信息和元數(shù)據(jù)。例如,如果采用的數(shù)字主文檔的文件格式不支持8位以上位元深度的圖像,那么掃描為全彩色圖像就失去了意義。另外,數(shù)字主文檔的文件格式應該是開放的、廣泛支持的和跨平臺兼容的,因為這樣的文檔格式有利于數(shù)據(jù)交換,且生命周期長。目前絕大多數(shù)數(shù)字化項目采用TIFF格式來保存數(shù)字化主文檔,并使用其他格式來保存數(shù)字主文檔的各類副本。
數(shù)字化生產產生的數(shù)字圖像一般都比較大,不利于計算機處理和網(wǎng)絡傳輸,為此,數(shù)字化項目常常需要采用一定的技術對其進行壓縮。所有壓縮技術都是基于一些復雜算法,將未壓縮的數(shù)字圖像中的二進制代碼串縮減為一種數(shù)學縮略形式。
壓縮技術有標準和專用之分。一般來講,使用一種得到廣泛支持的標準壓縮技術比使用專用壓縮技術更有利,雖然后者有時可能會提供更有效的壓縮或更好的質量,但從數(shù)字資源長期保存和應用的角度,標準壓縮技術更可靠,效率更高。
從壓縮前后文件中信息量的損失角度,壓縮技術又分為無損壓縮(如ITU-T.6)和有損壓縮(或稱失真壓縮)(如JPEG)兩類。無損壓縮利用數(shù)據(jù)的統(tǒng)計冗余進行壓縮,數(shù)據(jù)“解壓縮”后,完全恢復到原來狀態(tài),與原文件比特對比特地一致,不會導致任何失真,但壓縮率受到數(shù)據(jù)統(tǒng)計冗余度的限制。GIF、TIFF和PNG格式都支持無損壓縮。
有損壓縮利用了人類視覺對圖像中的某些頻率成分不敏感的特性,對一些最不重要的信息進行了平均化處理或者舍棄。所以,有損壓縮可以認為是“視覺無損”(在視覺效果上察覺不到損傷)。有損壓縮中,壓縮程度的不同對圖像的質量效果影響不同,一些新興的壓縮方法允許從一個圖像生成多種分辨率的圖像,從而使得圖像交付和呈現(xiàn)給最終用戶時,具有一定的靈活性。
在信息資源數(shù)字化項目實施過程中,無損壓縮常用于印刷文本的黑白掃描,有損壓縮則用于色調圖像(尤其是連續(xù)色調圖像)的掃描。因為后者僅僅靠簡化信息并不能明顯地節(jié)省圖像所占的空間。目前,越來越多的數(shù)字化項目將其生產的數(shù)字主文檔采取不壓縮或無損壓縮方式存儲,而各種副本則采用有損壓縮方式保存并向用戶提供各種服務。
雖然有損壓縮被認為“視覺無損”,但對數(shù)字圖像質量的影響是明顯的,尤其是壓縮比率高的時候。另外,有損壓縮會導致圖像質量的“世襲”性降低(即,基于有損壓縮圖像進行再次有損壓縮操作時,產生的新圖像質量會更低),這也是數(shù)字主文檔不采用有損壓縮存儲的原因之一。
圖像增強處理可以提高掃描后的圖像質量。這類處理一般包括去除網(wǎng)紋、去除斑點、糾正偏斜、銳化、使用定制濾波器以及位元深度調整等。所用的處理工具是圖像掃描加工軟件或圖像編輯軟件。
但是,圖像增強處理的使用引起了人們對圖像真實性和真實度的關注。所以,越來越多的數(shù)字化項目不贊成對數(shù)字化主文檔圖像進行增強處理,增強處理僅局限在由數(shù)字主文檔派生的各種副本上使用。
掃描操作人員的技能與工作狀態(tài)會對數(shù)字圖像的質量產生影響。比如,在黑白掃描模式中,閾值的設定會對圖像質量產生影響,而該項操作是由操作人員通過判斷來實施的,如果設定得當,可以最大限度地減少線條失落或線條粘連現(xiàn)象,否則會導致圖像質量的降低。再如,當使用數(shù)碼相機對三維實物型信息資源進行數(shù)字化拍照時,照明是影響數(shù)字圖像質量的一個重要因素,攝影師的技能則是實施照明效果的關鍵。
[1] Cornell University Library.Attributes for Common Compression Techniques. [2011-01-19].http://www.library.cornell.edu/preservation/tutorial/presentation/table7-3.html.
[2] CornellUniversityLibrary.CommonImageFileFormats.[2010-12-09]..http://www.library.cornell.edu/preservation/tutorial/presentation/table7-1.html.
[3] Cornell University Library.THE CASE FOR CREATING A RICH DIGITAL MASTER.[2010-10-06].http://www.library.cornell.edu/pres ervation/tutorial/conversion/ conversion-03.html.