□梁志敏/廣州少年兒童圖書館 廣州 510300
普及生物多樣性信息學技術
——澳大利亞植物標本數(shù)字圖書館
□梁志敏/廣州少年兒童圖書館 廣州 510300
澳大利亞數(shù)字植物標本館(Australia's Virtual Herbarium)是一個免費向公眾提供澳大利亞植物標本及相關植物學信息資源的數(shù)字圖書館。其資源類型包括數(shù)字化標本、圖片、出版物等,涵蓋范圍廣泛,瀏覽、檢索功能齊全。文章重點從資源組織、技術特征、界面設計、服務特點等方面進行了綜合性的評析。
澳大利亞植物標本館,數(shù)字圖書館,植物標本
“澳大利亞數(shù)字植物標本館”(Australia's Virtual Herbarium,以下簡稱AVH)是由澳大利亞標本館首腦理事會(the Council of Heads of Australasian Herbaria,簡稱CHAH)主持的,屬于全球首個實現(xiàn)全國性標本數(shù)字化共享的生物多樣性數(shù)字平臺。
CHAH負責為澳大利亞和新西蘭的主要標本館、植物標本館解決各種行政問題,增加澳大拉西亞植物標本館之間的合作和理解,其業(yè)務由憲法和目標聲明管轄。其成員包括澳大利亞國家植物標本館(阿德萊德)、昆士蘭植物標本館、堪培拉澳大利亞國家植物標本館、澳大利亞亞熱帶植物標本館(凱恩斯)、塔斯馬尼亞植物標本館(霍巴特)、墨爾本維多利亞國家植物標本館、國家植物標本館(悉尼新南威爾士州)、北領地植物標本館(達爾文)、西澳大利亞州的植物標本室(柏斯)、艾倫植物標本館(基督城,新西蘭)、新西蘭惠靈頓蒂帕帕植物標本室、新西蘭奧克蘭博物館植物標本館。
圖1 AVH合作機構分布圖
理事會每年舉辦一次會議,主辦機構在省會城市按以下順序輪換:堪培拉,布里斯班,墨爾本,珀斯,阿德萊德,新南威爾士州,達爾文,霍巴特,凱恩斯,新西蘭基督城,新西蘭惠靈頓和新西蘭奧克蘭。
由其管理的AVH是一個具備搜索功能的包括圖片、數(shù)字化標本、物種地圖等信息資源的數(shù)據(jù)庫,其資源并非由公眾自主上傳,而是由CHAH進行統(tǒng)一收集,使用統(tǒng)一標準軟件對全澳(現(xiàn)已包括新西蘭)十余家主要標本館的數(shù)百萬份標本實施數(shù)字化表達,并通過網(wǎng)絡實現(xiàn)標本信息與環(huán)境信息的關聯(lián)表達及共享。AVH實施十多年來,極大地推動了澳大利亞植物分類學及生物多樣性研究的發(fā)展,澳大利亞也由此成為世界上生物多樣性信息研究及利用的先驅國家之一。
AVH的網(wǎng)址是http://avh.ala. org.au/,在其網(wǎng)站上有較詳細的背景信息,用戶也可從數(shù)字圖書館首頁的搜索引擎和瀏覽界面中找到資源的數(shù)量和來源等相關信息。
AVH收集、展覽的主要對象是植物標本,植物標本是識別植物多樣性的關鍵,它為變化多端的植物及科學研究提供了永久的參考資料。標本還承載和記錄著當?shù)氐臍v史,例如一個地區(qū)某個時期內的植被種類,或不同時期種類的記載、變化情況,包括一種植物首次引入該地的時間等等。這些標本通常是經(jīng)過干燥后,小心裝訂在硬臺紙板上,貼上有關的資料(包括記錄采集時間、地點和采集人姓名的采集標簽,以及由植物專家鑒定的定名簽)。
通過四個多世紀的研究積累,全世界現(xiàn)已認知生物物種約200萬種,物種存在的憑證標本達3億份(件);我國現(xiàn)已描述和認知的生物物種占世界已知物種總數(shù)10%左右,約10萬種,憑證標本達3000萬份(件)。物種及其存在憑證的重要原始材料是保藏在標本館中的植物、動物和菌物標本以及植物園中栽培保育的活植物。這些材料是生物分類學、資源學、物種動態(tài)的監(jiān)測、實施保護和和可持續(xù)利用,以及其他生物學基礎研究最重要的原始材料和基本信息。每個物種和標本的描述性信息達上百項,而現(xiàn)代化的實驗觀測技術,更使每一物種和標本含有的生物信息的信息量呈爆炸性增長。顯然,傳統(tǒng)的研究方法包括標本室研究方法已無法滿足現(xiàn)代信息科學研究及社會大眾對認識物種、發(fā)現(xiàn)物種和利用物種的迫切要求。
AVH在線展示了包括所有成員館的標本六百萬種,類型有植物、藻類和真菌,從覆蓋國家和地區(qū)的生物標本基礎數(shù)據(jù)庫中獲得可信的、新穎的、有效的信息,以能被人們理解和感受的模式表現(xiàn)出來,并使這些原始材料和數(shù)據(jù)實現(xiàn)資源信息共享。
圖2 AVH主頁
AVH的每一項館藏條目都采用統(tǒng)一的元數(shù)據(jù)方案進行描述,同時使用規(guī)范化的受控語言,為揭示條目間的聯(lián)系提供了線索。
館藏使用的元數(shù)據(jù)字段包括題名、目錄編號、采集者、采集日期、館藏地點等(如表1)。在檢索頁面提供的是資源的題名、目錄編號、采集者、采集日期、館藏地點、分布地圖、收藏分析圖表與圖片。描述具體細致,增強了標引的準確度,進而提高了檢索的檢全率和檢準率。
AVH界面設計簡潔清新,功能布局直觀便捷,一目了然。
主頁主色調為綠色,暗示圖書館的主體資源——植物,分別選用植物油畫、標本圖片、標本圖片資源標識作為題圖,并采用幻燈片播放模式進行主動播放,概括性地展現(xiàn)網(wǎng)站主題。
主頁設計包括三大模塊:主菜單、關鍵詞檢索、參與機構介紹。
主菜單占據(jù)頁面上方,包括六個項目:主頁、關于我們、組織團隊、幫助、搜索與最新資訊,讓用戶形成對網(wǎng)站的初步了解,起到導航條的作用。
關鍵詞檢索框處于頁面正中,在AVH的標志圖標之下,非常醒目地突出網(wǎng)站的主要功能。
“參與機構介紹”欄目處于主頁下方,通過超文本連接11個參與機構的主頁,通過點擊機構標志圖標,可進入機構主頁,查閱參與機構的相關信息。由于這些機構同時也是AVH數(shù)據(jù)的提供者,其網(wǎng)站利用鮮艷的圖片、生動的生物及景觀相片來展示主題,通過瀏覽這些機構網(wǎng)站,也能激發(fā)用戶對AVH進行探知的興趣和積極性。
表1 元數(shù)據(jù)字段
AVH網(wǎng)站是使用JSP語言編寫的,固化成HTML頁面輸出,提高網(wǎng)站的速度以及兼容性。
AVH的數(shù)據(jù)是由FieldData software組織并存儲的,把各地研究機構/人員所做的各項關于澳洲植物研究的成果,收集到由“Atlas of living Australia”開發(fā)并運行的數(shù)據(jù)庫系統(tǒng)中,供網(wǎng)站用戶檢索。數(shù)據(jù)是隨時更新的,詳細記錄了標本的地理位置、發(fā)現(xiàn)時間等等信息,隨著更多的數(shù)據(jù)匯集,網(wǎng)站內容也越加豐富。
AVH的植物標本附加自制色卡置于遮擋自然光的人工設定室中,采用翻拍燈營造的無影條件下進行翻拍,器材采用數(shù)碼相機或攝像機。植物標本的形態(tài)特征數(shù)字化后,作為植物標本圖像的原始數(shù)據(jù),供計算機進行處理。利用計算機圖像處理軟件Photoshop等,對原始的植物標本圖像進行縮放和旋轉、調色、對比度、去噪等后期加工處理,數(shù)字圖像使用最高分辨率為800dpi,被保存為JPEG格式。最后按照其資料卡對各種植物標本圖片資源進行專業(yè)標識描述,圖片資料卡中詳細記錄作者、拍照地點、版權所有、來源標簽等描述性數(shù)據(jù),其中來源標簽一項在數(shù)字化后,可點擊跳轉繼續(xù)查詢。在數(shù)字資料卡中還添加了用戶互動的問答提問,詢問此資源及描述是否正確。
AVH面向互聯(lián)網(wǎng)開放,向所有終端用戶提供免費在線資料展覽,其目標用戶主要分為兩類:
(1)研究植物學、規(guī)劃植被恢復工作、追蹤入侵物種的分布、生物勘探、環(huán)境保護規(guī)劃、資源優(yōu)化、植物收集和生物多樣性調查的用戶;
(2)對植物感興趣、或是從地球歷史角度對植物標本感興趣的一般大眾。
(1)檢索服務
AVH提供五種檢索方式:快速檢索、高級檢索、批目錄號檢索、類群檢索、模糊檢索。
快速搜索允許用戶快速執(zhí)行使用一個單一的檢索詞搜索,對搜索詞匹配的第一次嘗試是對標準植物名稱和通用名稱列表。如果沒有找到匹配,匹配將嘗試對照分類單元名稱與標本記錄。如果仍然沒有匹配,將對以下字段:標本館名、植物標本館代碼、目錄編號、收藏家、收集筆記,進行全文搜索。
高級檢索允許用戶使用一個或多個檢索詞進行結構化的查詢。用戶可以查詢的數(shù)據(jù)字段包括分類名稱、分類單元名稱等,可在高級檢索同時輸入最多四個類群的名字進行檢索,如果想在一個時間超過四個類群名稱查詢,可使用批次名稱搜索,在結果頁上添加多個搜索條件。高級檢索也提供全文檢索項目。
批目錄號檢索可以通過目錄號碼進行查詢,允許用戶執(zhí)行一個目錄號列表的查詢。每個目錄號碼需要在查詢框中輸入一個單獨的行,按此格式,可輸入批目錄號碼進行同步查詢。批目錄號碼,是不同的植物標本室所用的目錄編號格式化存儲的數(shù)據(jù)頁的總結。
可以通過植物種屬類群名稱進行查詢。
用戶可以進行自定義的模糊檢索,允許用戶上傳ESRI shape文件,并執(zhí)行一個模糊檢索。
檢索結果提供三種顯示選項供用戶查看:記錄列表、分布圖,以及顯示某些方面的統(tǒng)計圖表。通過結果頁面左側的菜單中的“選擇范圍縮小”選項,并調整結果記錄中的顯示數(shù)值,用戶可以壓縮原始搜索結果,隨著結果范圍變小,地圖和圖表選項卡隨之更新。
(2)自動完成服務
在高級檢索欄中輸入時,當用戶開始打字,將出現(xiàn)一個分類單元名稱建議的下拉列表。這些名字都是ALA的名稱列表,提供植物、真菌和藻類唯一的名稱,雖然不一定對應AVH中的記錄,但ALA名稱列表與AVH記錄之間的對應關系,將提高全國物種清單的完成度。
(3)篩選服務
結果顯示頁面中“縮小選擇范圍”的菜單,可以用來申請額外的搜索條件的結果集。每個結果頁面的頂部上只列有前三個值,但通過點擊“選擇更多”選項,用戶可以通過一個彈出式窗口中查看所有的結果。如果有超過100個值的結果,只會顯示前100個值,但用戶可通過滾動窗口瀏覽接下來的100個值。用戶還可以通過點擊“標題列值”按字母順序排列所有未顯示的記錄數(shù),并通過點擊單一的值來過濾其他,也可以使用復選框選擇最多15個值,選擇這些記錄和結果中選定的值,或排除這些記錄。
(4)個人記錄服務
每條標本記錄都提供一個總結性的“記錄”選項卡。最近期發(fā)表(或編輯)的記錄將出現(xiàn)在列表頂部(注意,這些不一定是最近采集的標本)。點擊個人記錄可打開曾瀏覽記錄的詳細頁面,它提供了所有可用的數(shù)據(jù)記錄。
(5)下載服務
AVH所有數(shù)據(jù),除某些類群的數(shù)據(jù)屬于敏感保護或生物安全方面的原因,是向所有人開放的。用戶可以將搜索結果中的記錄,或獨特的分類名稱中搜索出的結果羅列成一個物種清單,以電子表格的形式進行下載。
(6)下載地圖服務
通過點擊“下載地圖”按鈕,用戶可以下載一個高分辨率的地圖。在彈出的窗口中,用戶可以選擇格式、大小和分辨率的地圖基礎層的大小、顏色和不透明度的地圖符號。
(7)提醒服務
當AVH出現(xiàn)與用戶搜索條件相匹配的的新紀錄時,或用戶搜索結果記錄中出現(xiàn)由用戶貢獻的新注解時,用戶可以使用代理功能得到電子郵件提醒通知。用戶只需要登錄訂閱電子郵件提醒,便可以選擇每月、每周、每天或每小時的基礎上接收提醒。用戶可以選擇搜索結果的任何形式更新條件,如產(chǎn)生新記錄、注釋或圖像添加到AVH時接收提醒。
除了AVH的標志,以及另有注明的項目外,AVH網(wǎng)站上的所有記錄提供澳大利亞署名的知識共享許可證,表示所提供的數(shù)據(jù)源是公共的,允許重新分配基于所述數(shù)據(jù)的任何衍生作品。網(wǎng)站提供鏈接訪問的相關網(wǎng)站,均持有法人代碼為CC 3 AU許可證。
同時AVH也表明用戶使用AVH所提供的數(shù)據(jù)時風險自行承擔。
AVH使用谷歌分析監(jiān)測用于統(tǒng)計網(wǎng)站的使用,包括用戶的互聯(lián)網(wǎng)協(xié)議(IP)地址和頂級域名,網(wǎng)站訪問的日期和時間,訪問頁面,查詢執(zhí)行和數(shù)據(jù)下載,以前的網(wǎng)站訪問和使用的瀏覽器等信息。任何未經(jīng)授權的訪問此系統(tǒng)是禁止的,受到澳洲的刑事和民事法律保護。
用戶從AVH中訪問或下載數(shù)據(jù)不需注冊或登錄,但在使用一些額外功能時,需要用戶注冊登記,如需要登錄才能提交問題與AVH記錄和注冊電子郵件提醒。注冊時需提交一個真正的電子郵件地址,在某些情況下,還可能會要求用戶提供真實姓名或其他識別或聯(lián)系的細節(jié),但這樣的個人信息將按照ALA隱私政策管理。
植物標本是識別植物多樣性的關鍵,它為變化多端的植物及科學研究提供了永久的參考資料。標本館既是自然歷史檔案館,也具有圖書館的功能。計算機技術及網(wǎng)絡信息技術的發(fā)展使得傳統(tǒng)標本館成為生物多樣性的重要信息庫。生物標本及其標簽信息的電子化、信息化使得“數(shù)字植物標本館”快速發(fā)展。AVH對于保護植物、研究生物多樣性信息是一個很有意義的項目,其中提供的圖片、記錄、地圖資源可獲性及有用性極高,使得植物標本館從傳統(tǒng)的以標本借閱為主的單功能服務向以信息和知識收集、傳播發(fā)布、檢索為主的多功能服務轉化,從“被動式”服務轉向“主動式”服務。其特點是收藏數(shù)字化、傳遞網(wǎng)絡化、資源共享化和結構連接化。在設計方面,界面較為友好,檢索功能強大,響應速度快,檢全率和檢準率高,并能按用戶要求提供各種檢索及篩選服務,地圖下載、提醒等服務具有創(chuàng)新意識,其采用的FieldData software很好支持了該數(shù)字圖書館資源的瀏覽分享系統(tǒng),為用戶提供了更為便捷的獲取數(shù)據(jù)資源的途徑。版權管理及用戶隱私保護意識強烈,值得學習。
AVH作為功能性的網(wǎng)站,在一般用戶友好度的設計上也存在不足的方面:
(1)資源推薦力度不夠。雖然網(wǎng)站會根據(jù)舊用戶的瀏覽記錄推薦相關記錄,但對新用戶是沒有任何的推薦與提示的,可以對熱門或者更新的資源添加“Hot”或“New”標簽,方便新用戶使用。
(2)對一般用戶而言界面友好度不足。網(wǎng)站設計的初衷是面向研究植物學、資源優(yōu)化、植物收集和生物多樣性調查等的專業(yè)型用戶,故而網(wǎng)站進入資料庫的主要途徑為搜索引擎,對于一般的興趣用戶,則缺乏一個方便快捷的瀏覽途徑。可在主頁添加數(shù)據(jù)庫名錄的連接,或植物科屬的詞典連接,方便一般用戶點擊進入進行普及性的瀏覽。
(3)用戶互動與分享性不足??稍O計論壇等功能模塊,供用戶互相交流,也可增加更多的社會化分享服務,如微博或電郵分享等,加大對館藏資源的推廣。
[1] Australia's Virtual Herbarium (AVH) [EB/OL]. [2013-04-15]. http://avh.ala.org.au/.
Popularity of Biodiversity Informatics Technology-Australia's Virtual Herbarium
Liang Zhimin / Guangzhou Children's library, Guangzhou, 510300
Australia's Virtual Herbarium is a free digital library which provides local related botany herbarium digital information resources, including digitized specimen, photographs, publications, etc., covering a wide range with complete functions of browsing and searching. This article comprehensively analyses its resource organization, technical features, interface design, service characteristics and other aspects.
Australia's Virtual Herbarium, Digital library, Plant specimens
2013-06-18)
10.3772/j.issn.1673—2286.2013.10.013
梁志敏(1978- ),女,館員,學士,廣州少年兒童圖書館工作,研究方向:閱讀推廣、文獻資源建設等。E-mail: hazyliang@163.com