何 佳
(西安思源學(xué)院 陜西 西安 710038)
當(dāng)前人們?nèi)粘9ぷ魃钪械男畔?shù)據(jù)越來越多,且內(nèi)容形式也變得更加復(fù)雜、多樣化,例如文本、聲音、圖片以及視頻等,信息數(shù)據(jù)的爆炸式增長增加了人們檢索信息、處理信息的難度。而隨著互聯(lián)網(wǎng)、云計算、大數(shù)據(jù)等現(xiàn)代化技術(shù)的發(fā)展,極大地豐富了處理信息的手段,使信息的檢索、處理和整合不再是難題。文本和聲音信息是人們最常接觸到的信息資源形式,處理技術(shù)手段也相對比較成熟,然而圖片和視頻相比文本和聲音而言,所蘊含的信息更為豐富,研究價值也更高。移動視覺搜索機制就是一種處理圖像數(shù)據(jù)的技術(shù)手段,用戶只需要利用手機攝像頭對準(zhǔn)物品拍照上傳,就可以得到物品的所有信息,搜索速度快且準(zhǔn)確率高。圖書館擁有豐富的信息資源,是人們獲取信息和知識的重要場所,因此如何讓用戶快速、準(zhǔn)確地檢索到想要的信息就成為最關(guān)鍵的問題[1]。將移動視覺搜索機制應(yīng)用到圖書館信息檢索過程中,將會為圖書館信息檢索速度和準(zhǔn)確性帶來質(zhì)的飛躍,極大地提升人們的信息檢索服務(wù)體驗。
移動視覺搜索機制(Mobile Visual Search,MVS)是指利用手機或者電腦等移動電子設(shè)備進行圖片、視頻等視覺數(shù)據(jù)的采集,并將其作為檢索對象上傳至視覺搜索引擎,就可以快速反饋得到與之相關(guān)聯(lián)的信息的一種信息檢索技術(shù)手段。移動視覺搜索機制需要在數(shù)據(jù)庫的基礎(chǔ)上,進行特征提取并建立相應(yīng)的特征索引庫,用戶在上傳圖片點擊搜索之后,移動視覺搜索機制會對照片進行特征提取,并與特征索引庫中的圖像特征進行檢索比對,最終得到圖像的關(guān)聯(lián)信息[2]。移動視覺搜索機制使用戶的搜索體驗更加生活化,搜索方式也因場景的不同而具有多樣性,移動設(shè)備也使得搜索方式變得更加智能和方便,搜索過程也變得更加高效;移動視覺搜索機制使人與設(shè)備之間的信息交流轉(zhuǎn)變?yōu)槿伺c人之間的信息交流,用戶在資源搜索過程中充分感受到人性化。
總的來說,移動視覺搜索機制的基本技術(shù)框架主要包括建立特征索引庫和圖像檢索兩個部分,建立特征索引庫是指需要對圖像庫中所有的圖像進行特征提取,根據(jù)特征的不同進行分類、整理,并建立相應(yīng)的特征索引庫;圖像檢索則是在建立特征索引庫的基礎(chǔ)上,對所查詢的圖形的特征進行提取,并與特征索引庫中的特征進行比對匹配,最終得到相一致的圖像信息,具體見圖1。
由表1 可以看出,移動視覺搜索機制作為一種新型的搜索模式,相比傳統(tǒng)的檢索方式而言,具有以下優(yōu)點:(1)高度智能化。大數(shù)據(jù)、云計算等互聯(lián)網(wǎng)技術(shù)的發(fā)展使得移動搜索裝置變得更加智能化,系統(tǒng)會對用戶的檢索習(xí)慣、瀏覽習(xí)慣進行記憶,并根據(jù)用戶的喜好推送相關(guān)的信息;(2)個性化更強。隨著科學(xué)技術(shù)的發(fā)展,人們在信息獲取過程中會更加關(guān)注多樣化的個性體驗,而移動視覺搜索機制可以根據(jù)用戶的個性化需求提供高質(zhì)量定制服務(wù),滿足不同用戶的不同需求;(3)用戶群體大眾化??萍际侄蔚牟粩噙M步,使得人們對于互聯(lián)網(wǎng)技術(shù)和移動電子設(shè)備的依賴性更強,移動視覺搜索機制滿足了人們隨時隨地就可以進行拍照搜索的需求,快捷、便利的信息檢索服務(wù)使人們對移動視覺搜索機制的認(rèn)可度更高,它的用戶群體也會更加大眾化;(4)檢索靈活度高。移動視覺搜索機制的檢索詞可以是文本,也可以是視頻、語音和圖像等,且往往只需要一次檢索就可以得到比較全面的信息資源。而傳統(tǒng)的信息檢索詞僅局限在文本形式,且往往需要多次檢索才可以得到準(zhǔn)確的檢索結(jié)果;(5)交互性更強。傳統(tǒng)的文獻檢索往往以圖書館的單向服務(wù)為主,缺乏交互性,而基于移動視覺搜索機制建立的圖書館充分考慮了讀者需求,不僅檢索結(jié)果更加可視化,而且用戶還可以通過線上論壇進行討論交流,增加了用戶之間、用戶與檢索機制之間的互動,更有利于提升用戶的檢索體驗[3]。
表1 移動視覺搜索機制與傳統(tǒng)信息檢索機制比較
基于移動視覺搜索機制構(gòu)建的數(shù)字圖書館主要包括傳輸感知層、資源整合層、視覺檢索層以及智慧服務(wù)層四大模塊,見圖2。
傳輸感知層是指對一些基礎(chǔ)信息資源進行獲取以及分析和存儲的過程,傳輸感知層是移動視覺搜索機制的基礎(chǔ)。基礎(chǔ)信息資源通常包括圖書館數(shù)字資源和用戶情境信息,圖書館數(shù)字資源具體包括圖書館的館藏文獻、電子資源以及影像資料等,在對數(shù)字資源進行采集上傳之后,需要依據(jù)一定的處理標(biāo)準(zhǔn)對數(shù)字資源進行標(biāo)引、分類,從而保證上傳數(shù)字資源的規(guī)范性;用戶情境信息主要包括用戶的基本信息、物理信息以及查詢信息,基本信息是指用戶的性別、年齡、職業(yè)、文化程度、興趣愛好和手機號等,物理信息是指用戶在檢索時所用設(shè)備、地理位置、網(wǎng)絡(luò)信號狀況以及查詢時間等,查詢信息則是指用戶在檢索過程中與檢索平臺或系統(tǒng)的互動,通常包括注冊信息、在線問卷調(diào)查以及檢索日志等[4]。而對于用戶情境獲取的方式一般是包括傳感器、監(jiān)控設(shè)備、圖像采集設(shè)備以及全球定位系統(tǒng)等。
資源整合層是指在傳輸感知層的基礎(chǔ)上,將基礎(chǔ)資源數(shù)據(jù)庫(文本庫、語音庫、圖片庫以及視頻庫等)提取、處理和整合,并建立相應(yīng)的語義特征索引庫和用戶特征索引庫,用戶在進行視覺資源檢索時就可以快速將視覺檢索對象與資源庫中的數(shù)據(jù)信息建立語義關(guān)聯(lián)。而且在用戶檢索過程中,系統(tǒng)也會將用戶的檢索行為進行記錄,將記錄結(jié)果轉(zhuǎn)化成模型用以表示和描述用戶的相關(guān)特征信息,來作為視覺檢索過程中推薦數(shù)據(jù)的依據(jù),這也是移動視覺搜索機制實現(xiàn)個性化服務(wù)的重要基礎(chǔ)之一。而對于新用戶而言,系統(tǒng)可以根據(jù)類似用戶的相關(guān)檢索數(shù)據(jù)對新用戶的檢索目的和愛好進行預(yù)測,這樣可以大大提高新用戶檢索的準(zhǔn)確性[5]。移動視覺搜索機制還可以不斷地進行智能化分析和優(yōu)化,通過不斷分析用戶的檢索日志以及用戶對檢索結(jié)果的反饋,不斷地更新用戶的特征信息,并自動優(yōu)化推理規(guī)則,使搜索精準(zhǔn)性不斷提高,有效地解決檢索過程存在的語義鴻溝問題,由此以用戶畫像和融合情境為基礎(chǔ)建立的移動視覺搜索機制可以更好地為用戶提供個性化、智能化服務(wù)。
視覺檢索層是指在用戶輸入圖像進行檢索后,系統(tǒng)根據(jù)資源整合層的信息基礎(chǔ),采用特定的檢索技術(shù)檢索得到與用戶檢索目的相一致的檢索結(jié)果。視覺檢索層的重要檢索技術(shù)手段包括圖像的ROI 定位、語義分析、情境建模、資源匹配等。首先,圖像的ROI 定位是將用戶輸入的待查詢圖像選擇一個局部區(qū)域進行特征提取,這樣可以將對大圖像的處理轉(zhuǎn)變成小圖像的處理,減少處理的圖像范圍和計算量,由此縮短檢索的時間;語義分析是指對各類圖像資源進行語義的抽取和分割,以此來找出語義文本和圖像數(shù)據(jù)之間的關(guān)系,并為圖像信息賦予語義標(biāo)簽;情境建模是指通過構(gòu)建的用戶情境模型對用戶的檢索目的和檢索需求進行預(yù)估,并將其作為一定的檢索依據(jù)來為用戶提供檢索服務(wù);資源匹配則是根據(jù)上述檢索運算,與視覺信息資源索引庫中的數(shù)據(jù)進行特征匹配,從而得到與用戶檢索圖像對象相匹配的各種信息資源。
智慧服務(wù)層為用戶提供了更具交互性的知識服務(wù),用戶不僅可以隨時隨地檢索圖像資源,還可以對圖書館里的特色館藏資源進行搜索,通過拍攝相關(guān)的實景直接就可以搜索得到相關(guān)的數(shù)字化內(nèi)容。另外,移動視覺搜索機制中還有線上討論平臺,用戶可以將檢索過程中遇到的問題在線上討論平臺上發(fā)布出來,與相似情境下的其他用戶進行交流和討論,還可以直接與專家進行探討解答疑惑,實現(xiàn)線上知識信息的交流與共享。圖書館還可以根據(jù)移送視覺搜索機制中的個性化服務(wù),為用戶主動推送相匹配的信息資源和相關(guān)咨詢。而且圖書館的知識可視化服務(wù)可以將文字知識以視覺表現(xiàn)形式描述出來,也可以將檢索內(nèi)容與學(xué)科領(lǐng)域、資源主題之間建立一定的聯(lián)系性,這都極大地豐富了知識的表達形式,使用戶更樂于去獲取知識,并加深對檢索結(jié)果的記憶和理解[6]。另外,基于移動視覺搜索機制建立的數(shù)字圖書館還擁有智能的評估機制,通過不斷地統(tǒng)計檢索的響應(yīng)時間、設(shè)備的兼容性、檢索資源的占用率以及用戶的反饋信息,對檢索服務(wù)質(zhì)量進行評估,并不斷地進行優(yōu)化,使移動視覺搜索機制的檢索變得更加實時、精準(zhǔn)、一致和豐富。
移動視覺搜索機制依托于大數(shù)據(jù)、互利網(wǎng)等先進的科學(xué)技術(shù),是實現(xiàn)圖書館檢索技術(shù)變革的重要技術(shù)手段,因此應(yīng)該繼續(xù)加強對移動視覺搜索機制的建設(shè),可以從以下幾方面著手:(1)加強對圖書館信息服務(wù)人員的培養(yǎng)。當(dāng)前圖書館信息服務(wù)人員缺乏移動視覺搜索理念,且計算機水平和移動視覺搜索機制的技術(shù)水平都不高,因此應(yīng)該加強移動視覺搜索機制相關(guān)知識的培養(yǎng),使信息服務(wù)人員掌握一定的計算機技術(shù)和移動視覺搜索機制技術(shù)。另外,還要積極培養(yǎng)信息服務(wù)人員的綜合素養(yǎng)和服務(wù)技能,提高數(shù)字圖書館的服務(wù)效益。(2)提高視覺對象數(shù)據(jù)庫的建設(shè)水平。視覺對象數(shù)據(jù)庫是移動視覺搜索機制的基礎(chǔ),不斷地完善視覺對象數(shù)據(jù)庫數(shù)據(jù)內(nèi)容和數(shù)據(jù)形式,可以有效避免信息資源單一化的呈現(xiàn),為用戶提供更加準(zhǔn)確、豐富和多樣化的信息資源,可以更好地提升用戶的檢索體驗感。(3)注重“以用戶為中心”的建設(shè)轉(zhuǎn)型。圖書館是為用戶提供信息資源的場所,數(shù)字圖書館的建設(shè)應(yīng)以用戶的需求和喜好為基礎(chǔ),在建設(shè)過程中加強與用戶的互動交流,邀請用戶參與到建設(shè)中,實現(xiàn)數(shù)字圖書館的共建共享。(4)完善圖書館數(shù)字人文專題資源建設(shè)。目前圖書館對一些珍貴的歷史文獻傳播和利用較為欠缺,例如名人字畫、真人手稿、典藏古籍以及一些歷史影像資料等,由于資料的特殊性,圖書館也沒有相應(yīng)的紙質(zhì)資料,導(dǎo)致圖書館難以發(fā)揮其應(yīng)有的人文資源優(yōu)勢,移動視覺搜索可以有效地完善這些資源信息,圖書館相關(guān)管理人員可以對人文專題資源進行收集,利用數(shù)字技術(shù)對文獻進行存儲,用戶可以通過移動設(shè)備掃描二維碼,然后自動跳轉(zhuǎn)相關(guān)文本、影像等相關(guān)界面,界面還應(yīng)包括多種方式的資源信息介紹,例如視頻、語音以及圖片等,從而增強用戶的閱讀體驗,提高圖書館資源的利用率。(5)增強數(shù)字圖書館人工智能項目建設(shè)。移動視覺搜索系統(tǒng)與人工智能相關(guān)技術(shù)相結(jié)合可以極大促進用戶的資源檢索效率,并能夠讓用戶獲得較好的使用體驗。智能檢索技術(shù)主要包括以下幾方面:自然語言處理技術(shù)、跨語言相似性檢索技術(shù)、數(shù)據(jù)挖掘技術(shù)、關(guān)聯(lián)規(guī)則挖掘技術(shù)等。目前我國圖書館人工智能項目建設(shè)大多數(shù)都傾向于人臉識別、人機交互等多種傳感器的智能服務(wù)研究,例如用戶可以錄入人臉信息,通過人臉識別技術(shù)進行圖書借閱、歸還等操作,提高圖書館的管理效率。
圖書館是用戶獲取知識和進行科研學(xué)習(xí)的信息資源中心,基于移動視覺搜索機制建立的數(shù)字圖書館不僅創(chuàng)新了信息檢索的方法,還極大地豐富了信息檢索的內(nèi)容形式,使信息檢索變得更加實時、準(zhǔn)確和多樣化。因此圖書館的有關(guān)管理人員應(yīng)該從加強圖書館信息服務(wù)人員培養(yǎng)、提高視覺對象數(shù)據(jù)的建設(shè)水平以及注重“以用戶為中心”的建設(shè)轉(zhuǎn)型著手,加強對數(shù)字圖書館移動視覺搜索機制的建設(shè),實現(xiàn)數(shù)字圖書館信息服務(wù)的高質(zhì)量發(fā)展。