李 默(山東科技大學(xué)圖書館)
隨著移動智能設(shè)備的迅速普及以及大數(shù)據(jù)、人工智能、無線網(wǎng)絡(luò)傳輸?shù)燃夹g(shù)的不斷進(jìn)步,越來越多的用戶利用移動設(shè)備進(jìn)行網(wǎng)絡(luò)信息檢索,而且由傳統(tǒng)的文字輸入檢索方式逐漸向文字、圖像、視頻等多種輸入方式相結(jié)合的綜合性檢索轉(zhuǎn)變。此外,在移動網(wǎng)絡(luò)環(huán)境影響下,數(shù)字圖書館作為知識存儲、組織和傳播中心,其提供的信息資源也不再局限于文本格式的數(shù)據(jù),而是包含了大量的圖像、視頻等視覺數(shù)據(jù)資源?;谖谋镜臋z索方式已經(jīng)無法適應(yīng)不斷增加的視覺數(shù)據(jù)資源檢索,如何提高視覺數(shù)據(jù)資源的檢索效率已成為數(shù)字圖書館信息資源建設(shè)的重要內(nèi)容。
移動視覺搜索(Mobile Visual Search,MVS)的出現(xiàn)為數(shù)字圖書館視覺數(shù)據(jù)資源檢索提供了新的技術(shù)解決方案,它是一種利用移動智能設(shè)備采集圖像、視頻等視覺數(shù)據(jù),通過移動網(wǎng)絡(luò)進(jìn)行視覺資源數(shù)據(jù)庫檢索以獲取關(guān)聯(lián)信息的信息檢索方式。[1]目前,MVS已廣泛應(yīng)用于醫(yī)療、商業(yè)、數(shù)字人文等多個領(lǐng)域,與文本檢索、語音檢索相比,MVS縮小了用戶查詢意圖與語義表達(dá)之間的鴻溝,提高了檢索結(jié)果的準(zhǔn)確度。[2]但是,MVS也存在著檢索結(jié)果同質(zhì)化、智能化服務(wù)水平低以及個性化功能不足等問題,因此,如何提高M(jìn)VS的檢索效果和智能化水平、并提供個性化檢索功能的MVS服務(wù)機(jī)制研究具有重要意義。Agent是能夠根據(jù)外部環(huán)境變化自主實(shí)現(xiàn)其設(shè)計(jì)目標(biāo)的計(jì)算實(shí)體,且具有自治性、感知性、反應(yīng)性和協(xié)作性等特征,而多Agent系統(tǒng)中Agent之間可以相互協(xié)調(diào)和通信,完成某一共同任務(wù),[3]因而,多Agent系統(tǒng)成為構(gòu)建個性化移動視覺搜索引擎的首選技術(shù)。
MVS概念自Chen等人在2009年斯坦福大學(xué)舉行的首屆MVS研討會上提出以來,[4]受到了產(chǎn)業(yè)界和學(xué)術(shù)界的廣泛關(guān)注,許多國內(nèi)外著名大學(xué)和研究機(jī)構(gòu)對MVS展開研究,取得了一定的進(jìn)展。其中,Google公司推出了面向MVS的Google Goggles系統(tǒng);亞馬遜利用Snap Tell系統(tǒng)向智能手機(jī)用戶提供MVS服務(wù);在國內(nèi),淘寶開發(fā)了基于MVS的手機(jī)購物App“拍立淘”;京東也為用戶提供了具有MVS功能的“拍照購”,用戶可以將物品拍照或截圖進(jìn)行檢索,滿足了用戶隨時隨地搜索物品購買的需求。另外,Rui Zhang等[5]提出了一個MVS多模態(tài)標(biāo)簽定位方法,該方法可以顯著提高用戶的MVS體驗(yàn);鐘志鵬等[6]開發(fā)了一個基于MVS的博物館導(dǎo)覽系統(tǒng),該系統(tǒng)可以在服務(wù)器端和手機(jī)端對展品進(jìn)行實(shí)時識別;胡海洋等[7]研究了基于極限學(xué)習(xí)機(jī)的MVS方法,并通過實(shí)驗(yàn)證明了極限學(xué)習(xí)機(jī)在MVS方面的可行性和高效性。
MVS研究的推進(jìn)也引起了圖書情報科學(xué)領(lǐng)域?qū)W者的廣泛關(guān)注。張興旺等[8]將MVS引入到數(shù)字圖書館建設(shè)中,分析了數(shù)字圖書館移動視覺搜索機(jī)制的內(nèi)涵、分類與架構(gòu)設(shè)計(jì),其后又提出了一種領(lǐng)域?qū)虻?、自適應(yīng)的、可演化的數(shù)字圖書館MVS引擎;[9]朱慶華等人對數(shù)字圖書館MVS進(jìn)行了一系列的研究,如基于關(guān)聯(lián)數(shù)據(jù)的數(shù)字圖書館MVS框架與應(yīng)用[10-11]、大數(shù)據(jù)環(huán)境下MVS的游戲化機(jī)制設(shè)計(jì)[12]、數(shù)字圖書館MVS的眾包模式[13]、基于情境感知的圖書館MVS服務(wù)設(shè)計(jì)[14]、基于語義關(guān)聯(lián)的圖書館MVS資源與服務(wù)聚合研究[15]等;曾子明等人也在MVS研究方面開展了系列工作,取得了許多研究成果,主要有大數(shù)據(jù)環(huán)境下面向科研用戶的MVS模型研究[16]、基于SoLo-Mo的智慧圖書館MVS服務(wù)研究[17]、智慧圖書館MVS服務(wù)及其技術(shù)框架研究[18]、去中心化的智慧圖書館MVS管理體系研究[19]等;另外,余婷婷[20]分析了MVS在數(shù)字人文領(lǐng)域的應(yīng)用方向和前景;韓璽等[21]則提出了基于MVS的圖書館、檔案館、博物館資源融合服務(wù)模式;孫翌等[22]將MVS應(yīng)用于李政道圖書館特藏陳展服務(wù)中,并詳細(xì)闡述了MVS在圖書館特色資源的陳展服務(wù)中的各項(xiàng)應(yīng)用功能。
信息技術(shù)的快速發(fā)展和網(wǎng)絡(luò)數(shù)據(jù)的爆炸式增長,使得搜索引擎由最初的目錄式搜索引擎、全文搜索引擎逐漸向個性化、智能化搜索引擎轉(zhuǎn)變。而Agent技術(shù)自提出以來,由于其在智能軟件建模方面的優(yōu)勢,較早地就被應(yīng)用于分布式數(shù)據(jù)源的信息搜索與處理中。Haverkamp等[23]在分析了已有的基于多Agent的分布式數(shù)據(jù)源信息檢索系統(tǒng)基礎(chǔ)之上,認(rèn)為Agent的智能性在應(yīng)用于互聯(lián)網(wǎng)分布式信息檢索系統(tǒng)時將更為重要。Keyhanipour等[24]提出了基于多Agent的元搜索引擎WebFusion,該系統(tǒng)可以通過分析用戶的點(diǎn)擊行為數(shù)據(jù)來預(yù)測用戶偏好,從而返回更加準(zhǔn)確的檢索結(jié)果。國內(nèi)也有很多學(xué)者對基于Agent的個性化搜索引擎開展了研究,其中,錢瑛[25]構(gòu)建了一個基于智能A-gent的網(wǎng)絡(luò)搜索和推薦信息服務(wù)系統(tǒng);李青山等[26]研究了基于Agent的智能元搜索引擎?zhèn)€性化方法及功能實(shí)現(xiàn)技術(shù),設(shè)計(jì)了基于動態(tài)更新的用戶檢索興趣挖掘機(jī)制和搜索引擎評估調(diào)度策略機(jī)制。
數(shù)字圖書館服務(wù)平臺的建設(shè)需要個性化搜索引擎,而與互聯(lián)網(wǎng)領(lǐng)域面向大眾的搜索引擎不同,其處理的數(shù)據(jù)主要是專業(yè)領(lǐng)域的信息資源,并且除了提供傳統(tǒng)的相關(guān)度排序、高級檢索、快速檢索等功能外,還要能提供信息過濾與推送、用戶興趣識別、多種類型信息資源檢索、內(nèi)容語義理解等功能。國內(nèi)許多學(xué)者對基于Agent的個性化搜索引擎在數(shù)字圖書館的具體應(yīng)用進(jìn)行了探索,如,龐英智[27]研究了基于多Agent技術(shù)的個性化搜索引擎,并重點(diǎn)分析了其在數(shù)字圖書館服務(wù)工作中的應(yīng)用;馬崴[28]論述了多Agent智能搜索引擎應(yīng)用在圖書館信息服務(wù)工作中的優(yōu)勢和意義;宋喆等[29]設(shè)計(jì)了一個基于多A-gent系統(tǒng)的數(shù)字圖書館個性化信息檢索結(jié)構(gòu)模型。綜上,隨著搜索引擎向智能化、移動化、個性化和交互便捷化的方向發(fā)展,數(shù)字圖書館個性化搜索引擎也從傳統(tǒng)的文字識別向視頻識別、音頻識別、圖像識別等多模態(tài)自然語言處理轉(zhuǎn)變,并從PC端向移動終端泛化,實(shí)現(xiàn)感知用戶個性化需求的檢索導(dǎo)向技術(shù)。
相關(guān)研究深化了信息檢索理論,但尚未有數(shù)字圖書館個性化MVS的文獻(xiàn)研究。因此,本文在現(xiàn)有國內(nèi)外研究成果的基礎(chǔ)之上,基于多Agent系統(tǒng)的協(xié)作性、適應(yīng)性和自主性,構(gòu)建支持個性化檢索的數(shù)字圖書館MVS體系結(jié)構(gòu),為用戶提供智能化的MVS服務(wù)。
為了實(shí)現(xiàn)數(shù)字圖書館MVS的個性化功能,本文設(shè)計(jì)了基于多Agent的數(shù)字圖書館個性化MVS體系結(jié)構(gòu)模型,該模型包含了基礎(chǔ)數(shù)據(jù)層、檢索業(yè)務(wù)層、多Agent服務(wù)層和用戶應(yīng)用層四個部分(見圖1)。在數(shù)字圖書館個性化MVC體系結(jié)構(gòu)中,基礎(chǔ)數(shù)據(jù)層是基礎(chǔ),檢索業(yè)務(wù)層是核心,多Agent服務(wù)層是樞紐,用戶應(yīng)用層是展示,四個部分在具體應(yīng)用過程中會進(jìn)行實(shí)時信息交互,形成一個有機(jī)的整體。
基礎(chǔ)數(shù)據(jù)層主要用于獲取、整理和存儲各類數(shù)字圖書館移動視覺資源(包括文本、圖像、音頻、視頻、3D模型等),并對資源數(shù)據(jù)進(jìn)行日常管理和維護(hù),是整個體系結(jié)構(gòu)的前提和基礎(chǔ)。其中,云存儲模塊的功能是把數(shù)字圖書館各類信息資源進(jìn)行集成和融合并存儲于云端,實(shí)現(xiàn)信息資源的統(tǒng)一化管理和分布式共享;資源采集模塊用于獲取各類資源數(shù)據(jù),包括學(xué)術(shù)文本數(shù)據(jù)、圖像信息數(shù)據(jù)、音視頻數(shù)據(jù)、用戶情境數(shù)據(jù)等。通過對獲取的各類數(shù)字資源進(jìn)行語義標(biāo)注,在不同類型數(shù)據(jù)資源之間建立語義關(guān)聯(lián),形成文本資源庫、視覺對象庫、情境模型庫和語義標(biāo)簽庫等多種數(shù)據(jù)庫;而用戶知識庫則用來存儲用戶在數(shù)字圖書館MVS過程中產(chǎn)生的各種行為信息數(shù)據(jù),它是構(gòu)建個性化MVS用戶行為模型的數(shù)據(jù)來源。
圖1 基于多Agent的數(shù)字圖書館智能MVS體系結(jié)構(gòu)
檢索業(yè)務(wù)層構(gòu)建在基礎(chǔ)數(shù)據(jù)層之上,是數(shù)字圖書館個性化MVS的關(guān)鍵和核心,主要功能是將加工處理后的信息資源進(jìn)行語義關(guān)聯(lián),并融合用戶情境信息以響應(yīng)用戶檢索需求。① 數(shù)據(jù)處理模塊主要負(fù)責(zé)從資源數(shù)據(jù)層訪問、獲取和分析海量基礎(chǔ)數(shù)據(jù),這些海量數(shù)據(jù)包括各類信息資源數(shù)據(jù)、用戶行為數(shù)據(jù)和情境信息數(shù)據(jù)等;② 情境建模模塊首先對獲取的情境信息建立形式化模型,然后通過模型推理挖掘隱藏的信息和用戶需求,最后得到情境分析結(jié)果;③ 語義分析模塊的功能是對各類信息資源數(shù)據(jù)進(jìn)行語義抽取和分割,并描述知識語義信息和數(shù)據(jù)信息之間的對應(yīng)關(guān)系,最后利用語義標(biāo)簽庫對語義標(biāo)注進(jìn)行規(guī)范化處理,使得可以完整描述各類資源數(shù)據(jù)的語義信息;④特征提取模塊的功能是檢測獲取的視覺檢索對象,篩選出用戶感興趣的目標(biāo)和區(qū)域并提取視覺特征,采用候選區(qū)域網(wǎng)絡(luò)方法來提高視覺檢索對象識別的準(zhǔn)確度;⑤ 資源匹配模塊是以視覺資源庫的數(shù)據(jù)為中心,對各類數(shù)字資源的特征元素進(jìn)行關(guān)聯(lián)匹配,返回與用戶視覺檢索對象相關(guān)的各類數(shù)字資源集合;⑥ 檢索執(zhí)行模塊是在上述功能模塊的基礎(chǔ)上執(zhí)行檢索任務(wù),完成相應(yīng)的視覺檢索功能,得到滿足用戶檢索意圖的以相關(guān)度排序的檢索結(jié)果。
多Agent服務(wù)層是數(shù)字圖書館個性化MVS體系結(jié)構(gòu)的樞紐和中轉(zhuǎn),主要負(fù)責(zé)系統(tǒng)的功能模塊調(diào)用,由多種Agent協(xié)作完成用戶行為分析、調(diào)度管理、個性化推薦以及檢索結(jié)果合成等功能。① 檢索Agent主要完成調(diào)度Agent分配的檢索任務(wù),根據(jù)檢索類別對復(fù)雜條件進(jìn)行轉(zhuǎn)化,并返回檢索結(jié)果;② 調(diào)度Agent主要用于數(shù)字圖書館MVS任務(wù)的組織和分配,根據(jù)用戶檢索請求與其他Agent進(jìn)行交互,協(xié)作完成MVS檢索任務(wù);③ 用戶Agent的功能是在用戶進(jìn)行視覺檢索時通過獲取用戶行為信息對用戶興趣進(jìn)行分析,并挖掘用戶查詢?nèi)罩局g的關(guān)聯(lián),將分析結(jié)果存儲在用戶知識庫中;④ 推薦Agent根據(jù)用戶Agent對用戶行為分析的結(jié)果,使用推薦算法向用戶推薦相關(guān)資源數(shù)據(jù)信息。
用戶應(yīng)用層是數(shù)字圖書館MVS的運(yùn)維和信息共享平臺,同時與用戶進(jìn)行交互,為用戶提供檢索接口、結(jié)果展示、評價反饋、個性化推薦等功能,是整個系統(tǒng)的前臺和展示。① 用戶可以在不同智能終端上通過多種方式利用檢索接口輸入檢索圖像,然后檢索接口將用戶的檢索請求發(fā)送給界面Agent;② 結(jié)果展示模塊將系統(tǒng)返回的多種類型信息資源進(jìn)行相關(guān)性融合,并以可視化的方式描述知識資源之間的聯(lián)系,提高知識的易理解性;③ 評價反饋模塊負(fù)責(zé)收集用戶反饋信息,對數(shù)字圖書館MVS服務(wù)的效率和滿意度進(jìn)行評價,評價采取顯示評價和隱式評價兩種方式同時進(jìn)行,依據(jù)評價結(jié)果對數(shù)字圖書館MVS模型進(jìn)行改進(jìn);④ 個性化推薦模塊根據(jù)用戶的情境信息、檢索行為與特征、社會網(wǎng)絡(luò)等數(shù)據(jù)進(jìn)行邏輯推理,發(fā)現(xiàn)用戶的興趣偏好,為用戶推薦相關(guān)的信息資源,提升用戶的個性化MVS服務(wù)體驗(yàn)。
數(shù)字圖書館個性化MVS是將MVS服務(wù)與Agent技術(shù)相結(jié)合,滿足MVS智能化功能需求,達(dá)到MVS服務(wù)以人為本的目的。為了發(fā)揮多Agent系統(tǒng)協(xié)作性、自治性、感知性的特點(diǎn),并適應(yīng)海量數(shù)據(jù)訪問、用戶情境多變的互聯(lián)網(wǎng)環(huán)境,本文基于FIPA(Foundation of Intelligent Physical Agents)標(biāo)準(zhǔn)設(shè)計(jì)了五類Agent,分別是界面Agent、檢索Agent、調(diào)度Agent、用戶Agent和推薦Agent,其內(nèi)部結(jié)構(gòu)和交互關(guān)系見圖2。
圖2 基于多Agent的數(shù)字圖書館智能MVS服務(wù)流程
(1)界面Agent主要完成檢索接口和結(jié)果合成兩方面的任務(wù),即一方面它需要負(fù)責(zé)接收用戶檢索請求,并將用戶檢索請求發(fā)送給調(diào)度Agent執(zhí)行檢索任務(wù);另一方面它將檢索結(jié)果進(jìn)行去重、合并、排序并展現(xiàn)給用戶。因此,界面Agent分為檢索接口模塊與結(jié)果合成模塊兩部分。在檢索接口模塊中,用戶除了能夠輸入圖像進(jìn)行檢索外,也可以選擇傳統(tǒng)的文本輸入檢索,并將檢索接口與數(shù)字圖書館移動終端檢索界面融合,充分考慮用戶的移動應(yīng)用行為習(xí)慣,提高M(jìn)VS服務(wù)的可用性和便捷性。結(jié)果合成模塊是用戶與MVS檢索功能的連接部分,它的作用是讓用戶在感受MVS服務(wù)操作流程的同時獲得檢索平臺返回的各類信息資源數(shù)據(jù),為了保證檢索結(jié)果中包含符合用戶興趣和需求的信息資源,界面Agent還需要從推薦Agent處獲得推薦信息,然后集成起來加入到最后的檢索結(jié)果集中。
(2)檢索Agent的主要功能就是接收調(diào)度Agent分配的檢索任務(wù),并與調(diào)度Agent交互獲取所需的檢索資源數(shù)據(jù),完成檢索后將檢索結(jié)果返回給調(diào)度A-gent。檢索Agent在接收到檢索任務(wù)后,首先,對檢索圖像進(jìn)行語義分析,并從調(diào)度Agent中獲取語義標(biāo)簽標(biāo)注檢索圖像或添加新的語義標(biāo)簽到語義標(biāo)簽庫中。然后,利用情境建模模塊對影響用戶的情境進(jìn)行過濾和邏輯推理,建立計(jì)算機(jī)可以理解的情境模型,通過與調(diào)度Agent交互對情境模型庫中已有的模型進(jìn)行匹配,根據(jù)匹配度不同得到讀者偏好并存儲到情境模型庫中;特征提取模塊對MVS檢索圖像進(jìn)行視覺熱區(qū)檢測篩選出用戶的興趣目標(biāo)和區(qū)域,得到檢索圖像的局部特征,再對局部特征進(jìn)行聚合得到檢索圖像的全部特征,另外在視覺特征提取的同時也要提取其文本特征,達(dá)到兼顧檢索結(jié)果幾何一致性和語義相關(guān)性的目的。最后,資源匹配模塊將MVS檢索圖像的特征描述符與視覺資源庫中數(shù)據(jù)的特征描述符進(jìn)行匹配,根據(jù)匹配結(jié)果對包括視覺信息資源在內(nèi)的各類數(shù)字資源進(jìn)行評分和排序,將檢索結(jié)果列表返回給調(diào)度Agent。
(3)調(diào)度Agent是多Agent服務(wù)層的核心,它是各類Agent進(jìn)行交互的橋梁,包含任務(wù)分配與數(shù)據(jù)管理兩個功能模塊。① 任務(wù)分配模塊首先接收來自界面Agent的用戶檢索請求,然后根據(jù)用戶請求的檢索類型向檢索Agent發(fā)送檢索任務(wù),并將得到的檢索結(jié)果列表返回界面Agent,同時與用戶Agent、推薦A-gent進(jìn)行交互,對用戶興趣模型以及評價反饋信息不斷進(jìn)行更新。② 數(shù)據(jù)管理模塊主要是對數(shù)字圖書館智能MVS系統(tǒng)中的各類數(shù)據(jù)庫進(jìn)行讀取、修改、刪除等操作,它從任務(wù)分配模塊獲得數(shù)據(jù)庫操作請求,是調(diào)度 Agent與檢索 Agent、用戶 Agent、推薦 Agent之間進(jìn)行數(shù)據(jù)傳輸?shù)慕涌凇?/p>
(4)將個性化技術(shù)應(yīng)用到數(shù)字圖書館MVS體系之中,針對用戶需求和偏好提供不同的檢索結(jié)果。用戶Agent包含行為感知、用戶分析、興趣挖掘三個功能模塊。行為感知模塊是在用戶進(jìn)行檢索時與用戶進(jìn)行交互,將用戶的檢索日志和行為記錄在系統(tǒng)中,包括用戶的點(diǎn)擊順序、檢索內(nèi)容、使用時長、跳轉(zhuǎn)鏈接、來訪時間等信息;用戶分析模塊是在用戶行為感知的基礎(chǔ)上,學(xué)習(xí)用戶興趣以及挖掘用戶群組特征,另外分析注冊用戶時還要把用戶的身份、職業(yè)、年齡、位置、天氣等信息進(jìn)行綜合邏輯推理;興趣挖掘模塊首先采用用戶興趣學(xué)習(xí)及更新算法建立用戶興趣模型,然后與調(diào)度Agent交互更新系統(tǒng)內(nèi)部的用戶知識庫,將用戶興趣數(shù)據(jù)存儲下來,為推薦Agent提供數(shù)據(jù)支持。
(5)推薦Agent負(fù)責(zé)主動向用戶提供檢索內(nèi)容相關(guān)的信息資源,提高了用戶的檢索效率和對數(shù)字圖書館MVS系統(tǒng)的黏著度,另外能夠激發(fā)用戶的潛在興趣,拓展用戶的檢索廣度和深度,它主要包括推薦引擎和評價反饋兩個功能模塊。① 推薦引擎模塊首先與調(diào)度Agent交互,接收任務(wù)分配消息、用戶興趣模型以及各類相關(guān)信息資源數(shù)據(jù),然后利用一種或多種推薦算法計(jì)算出與用戶檢索內(nèi)容相關(guān)的信息資源,對于注冊用戶還可以根據(jù)用戶的群組特征進(jìn)行推薦計(jì)算,最后將推薦資源列表返回給調(diào)度Agent;② 評價反饋模塊根據(jù)用戶對推薦資源的使用行為來獲取評價反饋信息,用戶的評價反饋信息包括顯式評價信息(用戶評論、打分、轉(zhuǎn)發(fā)等)和隱式評價信息(點(diǎn)擊瀏覽、忽略推薦、拒絕推薦等)兩種,利用用戶評價反饋信息進(jìn)一步更新用戶興趣模型,并將更新后的用戶興趣模型通過調(diào)度Agent存入用戶知識庫中,改進(jìn)數(shù)字圖書館個性化MVS服務(wù)的推薦效率。
推薦機(jī)制是實(shí)現(xiàn)數(shù)字圖書館MVS系統(tǒng)個性化服務(wù)的關(guān)鍵,而檢索推薦內(nèi)容要以視覺數(shù)據(jù)資源為中心、包含多種格式學(xué)術(shù)資源的知識展示方式提供給用戶。此外,在一般情況下推薦內(nèi)容都會產(chǎn)生信息過載現(xiàn)象,因此,針對上述情形要綜合采用多種推薦算法,以提高推薦內(nèi)容的多樣性和相關(guān)性。再者,為了提高推薦內(nèi)容的準(zhǔn)確性,要從多個方面完善用戶興趣模型,常用的用戶興趣建模方法有關(guān)鍵詞列表表示法、基于布爾模型的表示方法、基于向量空間模型的表示方法、基于本體的用戶模型表示方法[30]等,而由于視覺數(shù)據(jù)本身缺乏描述性文本,可以將用戶興趣標(biāo)簽作為語義素材來構(gòu)建用戶興趣模型,利用視覺數(shù)據(jù)分詞標(biāo)簽與用戶興趣標(biāo)簽的映射關(guān)系定位用戶興趣,并及時捕捉用戶興趣的變化。
數(shù)字圖書館MVS系統(tǒng)要實(shí)現(xiàn)準(zhǔn)確高效的個性化推薦功能,必須充分挖掘用戶的個性化信息及知識需求,但獲取精確檢索內(nèi)容推薦的同時也會帶來用戶隱私安全問題。數(shù)字圖書館用戶隱私安全保護(hù)需要解決三個方面的問題:① 確保用戶個人信息在傳輸和存儲過程中不被篡改;② 對用戶身份及個人數(shù)據(jù)訪問權(quán)限進(jìn)行嚴(yán)格驗(yàn)證;③ 對用戶個性化數(shù)據(jù)的使用采用授權(quán)機(jī)制,以利于用戶隱私泄露時對泄露源進(jìn)行追蹤。因此,數(shù)字圖書館應(yīng)制定相應(yīng)的隱私保護(hù)策略,如,實(shí)施用戶個人數(shù)據(jù)的多級保護(hù)機(jī)制,在數(shù)據(jù)層采用數(shù)據(jù)加密算法對數(shù)據(jù)進(jìn)行加密,在應(yīng)用層使用隱私增強(qiáng)技術(shù),在數(shù)據(jù)發(fā)布層利用匿名化方法;[31]對采集的用戶個性化數(shù)據(jù)進(jìn)行過濾、清理和刪減,清洗掉與用戶的行為分析、知識需求以及群組關(guān)系判定無關(guān)的隱私數(shù)據(jù);[32]為數(shù)字圖書館用戶提供更細(xì)粒度的訪問控制機(jī)制,由用戶自己設(shè)置個人敏感信息的保護(hù)級別和保護(hù)范圍;對MVS服務(wù)效用與用戶個人隱私之間做到更好的權(quán)衡,在滿足用戶知識需求最大化的同時最小化隱私等。
優(yōu)質(zhì)的視覺資源數(shù)據(jù)可以為用戶帶來良好的數(shù)字圖書館MVS個性化服務(wù)體驗(yàn),而且能夠提高系統(tǒng)的檢索速度和易用性。因此,對于視覺資源數(shù)據(jù)處理要從兩方面著手,一方面,為了應(yīng)對移動環(huán)境下實(shí)時應(yīng)用的需求,加快視覺資源特征提取的速度,視覺資源的形狀、紋理、顏色和輪廓等低層次特征信息應(yīng)采用局部特征提取方法,并減少視覺資源內(nèi)容由于視角變化、旋轉(zhuǎn)縮放等帶來的特征失真現(xiàn)象,而對于視覺資源的高層次語義信息則可以采用深度學(xué)習(xí)、卷積神經(jīng)網(wǎng)絡(luò)等方法進(jìn)行提取,為用戶提供具有更強(qiáng)語義匹配能力的視覺資源特征;[33]另一方面,為了降低視覺資源特征在移動網(wǎng)絡(luò)中的傳輸和存儲消耗,需要使用視覺特征壓縮方法(如二進(jìn)制哈希法、特征量化法等)來減少傳輸流量,以盡可能少的特征比特數(shù)傳遞盡可能多的視覺資源檢索信息,并采用分布式的高維索引方法建立支持大流量高并發(fā)的視覺資源數(shù)據(jù)庫,實(shí)現(xiàn)大規(guī)模視覺資源的快速準(zhǔn)確匹配。