王一涵
摘要:現(xiàn)如今圖書館高質(zhì)量發(fā)展已成為圖書館發(fā)展之路的必然趨勢(shì),而人工智能的發(fā)展發(fā)展將充分利用圖書館的資源,是優(yōu)化圖書館資源開發(fā)利用的有效方式之一?;趥€(gè)性化服務(wù)的特點(diǎn),提供有針對(duì)性、有特色的圖書館應(yīng)用已成為圖書館可持續(xù)發(fā)展的一項(xiàng)服務(wù)和戰(zhàn)略。本文在人工智能的背景下,重點(diǎn)分析了圖書館在個(gè)性化服務(wù)過程中的應(yīng)用,提出了創(chuàng)新策略,以更好地促進(jìn)圖書館的建設(shè)和發(fā)展。
關(guān)鍵詞:人工智能;圖書館;個(gè)性化服務(wù)
一、人工智能背景下圖書庫服務(wù)的特點(diǎn)
(一)資料化
圖書庫系統(tǒng)包括圖書庫員、館藏資料、信息技術(shù)、環(huán)境和使用者,然而大數(shù)據(jù)新信息環(huán)境的形成,逐漸模糊了圖書庫界與其他信息化的服務(wù)業(yè)之間的顯示的畫面。
調(diào)查發(fā)現(xiàn),84%的使用者使用檢索引擎Google開始信息檢索,1%的人開始在圖書庫頁面上檢索信息,所以圖書庫應(yīng)為這1%的使用者提供數(shù)字圖書庫資料。與此同時(shí),1%的使用者中有70%以上首先選擇使用數(shù)字珍藏;數(shù)字珍藏具有科學(xué)、經(jīng)濟(jì)和可查訪性的特征,而我們需要考慮的是選擇何種模式來存儲(chǔ)數(shù)據(jù)、怎樣的方式來組織信息供閱讀使用者參觀、以及選擇怎樣的方法來確保信息收集的可持續(xù)發(fā)展。
(二)網(wǎng)絡(luò)化
數(shù)字圖書庫的建設(shè)需要為使用者提供便利,而為了實(shí)現(xiàn)這一目的,網(wǎng)格和數(shù)字圖書庫網(wǎng)格將整個(gè)網(wǎng)絡(luò)集成到一個(gè)虛擬的超級(jí)計(jì)算機(jī)中,來實(shí)現(xiàn)使用者對(duì)多個(gè)數(shù)字圖書庫的無縫獲取??傊?,網(wǎng)格實(shí)現(xiàn)了資源的最大共享,實(shí)現(xiàn)了硬件資料、軟件資料和各種信息知識(shí)資料的全面連接。
二、圖書庫數(shù)據(jù)發(fā)掘簡(jiǎn)介
即使手握足夠數(shù)據(jù),圖書庫也要面對(duì)數(shù)據(jù)管理的挑戰(zhàn)。首先,數(shù)據(jù)的存儲(chǔ)、數(shù)據(jù)模型、數(shù)據(jù)分析格式、搜集數(shù)據(jù)的系統(tǒng)的基礎(chǔ)架構(gòu)都要重頭建起,必須能用而且不能出錯(cuò)。之后還要進(jìn)行數(shù)據(jù)清洗,然而并不是所有數(shù)據(jù)都是直接可用的,它們大多雜亂無章、難以理解、無法獲取、甚至有所缺失。
人工智能領(lǐng)域最聰明的一群人都想造出能真正促進(jìn)人類社會(huì)發(fā)展的產(chǎn)品和應(yīng)用,比如無人駕駛,比如預(yù)測(cè)世界經(jīng)濟(jì)走勢(shì)的系統(tǒng),比如超級(jí)醫(yī)療診斷系統(tǒng)等。但格式良好、適合分析的數(shù)據(jù)不會(huì)從天而降。目前,他們把80%的時(shí)間花在了整理歷史數(shù)據(jù)上,個(gè)性化推薦是數(shù)據(jù)發(fā)掘中的常見技術(shù)之一。
個(gè)性化推薦大致可以分為數(shù)據(jù)準(zhǔn)備、規(guī)律尋找、結(jié)果表述三個(gè)基本流程。它利用了來自統(tǒng)計(jì)并解讀解析、人工智能、對(duì)模式進(jìn)行辨識(shí)區(qū)別、神經(jīng)網(wǎng)絡(luò)、模糊數(shù)學(xué)、遺傳程序步驟等多個(gè)學(xué)科領(lǐng)域的思想,并借助于搜集數(shù)據(jù)的系統(tǒng)所提供的有效存儲(chǔ)、索引和查詢處理支持,以及高性能并行計(jì)算、分布式數(shù)據(jù)處理、可視化等技術(shù)而得以實(shí)現(xiàn)。
三、Web日記發(fā)掘應(yīng)用
(一)關(guān)聯(lián)規(guī)則在Web日記發(fā)掘中的運(yùn)用
關(guān)聯(lián)規(guī)則在Web日記發(fā)掘中用于發(fā)現(xiàn)使用者同時(shí)查訪哪些頁面,基本上用于查詢大型項(xiàng)目集。我們可以分析格式化的信息,并使用關(guān)聯(lián)規(guī)則的支持和可信度的定義直接通過Apriori程序步驟或其他相關(guān)程序步驟獲得經(jīng)常查訪的序列。
Apriori程序步驟是關(guān)聯(lián)規(guī)則發(fā)掘程序步驟的核心。它可以使用分段搜集數(shù)據(jù)的系統(tǒng)數(shù)據(jù)的方法來執(zhí)行發(fā)掘,以便使用者只需掃描搜集數(shù)據(jù)的系統(tǒng)兩次。但分割方法的前提是,整體搜集數(shù)據(jù)的系統(tǒng)的任何支持級(jí)別應(yīng)該至少有一組本地搜集數(shù)據(jù)的系統(tǒng)的支持度集合。發(fā)掘網(wǎng)絡(luò)日記數(shù)據(jù)是對(duì)網(wǎng)絡(luò)日記數(shù)據(jù)集進(jìn)行預(yù)處理,并根據(jù)一定的因素將其分成幾個(gè)小的數(shù)據(jù)段。在掃描多個(gè)數(shù)據(jù)段后,Apriori程序步驟用于獲取每個(gè)段的支持,然后每個(gè)分段的發(fā)掘結(jié)果被合并和掃描一次,并且最終的關(guān)聯(lián)規(guī)則集被過濾掉。
(二)序列模式分析序列模式用于查詢數(shù)據(jù)項(xiàng)中的時(shí)序關(guān)系
在Web日記發(fā)掘中,順序?qū)δJ竭M(jìn)行辨識(shí)區(qū)別是指查詢?cè)谑褂谜邥?huì)話中具有時(shí)間關(guān)系的頁面請(qǐng)求。在Web服務(wù)器日記中,使用者查訪會(huì)記錄一段時(shí)間。數(shù)據(jù)經(jīng)過預(yù)處理后,它會(huì)成為間歇性時(shí)間序列。這些順序模式可以預(yù)測(cè)使用者可能請(qǐng)求的頁面,從而可以在頁面上為特定使用者組放置不同的信息提示,提高信息相關(guān)的資料的利用率和使用者信息檢索查詢速度,優(yōu)化網(wǎng)站結(jié)構(gòu)。
(三)Web日記發(fā)掘的一般流程
Web日記發(fā)掘的一般流程包括三個(gè)階段:數(shù)據(jù)預(yù)處理,發(fā)掘階段和模式分析。數(shù)據(jù)預(yù)處理將來自不同數(shù)據(jù)源的數(shù)據(jù)重組為適合數(shù)據(jù)發(fā)掘的數(shù)據(jù)結(jié)構(gòu)是Web日記發(fā)掘的基礎(chǔ),也是整個(gè)發(fā)掘流程中最繁瑣和耗時(shí)的工作。數(shù)據(jù)預(yù)處理包括數(shù)據(jù)清理,使用者辨識(shí)區(qū)別,會(huì)話辨識(shí)區(qū)別,路徑補(bǔ)充和格式轉(zhuǎn)換等幾個(gè)步驟。這是成功Web日記發(fā)掘的關(guān)鍵。
在整個(gè)Web日記發(fā)掘流程中,數(shù)據(jù)預(yù)處理和日記發(fā)掘程序步驟是最關(guān)鍵的技術(shù)。 數(shù)據(jù)預(yù)處理作為發(fā)掘程序步驟的輸入,直接影響到對(duì)數(shù)發(fā)掘的質(zhì)量,發(fā)掘程序步驟的選擇和改進(jìn)是保證發(fā)掘成功的重要因素。
四、個(gè)性化推薦及過濾應(yīng)用
目前,特性化信息化的服務(wù)系統(tǒng)要求使用者逐步手動(dòng)選擇所需的信息類別,然后將這些選擇提交給系統(tǒng)以顯示相應(yīng)的信息。這種服務(wù)方法的低效性也會(huì)增加系統(tǒng)的負(fù)擔(dān)。一旦大家選擇同時(shí)提交請(qǐng)求,信息化的服務(wù)系統(tǒng)將面臨崩潰的危險(xiǎn)。智能過濾技術(shù)智能獲取并分析使用者特定的需要信息,然后在頁面上顯示使用者需要的信息相關(guān)的資料。有些使用者只是去圖書庫找資料來解決一些實(shí)際方面,他們不清楚他們想要的信息。面對(duì)這種情況,智能過濾系統(tǒng)通過使用者的操作行為分析使用者的實(shí)際特定的需要,然后根據(jù)這些特定的需要主動(dòng)推送滿足使用者特定的需要的使用者信息相關(guān)的資料。
另外,使用者的系統(tǒng)追蹤方法也分為顯示追蹤和隱式追蹤兩種。前者是基于使用者反饋的信息,即從圖書庫服務(wù)系統(tǒng)閱讀使用者存儲(chǔ)的個(gè)人基本信息,包括教育、專業(yè)和興趣者在填寫基本信息時(shí)主動(dòng)推薦信息相關(guān)的資料,這種追蹤方式需要使用者的參與。后者通過諸如使用者查看的頁面和查詢內(nèi)容之類的信息來推斷使用者的真實(shí)特定的需要,這種追蹤方法有助于提高服務(wù)系統(tǒng)的效率和智能。
特性化信息智能挑選系統(tǒng)首先挑選使用者信息,創(chuàng)建使用者興趣知識(shí)庫,然后根據(jù)使用者的操作行為進(jìn)一步挑選特性化信息,并基于此更新使用者的興趣知識(shí)。該系統(tǒng)基于其掌握的使用者信息,以便再次智能地在信息化的服務(wù)系統(tǒng)中屏蔽數(shù)字網(wǎng)絡(luò)信息。
參考文獻(xiàn):
[1]王欣, 張冬梅. 大數(shù)據(jù)環(huán)境下基于高校讀者小數(shù)據(jù)的圖書館個(gè)性化智能服務(wù)研究[J]. 情報(bào)理論與實(shí)踐, 2018(2).
[2]柳益君, 何勝, 馮新翎,等. 大數(shù)據(jù)挖掘在高校圖書館個(gè)性化服務(wù)中應(yīng)用研究[J]. 圖書館工作與研究, 2017, 1(5):23-29.
[3]張立濱. 協(xié)同過濾技術(shù)在高校圖書館學(xué)術(shù)資源個(gè)性化推薦服務(wù)中的應(yīng)用研究[J]. 河北科技圖苑, 2017, 30(4):83-86.
[4]韓冬慧, 韋合普, 李娟,等. 大數(shù)據(jù)背景下高校移動(dòng)圖書館個(gè)性化推薦平臺(tái)研究——以四川高校圖書館為例[J]. 四川圖書館學(xué)報(bào), 2017(3):21-24.
[5]崔陽. 高校數(shù)字圖書館個(gè)性化信息推薦服務(wù)策略探究[J]. 科教導(dǎo)刊, 2017(1):182-183.
[6]鐘義信. 人工智能:概念·方法·機(jī)遇[J]. 科學(xué)通報(bào), 2017(22):2473-2479.
[7]郝登山. 人工智能在計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)中的應(yīng)用分析[J]. 中國(guó)新通信, 2016, 18(1):87-89.
[8]何波, 章宏遠(yuǎn), 裴劍輝. 基于大數(shù)據(jù)的高校圖書館個(gè)性化服務(wù)研究[J]. 新世紀(jì)圖書館, 2017(10):59-61.
作者單位:威海市圖書館