• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      數(shù)據(jù)挖掘技術(shù)及其在圖書館2.0建設(shè)中的應(yīng)用

      2013-02-15 05:33:49柴艷玲
      圖書館研究 2013年1期
      關(guān)鍵詞:博客數(shù)據(jù)挖掘學(xué)科

      柴艷玲

      (昆明學(xué)院圖書館,云南 昆明 650214)

      隨著Web2.0技術(shù)的日益成熟,圖書館界利用Web2.0技術(shù)構(gòu)建新型的圖書館服務(wù)模式,圖書館2.0隨之出現(xiàn)。構(gòu)建圖書館2.0不僅需要利用簡易信息聚合(RSS)、博客(Blog)、維客(Wiki)、即時通信 (IM)、 社會性網(wǎng)絡(luò)服務(wù) (SNS) 標(biāo)簽 (Tag)等Web2.0技術(shù),而且需要眾多讀者的參與和大量信息資源的支撐。應(yīng)用數(shù)據(jù)挖掘技術(shù)從海量的數(shù)據(jù)中提取有用的知識,從讀者需求信息中分析讀者需求傾向,可完善圖書館2.0結(jié)構(gòu)化數(shù)據(jù)庫的建設(shè),及時發(fā)現(xiàn)、掌握讀者的閱讀規(guī)律和信息需求,從而提高圖書館2.0的服務(wù)水平。

      1 圖書館2.0概述

      自從2005年鮑爾·米勒(Paul Miller)博士提出圖書館2.0概念以來,國內(nèi)外學(xué)者紛紛開展圖書館2.0研究,一些大學(xué)圖書館也在利用Web2.0技術(shù)構(gòu)建圖書館2.0。對于圖書館2.0的含義,目前沒有統(tǒng)一的說法。范并思、胡小菁指出圖書館2.0是Web2.0技術(shù)或服務(wù)在圖書館信息服務(wù)中的應(yīng)用。劉煒、葛秋妍指出,圖書館2.0不僅僅是一些技術(shù)的組合,更是一種新的服務(wù)模式和管理理念。從這些學(xué)者的論述中,可以看出圖書館2.0注重用戶參與,是以用戶為中心的圖書館服務(wù)模式,是以Web2.0技術(shù)應(yīng)用為主的一種新型服務(wù)模式。在圖書館2.0環(huán)境下,用戶可以參與圖書館的資源建設(shè)、資源組織、門戶網(wǎng)站建設(shè)。隨著圖書館2.0理論研究的不斷深入,北京大學(xué)圖書館、廈門大學(xué)圖書館、南開大學(xué)圖書館、上海大學(xué)圖書館、重慶大學(xué)圖書館、上海交通大學(xué)圖書館、武漢大學(xué)圖書館等積極探索圖書館2.0的建設(shè)和應(yīng)用,推出了圖書館2.0構(gòu)建方案,在資源建設(shè)、信息服務(wù)等方面構(gòu)建了以用戶為中心的服務(wù)模式,成為國內(nèi)大學(xué)圖書館推行圖書館2.0服務(wù)的先行者。總之,參與、合作、創(chuàng)新、共享是圖書館2.0的核心理念。圖書館2.0支持用戶創(chuàng)造或貢獻資源、支持用戶編輯與標(biāo)引資源、支持圖書館為用戶推送與定制資源,是現(xiàn)代網(wǎng)絡(luò)環(huán)境下圖書館的發(fā)展方向。

      2 數(shù)據(jù)挖掘技術(shù)

      數(shù)據(jù)挖掘是從大量的、不完全的、有噪聲的數(shù)據(jù)中提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。數(shù)據(jù)挖掘以人工智能為基礎(chǔ),運用了數(shù)據(jù)庫技術(shù)、統(tǒng)計學(xué)和進化計算等理論和算法。數(shù)據(jù)挖掘的任務(wù)是對數(shù)據(jù)進行關(guān)聯(lián)分析、聚類分析、分類分析、異常分析、特異群組分析和演變分析等,從而找出潛在的有用的信息。目前,數(shù)據(jù)挖掘有十大經(jīng)典算法,其中決策樹方法、關(guān)聯(lián)分析、聚類分析、遺傳算法、粗糙集方法、支持向量機方法是應(yīng)用較為廣泛的數(shù)據(jù)挖掘方法。數(shù)據(jù)挖掘是通過分析每個數(shù)據(jù),從大量數(shù)據(jù)中尋找其規(guī)律的技術(shù),主要分為數(shù)據(jù)準(zhǔn)備、規(guī)律尋找和規(guī)律表示三個步驟:1)數(shù)據(jù)準(zhǔn)備。收集、整理原始數(shù)據(jù),為數(shù)據(jù)挖掘提供充足的材料。對數(shù)據(jù)進行預(yù)處理,將數(shù)據(jù)變換為適合挖掘的形式,如匯總或聚集操作、屬性量化或數(shù)據(jù)降維等。2)數(shù)據(jù)挖掘。確定挖掘的目的和挖掘方法,對數(shù)據(jù)進行分析。3)結(jié)果表達與解釋。數(shù)據(jù)挖掘系統(tǒng)具有產(chǎn)生數(shù)以千計、甚至上萬的模式或規(guī)則的潛在能力。依據(jù)用戶對模式的興趣度進行評估,把能夠表示知識的有趣模式提交給用戶。

      數(shù)據(jù)挖掘工具種類繁多,通常分為三種:通用型工具、綜合數(shù)據(jù)挖掘工具、快速發(fā)展的面向特定應(yīng)用的工具。通用型工具占有較多的市場份額。通用的數(shù)據(jù)挖掘工具采用通用的挖掘算法,處理常見的數(shù)據(jù)類型。如IBM公司的QUEST系統(tǒng)、SGI公司的MineSet系統(tǒng)等。QUEST是一種多任務(wù)數(shù)據(jù)挖掘系統(tǒng),提供了專門在大型數(shù)據(jù)庫上進行各種開采的功能:關(guān)聯(lián)規(guī)則發(fā)現(xiàn)、序列模式發(fā)現(xiàn)、時間序列聚類、決策樹分類、遞增式主動開采等。MineSet集成多種數(shù)據(jù)挖掘算法和可視化工具,幫助用戶直觀地、實時地發(fā)掘、理解大量數(shù)據(jù)背后的知識。MineSet以先進的可視化顯示方法、提供多種數(shù)據(jù)挖掘模式、支持多種關(guān)系數(shù)據(jù)庫、具有多種數(shù)據(jù)轉(zhuǎn)換功能、操作簡單、支持國際字符、可以直接發(fā)布到Web等優(yōu)勢成為數(shù)據(jù)挖掘工具應(yīng)用的佼佼者

      3 基于數(shù)據(jù)挖掘技術(shù)的圖書館2.0構(gòu)建

      圖書館2.0的建設(shè)首先要做好圖書館2.0網(wǎng)站建設(shè),在此基礎(chǔ)上建立資源系統(tǒng)和服務(wù)系統(tǒng)。1932年我國著名圖書館學(xué)家杜定友提出 “書”(包括圖書等一切文化記載)、“人”(即閱覽者)、 法”(包括圖書館的設(shè)備、管理方法、管理人才等)是圖書館構(gòu)成的三要素。1957年,劉國均先生在《什么是圖書館學(xué)》一文中提出圖書、讀者、領(lǐng)導(dǎo)和干部、建筑與設(shè)備、工作方法是圖書館的構(gòu)成要素。從這些學(xué)者對圖書館構(gòu)成要素的不同表達中,我們可以看出,圖書和讀者是圖書館構(gòu)成的基本要素。筆者從這兩方面探討應(yīng)用數(shù)據(jù)挖掘技術(shù)構(gòu)建圖書館2.0的資源體系和用戶服務(wù)內(nèi)容。

      3.1 圖書館2.0的資源建設(shè)

      圖書館2.0的資源建設(shè)因用戶的參與變得更為多樣化,圖書館要對用戶創(chuàng)造和分享的信息進行有效的收集、整理組織并長期保存,以豐富圖書館2.0信息資源。一是利用數(shù)據(jù)挖掘技術(shù)對大量網(wǎng)絡(luò)信息資源尤其是用戶創(chuàng)造的網(wǎng)絡(luò)信息資源進行挖掘、整理,建立各種數(shù)據(jù)庫。網(wǎng)絡(luò)數(shù)據(jù)挖掘是從Web文檔、Web活動中抽取出用戶感興趣的、潛在有價值的隱藏信息。網(wǎng)絡(luò)資源增長迅速、內(nèi)容豐富、形式多樣、結(jié)構(gòu)復(fù)雜、分布廣泛,圖書館可按專題挖掘信息、整理信息,構(gòu)建專題數(shù)據(jù)庫。如高校圖書館可針對學(xué)校學(xué)科特色,構(gòu)建學(xué)科信息庫;挖掘高校師生個人收藏夾,找到隱藏在個人收藏夾中的Web站點的隱性信息,發(fā)掘網(wǎng)站中的所隱含的信息;挖掘教師教學(xué)課件、備課講義以及論文資料等原生數(shù)字資源進行收集、整理、加工,建立知識庫。二是挖掘用戶信息需求特點,建立適合用戶需求的資源體系。對用戶訪問圖書館的歷史記錄、用參考咨詢問題記錄、用戶文獻借閱記錄、用戶參與圖書館活動記錄等進行挖掘,發(fā)現(xiàn)用戶信息需求特點,構(gòu)建知識庫??梢苑治鲇脩舨┛?、維客等內(nèi)容,提煉用戶需求內(nèi)容。廈門大學(xué)圖書館基于維客建立的知識庫主要內(nèi)容包括部門規(guī)章制度、業(yè)務(wù)標(biāo)準(zhǔn)規(guī)范、日常通知告示等,這一知識庫成為用戶了解圖書館的重要參考源。采用數(shù)據(jù)挖掘工具,對用戶借閱數(shù)據(jù)進行聚類分析,找出用戶文獻借閱的一般規(guī)律,從而針對性的加強文獻采購工作,使所采購的文獻既符合本館館藏建設(shè)要求,又能最大限度地滿足用戶的需求。從館員與讀者的QQ交談中、RSS資源推送中、用戶利用SNS網(wǎng)站的過程中挖掘用戶信息需求內(nèi)容,預(yù)測用戶未來信息需求傾向,從而建立具有前瞻性的信息資源體系。三是應(yīng)用數(shù)據(jù)挖掘技術(shù),可以協(xié)助采購人員確定購買各學(xué)科圖書的數(shù)量和復(fù)本量,協(xié)助數(shù)字資源管理人員對各類數(shù)據(jù)庫進行正確評價。通過對文獻借閱量的分析和挖掘,可以獲得圖書的流通指數(shù)、借閱情況、數(shù)字資源訪問情況等,以探索各類文獻間的關(guān)聯(lián)規(guī)則或比例關(guān)系,為各學(xué)科文獻的采訪工作提供科學(xué)、合理的分析和預(yù)測報告。

      3.2 圖書館2.0的用戶服務(wù)

      用戶是圖書館2.0的中心和基礎(chǔ)。通過對圖書館大量數(shù)據(jù)進行聚類分析,可得出讀者需求特征,將讀者劃分為不同的“讀者QQ群”,針對不同的讀者群提供不同內(nèi)容的信息咨詢服務(wù)。QQ群是騰訊公司推出的多人聊天交流服務(wù),群主在創(chuàng)建群以后,可以邀請朋友或者有共同興趣愛好的人到一個群里面聊天。在群內(nèi)除了聊天,騰訊還提供了群空間服務(wù),在群空間中,用戶可以使用群BBS、相冊、共享文件等多種方式進行交流。圖書館可利用“讀者QQ群”,選派不同特長的館員與QQ群的用戶進行交流,開展在線信息咨詢服務(wù)。如圖書館可在圖書館2.0網(wǎng)站建立“文學(xué)類讀者QQ群”“科普類讀者QQ群”“健康類讀者QQ群”“少兒讀者QQ群”等,從而為不同QQ群里的讀者提供其所需的信息內(nèi)容,向不同的讀者QQ群利用RSS主動推送信息。

      博客是以網(wǎng)絡(luò)作為載體,簡易迅速便捷地發(fā)布自己的心得,及時有效輕松地與他人進行交流,集豐富多彩的個性化展示于一體的綜合性平臺。在 “老槐也博客”“超平的博客”“竹帛齋博客”“編目精靈Ⅲ”等圖書館界知名人士博客不斷出現(xiàn)的情形下,圖書館用戶創(chuàng)建的個人博客大量涌現(xiàn)。截至2008年11月7日,中國博客數(shù)量已達到1.07億,2011年我國微博客用戶已經(jīng)超過3億。利用數(shù)據(jù)挖掘技術(shù),對用戶個人博客進行分析,根據(jù)用戶信息需求,構(gòu)建圖書館博客,可將潛在讀者發(fā)展成為現(xiàn)實讀者,擴大圖書館服務(wù)的范圍,提升圖書館的社會影響力。如高校圖書館可在圖書館2.0網(wǎng)站建立學(xué)科博客,為用戶提供學(xué)科知識服務(wù)。上海交通大學(xué)圖書館建立了材料學(xué)科、機械與動力工程、化學(xué)化工、船舶海洋與建筑工程、電子信息與電氣工程、法律學(xué)科、經(jīng)濟與管理、傳媒與設(shè)計等14個學(xué)科博客,介紹和鏈接學(xué)科常用資源,多角度、深層次揭示圖書館資源,為學(xué)科館員的深層次服務(wù)和科研實踐提供了一個舞臺。哈爾濱工業(yè)大學(xué)圖書館在其網(wǎng)站上建立了建筑學(xué)科、材料學(xué)科、管理學(xué)科、能源學(xué)科、交通學(xué)科、計算機學(xué)科、人文社會學(xué)科博客,用戶通過點擊各個學(xué)科博客網(wǎng)址,便可瀏覽內(nèi)容豐富、圖文并茂的學(xué)科博客內(nèi)容。

      總之,利用數(shù)據(jù)挖掘技術(shù)對用戶的網(wǎng)址瀏覽記錄進行挖掘,發(fā)現(xiàn)用戶的使用模式,根據(jù)用戶的興趣提供主動的個性化服務(wù),是圖書館2.0服務(wù)的基本理念。

      4 結(jié)束語

      圖書館2.0是圖書館未來發(fā)展的一個方向,利用數(shù)據(jù)挖掘技術(shù),建立圖書館2.0的信息資源體系,提供個性化的服務(wù)內(nèi)容,可激發(fā)廣大用戶利用圖書館2.0獲取信息的興趣,使Web2.0技術(shù)真正成為推動圖書館科學(xué)發(fā)展的助推器。當(dāng)然,在構(gòu)建圖書館2.0的過程中,圖書館界還需利用其他信息技術(shù),使圖書館2.0的資源更豐富、服務(wù)更便捷。

      [1]曹薇.圖書館 2.0建設(shè)研究[J].情報探索,2009(9):113-115.

      [2]劉曉忠.數(shù)據(jù)挖掘技術(shù)在圖書館建設(shè)中的應(yīng)用[J].硅谷,2012(6):158.

      [3]倪鳳霞.以圖書館 2.0為背景的高校圖書館服務(wù)[J].圖書館學(xué)刊,2011(4):86.

      [4]潘旭武,陳玲洪.數(shù)據(jù)挖掘在數(shù)字圖書館中的應(yīng)用研究[J].浙江高校圖書情報工作,2007(1):36-39.

      猜你喜歡
      博客數(shù)據(jù)挖掘學(xué)科
      【學(xué)科新書導(dǎo)覽】
      土木工程學(xué)科簡介
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      “超學(xué)科”來啦
      基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      論新形勢下統(tǒng)一戰(zhàn)線學(xué)學(xué)科在統(tǒng)戰(zhàn)工作實踐中的創(chuàng)新
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      博客天下
      博客天下(2015年2期)2015-09-15 14:12:57
      基于GPGPU的離散數(shù)據(jù)挖掘研究
      博客相冊
      博客天下(2009年12期)2009-08-21 07:35:10
      枣阳市| 缙云县| 娱乐| 马鞍山市| 浦城县| 瑞安市| 新疆| 盐津县| 阿合奇县| 商丘市| 夏津县| 东港市| 永宁县| 台湾省| 武胜县| 永宁县| 武冈市| 浮山县| 武定县| 遂宁市| 湘潭市| 邢台市| 洛阳市| 阳原县| 凤冈县| 涡阳县| 南投县| 邹平县| 名山县| 舞钢市| 巴塘县| 达日县| 广西| 衡水市| 荔浦县| 澄迈县| 江口县| 遵义市| 双鸭山市| 巴林右旗| 长泰县|