• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      圖書館行業(yè)大數(shù)據(jù)建設研究

      2016-03-17 16:47:33張寧李雪
      科技與創(chuàng)新 2016年5期
      關鍵詞:共享平臺大數(shù)據(jù)圖書館

      張寧+李雪

      摘 要:主要研究了圖書館行業(yè)大數(shù)據(jù)建設的內(nèi)容。根據(jù)國內(nèi)外大數(shù)據(jù)商業(yè)應用實例,從需求、數(shù)據(jù)、標準、共享和環(huán)境建設等方面闡述了大數(shù)據(jù)技術是如何在圖書館行業(yè)落地的,并最終確立了圖書館大數(shù)據(jù)建設的內(nèi)容,包括確定需求和業(yè)務場景、建設數(shù)據(jù)中心、制訂行業(yè)標準、搭建共享平臺、構建圖書館大數(shù)據(jù)生態(tài)圈五方面。

      關鍵詞:圖書館;大數(shù)據(jù);共享平臺;大數(shù)據(jù)生態(tài)圈

      中圖分類號:G250.7 文獻標識碼:A DOI:10.15913/j.cnki.kjycx.2016.05.001

      隨著云計算技術、數(shù)據(jù)存儲和分析等技術的不斷進步和發(fā)展,大數(shù)據(jù)產(chǎn)業(yè)的內(nèi)在價值日益凸顯。人們開始越來越多地依賴數(shù)據(jù)進行決策分析,并對數(shù)據(jù)進行再加工,以不斷發(fā)掘數(shù)據(jù)的內(nèi)在價值,大數(shù)據(jù)已從傳統(tǒng)意義上的概念逐步發(fā)展成為一種產(chǎn)業(yè),成為各國學者研究的熱點。本文以此為背景,通過研究、分析國內(nèi)外相關商業(yè)應用案例,并結合圖書館實際,研究圖書館行業(yè)大數(shù)據(jù)建設的內(nèi)容,希望能為圖書館大數(shù)據(jù)建設提供一定的參考和借鑒。

      1 國內(nèi)外研究現(xiàn)狀

      目前,各國對大數(shù)據(jù)產(chǎn)業(yè)十分重視,紛紛開展大數(shù)據(jù)研究。其中,美國作為大數(shù)據(jù)的發(fā)源地和創(chuàng)新引領者,一直走在世界的最前端。2012-03-29,美國頒布了《大數(shù)據(jù)研究和發(fā)展計劃》,標志著美國成為第一個將大數(shù)據(jù)上升到國家戰(zhàn)略并制訂行動計劃的國家。2013-06,日本公布了《面向2020年的ICT綜合戰(zhàn)略》,全面闡述了在2013—2020年期間以發(fā)展開放公共數(shù)據(jù)和大數(shù)據(jù)為核心的新IT國家戰(zhàn)略,提出將日本建設成為具有世界最高水準的廣泛運用信息產(chǎn)業(yè)技術的國家。加拿大計劃以寬帶建設和數(shù)據(jù)中心建設為支撐,為大數(shù)據(jù)的發(fā)展提供前提條件。英國力推數(shù)據(jù)公開,為商業(yè)、研究機構所用,并支持大數(shù)據(jù)在醫(yī)療、農(nóng)業(yè)、商業(yè)和學術研究等領域的發(fā)展。法國則以新興企業(yè)、軟件制造商、工程師、信息系統(tǒng)設計師等為目標,以一系列投資計劃來促進大數(shù)據(jù)技術的發(fā)展。此外,德國、西班牙、俄羅斯、韓國、澳大利亞、新加坡和印度等國家也紛紛從寬帶網(wǎng)絡、智慧城市、基礎設施、數(shù)據(jù)中心等方面布局大數(shù)據(jù)產(chǎn)業(yè),希望搶占大數(shù)據(jù)領域的技術制高點。

      我國大數(shù)據(jù)布局開始于2012年,包括“十二五國家政務信息化建設工程規(guī)劃”、國家發(fā)改委和中科院“基礎研究大數(shù)據(jù)服務平臺應用示范”項目、廣東啟動大數(shù)據(jù)戰(zhàn)略推動政府轉(zhuǎn)型、北京探索政府公布大數(shù)據(jù)供社會開發(fā)和上海大數(shù)據(jù)研發(fā)三年行動計劃等。此外,在技術層面上,國內(nèi)大數(shù)據(jù)的關注重點為“信息集成”,即利用一個集成的、可縮放的、可擴展和安全的信息基礎設施來推動大數(shù)據(jù)的應用實踐。在商業(yè)上,各商業(yè)帝國也開始紛紛打造自己的大數(shù)據(jù)“戰(zhàn)場”。比如,Google在海量數(shù)據(jù)存儲方面提出了分布式計算的方式,實現(xiàn)了海量數(shù)據(jù)的存儲和管理。Yahoo將大量資源投入到Hadoop的研究中,以推動Hadoop的發(fā)展。阿里巴巴以大量商業(yè)數(shù)據(jù)為基礎進行統(tǒng)計、分析和挖掘,形成規(guī)范的實體明細數(shù)據(jù)和指標數(shù)據(jù),對外提供數(shù)據(jù)服務,并獲得了較好的利潤。其中,具有代表性的為阿里巴巴的“數(shù)據(jù)魔方”。在圖書館行業(yè),美國哈佛大學圖書館已將“大數(shù)據(jù)”服務引入圖書館并付諸實踐,將圖書館大數(shù)據(jù)向讀者公布,其中包含1 200多萬種資料,有書目數(shù)據(jù)、地圖、手稿、音/視頻等,并在美國數(shù)字公共圖書館中提供下載服務。

      2 圖書館行業(yè)大數(shù)據(jù)建設的必要性

      據(jù)2014年中國電子技術標準化研究院出版的《大數(shù)據(jù)標準化白皮書》顯示,目前我國的大數(shù)據(jù)應用主要集中在涉及社會管理和公共服務領域的政府部門,其中,關注度位列前三的分別為“智慧城市”“政務”和“公共服務”。但是,隨著數(shù)字圖書館建設的不斷深入,“智慧圖書館”應運而生。一方面,圖書館擁有的數(shù)字資源和數(shù)據(jù)呈爆炸式增長。以國家圖書館為例,截至2014年年底,數(shù)字資源總量達到1 024.45 TB,數(shù)字資源長期保存量達到897.86 TB,數(shù)字資源服務量達到734.52 TB。除此以外,全館幾十個應用系統(tǒng)每天產(chǎn)生的結構化、非結構化數(shù)據(jù)也已達到GB級,比如用戶行為數(shù)據(jù)、資源數(shù)據(jù)和系統(tǒng)日志等,為圖書館大數(shù)據(jù)建設提供了數(shù)據(jù)基礎。另一方面,為讀者提供個性化服務也是圖書館的現(xiàn)代化需求之一。

      3 圖書館大數(shù)據(jù)建設

      本文以國家圖書館數(shù)字圖書館建設為背景,在研究現(xiàn)代商業(yè)應用成功案例的基礎上,將部分先進理念引入圖書館行業(yè),分別從確定需求、建設數(shù)據(jù)、制訂標準、搭建共享平臺和構建大數(shù)據(jù)生態(tài)圈五個方面,闡述圖書館大數(shù)據(jù)建設的內(nèi)容,為大數(shù)據(jù)技術在圖書館行業(yè)落地提供一定的參考。

      3.1 確定需求和業(yè)務場景

      在大數(shù)據(jù)環(huán)境下,數(shù)據(jù)的有效價值率是很低的,有用數(shù)據(jù)或核心數(shù)據(jù)占有的比例很小,過多地收集數(shù)據(jù)會導致核心數(shù)據(jù)被埋沒在大量的無用數(shù)據(jù)或死數(shù)據(jù)中。因此,前期業(yè)務數(shù)據(jù)的收集并不是盲目的、無邊界的,而是需要我們明確自身的業(yè)務需求,從業(yè)務驅(qū)動的角度選擇最主要、最基礎且需要解決或產(chǎn)生的業(yè)務場景,并根據(jù)這些需求和場景選取所需要的數(shù)據(jù),收集與之相關的數(shù)據(jù)作為大數(shù)據(jù)的數(shù)據(jù)基礎。

      對于圖書館來說,基本業(yè)務需求就是讀者服務和資源建設兩個方面。無論現(xiàn)代技術如何發(fā)展,發(fā)展到何種程度,這兩個方面始終是圖書館業(yè)務的核心。只有牢牢抓住這兩個核心,才能抓住圖書館的核心業(yè)務。因此,圖書館大數(shù)據(jù)的建設首先需要收集與讀者服務和資源建設相關的數(shù)據(jù)。與之相關的數(shù)據(jù)包括讀者屬性數(shù)據(jù)、行為數(shù)據(jù)、資源屬性和資源數(shù)據(jù)等。此外,還需要提供對內(nèi)和對外兩種業(yè)務場景,對內(nèi)為圖書館行業(yè)的管理決策提供科學依據(jù);對外主要為讀者提供個性化、精細化服務,以及為機構用戶提供增值數(shù)據(jù)服務。

      3.2 收集整理數(shù)據(jù),建設數(shù)據(jù)中心

      在大數(shù)據(jù)環(huán)境下,需要對收集到的海量數(shù)據(jù)進行有效的管理和篩選,構建數(shù)據(jù)應用平臺,即建設數(shù)據(jù)中心。對于圖書館來說,需要處理的數(shù)據(jù)不僅包括讀者屬性、讀者行為、服務政策、資源屬性、資源內(nèi)容、資源管理方式等數(shù)據(jù),還包括圖書館業(yè)務規(guī)劃,資源采購情況,服務政策,國家文化走向,當?shù)氐纳鐣?、交通管理和?jīng)濟發(fā)展水平等其他外部數(shù)據(jù)。要想做好數(shù)據(jù)的收集整理和數(shù)據(jù)中心的建設,以下幾方面的工作不容忽視。

      3.2.1 人才培養(yǎng)

      隨著大數(shù)據(jù)時代的到來,圖書館傳統(tǒng)的工作方式、管理辦法和工作內(nèi)容都會發(fā)生變化,數(shù)據(jù)服務模式的比例將會增加,原有圖書館的服務模式也將會由單一的圖書服務模式逐步演變?yōu)閳D書服務和數(shù)據(jù)服務并存的模式。圖書館除了需要擁有一批精通傳統(tǒng)業(yè)務的圖書館員外,還需要培養(yǎng)一批掌握數(shù)據(jù)收集、數(shù)據(jù)分析、數(shù)據(jù)管理、數(shù)據(jù)服務和數(shù)據(jù)研究的人才,將數(shù)據(jù)的收集整理、分析建模、存儲管理、應用服務和研究創(chuàng)新貫穿起來,形成一條完整的主線。這是圖書館大數(shù)據(jù)建設成敗的關鍵所在。

      3.2.2 數(shù)據(jù)估值

      在大數(shù)據(jù)時代,數(shù)據(jù)是具有價值的,充當“生產(chǎn)原材料”的角色,任何企業(yè)或組織在收集原材料時,都會對其進行估值,數(shù)據(jù)也不例外。從數(shù)據(jù)的角度來看,數(shù)據(jù)估值就是從不同的角度、不同的維度思考數(shù)據(jù)的價值。只有明確了數(shù)據(jù)的價值,才能做到數(shù)據(jù)的有效收集、整理和篩選,否則收集到的數(shù)據(jù)中就會存在大量低價值或無價值的數(shù)據(jù),從而無法篩選出我們需要的核心數(shù)據(jù)。

      數(shù)字圖書館發(fā)展到今天,已經(jīng)積累了不少結構化和非結構化數(shù)據(jù),以國家圖書館為代表,數(shù)字資源總量已經(jīng)達到1 024.45 TB。此外,數(shù)字圖書館工程所涉及到的幾十個系統(tǒng)每天產(chǎn)生的數(shù)據(jù)增量也以GB來計。這些數(shù)據(jù)增量的數(shù)據(jù)輸入標準、數(shù)據(jù)格式、數(shù)據(jù)類型、表現(xiàn)形式和存儲結構千差萬別、形式各異。在現(xiàn)有技術條件下,完全收集、整理和處理這些數(shù)據(jù)是一件幾乎不可能完成的事情,因此,必須要制訂圖書館數(shù)據(jù)價值評估標準,對數(shù)據(jù)價值進行量化評判和評估,按照數(shù)據(jù)的重要性排序和分類,并建立數(shù)據(jù)價值信息庫。這樣,不僅有利于收集核心數(shù)據(jù),還有利于了解數(shù)據(jù)價值分布情況,便于數(shù)據(jù)的后續(xù)收集、保存和使用。

      3.2.3 數(shù)據(jù)分類

      在面對大量碎片化數(shù)據(jù)時,如果沒有對收集的數(shù)據(jù)進行科學、有效的分類、存放和管理,就會出現(xiàn)放進去時很輕松,但等到要找出來時就會浪費大量時間,甚至可能找不到的情況。因此,在收集數(shù)據(jù)時,需要對收集的數(shù)據(jù)進行合理分類。筆者認為,可以按照存儲層次、業(yè)務歸屬、隱私安全和數(shù)據(jù)價值等進行劃分。

      3.2.3.1 按照存儲層次劃分

      從數(shù)據(jù)的存儲角度出發(fā),數(shù)據(jù)可以分為基礎數(shù)據(jù)、中間數(shù)據(jù)和應用數(shù)據(jù)三種。其中,基礎數(shù)據(jù)即為原始數(shù)據(jù),僅存儲收集到的最基礎、最原始的數(shù)據(jù),不作任何加工和統(tǒng)計匯總,作為其他數(shù)據(jù)的基礎;中間數(shù)據(jù)是由基礎數(shù)據(jù)發(fā)展而來,在基礎數(shù)據(jù)的基礎上進行加工,包括統(tǒng)計分析、分類匯總等,形成數(shù)據(jù)倉庫;應用數(shù)據(jù)則是針對具體業(yè)務問題,經(jīng)過一系列的數(shù)據(jù)分析和數(shù)據(jù)挖掘得來的數(shù)據(jù)。

      3.2.3.2 按照業(yè)務歸屬劃分

      按照業(yè)務歸屬劃分時,需按照不同的業(yè)務主體分門別類地歸納。對于圖書館行業(yè)來說,業(yè)務數(shù)據(jù)可以分為讀者數(shù)據(jù)、資源數(shù)據(jù)、借閱類數(shù)據(jù)、行為數(shù)據(jù)和資源管理數(shù)據(jù)等。

      3.2.3.3 按照隱私安全劃分

      按照隱私安全劃分,圖書館數(shù)據(jù)可以分為隱私數(shù)據(jù)和非隱私數(shù)據(jù)。其中,隱私數(shù)據(jù)包括個人級別的隱私數(shù)據(jù)、資源級別的隱私數(shù)據(jù)和行為級別的隱私數(shù)據(jù)。個人級別的隱私數(shù)據(jù)是指涉及到讀者個人隱私信息的數(shù)據(jù),包括讀者個人的姓名、住址、工作單位、身份證號、用戶名和密碼等;資源級別的隱私數(shù)據(jù)是指資源的保密性元數(shù)據(jù),包括圖書、音像資源的保密性要求,可公開級別等信息;行為級別的隱私數(shù)據(jù)是指個人在圖書館借閱行為中產(chǎn)生的不宜對大眾公開、或公開后可能會對個人造成不良影響的數(shù)據(jù),包括個人的借閱記錄、逾期記錄等數(shù)據(jù)。

      3.2.3.4 按照數(shù)據(jù)價值劃分

      數(shù)據(jù)是有價的,且每種數(shù)據(jù)的價值不同。人們在使用數(shù)據(jù)時,總希望優(yōu)先使用高價值數(shù)據(jù),忽略或放棄無價值數(shù)據(jù),因此,在數(shù)據(jù)估值的基礎上,需對數(shù)據(jù)價值分類。其中,按照表現(xiàn)形式來分,可以分為顯性價值和隱性價值;按照作用方式來分,可以分為直接價值和間接價值;按照時間范圍來分,可以分為短期價值和長期價值;按照空間范圍來分,可以分為局部價值和整體價值。

      3.2.4 數(shù)據(jù)培養(yǎng)

      對數(shù)據(jù)進行培養(yǎng)即為阿里巴巴大數(shù)據(jù)中所提到的“養(yǎng)數(shù)據(jù)”戰(zhàn)略,也就是改變過去傳統(tǒng)的對已有數(shù)據(jù)單純的、“被動式”的收集行為,開展從無到有的“生產(chǎn)”或“尋找”數(shù)據(jù)的 “主動式”行為,這是基于業(yè)務的深入理解和更高層次決策的需要,也是數(shù)據(jù)收集的更高層次。數(shù)據(jù)的收集不應該僅僅考慮有什么數(shù)據(jù)就收集什么數(shù)據(jù),而是要決定收集哪些數(shù)據(jù),從解決問題的角度出發(fā),在實際研究中了解需要哪些數(shù)據(jù),缺少哪些數(shù)據(jù),哪些數(shù)據(jù)的精度還不符合我們的要求,從而主動地去收集、補充和生產(chǎn)這些數(shù)據(jù),實現(xiàn)從數(shù)據(jù)化運營向運營數(shù)據(jù)的轉(zhuǎn)變。

      3.3 制訂圖書館行業(yè)大數(shù)據(jù)建設標準

      目前,大數(shù)據(jù)技術相關標準的制訂還處于起步階段。就圖書館行業(yè)來說,需要盡快制訂圖書館行業(yè)大數(shù)據(jù)標準體系,分別從基礎框架、數(shù)據(jù)格式、數(shù)據(jù)價值、工作流程和使用方式等方面制訂相關行業(yè)標準,并作為行業(yè)引領規(guī)范,這對圖書館行業(yè)內(nèi)部數(shù)據(jù)交換和共享具有極大的促進作用。

      3.4 搭建大數(shù)據(jù)共享平臺

      我國研究大數(shù)據(jù)的著名學者、電子科技大學的周濤教授曾有一個重要觀點,“進行據(jù)收集無外乎兩個方面,一方面是自己用——用其他數(shù)據(jù)來提高自己手上數(shù)據(jù)的精準度,為我所用;另一方面就是給別人用——把自己的數(shù)據(jù)貢獻給他人使用,提高他人的數(shù)據(jù)精準度?!?/p>

      圖書館行業(yè)不同于其他行業(yè),各級圖書館、各地圖書館以合作為主,資源共享、聯(lián)盟合作是各圖書館關系的主線,文獻傳遞、館際互借也早已深入人心。在大數(shù)據(jù)時代,建設圖書館行業(yè)大數(shù)據(jù)共享平臺,就是以建立大數(shù)據(jù)共建共享機制為基礎,采用直接提供數(shù)據(jù)集和開放數(shù)據(jù)接口兩種方式,聯(lián)合各級圖書館、各地圖書館共同參與大數(shù)據(jù)共享平臺建設。這樣,不僅能夠促進圖書館行業(yè)大數(shù)據(jù)的合作共建、成果共享,還能夠加快大數(shù)據(jù)產(chǎn)業(yè)在圖書館行業(yè)的價值轉(zhuǎn)化。

      3.5 構建圖書館大數(shù)據(jù)生態(tài)圈

      所謂“生態(tài)圈”,其實是借助了生態(tài)學的概念。圖書館大數(shù)據(jù)生態(tài)圈是指在圖書館行業(yè)環(huán)境下所有與大數(shù)據(jù)產(chǎn)業(yè)相關的個體總和,包括圖書館的整個行業(yè)環(huán)境以及在此環(huán)境下的大數(shù)據(jù)涉及的各個層面,比如數(shù)據(jù)源層、數(shù)據(jù)存儲層、數(shù)據(jù)分析層、應用層、支撐保障體系等。在整個生態(tài)系統(tǒng)中,圖書館的優(yōu)勢和核心為數(shù)據(jù)源層,關鍵為數(shù)據(jù)分析層。因此,在構建圖書館大數(shù)據(jù)生態(tài)圈時,我們需要在把握優(yōu)勢層和核心層的基礎上,開放其他層,并走聯(lián)合合作的道路,將各個層面上的行業(yè)、企業(yè)和用戶吸納并連接起來,共同打造圖書館系生態(tài)圈。

      4 總結

      大數(shù)據(jù)已經(jīng)成為信息產(chǎn)業(yè)界的研究熱點,是未來新技術產(chǎn)業(yè)發(fā)展的趨勢之一。圖書館行業(yè)的發(fā)展,尤其是隨著數(shù)字圖書館的不斷深入,大數(shù)據(jù)建設是必不可少的。但是,圖書館行業(yè)大數(shù)據(jù)建設也絕非易事,它需要我們從自身業(yè)務出發(fā),整體規(guī)劃、合理布局,從確定需求、建設數(shù)據(jù)、制訂標準、搭建共享平臺和構建大數(shù)據(jù)生態(tài)圈幾方面入手。只有這樣,才能走出一條傳統(tǒng)圖書館與現(xiàn)代技術相結合的道路,才能將大數(shù)據(jù)技術真正長久地應用于圖書館行業(yè),為圖書館的現(xiàn)代化建設服務。

      參考文獻

      [1]李紀舟,蘇曉娟,葉蕾.大數(shù)據(jù)技術及其國外發(fā)展情況[J].電信技術研究,2013(2).

      [2]宋榮華,李宗富.部分國家大數(shù)據(jù)發(fā)展對我國的啟示[J].科技情報開發(fā)與經(jīng)濟,2014,24(22).

      [3]鄒捷.大數(shù)據(jù)技術發(fā)展研究綜述[J].科技風,2014,7(14).

      [4]陳新明.淘寶網(wǎng)數(shù)據(jù)平臺數(shù)據(jù)倉庫建設[D].大連:大連理工大學,2013.

      [5]程蓮娟.美國推進大數(shù)據(jù)的應用實踐及其有益借鑒——基于圖書館視角的分析[J].情報資料工作,2013(5).

      [6]張新娜.大數(shù)據(jù)時代智慧圖書館建設路徑分析[J].圖書館研究,2014(1).

      [7]蘇蓉.基于大數(shù)據(jù)的數(shù)字圖書館信息服務研究[D].武漢:華中師范大學,2014.

      〔編輯:劉曉芳〕

      猜你喜歡
      共享平臺大數(shù)據(jù)圖書館
      圖書館
      小太陽畫報(2018年1期)2018-05-14 17:19:25
      中企搭乘“共享平臺”好出海
      科學數(shù)據(jù)共享平臺的建設與服務探討
      “微平臺”在包裝設計課程資源共享教學中的應用研究
      藝術科技(2016年10期)2016-12-14 00:18:26
      飛躍圖書館
      基于大數(shù)據(jù)背景下的智慧城市建設研究
      科技視界(2016年20期)2016-09-29 10:53:22
      高校大型儀器設備共享平臺構建與運行管理探討
      科教導刊(2016年9期)2016-04-21 01:47:30
      去圖書館
      凤翔县| 西林县| 克什克腾旗| 惠安县| 商城县| 化隆| 金川县| 巴林左旗| 新和县| 沁水县| 柘荣县| 油尖旺区| 邵武市| 达州市| 伊宁县| 鄂托克旗| 绵阳市| 镇巴县| 慈溪市| 菏泽市| 买车| 岳阳县| 海原县| 嘉兴市| 慈溪市| 新巴尔虎右旗| 南郑县| 五台县| 兰考县| 边坝县| 调兵山市| 昌江| 长子县| 沭阳县| 万山特区| 松阳县| 佛冈县| 即墨市| 民权县| 巴林右旗| 云阳县|