李晶潔 彭喜梅 李 嵐 張晨玉 王梓真 高文軒
摘? 要:隨著大數(shù)據(jù)時(shí)代來臨,高校圖書館傳統(tǒng)的管理和運(yùn)營(yíng)模式已不能滿足閱讀者需求。文章針對(duì)高校圖書館對(duì)閱讀者喜好了解的缺失,書籍引進(jìn)、擺放規(guī)律不人性化,部分書籍閑置或緊缺等問題,對(duì)天津商業(yè)大學(xué)圖書館閱讀者數(shù)據(jù)進(jìn)行精準(zhǔn)分析,從多維度建立數(shù)據(jù)模型,繪制清晰明了的關(guān)鍵詞數(shù)據(jù)畫像,并參照該畫像內(nèi)容,對(duì)圖書館的資源建設(shè)和服務(wù)提出合理的建議,為相關(guān)院校提供參考。
關(guān)鍵詞:大數(shù)據(jù);高校圖書館;數(shù)據(jù)畫像;人性化服務(wù)
中圖分類號(hào):G252? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2020)01-0090-08
Abstract:With the coming of the era of big data,the traditional management and operation mode of university libraries cant meet the needs of students. In view of the lack of the university librarys understanding of the readerspreferences,the inhumanity of the rules of book introduction and placement,and the idleness or shortage of some books,this paper uses data mining technology to accurately analyze the readersdata in the library of Tianjin University of Commerce,builds a data model from multiple dimensions,draws a clear keyword? data portrait,and makes reference to the content of the portrait. This paper puts forward reasonable suggestions for the resource construction and service of the library,and provides reference for relevant colleges and universities.
Keywords:big data;university library;data portrait;humanized service
0? 引? 言
2008年,維克托·邁爾-舍恩伯格和肯尼斯·庫克耶在《大數(shù)據(jù)時(shí)代》一書中首次提出了大數(shù)據(jù)的概念,這一概念的提出不僅引起了各大領(lǐng)域的廣泛關(guān)注和討論,還給世界重新下了定義。研究機(jī)構(gòu)Gartner[1]指出:大數(shù)據(jù)需要新的處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力來適應(yīng)海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。
隨著全球數(shù)據(jù)爆炸式增長(zhǎng),大數(shù)據(jù)開始滲透到各個(gè)行業(yè)和領(lǐng)域,人們需要新的、更有效的手段對(duì)各種的大量數(shù)據(jù)進(jìn)行挖掘以發(fā)揮其潛能。高校圖書館作為公共服務(wù)體系的重要組成部分,傳統(tǒng)的管理模式和服務(wù)模式已不能滿足閱讀者多樣化的需求。因此,高校圖書館應(yīng)當(dāng)與時(shí)俱進(jìn),借助大數(shù)據(jù)發(fā)展的機(jī)遇,最大可能地為讀者提供有價(jià)值的、精準(zhǔn)度高的信息,提高圖書館資源利用率,完善服務(wù)體系。
1? 相關(guān)研究綜述
王慶和趙發(fā)珍[2]提出用戶畫像有兩種概念,一種是1998年交互設(shè)計(jì)之父Alan Cooper提出的用戶畫像,謝奇、關(guān)晶和楊錯(cuò)[3]將其概括為:通過調(diào)研問卷、電話訪談等手段獲得用戶的定性特征,是描繪或者抽象用戶屬性差異的方法;另一種用戶畫像是在大數(shù)據(jù)環(huán)境下產(chǎn)生的,與數(shù)據(jù)挖掘、大數(shù)據(jù)分析相關(guān),通過數(shù)據(jù)建立描繪用戶的標(biāo)簽,即根據(jù)用戶人口統(tǒng)計(jì)信息、社交關(guān)系、偏好習(xí)慣和消費(fèi)行為等信息而抽象出來的標(biāo)簽畫像,是針對(duì)人的實(shí)時(shí)特征的描繪。本文描述的數(shù)據(jù)畫像即在第二種概括的基礎(chǔ)上進(jìn)行可視化分析得到。數(shù)據(jù)畫像從數(shù)據(jù)來源上分析具有較強(qiáng)的動(dòng)態(tài)性,如圖書館的借閱數(shù)據(jù),借閱者的性別、學(xué)院等特征是固定不變的,相對(duì)來說比較穩(wěn)定,但是借閱者的借閱行為是隨著時(shí)間的變化不斷變化的,這些行為大多會(huì)受到周圍環(huán)境的影響,因此我們要建立精準(zhǔn)的數(shù)據(jù)畫像,需要在時(shí)間或者空間上選好節(jié)點(diǎn),時(shí)間或空間節(jié)點(diǎn)選取得越準(zhǔn)確,參考價(jià)值越高。
從中國(guó)出版?zhèn)髅缴虉?bào)的數(shù)據(jù)來看,近五年來圖書館館配書籍的品種和數(shù)量在逐年增加,從2013年的90.8萬種躍升至2017年的133.6萬種,這樣龐大的數(shù)據(jù)量無疑給圖書館的采購(gòu)人員增加了很大的難度,在探知閱讀對(duì)象對(duì)不同書籍的喜好程度上,采購(gòu)人員最多能做到的只是依舊按以往的圖書種類清單購(gòu)買,以及試探性地添加為數(shù)不多的新種類進(jìn)行測(cè)試。這樣落后的做法往往需要消耗大量的人力、物力、財(cái)力,并且得到的結(jié)果也與“人性化”相悖。近幾年來中國(guó)高校圖書館服務(wù)雖然越來越趨于多樣化、便捷化,但是在圖書館人性化服務(wù)方面缺乏專門的分析和研究。在大數(shù)據(jù)的時(shí)代環(huán)境下,要想跟上井噴式的數(shù)據(jù)增長(zhǎng),我們必須采取數(shù)據(jù)挖掘技術(shù)[4]對(duì)數(shù)據(jù)進(jìn)行精準(zhǔn)分析。
在相關(guān)研究上,丁雷[5]建立了高校圖書館用戶畫像,用數(shù)據(jù)立方體上應(yīng)用OLAP分析技術(shù)從多個(gè)時(shí)空粒度構(gòu)建圖書館的用戶畫像模型;程秀峰[6]等運(yùn)用樸素貝葉斯算法與情景感知功能的協(xié)同推薦模型,形成推薦模型,達(dá)到了個(gè)性化服務(wù)推薦圖書的效果。曾建勛[7]認(rèn)為圖書館精準(zhǔn)服務(wù)需要用戶畫像,用戶畫像可以更好地認(rèn)識(shí)網(wǎng)絡(luò)中的用戶、改善網(wǎng)絡(luò)信息組織、發(fā)現(xiàn)信息傳播規(guī)律。胡媛[8]提出的數(shù)字圖書館知識(shí)社區(qū)綜合服務(wù)能力評(píng)價(jià)指標(biāo)體系。
綜上所述,高校圖書館數(shù)據(jù)畫像研究尚處于發(fā)展階段,還有很多需要完善的方面,如何將大數(shù)據(jù)環(huán)境中用戶畫像思想應(yīng)用在高校圖書館至關(guān)重要。本文在相關(guān)研究的基礎(chǔ)上,以天津商業(yè)大學(xué)為例,對(duì)高校圖書館數(shù)據(jù)畫像進(jìn)行可視化研究,得出不同人群閱讀習(xí)慣、借閱規(guī)律等信息,為圖書館的效率提升提供建議,為相關(guān)財(cái)經(jīng)院校的相關(guān)研究提供參考。
2? 數(shù)據(jù)的采集
閱讀者的數(shù)據(jù)大致分為兩種:一種為靜態(tài)數(shù)據(jù),一種為動(dòng)態(tài)數(shù)據(jù)[9]。我們以天津商業(yè)大學(xué)為初始研究對(duì)象,獲取了“2018年圖書續(xù)借數(shù)據(jù)”“2018年有借閱記錄的書目”“2018年外借中記錄圖書”“2017—2018年中文新書被借閱圖書”“2018年電子書借閱情況統(tǒng)計(jì)”“2018年閱讀者使用座位情況統(tǒng)計(jì)”等數(shù)據(jù)。其中,靜態(tài)數(shù)據(jù)包括閱讀者性別、姓名、學(xué)院、年級(jí)、ID、借閱圖書所處圖書館位置、借閱者類別(教師、研究生、本科生)等;動(dòng)態(tài)數(shù)據(jù)即為閱讀者的行為數(shù)據(jù),包括借閱圖書種類、是否續(xù)借、借閱日期、歸還日期、進(jìn)入圖書館是否預(yù)約、入館時(shí)間、閱讀者所選擇的閱覽室及樓層、選擇的座位編號(hào)等。
3? 數(shù)據(jù)預(yù)處理
建立圖書館數(shù)據(jù)畫像的過程可表現(xiàn)為數(shù)據(jù)化→標(biāo)簽化→關(guān)聯(lián)化→可視化,即首先采集閱讀者的相關(guān)數(shù)據(jù),對(duì)其進(jìn)行預(yù)處理,實(shí)現(xiàn)數(shù)據(jù)化。數(shù)據(jù)處理的主要內(nèi)容包括數(shù)據(jù)清洗、數(shù)據(jù)抽取、數(shù)據(jù)交換和數(shù)據(jù)計(jì)算等[10]。第一步,利用Python、Excel軟件對(duì)缺失數(shù)據(jù)以及毫無意義的數(shù)據(jù)進(jìn)行過濾,刪除原始數(shù)據(jù)中的重復(fù)數(shù)據(jù),去除平滑噪聲數(shù)據(jù)[11],處理缺失值和異常值等,最終得到一份操作性強(qiáng)、有實(shí)際意義的新數(shù)據(jù)。第二步,根據(jù)《中國(guó)圖書館圖書分類法》22個(gè)基本大類對(duì)獲取得到的天津商業(yè)大學(xué)借閱圖書數(shù)據(jù)進(jìn)行分類。第三步,整理數(shù)據(jù)可得,樣本室不可外借圖書總計(jì)21202冊(cè),占館藏比例前五的不可外借圖書種類依次為經(jīng)濟(jì)、政治法律、數(shù)理科學(xué)和化學(xué)、哲學(xué)、語言文字;閱覽室可外借圖書總計(jì)42411冊(cè),占館藏比例前五的可外借圖書種類依次為經(jīng)濟(jì)、工業(yè)技術(shù)、政治法律、文學(xué)、數(shù)理科學(xué)和化學(xué)。各類圖書占館藏比例與占借閱總量比例相比較可以用來衡量某類圖書的利用率,表達(dá)公式為:
2017—2018年占借閱總量占比前四的圖書總類為經(jīng)濟(jì)、文學(xué)、工業(yè)技術(shù)、政治法律,由此我們可推測(cè)各類圖書占館率與利用率間有正向關(guān)系。最后,以閱讀者為研究對(duì)象,建立學(xué)生性別、學(xué)院、年級(jí)、圖書借閱時(shí)長(zhǎng)與外借圖書、圖書分類、圖書續(xù)借情況、圖書館科室等維度之間的關(guān)系,并分析其關(guān)聯(lián)程度。
4? 數(shù)據(jù)分析
4.1? 借閱總數(shù)分析
2018年各學(xué)院借閱者已歸還借閱總量為26190冊(cè),法
學(xué)院借閱量最多,為3313冊(cè),會(huì)計(jì)學(xué)院借閱量最少,為343冊(cè),其余學(xué)院如圖1所示;2018年外借中記錄總量2631冊(cè),機(jī)械工程學(xué)院借閱量最多,為239冊(cè),會(huì)計(jì)學(xué)院借閱量最少,為16冊(cè),其余學(xué)院如圖2所示;在2018年總體借閱量學(xué)院分布圖中,借閱量位于突出位置的學(xué)院為法學(xué)院、經(jīng)濟(jì)學(xué)院、商學(xué)院,2018年總體借閱量學(xué)院分布如圖3所示。
4.2? 借閱者學(xué)院分布及關(guān)聯(lián)性分析
熱圖中每行(列)方塊大小越均勻,說明該行(列)所對(duì)應(yīng)列(行)的維度關(guān)聯(lián)程度越小。由2018年借閱數(shù)據(jù)熱圖可知,工業(yè)技術(shù)類圖書較受研究生部、機(jī)械工程學(xué)院、教師喜愛;經(jīng)濟(jì)類圖書較受經(jīng)濟(jì)學(xué)院、研究生部、商學(xué)院喜愛;歷史、地理類圖書較受研究生部、教師喜愛;社會(huì)科學(xué)總論類圖書較受研究生部喜愛;數(shù)理科學(xué)和化學(xué)類圖書較受研究生部、生物技術(shù)與食品科學(xué)學(xué)院、理學(xué)院喜愛;文學(xué)列方塊大小均較大,說明文學(xué)類圖書均受各學(xué)院借閱者喜愛;語言文字類圖書受研究生部、外國(guó)語學(xué)院、國(guó)際教育合作學(xué)院喜愛;哲學(xué)類圖書受研究生部、經(jīng)濟(jì)學(xué)院喜愛;藝術(shù)類圖書明顯受藝術(shù)學(xué)院喜愛;政治、法律明顯受研究生部、法學(xué)院喜愛;馬列主義類圖書明顯受研究生部喜愛;余下的文化科學(xué)類、醫(yī)藥衛(wèi)生類、生物科學(xué)類、天文學(xué)類、軍事類、交通運(yùn)輸類、自然科學(xué)總論類、綜合性圖書類圖書借閱者普遍較少,2018年各學(xué)院借閱圖書種類數(shù)據(jù)熱圖如圖4所示。
4.3? 借閱者年級(jí)分析
從2018年借閱圖書數(shù)據(jù)可以看出:本科生借閱量最多的年級(jí)為17級(jí),占比21.71%;研究生同樣也是17級(jí)借閱量最多,占比7.05%;教師借閱圖書量占全校借閱量的2.82%,在2018年全校龐大的借閱數(shù)據(jù)中已經(jīng)達(dá)到了很高的借閱水平,2018年各年級(jí)圖書借閱情況占比如圖5所示。
4.4? 借閱者性別分析
根據(jù)2018年各類圖書男女生借閱情況分析可得,男生偏好圖書前三類依次為工業(yè)技術(shù)、經(jīng)濟(jì)、文學(xué);女生偏好圖書前三類依次為文學(xué)、工業(yè)技術(shù)、經(jīng)濟(jì);男生語言文學(xué)類借閱總占比明顯小于女生。男生續(xù)借圖書中工業(yè)技術(shù)類最多,女生續(xù)借圖書中文學(xué)類最多,這與性別偏好有關(guān),2018年各類圖書男女生借閱及續(xù)借情況如圖6、圖7所示。
根據(jù)2018年各學(xué)院男女生借閱情況可知,在男生借閱數(shù)據(jù)中,研究生借閱量最多,本科生機(jī)械工程學(xué)院借閱量較多,會(huì)計(jì)學(xué)院、管理學(xué)院借閱量較少;在女生借閱數(shù)據(jù)中,研究生借閱量也較多,本科生法學(xué)院借閱量最多,管理學(xué)院、會(huì)計(jì)學(xué)院借閱量最少。綜合比較,藝術(shù)學(xué)院、公共管理學(xué)院、商學(xué)院男女生借閱人數(shù)差距較大,管理學(xué)院、會(huì)計(jì)學(xué)院、信息工程學(xué)院男女生借閱人數(shù)差距較小,2018年各學(xué)院男女生借閱情況如圖8所示。
根據(jù)2018年男女生各學(xué)院借閱時(shí)長(zhǎng)分析可知,女生借閱時(shí)長(zhǎng)中,會(huì)計(jì)學(xué)院最短,其他學(xué)院較均勻;男生借閱時(shí)長(zhǎng)中,會(huì)計(jì)學(xué)院與管理學(xué)院較短,與其他學(xué)院差距較大。雖然女生借閱書本總量大于男生,但機(jī)械工程學(xué)院與信息工程學(xué)院男生借閱時(shí)長(zhǎng)明顯比女生長(zhǎng),2018年男女生各學(xué)院借閱時(shí)長(zhǎng)如圖9所示。
(a)各學(xué)院女生借閱時(shí)長(zhǎng)
(b)各學(xué)院男生借閱時(shí)長(zhǎng)
4.5? 圖書館具體書目借閱分析
根據(jù)2018年借閱圖書畫像和外借已歸還圖書中最受歡迎書目可知,社會(huì)學(xué)類、基礎(chǔ)學(xué)科教輔書類、熱門小說類受廣大借閱者歡迎。因此,各高??梢源罅恳M(jìn)當(dāng)下熱門圖書,以及本學(xué)?;A(chǔ)課程的輔導(dǎo)書,2018年借閱圖書畫像如圖10所示,2018外借已歸還圖書中最受歡迎書目如圖11所示。
由最受歡迎書目男女生借閱情況可知,前十名最受歡迎書目女生借閱次數(shù)均高于男生,主要是由天津商業(yè)大學(xué)男女比例不均衡所致。《經(jīng)濟(jì)學(xué)原理》這本書男女生借閱次數(shù)相差不大,我們認(rèn)為這與經(jīng)濟(jì)學(xué)是天津商業(yè)大學(xué)的一門重要學(xué)科有較大關(guān)聯(lián),根據(jù)線下調(diào)查,還有一個(gè)原因是越來越多的學(xué)生認(rèn)識(shí)到經(jīng)濟(jì)學(xué)在生活中的重要性。2018最受歡迎書目男女生借閱情況如圖12所示。
利用詞云圖對(duì)各學(xué)院借閱情況具體分析,由經(jīng)濟(jì)學(xué)院借閱書目可知,借閱記錄前十的書目中,有九本是關(guān)于經(jīng)濟(jì)學(xué)的圖書,剩余一本為《高等數(shù)學(xué)》。眾所周知,經(jīng)濟(jì)學(xué)體系中經(jīng)濟(jì)學(xué)的概念、理論判斷、客觀推理的內(nèi)容表現(xiàn)為科學(xué)規(guī)律,其表現(xiàn)形式就是語言[12](自然語言和人工語言),數(shù)學(xué)語言就是一種特別重要的人工語言。因此,經(jīng)濟(jì)學(xué)專業(yè)的學(xué)生除了自生專業(yè)素養(yǎng)的培養(yǎng),還必須要有數(shù)學(xué)方面的邏輯思維能力。商學(xué)院與經(jīng)濟(jì)學(xué)院有著密不可分的關(guān)系,商學(xué)是隨著時(shí)代經(jīng)濟(jì)變化的步伐產(chǎn)生的,但又區(qū)別于經(jīng)濟(jì)學(xué)。商學(xué)的范圍很廣,包括會(huì)計(jì)財(cái)務(wù)、銀行學(xué)、商業(yè)運(yùn)營(yíng)、人力資源、經(jīng)濟(jì)等,該學(xué)科服務(wù)于社會(huì)生活中的各個(gè)領(lǐng)域。商學(xué)院借閱書目的種類繁多,如《貨幣金融學(xué)》《互聯(lián)網(wǎng)》《工程數(shù)學(xué)》《會(huì)計(jì)基礎(chǔ)》《管理心理學(xué)》等,經(jīng)濟(jì)學(xué)院借閱書目如圖13所示,商學(xué)院借閱書目如圖14所示。
由各學(xué)院借閱結(jié)果可得,《高等數(shù)學(xué)》作為各學(xué)院基礎(chǔ)課,各學(xué)院借閱的次數(shù)較均衡且普遍偏多。同為基礎(chǔ)學(xué)科的《大學(xué)英語》《馬克思主義基本原理概論》《中國(guó)近現(xiàn)代史綱要》等書籍卻鮮有借閱,易知借閱者更偏好借閱較有難度的基礎(chǔ)課類書籍。除《高等數(shù)學(xué)》外,各學(xué)院借閱次數(shù)較多的是文學(xué)類圖書,這與之前分析的結(jié)論一致——文學(xué)類圖書均受各學(xué)院的喜愛。而其他書目與借閱者所學(xué)專業(yè)有很強(qiáng)的對(duì)應(yīng)性,例如《食品營(yíng)養(yǎng)學(xué)》的借閱者全部為生物技術(shù)與食品科學(xué)學(xué)院學(xué)生,《法理學(xué)》的借閱者全部為法學(xué)院學(xué)生。
5? 閱讀者行為與圖書館座位關(guān)系分析
對(duì)2018年閱讀者入館時(shí)段分析,6月和11月各學(xué)院進(jìn)館人數(shù)達(dá)到頂峰,6月經(jīng)濟(jì)學(xué)院進(jìn)館人數(shù)高達(dá)27013人,與2018年各學(xué)院借閱總覽圖進(jìn)行對(duì)照,6月和11月進(jìn)館人數(shù)達(dá)到頂峰的主要原因是考試復(fù)習(xí),并且在各個(gè)時(shí)段所有學(xué)院使用座位總次數(shù)最多的均為15級(jí)學(xué)生,聯(lián)系2018年為15級(jí)學(xué)生考研備考時(shí)期,可推斷15級(jí)學(xué)生座位使用次數(shù)與考研自習(xí)有很大關(guān)系,其他月份進(jìn)館人數(shù)與借閱人數(shù)呈正相關(guān)。文學(xué)專業(yè)學(xué)生更偏好去社科借閱室,經(jīng)濟(jì)學(xué)、理學(xué)和工學(xué)專業(yè)學(xué)生更偏好去科技借閱室,2018年入館時(shí)段分布如圖15所示(圖書館每年2月閉館,沒有數(shù)據(jù))。
6? 結(jié)? 論
在大數(shù)據(jù)時(shí)代,各服務(wù)行業(yè)未來的發(fā)展趨近于精準(zhǔn)服務(wù),圖書館領(lǐng)域的發(fā)展也不例外。用戶畫像作為實(shí)現(xiàn)精準(zhǔn)服務(wù)的描述工具之一,運(yùn)用于高校圖書館,能夠提供更高效、更高質(zhì)量、更人性化的服務(wù)。本文分析了圖書館領(lǐng)域用戶畫像的研究現(xiàn)狀,借鑒了用戶畫像在電子商務(wù)領(lǐng)域和圖書館領(lǐng)域的發(fā)展經(jīng)驗(yàn),應(yīng)用大數(shù)據(jù)的處理方法,從多維度分析借閱者偏好,尋找規(guī)律,最后形成借閱者的標(biāo)簽體系,并建立借閱者數(shù)據(jù)畫像,從而挖掘出大量數(shù)據(jù)中隱含的、有潛在價(jià)值的信息。
從大數(shù)據(jù)時(shí)代給圖書館帶來的機(jī)遇與挑戰(zhàn)來看,高校圖書館作為師生獲取學(xué)習(xí)資源的場(chǎng)所,應(yīng)該及時(shí)提高圖書資源建設(shè)和服務(wù)水平。利用建立的數(shù)據(jù)畫像,建議各高校圖書館在資源建設(shè)方面提升書籍曝光度;多引進(jìn)熱門圖書和經(jīng)典圖書;將自習(xí)室與閱覽室分開,使書刊資源得到充分利用。在服務(wù)水平方面,建議根據(jù)學(xué)院偏好程度設(shè)立圖書分區(qū),完善圖書推薦系統(tǒng);增加線下讀書活動(dòng);實(shí)現(xiàn)周末借閱圖書自由化。
參考文獻(xiàn):
[1] THIBODEAU,PATRICK. Gartner Upbeat on Big Data Jobs [J].EN,2012,46(20):6.
[2] 王慶,趙發(fā)珍.基于“用戶畫像”的圖書館資源推薦模式設(shè)計(jì)與分析 [J].現(xiàn)代情報(bào),2018,38(3):105-109+137.
[3] 謝奇,關(guān)晶,楊錯(cuò).后GoogleScholar時(shí)代新的學(xué)術(shù)利器——百度學(xué)術(shù)搜索 [J].農(nóng)業(yè)圖書情報(bào)學(xué)刊,2015,27(6):110-114.
[4] 蔡萌萌,張巍巍,王泓霖.大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘綜述 [J].價(jià)值工程,2019,38(5):155-157.
[5] 丁雷.大數(shù)據(jù)環(huán)境下高校圖書館用戶畫像與特征研究 [J].中國(guó)科技信息,2018(24):59-62+64.
[6] 程秀峰,范曉瑩,楊金慶.一種融合了基于樸素貝葉斯算法與情境感知的協(xié)同推薦系統(tǒng)——以大學(xué)圖書館實(shí)體圖書推薦為例 [J].現(xiàn)代情報(bào),2019,39(2):57-65.
[7] 曾建勛.精準(zhǔn)服務(wù)需要用戶畫像 [J].數(shù)字圖書館論壇,2017(12):1.
[8] 胡媛,毛寧. 基于用戶畫像的數(shù)字圖書館知識(shí)社區(qū)用戶模型構(gòu)建 [J].圖書館理論與實(shí)踐,2017(4):82-85+97.
[9] 李雅. 基于讀者用戶畫像的高校圖書館精準(zhǔn)化服務(wù)研究 [J].農(nóng)業(yè)圖書情報(bào)學(xué)刊,2018,30(12):108-111.
[10] 余本國(guó).基于Python的大數(shù)據(jù)分析基礎(chǔ)及實(shí)戰(zhàn) [M].北京:中國(guó)水利水電出版社,2018.
[11] 趙一凡,卞良,叢昕.數(shù)據(jù)清洗方法研究綜述 [J].軟件導(dǎo)刊,2017,16(12),222-224.
[12] 陳世清.超越中國(guó)“主流經(jīng)濟(jì)學(xué)家” [M].北京:中國(guó)國(guó)際廣播出版社,2013.
作者簡(jiǎn)介:李晶潔(1985-),男,漢族,天津人,就職于理學(xué)院,教師,博士研究生,研究方向:數(shù)據(jù)分析,環(huán)境信用評(píng)價(jià),隨機(jī)微分方程;彭喜梅(1996-),女,漢族,四川宜賓人,本科在讀,研究方向:數(shù)學(xué)與應(yīng)用數(shù)學(xué);李嵐(1998-),女,漢族,云南紅河人,本科在讀,研究方向:數(shù)學(xué)與應(yīng)用數(shù)學(xué);張晨玉(1996-),女,漢族,貴州仁懷人,本科在讀,研究方向:信息與計(jì)算科學(xué);王梓真(1998-),女,漢族,河北邢臺(tái)人,本科在讀,研究方向:數(shù)學(xué)與應(yīng)用數(shù)學(xué);高文軒(1998-),女,漢族,廣西桂林人,本科在讀,研究方向:數(shù)學(xué)與應(yīng)用數(shù)學(xué)。