施 爍
(北京中電普華信息技術有限公司,北京 100089)
物聯(lián)網(wǎng)利用激光掃描器、GPRS 定位系統(tǒng)、紅外線感應器、射頻識別等設備,通過互聯(lián)網(wǎng)和實體連接起來交換信息和通訊,最終實現(xiàn)智能識別、定位、監(jiān)管、跟蹤和管理。物聯(lián)網(wǎng)技術被廣泛應用于人們的生產(chǎn)生活中,各行各業(yè)都離不開物聯(lián)網(wǎng),不同類型的數(shù)據(jù)可通過傳感器節(jié)點進行交流和通訊。隨著物聯(lián)網(wǎng)技術的不斷發(fā)展,產(chǎn)生的數(shù)據(jù)也越來越多,這些數(shù)據(jù)里蘊藏著巨大的、有用的價值,挖掘與分析這些有用的價值對人類社會的發(fā)展進步有重大意義。
物聯(lián)網(wǎng)存在的意義是使得人們的生產(chǎn)生活更加智能化,而數(shù)據(jù)背后的價值可被挖掘出來并得以有效分析是智能化應用的基礎,也是衡量物聯(lián)網(wǎng)是否智能化的標準之一。物聯(lián)網(wǎng)數(shù)據(jù)的特點主要有以下幾點:
(1)異構性和海量性。物聯(lián)網(wǎng)中的各類傳感器和數(shù)據(jù)均被存儲于不同的數(shù)據(jù)庫中,物聯(lián)網(wǎng)的誕生方式也決定了它的異構性,而且這些數(shù)據(jù)不僅包含了二維結構化數(shù)據(jù),也包含了圖像、視頻、文檔等非結構化數(shù)據(jù),該類數(shù)據(jù)不能通過二維方式表達出來。物聯(lián)網(wǎng)中包含了海量數(shù)據(jù)節(jié)點和傳感器,每天產(chǎn)生的數(shù)據(jù)量龐大。
(2)分布式存儲特性。要進行數(shù)據(jù)挖掘,首先要存儲數(shù)據(jù),由于物聯(lián)網(wǎng)的異構性,決定了數(shù)據(jù)的分布式存儲。與以往的數(shù)據(jù)存儲方式不同,分布式存儲將數(shù)據(jù)分散的存儲于不同的網(wǎng)絡節(jié)點形成虛擬的存儲器。分布式存儲使得不同地域、網(wǎng)絡間的數(shù)據(jù)交換和共享成為可能。
數(shù)字圖書館的框架由感知層、數(shù)據(jù)層、數(shù)據(jù)挖掘?qū)雍蛻脤咏M成。
(1)感知層。感知層中大量的傳感器節(jié)點用于數(shù)據(jù)采集,還有大量的虛擬化資源。
(2)傳輸層。傳輸層為了實現(xiàn)圖書館中人和人、人和物、物和物之間的全面聯(lián)系、交流互通,而將移動網(wǎng)絡、局域網(wǎng)絡、物聯(lián)網(wǎng)、無線網(wǎng)之間進行融合,構建安全、暢通、可靠的傳輸通道。
(3)數(shù)據(jù)層和數(shù)據(jù)挖掘?qū)印?shù)據(jù)層利用數(shù)據(jù)轉(zhuǎn)換模塊將非結構數(shù)據(jù)和異構數(shù)據(jù)轉(zhuǎn)換并進行分布式存儲,既解決了異構數(shù)據(jù),又保證數(shù)據(jù)存儲的完整性。物聯(lián)網(wǎng)數(shù)據(jù)不僅具有一般數(shù)據(jù)的特性,在此基礎上在有時間性、復雜性、空間性等性質(zhì),可將現(xiàn)實的空間時間反應出來。數(shù)據(jù)挖掘?qū)邮菆D書館的核心框架之一,可提供數(shù)據(jù)挖掘的云計算服務和數(shù)據(jù)并行化技術等,可進行數(shù)據(jù)的轉(zhuǎn)換和清洗等工作。數(shù)據(jù)挖據(jù)層還可實現(xiàn)數(shù)據(jù)的關系、分類、聚集同類數(shù)據(jù)、發(fā)現(xiàn)異常等。
(4)應用層。該功能實現(xiàn)人機交互,如用戶注冊、識別、展示服務結果等。
以物聯(lián)網(wǎng)為基礎的數(shù)字圖書館讓文獻與人、文獻與文獻之間相互聯(lián)系。大量用戶信息蘊藏在圖書館的系統(tǒng)之中,比如用戶的借閱記錄、個人信息等,通過對這些數(shù)據(jù)進行挖掘并分析,可得出該用戶的個性信息。數(shù)據(jù)挖掘在數(shù)字圖書館中的應用體現(xiàn)在針對個人的個性化服務、優(yōu)化館藏信息和分類布局等。
(1)優(yōu)化館藏信息與分類。通過挖掘用戶的借閱記錄,將借閱圖書的頻率、目錄、種類總結出來,可得出用戶的借閱習慣和偏好。進而為圖書館的下一步采購和圖書布局分類提供指導,使得館藏資源的布局達到最優(yōu),更好的服務于人們。
(2)個性化服務。根據(jù)用戶的瀏覽歷史記錄和興趣可定制個性化服務與推介,通過向用戶的手機APP 或者其他交流平臺推送相關內(nèi)容,這樣可以保證用戶以最快的速度獲取最新的、最相關的第一手資料。實現(xiàn)個性化服務技術的關鍵:①以用戶特征為基礎建立模型。既然是個性化,就要以用戶自身的需求為出發(fā)點,就如同去裁縫店量體裁衣一樣,而和量體裁衣不一樣的是裁縫店的布料是固定的,只能根據(jù)顧客的體型做相應的改動。此處的個性化服務首先分析了用戶的興趣愛好、知識背景、工作環(huán)境、社會關系、社交層面等,而且它們是動態(tài)的,隨時可能變化的,以此為基礎建立模型;②個性化推介。以往在圖書館輸入同一個詞語進行檢索,得出的結果都一樣,由于數(shù)據(jù)資源太多巨大,找到自己需要的資源非常困難。而挖掘技術的引進,個性化推介引擎的問世,可幫助用戶從大量的數(shù)據(jù)資源中找到自己想要的內(nèi)容,信息過載問題迎刃而解。