李冬梅
(南通大學(xué) 圖書(shū)館,江蘇 南通 226019)
當(dāng)前,隨著新一代信息技術(shù)的不斷發(fā)展,人工智能技術(shù)應(yīng)用得到快速推廣。在人工智能領(lǐng)域,機(jī)器學(xué)習(xí)技術(shù)可以最大程度模擬人類(lèi)大腦的運(yùn)行機(jī)制,實(shí)現(xiàn)各類(lèi)知識(shí)資源的獲取與關(guān)聯(lián)分析[1]。情境感知主要包括地域情境、內(nèi)心情境的感知,它主要體現(xiàn)的是對(duì)現(xiàn)實(shí)世界實(shí)體屬性信息進(jìn)行刻畫(huà)。在不同的情境中,人們的個(gè)性化反映不盡相同。機(jī)器學(xué)習(xí)技術(shù)在數(shù)字圖書(shū)館情境感知中的應(yīng)用,可以實(shí)現(xiàn)用戶(hù)情境信息的全方位采集,了解不同用戶(hù)的個(gè)性化需求特征,為提高數(shù)字圖書(shū)館個(gè)性化推薦服務(wù)精準(zhǔn)度和用戶(hù)滿(mǎn)意度奠定基礎(chǔ)。
數(shù)字圖書(shū)館是人們生產(chǎn)生活的重要場(chǎng)所,其良好的信息服務(wù)功能受到廣大用戶(hù)的喜愛(ài)和關(guān)注[2]。對(duì)于數(shù)字圖書(shū)館而言,機(jī)器學(xué)習(xí)技術(shù)通過(guò)模擬人類(lèi)大腦神經(jīng)網(wǎng)絡(luò),可以建立圖書(shū)館用戶(hù)行為特征數(shù)據(jù)與圖書(shū)館館藏資源間的數(shù)據(jù)關(guān)聯(lián),同時(shí)實(shí)現(xiàn)關(guān)聯(lián)數(shù)據(jù)資源特征信息的深層次挖掘,使數(shù)字圖書(shū)館與用戶(hù)信息的關(guān)聯(lián)數(shù)據(jù)資源得到廣泛使用,不僅為圖書(shū)館用戶(hù)帶來(lái)了更為便捷的閱讀服務(wù),而且極大地縮短了數(shù)據(jù)運(yùn)算和傳輸時(shí)間,提高了數(shù)字圖書(shū)館信息服務(wù)效率。
在特定情境的激發(fā)下,人們身體中的各種感覺(jué)細(xì)胞會(huì)全方位獲取情境中的信息,并傳輸至大腦進(jìn)行綜合分析判斷,最終形成人們的情緒反應(yīng)。情境感知是通過(guò)傳感器、無(wú)線接觸通信設(shè)備等,采集用戶(hù)在特定情境中的不同信號(hào),并傳輸至計(jì)算機(jī)中,計(jì)算機(jī)對(duì)獲取的用戶(hù)個(gè)人特征信息、地理位置信息、行為狀態(tài)信息等進(jìn)行綜合分析,為提升個(gè)性化推薦服務(wù)水平奠定基礎(chǔ)[3]。機(jī)器學(xué)習(xí)技術(shù)在數(shù)字圖書(shū)館中的應(yīng)用,可以極大提高情境數(shù)據(jù)采集、情境數(shù)據(jù)挖掘和特征提取效率,可以建立情境數(shù)據(jù)與圖書(shū)館館藏資源間的數(shù)據(jù)關(guān)聯(lián),從根本上提高了數(shù)字圖書(shū)館情境感知數(shù)據(jù)運(yùn)算和智能分析水平。
數(shù)字圖書(shū)館智慧化服務(wù)是通過(guò)利用多種智能分析技術(shù),采集用戶(hù)在不同情境中的需求信息,最終滿(mǎn)足不同用戶(hù)的個(gè)性化需求服務(wù)。機(jī)器學(xué)習(xí)技術(shù)可以根據(jù)用戶(hù)不同興趣愛(ài)好,將不同用戶(hù)進(jìn)行合理劃分,建立多個(gè)用戶(hù)群組,使具有相同興趣愛(ài)好的用戶(hù)聚集起來(lái),營(yíng)造一個(gè)開(kāi)放、溫馨的學(xué)習(xí)交流環(huán)境[4-5]。機(jī)器學(xué)習(xí)技術(shù)在情境感知推薦服務(wù)中的應(yīng)用可以極大地提高數(shù)字圖書(shū)館智慧化分析水平,它通過(guò)利用綜合分析計(jì)算和智能匹配運(yùn)算,建立數(shù)字圖書(shū)館與用戶(hù)、不同用戶(hù)間的數(shù)據(jù)關(guān)聯(lián),并對(duì)數(shù)字圖書(shū)館館藏?cái)?shù)據(jù)進(jìn)行實(shí)時(shí)檢測(cè),提高了數(shù)字資源的自動(dòng)識(shí)別和控制能力,使各類(lèi)資源可以得到充分應(yīng)用,為數(shù)字圖書(shū)館高層次、全方位服務(wù)奠定基礎(chǔ)。
數(shù)字圖書(shū)館情境數(shù)據(jù)融合是情境感知推薦服務(wù)的基礎(chǔ),它主要是對(duì)智能感應(yīng)設(shè)備所獲取的全方位用戶(hù)情境信息進(jìn)行融合處理?;跈C(jī)器學(xué)習(xí)的數(shù)字圖書(shū)館情境數(shù)據(jù)融合是將獲取的用戶(hù)情境數(shù)據(jù)進(jìn)行深層次挖掘、特征提取,形成用戶(hù)個(gè)性化的需求特征,達(dá)到洞察用戶(hù)、了解用戶(hù)的目的。
用戶(hù)情境數(shù)據(jù)采集是情境感知推薦服務(wù)的基礎(chǔ)。數(shù)字圖書(shū)館通過(guò)利用傳感器、智能終端、無(wú)線接觸通信設(shè)備等各種智能設(shè)備,獲取與用戶(hù)所處情境相關(guān)的數(shù)據(jù)信息,這些信息包括用戶(hù)基本信息、位置信息、空間信息、近期瀏覽信息等[6]。通常來(lái)講,這些數(shù)據(jù)可以分為固定數(shù)據(jù)和變化數(shù)據(jù)兩種:固定數(shù)據(jù)包括用戶(hù)注冊(cè)信息、研究領(lǐng)域、學(xué)科專(zhuān)業(yè)等;變化數(shù)據(jù)包括用戶(hù)的興趣愛(ài)好、心態(tài)情緒、行為特征、天氣變化、位置信息、空間信息、瀏覽信息等。本文通過(guò)利用機(jī)器學(xué)習(xí)技術(shù),對(duì)所獲取的用戶(hù)情境信息進(jìn)行辨識(shí),利用神經(jīng)網(wǎng)絡(luò)算法建立不同數(shù)據(jù)間的聯(lián)系,建立符合用戶(hù)個(gè)性化特征的數(shù)據(jù)標(biāo)簽,方便數(shù)字圖書(shū)館推薦服務(wù)的使用。
系統(tǒng)所采集的用戶(hù)情境數(shù)據(jù)通常為不規(guī)則數(shù)據(jù),一些數(shù)據(jù)甚至?xí)霈F(xiàn)錯(cuò)誤或者模糊情況。在使用這些數(shù)據(jù)之前,需要對(duì)其進(jìn)行數(shù)據(jù)處理。通常來(lái)講,用戶(hù)情境數(shù)據(jù)處理主要是對(duì)數(shù)據(jù)進(jìn)行挖掘、特征提取,發(fā)掘出數(shù)據(jù)本身所隱藏的共性、個(gè)性特征信息,通過(guò)對(duì)這些特征信息的分析,可以實(shí)現(xiàn)數(shù)據(jù)的辨識(shí)、歸類(lèi)。利用機(jī)器學(xué)習(xí)技術(shù)來(lái)處理用戶(hù)情境特征數(shù)據(jù),可以模擬人類(lèi)大腦思維方式,分辨情境數(shù)據(jù)的不同特征,同時(shí)建立各特征數(shù)據(jù)的關(guān)聯(lián),形成用戶(hù)情境數(shù)據(jù)特征單元。該特征單元是對(duì)用戶(hù)情境的語(yǔ)義描述,它可以是用戶(hù)情境的共性數(shù)據(jù)特征描述,也可以是用戶(hù)情境的個(gè)性數(shù)據(jù)特征描述,不同特征單元的關(guān)聯(lián)就形成了用戶(hù)情境的基本模型。在建立用戶(hù)情境數(shù)據(jù)特征單元的基礎(chǔ)上,對(duì)圖書(shū)館館藏?cái)?shù)據(jù)資源進(jìn)行整合,搭建與特征單元一一對(duì)應(yīng)的情境實(shí)例庫(kù),最終建立基于機(jī)器學(xué)習(xí)的數(shù)字圖書(shū)館用戶(hù)情境模型。
用戶(hù)個(gè)性化需求匹配是數(shù)字圖書(shū)館情境感知推薦服務(wù)的核心,它將數(shù)字圖書(shū)館館藏資源與用戶(hù)情境之間建立對(duì)應(yīng)聯(lián)系。用戶(hù)情境模型是用戶(hù)個(gè)性化需求匹配的基礎(chǔ),通過(guò)用戶(hù)情境模型,可以準(zhǔn)確分離出用戶(hù)情境數(shù)據(jù)特征單元,也就是對(duì)用戶(hù)情境的語(yǔ)義描述,這種語(yǔ)義描述可以直接被計(jì)算機(jī)使用。用戶(hù)個(gè)性化需求匹配過(guò)程是以用戶(hù)情境語(yǔ)義描述為特征詞,在數(shù)字圖書(shū)館館藏資源中開(kāi)展相似度檢索的過(guò)程,對(duì)檢索結(jié)果進(jìn)行相似度排序,相似度高的數(shù)據(jù)資源被保留下來(lái)并提供給用戶(hù)。在整個(gè)相似度檢索過(guò)程中,機(jī)器學(xué)習(xí)技術(shù)發(fā)揮了重要作用,它以用戶(hù)情境語(yǔ)義描述為標(biāo)的物,通過(guò)迭代算法、神經(jīng)網(wǎng)絡(luò)算法等對(duì)數(shù)字圖書(shū)館館藏資源進(jìn)行一一對(duì)比,提高了用戶(hù)個(gè)性化需求匹配的精確度和準(zhǔn)確率。
本文在深入分析基于機(jī)器學(xué)習(xí)的數(shù)字圖書(shū)館情境數(shù)據(jù)融合流程后,結(jié)合國(guó)內(nèi)外最新研究成果,構(gòu)建了基于機(jī)器學(xué)習(xí)的數(shù)字圖書(shū)館情境感知推薦服務(wù)平臺(tái)。該服務(wù)平臺(tái)由情境數(shù)據(jù)采集層、綜合推理分析層和個(gè)性化感知推薦層組成。
情境數(shù)據(jù)采集層是基于機(jī)器學(xué)習(xí)的數(shù)字圖書(shū)館情境感知推薦服務(wù)平臺(tái)的基礎(chǔ),它的主要作用是提供數(shù)據(jù)支撐。用戶(hù)情境數(shù)據(jù)采集包括對(duì)用戶(hù)固定數(shù)據(jù)信息采集和用戶(hù)實(shí)時(shí)數(shù)據(jù)信息采集兩個(gè)方面。用戶(hù)固定數(shù)據(jù)信息主要是用戶(hù)注冊(cè)信息,包括用戶(hù)姓名、聯(lián)系方式、通訊地址、所學(xué)專(zhuān)業(yè)、工作性質(zhì)、家庭住址、借閱記錄、使用權(quán)限等;用戶(hù)實(shí)時(shí)數(shù)據(jù)信息是情境數(shù)據(jù)采集層的重點(diǎn),包括用戶(hù)使用設(shè)備信息、地理位置信息、在線時(shí)長(zhǎng)、行為舉止、興趣愛(ài)好、情緒變化等。情境數(shù)據(jù)采集層通過(guò)建立數(shù)字圖書(shū)館系統(tǒng)與用戶(hù)智能終端設(shè)備間的聯(lián)系,可以實(shí)現(xiàn)多角度、全方位的用戶(hù)行為跟蹤,進(jìn)而采集更為全面的用戶(hù)情境數(shù)據(jù),該層還可以對(duì)采集數(shù)據(jù)進(jìn)行初步過(guò)濾和分類(lèi)。
綜合推理分析層主要是對(duì)所采集的數(shù)據(jù)進(jìn)行處理,同時(shí)對(duì)用戶(hù)情境數(shù)據(jù)進(jìn)行綜合分析。該層首先對(duì)情境數(shù)據(jù)采集層數(shù)據(jù)進(jìn)行分析,將數(shù)據(jù)中的非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行轉(zhuǎn)化,剔除數(shù)據(jù)標(biāo)識(shí)模糊或者錯(cuò)誤的數(shù)據(jù),保證數(shù)據(jù)的完整性和準(zhǔn)確性。然后,對(duì)情境數(shù)據(jù)開(kāi)展數(shù)據(jù)挖掘和特征提取,發(fā)掘出情境數(shù)據(jù)間的內(nèi)在本質(zhì),提取出情境數(shù)據(jù)特征,并對(duì)每組數(shù)據(jù)特征進(jìn)行標(biāo)識(shí),方便數(shù)據(jù)檢索和比對(duì)。該層利用機(jī)器學(xué)習(xí)技術(shù)中的螞蟻算法、神經(jīng)網(wǎng)絡(luò)分析法,模擬人類(lèi)大腦分析模式,對(duì)采集到的用戶(hù)情境數(shù)據(jù)進(jìn)行綜合分析,建立不同情境數(shù)據(jù)特征間的數(shù)據(jù)關(guān)聯(lián),形成用戶(hù)情境數(shù)據(jù)特征單元網(wǎng)絡(luò)。用戶(hù)情境數(shù)據(jù)特征單元網(wǎng)絡(luò)的建立使用戶(hù)情境數(shù)據(jù)與數(shù)字圖書(shū)館館藏資源間形成了對(duì)應(yīng)關(guān)系,方便了數(shù)據(jù)綜合分析后的資源檢索。
個(gè)性化感知推薦層是以用戶(hù)情境數(shù)據(jù)綜合推理分析結(jié)果為基礎(chǔ),在數(shù)字圖書(shū)館館藏資源中開(kāi)展數(shù)據(jù)匹配,并將匹配結(jié)果資源向用戶(hù)展示。數(shù)據(jù)匹配的準(zhǔn)確性關(guān)系到個(gè)性化感知推薦用戶(hù)滿(mǎn)意度,因此在開(kāi)展數(shù)據(jù)匹配過(guò)程中,首先需要注意的是匹配規(guī)則的制定。匹配規(guī)則是由一系列權(quán)重比值組成的,系統(tǒng)通過(guò)對(duì)用戶(hù)情境數(shù)據(jù)特征單元和數(shù)字圖書(shū)館館藏資源數(shù)據(jù)標(biāo)識(shí)進(jìn)行辨識(shí),得出數(shù)據(jù)特征相似度、數(shù)據(jù)描述吻合度等數(shù)據(jù)。通過(guò)對(duì)這類(lèi)數(shù)據(jù)設(shè)定權(quán)重值,開(kāi)展疊加計(jì)算,得出數(shù)據(jù)匹配度,最終將匹配度高的數(shù)據(jù)推薦給用戶(hù)。
個(gè)性化智能推薦服務(wù)是伴隨著信息技術(shù)、人工智能技術(shù)的不斷發(fā)展而得到深入研究的,是數(shù)字圖書(shū)館服務(wù)用戶(hù)的核心功能。數(shù)字圖書(shū)館通過(guò)利用神經(jīng)網(wǎng)絡(luò)技術(shù)對(duì)用戶(hù)情景數(shù)據(jù)進(jìn)行深入學(xué)習(xí),提取用戶(hù)情景個(gè)性化特征數(shù)據(jù),建立不同情景群類(lèi),劃分不同情景下的用戶(hù)需求層次。通過(guò)對(duì)用戶(hù)所屬情景群類(lèi)和層次特征的綜合計(jì)算,得出用戶(hù)實(shí)際需求語(yǔ)義表述。機(jī)器學(xué)習(xí)技術(shù)不僅提高了數(shù)字圖書(shū)館對(duì)用戶(hù)的辨識(shí)認(rèn)知程度,而且極大地提高了個(gè)性化智能推薦服務(wù)水平。個(gè)性化智能推薦服務(wù)作為數(shù)字圖書(shū)館服務(wù)水平的標(biāo)志化特征,為數(shù)字圖書(shū)館知識(shí)庫(kù)技術(shù)的應(yīng)用及智能綜合服務(wù)平臺(tái)的建立奠定了基礎(chǔ),為數(shù)字圖書(shū)館服務(wù)科學(xué)化提供了技術(shù)指導(dǎo)。
進(jìn)入數(shù)字化時(shí)代,圖書(shū)館用戶(hù)的使用習(xí)慣、閱讀方式都在發(fā)生較大變化。隨著智能設(shè)備的不斷發(fā)展,智能閱讀設(shè)備逐漸被廣大圖書(shū)館用戶(hù)接受。智能設(shè)備在圖書(shū)館中的應(yīng)用,改變了用戶(hù)傳統(tǒng)的圖書(shū)閱讀方式和習(xí)慣,對(duì)圖書(shū)館資源開(kāi)發(fā)利用提出了挑戰(zhàn)?;跈C(jī)器學(xué)習(xí)的數(shù)字圖書(shū)館可以充分利用圖像文字、情景等識(shí)別技術(shù),打造與圖書(shū)館實(shí)際場(chǎng)景相同的虛擬場(chǎng)景,為用戶(hù)提供強(qiáng)大的虛擬體驗(yàn)服務(wù)。用戶(hù)通過(guò)穿戴特定智能裝備,可以身臨其境地感受虛擬圖書(shū)館所提供的各項(xiàng)服務(wù)。同時(shí),還可以實(shí)現(xiàn)用戶(hù)與虛擬圖書(shū)館的互動(dòng)交流,使用戶(hù)真正體會(huì)到智能技術(shù)所帶來(lái)的各種便利,提升用戶(hù)閱讀體驗(yàn)服務(wù)。
語(yǔ)音識(shí)別技術(shù)是當(dāng)前各領(lǐng)域研究的重點(diǎn),它作為機(jī)器學(xué)習(xí)技術(shù)之一,應(yīng)用領(lǐng)域越來(lái)越廣泛。該技術(shù)可以將人類(lèi)語(yǔ)音信息轉(zhuǎn)化為能夠被計(jì)算機(jī)識(shí)別的語(yǔ)言信息,并且在整個(gè)信息轉(zhuǎn)化過(guò)程中,最大限度地保證了信息的無(wú)損性。語(yǔ)音識(shí)別技術(shù)在數(shù)字圖書(shū)館中的應(yīng)用,將會(huì)極大地提升數(shù)字圖書(shū)館的智能化水平。數(shù)字圖書(shū)館通過(guò)利用語(yǔ)音識(shí)別技術(shù),將用戶(hù)個(gè)性化需求語(yǔ)音輸入轉(zhuǎn)化為系統(tǒng)可識(shí)別的語(yǔ)言信息,并在數(shù)字圖書(shū)館館藏資源中進(jìn)行智能信息匹配,建立了用戶(hù)語(yǔ)音信息與數(shù)字圖書(shū)館館藏資源間的聯(lián)系,實(shí)現(xiàn)了數(shù)字圖書(shū)館語(yǔ)音智能檢索功能。語(yǔ)音智能檢索服務(wù)可以極大地拓寬數(shù)字圖書(shū)館服務(wù)群體對(duì)象范圍,降低了數(shù)字圖書(shū)館使用難度,方便特殊人群使用。
隨著人工智能技術(shù)的不斷發(fā)展,機(jī)器學(xué)習(xí)技術(shù)在數(shù)字圖書(shū)館領(lǐng)域的應(yīng)用,為其準(zhǔn)確獲取用戶(hù)情景數(shù)據(jù)信息提供了便利,有效地提高了數(shù)字圖書(shū)館個(gè)性化情景感知推薦服務(wù)水平。同時(shí),機(jī)器學(xué)習(xí)技術(shù)可以有效地提升數(shù)字圖書(shū)館的情景感知能力,使其可以更為全面地了解用戶(hù)的個(gè)性化特征,掌握當(dāng)代數(shù)字圖書(shū)館用戶(hù)的個(gè)性化需求。然而,在實(shí)際應(yīng)用過(guò)程中,由于用戶(hù)智能終端設(shè)備不同,可能會(huì)導(dǎo)致用戶(hù)情景數(shù)據(jù)采集的不完整。隨著人工智能技術(shù)的不斷發(fā)展,相信機(jī)器學(xué)習(xí)技術(shù)在數(shù)字圖書(shū)館領(lǐng)域的應(yīng)用會(huì)逐步得到完善,同時(shí)數(shù)字圖書(shū)館情景感知推薦服務(wù)水平將會(huì)得到更大提升。