裘進(jìn) 李秋霞
摘 要 農(nóng)業(yè)信息的獲取對(duì)用戶農(nóng)業(yè)生產(chǎn)來(lái)說(shuō)至關(guān)重要,其直接影響了農(nóng)民的收入。由于農(nóng)業(yè)具有地域性、季節(jié)性等情境特點(diǎn),再加上用戶具有個(gè)人偏好上的動(dòng)態(tài)變化,使農(nóng)業(yè)信息推薦的時(shí)效性尤為重要?;诖耍瑢⑥r(nóng)業(yè)情境特點(diǎn)、用戶搜索瀏覽行為、用戶特征、信息偏好、時(shí)間變化等綜合考慮,構(gòu)建面向涉農(nóng)用戶的農(nóng)業(yè)信息個(gè)性化推薦服務(wù)框架和算法模型。
關(guān)鍵詞 農(nóng)業(yè)信息資源;用戶興趣偏好;個(gè)性化推薦
中圖分類(lèi)號(hào):TP391.3 文獻(xiàn)標(biāo)志碼:B DOI:10.19415/j.cnki.1673-890x.2018.15.109
在信息技術(shù)不斷發(fā)展的今天,農(nóng)業(yè)領(lǐng)域?qū)π畔①Y源的需求也隨之增強(qiáng),掌握農(nóng)業(yè)信息對(duì)涉農(nóng)用戶的生產(chǎn)、市場(chǎng)活動(dòng)有著密切的關(guān)系,如何在農(nóng)業(yè)領(lǐng)域相關(guān)活動(dòng)中推進(jìn)信息化技術(shù)的應(yīng)用,如何利用信息化技術(shù)使農(nóng)業(yè)信息需求用戶及時(shí)獲知農(nóng)業(yè)方面的政策法規(guī)、前沿技術(shù)、市場(chǎng)信息,并提供具有針對(duì)性的個(gè)性化咨詢服務(wù)成為了農(nóng)業(yè)信息化推進(jìn)過(guò)程中的一大難題。一方面,農(nóng)業(yè)信息涉及因素較多,結(jié)構(gòu)關(guān)系復(fù)雜;另一方面,用戶快速獲取信息的時(shí)效性和針對(duì)性不強(qiáng)。
目前,信息推薦系統(tǒng)大多是根據(jù)用戶網(wǎng)絡(luò)瀏覽行為進(jìn)行相關(guān)推薦,對(duì)用戶具體特征、用戶偏好及情境因素等考慮較少[1]。事實(shí)上,用戶對(duì)信息的需求是不斷變化的,但已有的推薦算法大多停留在靜態(tài)層面,并未考慮到時(shí)間差異對(duì)用戶偏好的動(dòng)態(tài)改變,用戶對(duì)信息偏好的興趣會(huì)隨著時(shí)間推移出現(xiàn)動(dòng)態(tài)漂移,從而在一定程度上引起最終推薦效果的偏差[2]。因此,為解決涉農(nóng)用戶農(nóng)業(yè)信息過(guò)載、信息不對(duì)稱(chēng)、信息獲取效率低等問(wèn)題,應(yīng)結(jié)合用戶情境特點(diǎn)和信息興趣的偏好變化,建立農(nóng)業(yè)信息個(gè)性化推薦的基本流程和算法。
1 農(nóng)業(yè)信息服務(wù)的關(guān)聯(lián)因素
1.1 農(nóng)業(yè)信息情境
農(nóng)業(yè)信息推薦服務(wù)是以用戶為服務(wù)對(duì)象,信息資源為基礎(chǔ)數(shù)據(jù),為用戶提供個(gè)性化信息推薦服務(wù)為目標(biāo)。由于農(nóng)業(yè)信息服務(wù)會(huì)受到農(nóng)業(yè)領(lǐng)域中相關(guān)情境因素的影響,如地域、季節(jié)、溫度、土壤、光照、市場(chǎng)、種植技術(shù)水平等因素,所以農(nóng)業(yè)信息推薦服務(wù)具有情境因素的特點(diǎn)。
情境因素的獲取是指根據(jù)用戶所處的具體農(nóng)業(yè)環(huán)境和農(nóng)業(yè)生產(chǎn)因素,一方面需獲取用戶農(nóng)業(yè)信息資源的地理特性、周期性的特點(diǎn),另一方面通過(guò)物聯(lián)網(wǎng)傳感器技術(shù)對(duì)所處農(nóng)業(yè)領(lǐng)域溫度、濕度、土壤等農(nóng)業(yè)生產(chǎn)信息資源進(jìn)行獲取。以上兩方面情境因素的獲取是對(duì)用戶不斷變化的周?chē)h(huán)境信息進(jìn)行獲取處理的過(guò)程。
1.2 用戶興趣偏好信息的獲取
在農(nóng)業(yè)信息資源推薦中,即使用戶在相同的地域、時(shí)節(jié)、氣候、土壤等情景條件下,其信息需求也會(huì)有一定差異。因此,如何構(gòu)建用戶對(duì)信息需求偏好與已有信息資源之間的關(guān)系,是農(nóng)業(yè)信息個(gè)性化推薦服務(wù)中的重要環(huán)節(jié)。
本研究主要從用戶顯式行為信息和隱式信息兩方面構(gòu)建用戶對(duì)農(nóng)業(yè)信息的興趣偏好計(jì)算模型。顯式信息的獲取是通過(guò)用戶主動(dòng)提供的一些個(gè)人基本情況、信息內(nèi)容偏好、獲取信息的方式等多方面來(lái)構(gòu)建用戶的興趣偏好模型。隱式信息的獲取是在用戶沒(méi)有主動(dòng)參與的情況下,通網(wǎng)頁(yè)信息瀏覽、網(wǎng)頁(yè)點(diǎn)擊、網(wǎng)頁(yè)保存、網(wǎng)頁(yè)打印、服務(wù)器端日志數(shù)據(jù)等操作提取用戶興趣偏好。
1.3 信息個(gè)性化推薦技術(shù)
在生產(chǎn)應(yīng)用的各領(lǐng)域中,信息資源數(shù)量呈指數(shù)式增長(zhǎng),這使得用戶無(wú)法在最短的時(shí)間內(nèi)快速獲取高需求信息,從而導(dǎo)致信息過(guò)載、使用效率低下、信息獲取成本高等多種問(wèn)題。本研究采用個(gè)性化信息推薦技術(shù)以提高農(nóng)業(yè)信息領(lǐng)域信息資源利用率,針對(duì)用戶個(gè)性化的特點(diǎn)和需求,構(gòu)建以用戶為中心的信息推薦服務(wù),從而解決信息過(guò)載、搜尋信息針對(duì)性較差的問(wèn)題?;诖?,構(gòu)建的個(gè)性化農(nóng)業(yè)信息推薦服務(wù)模型主要包含三大模塊:農(nóng)業(yè)信息資源數(shù)據(jù)庫(kù)、用戶興趣偏好計(jì)算、農(nóng)業(yè)信息個(gè)性化推薦三個(gè)模塊,如圖1所示。
2 個(gè)性化推薦平臺(tái)總體架構(gòu)
基于數(shù)據(jù)獲取渠道、數(shù)據(jù)信息、信息偏好匹配構(gòu)建了農(nóng)業(yè)信息個(gè)性化推薦的服務(wù)框架,以為農(nóng)業(yè)信息用戶提供信息資源服務(wù),如圖2所示。
3 農(nóng)業(yè)信息個(gè)性化推薦模型
3.1 用戶偏好模型的構(gòu)建
用戶對(duì)農(nóng)業(yè)信息的偏好程度可從用戶在網(wǎng)頁(yè)搜索瀏覽行為上體現(xiàn),主要包括農(nóng)業(yè)信息網(wǎng)頁(yè)的點(diǎn)擊瀏覽、訪問(wèn)時(shí)長(zhǎng)、頁(yè)面保存、頁(yè)面打印等行為,農(nóng)業(yè)信息推薦服務(wù)模塊如圖3所示。通過(guò)以上行為,可構(gòu)建用戶偏好行為的靜態(tài)度量模型,故用戶對(duì)網(wǎng)頁(yè)信息瀏覽偏好函數(shù)可表示為:
I(m)=φ(f(m),t(m),s(m),p)
f(m)為用戶對(duì)網(wǎng)頁(yè)m點(diǎn)擊情況函數(shù),t(m)是在網(wǎng)頁(yè)m上的訪問(wèn)時(shí)長(zhǎng),s(m)是對(duì)網(wǎng)頁(yè)保存情況的函數(shù),p(m)是對(duì)網(wǎng)頁(yè)打印情況的函數(shù)。上述用戶偏好函數(shù)模型并未將用戶訪問(wèn)農(nóng)業(yè)信息網(wǎng)的時(shí)間信息變化考慮在內(nèi),基于此,根據(jù)實(shí)際應(yīng)用中用戶對(duì)農(nóng)業(yè)信息的需求與時(shí)間推移變化的關(guān)系,構(gòu)建農(nóng)業(yè)信息個(gè)性化推薦來(lái)契合用戶的真實(shí)需求。研究發(fā)現(xiàn),用戶的興趣偏好會(huì)隨著時(shí)間而減弱,一般來(lái)說(shuō),用戶對(duì)最近的網(wǎng)頁(yè)瀏覽興趣度較高,而對(duì)先前的搜索瀏覽行為興趣偏好弱化,因此,農(nóng)戶信息偏好的網(wǎng)頁(yè)信息應(yīng)該與最近時(shí)間搜索瀏覽的網(wǎng)頁(yè)相似,于是將用戶網(wǎng)頁(yè)搜索瀏覽的時(shí)間信息融入到偏好度模型中,修正的用戶偏好度模型可表示為:
w(u,m)表示基于時(shí)間的權(quán)重因子,已訪問(wèn)農(nóng)業(yè)信息網(wǎng)頁(yè)m對(duì)用戶u的權(quán)重。
進(jìn)一步利用顯式獲取和隱式獲取的方法,將用戶主動(dòng)提供的興趣偏好、跟蹤用戶搜索瀏覽網(wǎng)頁(yè)的行為推理出用戶偏好,從而獲取用戶信息需求。此外,將用戶情境因素融入模型構(gòu)建中,得到用戶綜合興趣偏好模型:
3.2 推薦算法的實(shí)現(xiàn)
通過(guò)獲取用戶相關(guān)的情境因素,以及用戶在搜索瀏覽信息過(guò)程中顯式、隱式信息,利用網(wǎng)頁(yè)信息偏好度計(jì)算得到用戶對(duì)網(wǎng)頁(yè)信息的偏好程度,并結(jié)合用戶偏好推薦公式計(jì)算得到的前N篇農(nóng)業(yè)信息網(wǎng)頁(yè),并返回給農(nóng)戶,為涉農(nóng)用戶提供農(nóng)業(yè)信息方面的相關(guān)推薦。具體算法描述如下。
輸入:目標(biāo)用戶u的情境數(shù)據(jù),用戶u訪問(wèn)過(guò)的農(nóng)業(yè)信息資源數(shù)據(jù)、訪問(wèn)時(shí)間。
輸出:向目標(biāo)用戶u推薦的N篇興趣偏好度最高的網(wǎng)頁(yè)信息。
過(guò)程:1)通過(guò)傳感器、GPRS等互聯(lián)網(wǎng)終端設(shè)備采集用戶相關(guān)情境信息,形成向量U;2)利用相似度公式計(jì)算用戶情境因素與待推薦網(wǎng)頁(yè)信息的相似值,從而獲得所需推薦的農(nóng)業(yè)信息,轉(zhuǎn)入f;3)對(duì)Web用戶日志信息進(jìn)行挖掘,獲取用戶大量的網(wǎng)頁(yè)搜索、瀏覽行為數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行清洗、去噪、提取等相關(guān)處理,再通過(guò)熵權(quán)計(jì)算法,得到目標(biāo)用戶u的行為權(quán)重;4)讀取目標(biāo)用戶u訪問(wèn)的每個(gè)信息資源i的行為數(shù)據(jù)和訪問(wèn)時(shí)間數(shù)據(jù),得到基于最近信息瀏覽的集合C;5)對(duì)集合C中用戶偏好度值進(jìn)行標(biāo)準(zhǔn)化處理,計(jì)算得出待推薦農(nóng)業(yè)信息與用戶情境、瀏覽行為相匹配的相似度I(A);6)將排序最前、最相關(guān)的N篇網(wǎng)頁(yè)信息推薦給用戶。
4 結(jié)語(yǔ)
農(nóng)業(yè)信息的個(gè)性化推薦系統(tǒng)對(duì)于用戶和農(nóng)業(yè)信息服務(wù)網(wǎng)站來(lái)說(shuō)至關(guān)重要,它不僅能夠提升用戶信息搜索瀏覽的時(shí)間效率,也可幫助農(nóng)業(yè)信息服務(wù)網(wǎng)站根據(jù)用戶群里的需求充分挖掘用戶的消費(fèi)潛力。為了滿足用戶對(duì)農(nóng)業(yè)信息個(gè)性化、準(zhǔn)確性、高效性的需求,將涉農(nóng)用戶情境因素、網(wǎng)頁(yè)搜索瀏覽行為、訪問(wèn)時(shí)間、興趣偏好綜合考慮,構(gòu)建了一個(gè)多信息構(gòu)成的綜合推薦模型,并設(shè)計(jì)個(gè)性化農(nóng)業(yè)信息推薦算法,使推薦結(jié)果更加符合用戶的真實(shí)需求。
參考文獻(xiàn):
[1] 王國(guó)霞,劉賀平.個(gè)性化推薦系統(tǒng)綜述[J].計(jì)算機(jī)工程與應(yīng)用,2012,48(7):66-76.
[2] 邢春曉,高鳳榮,戰(zhàn)思南,等.適應(yīng)用戶興趣變化的協(xié)同過(guò)濾推薦算法[J].計(jì)算機(jī)研究與發(fā)展,2007,44(2):296-300.
(責(zé)任編輯:趙中正)