何秀 丁豐
摘 要 上下文信息是指用戶在檢索過程中產(chǎn)生的一切與檢索活動相關(guān)的信息的總和,該類信息具有高可靠性、針對性、完整性等特征,有利于信息檢索模型準(zhǔn)確理解用戶興趣偏好。文中闡述了上下文信息的產(chǎn)生、特征,以及捕獲方式,并針對不同的運用對上下文信息進(jìn)行分類。
【關(guān)鍵詞】下文信息 上下文檢索 搜索引擎 信息檢索
用戶的搜索行為是處在一定地上下文環(huán)境下,目前的查詢系統(tǒng)因利用上下文信息,改善了原有搜索結(jié)果重復(fù)率高的現(xiàn)象,為用戶提供了更具人性化、個性化的高質(zhì)量服務(wù)。
上下文信息對搜索引擎具有非常重要的價值,在對上下文信息研究中發(fā)現(xiàn),不同的上下文信息對用戶檢索行為產(chǎn)生的影響不一樣,即在不同的環(huán)境下,某些上下文信息具有較高的使用價值,而某些上下文信息則可以忽略。因此,有必要分析各種上下文信息對用戶查詢行為的影響,有針對性地利用上下文信息資源。
1 上下文信息的分類
在不同的應(yīng)用場景(context)下,對上下文信息的定義各具特點,Lawrence認(rèn)為Web搜索上下文是指與用戶檢索意圖和表達(dá)相關(guān)的一切信息。Brown 將上下文定義為與用戶所處的環(huán)境、當(dāng)前查詢時間、季節(jié)、溫度等相關(guān)的信息。Anind 定義:“上下文是指在特定的環(huán)境下,能夠標(biāo)識實體特征的相關(guān)信息,其中相關(guān)信息可以包括某人、物、時間、地點、應(yīng)用系統(tǒng)等,只要所涉及的實體與用戶的交互環(huán)境相關(guān)聯(lián)”。在信息檢索領(lǐng)域,現(xiàn)廣泛接受的是將上下文信息劃分為:用戶上下文、資源上下文、系統(tǒng)上下文等。
1.1 用戶上下文
分為用戶靜態(tài)上下文和用戶動態(tài)上下文,靜態(tài)上下文信息包括年齡、學(xué)歷、專業(yè)、工作性質(zhì)、愛好、生活經(jīng)驗和習(xí)慣等與用戶個體相聯(lián)系的其它特征;用戶動態(tài)上下文指檢索過程中產(chǎn)生的所有信息總和,例如:查詢詞、查詢發(fā)生時間、用戶的IP地址、當(dāng)前查詢?yōu)g覽所用時間、用戶的反饋檢查信息等信息;
1.2 資源上下文
Web頁面之間的超鏈接信息、頁面本身的結(jié)構(gòu)信息等。
1.3 系統(tǒng)上下文
查詢系統(tǒng)本身的某些特征,例如:系統(tǒng)采用的搜引機(jī)制、檢查模型、排序機(jī)制、檢索界面的布局等。
2 上下文信息的獲取
在信息檢索中,從用戶參與的方式考慮,可將信息收集的方式分為顯式收集、隱式收集、推理獲取。
2.1 顯式收集
顯式收集(或稱顯式反饋)是指用戶根據(jù)系統(tǒng)設(shè)計的表單內(nèi)容,自主提交個人基本信息或參與系統(tǒng)的交互信息,用戶靜態(tài)上下文的挖掘則可以采用此方式。
2.2 隱式收集
隱式收集(又稱隱式反饋)是指系統(tǒng)在不影響為用戶提供檢索服務(wù)的前提下,“悄無聲息”地收集用戶的檢索信息,用戶動態(tài)上下文及資源上下文則可采取該方法;該方法常用的技術(shù)有:Web信息抽取、基于模板的方法、桌面代理、利用瀏覽器插件等。
2.3 推理獲取
即借助數(shù)學(xué)中的統(tǒng)計學(xué)理論和數(shù)據(jù)挖掘的相關(guān)知識,進(jìn)行歸納演繹和推斷用戶的某些信息。
3 上下文信息的研究應(yīng)用
上下文信息的獲取、表示、組織所采用的方法直接影響著系統(tǒng)的搜索質(zhì)量。如圖3-1所示,闡述了用戶檢索過程產(chǎn)生的上下文信息在信息檢索系統(tǒng)中的具體應(yīng)用。
如圖3-1所示,對信息檢索中常見應(yīng)用進(jìn)行了歸類,用戶檢索中產(chǎn)生的上下文信息可幫助檢索系統(tǒng)理解用戶需求、用戶查詢、文檔信息以及檢查用戶查詢與文檔是否匹配。
4 結(jié)束與展望
上下文信息有利于提高搜索引擎質(zhì)量,有著重要的使用價值。在利用上下文信息時,不僅需考慮其表示方式,由于各類上下文信息對用戶檢索行為產(chǎn)生的權(quán)重不同,還應(yīng)綜合考慮其帶來的影響因子,從而構(gòu)建合理高效地檢索模型。
參考文獻(xiàn)
[1]Lawrence s. Context in web search[J].IEEE Date Engineering Bulletin,2000, 23(3):5-32.
[2]Brown P J,Bovey J D,Chen X.Context-Aware Applications:From the laboratory to the marketplace[J].IEEE Personal Communications,1997, 4(5):58-64.
[3]Anind K D.Understanding and using Context [J].Personal and ubiquitous computing, 2001.
[4]田萱,李冬梅.上下文信息檢索研究綜述[J].計算機(jī)科學(xué).2010,38(9):18-24.
[5]Jiang D X,Pei J,Li H.Enhancing Web Search by Mining Search and Browse Logs[C].New York:ACM Press,2011:1-185.
[6]何秀,牛之賢,孫靜宇.上下文對用戶搜索行為的影響[J].情報雜志.2012,10(31):122-125.
作者簡介
何秀(1988-),女,現(xiàn)為廣東科技學(xué)院計算機(jī)系碩士研究生在讀,主要研究方向為信息檢索。
丁豐(1988-),女,現(xiàn)為廣東科技學(xué)院計算機(jī)系碩士研究生在讀,主要研究方向軟件工程。
作者單位
廣東科技學(xué)院計算機(jī)系 廣東省東莞市 523083endprint
摘 要 上下文信息是指用戶在檢索過程中產(chǎn)生的一切與檢索活動相關(guān)的信息的總和,該類信息具有高可靠性、針對性、完整性等特征,有利于信息檢索模型準(zhǔn)確理解用戶興趣偏好。文中闡述了上下文信息的產(chǎn)生、特征,以及捕獲方式,并針對不同的運用對上下文信息進(jìn)行分類。
【關(guān)鍵詞】下文信息 上下文檢索 搜索引擎 信息檢索
用戶的搜索行為是處在一定地上下文環(huán)境下,目前的查詢系統(tǒng)因利用上下文信息,改善了原有搜索結(jié)果重復(fù)率高的現(xiàn)象,為用戶提供了更具人性化、個性化的高質(zhì)量服務(wù)。
上下文信息對搜索引擎具有非常重要的價值,在對上下文信息研究中發(fā)現(xiàn),不同的上下文信息對用戶檢索行為產(chǎn)生的影響不一樣,即在不同的環(huán)境下,某些上下文信息具有較高的使用價值,而某些上下文信息則可以忽略。因此,有必要分析各種上下文信息對用戶查詢行為的影響,有針對性地利用上下文信息資源。
1 上下文信息的分類
在不同的應(yīng)用場景(context)下,對上下文信息的定義各具特點,Lawrence認(rèn)為Web搜索上下文是指與用戶檢索意圖和表達(dá)相關(guān)的一切信息。Brown 將上下文定義為與用戶所處的環(huán)境、當(dāng)前查詢時間、季節(jié)、溫度等相關(guān)的信息。Anind 定義:“上下文是指在特定的環(huán)境下,能夠標(biāo)識實體特征的相關(guān)信息,其中相關(guān)信息可以包括某人、物、時間、地點、應(yīng)用系統(tǒng)等,只要所涉及的實體與用戶的交互環(huán)境相關(guān)聯(lián)”。在信息檢索領(lǐng)域,現(xiàn)廣泛接受的是將上下文信息劃分為:用戶上下文、資源上下文、系統(tǒng)上下文等。
1.1 用戶上下文
分為用戶靜態(tài)上下文和用戶動態(tài)上下文,靜態(tài)上下文信息包括年齡、學(xué)歷、專業(yè)、工作性質(zhì)、愛好、生活經(jīng)驗和習(xí)慣等與用戶個體相聯(lián)系的其它特征;用戶動態(tài)上下文指檢索過程中產(chǎn)生的所有信息總和,例如:查詢詞、查詢發(fā)生時間、用戶的IP地址、當(dāng)前查詢?yōu)g覽所用時間、用戶的反饋檢查信息等信息;
1.2 資源上下文
Web頁面之間的超鏈接信息、頁面本身的結(jié)構(gòu)信息等。
1.3 系統(tǒng)上下文
查詢系統(tǒng)本身的某些特征,例如:系統(tǒng)采用的搜引機(jī)制、檢查模型、排序機(jī)制、檢索界面的布局等。
2 上下文信息的獲取
在信息檢索中,從用戶參與的方式考慮,可將信息收集的方式分為顯式收集、隱式收集、推理獲取。
2.1 顯式收集
顯式收集(或稱顯式反饋)是指用戶根據(jù)系統(tǒng)設(shè)計的表單內(nèi)容,自主提交個人基本信息或參與系統(tǒng)的交互信息,用戶靜態(tài)上下文的挖掘則可以采用此方式。
2.2 隱式收集
隱式收集(又稱隱式反饋)是指系統(tǒng)在不影響為用戶提供檢索服務(wù)的前提下,“悄無聲息”地收集用戶的檢索信息,用戶動態(tài)上下文及資源上下文則可采取該方法;該方法常用的技術(shù)有:Web信息抽取、基于模板的方法、桌面代理、利用瀏覽器插件等。
2.3 推理獲取
即借助數(shù)學(xué)中的統(tǒng)計學(xué)理論和數(shù)據(jù)挖掘的相關(guān)知識,進(jìn)行歸納演繹和推斷用戶的某些信息。
3 上下文信息的研究應(yīng)用
上下文信息的獲取、表示、組織所采用的方法直接影響著系統(tǒng)的搜索質(zhì)量。如圖3-1所示,闡述了用戶檢索過程產(chǎn)生的上下文信息在信息檢索系統(tǒng)中的具體應(yīng)用。
如圖3-1所示,對信息檢索中常見應(yīng)用進(jìn)行了歸類,用戶檢索中產(chǎn)生的上下文信息可幫助檢索系統(tǒng)理解用戶需求、用戶查詢、文檔信息以及檢查用戶查詢與文檔是否匹配。
4 結(jié)束與展望
上下文信息有利于提高搜索引擎質(zhì)量,有著重要的使用價值。在利用上下文信息時,不僅需考慮其表示方式,由于各類上下文信息對用戶檢索行為產(chǎn)生的權(quán)重不同,還應(yīng)綜合考慮其帶來的影響因子,從而構(gòu)建合理高效地檢索模型。
參考文獻(xiàn)
[1]Lawrence s. Context in web search[J].IEEE Date Engineering Bulletin,2000, 23(3):5-32.
[2]Brown P J,Bovey J D,Chen X.Context-Aware Applications:From the laboratory to the marketplace[J].IEEE Personal Communications,1997, 4(5):58-64.
[3]Anind K D.Understanding and using Context [J].Personal and ubiquitous computing, 2001.
[4]田萱,李冬梅.上下文信息檢索研究綜述[J].計算機(jī)科學(xué).2010,38(9):18-24.
[5]Jiang D X,Pei J,Li H.Enhancing Web Search by Mining Search and Browse Logs[C].New York:ACM Press,2011:1-185.
[6]何秀,牛之賢,孫靜宇.上下文對用戶搜索行為的影響[J].情報雜志.2012,10(31):122-125.
作者簡介
何秀(1988-),女,現(xiàn)為廣東科技學(xué)院計算機(jī)系碩士研究生在讀,主要研究方向為信息檢索。
丁豐(1988-),女,現(xiàn)為廣東科技學(xué)院計算機(jī)系碩士研究生在讀,主要研究方向軟件工程。
作者單位
廣東科技學(xué)院計算機(jī)系 廣東省東莞市 523083endprint
摘 要 上下文信息是指用戶在檢索過程中產(chǎn)生的一切與檢索活動相關(guān)的信息的總和,該類信息具有高可靠性、針對性、完整性等特征,有利于信息檢索模型準(zhǔn)確理解用戶興趣偏好。文中闡述了上下文信息的產(chǎn)生、特征,以及捕獲方式,并針對不同的運用對上下文信息進(jìn)行分類。
【關(guān)鍵詞】下文信息 上下文檢索 搜索引擎 信息檢索
用戶的搜索行為是處在一定地上下文環(huán)境下,目前的查詢系統(tǒng)因利用上下文信息,改善了原有搜索結(jié)果重復(fù)率高的現(xiàn)象,為用戶提供了更具人性化、個性化的高質(zhì)量服務(wù)。
上下文信息對搜索引擎具有非常重要的價值,在對上下文信息研究中發(fā)現(xiàn),不同的上下文信息對用戶檢索行為產(chǎn)生的影響不一樣,即在不同的環(huán)境下,某些上下文信息具有較高的使用價值,而某些上下文信息則可以忽略。因此,有必要分析各種上下文信息對用戶查詢行為的影響,有針對性地利用上下文信息資源。
1 上下文信息的分類
在不同的應(yīng)用場景(context)下,對上下文信息的定義各具特點,Lawrence認(rèn)為Web搜索上下文是指與用戶檢索意圖和表達(dá)相關(guān)的一切信息。Brown 將上下文定義為與用戶所處的環(huán)境、當(dāng)前查詢時間、季節(jié)、溫度等相關(guān)的信息。Anind 定義:“上下文是指在特定的環(huán)境下,能夠標(biāo)識實體特征的相關(guān)信息,其中相關(guān)信息可以包括某人、物、時間、地點、應(yīng)用系統(tǒng)等,只要所涉及的實體與用戶的交互環(huán)境相關(guān)聯(lián)”。在信息檢索領(lǐng)域,現(xiàn)廣泛接受的是將上下文信息劃分為:用戶上下文、資源上下文、系統(tǒng)上下文等。
1.1 用戶上下文
分為用戶靜態(tài)上下文和用戶動態(tài)上下文,靜態(tài)上下文信息包括年齡、學(xué)歷、專業(yè)、工作性質(zhì)、愛好、生活經(jīng)驗和習(xí)慣等與用戶個體相聯(lián)系的其它特征;用戶動態(tài)上下文指檢索過程中產(chǎn)生的所有信息總和,例如:查詢詞、查詢發(fā)生時間、用戶的IP地址、當(dāng)前查詢?yōu)g覽所用時間、用戶的反饋檢查信息等信息;
1.2 資源上下文
Web頁面之間的超鏈接信息、頁面本身的結(jié)構(gòu)信息等。
1.3 系統(tǒng)上下文
查詢系統(tǒng)本身的某些特征,例如:系統(tǒng)采用的搜引機(jī)制、檢查模型、排序機(jī)制、檢索界面的布局等。
2 上下文信息的獲取
在信息檢索中,從用戶參與的方式考慮,可將信息收集的方式分為顯式收集、隱式收集、推理獲取。
2.1 顯式收集
顯式收集(或稱顯式反饋)是指用戶根據(jù)系統(tǒng)設(shè)計的表單內(nèi)容,自主提交個人基本信息或參與系統(tǒng)的交互信息,用戶靜態(tài)上下文的挖掘則可以采用此方式。
2.2 隱式收集
隱式收集(又稱隱式反饋)是指系統(tǒng)在不影響為用戶提供檢索服務(wù)的前提下,“悄無聲息”地收集用戶的檢索信息,用戶動態(tài)上下文及資源上下文則可采取該方法;該方法常用的技術(shù)有:Web信息抽取、基于模板的方法、桌面代理、利用瀏覽器插件等。
2.3 推理獲取
即借助數(shù)學(xué)中的統(tǒng)計學(xué)理論和數(shù)據(jù)挖掘的相關(guān)知識,進(jìn)行歸納演繹和推斷用戶的某些信息。
3 上下文信息的研究應(yīng)用
上下文信息的獲取、表示、組織所采用的方法直接影響著系統(tǒng)的搜索質(zhì)量。如圖3-1所示,闡述了用戶檢索過程產(chǎn)生的上下文信息在信息檢索系統(tǒng)中的具體應(yīng)用。
如圖3-1所示,對信息檢索中常見應(yīng)用進(jìn)行了歸類,用戶檢索中產(chǎn)生的上下文信息可幫助檢索系統(tǒng)理解用戶需求、用戶查詢、文檔信息以及檢查用戶查詢與文檔是否匹配。
4 結(jié)束與展望
上下文信息有利于提高搜索引擎質(zhì)量,有著重要的使用價值。在利用上下文信息時,不僅需考慮其表示方式,由于各類上下文信息對用戶檢索行為產(chǎn)生的權(quán)重不同,還應(yīng)綜合考慮其帶來的影響因子,從而構(gòu)建合理高效地檢索模型。
參考文獻(xiàn)
[1]Lawrence s. Context in web search[J].IEEE Date Engineering Bulletin,2000, 23(3):5-32.
[2]Brown P J,Bovey J D,Chen X.Context-Aware Applications:From the laboratory to the marketplace[J].IEEE Personal Communications,1997, 4(5):58-64.
[3]Anind K D.Understanding and using Context [J].Personal and ubiquitous computing, 2001.
[4]田萱,李冬梅.上下文信息檢索研究綜述[J].計算機(jī)科學(xué).2010,38(9):18-24.
[5]Jiang D X,Pei J,Li H.Enhancing Web Search by Mining Search and Browse Logs[C].New York:ACM Press,2011:1-185.
[6]何秀,牛之賢,孫靜宇.上下文對用戶搜索行為的影響[J].情報雜志.2012,10(31):122-125.
作者簡介
何秀(1988-),女,現(xiàn)為廣東科技學(xué)院計算機(jī)系碩士研究生在讀,主要研究方向為信息檢索。
丁豐(1988-),女,現(xiàn)為廣東科技學(xué)院計算機(jī)系碩士研究生在讀,主要研究方向軟件工程。
作者單位
廣東科技學(xué)院計算機(jī)系 廣東省東莞市 523083endprint