胡西 謝雅婷
摘 要:本文主要介紹的個性化推薦的發(fā)展現(xiàn)狀,基于對相關專利申請的分析對個性化推薦技術進行了梳理,以產(chǎn)業(yè)和科研的關注點結(jié)合國際專利分類體系,確定了主要的研究方向和研究對象的分類號分布范圍。從專利文獻的視角對個性化推薦的申請情況及未來發(fā)展進行了全面的統(tǒng)計分析,介紹了個性化推薦的重點技術分支及其發(fā)展歷程,從不同的技術分支角度總結(jié)了與個性化推薦相關的專利申請趨勢。
關鍵詞:個性化,推薦,信息,采集,定制,數(shù)據(jù),挖掘。
1個性化推薦的技術概述
個性化推薦直到20世紀90年代才被作為一個獨立的概念被提出來,至今得到飛速發(fā)展。由于巨大的應用需求,個性化推薦得到了廣泛的關注,國內(nèi)外越來越多的學者開始研究個性化推薦。個性化推薦是根據(jù)用戶資料信息、歷史行為記錄及物品的特征屬性來分析用戶對物品的偏好而生成個性化推薦列表,為用戶提供信息推薦的一種過濾和挖掘技術。個性化推薦是一個綜合眾多學科的研究領域,涉及統(tǒng)計分析、信息檢索、數(shù)據(jù)挖掘、機器學習、人工智能、自然語言處理等。從系統(tǒng)的結(jié)構(gòu)層次上看,可以把個性化推薦分為:信息采集、用戶建模、推薦算法和推薦輸出。
(1)個性化推薦是建立在用戶信息的技術上,因此,信息采集是建立個性化推薦模型的前提和必要條件。采集數(shù)據(jù)信息是通過獲取用戶信息、喜好、特征與興趣等數(shù)據(jù)的過程。
(2)為能夠準確地反映用戶各個方面、動態(tài)發(fā)展的興趣愛好,需要為用戶建立用戶模型。用戶模型的表示提供一種結(jié)構(gòu)化的進行個性化推薦。
(3)推薦算法從根本上決定了個性化推薦系統(tǒng)的類型、性能以及優(yōu)劣。推薦算法是根據(jù)收集的用戶個人信息和對應的用戶模型,通過設定算法目標進行學習,并對特定用戶計算出推薦結(jié)果。
(4)推薦輸出是根據(jù)推薦算法得到推薦結(jié)果,將結(jié)果展示通過預測值、結(jié)果推薦或是其他方式呈現(xiàn)給用戶。
2個性化推薦專利基本情況分析
2.1全球?qū)@暾埛治?/p>
2.1.1技術趨勢分析
對全球歷年專利申請的分布進行了統(tǒng)計,個性化推薦大概是從1993年開始有相關專利的申請的,在2006年之前發(fā)展十分緩慢,申請量都很少,屬于起步階段,2006年之后,發(fā)展速度明顯加快,專利申請量逐漸增多,雖然有波動,但總體而言,專利申請量是不斷增加的,這也與互聯(lián)網(wǎng)技術的迅猛發(fā)展趨勢相吻合。2013年的申請量達到頂峰。到2014年申請量有所回落,由于2015年專利申請的公開數(shù)據(jù)不完整導致總申請量下降,但并不能因此判斷該領域申請量出現(xiàn)大幅下降趨勢??傮w來說,本領域依然是專利申請的熱點,未來專利申請量仍然會逐年提升,繼續(xù)保持較高水平。
2.1.2區(qū)域布局分析
本節(jié)對全球?qū)@暾堉械闹饕暾埲诉M行了分析,在個性化推薦領域,全球?qū)@暾堉饕性诿绹?、中國、PCT、韓國、歐洲以及日本。美國的申請量位于第一位,其申請量占全球三分之一,遙遙領先于其他國家,可見美國在該技術上具有相當大的優(yōu)勢。中國緊隨其后,占有19%的申請量,位居第二,這反應出了個性化推薦在中國也具有相當高的研究價值。國際申請排名第三,約占全球申請總量的12%。緊接著是韓國、歐洲以及日本,這些國家的申請量也不容忽視。
2.2國內(nèi)專利狀況
2.2.1國內(nèi)主要申請人分布
圖2.2是對個性化推薦領域相關專利申請的國內(nèi)主要申請人分布情況進行統(tǒng)計。
從圖2.2可以看出,我國個性化推薦領域相關專利的主要申請人還是以企業(yè)為主,說明相比于單個高校,企業(yè)更加重視相關的研發(fā)工作,主要由于個性化推薦能帶來相當大的經(jīng)濟利潤。百度公司排在第一位,說明百度公司在個性化推薦領域特別是個性化搜索方面投入較多的資源進行研發(fā),申請量遠高于其他企業(yè),具有相當大的技術優(yōu)勢。緊隨其后,騰訊、阿里巴巴、北京奇虎、小米也占據(jù)了一定比例的申請量。
3個性化推薦相關專利的技術分支及技術分析
3.1個性化推薦的技術分支
根據(jù)對個性化推薦技術背景的了解以及相關專利文獻的閱讀,確定個性化推薦在專利申請上主要研究的技術分支為:信息收集和推薦算法。其中,根據(jù)推薦目標,數(shù)據(jù)收集主要分為多媒體信息偏好的數(shù)據(jù)收集和商品偏好的數(shù)據(jù)收集兩個部分:
多媒體信息偏好的數(shù)據(jù)收集主要為音視頻、電視節(jié)目的數(shù)據(jù)收集。為了獲得更準確的信息,各個學者開始考慮通過獲取用戶觀看節(jié)目時的表情或者眼跳等計算用戶真正對于節(jié)目的哪個內(nèi)容感興趣,其中就用到了表情識別技術和人眼識別技術。
商品偏好的數(shù)據(jù)收集主要為電子商務中的信息采集。
個性化推薦算法的主流是內(nèi)容推薦算法和協(xié)同過濾算法。
內(nèi)容推薦算法側(cè)重于基于學習的推薦,根據(jù)用戶的反饋信息,自動地校正推薦列表的內(nèi)容。
協(xié)同過濾算法側(cè)重于解決數(shù)據(jù)冷啟動問題,數(shù)據(jù)稀疏性問題和可擴展問題。如何高效可擴展的個性化推薦是將來研究的重點。
4小結(jié)
本文圍繞個性化推薦這一技術主題,對全球和國內(nèi)相關的專利申請進行了分析。從總體的申請量趨勢來看,個性化推薦仍是當前的一大熱點,呈現(xiàn)出上升趨勢;從全球原創(chuàng)區(qū)域分布來看,美國占據(jù)著絕大部分的比例,處于霸主地位,而我國緊跟美國,處于第二位,可見,我國在這一領域也還是占有一定的地位;從國內(nèi)的申請量來看,外國來華申請也占據(jù)著較高的比例,仍是以美國為首,而微軟公司,也是申請最多的申請人;對于國內(nèi)的申請人,以百度居首,騰訊和阿里巴巴依次位于第二和第四。通過對這些數(shù)據(jù)的分析,對個性化推薦這一技術有了宏觀上的把握,也更加清楚這一技術的發(fā)展動態(tài)。
作者簡介:
胡西 1990.9,漢族,湖北武漢,女,碩士研究生,視頻圖像處理。
謝雅婷 1991.11,漢族,湖北武漢,女,碩士研究生,視頻圖像處理(等同第一作者)。