王子巖 司亮 劉濱 劉宇 孫中賢 劉增杰 張紅斌 劉青
摘 要:手機(jī)等移動智能終端在全社會的普及,使得數(shù)字內(nèi)容的生產(chǎn)能力下沉到社會各個層面,形成了多源、自主、原生的互聯(lián)網(wǎng)媒體內(nèi)容制造格局;而以社交媒體、自媒體為代表的各類新興媒體的蓬勃發(fā)展,使得數(shù)字內(nèi)容的傳播能力極大增強(qiáng),大量衍生內(nèi)容在敏感、熱點、重要事件的報道傳播中產(chǎn)生?;ヂ?lián)網(wǎng)資訊具有海量、內(nèi)容質(zhì)量參差不齊、觀點多極等特點。如何將價值導(dǎo)向?qū)φ_的、信息披露準(zhǔn)確的資訊進(jìn)行精準(zhǔn)推薦,維護(hù)和促進(jìn)社會公平正義,成為司法領(lǐng)域的新問題和新挑戰(zhàn)。
推薦系統(tǒng)有效解決了用戶在海量信息中難以高效獲得信息的問題?;趦?nèi)容的推薦技術(shù)通過分析用戶以往感興趣的項目,經(jīng)計算得到相似的項目,再將相似度最高的若干項目推送給用戶。推薦系統(tǒng)中應(yīng)用最廣泛的是協(xié)同過濾推薦算法(collaborative filtering,CF),該概念最早于1992年由GOLDBERG等在開發(fā)Tapestry郵件過濾系統(tǒng)時首次提出,其核心思想是運用算法對用戶的歷史行為數(shù)據(jù)進(jìn)行分析,挖掘出用戶的興趣偏好,根據(jù)不同的興趣偏好對用戶進(jìn)行類別劃分并推薦相似偏好的物品。當(dāng)前,個性化推薦已經(jīng)在電子商務(wù)、影視作品、餐飲美食、新聞資訊等領(lǐng)域獲得了較為廣泛的應(yīng)用?!熬〇|”的推薦起步于2012年,當(dāng)時的產(chǎn)品推薦是基于規(guī)則匹配進(jìn)行的,整個推薦產(chǎn)品線組合就像一個個松散的原始部落,部落與部落之間沒有任何工程、算法的交集?!疤詫殹睆?013年推出了“個性化推薦”即“千人千面”的推薦引擎,利用用戶的一些行為,通過算法推測出用戶可能喜歡的東西?!懊缊F(tuán)”構(gòu)建了世界上最大的菜品知識庫,為200多萬商家、3億多件商品繪制了知識圖譜,并為2.5億用戶畫像,構(gòu)建了世界上用戶規(guī)模最大的O2O智能推薦平臺?!岸拱辍崩蒙缃恍袨榉治鼋鉀Q推薦問題,如基于用戶相同行為的協(xié)同過濾技術(shù)、友鄰?fù)扑]等,也是個性化推薦的一個補(bǔ)充。社交化推薦的引入,可以解決因單純產(chǎn)品內(nèi)容推薦導(dǎo)致推薦范圍越來越窄的問題。“今日頭條”的個性化推薦算法基于投票方法,其核心理念就是投票,每個用戶一票,喜歡哪篇文章就把票投給哪篇文章,經(jīng)過統(tǒng)計,最后得到的結(jié)果很可能是此類人群里最好的文章,并把這篇文章推薦給同類人群用戶。該方法看起來似乎很簡單,但實際上需要基于對海量用戶行為的數(shù)據(jù)挖掘與分析。
系統(tǒng)動力學(xué)是一門基于系統(tǒng)論、控制論與信息論,并借助計算機(jī)模擬技術(shù)的交叉學(xué)科,其通過系統(tǒng)的視角,進(jìn)行結(jié)構(gòu)化動態(tài)分析和模型模擬,擅長分析高階、非線性時變和復(fù)雜系統(tǒng),采用定性與定量相結(jié)合的方法,適合對資訊個性化推薦這種動態(tài)復(fù)雜過程進(jìn)行分析。針對司法工作相關(guān)資訊的個性化推薦問題,應(yīng)用系統(tǒng)動力學(xué)理論,對影響資訊推薦效果的重要因素在Vensim軟件中進(jìn)行建模仿真,構(gòu)建包括用戶量、文章量、標(biāo)簽數(shù)量和各子系統(tǒng)之間影響的因果反饋模型和存量流量模型,建立系統(tǒng)動力學(xué)方程模型,經(jīng)仿真對相關(guān)因素進(jìn)行敏感性分析。結(jié)果表明,文章量、設(shè)置的特征化標(biāo)簽和對文章的興趣點因子等都對推薦效果有重要影響,這是在設(shè)計推薦系統(tǒng)時需要重點考慮的因素,也是解決推薦系統(tǒng)冷啟動、實時性和“信息繭房”等關(guān)鍵問題的重要途徑?;谙到y(tǒng)動力學(xué)進(jìn)行資訊個性化推薦研究,可以積極有效地應(yīng)對司法領(lǐng)域資訊披露面臨的挑戰(zhàn),提高精準(zhǔn)推薦效果。
關(guān)鍵詞:數(shù)據(jù)處理;個性化推薦;司法工作;系統(tǒng)動力學(xué);資訊平臺;仿真模擬
中圖分類號:TP311.13 文獻(xiàn)標(biāo)識碼:A
doi:10.7535/hbkd.2021yx02010
Study on information personalized recommendation
based on system dynamics
WANG Ziyan1,SI Liang2,3,LIU Bin2,3,LIU Yu4,
SUN Zhongxian2,3,LIU Zengjie2,3,ZHANG Hongbin5,LIU Qing2,3
(1.School of Law,Hebei University of Economics and Business,Shijiazhuang,Hebei 050061,China; 2.School of Economics and Management,Hebei University of Science and Technology,Shijiazhuang,Hebei 050018,China; 3.Big Data and Social Computing Research Center,Hebei University of Science and Technology,Shijiazhuang,Hebei 050018,China; 4.Library,Hebei Professional College of Political Science and Law,Shijiazhuang,Hebei 050061,China; 5.School of Information Science and Engineering,Hebei University of Science and Technology,Shijiazhuang,Hebei 050018,China)
Abstract:
With the popularity of mobile intelligent terminals such as mobile phones in the whole society,the production capacity of digital content has sunk to all levels of the society,forming a multi-source,independent and native Internet media content manufacturing pattern.With the vigorous development of various emerging media represented by social media and we media,the propagation ability of digital content has been greatly enhanced,especially in the reporting of sensitive,hot and important events in the process of propagation,which will produce a lot of derivative content.The improvement of the above two abilities causes the internet information to be characterized by mass,uneven content quality and multi-point of view.How to accurately recommend the news of correct value orientation and accurate information disclosure related to judicial work to maintain and promote social fairness and justice has become a new problem and challenge in the judicial field.
Recommender system effectively solved the problem that it was difficult for users to find the information they need efficiently in the mass of information.Content based recommendation technology analyzed the items that users are interested in before,got the similar items by calculation,and then pushed the items with the highest similarity to users.Collaborative filtering (CF) is the most widely used recommendation system,which was first proposed by Goldberg in 1992 when developing tapestry e-mail filtering system.Its core idea is to analyze the user′s historical behavior data through the algorithm,mine the user′s interest preferences,classify users according to different interest preferences,and recommend items with similar preferences.Collaborative filtering is the most widely used algorithm in recommendation system.It was first proposed by Goldberg in 1992 when developing tapestry e-mail filtering system.Its core idea was to analyze the user′s historical behavior data through the algorithm,mine the user′s interest preferences,classify users according to different interest preferences,and recommend items with similar preferences.At present,personalized recommendation has been widely used in e-commerce,film and television works,food and beverage,news and other fields.For example,the recommendation of Jingdong started in 2012,and the recommendation products were based on rule matching.The combination of the whole recommendation product lines was like a loose primitive tribe,and there was no intersection of engineering and algorithm between the tribes.Taobao launched the recommendation engine of "personalized recommendation",namely "thousands of people and thousands of faces" in 2013,which used some users′behaviors to speculate what users may like through algorithms.Meituan has built the world′s largest food knowledge base,created knowledge graphs for more than 2 million businesses and 300 million products,made user portraits for 250 million users,and built the world′s largest O2O intelligent recommendation platform for users. Douban used social behavior analysis to solve recommendation problems,such as collaborative filtering technology based on the sameusers′behavior ,and friends or neighbors recommendation,etc.,which is also a supplement of personalized recommendation.The introduction of social recommendation can solve the problem of narrow recommendation range caused by simple product content recommendation.The personalized recommendation algorithm of Toutiao was based on voting,and its core idea was to vote.Each user can cast his only vote to the article he likes.After statistics,the final result was likely to be the best article in this crowd,and the article would be recommended to the same group of users.This method seems to be very simple,but in fact,it needs massive user behavior data mining and analysis.
System dynamics is an interdisciplinary subject based on system theory,cybernetics and information theory,and with the help of computer simulation technology.From the perspective of system,structured and dynamic analysis and model simulation are conducted,which is good at analyzing high-order,nonlinear and time-varying complex systems,and is suitable for analyzing the dynamic and complex process of personalized information recommendation by combining qualitative and quantitative analysis..Based on the theory of system dynamics,this paper modeled and simulated the important factors that affect the effect of information recommendation in Vensim software,and constructed the causal feedback model and stock flow model including the number of users,articles,tags and the influence among subsystems.The system dynamics equation model was established,and the sensitivity analysis of related factors was carried out.The results show that the number of articles,the characteristic tags and the interest factors of articles all have an important impact on the recommendation effect.They are the key factors to be considered in the design of the recommendation system,and are also the important ways to solve the key problems,such as the cold start,real-time and "information cocoon room" of the recommendation system.Research on information personalized recommendation based on system dynamics can actively and effectively meet the challenges of information disclosure in the judicial field and improve the accurate recommendation effect.
Keywords:
data processing; personalized recommendation; judicial work; system dynamics; information platform;simulation
手機(jī)和平板電腦等移動電子設(shè)備的普及,讓發(fā)現(xiàn)、記錄和傳播身邊事、即時事、敏感事的泛計算能力下沉到社會各個層面,促進(jìn)了各種新興媒體的產(chǎn)生,互聯(lián)網(wǎng)大數(shù)據(jù)從形式到內(nèi)容都得到了前所未有的發(fā)展[1-3];與此同時,習(xí)近平總書記提出的讓全體人民感受到社會公平正義的要求,也給司法工作提出了新命題。如何在突發(fā)公共事件之際通過互聯(lián)網(wǎng)使司法正能量滲透到社會的方方面面,讓司法領(lǐng)域的新聞報道、情況通告成為人民群眾樂意讀、及時讀、愿意傳播的信息,成為維護(hù)社會穩(wěn)定、保障國家安全的重要任務(wù),也是當(dāng)前司法工作面臨的挑戰(zhàn)性問題[4-6]。資訊個性化推薦技術(shù)恰恰能解決對特定主體、特定主題、特定領(lǐng)域互聯(lián)網(wǎng)內(nèi)容的推薦問題,能夠更敏捷、更高效、更及時地從海量媒體內(nèi)容中將價值導(dǎo)向正確的、信息披露準(zhǔn)確的資訊進(jìn)行精準(zhǔn)推薦,形成良好的社會反響。這種基于內(nèi)容的推薦技術(shù),通過分析用戶以往感興趣的項目,計算出特征相似的項目,再將相似度最高的若干項目推送給用戶。例如:“豆瓣”采用基于協(xié)同過濾的個性化新聞推薦系統(tǒng),可以向用戶推薦其可能關(guān)注的、特定范圍的圖片、文字、影像等內(nèi)容,會對用戶瀏覽過的相關(guān)內(nèi)容進(jìn)行評價,從而獲取到評分信息并進(jìn)行針對性的推薦;“今日頭條”等在呈現(xiàn)新聞信息時同樣采用了個性化推薦算法,通過個性化新聞定制設(shè)置界面,實現(xiàn)了根據(jù)地區(qū)、新聞關(guān)鍵字、新聞媒體或者新聞熱度等篩選條件,將用戶感興趣的新聞內(nèi)容呈現(xiàn)出來的效果[7-9]。系統(tǒng)動力學(xué)是基于控制論、系統(tǒng)論、信息論、模擬技術(shù)等學(xué)科,擅長分析高階、非線性時變、復(fù)雜系統(tǒng)的定性與定量分析相結(jié)合的工具,也適合分析資訊個性化推薦這種動態(tài)復(fù)雜的過程[10-12]。
本文應(yīng)用系統(tǒng)動力學(xué)理論,構(gòu)建資訊平臺用戶量、文章量、標(biāo)簽量和各子系統(tǒng)之間的因果反饋模型和存量流量模型,建立系統(tǒng)動力學(xué)方程模型,并利用Vensim[13-14]對資訊推薦效果的影響因素進(jìn)行建模仿真和分析。
1 資訊個性化推薦系統(tǒng)重要因素系統(tǒng)動力學(xué)識別
1.1 構(gòu)建資訊個性化推薦系統(tǒng)的因果反饋模型
推薦系統(tǒng)多以定義社會化標(biāo)簽來標(biāo)注文章特征和用戶特征[15-17]。資訊個性化推薦服務(wù)主要與用戶量、文章量和標(biāo)簽量等相關(guān),因此將行為資訊平臺的推薦系統(tǒng)分為3個子系統(tǒng):1)用戶量子系統(tǒng),包括用戶增長量、用戶減少量、吸引力等變量;2)文章量子系統(tǒng),包括文章采集、文章淘汰、文章曝光量、文章上下文分詞、文章訪問量、文章傳播等變量因素;3)聯(lián)系到用戶和文章的標(biāo)簽子系統(tǒng),包括標(biāo)簽生成、標(biāo)簽消亡、熱點標(biāo)簽、標(biāo)簽群組等變量。以資訊平臺用戶量的增長為研究目標(biāo),構(gòu)建的資訊個性化推薦因果關(guān)系圖如圖1所示。
1.2 因果反饋模型分析
對在Vensim中構(gòu)建的因果反饋模型進(jìn)行分析。系統(tǒng)動力學(xué)主要利用反饋機(jī)制研究內(nèi)部結(jié)構(gòu),從而研究系統(tǒng)的行為模式與特性,建立因果回路,把用戶量作為評價資訊平臺利用推薦系統(tǒng)效果的主要因素,其中熱門標(biāo)簽與標(biāo)簽比、文章訪問量等因素正向影響用戶量,由此得到4條主要因果反饋回路:
1)用戶量→+熱點標(biāo)簽與標(biāo)簽比→+標(biāo)簽吸引力因子→+吸引力因子→+用戶增加;
2)用戶量→+文章訪問量→+曝光量與文章比例→+文章吸引力因子→+吸引力因子→+用戶增加;
3)用戶量→+文章訪問量→+曝光量與文章比例→+文章曝光量因子→+文章傳播因子→+文章采集→+文章量→+興趣點因子→+標(biāo)簽文章因子→+標(biāo)簽生成因子→+標(biāo)簽采集→+標(biāo)簽量→+熱點標(biāo)簽與標(biāo)簽比→+標(biāo)簽吸引力因子→+吸引力因子→+用戶增加;
4)用戶量→+熱點標(biāo)簽與標(biāo)簽比→+標(biāo)簽量因子→+標(biāo)簽生成因子→+標(biāo)簽采集→+標(biāo)簽量→+興趣點因子→+文章詞量稀疏→+文章傳播因子→+文章采集→+文章量→+分詞量→-曝光量與文章比例→+文章吸引力因子→+吸引力因子→+用戶增加。
由此可知,資訊平臺的用戶量與文章訪問量、熱點標(biāo)簽與標(biāo)簽比、文章曝光量因子、文章吸引力因子等形成正反饋回路,通過更高的文章吸引力,帶來了更多的文章訪問量,提高了文章曝光量;熱點標(biāo)簽與標(biāo)簽的比例又反映了文章的實時性等因素,文章的吸引力因子通過用戶的興趣點因子與標(biāo)簽、文章詞量的系數(shù)等因素相聯(lián)系,吸引力提高對用戶量形成了新的正反饋回路。
不僅如此,還可以直觀展示出某一因素的因果樹。圖2所示為吸引力因子的因果樹。
吸引力因子與文章吸引力和標(biāo)簽吸引力有著直接的關(guān)系,即在采集新聞資訊平臺內(nèi)容時,需要重點處理用戶信息、文章信息和文章上下文這種場景信息,并進(jìn)行特征分析,提取出用戶特征、文章特征和上下文場景特征,便于以后推薦系統(tǒng)根據(jù)吸引力情況進(jìn)行匹配推薦。
2 資訊個性化推薦系統(tǒng)影響因素存量流量模型
2.1 繪制存量流量圖
通過對因果關(guān)系進(jìn)行分析與整合,建立完整的資訊個性化推薦系統(tǒng)動力學(xué)存量流量模型,如圖3所示。
2.2 構(gòu)建系統(tǒng)動力學(xué)方程
2.2.1 建立Vensim方程式
將模型中的變量單位以天(d)為單位,用得到的影響因素指標(biāo)權(quán)重代入系統(tǒng)動力學(xué)存量流量模型中,其中涉及到Vensim方程式如下:
興趣點因子= (感興趣文章占比*文章量+感興趣標(biāo)簽占比*標(biāo)簽量)/文章詞量;
分詞量=文章總量*文章提供分詞平均率;
吸引力因子=感興趣標(biāo)簽占比因子*標(biāo)簽吸引力因子;
文章傳播因子=文章詞量系數(shù)*文章曝光量因子;
感興趣標(biāo)簽占比因子=感興趣標(biāo)簽占比因子表(曝光量與文章比例);
文章總量= INTEG(文章采集-文章過時,1 000);
文章曝光量因子=文章曝光量因子表(曝光量與文章比例);
文章訪問量=用戶*文章訪問量因子;
文章過時=文章總量*文章自然過時率;
文章采集=文章總量*文章傳播因子*文章自然采集率;
曝光量與文章比例=文章訪問量/分詞量;
標(biāo)簽吸引力因子=標(biāo)簽吸引力因子表(標(biāo)簽數(shù)與活躍標(biāo)簽比例);
標(biāo)簽總量= INTEG(標(biāo)簽采集-標(biāo)簽消亡,18);
標(biāo)簽數(shù)與活躍標(biāo)簽比例=用戶/(標(biāo)簽群組數(shù)*標(biāo)簽總量);
標(biāo)簽文章因子=詞量因子表(興趣點因子);
標(biāo)簽消亡=標(biāo)簽總量*標(biāo)簽消失率;
標(biāo)簽生成因子=標(biāo)簽量因子*標(biāo)簽文章因子;
標(biāo)簽采集=標(biāo)簽總量*標(biāo)簽生成率*標(biāo)簽生成因子;
標(biāo)簽量因子=標(biāo)簽因子表(標(biāo)簽數(shù)與活躍標(biāo)簽比例);
用戶= INTEG(用戶增加-用戶減少,500);
用戶減少=用戶*用戶自然減少率;
用戶增加=用戶*用戶自然增長率*吸引力因子;
用戶增長率=(用戶增加-用戶減少)/用戶;
文章詞量系數(shù)=文章詞量系數(shù)表(興趣點因子)。
2.2.2 建立表函數(shù)
表函數(shù)一般用于反映自變量與因變量之間的非線性關(guān)系。在Vensim軟件中,表函數(shù)可以在Lookup選項中把自變量、因變量的最大值和最小值同一些自變量與因變量對應(yīng)的點值列出,將收集到的關(guān)于文章、標(biāo)簽的相關(guān)數(shù)據(jù)用表函數(shù)的形式輸入到公式中,涉及到的表函數(shù)指標(biāo)如下:
感興趣標(biāo)簽占比因子表=[(0,0)-(2,2)],(0,2),(0.2,1.95),(0.4,1.8),(0.6,1.6),(0.8,1.35),(1,1),(1.2,0.5),(1.4,0.3),(1.6,0.2),(1.8,0.15),(2,0.1);
文章曝光量因子表=[(0,0)-(2,2)],(0,0.2),(0.2,0.25),(0.4,0.35),(0.6,0.5),(0.8,0.7),(1,1),(1.2,1.35),(1.4,1.6),(1.6,1.8),(1.8,1.95),(2,2);
文章詞量系數(shù)表=[(0,0)-(1,2)],(0,1),(0.1,1.15),(0.2,1.3),(0.3,1.4),(0.4,1.45),(0.5,1.4),(0.6,1.3),(0.7,0.9),(0.8,0.5),(0.9,0.25),(1,0);
標(biāo)簽吸引力因子表=[(0,0)-(2,2)],(0,1.4),(0.2,1.4),(0.4,1.35),(0.6,1.3),(0.8,1.15),(1,1),(1.2,0.8),(1.4,0.65),(1.6,0.5),(1.8,0.45),(2,0.4);
標(biāo)簽因子表=[(0,0)-(2,2)],(0,0.2),(0.2,0.25),(0.4,0.35),(0.6,0.5),(0.8,0.7),(1,1),(1.2,1.35),(1.4,1.6),(1.6,1.8),(1.8,1.95),(2,2);
詞量因子表=[(0,0)-(1,2)],(0,0.4),(0.1,0.7),(0.2,1),(0.3,1.25),(0.4,1.45),(0.5,1.5),(0.6,1.5),(0.7,1.4),(0.8,1),(0.9,0.5),(1,0)。
2.2.3 確定影響因素的初始值
本文主要研究資訊個性化推薦的主要影響因素和機(jī)制,注重關(guān)鍵因素對整體資訊平臺的影響,因此,初始值設(shè)置的精確性不會對結(jié)論產(chǎn)生影響。為了便于研究,模型中變量因素的初始值根據(jù)實際項目經(jīng)驗設(shè)置,如表1所示。
將以上方程、表函數(shù)指標(biāo)以及變量因素初始值代入Vensim存量流量模型中,對模型進(jìn)行仿真檢驗。
2.3 模型檢驗
第1步,需要對系統(tǒng)的邊界進(jìn)行檢驗,通過觀察模型中增加或者減少變量是否能夠形成閉合回路來驗證該變量是否對所研究的問題產(chǎn)生影響。驗證無誤后進(jìn)行第2步運行檢驗,使用Vensim中model菜單下的“Check Model”功能,對模型中所有的變量進(jìn)行檢驗。檢驗顯示,所有變量已經(jīng)賦值,且各變量之間均已建立了系統(tǒng)動力學(xué)方程。
3 系統(tǒng)動力學(xué)仿真分析
3.1 因素模擬分析
在Vensim軟件中,對資訊個性化推薦系統(tǒng)動力學(xué)存量流量模型進(jìn)行仿真模擬分析,在保持原始設(shè)定參數(shù)不變的情況下,關(guān)鍵影響因素中用戶量、文章量與標(biāo)簽量的變化趨勢如圖4所示。
在圖4中,用戶量、文章量、標(biāo)簽量存在明顯正相關(guān)關(guān)系,這3個量都是存量,是一個累計值,從趨勢上看,都是隨著時間的變化先增加后減少,并且在模型運行初期都有明顯加速的過程,在模擬到30 d左右達(dá)到峰值,之后雖然推薦系統(tǒng)也在不斷工作,但是在沒有外因進(jìn)行刺激的情況下,資訊平臺的用戶量開始呈下降趨勢。其余因素的變化,亦可通過仿真分析變化趨勢,由于篇幅所限,在此不再贅述。
3.2 變動參數(shù)的仿真結(jié)果分析
在進(jìn)行仿真分析時,研究各變量對整體系統(tǒng)的影響,往往采取調(diào)節(jié)某一變量的值來觀察其對系統(tǒng)的具體影響。資訊平臺個性化推薦系統(tǒng)設(shè)計時,常常需要對用戶以及文章情況打上特征標(biāo)簽,其中標(biāo)簽群組數(shù)代表定義用戶標(biāo)簽的個數(shù),圖5所示代表了分別給一個用戶打上5個、3個和7個的標(biāo)簽時,最終對吸引力因子和用戶量的影響。由圖5可知,在合理范圍內(nèi),更明確的特征標(biāo)簽數(shù)能夠?qū)τ脩袅慨a(chǎn)生更為積極的影響。
在推薦系統(tǒng)中,普遍存在稀疏性問題,即在系統(tǒng)運行初期,由于用戶和文章的特征較少,所以導(dǎo)致推薦效果較差。因此在對文章內(nèi)容上下文場景進(jìn)行分析時,文章內(nèi)容的長短影響著閱讀體驗,同時,系統(tǒng)對文章的切詞和分詞進(jìn)行語義處理,也影響著數(shù)據(jù)的稀疏性問題。以文章3 000字?jǐn)?shù)為基準(zhǔn),測試字?jǐn)?shù)對吸引力因子和用戶量的影響,如圖6所示。由圖6可知,在合理范圍內(nèi),文章字?jǐn)?shù)的變化對吸引力因子和用戶量的影響不大,解決稀疏性問題可通過用戶或文章聚類以及增加對內(nèi)頁的優(yōu)化,增加轉(zhuǎn)發(fā)與點贊、打分等手段,增加用戶對平臺的互動性,收集用戶和文章的特征信息,在一定程度上可解決稀疏性問題。
4 結(jié) 語
1)文章量、特征化標(biāo)簽和文章興趣點因子等都對推薦效果有重要影響,同時也存在邊際遞減效應(yīng)。冷啟動[18]、實時性[19]、稀疏性和“信息繭房”[20]等問題是每個推薦系統(tǒng)的共性問題。
2)對平臺既有用戶,利用其注冊信息打上用戶標(biāo)簽,對資訊也打上語義分類標(biāo)簽,可緩解冷啟動問題;被推薦的資訊最好有一定的時效,可加入被關(guān)聯(lián)的熱點內(nèi)容,提高文章的吸引力與可讀性,提高推薦系統(tǒng)的實時性,破解“信息繭房”問題。
3)對司法工作領(lǐng)域的資訊個性化推薦而言,首先,較高的新聞數(shù)量和曝光量有助于資訊平臺引流和提升黏性,但是要避免“信息過載”[21]導(dǎo)致的用戶體驗差乃至“脫粉”(取消平臺關(guān)注)等問題,所以,需要平衡推薦新聞的量和種類;其次,要重視上線后首批用戶的使用體驗,從敏感性分析來看,如果帶給首批用戶更好的體驗,將會帶來良好的用戶增長曲線。
4)如果僅在司法新聞資訊個性化推薦這一點上發(fā)力,由于用戶興趣點衰退等原因,其平臺自身發(fā)展往往會落入瓶頸期,用戶量難以持續(xù)增長。所以,本研究未來工作將結(jié)合資訊平臺具體的運營情況,在不斷完善推薦系統(tǒng)的同時,豐富平臺功能,增加客戶與應(yīng)用平臺的互動性,挖掘和分析用戶增長曲線和用戶黏性的變化規(guī)律。
參考文獻(xiàn)/References:
SUN Z,DAN C L,SHI Y.Big data analysis on social networking//IEEE International Conference on Big Data (Big Data)[C].Los Angeles:IEEE,2019:6220-6222.
[2] RUBEN T,JORDI T,EDUARD A.Multimedia big data computing for in-depth event analysis[C]//IEEE International Conference on Multimedia Big Data.Beijing:IEEE,2015:144-147.
[3] FENG C,KHAN M,ARIF U R,et al.News recommendation systems:Accomplishments,challenges & future directions[J].IEEE Access,2020,8:16702-16725.
[4] 李明,劉濱.基于數(shù)據(jù)驅(qū)動的司法公開信息化監(jiān)管系統(tǒng)[J].河北科技大學(xué)學(xué)報,2016,37(4):407-415.
LI Ming,LIU Bin.Data driven information system for supervision of judicial open[J].Journal of Hebei University of Science and Technology,2016,37(4):407-415.
[5] 鄧凱.試論中國司法信息化的演進(jìn)及其技術(shù)路徑[J].決策探索,2021(1):49-53.
DENG Kai.Research on the evolution of China's judicial informatization and its technical path[J].Policy Research & Exploration,2021(1):49-53.
[6] 孫笑俠.論司法信息化的人文“止境”[J].法學(xué)評論,2021,39(1):22-37.
SUN Xiaoxia.Research on the humanity edge of judicial informatization[J].Law Review,2021,39(1):22-37.
[7] XIE Jin,ZHU Fuxi,LI Xuefei,et al.Attentive preference personalized recommendation with sentence-level explanations[J].Neurocomputing,2021,426:235-247.
[8] LI Hui,LI Haining,ZHANG Shu,et al.Intelligent learning system based on personalized recommendation technology[J].Neural Computing and Applications,2019,31(9):4455-4462.
[9] LI M,WANG L.A survey on personalized news recommendation technology[J].IEEE Access,2019,7:145861-145879.
[10]劉揚.利用系統(tǒng)動力學(xué)理論探究大數(shù)據(jù)監(jiān)管作用機(jī)理[J].信息通信技術(shù)與政策,2019(10):76-81.
LIU Yang.Using system dynamics to analyze the mechanism of big data regulation[J].Information and Communications Technology and Policy,2019(10):76-81.
[11]李洪波,熊勵,劉寅斌.基于系統(tǒng)動力學(xué)的信息管理研究:框架與綜述[J].情報科學(xué),2017,35(2):164-170.
LI Hongbo,XIONG Li,LIU Yinbin.Information management research based on system dynamics:A framework and literature review[J].Information Science,2017,35(2):164-170.
[12]葉瓊元,夏一雪,張鵬,等.面向輿情大數(shù)據(jù)的突發(fā)事件民意系統(tǒng)演化機(jī)理與仿真研究[J].情報科學(xué),2019,37(1):80-85.
YE Qiongyuan,XIA Yixue,ZHANG Peng,et al.The evolution mechanism and simulation of internet public opinion for emergent [J].Information Science,2019,37(1):80-85.
[13].System dynamics approach for analyzing internet rumor model using Vensim[J].Journal of Cybercommunication Academic Society,2013,30(3):79-113.
[14]徐建全,楊沿平.基于Vensim的汽車輕量化全生命周期動態(tài)評價[J].計算機(jī)集成制造系統(tǒng),2020,26(4):954-969.
XU Jianquan,YANG Yanping.Dynamic evaluation of lightweight automobile life cycle based on Vensim software [J].Computer Integrated Manufacturing Systems,2020,26(4):954-969.
[15]AN S,ZHAO Z,ZHOU H.Research on an agent-based intelligent social tagging recommendation system[C]//9th International Conference on Intelligent Human-Machine Systems and Cybernetics (IHMSC).Hangzhou:[s.n.],2017:43-46.
[16]XU Z,TIFREA-MARCIUSKA O,LUKASIEWICZ T,et al.Lightweight tag-aware personalized recommendation on the social web using ontological similarity[J].IEEE Access,2018,6:35590-35610.
[17]ZHANG J,YANG Y,ZHUO L,et al.Personalized recommendation of social images by constructing a user interest tree with deep features and tag trees[J].IEEE Transactions on Multimedia,2019,21(11):2762-2775.
[18]WANG Xinghua,PENG Zhaohui,WANG Senzhang,et al.CDLFM:Cross-domain recommendation for cold-start users via latent feature mapping[J].Knowledge and Information Systems,2020,62:1723-1750.
[19]王智圣,李琪,汪靜,等.基于隱式用戶反饋數(shù)據(jù)流的實時個性化推薦[J].計算機(jī)學(xué)報,2016,39(1):52-64.
WANG Zhisheng,LI Qi,WANG Jing,et al.Real-time personalized recommendation based on implicit user feedback data stream[J].Chinese Journal of Computers,2016,39(1):52-64.
[20]王瑞.“信息繭房”的實質(zhì)、成因與突圍之道[J].青年記者,2020(36):23-24.
[21]周萬珍,曹迪,許云峰,等.推薦系統(tǒng)研究綜述[J].河北科技大學(xué)學(xué)報,2020,41(1):76-87.
ZHOU Wanzhen,CAO Di,XU Yunfeng,et al.A survey of recommendation systems[J].Journal of Hebei University of Science and Technology,2020,41(1):76-87.