周莉 成文武
“提升類案推送的智能化、精準(zhǔn)化水平”是最高人民法院《關(guān)于統(tǒng)一法律適用加強檢索的指導(dǎo)意見(試行)》(以下簡稱《指導(dǎo)意見》)中明確提出的要求。①《關(guān)于統(tǒng)一法律適用加強檢索的指導(dǎo)意見(試行)》第12條規(guī)定,各級人民法院應(yīng)當(dāng)積極推進(jìn)類案檢索工作,加強技術(shù)研發(fā)和應(yīng)用培訓(xùn),提升類案推送的智能化、精準(zhǔn)化水平。從關(guān)鍵詞主動搜索到類案智能推送,類案智能平臺確實已實現(xiàn)了從0到1的突破,但仍然有學(xué)者認(rèn)為,“這些類案推送平臺仍處于只有人工沒有智能的層面?!雹訇愮骸额惏竿扑颓度搿爸腔鄯ㄔ骸鞭k案場景的原理和路徑》,載《中國應(yīng)用法學(xué)》2018年第4期。亦有學(xué)者認(rèn)為,“如果不將算法與法律思維相融合,這些類案推送平臺將是沒有靈魂的技術(shù)軀殼,不會在司法實踐中發(fā)揮出其應(yīng)有作用?!雹趧Ⅳ敿骸额惐韧评碓诜扇斯ぶ悄苤械膽?yīng)用——以指導(dǎo)性案例智能推送系統(tǒng)的構(gòu)建為例》,載《法律方法》2019年第2期。目前,學(xué)術(shù)界對類案推送的研究成果不多,主要集中在類案推送的制度構(gòu)建、算法構(gòu)架上,對類案推送在司法實踐中的實際效果如何、如何提高類案推送質(zhì)量等方面鮮有研究。③質(zhì)量可以用于形容產(chǎn)品或服務(wù)的好壞、優(yōu)劣程度,本文提到的類案推送質(zhì)量主要指的是類案推送結(jié)果對用戶需求的滿足程度。為此,本文從類案推送質(zhì)量的不同維度出發(fā),通過控制類案推送的每道關(guān)鍵工序,確保類案推送結(jié)果盡可能貼近法官用戶真實需求這一質(zhì)量要求。
為考察類案推送在審判中的實際運行狀況,筆者通過人民法院官網(wǎng)報道、本院法官座談會、面向Z市法官隨機(jī)發(fā)放100份調(diào)查問卷等方式搜集資料,④筆者之所以選擇Z市法院法官作為調(diào)查對象,主要是考慮到Z市所有法院都配備最高院的類案智能推送系統(tǒng),沒有配備其他類案推送平臺。以定量調(diào)查方法呈現(xiàn)法官用戶使用類案智能推送系統(tǒng)的真實感知。其中,調(diào)查內(nèi)容涵蓋:遇到何種情況時,需要使用類案推送;通常在哪個階段需要使用類案推送;基于哪些原因使用類案推送;對類案推送哪些方面表示滿意。
如果說通過主動輸入關(guān)鍵詞進(jìn)行類案檢索的平臺屬于初代類案智能平臺,那么在以中國裁判文書網(wǎng)、法信為代表的初代類案智能平臺之后,主要出現(xiàn)了三種類案推送平臺:一是進(jìn)階的“類案檢索”,通過細(xì)分案由、拆分關(guān)鍵詞進(jìn)行檢索,雖能得到更準(zhǔn)確的推送結(jié)果,但仍需法官進(jìn)行人工甄別;二是初級類案推送,即通過圖像識別、語義理解抓取案件要素,但不能適用于規(guī)范化低的復(fù)雜案由,往往準(zhǔn)確性不高;三是交互頻繁設(shè)計的類案推送,即通過設(shè)計多層級前提條件,法官通過多輪交互對話獲得精確結(jié)果,但每一次的交互對話都容易與原意偏離。可見,在初代類案智能平臺之后,各種類案智能產(chǎn)品仍然沒有實現(xiàn)真正意義上的人工智能推送。
表1 類案智能平臺情況匯總表
《指導(dǎo)意見》第2條①《關(guān)于統(tǒng)一法律適用加強檢索的指導(dǎo)意見(試行)》第2條規(guī)定,人民法院辦理案件具有下列情形之一,應(yīng)當(dāng)進(jìn)行類案檢索:(一)擬提交專業(yè)(主審)法官會議或者審判委員會討論的;(二)缺乏明確裁判規(guī)則或者尚未形成統(tǒng)一裁判規(guī)則的;(三)院長、庭長根據(jù)審判監(jiān)督管理權(quán)限要求進(jìn)行類案檢索的;(四)其他需要進(jìn)行類案檢索的。對類案檢索適用范圍予以明確,在一定程度上避免了全面檢索給法官帶來的負(fù)累。2019年,全國法院法官人均辦案228件,同比增長13.4%,有些地方法院法官人均辦案數(shù)量甚至超過500件。②參見于子平:《深化司法改革 建設(shè)智慧法院》,載中國法院網(wǎng)https://www.chinacourt.org/article/detail/2020/06/id/5285569.shtml,2020年6月20日訪問。在案多人少的今天,辦案法官并不會對全部案件采用類案檢索,全面推送顯然也缺乏推廣土壤。然而,《指導(dǎo)意見》沒有對“其他需要進(jìn)行類案檢索的”這一條文進(jìn)行明確規(guī)定,容易導(dǎo)致審判實踐中出現(xiàn)適用不統(tǒng)一的情形。根據(jù)調(diào)研結(jié)果,辦案法官對《指導(dǎo)意見》規(guī)定的三種類案檢索情形基本達(dá)成一致意見,但對其他需要進(jìn)行類案檢索的情形產(chǎn)生了一定的分歧,遇到新型案件需進(jìn)行類案推送有74人,遇到自由裁量權(quán)行使中存在裁判尺度不一需要進(jìn)行類案推送有58人,遇到擬作出的裁判與本院或上級法院的類案裁判可能發(fā)生沖突有51人,遇到其他情形有33人。可見,類案檢索范圍的模糊規(guī)定在一定程度上導(dǎo)致了類案推送范圍的適用不一。
從庭前準(zhǔn)備階段到案件審理階段,再到結(jié)案階段,辦案法官都有類案推送的需求,且在不同的庭審階段,會有不一樣的需求。然而,現(xiàn)行類案智能推送系統(tǒng)只能滿足辦案法官的部分需求:一是在庭前準(zhǔn)備階段,能輔助檢索類似案例,仍需要辦案法官自行整理審理要點;二是在案件審理階段,能提供大量相似事實情節(jié)的案例樣本,但無法根據(jù)法官類型、個人偏好進(jìn)行及時地個性化推送;三是在結(jié)案階段,能提供類案集合的基本事實、爭議焦點、證據(jù)認(rèn)定、判決結(jié)果等,但無法對裁判結(jié)果預(yù)判、對裁判偏離度提示、對類似裁判思路總結(jié)。可見,現(xiàn)行類案推送還不算真正意義上的人工智能推送,只是能夠有限滿足辦案法官的辦案需求。
類案智能推送系統(tǒng)是人工智能與法律深度融合的產(chǎn)物,而法官則是法律與技術(shù)之間的連接者,也是類案推送產(chǎn)品的最終質(zhì)量檢測員。為了通過窺視法官對類案智能推送系統(tǒng)不同方面的滿意程度,進(jìn)而呈現(xiàn)類案推送質(zhì)量短板所在,筆者在調(diào)查問卷中融入以下評價指標(biāo):1.相關(guān)性,即智能推送的案例與法官真實需求很相關(guān)的;2.權(quán)威性,即智能推送的案例是令人信服的;3.準(zhǔn)確性,即智能推送的案例是準(zhǔn)確的、無錯誤的;4.精簡性,即智能推送結(jié)果簡練直觀、一目了然;5.易懂性,即智能推送結(jié)果易于理解;6.廣泛性,即智能推送的案例很多,涉及法院廣泛;7.審判輔助效用,即智能推送的案例有利于輔助審判工作。通過調(diào)研可見,現(xiàn)行類案推送在相關(guān)性、準(zhǔn)確性方面明顯存在質(zhì)量短板,在易懂性、廣泛性、精簡性、審判輔助效用方面亦有待提高。
“信息質(zhì)量維度是指信息滿足用戶要求和使用目的的基本質(zhì)量特性?!雹賱⒈骸毒W(wǎng)絡(luò)環(huán)境中基于用戶視角的信息質(zhì)量評價研究》,中國社會科學(xué)出版社2015年版,第48頁。類案推送結(jié)果屬于信息的一種,自然可通過不同信息質(zhì)量維度進(jìn)行評價。為深入考察類案推送在審判實踐中的運行困境,需從不同維度對類案推送進(jìn)行質(zhì)量評估,具體如下:
目前類案推送系統(tǒng)的文書儲備基本來源于裁判文書網(wǎng)的判決書數(shù)據(jù)以及最高檢發(fā)布的指導(dǎo)案例及最高法、各省、直轄市、自治區(qū)高級人民法院、檢察院發(fā)布的典型案例。由于缺少過濾、整合的過程,導(dǎo)致有效資源難以提煉,過多冗余信息必然會導(dǎo)致有效信息的丟失,造成推送遺漏的窘境。
1.公開時間的斷層。中國裁判文書網(wǎng)于2013年才開始逐步建立,此后生效裁判文書才開始集中上傳至這一平臺。②參見陳燾、劉宇瓊:《“同案同判”的涵攝與超越——兼論區(qū)域法律統(tǒng)一適用與司法協(xié)同治理》,載《法學(xué)研究》2020年第3期。囿于案卷電子化的時間較晚,上網(wǎng)案例的發(fā)布時間大多在2013年之后,造成當(dāng)前的數(shù)據(jù)庫缺乏“歷史底蘊”,可推送數(shù)據(jù)僅局限于2013年至今的上網(wǎng)裁判文書,以致推送結(jié)果存在年份上的遺漏。
2.公開地域的失衡。浙江、山東、安徽、河北、陜西公開結(jié)案比超過60%,而有些省份如黑龍江、西藏要低于20%,總體看,經(jīng)濟(jì)發(fā)達(dá)省份的公開文書量不僅超過經(jīng)濟(jì)落后省份,公開比例也相對更高,導(dǎo)致推送數(shù)據(jù)庫的完整性受到掣肘,可推送數(shù)據(jù)存在地域上的遺漏。③參見馬超、于曉虹、何海波:《大數(shù)據(jù)分析:中國司法裁判文書上網(wǎng)公開報告》,載《中國法律評論》2016年第4期。
3.公開技術(shù)的掣肘。類案推送目前采用搜索為主的推送方式,通過疊加多個關(guān)鍵詞,在一定程度上限定搜索范圍,以達(dá)到推送目的。然而,缺乏核心法律技術(shù)細(xì)節(jié)設(shè)計支撐,最終推送結(jié)果只是機(jī)械包含搜索關(guān)鍵詞的大量文書,而非真正意義上的類案,無法解決業(yè)務(wù)核心難點。
當(dāng)待決案件為新類型案件或疑難復(fù)雜案件時,法官對類案推送的期待值和需求值也會相對較高,此類案件的復(fù)雜之處在于對事實或證據(jù)的認(rèn)定以及案件中涉及的疑難法律問題的處理。
1.類案標(biāo)注不全面,導(dǎo)致結(jié)果失真。目前的類案推送系統(tǒng)主要通過關(guān)鍵詞搜索方式運行,即由用戶通過檢索關(guān)鍵詞的形式達(dá)到推送目的。若爭議焦點、亟需解決的法律問題段落沒有被設(shè)置成相應(yīng)的要素標(biāo)簽,且數(shù)據(jù)庫中文書包含的表達(dá)詞匯與用戶鍵入的搜索關(guān)鍵詞不一致時,即使該文書實際上有關(guān)于該爭議焦點或者疑難法律問題的專段論述,也無法出現(xiàn)在最終推送結(jié)果中。
2.類案要件不標(biāo)準(zhǔn),引發(fā)重復(fù)篩選。通過相關(guān)性選項排序的推送結(jié)果,往往是數(shù)據(jù)庫文書與用戶搜索關(guān)鍵詞的一致性體現(xiàn)結(jié)果,有的僅僅是案件特征形式上相似,實質(zhì)法律關(guān)系上卻與待決案件大相徑庭,無法精準(zhǔn)滿足用戶的推送需求。雖然通過多次篩選、甚至全文檢索逐一比照,用戶也能得到所需信息,但需以耗費大量時間成本為代價,時間成本與利用率不成正比。
可見,只有采用更精準(zhǔn)的信息抓取方式、更先進(jìn)的個性化推送技術(shù),才是當(dāng)前類案推送在人工智能輔助下的應(yīng)有之意。
最高法第一批指導(dǎo)性案例于2011年12月發(fā)布,至今已發(fā)布21批共112件指導(dǎo)性案例。①參見潘子璇:《統(tǒng)一司法尺度維護(hù)司法公正 最高院七年來發(fā)布112件指導(dǎo)案例》,載騰訊網(wǎng)https://new.qq.com/omn/20190225/20190225A0FL81.heml?pc,2020年6月20日訪問。但對于裁判文書公開網(wǎng)公開的海量裁判文書來說,指導(dǎo)性案例的數(shù)量只是滄海一粟,涵蓋的爭議焦點和法律要素廖若星辰,而審判實踐中遇到的疑難問題千差萬別,大部分超出指導(dǎo)性案例的涵蓋范疇,故類案推送結(jié)果大部分來源于已公開的裁判文書,需要法官結(jié)合自身經(jīng)驗對推送結(jié)果進(jìn)行甄別。一方面,在類案推送系統(tǒng)中,指導(dǎo)性案例和典型案例等沒有區(qū)別標(biāo)識,混雜于普通案例之中;另一方面,未對普通案例文書進(jìn)行篩選,很多數(shù)據(jù)存在錯別字、要素不全等形式上的缺失,又或存在不同程度的說理不清、論證不明的情況。類案推送呈現(xiàn)結(jié)果若沒有經(jīng)過濾、篩選、排序等流程,必然會導(dǎo)致法官用戶由于甄別耗時過長,引發(fā)對類案推送的信任斷裂,最終對類案推送結(jié)果產(chǎn)生質(zhì)疑,這既有違類案推送系統(tǒng)設(shè)計的最初意圖,也有悖借助類案推送提高裁判文書質(zhì)量的初衷。
如果說統(tǒng)一裁判尺度是類案推送的質(zhì)量要求,那么,在案件審判流程公開,透明司法的大環(huán)境下,在人均辦案任務(wù)數(shù)日益增長的現(xiàn)狀下,時間于制度的價值備感重要?;趯^程和效果的整體考量,類案推送的主要目的應(yīng)當(dāng)定位在效率上。
1.精準(zhǔn)推送的制約。法官真正需要的是某個疑難問題的主流觀點、案件裁判思路以及論證說理的方法等,而現(xiàn)行類案推送只能識別具有相似性的文書字段?,F(xiàn)階段文書格式化程度并不高,某一特定字段可能與檢索者的實際需求相去甚遠(yuǎn),且類案推送系統(tǒng)的數(shù)據(jù)獲取方法過于簡單,缺乏深層加工,易導(dǎo)致結(jié)果偏差。
2.智能推送的不暢。在全文顯示的推送模式下,法官需要花費大量時間去逐一甄別法律爭點,通過閱讀上述文書中的論證說理部分,自行提煉相關(guān)裁判思路、觀點,對多篇文書中不同的裁判思路、觀點進(jìn)行對比,選擇最符合自身需求的文書論證說理部分采用。也就是說,傳統(tǒng)類案推送系統(tǒng)中的推送結(jié)果并非用戶最終的需求,只是從數(shù)據(jù)庫中完成了部分?jǐn)?shù)據(jù)的初步篩選,原始推送結(jié)果不能清晰地體現(xiàn)出案件裁判價值取向的全樣本規(guī)律及不同地域法院的裁判價值考量。如果不結(jié)合法官自身的二次人工篩選,原始推送結(jié)果可提供的只是案件與法官之間點對點的推送,而不是具有不同價值取向或裁判規(guī)律的類案模塊與法官之間面與點的對接。
正因為大海撈針般的檢索可能遠(yuǎn)不如按既有經(jīng)驗判決來得快,所以在衡量時間成本與效率價值后,很少會有法官愿意花費大量時間用于類案檢索以規(guī)避“質(zhì)量”隱患。
只有了解人工智能輔助下類案推送的真實當(dāng)下,才能預(yù)判和迎接它的可能未來。在清楚知道類案推送在審判實踐中存在的質(zhì)量短板后,下一步才能從宏觀層面到微觀層面對類案推送進(jìn)行全方位優(yōu)化。
“法律人工智能產(chǎn)品如果沒有立足法律人活動的場景需求,沒有尊重法律思維和體現(xiàn)法律方法,那么在實踐運行中難免水土不服并產(chǎn)生一系列問題,進(jìn)而導(dǎo)致無法充分發(fā)揮法律人工智能產(chǎn)品的積極效能?!雹賱Ⅳ敿骸额惐韧评碓诜扇斯ぶ悄苤械膽?yīng)用——以指導(dǎo)性案例智能推送系統(tǒng)的構(gòu)建為例》,載《法律方法》2019年第2期。首先,要將法律科學(xué)技術(shù)與法律業(yè)務(wù)場景緊密結(jié)合起來,確定標(biāo)簽體系的合理性,類案推送的結(jié)果才能具有最佳的數(shù)據(jù)匹配效果;其次,需要具有法律業(yè)務(wù)知識的人加入法律知識圖譜的建立隊伍中,完善現(xiàn)有類案推送系統(tǒng)的知識架構(gòu)體系,用“司法話語”充實類案推送知識圖譜,盡可能貼近法官思維規(guī)則和司法推理過程。“法律知識圖譜的提煉不僅需要足夠優(yōu)秀的專業(yè)法律知識,而且更是一項復(fù)雜工程?!雹谌A宇元典法律人工智能研究院:《讓法律人讀懂人工智能》,法律出版社2018年版,第29頁。最后,要將裁判思維方法與類案推送相糅合,以民商事案件為例,曾有法官歸納了七種典型的民商事裁判思維,分別是回流型、往返型、衡平型、循環(huán)型、同步型、逆向型、順向型。③參見郝廷婷:《民事審判思維方法實證研究——“三段論”邏輯在中國基層法院的續(xù)造與驗算》,載《法律適用》2012年第1期。在以請求權(quán)為基礎(chǔ)的裁判思維指導(dǎo)下,根據(jù)不同類型案件的審理步驟,尤其是針對重大疑難復(fù)雜案件、新型案件進(jìn)行裁判思路的歸納。將人工智能技術(shù)與法律思維最大限度地結(jié)合起來,在算法設(shè)計中融入法律思維,提高認(rèn)知智能技術(shù)優(yōu)化程度,增強識別效果的準(zhǔn)確性。
在人工智能輔助下,類案推送結(jié)果應(yīng)當(dāng)是基于科學(xué)的模型及算法產(chǎn)生的,相較于傳統(tǒng)類案檢索方式而言,不受用戶檢索操作水平的掣肘,能夠有針對性地為用戶提供經(jīng)過篩選的推送結(jié)果。就法官用戶而言,每個法官都有自己的特征,如何捕捉法官用戶的多維特征,進(jìn)而挖掘其真實需求,對于類案精準(zhǔn)推送至關(guān)重要。一是用戶的靜態(tài)特征,所處庭室、從事審判工作時間、受教育程度等。例如,在最高院發(fā)布新的典型案例時,通過智能對比識別,發(fā)現(xiàn)類案數(shù)據(jù)庫中有文書與某位法官用戶主辦的待決案件相似度較高,根據(jù)不同案例類型對不同庭室的法官進(jìn)行精準(zhǔn)化類案推送。二是用戶的動態(tài)特征,所處庭審階段、檢索習(xí)慣、查詢領(lǐng)域等。根據(jù)案件所處不同庭審階段,對法官用戶進(jìn)行個性化類案推送,以便于法官用戶理清審判要點。只有將用戶特征與類案推送模型深度糅合,才能挖掘用戶的真實需求,使用戶逐步脫離“個體經(jīng)驗”依賴,建立對類案推送結(jié)果的信任關(guān)系。
類案推送是人工智能與法律深度融合的產(chǎn)物,而法官不僅是類案推送產(chǎn)品的使用者,亦是類案推送產(chǎn)品的最終質(zhì)量檢測員。一方面,對于類案推送結(jié)果在審判實踐中運行效果如何、存在哪些不足、亟需從哪些方面進(jìn)行完善等問題,法官更有話語權(quán)。根據(jù)法官用戶的反饋意見,對類案推送系統(tǒng)進(jìn)行針對性調(diào)整、優(yōu)化,能讓類案推送結(jié)果更加切合法官用戶的真實需求。另一方面,建立一套科學(xué)的、操作性強的評價體系,既可以規(guī)范推送的模式、便于量化執(zhí)行,亦能提高推送結(jié)果的采納度、匹配度,滿足法官用戶更高層次的需求。通過量化評價體系,對推送結(jié)果從多個方面進(jìn)行質(zhì)量評價,法官用戶能從最終的綜合評分中,自行評估結(jié)果的參考價值度,從中篩選采納所需的推送結(jié)果。
為達(dá)到質(zhì)量要求,在質(zhì)量形成全過程的每一個環(huán)節(jié)所采取作業(yè)的技術(shù)和活動稱為質(zhì)量控制?!皬V義上的質(zhì)量控制就是確定系統(tǒng)過程的狀態(tài)以及糾正質(zhì)量過程的狀態(tài)以及糾正質(zhì)量過程偏離質(zhì)量目標(biāo)的質(zhì)量管理活動?!雹偻鹾Q啵骸顿|(zhì)量分析與質(zhì)量控制》,電子工業(yè)出版社2015年版,第18頁。簡言之,質(zhì)量控制是為了通過監(jiān)視質(zhì)量形成過程,消除質(zhì)量環(huán)上所有階段引起不合格或不滿意效果的因素。要對類案推送的信息質(zhì)量進(jìn)行控制,就應(yīng)當(dāng)貫徹預(yù)防為主的原則,使信息推送過程中的每一個質(zhì)量環(huán)節(jié)都處于有效的受控狀態(tài)。根據(jù)類案推送結(jié)果存在的質(zhì)量問題,圍繞類案推送的特點,提出把握每個環(huán)節(jié)的關(guān)鍵點,構(gòu)建類案推送質(zhì)量控制機(jī)制,旨在保障類案推送的相關(guān)性、準(zhǔn)確性、易懂性、及時性和可用性。
根據(jù)《指導(dǎo)意見》第3條①《關(guān)于統(tǒng)一法律適用加強檢索的指導(dǎo)意見(試行)》第3條規(guī)定,承辦法官依托中國裁判文書網(wǎng)、審判案例數(shù)據(jù)庫等進(jìn)行類案檢索,并對檢索的真實性、準(zhǔn)確性負(fù)責(zé)。的規(guī)定,辦案法官要依托中國裁判文書網(wǎng)、審判案例數(shù)據(jù)庫等進(jìn)行類案檢索。假如沒有優(yōu)質(zhì)的法律數(shù)據(jù)庫,類案推送就猶如空中樓閣,無法為辦案提供信息支撐和保障。類案推送并非需要浩如煙海的數(shù)據(jù),高質(zhì)量的數(shù)據(jù)才是確保類案推送質(zhì)量高的第一步。
本文認(rèn)為,可以通過三增一減來建立目標(biāo)數(shù)據(jù)庫。一是加強全國法院歷史裁判檔案的電子化,由各個法院對歷史數(shù)據(jù)進(jìn)行逐步整理,實現(xiàn)司法數(shù)據(jù)系統(tǒng)化、完整化,減少時間跨度上的缺失和斷層,從中提煉經(jīng)過時間驗證的司法經(jīng)驗,以應(yīng)對日益增長的新型、疑難、復(fù)雜案件的推送需求;二是加強全國各地法院裁判檔案的公開化,尤其是針對上網(wǎng)文書公開率偏低的地區(qū)法院,以避免目標(biāo)數(shù)據(jù)庫在地域上的失衡;三是加強法律法規(guī)、司法解釋、指導(dǎo)意見、指導(dǎo)性案例的填充,及時更新目標(biāo)數(shù)據(jù)庫的數(shù)據(jù);四是減少重復(fù)冗余信息。類案推送系統(tǒng)的數(shù)據(jù)庫可以基于中國裁判文書網(wǎng)、審判案例數(shù)據(jù)庫,但不能完全復(fù)制沿用上述數(shù)據(jù),在篩選目標(biāo)數(shù)據(jù)庫的準(zhǔn)入數(shù)據(jù)時,要以是否具有參考價值、參考價值高低作為準(zhǔn)入標(biāo)準(zhǔn)。目標(biāo)數(shù)據(jù)庫的篩選隊伍應(yīng)配備相應(yīng)的法律專業(yè)人士,以其專業(yè)的法律思維,對無法抓取裁判思路的、論證說理過于簡單的類案文書予以排除,對重復(fù)的類案文書進(jìn)行過濾、整合,以此降低法官用戶獲取有用信息的時間成本,提高推送效率。
針對類案數(shù)據(jù)庫中的數(shù)據(jù)龐大、質(zhì)量參差不齊且均為非結(jié)構(gòu)化數(shù)據(jù)的特征,流程設(shè)計應(yīng)從數(shù)據(jù)、用戶和結(jié)果為主體出發(fā),以法官用戶為中心,實現(xiàn)類案推送流程智能化、精準(zhǔn)化。
1.以“數(shù)據(jù)深度加工”塑造法律知識圖譜
(1)加載法律專有名詞詞典,將類案數(shù)據(jù)庫中的文書樣本數(shù)據(jù)與待決案件的起訴狀、答辯狀等電子檔案中的非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行深度加工;(2)構(gòu)建法律同義詞詞表,并基于語言轉(zhuǎn)換策略實現(xiàn)同義關(guān)系的抽取,即將同義詞、近義詞進(jìn)行匯聚歸類;(3)利用Jieba工具包的分詞功能和詞性標(biāo)記功能,對文本數(shù)據(jù)進(jìn)行分詞以及詞性標(biāo)注,避免出現(xiàn)分詞時將法律專有名詞分開的情況,并對名詞集中的非領(lǐng)域概念進(jìn)一步剔除。①參見鄭姝雅、黃奇、張戈、李雨軒、陳雪:《面向用戶生成內(nèi)容的本體構(gòu)建方法》,載《情報科學(xué)》2019年第11期。通過對數(shù)據(jù)的深度加工,進(jìn)一步規(guī)范文書框架與文字表達(dá),將類案數(shù)據(jù)庫的文書與待決案件自動生成為個案知識圖譜。
2.以“用戶特征+微觀行為”勾勒法官用戶畫像
在“門診式”審判新模式下,不同審判團(tuán)隊的審判方向各有不同,即便在同一個審判團(tuán)隊中,由于法官的性格、辦案經(jīng)驗、辦案風(fēng)格各具特色,對類案推送的需求偏好,亦各有不同?!坝脩舢嬒竦目坍嬐ǔ:w用戶的多個屬性——需求、行為、興趣、心理、性格等?!雹趨莿υ啤Ⅰ忝髦椋骸痘谟脩舢嬒窈鸵曨l興趣標(biāo)簽的個性化推薦》,載《情報科學(xué)》2020年第1期。通過用戶畫像的構(gòu)建,挖掘法官用戶的真實需求,有效提升類案推送的精準(zhǔn)度和智能度。具體過程如下:
(1)用戶特征分析。采集與法官用戶相關(guān)的多源數(shù)據(jù),包括用戶的姓名、性別、所屬法院層級、審判團(tuán)隊的類別、負(fù)責(zé)案件類型、年齡、辦案年限、辦案經(jīng)歷、推送需求偏好等數(shù)據(jù)。
(2)微觀行為挖掘。透過類案推送系統(tǒng)中的用戶日志信息,可以采集法官用戶的微觀行為信息,以此挖掘法官用戶偏好。從法官用戶在事實查明、說理論證、法條引用、判項表述等各部分停留的時長以及用戶復(fù)制引用的樣本結(jié)構(gòu)頻率等微觀行為信息中,提取用戶關(guān)注的重點模塊。例如:法官用戶在閱讀類案文書時,在說理論證部分耗時最長,且復(fù)制引用的樣本多為類案數(shù)據(jù)中的說理論證部分,則可以得出該法官用戶重點關(guān)注說理論證部分的結(jié)論。在此后的推送中,可提高說理論證部分相似度的推送權(quán)重和賦值,并以區(qū)別字體、顏色顯示該部分推送內(nèi)容。將法官用戶的行為信息利用神經(jīng)網(wǎng)絡(luò)進(jìn)行建模,模擬微觀行為和宏觀交互信息,捕捉各類行為序列對推薦結(jié)果的影響力,得到行為偏好向量,即為實時的法官用戶畫像行為特征。③參見吳彥文、劉雪純、杜嘉薇、何華卿:《融合微觀行為特性的用戶畫像增強研究》,載《情報科學(xué)》2020年第1期。
(3)用戶畫像聚類。依據(jù)法官用戶的微觀行為特征進(jìn)行實時地法官用戶畫像更新,通過法官用戶的相似度計算,在已構(gòu)建單個法官用戶畫像的基礎(chǔ)上,進(jìn)行法官用戶聚類,形成聚類法官用戶畫像。
3.以“分類逐層檢索”重塑推送呈現(xiàn)
在推送過程中,效力層級、地域范圍、推送類型、案件相似度、裁判日期均是優(yōu)先推送所需要考慮的因素。為提高推送精準(zhǔn)度和推送質(zhì)效,可實行“分類逐層檢索”的方式。
一方面,對于不同層級的案例,可以參考《指導(dǎo)意見》第4條①《關(guān)于統(tǒng)一法律適用加強檢索的指導(dǎo)意見(試行)》第4條規(guī)定,類案檢索范圍一般包括:(一)最高人民法院發(fā)布的指導(dǎo)性案例;(二)最高人民法院發(fā)布的典型案例及裁判生效的案件;(三)本?。ㄗ灾螀^(qū)、直轄市)高級人民法院發(fā)布的參考性案例及裁判生效的案件;(四)上一級人民法院及本院裁判生效的案件。除指導(dǎo)性案例以外,優(yōu)先檢索近三年的案例或者案件;已經(jīng)在前一順位中檢索到類案的,可以不再進(jìn)行檢索。進(jìn)行排序。在第一層級中,與新的法律、行政法規(guī)、司法解釋相沖突或者為新的指導(dǎo)性案例所取代的,一律不予推送。除第一層級外,均遵循已推送前一層級的類案,可不再推送后一層級的類案這一原則進(jìn)行,并在推送結(jié)果中標(biāo)明相應(yīng)的層級信息。若在上述規(guī)定的范圍內(nèi)無法找到類案,可以對本省其他法院(除本市)裁判的案件、全國其他法院(除本?。┎门械陌讣M(jìn)行推送。
另一方面,對于同一層級的案例,需要結(jié)合相似度、歷史參考采納率、案例生效時間等因素進(jìn)行排序,可以將因素權(quán)重初始設(shè)定為:相似度>歷史參考采納率>案例生效時間,通過融合算法形成最終的類案推送權(quán)重,并據(jù)此按照降序進(jìn)行排列。(1)相似度。指的是與待決案件在訴訟請求、基本事實、爭議焦點、法律適用問題等方面的相似程度。(2)歷史參考采納率。對推送結(jié)果的采納過程,實際上也是法官用戶對推送類案文書樣本的檢驗過程。一篇類案文書被參考采納入待決案件裁判文書的次數(shù)越高,該文書質(zhì)量高的可能性越大。(3)案例生效時間。法不溯及既往,法律條文更新的速度日新月異。裁判文書生效時間越新,運用已廢止、已修改法律條文的可能性就越小,蘊含的法律思維也會符合主流觀點?!吨笇?dǎo)意見》亦規(guī)定,優(yōu)先檢索近三年的案例或案件。
類案推送系統(tǒng)與法官用戶之間更多體現(xiàn)為一種單向互動,而法官用戶在推送過程中的認(rèn)知和需求是一個不斷變化的過程,應(yīng)意識到法官用戶對系統(tǒng)實時反饋的重要性,設(shè)計一種人機(jī)交互的動態(tài)評分機(jī)制,用于監(jiān)控推送質(zhì)量,在法官用戶提供反饋的過程中不斷對系統(tǒng)進(jìn)行調(diào)整和優(yōu)化。
根據(jù)法官用戶的真實需求,將類案推送質(zhì)量拆分為以下幾個構(gòu)成因素,進(jìn)一步測度指標(biāo)權(quán)重,對質(zhì)量進(jìn)行評分。1.相關(guān)度。指的是推送結(jié)果和用戶需求的匹配度,簡言之,就是推送案例與用戶真實需求的相關(guān)程度。推送案例與待決案件越相關(guān),代表推送結(jié)果質(zhì)量越高。2.準(zhǔn)確度。即推送的案例是準(zhǔn)確的、無錯誤的,小到字體錯誤、格式錯誤等,大到事實認(rèn)定錯誤、證據(jù)采納錯誤等。推送案例錯誤越少,準(zhǔn)確度越高。3.易懂度。即推送結(jié)果簡練、直觀、一目了然,易于理解。法律知識圖譜越層層遞進(jìn)、越環(huán)環(huán)相扣,易懂度越高。4.及時性。即推送案例是否及時更新。假如推送案例所依據(jù)的法律條文內(nèi)容或呈現(xiàn)的裁判觀點早已發(fā)生變化,則類案推送質(zhì)量較低。5.采用度。即根據(jù)推送樣本被采用的次數(shù),對其進(jìn)行相應(yīng)的評分增減。采用次數(shù)越多,則該項評分越高。根據(jù)以上五個因素對推送結(jié)果的影響力及重要性,可以將因素權(quán)重初始設(shè)定為:相關(guān)度>準(zhǔn)確度>易懂度>及時性>采用度,根據(jù)權(quán)重比例智能生成推送結(jié)果的質(zhì)量估分。在法官用戶使用過程中,根據(jù)類案推送結(jié)果的滿意度,參與到推薦結(jié)果的反饋評分中,對質(zhì)量估分進(jìn)行動態(tài)調(diào)整,以實現(xiàn)人機(jī)交互的交流反饋,最終讓推送結(jié)果與法官用戶期望值不斷貼近。
對于辦案法官而言,真正的類案推送需求是尋找裁判思路,找到類案裁判規(guī)律,而不是大量案例的簡單匯總。目前,市面上的類案推送平臺不能算是真正意義上的類案推送產(chǎn)品,不能滿足辦案法官的真實需求,類案推送的質(zhì)量短板沒有引起理論界和實務(wù)界的廣泛關(guān)注。本文將信息維度與用戶需求相結(jié)合,提出以質(zhì)量控制為重點,以信息維度提高用戶需求為視角,通過將大數(shù)據(jù)及人工智能技術(shù)融入司法辦案中,實現(xiàn)類案知識推送的精細(xì)化;通過控制類案推送的每道關(guān)鍵工序,從而促使類案推送結(jié)果真正符合辦案法官的真實需求,以求不僅能減輕辦案法官的裁判負(fù)累,還能夠在一定程度上確保法律統(tǒng)一適用。