徐雪珂
摘要:為解決智慧司法建設過程中手寫漢字識別、語音識別、司法聊天機器人、司法文書語義分析等復雜問題,提出將深度學習與智慧司法相結合,即運用深度學習模型來攻克智慧司法建設過程中的技術難題。主要對深度學習的發(fā)展及定義做了簡要分析,總結了幾種典型的深度學習模型,介紹了基于深度學習的手寫漢字識別、語音識別、司法聊天機器人、司法文書語義分析在智慧司法建設中的應用。
關鍵詞:深度學習;智慧司法;司法信息化;互聯(lián)網(wǎng)+;神經(jīng)網(wǎng)絡
中圖分類號:TP393 文獻標識碼:A 文章編號:1009-3044(2018)22-0176-03
1 前言
隨著人工智能與機器學習的發(fā)展,各個領域均掀起信息化改革的浪潮,司法信息化是當前司法改革最重要舉措之一,而智慧司法是司法信息化改革的核心部分。隨著全國各地智慧司法的建設,手寫漢字識別、語音識別、司法聊天機器人、司法文書語義分析等典型的技術問題逐漸浮現(xiàn)出來,且成為智慧司法建設進程中亟待解決的問題。
深度學習作為當今機器學習領域乃至計算機和互聯(lián)網(wǎng)領域最為炙手可熱的研究方向之一,自面世以來其預測的準確度就在很多方面大大超越了以前的機器學習算法,在圖像處理、自然語言、音頻識別等方面展現(xiàn)出了驚人的優(yōu)勢。尤其是近幾年來卷積神經(jīng)網(wǎng)絡(CNN)、循環(huán)神經(jīng)網(wǎng)絡(RNN)、對抗神經(jīng)網(wǎng)絡(GAN)的出現(xiàn)更使得深度學習算法一路高歌猛進,得到了學術界和工業(yè)界的廣泛關注。
通過深度學習和海量數(shù)據(jù)的結合將會在不同領域取得令人矚目的成績。本文立足于司法角度,介紹了如何運用深度學習模型解決智慧司法建設過程中典型的技術難題,從而推動司法信息化的發(fā)展。
2 深度學習的發(fā)展及定義
2.1 深度學習的發(fā)展
深度學習作為機器學習的一個分支,早在1943年W.Pitts等人就已經(jīng)提出了最早的神經(jīng)網(wǎng)絡模型,并用數(shù)學方式對其進行建模。但是直到1980年之前,神經(jīng)網(wǎng)絡都沒有很大發(fā)展,只能進行淺層的線性二分類,甚至無法計算異或操作。1980年,深度學習的創(chuàng)始人G.Hinton提出了多層感知器模型,使用多維度的隱含層來作為傳統(tǒng)的單層感知器的替代品,從而有了一定的突破。
但機器學習在幾十年的發(fā)展中,仍有很多問題未能解決。其中包括:BP算法隨著神經(jīng)網(wǎng)絡層次的加深,參數(shù)優(yōu)化效果無法傳遞到前層,從而導致容易出現(xiàn)局部最優(yōu)解或過擬合問題[1],以及計算機尚未發(fā)展成熟,所以直到21世紀初,出現(xiàn)過幾次神經(jīng)網(wǎng)絡熱潮都很快因為其物理局限性而被迫進入冰封期。而同時代機器學習又出現(xiàn)了很多有效的其他算法,例如決策樹、貝葉斯網(wǎng)絡、支持向量機等很多衍生算法。可以說,以前的深度學習被給予厚望,但是只停留在人們的概念之中,直到2006年Geoffrey Hinton在著名的科學雜志上發(fā)表文章,提出了一種新的神經(jīng)網(wǎng)絡,也就是我們現(xiàn)最熱門的“深度學習”的雛形。
筆者在對dblp數(shù)據(jù)庫中對deep learning關鍵字進行檢索后發(fā)現(xiàn),深度學習相關論文在1998年到2009年間逐年小幅度增長,在10篇周圍浮動,尚屬于一個研究的小眾領域。從2010年到2017年深度學習相關論文開始呈現(xiàn)幾何級數(shù)增長,到2017年各類期刊雜志上的論文數(shù)量已經(jīng)增長至3008篇,足以見得深度學習在研究界的火熱程度。
2.2 深度學習的定義
深度學習因為涉及例如信息識別等很多相關領域,所以很難從廣義上界定。相關的定義很多,這里我們采用一個比較權威的定義:
機器學習是專門研究計算機如何實現(xiàn)或模仿人類的學習行為,獲得新技能和新知識,并且識別現(xiàn)有的知識,從而利用經(jīng)驗使自身性能不斷改善提升的一門科學。[2]深度學習是機器學習的子領域,是試圖通過一系列多層的非線性的變換對數(shù)據(jù)進行抽象的算法。[3]
如圖1所示,圖中的每一個節(jié)點被稱作一個神經(jīng)元,通常我們也將它稱為一個感知器,每一個感知器都有一個或多個輸入和輸出以及其自身的權重。圖中最左邊我們稱作輸入層,輸入后面的一排感知器我們稱作第一層感知器,后面的也以此類推,總體稱作隱藏層,最后輸出的單元被稱為輸出層。第一層感知器每一個感知器都接受了輸入的值并輸出了四個結果,隱藏層第二層感知器接受了來自上一層的所有結果并將其作為自己的輸入值,通過權重做出自己的輸出,通過這種方式,使得每后一層都能做出比前一層更加復雜和抽象的決策,直到最后一層輸出結果。
傳統(tǒng)的機器學習算法在很大程度上依賴的是人為的建模和特征提取的函數(shù),通過人賦予的函數(shù)來保證計算數(shù)據(jù)和預測的精確度。與傳統(tǒng)機器學習方法不同的是, 深度學習試圖自動完成數(shù)據(jù)表示和特征提取工作; 并且深度學習更強調, 通過學習過程提取出不同水平、不同維度的有效表示, 以便提高不同抽象層次上對數(shù)據(jù)的解釋能力。[4]深度學習中的深度是用于將所有參數(shù)切割到不同參數(shù)空間,通過一系列的前向和反向傳播函數(shù),從前一層或后一層獲取數(shù)據(jù),逐層對其參數(shù)進行修改。而其存在的意義在于自動學習相關數(shù)據(jù)之間的內部關系,主要的方法是尋找數(shù)據(jù)的“特征”,簡單地來說,就是能夠在處理數(shù)據(jù)的同時,通過改變自己內部參數(shù)的方式獲得更好的數(shù)據(jù)處理能力。
3幾種典型的深度學習模型
深度神經(jīng)模型隨著研究的不斷深入也產(chǎn)生了很多不同的模型,最近在傳統(tǒng)機器學習需要解決問題的多項領域取得了顯著成效。卷積神經(jīng)網(wǎng)絡(CNN)、生成對抗網(wǎng)絡(GAN)和遞歸神經(jīng)網(wǎng)絡(RNN)特別是長期短期記憶網(wǎng)絡(LSTM)被廣泛運用,這些只需要有限的領域知識就可以達到相當?shù)男阅?,并且易于同時適用于特定的應用程序。
3.1卷積神經(jīng)網(wǎng)絡(CNN)
卷積神經(jīng)網(wǎng)絡因為其有能力捕捉空間或時間結構的局部相關性,在計算機視覺和NLP任務中取得了出色的表現(xiàn)。最近出現(xiàn)的一些新技術,如 Inception module[5]、Batchnorm[6]、以及殘差網(wǎng)[7]也使得性能更好。
3.2遞歸神經(jīng)網(wǎng)絡(RNN)
遞歸神經(jīng)網(wǎng)絡具有處理任意長度序列和捕獲長期依賴性的能力,其后的LSTMs[8]是為了更好的記憶和記憶訪問而設計的,它也可以避免標準遞歸神經(jīng)網(wǎng)絡中出現(xiàn)梯度爆炸或消失的問題,再后的BLSTM考慮了傳統(tǒng)LSTM忽略的未來的上下文信息,其在手寫識別、序列標注和機器翻譯中展現(xiàn)了很好的性能。
3.3生成對抗網(wǎng)絡(GAN)
生成對抗網(wǎng)絡(GAN)[9]是用于學習如何生成圖像的生成模型,其由一個發(fā)生器G和一個鑒別器D組成,根據(jù)博弈論進行訓練。G將輸入噪聲向量映射到輸出圖像,而D預測輸入圖像是否是由G生成的樣本,二者平衡后即可輸出以假亂真的圖像數(shù)據(jù)。目前,生成對抗網(wǎng)絡是深度學習研究者最熱的研究主題。
4 深度學習在智慧司法中的應用
4.1 基于深度學習的手寫文書識別
隨著司法體系信息化與智慧化的建設,傳統(tǒng)的pdf、jpg、png等照片形式的文書存儲格式已經(jīng)不再滿足當下文書存儲的需要,而是要求以word文檔格式進行電子版的文書存儲。目前市面上的OCR轉換器對手寫漢字的識別率非常低,不能解決手寫漢字由圖片向word轉換的需求?,F(xiàn)階段司法機構對手寫文書的處理一般采用工作人員手工錄入或直接將此類文書封存,不加以使用。但手寫文書數(shù)量較大且種類繁多,若均采用手工錄入,不僅耗費人力物力工作量大,而且出現(xiàn)的錯誤和遺漏無法進行檢校;但是若不使用該類文書會造成大量關鍵信息的缺失,從而影響智慧司法系統(tǒng)的準確度。將深度學習中的文字識別技術運用于手寫文書的識別,可以很好地解決此問題。
近年來,rcnn等一系列特征提取算法的出現(xiàn)以及近期的熱點算法attention可以快捷方便地將文字識別率增加至96%以上。大部分法律文書具有固定格式框架,因此可對固定格式部分著重進行樣本訓練,如果將深度學習技術結合OCR技術用于法律文書的識別,將基于深度學習的手寫漢字識別技術用于司法這一特定領域,只需少量的工作人員對識別后的文書進行校對即可完成對相關任務的處理,節(jié)省了工作時間,極大地降低了工作量,提高手寫文書識別的準確率。
4.2 基于深度學習的語音識別
智慧司法建設中語音識別技術普遍用于語音與文字的同步轉換、語音類文書關鍵信息提取、語音輸入等方面,是衡量司法建設智能度的一大標準。在傳統(tǒng)的法庭中,法庭上出現(xiàn)的每一句話都需要書記員記錄下來,出現(xiàn)錯漏等種種問題在所難免。如果在法院進行庭審時,現(xiàn)場收錄庭審語音,并采用語音識別技術直接將庭審語音轉換為電子版庭審筆錄,即可省去書記員手動記錄庭審筆錄以及轉換為電子檔案的工作,還降低了出現(xiàn)錯漏的情況。另外,在智能量刑系統(tǒng)中,可直接導入語音類文書進行量刑,省去了語音類文書轉換的這一過程,使得量刑系統(tǒng)更加便捷。
目前,以科大訊飛為首的科技公司已經(jīng)運用深度學習框架DFCNN將語音識別率增加到了98%,可識別方言達到23種,甚至超過了人類識別的正確度,但是國內少有將語音識別技術運用在智慧司法建設中,僅有的也只是采用很原始的算法對未經(jīng)標注的語音數(shù)據(jù)進行處理,存在著識別率低、時間長等一系列問題。所以如何將目前深度學習領域現(xiàn)有的成果與現(xiàn)實場景相結合將是未來人工智能研究者很重要的發(fā)展方向。
4.3 基于深度學習的司法聊天機器人
因為傳統(tǒng)觀念的影響,在大眾的心目中,法律咨詢和司法進度查詢一直是一個羞于啟齒和困難的問題。法院因為人員問題也不能開設很多便民窗口給大眾提供便捷的司法資訊服務。深度學習中自然語言方向的聊天機器人可以幫助法律部門解決這個問題。
聊天機器人是屬于智慧司法建設的人工智能建設部分,其主要包括APP端、微信端、司法服務點三種形式,其主要功能為與司法相關事宜的咨詢。例如,上訴流程、所需材料、法律法條咨詢、量刑咨詢等。類似于淘寶智能客服,使用者只需在系統(tǒng)中輸入需要咨詢的問題,系統(tǒng)便會自動反饋查詢結果,如果咨詢問題搜索不到或者過于復雜,即可接入人工服務,這樣就可以隨時隨地進行司法咨詢,極大程度的減輕了司法工作者的工作量。另一方面,有利于深化公民司法教育,通過聊天機器人獲取想要了解的法律相關的內容,同時,法院方面也可以根據(jù)統(tǒng)計數(shù)據(jù)了解哪一方面是老百姓最需要、最緊急的要求,在方便群眾的同時,提升法院的信息化水平。
4.4 基于深度學習的司法文書語義分析
司法文書語義分析是智慧司法建設過程中最常用的技術之一。在傳統(tǒng)的量刑模式中,法官要通過讀取大量卷宗,手工的完成上述工作,不僅浪費大量時間,同時還會出現(xiàn)很多疏漏,不夠公正透明。
在智能量刑系統(tǒng)中,我們可以將案件起訴書、庭審筆錄等相關文書進行量化,使用word2vec模型進行詞嵌入,通過一系列的深度學習算法進行關鍵信息提取、語義分析、自動摘要等,提取出被告人及其犯罪情節(jié),系統(tǒng)再根據(jù)提取出的信息與法律法規(guī)進行匹配,為量刑系統(tǒng)提供相關的理論依據(jù)。這樣一來,每一條量刑都是通過對以前量刑結果的大量分析得出的,不僅可以減輕法官的負擔和心理壓力,為他們提供完備的量刑依據(jù),同時還可以保障司法透明化,降低貪腐和暗箱操作的可能性。
5總結
深度學習與智慧司法建設的結合有著長久而深遠的意義,更是進一步建設司法信息化的必經(jīng)之路。各種深度學習算法的出現(xiàn)及其在其他領域展現(xiàn)出的重要作用為司法中出現(xiàn)的各種技術難題的解決提出了新理念、新思路、新方法,使司法向著智能化邁進了一大步。深度學習正處于不斷研究發(fā)展的階段,除上文提到的技術外,司法領域仍有很多方面可使用深度學習研究成果來節(jié)省人力物力、提升工作效率。因此,如何將深度學習成果落到實處,使其在智慧司法建設進程中發(fā)揮更大的作用是智慧司法研究者未來研究的一種重要的方向。
參考文獻:
[1] 馬世龍,烏尼日其其格,李小平. 大數(shù)據(jù)與深度學習綜述[J]. 智能系統(tǒng)學報,2016,11(06):728-742.
[2] 姚麗. 基于深度學習特征提取的高校投入產(chǎn)出績效評價研究[D].華南理工大學,2017.
[3] Dong Yu, Li Deng:Deep Learning and Its Applications to Signal and Information Processing [Exploratory DSP]. IEEE Signal Process. 2011, 28(1): 145-154.
[4] 奚雪峰,周國棟. 面向自然語言處理的深度學習研究[J]. 自動化學報,2016,42(10):1445-1465.
[5] Christian Szegedy, Vincent Vanhoucke, Sergey Ioffe, Jonathon Shlens, Zbigniew Wojna:Rethinking the Inception Architecture for Computer Vision, 2016: 2818-2826
[6] Sergey Ioffe, Christian Szegedy:Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift, 2015: 448-456
[7] Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun:Deep Residual Learning for Image Recognition. CVPR 2016: 770-778
[8] Sepp Hochreiter, Jürgen Schmidhuber:Long Short-Term Memory. Neural Computation,1997, 9(8): 1735-1780.
[9] Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron C. Courville, Yoshua Bengio: Generative Adversarial Nets, 2014: 2672-2680
【通聯(lián)編輯:光文玲】