熊建英
(江西警察學院 安全管理系,江西 南昌 330003)
在信息化發(fā)展的大背景下,公安工作劃為四個階段,即“傳統(tǒng)警務、信息警務、數據警務、智慧警務”,相應的信息化發(fā)展歷程也可劃分為三個階段(如圖1所示),其中在IT階段通過計算機信息系統(tǒng)大大提升了警務工作的效率;在DT階段實現利用大數據匯聚開展警務情報分析研判工作;而在AI階段,則更多的是基于大數據的預測促進警務發(fā)展。
圖1 公安信息化發(fā)展階段
IT階段具有標記性的事件是2003年正式啟動的“金盾工程”,該工程完成了公安信息網絡基礎設施的建設和架構、基礎信息采集、警務工作信息化流轉等,提高了社會資源共享、公安信息資源綜合利用水平。在DT階段,2013年通過云計算為公安大數據處理提供了存儲、運算、展示的基礎平臺。2014年將大數據技術服務于公安實戰(zhàn),歷經數年在數據資源共享、系統(tǒng)整合和信息深度應用上取得了實質性提升。有了云計算提供的算力支持,互聯網、物聯網等發(fā)展帶來的大數據整合,為從大數據中獲取大價值提供了技術保障,進一步推動了智慧警務的發(fā)展[1]。目前,公安部科技信息化局對大數據智能化建設推進方案進行了詳細部署,用于指導多省市的大數據規(guī)劃設計,形成全國統(tǒng)一戰(zhàn)略。
公安部門正面臨各類監(jiān)管數據呈幾何增長和高頻流動,這就使得公安人員在信息利用方面還有待提高[2][3]。
一是在數據資源采集方面。目前,很多網絡數據都不能實現智能化的自動采集,也有不少民警對原始數據的敏感度不夠,忽略數據質量,導致很多數據質量較低,無法保證完整性、一致性,為進一步價值挖掘帶來困難。
二是在數據融合創(chuàng)新方面。目前,在數據處理過程中主要還是以查詢、統(tǒng)計等傳統(tǒng)分析方法為主,運用數據建模實現深度挖掘能力偏低,無法滿足警務實戰(zhàn)的需要。數據的運用需要民警辦案經驗、大數據、IT技術的融合,能否找到技術與業(yè)務的契合點,這就需要辦案人員具有相應的思維能力。
三是在大數據應用方面。目前,很多民警在數據應用上數據思維能力不強,往往依靠傳統(tǒng)經驗開展個案的因果分析,不能應對新情況。而大數據時代,偵查治理需要從個體思維轉向總體思維、因果思維轉向相關思維、自然思維轉向智能思維。
人們習慣按經驗、感性思維對事物進行判斷,這種思維方式不夠嚴謹、理性,容易出錯。香濃在信息論中將信息定義為一種對不確定的隨機性的消除,而數據是信息的載體,如果獲取的數據越多,對事物了解的維度也將越多,從而可以更好地消除不確定,做出準確的決策[4]。過去由于技術限制無法采集、存儲、處理大量數據,只能進行數據抽樣分析,認識事物會存在很大誤差。而在大數據時代,可以方便、快捷、動態(tài)地獲取研究對象相關的海量數據,為了更全面、立體、系統(tǒng)地認識事物,思考方式也應該從感性思維轉向更理性的數據思維。
在利用大數據認識世界的同時,需要重構對數據的理解。首先,需要高質量的數據,因為收集數據的目的是要產生價值,大數據的大是反映事物的信息維度多,但并非數據越多越好,無用的數據只是垃圾。阿里首席數據運營師車品覺提出,盲目地收集不但不會給企業(yè)帶來價值,也承擔著數據收集與管理成本[5]48-53。其次,大數據需要管理和利用,大數據是真實世界的刻畫,在力求數據真實的同時,收集的大數據要合理利用,從數據中挖掘有價值的規(guī)律,尊重數據,用數據作為管理決策的重要依據。最后,大數據需要構建一整套優(yōu)良的數據驅動流程。
表3為兩種運營模式下的運營時間對比。由表3可知,采用站站停運營模式時,13號線全線運營時間為82 min,因本線客流平均運距超過常規(guī)地鐵,且直達客流較多,客流特征適應性較差。因此,有必要對快慢車組合運營進行研究。
數據思維被認為是“企業(yè)管理的第一思維”。人的思維是對事物認識的高級階段,是人腦活動的內在程序,是一種習慣性思考問題和處理問題的模式,涉及看問題的角度、問題分析的層次和方法,對人的行為模式產生直接影響。恩格斯曾經提出:每一個時代的理論思維,都是一種歷史的產物,它在不同的時代具有不同的形式,同時具有完全不同的內容[6]。數據驅動方法從20世紀70年代開始起步,數據思維需要人們尊重事實、遵循理性、遵守邏輯、追求精確等,強調“數據勝于事實、用數據說話、數據產生價值”等觀念[5]48-53?;ヂ摼W出現后,可用的數據量劇增,數據驅動方法的優(yōu)勢越來越明顯。由于各個領域數據不斷向外擴展,使得數據開始出現交叉,各個維度的數據從點和線漸漸連成了網,數據之間關聯性增強,也就形成了大數據[7]。而大數據思維則是大數據時代的產物,即具有數據思維的一般共性,也由于自身所特有的4V屬性(如圖2所示,即數量大、種類雜、速度快、價值密度低),在思維方式上呈現出獨有的特征?!洞髷祿r代》將大數據思維方式歸結為三點:利用全體數據替代隨機樣本,允許數據的混雜性而不追求精確性,分析事物采用相關關系代替因果關系[8]。
圖2 大數據的4V特征
警務人員需要培養(yǎng)與之相適應的大數據思維習慣,下面從警務工作視角介紹大數據思維原理。
大數據思維下,“流程”核心轉變?yōu)椤皵祿焙诵?,這是當前IT產業(yè)的變革,計算框架轉變?yōu)橐源髷祿鎯Α⒂嬎銥楹诵牡姆妒?,數據成為智能化的基礎。公安信息化建設也向“數據核心”轉變。過去公安信息系統(tǒng)依靠存儲、數據庫、應用三層傳統(tǒng)的架構,按工作流程構建信息系統(tǒng)?,F在則更關注數據整合利用,綜合利用大數據、云計算、人工智能、物聯網的新技術,在云的框架下實現大數據存儲和計算。
大數據的意義在于“有用”,從數據中獲取知識,基于大數據形成的決策可以為組織創(chuàng)造新的價值。而實現數據轉換為價值需要把業(yè)務問題定義成一個可分析的數據問題,數學上是一個回歸分析問題,是從自變量數據X中找到因變量數據Y之間的關聯,實現從數據到價值的轉變[5]48-53。例如,對某P2P網貸平臺風險進行評估,希望得到價值風險值Y,就需要很多數據X來評估。這些可以被利用的數據包括P2P網站平臺、公司工商信息、法律訴訟、網絡輿情、政府公開信息等多維數據,將一套通過機器學習獲得的或通過經驗構建的計算規(guī)則運用于這些可被觀察的數據,也就實現了從數據到價值的轉換。
從抽樣中得到的結論往往是片面的,數據量越大,更能全面反映客觀事實,得到的結論更接近事實。例如,以前想要知道某條路段的交通擁堵情況,可以抽樣一周路面的車流量數據,再推斷一般路面情況。但是,這個被抽樣的數據不一定能代表整體,可能出現很多不確定性,有可能受其他路段臨時管制影響、受天氣影響等。但現在交管部門具有存儲和處理大數據的能力,可以從年度、月度、周、天、時段等更多維度展示某一路段的交通特征,從更全面的樣本觀察規(guī)律和態(tài)勢。甚至可以將交通信息在地圖上進行動態(tài)展示,這些信息可以有效、有針對性地支撐交通管理決策的制定。
大數據的使用讓關注精度轉變?yōu)殛P注效率。大數據標志著人類在尋求量化和認識世界的道路上前進了一大步,過去很多不可計量、存儲、分析和共享的信息都被數據化了,如聲音、行為等。大數據思維有點像混沌思維,確定與不確定交織在一起,數據的規(guī)律具有高概率、高關聯度的特征,這并不是一種精確的對應關系。例如,挖掘隱性吸毒人員時,如果某些人員出現異常行為,如出入特定場所、從事某些職業(yè)、與吸毒人員來往密切等,挖掘模型會計算出這些人員可能吸毒的概率。只要大數據分析指出可能性,公安機關便可以此為依據做出預警響應。
大數據思維模式下,因果關系轉變?yōu)殛P注相關性。關注相關關系,是指關注數據之間表現出來的關聯性。很多時候可以利用大數據的強關聯性替代因果性,從而快速找到解決問題的方法。例如,英國通過大數據縮小恐怖分子排查范圍??植婪肿悠茐臉O大,也難以監(jiān)控。很多學者都希望可以提前把他們篩選出來,但通過通信、資金往來的監(jiān)控難以找到有效的篩選方法。而英國經濟學家霍斯利通過大數據發(fā)現恐怖分子不買保險,他在傳統(tǒng)的行為監(jiān)測中添加了這個條件,把懷疑范圍大大縮小,警方也根據這一線索抓獲恐怖分子。不能說不買保險的人就是恐怖分子,但大數據表明恐怖分子與購買保險具有強相關性。從這一相關性出發(fā),可以很快找到篩選的方法。大數據的相關性分析可以更快速找到解決問題方案,可以先知道結果,然后再倒推原因,逆向推理也可以建立邏輯關系因果鏈條。
預測是大數據的核心,計算機會將數學算法運用到海量數據上,從而預測事情發(fā)生的可能性。2002年電影《少數派報告》上映的時候,預測犯罪還是科幻電影里的情節(jié)。但是,到了大數據時代,現在越來越多的案例表明犯罪預測成為可能。在洛杉磯,警局就從歷史大量案件的數據中挖掘特征和規(guī)律,來預測犯罪高發(fā)的地區(qū),合理安排警察巡邏。這種大數據分析預測成功地降低了轄區(qū)內的犯罪率,預測警務也成為大數據警務的熱門領域。
大數據讓人找信息轉變?yōu)樾畔⒄胰?。在互聯網的發(fā)展進程中先是人找信息,如通過搜索引擎找到自己所需的信息。但現在很多情況是網絡根據用戶偏好,將信息推送給相應的人,這也是智能交互時代的轉變?!靶畔⒄胰恕本褪峭ㄟ^大數據挖掘,把信息推薦給人。公安領域就是由案情到人的思維方式,通過大數據挖掘出案件線索,再落地到現實中的人。例如,通過監(jiān)測互聯網大數據發(fā)現涉恐線索,再將這些線索與涉恐人員、涉恐事件信息庫比對,落實嫌疑人。
大數據讓人懂機器轉變?yōu)闄C器懂人。以往操作計算機的是專業(yè)人員,而現在即使用戶毫無計算機專業(yè)基礎,仍然可以使用機器。在警務工作中,大數據應用不是抬高技術門檻,讓用戶望而卻步,而是打造更適合用戶的數字化環(huán)境。如警務平臺要減少民警操作步驟,要設計更簡潔清晰的操作界面,要適應警務人員的工作習慣。
在警務視角下,大數據思維是指通過數據化的整體性思維對數據資源、警務模式、犯罪治理、管理決策進行重新審視,以構建多源異構的大數據管理為基礎,通過數據采集、整理、分析研判,從海量數據相關性中快速洞見情報信息,從多維信息中消除不確定性,從而讓數據驅動警務運作的思維方式[2]。推進警務大數據深度應用關鍵要讓大數據思維貫穿于案件偵查、社會治理等警務工作中。從不同的驅動角度分析思維與警務工作融合,典型類型如表1所示。
表1 警務工作中大數據的主要分析類型表
大數據偵查類分析是一種案件驅動的被動分析模式,這也是警務工作中最為常見的分析方法,適合于刑偵、經偵等案件偵查?;诖髷祿尘跋碌膫刹榉治觯枰谵k案過程中結合案件相關信息,依托各類應用系統(tǒng)進行查詢、分析、比對等,從而獲取或挖掘出案件線索,為案件偵查提供方向、思路和方法[9]。由于犯罪活動相關的信息與社會信息相交織,嫌疑人在案前、案中、案后的每一個行為都可能被現代電子產品所記錄下來,關鍵線索信息也隱藏在各類數據中。通過對犯罪嫌疑人遺留在犯罪現場的痕跡物證的搜集,通過現場視頻人像、DNA、指紋、被害人等信息關聯出多種數據。利用大數據思維方法引導,從大數據相關性原理出發(fā)將偵查假設、邏輯推理與數據相結合,依托網絡各類數據資源平臺進行關聯分析,利用大數據多維信息做證據的交叉驗證,用信息找人原理,從數據痕跡確定嫌疑人身份和位置等(如圖3所示)。
圖3 偵查類數據分析范例
大數據治理類分析是以數據驅動的主動分析模式,通過相關性分析、對關鍵元素進行統(tǒng)計分析,可以更有效、更智能、更精準地支持治理決策,適用于社會警務、治安防控等[10][11]。在社會治理方面,通過大數據技術提升公安機關社會治理的智能化水平,包括采用全樣本原理分析事物整體規(guī)律、預測性原理感知風險隱患,主動實現風險預測、犯罪防范等。例如,在服務群眾方面,采用機器懂人的思維原理,通過數據分析有效預測群眾辦事的熱點時間、熱點事務等,科學安排警力,優(yōu)化服務流程。在交通管理方面,通過全樣本原理和預測原理分析交通數據,可以預知交通流量、重點交通區(qū)域與擁堵情況,合理疏導。在社區(qū)治理方面,可以結合常駐人口和流動人口、發(fā)案時間與地點、作案特征等信息做相關性和預測性分析,從而優(yōu)化小區(qū)安防,加強巡邏,加大安全宣傳,預防犯罪發(fā)生(如圖4所示)。
圖4 治理類數據分析范例
大數據目標研判性分析是一種以明確目標為驅動的數據主動分析模式。圍繞某個對象搜集相關大數據,構建行為特征,通過機器學習建立智能預測模型,實現對目標行為的綜合研判、預測、預警[12][13]。這類分析適用于監(jiān)測重點人口、重點行業(yè)、某類犯罪活動等。例如,在重要節(jié)日安保方面,可以通過對各種流量數據進行監(jiān)控,有針對性地加強安保巡邏,提前規(guī)避一些重大公共安全事件的發(fā)生。在重點人口管理方面通過大量行為數據分析,對異動風險進行預測預警。將行為數據與重點人員數據庫相比對,如對涉穩(wěn)群體的異常交通數據實時監(jiān)測,對其行為趨勢進行分析,研判風險級別,提前做好風險應對(如圖5所示)。
圖5 目標研判類數據分析范例
社會已經全面數字化、網絡化,大數據雖然不是萬能的,但在現代社會是不可或缺的。大數據思維原理可以歸納為:引用盡量全面的數據,從多維混雜的數據中進行相關性分析預測。大數據思維是一種可以貫穿人們工作生活,輔助處理問題的能力。從警務工作中數據分析的利用來看,傳統(tǒng)的思維在改進,智能分析化程度在提高。隨著大數據警務的發(fā)展,警務工作也從案件驅動更多轉變?yōu)閿祿寗?、目標驅動;由被動分析轉化為主動分析;由簡單的查詢,轉為大數據關聯分析、模型化智能分析。