□ 陳曉蕓
最近,李克強總理在浙江考察時,對浙江省公共信用信息平臺給予了高度的評價。信用數據是建設公共信用信息平臺的基礎,離開數據,信息平臺便成無源之水、無本之木。信用數據質量好壞直接影響信用檔案的質量狀況,影響信用信息的共享互通,影響信用評價的準確性和客觀性,最終影響信用應用的順利開展。因此,加強信用數據質量管理,開展信用數據質量評價,將其作為數據管理的手段倒逼數據質量的提升,十分有必要。
公共信用信息歸集的特點是只負責整合各數據源頭部門的信用信息,不修改各部門提供的信息內容,確保信用數據真實有效并可追溯。開展信用數據質量評價的目標是對省級部門和市、縣(市、區(qū))信用數據報送質量進行評價,并把相應評價結果反饋給數源部門,從源頭上提高數據質量。
在實際公共信用信息歸集過程中,各信息來源部門提供的數據在完整性、有效性、及時性等方面存在質量參差不齊的問題。從完整性看,較常見的問題是缺失唯一識別碼和關鍵字段。缺失唯一識別碼即缺失統(tǒng)一社會信用代碼或身份證號碼,對信息清洗比對帶來難度,容易造成主體的信息遺漏;缺少關鍵字段即缺少反映信息實質內容的必要字段,如不良信息、榮譽記錄信息時間字段缺失或不完整等。從有效性看,常見的問題是歸集的公共信用數據字段類型、字段長度等格式不符合國家或浙江已有的規(guī)范標準,無法通過入庫的規(guī)范化校驗。從時效性看,較常見的問題是數源部門未根據公共信用信息目錄更新周期的要求及時更新信息,無法動態(tài)反映主體的真實信用狀況。
針對上述問題,積極開展信用數據質量評價,讓部門了解自身數據問題,切實加強質量管控,是提升社會信用建設水平的有效手段。從完整性、時效性、有效性等三個方面存在的癥結著手,借鑒其它省市信用數據質量管理經驗,基于可操作性原則,可設置如下五方面評價指標:
一是主體唯一識別碼覆蓋率。用以評價部門或地方所提供信息記錄是否包含統(tǒng)一社會信用代碼或自然人身份證號碼,可通過有主體唯一識別碼的記錄條數與所提供信息的總記錄條數比率獲取測評值。
二是必填字段覆蓋率。用以評價部門或地方所提供信息的重要字段是否完整填報,可通過完整填報必填字段的記錄條數和總記錄條數比率獲取測評值,單條信息記錄的必填項均完整填報的計為1條。
三是信息準確率。用以評價部門或地方所提供信息記錄的數據內容是否符合系統(tǒng)定義的數據類型、長度、格式、取值范圍或邏輯關系等,可通過邏輯校驗的記錄條數與總記錄條數比率獲取測評值,單條信息記錄所有數據項內容均通過邏輯校驗的計為1條。
四是信息更新率。用以評價部門或地方是否在規(guī)定周期內及時更新信息,可通過及時更新的信息項條數與該部門或地方報送信息項總條數的比率獲取測評值。及時更新的信息項條數計算規(guī)則分為兩種情況:一種為生成周期為年度、半年、季度、月度的這類定期信息,通過計算檢查當日和最近一次更新日期的時間間距,與更新周期值進行比較,以確定該信息記錄是否做到及時更新。若時間間距小于或等于周期值的視為該信息項已及時更新,若大于周期值的視為該信息項未及時更新。第二種情況為生成周期為不定期或實時的信息,默認己更新,若通過抽查或例證發(fā)現,該信息項沒有做到及時更新的,則不計入更新條數。
五是信息覆蓋面。用以評價部門或地方是否提供其產生的規(guī)定信息項的全部信用信息,可通過數據庫比對進行驗證。此項評價指標作為附加指標,不列入評價總分權重分配,作為抽查或例證的扣分項。
在實際工作中,遇到的數據問題更加錯綜復雜,信用數據質量評價需在實踐當中不斷動態(tài)調整與完善,在評價中不斷發(fā)現問題與解決問題,并配套針對性的制度與管理辦法,才能長效地提升信用數據的質量。