傅瑤
(福建省星云大數(shù)據(jù)應(yīng)用服務(wù)有限公司 福建省福州市 350025)
隨著政務(wù)信息化建設(shè)和產(chǎn)業(yè)數(shù)字化的有序推動,海量的政務(wù)數(shù)據(jù)呈指數(shù)級增長,這些源源不斷增長的數(shù)據(jù)資源蘊含豐富的應(yīng)用價值,但目前數(shù)據(jù)的應(yīng)用還停留在表層,有待深入挖掘。2020年4月,中共中央、國務(wù)院印發(fā)《關(guān)于構(gòu)建更加完善的要素市場化配置體制機制的意見》中提出,要加快培育數(shù)據(jù)要素市場,推進政府數(shù)據(jù)開放共享,提升社會數(shù)據(jù)資源價值,加強數(shù)據(jù)資源整合和安全保護在社會管理、應(yīng)急管理、資源調(diào)配等方面更好發(fā)揮作用。政務(wù)數(shù)據(jù)資產(chǎn)價值的深入挖掘應(yīng)用越發(fā)重要,是實現(xiàn)數(shù)據(jù)多跑腿群眾少跑路、政府監(jiān)管和社會治理模式轉(zhuǎn)型的重要推動力,關(guān)系民生百態(tài)。
本文通過對住房城鄉(xiāng)建設(shè)行業(yè)政務(wù)數(shù)據(jù)應(yīng)用的現(xiàn)狀分析,基于目前多源數(shù)據(jù)融合打通的現(xiàn)狀,探索如何實現(xiàn)數(shù)據(jù)融合的深入應(yīng)用。具體以施工風險評估細分領(lǐng)域為研究對象,通過數(shù)據(jù)建模分析,輸出施工企業(yè)風險評估應(yīng)用,評估結(jié)果應(yīng)用于施工企業(yè)的分類監(jiān)管,實現(xiàn)監(jiān)管的前置和預(yù)判,也為跨部門間的協(xié)同監(jiān)管和執(zhí)法提供數(shù)據(jù)支持,助力住建行業(yè)具體業(yè)務(wù)的監(jiān)管逐步從粗放型向精細化、精準化轉(zhuǎn)變,從被動響應(yīng)向主動預(yù)見轉(zhuǎn)變,從經(jīng)驗判斷向大數(shù)據(jù)科學決策轉(zhuǎn)變,提升市場監(jiān)管效能。
中國政務(wù)大數(shù)據(jù)的發(fā)展歷經(jīng)三個階段:2010年以前是以三金工程為代表的信息化建設(shè);2011-2016年步入大數(shù)據(jù)平臺建設(shè)和數(shù)據(jù)整合,各級政府主導(dǎo)搭建了大量平臺;2017年至今,數(shù)據(jù)資產(chǎn)管理和應(yīng)用成為新主題。近年來,國家高度重視并不斷完善大數(shù)據(jù)政策支撐,圍繞國家政策,各大部委和相關(guān)行業(yè)管理機構(gòu)、各省市也陸續(xù)出臺了相關(guān)政策以促進大數(shù)據(jù)在各領(lǐng)域的深入應(yīng)用,政務(wù)數(shù)據(jù)應(yīng)用將逐步向“大監(jiān)管大服務(wù)”方向邁進,用以實現(xiàn)更精準高效的監(jiān)管和更便捷深入的服務(wù)。住房城鄉(xiāng)建設(shè)工作事關(guān)經(jīng)濟社會發(fā)展全局,2019年,全國宜居環(huán)境建設(shè)完成投資約2980 億元,占基礎(chǔ)設(shè)施投資近三分之一,建筑業(yè)、房地產(chǎn)業(yè)增加值占全省GDP 的比重約為13%。住房城鄉(xiāng)建設(shè)部門肩負著統(tǒng)籌城鄉(xiāng)規(guī)劃管理,指導(dǎo)全國住宅建設(shè)和住房制度改革,監(jiān)督管理建筑市場、建筑安全和房地產(chǎn)市場的重要職能,關(guān)系到民生保障和社會穩(wěn)定。住建行業(yè)信息化大力推進始于2016年國家出臺《住房城鄉(xiāng)建設(shè)部關(guān)于印發(fā)2016-2020年建筑業(yè)信息化發(fā)展綱要的通知》(建質(zhì)函〔2016〕183 號),后各省住建部門相繼出臺行業(yè)信息化總體規(guī)劃,并啟動行業(yè)大數(shù)據(jù)平臺建設(shè)。截至目前,各省住建部門已基本建設(shè)完成部門數(shù)據(jù)平臺,也通過各省級統(tǒng)一的政務(wù)數(shù)據(jù)匯聚共享類平臺,初步實現(xiàn)了與公安、市監(jiān)、國土、民政等相關(guān)行業(yè)主管部門的數(shù)據(jù)對接和共享。
圖1
立足住建行業(yè),數(shù)據(jù)應(yīng)用領(lǐng)域還存在三方面普遍性的不足:一是行業(yè)內(nèi)部業(yè)務(wù)協(xié)同不足。由于住建類行政許可(公共服務(wù))事項的審批標準復(fù)雜,企業(yè)(個人)需要提交的申請材料多、內(nèi)容雜、數(shù)據(jù)量大,行業(yè)信息系統(tǒng)缺乏統(tǒng)一的數(shù)據(jù)標準和技術(shù)規(guī)范,導(dǎo)致信息系統(tǒng)之間難以互聯(lián)互通,“煙囪”和“孤島”現(xiàn)象仍然存在,業(yè)務(wù)協(xié)同程度不高,與“放管服”改革的要求和“全程網(wǎng)辦”、“最多跑一次”的網(wǎng)上政務(wù)服務(wù)目標還存在較大差距;二是行業(yè)內(nèi)部數(shù)據(jù)資源開發(fā)水平不高。行業(yè)各業(yè)務(wù)部門積累了大量數(shù)據(jù),涉及的行業(yè)多、業(yè)務(wù)廣、鏈條長,數(shù)據(jù)匯聚整合和共享應(yīng)用的程度較低,一些重要的核心數(shù)據(jù)資源開發(fā)利用滯后,數(shù)據(jù)共享和綜合應(yīng)用水平不高,甚至出現(xiàn)數(shù)據(jù)“打架”的現(xiàn)象,還不能為行業(yè)監(jiān)管、公共服務(wù)和科學決策提供有效支撐;三是外部數(shù)據(jù)融合應(yīng)用深度不足。雖與公安、市監(jiān)、國土、民政等相關(guān)行業(yè)主管部門的數(shù)據(jù)實現(xiàn)對接和共享,但數(shù)據(jù)應(yīng)用主要還是停留在住建行業(yè)內(nèi)部系統(tǒng)整合、入口整合、可視化展示、內(nèi)部統(tǒng)計分析等表層應(yīng)用階段,行業(yè)細分領(lǐng)域與外部數(shù)據(jù)融合應(yīng)用深度不足,行業(yè)數(shù)據(jù)資源價值未能有效挖掘,未能實現(xiàn)對具體業(yè)務(wù)的有效支撐,從本質(zhì)上實現(xiàn)治理模式轉(zhuǎn)變的目標還未實現(xiàn)。
具體在施工安全監(jiān)管這一細分領(lǐng)域,近些年施工安全與質(zhì)量問題仍然高發(fā)并且還在持續(xù)上升,根據(jù)《住房城鄉(xiāng)建設(shè)部關(guān)于2019年房屋市政工程生產(chǎn)安全事故情況的通報》顯示,2019年全國共發(fā)生房屋市政工程生產(chǎn)安全事故773 起、死亡904 人,與2018年相比分別上升5.31%和7.62%。2020年3月,福建泉州欣佳酒店坍塌安全生產(chǎn)責任事故暴露出地方有關(guān)方面安全生產(chǎn)監(jiān)管責任不落實,造成安全風險隱患的漏洞和盲區(qū),監(jiān)管手段落后,成效低下等問題,“安全標語寫得好,實際監(jiān)察確很少”的現(xiàn)象在全國普遍存在。
政務(wù)大數(shù)據(jù)的價值體現(xiàn),歸根結(jié)底還是要基于行業(yè)應(yīng)用的,本文以住建行業(yè)數(shù)據(jù)應(yīng)用為研究目標,圍繞行業(yè)的特定業(yè)務(wù)場景,探索政務(wù)數(shù)據(jù)價值挖掘分析和綜合應(yīng)用的有效措施??紤]到工程施工安全是住建行業(yè)發(fā)展的基本保障,針對施工安全與質(zhì)量問題仍然高發(fā),因信息單一導(dǎo)致的承攬工程安全風險無法預(yù)判,針對施工企業(yè)安全評估的政務(wù)大數(shù)據(jù)應(yīng)用較少的現(xiàn)狀,具體以施工安全監(jiān)管這一細分領(lǐng)域為例,基于存量的多源數(shù)據(jù)資源,構(gòu)建出施工企業(yè)風險評估模型,實現(xiàn)基于大數(shù)據(jù)應(yīng)用條件下施工安全的分類監(jiān)管、預(yù)警和預(yù)判,目標是降低工程事故風險,提升住建行業(yè)服務(wù)品質(zhì)、綜合治理能力和科學決策水平。
研究主體為福建省住房和城鄉(xiāng)建設(shè)廳,應(yīng)用建模選擇目標群體為在福建省市場監(jiān)督管理局注冊,福建省住建廳登記的施工企業(yè)。省住建廳己開發(fā)運行了50 套信息系統(tǒng),信息資源歸集涵蓋企業(yè)管理、人員管理、工程管理、信用管理、住房管理、城鄉(xiāng)管理6 大類業(yè)務(wù)領(lǐng)域69 小類業(yè)務(wù)數(shù)據(jù)庫,系統(tǒng)服務(wù)住建行業(yè)約3.5 萬家企業(yè),各類從業(yè)人員100 多萬,總共累積了約7.32T 的數(shù)據(jù)量。2018年開始,依托福建省政務(wù)數(shù)據(jù)匯聚共享平臺,實現(xiàn)了公安、市監(jiān)、水利、國土等跨部門的相關(guān)外部數(shù)據(jù)接入,對外共享了住建企業(yè)信息工程信息、住房配置信息、從業(yè)人員信息、注冊人員信息內(nèi)部數(shù)據(jù)。
如圖1所示。
3.3.1 明確數(shù)據(jù)需求
內(nèi)部數(shù)據(jù):省住建廳內(nèi)部業(yè)務(wù)應(yīng)用系統(tǒng)的數(shù)據(jù),包括房地產(chǎn)信息管理信息系統(tǒng)、施工企業(yè)新增綜合信用評價系統(tǒng)、建設(shè)工程責任主體不良記錄“黑名單”管理系統(tǒng)等。
外部數(shù)據(jù):省住建廳外部相關(guān)部門的數(shù)據(jù),包括省市場監(jiān)督管理局(企業(yè)基本登記信息、企業(yè)年度報告情況、股東信息)、省公安廳(榮譽信息、行政處罰信息)等。
3.3.2 數(shù)據(jù)獲取
外部數(shù)據(jù)通過福建省政務(wù)數(shù)據(jù)匯聚平臺獲取,將省住建廳業(yè)務(wù)數(shù)據(jù)庫和福建省政務(wù)數(shù)據(jù)匯聚共享平臺數(shù)據(jù)抽取到數(shù)據(jù)資源中心,形成貼源庫。最終提取的政務(wù)數(shù)據(jù)包括注冊資本、成立時間、總資本、總負債、總收入、總利潤、凈利潤、企業(yè)性質(zhì)、資質(zhì)等級、不良行為次數(shù)、黑名單上榜次數(shù)、處罰次數(shù)、懲戒次數(shù)、外部信用評價分數(shù)以及安全事故發(fā)生次數(shù)。
3.3.3 數(shù)據(jù)預(yù)處理
按照應(yīng)用需求,對獲取的政務(wù)數(shù)據(jù)進行包括數(shù)據(jù)清洗、比對、格式轉(zhuǎn)換、脫敏、重構(gòu)的預(yù)處理,存儲建立基礎(chǔ)數(shù)據(jù)庫。
3.3.4 特征變量選取
對數(shù)據(jù)資源進行相關(guān)性分析,分析各個變量對于模型的重要程度,選取建模應(yīng)用的特征變量,從而為后續(xù)業(yè)務(wù)建模奠定基礎(chǔ)。首先,從企業(yè)基本信息、資質(zhì)信息、信用行為3 大維度選取訓練的特征變量,即從上述獲取的政務(wù)數(shù)據(jù)中的注冊資本、成立時間、總資本、總負債、總收入、總利潤、凈利潤、企業(yè)性質(zhì)、資質(zhì)等級、不良行為次數(shù)、黑名單上榜次數(shù)、處罰次數(shù)、懲戒次數(shù)以及外部信用評價分數(shù)等特征變量中選取自變量,上述政務(wù)數(shù)據(jù)中的安全事故發(fā)生次數(shù)作為因變量;而后,利用二維列聯(lián)表對所述自變量與因變量進行相關(guān)性分析,得到相關(guān)性最大的n 個自變量,即對企業(yè)安全事故發(fā)生次數(shù)影響最大;最后,得到影響企業(yè)安全事故發(fā)生次數(shù)的自變量主要與信用行為維度相關(guān),即與不良行為次數(shù)、黑名單上榜次數(shù)、處罰次數(shù)、懲戒次數(shù)、外部信用評價分數(shù)等特征變量緊密相關(guān)。
3.3.5 創(chuàng)建風險評估模型
基于以上選取的特征變量,創(chuàng)建風險評估模型:
安全事故發(fā)生概率=1/(1+exp(a+b1*自變量1+b2*自變量2+…+bn*自變量n));
其中a 和bn 均表示回歸系數(shù);自變量n 為不良行為次數(shù)、黑名單上榜次數(shù)、處罰次數(shù)、懲戒次數(shù)、外部信用評價分數(shù)中的一個。
將上述變量及模型輸入SPSS 軟件中,應(yīng)用logistic 回歸模型和線性回歸模型進行模型訓練,經(jīng)過比較,線性回歸模型能較好地解釋各自變量對因變量的影響。實際得到的風險評估模型為:
發(fā)生安全事故的概率=1/(1+exp(0.642+0.079*不良行為次數(shù)+0.447*處罰次數(shù)+0.21*黑名單上榜次數(shù)+0.188*懲戒次數(shù)-0.007*外部信用評分))。
考慮到最終輸出的為發(fā)生安全事故的概率,通過歸一化處理,將所得結(jié)果映射為0~1200 的分數(shù)。
3.3.6 風險評估應(yīng)用
利用訓練后的風險評估模型對企業(yè)風險進行評估,首先,計算每家建筑業(yè)企業(yè)的“發(fā)生安全事故的概率”;其次,通過(1-概率)*1200 得到基準分。由于存在信息缺失,需要平衡一些企業(yè)由于信息缺失而無法獲得真實的不良行為、處罰、懲戒等信息,對于能匹配到建筑證和施工安全證的企業(yè)進行分加分,其中建筑證一、二、三、四級分別對應(yīng)加200 分、150 分、100 分、50 分,施工安全證對應(yīng)加50 分,最終計算得到企業(yè)風險評估分數(shù),將分數(shù)折算成A-E 五個等級,A、B 等級的企業(yè)風險系數(shù)較低,D、E 等級的企業(yè)風險系數(shù)較高。經(jīng)過模型應(yīng)用,省住建廳登記的施工企業(yè)總共17969 家,其中A 級311 家,B 級1634 家,C 級16010 家,D 級11 家,E 級3 家。針對不同的等級,省住建廳,聯(lián)合相關(guān)業(yè)務(wù)監(jiān)管部門,制定分類監(jiān)管方案,實行差別化、動態(tài)化管理,突出重點、提升監(jiān)管效能。
基于存量的多源數(shù)據(jù)資源,通過創(chuàng)建風險評估模型,應(yīng)用于施工企業(yè)的分類監(jiān)管、精準監(jiān)管,探索“治未病”的事前風險監(jiān)管機制,形成支撐部門具體業(yè)務(wù)的數(shù)據(jù)體系,助力住建部門實現(xiàn)監(jiān)管轉(zhuǎn)型,讓數(shù)據(jù)與業(yè)務(wù)真正融合,同時能夠?qū)⑸婕暗狡渌O(jiān)管部門的風險信息實現(xiàn)共享,形成協(xié)同監(jiān)管、聯(lián)合執(zhí)法的效果。
本案例針對施工安全監(jiān)管細分領(lǐng)域開展數(shù)據(jù)應(yīng)用研究,研究成果力爭在政務(wù)服務(wù)、住房租賃、房地產(chǎn)市場監(jiān)測等其他住建行業(yè)核心業(yè)務(wù)領(lǐng)域?qū)崿F(xiàn)借鑒意義,探索建設(shè)創(chuàng)新型應(yīng)用。伴隨著住建行業(yè)大數(shù)據(jù)資源中心的深入建設(shè)、跨部門政務(wù)數(shù)據(jù)的進一步打通,數(shù)據(jù)資源的增長速度將超過預(yù)期,數(shù)據(jù)價值挖掘應(yīng)用的速度亟需跟上腳步,通過應(yīng)用過程積累的動態(tài)數(shù)據(jù)反哺行業(yè)大數(shù)據(jù)資源中心,方可實現(xiàn)“業(yè)務(wù)通、流程通、數(shù)據(jù)通”。在宏觀層面為因城施策、分類調(diào)控政策制定提供數(shù)據(jù)支撐,提升住建管理部門的決策分析能力;在微觀層面事前監(jiān)測各類違法違規(guī)行為,提升行業(yè)監(jiān)管的精準性和有效性。從而構(gòu)建基于大數(shù)據(jù)應(yīng)用條件下的縱向協(xié)調(diào)、橫向配合、快速反應(yīng)的監(jiān)管體系。