●胡曉北 岳書銘
大數(shù)據(jù)(Big Data),又稱為巨量資料,指的是數(shù)據(jù)類別特別大的數(shù)據(jù)集,并且數(shù)據(jù)集無法用傳統(tǒng)數(shù)據(jù)庫工具對其內(nèi)容進行抓取、管理和處理。狹義上來說,大數(shù)據(jù)也指舍棄隨機分析法或抽樣調(diào)查的捷徑,而對可能搜集采用到的所有數(shù)據(jù)進行分析處理。
隨著社會現(xiàn)代信息化步伐的不斷加快,大數(shù)據(jù)正逐步蛻變?yōu)楝F(xiàn)代社會基礎設施的重要組成部分,就像交通、水利、電力和網(wǎng)絡通信一樣不可或缺,并對經(jīng)濟學、政治學、社會學和許多門類科學產(chǎn)生巨大的影響。目前,我國稅收風險管理的重要依據(jù)來自于大量的涉稅數(shù)據(jù),稅收數(shù)據(jù)的采集和利用貫穿稅收風險識別、稅收風險評價等各個環(huán)節(jié),將大數(shù)據(jù)理念引入稅收風險管理,確保數(shù)據(jù)信息的準確、完整、全面,并改變以往的數(shù)據(jù)應用思維,是提升稅務機關風險控制水平,提高稅收征管效率的必由之路。
提高數(shù)據(jù)準入要求,確保數(shù)據(jù)信息準確、完整,是開展大數(shù)據(jù)分析的基礎,海量數(shù)據(jù)的良莠不齊是大數(shù)據(jù)時代進行精確分析的一大難題。同樣,在稅收風險管理過程中,采集的數(shù)據(jù)信息是否準確和完整,直接影響著稅收風險分析的準確度和全面性,進而影響稅收風險處置和稅收風險評價的正確性,如果稅收風險識別所需的信息不完整、不準確,會使稅收風險管理的效率大打折扣。
目前,我國稅務部門釆集的涉稅信息主要來源于稅務機關征收采集和納稅人自行申報,涉稅數(shù)據(jù)信息采集范圍小,納稅申報表及附列資料的內(nèi)容單一。在信息釆集的整個過程中,依靠的主要是納稅人自行填寫,稅務人員的指導很有限,因而納稅人的文化水平直接影響到涉稅數(shù)據(jù)的真實完整性。同時,稅務機關在工作過程中對歷史數(shù)據(jù)的導入、錯誤操作等行為也會產(chǎn)生大量的不規(guī)范數(shù)據(jù)、垃圾數(shù)據(jù)和缺失數(shù)據(jù)。部分辦稅員和管理員對涉稅信息的重要性認識不夠,稅收管理員隊伍老齡化現(xiàn)象較為嚴重,計算機應用水平十分有限,很多時候仍停留在紙上辦公,這與現(xiàn)代稅收征管工作的信息化要求有較大差距。這些不良因素帶來的涉稅數(shù)據(jù)采集不規(guī)范的問題,對涉稅數(shù)據(jù)的分析利用,乃至對征管質(zhì)量都有不利影響,極易引發(fā)稅收風險。在實際工作中,數(shù)據(jù)信息采集不規(guī)范的問題時常發(fā)生,進入稅務機關核心征管系統(tǒng)中,如果查詢納稅人的登記信息,會發(fā)現(xiàn)有些納稅人的注冊資金空白或為0;有的納稅人的身份證號位數(shù)不對,14位、17位身份證號碼大量存在;有的納稅人的經(jīng)營注冊地址不完整,沒有精確到街道門牌號等;有的企業(yè)法人或辦稅人員的聯(lián)系電話要么位數(shù)不對,要么為空,要么可以看出來明顯是編造的,甚至不同的納稅人用同一個電話號碼;除了以上這些納稅人填寫的基礎信息外,其他如車船產(chǎn)權、土地出讓、房屋產(chǎn)權、會計賬簿等附列信息采集也存在各種各樣的問題,這些信息基本上都是空白,沒有按要求填寫,甚至存在納稅人在后期辦理納稅申報時發(fā)現(xiàn)沒有稅種認定信息的現(xiàn)象。
大力推進稅源管理的科學化、精細化進程,要以全面、真實、準確的稅收數(shù)據(jù)信息為基礎。在稅收風險管理的實際工作中,高質(zhì)量的基礎數(shù)據(jù)是工作的前提和關鍵。只有不斷提高基礎數(shù)據(jù)的準確、完整、可靠,才能保證稅收風險識別的精準性,為下一步的稅收風險評價和處置提供堅實可靠的依據(jù)??傮w上看,可以從以下幾個方面努力把握好數(shù)據(jù)質(zhì)量關:一是研究制訂科學合理的數(shù)據(jù)采集標準,提高信息接入質(zhì)量門檻。嚴格的數(shù)據(jù)標準是確定數(shù)據(jù)是否合規(guī)的準則,是進行數(shù)據(jù)相關管理工作的基本規(guī)范要求??茖W合理的數(shù)據(jù)標準對采集規(guī)范信息、錄入系統(tǒng)標準等具有實際操作指導性,有利于加強數(shù)據(jù)信息質(zhì)量管理,也有利于數(shù)據(jù)交換和外部信息共享。當前正在運行的稅源征管信息系統(tǒng)對涉稅信息錄入要求較低,應逐步制定實施全?。ㄊ校┙y(tǒng)一的數(shù)據(jù)采集標準,用于規(guī)范和約束基層稅務機關工作人員的數(shù)據(jù)采集工作。二是完善征管數(shù)據(jù)審核審計子系統(tǒng),建立數(shù)據(jù)審計平臺功能,總結歸納數(shù)據(jù)審計校驗規(guī)則,開發(fā)相應的數(shù)據(jù)審計軟件,加強對已采集數(shù)據(jù)邏輯關系的審核。通過該系統(tǒng)可以對已采集的數(shù)據(jù)進行完整性、全面性和邏輯性進行檢查,包括稅務登記、稅種認定、發(fā)票發(fā)售和驗舊、申報征收、稅務注銷等多個環(huán)節(jié)的數(shù)據(jù)審核,并制定統(tǒng)一數(shù)據(jù)格式標準,指定存放區(qū)域,全過程把好數(shù)據(jù)質(zhì)量關。三是建立涉稅信息質(zhì)量管理長效機制,加強涉稅信息考核管理。稅務機關電子稅務部門應安排專人對信息數(shù)據(jù)進行監(jiān)控,并實行問責機制,將數(shù)據(jù)的準確性和完整性列入績效考核當中,切實引起稅務工作人員的重視。同時,加大對征管信息庫基礎數(shù)據(jù)的維護,及時清理垃圾信息,安排專人負責納稅人涉稅基礎信息的釆集和維護工作,建立電子數(shù)據(jù)信息釆集維護的長效跟蹤機制。
在過去很長一段時間里,準確分析大量數(shù)據(jù)是一種很難完成的挑戰(zhàn),因為記錄、存儲和分析數(shù)據(jù)的信息化工具達不到要求,我們只能采集少量數(shù)據(jù)信息進行分析運用,即使目前突破了條件限制,在過程中仍會自然地將數(shù)據(jù)進行刪減,人為限制了數(shù)據(jù)量的搜集,但大數(shù)據(jù)時代中我們可以處理的數(shù)據(jù)量已經(jīng)大大地增加,全面而龐大的數(shù)據(jù)可以讓我們對事情的看待更為準確和宏觀。同時,我們所處社會的關聯(lián)程度日趨復雜,個體不可能獨立于社會而存在,數(shù)據(jù)的記錄也是全方位全過程的,不存在任何死角,對蛛絲馬跡的線索運用將更為廣泛和普遍。
就目前稅務機關涉稅信息采集來看,普遍存在兩點局限:一是采集信息要求不高,納稅人填寫稅務登記表格時往往只需要填寫部分內(nèi)容,大部分表格都是以空白形式存檔,對涉稅信息采集只求局部,不追求全面;二是采集信息途徑單一,信息來源往往僅限于納稅人本身,以及國稅、地稅、工商、銀行等少數(shù)部門之間簡單的信息交換,而不是實現(xiàn)真正意義上的信息共享。稅收風險管理從本質(zhì)上來講就是對納稅人進行信息采集和審核,如果納稅人有關的所有信息很難采集完整,不利于對納稅人進行風險分析,極易引發(fā)涉稅風險。反之,稅務機關對企業(yè)的生產(chǎn)銷售情況了如指掌,運籌帷幄,將會不再局限于“管中窺豹”。以房地產(chǎn)行業(yè)為例,企業(yè)銷售未完工開發(fā)產(chǎn)品取得的預收收入,應按預計計稅毛利率(15%、10%、5%、3%)分季(或月)計算出預計毛利額,計入當期應納稅所得額。開發(fā)產(chǎn)品完工后,企業(yè)應及時計算結轉(zhuǎn)計稅成本,計算此前銷售收入的實際毛利額,同時將其實際毛利額與其對應的預計毛利額之間的差額,計入當年度企業(yè)的應納稅所得額中。如果房管局的信息可以與稅務機關共享,那么企業(yè)預售房屋收入的準確性就有保障,大大降低少計收入風險;如果國家土地儲備中心的信息可以與稅務機關共享,那么企業(yè)的土地成本就可以準確計算;如果銀行的信息可以與稅務機關共享,那么企業(yè)賬外收入的情況就有跡可查;如果自來水公司、供熱公司、電力公司的信息可以與稅務機關共享,那么企業(yè)配套設施建設費用就能一目了然,等等。
在歐美國家,信息化技術發(fā)展較快,信息采集和共享制度比較完善,稅務機關可以采集利用到比較全面的企業(yè)涉稅信息。如澳大利亞稅務局已經(jīng)建立完善了納稅人的基本信息資料庫,這些數(shù)據(jù)的來源包括進出口管理部門、銀行等金融機構、移民管理部門、股票交易市場、房產(chǎn)土地部門、車管部門等,使得它的風險管理系統(tǒng)能夠運用大量的外部相關信息進行多角度、全方位的綜合性分析,風險評價的準確性得到極大的提高。因此,我國各級政府部門應借鑒國際稅收先進經(jīng)驗,打破部門之間存在的“信息壁壘”,逐步建立以地方政府為主導,各相關部門協(xié)作配合的公共部門信息共享平臺,將住房與城鄉(xiāng)建設委員會、房屋管理局、人民法院、財政局、海關、審計局等政府機關,及銀行、各行業(yè)協(xié)會等機構,包括電視、網(wǎng)絡等新聞媒體吸納進來,制定規(guī)范統(tǒng)一的數(shù)據(jù)交換標準,建立便捷暢通的信息獲取渠道,充分利用電子網(wǎng)絡快速獲取所需的數(shù)據(jù)信息,確保各經(jīng)濟實體的相關涉稅信息都能及時準確地納入稅收風險管理系統(tǒng),為開展稅收風險識別和稅收風險評價提供可靠、有效的信息來源。同時,應不斷提高稅務機關內(nèi)外部信息共享協(xié)作機制的運行效率,達到及時發(fā)現(xiàn)風險、及時處理問題的效果,更好地解決稅收工作中征納雙方涉稅信息不對稱問題。建議政府將第三方信息共享平臺納入各部門目標責任制考核內(nèi)容,防止“自比自劃”的情況發(fā)生,確保責任單位間達成共識,保證數(shù)據(jù)的充分、及時、有效共享。同時,各稅務部門需要狠下力氣,從上至下打破內(nèi)部之間職責相對獨立的弊病,整合辦公系統(tǒng)軟件,對信息采集進行統(tǒng)一規(guī)劃和科學分工,形成一種長效的交流反饋機制,努力拓展和暢通信息獲取渠道,做好稅務系統(tǒng)內(nèi)部信息的比對工作,充分發(fā)揮已有涉稅信息的最大化采集利用。
一直以來,我們總是習慣把提取樣本、分析樣本、制定模型、模型運用等流程,當做分析和解決問題的基本思路。但是通過模型的制定,以部門代表全體的方法只是基于少數(shù)樣本的選取,代表性沒有根本保障,同時該方法的運用也會因為對象個體的差異性而受限,具有一定的局限性。如今,技術環(huán)境已經(jīng)有了很大的改善,在大數(shù)據(jù)時代我們可以對每一個樣本進行分析,制定出針對個體的指標體系,從而進行精細化的監(jiān)督和管理。當然,在某些特定的情況下,我們依然可以使用模板分析法,但它正逐步被“私人定制”散發(fā)出的光芒所掩蓋。
在稅收風險管理工作中,我們期望能夠通過部分企業(yè)的風險管理總結開發(fā)適用于某一行業(yè)或具備某些相同特征的企業(yè)的風險管理模型,對模型的制定往往投入很大的精力,模型建成后又以該模型為樣板,推廣應用到該行業(yè)的風險管理中,并期待著良好的效果,以求達到畢其功于一役的目的。這種以樣本推測總體,以部分代表全部的思維模式,已經(jīng)逐步顯露弊端。同一行業(yè)中的每個企業(yè)都是獨立的個體,出現(xiàn)的問題各不相同,均有其自身的特殊性。以房地產(chǎn)行業(yè)為例,僅其未按預計計稅毛利率確認收入一項,各企業(yè)的處理就存在很多差異:甲公司將預收房屋款項計入其他往來款中,未按計稅毛利率計入當期應納稅所得額;乙公司預售收入2010年仍按15%計稅毛利率計入當期應納稅所得額,而法規(guī)規(guī)定2010年應按25%預征利潤率計算應稅利潤,出現(xiàn)10%的差額未計入企業(yè)所得額;丙公司的情況則是自2004年至今一直按照預計毛利率進行預繳,開發(fā)產(chǎn)品完工后仍未結轉(zhuǎn)成本收入。相比而言,不同的行業(yè)之間則更加沒有可參照性,所得稅法規(guī)定房地產(chǎn)企業(yè)銷售未完工開發(fā)產(chǎn)品取得的收入計入預收賬款,這與其他的行業(yè)企業(yè)的稅務處理有著天壤之別。
前任蘋果公司總裁喬布斯治療癌癥的過程對這種“私人定制”思維在現(xiàn)實生活運用十分具有代表性。醫(yī)生將喬布斯身上所有DNA和腫瘤DNA 進行排序,進而得到了整個基因密碼的數(shù)據(jù)文檔,然后基于他的特定基因組成,按所需的效果有針對性地進行治療。在治療過程中,如果癌癥病變導致所用藥物失效,醫(yī)生就及時更換另一種藥物繼續(xù)救治。雖然最終沒能治愈,卻已將他生命延續(xù)多年,這已然取得了巨大的勝利。同樣的,作為稅務部門,我們所做出的每一個行業(yè)模型不可能完全適用于每一個企業(yè),就像是產(chǎn)生于樣本實驗中的醫(yī)療藥物不一定適用于相同癥狀的病人一樣。我們應該尊重企業(yè)情況的特殊性,在行業(yè)特征的指導下,對所有企業(yè)的信息進行系統(tǒng)分析,制定出適用于該企業(yè)自身的稅收風險管理體系,而不是單單依靠模型中的通用指標測算。假設稅收風險管理工作單純按照某種特定模型去進行工作流程,結果必然會出現(xiàn)因為忽視企業(yè)特殊性的存在而忽視更大的稅收風險點。這就需要我們在稅收風險管理過程中,注重不同企業(yè)的特殊性,考慮到更多的因素,在充分利用大數(shù)據(jù)的情況下尋找更具客觀性、實用性、針對性的數(shù)據(jù)分析方法,樹立更具開創(chuàng)性的數(shù)據(jù)使用理念。