倪可 鐘山河 王斐
【摘要】? 信息化、互聯(lián)網(wǎng)、物聯(lián)網(wǎng)的發(fā)展推動了大數(shù)據(jù)時代的到來。大數(shù)據(jù)時代信息技術(shù)發(fā)展的巨大變革深刻影響著社會發(fā)展的方方面面,同樣也對財務(wù)分析產(chǎn)生了積極影響。文章通過對大數(shù)據(jù)及其對財務(wù)分析的影響進(jìn)行研究,提出了相應(yīng)的應(yīng)對策略,以期對財務(wù)分析工作提供借鑒和思考。
【關(guān)鍵詞】? ?大數(shù)據(jù);財務(wù)分析;數(shù)據(jù)挖掘
【中圖分類號】? F232? 【文獻(xiàn)標(biāo)識碼】? A? 【文章編號】? 1002-5812(2020)10-0106-03
財務(wù)分析在企業(yè)管理中的作用至關(guān)重要,為企業(yè)經(jīng)營提供了決策依據(jù),為改善企業(yè)管理提供了支持。財務(wù)分析具有完整的理論體系和專門的技術(shù)方法。大數(shù)據(jù)勢必會對財務(wù)分析產(chǎn)生影響,對財務(wù)分析人員提出新的要求和挑戰(zhàn)。
一、大數(shù)據(jù)的特點、產(chǎn)生和大數(shù)據(jù)技術(shù)
(一)大數(shù)據(jù)的特點。大數(shù)據(jù)(Big Data)是需要采用新的處理方法和工具才能高效收集、處理、儲存和分析的信息資產(chǎn),具有“5V”的特點。Velocity是指數(shù)據(jù)被生成、收集和處理的速度極快。Volume是指數(shù)據(jù)量宏大,對傳統(tǒng)的數(shù)據(jù)儲存、分析和統(tǒng)計推斷等帶來了巨大挑戰(zhàn)。Value是指數(shù)據(jù)集的價值極高,但是價值密度極低。Variety是指數(shù)據(jù)種類極多,包括文本、語音、圖片、視頻、數(shù)值等。Veracity是指數(shù)據(jù)的可靠性,因數(shù)據(jù)的來源極多,數(shù)據(jù)的質(zhì)量可能良莠不齊,因此,需要關(guān)注數(shù)據(jù)集在生成的過程中有沒有統(tǒng)計偏倚、數(shù)據(jù)集是否有缺失值等問題。
(二)大數(shù)據(jù)的產(chǎn)生。隨著人類社會信息化進(jìn)程的加快和對互聯(lián)網(wǎng)依賴性的增加,人類在日常生產(chǎn)和生活中都會產(chǎn)生大量數(shù)據(jù),如社交媒體(如點贊、評論、轉(zhuǎn)載和視頻上傳等)、交易系統(tǒng)(包括網(wǎng)購記錄、單據(jù)和收件回條等)、政務(wù)系統(tǒng)、辦公系統(tǒng)、自動化系統(tǒng)、財務(wù)系統(tǒng)等。近年來,物聯(lián)網(wǎng)的發(fā)展更是推動了數(shù)據(jù)量的躍升。物聯(lián)網(wǎng)中的溫度感知器、濕度感知器、壓力傳感器等感知器以及視頻監(jiān)控器,每時每刻都會自動產(chǎn)生大量數(shù)據(jù),促使人類社會迅速進(jìn)入大數(shù)據(jù)時代。
(三)大數(shù)據(jù)技術(shù)。大數(shù)據(jù)技術(shù)是指伴隨著大數(shù)據(jù)的采集、存儲、分析和應(yīng)用的相關(guān)技術(shù),是使用非傳統(tǒng)工具對大量的結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行處理,從而獲得分析和預(yù)測結(jié)果的一系列數(shù)據(jù)處理和分析技術(shù)。當(dāng)下最受歡迎的基礎(chǔ)技術(shù)包括數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理(包括缺失值處理等)、分布式存儲(Apache Hadoop)、NOSQL(Not Only SQL)數(shù)據(jù)庫、數(shù)據(jù)倉庫、機(jī)器學(xué)習(xí)(各類計算統(tǒng)計學(xué)算法)、并行計算(Apache Spark,MapReduce等)、數(shù)據(jù)可視化(包括制圖)等各種范疇和不同層面的技術(shù)。Python語言的Pandas(數(shù)據(jù)結(jié)構(gòu)與處理)、NumPy(高性能計算)、Scikit-learn(回歸問題、聚類分析問題)、TensorFlow(深度學(xué)習(xí)、規(guī)律尋找)、Pytorch(深度學(xué)習(xí)、人工智能)、Matplotlib(繪圖)等庫是相當(dāng)實用的工具;而且,Python還可以兼容Hadoop MapReduce,使得解決復(fù)雜的大數(shù)據(jù)問題變得輕松。其他受歡迎的工具還包括R語言(dplyr,ggplot2)和MATLAB等。
(四)大數(shù)據(jù)的工作流程。
1.數(shù)據(jù)預(yù)處理。在現(xiàn)實生活中,剛剛獲取的數(shù)據(jù)集往往是不完整的:一是表格中數(shù)據(jù)缺失(Missing Value),如有一些單元格中的數(shù)據(jù)為空。二是未正確標(biāo)注種類數(shù)據(jù)(Categorical/Ordinal Data),例如一張調(diào)查問卷中的某一個問題給出的滿意程度為1—5,而回答5的人的滿意程度顯然不是回答1的人的5倍,這種情況下進(jìn)行機(jī)器學(xué)習(xí)會導(dǎo)致模型產(chǎn)生統(tǒng)計偏倚。三是數(shù)據(jù)集的值有錯誤,例如在年齡一欄錄入了負(fù)數(shù)等。四是數(shù)據(jù)集有重復(fù)值(Duplicate),會導(dǎo)致在機(jī)器學(xué)習(xí)過程中賦予同一個解釋變量更大的權(quán)重,從而“稀釋”了其他潛在的重要解釋變量被發(fā)現(xiàn)的可能性。這些不完整、不一致、不正確的數(shù)據(jù)常常會導(dǎo)致錯誤的結(jié)論,因此,數(shù)據(jù)科學(xué)家在獲取一個數(shù)據(jù)集后,通常需要進(jìn)行大量的數(shù)據(jù)預(yù)處理。其中,處理數(shù)據(jù)集中的缺失值通常是數(shù)據(jù)預(yù)處理的一個重要環(huán)節(jié),常用的有三種方法:棄用、鍵入、標(biāo)示。
棄用的方法最為簡單直觀。如果一個解釋變量(列)中有較少的隨機(jī)缺失值(沒有規(guī)律的,因為值缺失的規(guī)律也是可關(guān)注點之一),則可以考慮棄用有缺失值的觀測值(排)。如果一個解釋變量中有過多的隨機(jī)缺失值,那么可以考慮刪除該解釋變量。
刪除和棄用不可避免地會導(dǎo)致信息的丟失,因此,數(shù)據(jù)科學(xué)家可以采用在有缺失值的單元格中鍵入一個插入值的方法。插入值的選擇方法有很多種:第一種方法也是最樸素的方法是插入統(tǒng)計學(xué)中的平均值、中值等。通常來說,在正態(tài)(無偏態(tài))的數(shù)據(jù)集中鍵入平均值表現(xiàn)良好,在有偏態(tài)的數(shù)據(jù)集中鍵入中值更加穩(wěn)健(Robust),因為中值不容易受到離群值的影響。第二種方法是(線性)回歸插值。這種方法是將缺失值設(shè)為反應(yīng)變量,將其他現(xiàn)有數(shù)據(jù)設(shè)為解釋變量,然后通過擬合的回歸模型,用已有的數(shù)據(jù)來預(yù)測缺失值。第三種方法是熱卡法,也就是將缺失值替換成相似的觀測中的值。常用的方法有將數(shù)據(jù)按照某些特定屬性進(jìn)行分層后鍵入缺失值、kNN(k最鄰近算法)等。
標(biāo)示法比簡單的刪除法和棄用法損失的信息少,但是在鍵入缺失值時,信息也不可避免地會有所損失。因此,將缺失值單獨標(biāo)示出來,可以獲得值為什么缺失的規(guī)律,這也是使用標(biāo)示法的初衷。例如,可以考慮將所有缺失值替換成一個值(比如0)來代表缺失,然后在繪制概率分布和計算統(tǒng)計數(shù)值時將其忽略。對于分類數(shù)據(jù),則可以多加一類“缺失”來代表單元格中存在的缺失值。
2.機(jī)器學(xué)習(xí)。通常來說,如果完成了數(shù)據(jù)預(yù)處理,數(shù)據(jù)分析就完成了一大半。在處理大數(shù)據(jù)問題時,在嘗試復(fù)雜模型和方法之前,應(yīng)該先嘗試線性回歸、邏輯回歸(通常用于分類問題,本質(zhì)還是回歸算法)、決策樹等這些基礎(chǔ)模型,將其作為基線,以避免先試用繁瑣的方法卻沒能帶來更好的結(jié)果。
由于模型越來越多,模型的選擇也變得越來越困難;如果選擇的模型不夠好,就需要重新選擇模型和訓(xùn)練模型,尤其是在處理大數(shù)據(jù)問題上,往往需要相當(dāng)?shù)臅r間和精力。如果用很少的嘗試就選出合適的模型,就可以省下很多時間;尤其是對于重要的規(guī)律來說,如果能夠盡早發(fā)現(xiàn)可能會給公司帶來更多價值。只不過,數(shù)據(jù)科學(xué)家只有經(jīng)過不停試錯、反復(fù)嘗試,才能獲得選出合適模型的能力。
3.統(tǒng)計推斷。統(tǒng)計推斷和得出結(jié)論是最為重要的一個步驟,但通常來說這個步驟比較簡單。在擬合模型后,可以使用極大似然估計(MLE)和檢驗統(tǒng)計量來做假設(shè)檢驗;也可以通過檢驗統(tǒng)計量的分布來做假設(shè)下的置信區(qū)間。因為大部分檢驗統(tǒng)計量都是現(xiàn)成的,做統(tǒng)計推斷不僅需要統(tǒng)計學(xué)和數(shù)據(jù)科學(xué)的知識,常識和專業(yè)知識也是非常重要的,因此,數(shù)據(jù)科學(xué)家可以與專業(yè)人士合作,共同理解模型得出的結(jié)果。
(五)大數(shù)據(jù)分析的局限性。值得注意的是,統(tǒng)計推斷只能得出證據(jù)來拒絕一個假設(shè),而不能得出證據(jù)來證明一個假設(shè)。而且,得出的證據(jù)是統(tǒng)計顯著性,統(tǒng)計顯著性代表相關(guān)性,不能直接用來證明因果關(guān)系。因此,在需要證明因果關(guān)系的情況下,經(jīng)過合理設(shè)計的實驗的數(shù)據(jù)分析可能比大數(shù)據(jù)分析的價值更高。
二、大數(shù)據(jù)對財務(wù)分析的影響
大數(shù)據(jù)具有數(shù)據(jù)量大、數(shù)據(jù)類型多樣、產(chǎn)生迅速、價值高但密度低的特征,本文試分析其對財務(wù)分析的數(shù)據(jù)來源、分析方法、分析內(nèi)容、分析結(jié)果等方面產(chǎn)生的影響。
(一)數(shù)據(jù)來源方面的影響。傳統(tǒng)的財務(wù)分析數(shù)據(jù)主要來源于內(nèi)部財務(wù)賬表以貨幣計量的結(jié)構(gòu)化數(shù)據(jù)。大數(shù)據(jù)時代,財務(wù)分析數(shù)據(jù)的來源除了內(nèi)部財務(wù)賬表以貨幣計量的結(jié)構(gòu)化數(shù)據(jù)外,還有各類非結(jié)構(gòu)化數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)等,并且可用的外部數(shù)據(jù)也越來越多。
(二)分析方法方面的影響。財務(wù)分析的方法有很多種,主要包括趨勢分析法、比率分析法、因素分析法。傳統(tǒng)財務(wù)分析以企業(yè)內(nèi)部數(shù)據(jù)對比分析(縱向?qū)Ρ确治觯橹?,橫向?qū)Ρ确治鲇捎诳扇〉耐獠繑?shù)據(jù)受限而較少采用。在大數(shù)據(jù)時代,由于大數(shù)據(jù)處理方法的應(yīng)用,尤其是數(shù)據(jù)挖掘技術(shù)、爬蟲技術(shù)等,使得獲取外部數(shù)據(jù)變得容易,因而橫向?qū)Ρ确治鲆沧兊酶鼮槿菀住?/p>
傳統(tǒng)財務(wù)分析偏重于因果分析,遵循從結(jié)果到原因的分析思路。比如,對于利潤變化,通常會從利潤變化了這一結(jié)果查找原因,如收入、成本、費用等是否發(fā)生變化,如圖1所示。
大數(shù)據(jù)時代的財務(wù)分析偏重于相關(guān)分析,即從某一相關(guān)事務(wù)的變化去分析另一相關(guān)事務(wù)是否發(fā)生變化,如沒有變化或者變化不合常規(guī),再分析其影響因素,以解釋沒有變化或者變化不合常規(guī)是否合理。比如,由于收入變化了,因此分析利潤是否發(fā)生變化,如果利潤沒有變化或者變化不合常規(guī),那么再分析成本、費用是否發(fā)生變化,并通過分析成本、費用變化是否合理來判斷利潤沒有變化或變化不合常規(guī)是否合理,如下頁圖2所示。
傳統(tǒng)財務(wù)分析以事后分析為主,往往是對已經(jīng)報賬、記賬的財務(wù)數(shù)據(jù),即已經(jīng)發(fā)生的財務(wù)數(shù)據(jù)進(jìn)行分析,不能對未報賬、未記賬或者事前、事中即將發(fā)生的財務(wù)數(shù)據(jù)進(jìn)行分析。大數(shù)據(jù)時代,因為數(shù)據(jù)分析以相關(guān)性為主,財務(wù)分析將以過程分析為主、結(jié)果分析為輔。
(三)分析結(jié)果方面的影響。傳統(tǒng)的財務(wù)分析一般限于對表層原因的分析,對于更深層次的原因,由于數(shù)據(jù)來源的限制,較少涉及。比如,本期銷售收入減少了,傳統(tǒng)財務(wù)分析僅限于分析銷量是否減少或單價是否降低,對于質(zhì)量、口碑、消費者變化以及供求變化等深層次原因,由于數(shù)據(jù)來源的限制,一般不做分析。比如,傳統(tǒng)財務(wù)分析可能會得出本期維修費用增加是造成本期成本升高的原因,而對于維修費增加的直接原因一般不做分析。
在大數(shù)據(jù)時代,財務(wù)分析不僅可以分析出表層原因,還可以追蹤分析到深層次原因。如對于本期銷售收入的減少,不僅可以分析出銷量是否減少或者單價是否降低,還可以分析出對某某客戶銷售量的減少,是否為質(zhì)量變差、口碑不好、消費者愛好發(fā)生變化等深層次原因。而對于成本增加的原因,不僅可以分析出是維修費的增加,還可以分析出是因為哪臺機(jī)器損壞、機(jī)器的哪個部位損壞以及操作不當(dāng)、新員工培訓(xùn)不到位等深層次原因。
大數(shù)據(jù)時代,尤其是5G時代的到來,數(shù)據(jù)的傳輸速度越來越快,獲得及時性數(shù)據(jù)的可能性更大,可用數(shù)據(jù)更多,因此更能分析出深層次原因。財務(wù)分析的結(jié)果將更準(zhǔn)確、更可靠、更及時、更相關(guān),更有利于解決問題,從而更好地滿足決策需求和管理需要。
(四)會計監(jiān)督方面的影響。會計的職責(zé),一是財務(wù)核算,二是財務(wù)監(jiān)督。一名優(yōu)秀的財務(wù)工作者,除了要做好會計核算工作,更要做好財務(wù)監(jiān)督工作。大數(shù)據(jù)時代,偏重于相關(guān)性和過程性財務(wù)分析思維,更能從相關(guān)事務(wù)中發(fā)現(xiàn)另一相關(guān)事務(wù)的異常情況,從而發(fā)現(xiàn)舞弊、貪污等問題。比如,某期報銷的機(jī)器維修費較高,通過大數(shù)據(jù)分析發(fā)現(xiàn)該期的機(jī)器運轉(zhuǎn)率或者耗電量卻正常,說明極有可能存在舞弊、貪污等問題。
(五)分析人員方面的影響。大數(shù)據(jù)時代給財務(wù)分析人員提供了很多工具和方法,但是如果不能靈活使用這些工具和方法,財務(wù)分析人員很難有效利用這些大數(shù)據(jù)集。因此,財務(wù)分析人員應(yīng)當(dāng)通過不斷學(xué)習(xí)來掌握這些技能,分析思維應(yīng)從因果型轉(zhuǎn)向相關(guān)型。此外,隨著財務(wù)業(yè)務(wù)一體化的普及,自動記賬和自動生成會計報表已經(jīng)實現(xiàn),會計傳統(tǒng)的記賬、出報表等工作逐步被計算機(jī)所取代,管理型、復(fù)合型會計人才將變得越來越重要。這就要求財務(wù)分析人員轉(zhuǎn)變觀念,加強(qiáng)學(xué)習(xí),掌握大數(shù)據(jù)財務(wù)分析技能。
三、大數(shù)據(jù)時代做好財務(wù)分析工作的應(yīng)對策略
(一)提高財務(wù)分析人員的素質(zhì)。大數(shù)據(jù)時代,財務(wù)分析人員將面臨數(shù)據(jù)容量大、種類多、價值密度低等問題。在短時間內(nèi)依靠傳統(tǒng)方法發(fā)現(xiàn)數(shù)據(jù)之間的關(guān)系和有價值的信息變得越來越困難,這就要求財務(wù)分析人員提高素質(zhì),不斷加強(qiáng)學(xué)習(xí)能力,掌握大數(shù)據(jù)的處理方法和思維,提高財務(wù)分析報告的質(zhì)量,更好地為決策和管理服務(wù)。
(二)建立智能化的財務(wù)分析體系。大量的低價值密度數(shù)據(jù),依靠人工收集、處理、分析變得很困難。因此,財務(wù)分析人員可以通過創(chuàng)新型數(shù)據(jù)處理技術(shù)和方法,建立起自動收集、處理、分析數(shù)據(jù)的智能化財務(wù)分析體系。該體系應(yīng)具有以下特點:一是能夠采用爬蟲技術(shù)等自動收集、整理、處理和存貯數(shù)據(jù)。二是能夠自動分析數(shù)據(jù)變化的深層次原因,能夠幫助財務(wù)分析人員找到解決問題的辦法。三是能夠自動生成滿足各類人需要的直觀的、準(zhǔn)確的分析報告。四是能夠?qū)Ω鞣N財務(wù)風(fēng)險進(jìn)行自動預(yù)警,從而幫助決策人員做出正確決策。
(三)轉(zhuǎn)變財務(wù)分析思維和方法。大數(shù)據(jù)影響了財務(wù)分析的思維和方法。在大數(shù)據(jù)時代,為了更好地使用大數(shù)據(jù)這種高價值的新型資產(chǎn),財務(wù)分析思維應(yīng)從因果型轉(zhuǎn)向相關(guān)型,從偏重于結(jié)果分析轉(zhuǎn)向過程分析,從核算型會計思維轉(zhuǎn)向管理型會計思維。
四、結(jié)論
互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、信息技術(shù)的發(fā)展,造就了大數(shù)據(jù)時代。大數(shù)據(jù)豐富了財務(wù)分析的數(shù)據(jù)來源,影響了財務(wù)分析思維、方法、結(jié)果和人員。財務(wù)分析人員應(yīng)加強(qiáng)學(xué)習(xí)能力,掌握大數(shù)據(jù)的處理技術(shù)和方法,轉(zhuǎn)變財務(wù)分析的思維和方法,提高自身素質(zhì),滿足大數(shù)據(jù)時代的需要,更好地為決策和管理服務(wù)。
【主要參考文獻(xiàn)】
[1] Gartner.www.gartner.com/en/information-technology/glossary/big-data.
[2] World Internet Users Statistics and 2019 World Population Stats(0AD).www.internetworldstats.com/stats.htm.
[3] 文慧嬌.基于價值功能的財務(wù)分析框架構(gòu)建的思考——以水務(wù)企業(yè)為例[J].商業(yè)會計,2017,(05).
[4] 林潔瑩.大數(shù)據(jù)時代背景下會計財務(wù)分析研究[J].濟(jì)南職業(yè)學(xué)院學(xué)報,2015,(12).