劉云天, 孫晶琪*, 牛東曉, 張煥粉
(1.華北電力大學(xué)經(jīng)濟(jì)與管理學(xué)院, 北京 102206; 2.北京清暢電力技術(shù)股份有限公司, 北京 100085)
伴隨著大數(shù)據(jù)和信息化時(shí)代的來臨,傳統(tǒng)的庫存控制管理方法漸漸難以適應(yīng)現(xiàn)代化企業(yè)庫存管理的需求。制造業(yè)企業(yè)往往存在著庫存產(chǎn)品繁多,難以管理的問題,對于高經(jīng)濟(jì)價(jià)值的庫存產(chǎn)品進(jìn)行重點(diǎn)管理,而忽略低經(jīng)濟(jì)價(jià)值庫存產(chǎn)品的管理控制,從長遠(yuǎn)來看會造成巨大的經(jīng)濟(jì)損失,制造業(yè)企業(yè)如何管理這些種類繁多的庫存產(chǎn)品,使庫存更加合理已成為亟待解決的難題[1]。
以上方法均采用傳統(tǒng)分類方法對企業(yè)庫存產(chǎn)品進(jìn)行管理,存在著分類標(biāo)準(zhǔn)較為單一,在實(shí)際應(yīng)用時(shí)存在盤點(diǎn)清查困難等問題??紤]到傳統(tǒng)分類方法的局限性,很多學(xué)者已經(jīng)開始探索新的數(shù)據(jù)分類方法。梁淑蓉等[7]基于權(quán)重搜索樹提出了改進(jìn)K近鄰的高維分類算法,該算法對比K近鄰分類算法、決策樹和支持向量機(jī)算法,顯著減少了數(shù)據(jù)分類的時(shí)間,相較其他算法也具有更高的分類準(zhǔn)確率。張揚(yáng)等[8]研究了一種新的證據(jù)分聚類融合算法。顯著提高了分類準(zhǔn)確度。王剛等[9]提出了一種新的云計(jì)算環(huán)境下自適應(yīng)分類方法,通過提取的分布式語義文本特征并進(jìn)行驗(yàn)證,發(fā)現(xiàn)該方法具有更高的分類精度和效率。從以上研究可知,學(xué)者們通過將數(shù)據(jù)挖掘技術(shù)應(yīng)用到數(shù)據(jù)分類中,大大提升了數(shù)據(jù)分類的效率和準(zhǔn)確性。
由于傳統(tǒng)庫存分類方法存在不能準(zhǔn)確分類,存量控制困難等問題,現(xiàn)提出基于K-means聚類算法的ABC庫存分類方法。首先從供應(yīng)商的庫存管理系統(tǒng)中提取產(chǎn)品銷售數(shù)據(jù),然后采用聚類分析算法,對原始數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,在剔除掉無關(guān)數(shù)據(jù)后,根據(jù)各樣本數(shù)據(jù)與各聚類中心的距離對樣本數(shù)據(jù)進(jìn)行分類,建立數(shù)據(jù)分類模型對庫存產(chǎn)品進(jìn)行分類,以指導(dǎo)企業(yè)的庫存管理決策。通過將數(shù)據(jù)挖掘技術(shù)與傳統(tǒng)庫存管理方法相結(jié)合,達(dá)到建立科學(xué)而有效的庫存分析系統(tǒng)的目的。
ABC分類法是將事物在價(jià)值、數(shù)量等方面的特征作為依據(jù),進(jìn)行劃分和歸類、區(qū)分重要和一般,以采取不同管理策略的一種方法[10]。ABC 分類法的思想實(shí)質(zhì)上可以這樣概括:多數(shù)的經(jīng)濟(jì)價(jià)值往往集中于少數(shù)產(chǎn)品,而多數(shù)產(chǎn)品僅僅占據(jù)少數(shù)經(jīng)濟(jì)價(jià)值,企業(yè)應(yīng)該重視對前者的管理[11]。ABC分類法的一般步驟如下。
(1)數(shù)據(jù)獲取。從ERP管理系統(tǒng)中獲取產(chǎn)品的種類、型號、銷售額等數(shù)據(jù)。
(2)分析計(jì)算。將從ERP管理系統(tǒng)中獲取的數(shù)據(jù)進(jìn)行分析、計(jì)算。繼而計(jì)算各產(chǎn)品的銷售量與銷售累計(jì)量占總銷售量的百分比、各產(chǎn)品銷售額與累計(jì)銷售額占總銷售額的百分比。
(3)確定分類標(biāo)準(zhǔn)。根據(jù)ABC分類法基本思想,把累計(jì)銷售額為 60%~80%的產(chǎn)品歸為 A 類,把累計(jì)銷售額為 20%~30%的商品歸為 B 類,其余歸為 C 類。
(4)依據(jù)上一步的分類結(jié)果,制訂ABC分類管理標(biāo)準(zhǔn)表,對A、B、C三類對象采取不同的管理策略。
聚類分析是數(shù)據(jù)挖掘中十分熱門的一個(gè)研究方向,與其他學(xué)科的研究領(lǐng)域有著很大的交叉性[12]??梢酝ㄟ^使用聚類分析算法發(fā)現(xiàn)各種數(shù)據(jù)的隱含結(jié)構(gòu),對數(shù)據(jù)進(jìn)行自動(dòng)分類,進(jìn)而獲知數(shù)據(jù)的大致分布,能夠在諸多領(lǐng)域?yàn)楦鞣N不同的企業(yè)提供決策支持[13]。
K-means算法是一種得到最廣泛使用的聚類算法,其主要思想是:首先通過計(jì)算得出各聚類子集內(nèi)所有數(shù)據(jù)樣本的均值,并將其作為該聚類的代表點(diǎn),然后把每個(gè)數(shù)據(jù)點(diǎn)歸入最鄰近的類別中,使評價(jià)聚類性能的準(zhǔn)則函數(shù)趨于最優(yōu)、從而使同類別中的對象相似度(相似度為一個(gè)簇中對象的平均值)較高,而不同類之間的對象相似度較小[14]。算法的一般步驟為:在樣本中隨機(jī)抽取K個(gè)對象,假設(shè)每個(gè)對象的初始值等于該簇的平均值,對于剩余對象,根據(jù)其與各個(gè)簇的質(zhì)心的距離逐個(gè)分配到最鄰近的簇,然后重新計(jì)算各個(gè)簇的平均值,不斷重復(fù)此過程直至準(zhǔn)則函數(shù)收斂。
K-means算法的一般步驟如下。
假定存在數(shù)據(jù)點(diǎn)集D={x1,x2,…,xn}, 以及k個(gè)簇C={C1,C2,…,Ck},每個(gè)簇的聚類中心為
(1)
式(1)中:nCi表示第i個(gè)簇中數(shù)據(jù)點(diǎn)x的個(gè)數(shù)。
構(gòu)建準(zhǔn)則函數(shù)為
(2)
(4)循環(huán)步驟(2)和步驟(3),直到準(zhǔn)則函數(shù)E的數(shù)值保持不變。
(5)分類完成,得到k個(gè)聚類。
在對庫存產(chǎn)品進(jìn)行分類時(shí),首先為每一個(gè)類選擇一個(gè)聚類中心,依據(jù)ABC分類方法將庫存產(chǎn)品數(shù)據(jù)分為三個(gè)簇,其中A 類庫存產(chǎn)品是指價(jià)值80%銷售額的占據(jù)20%數(shù)量的產(chǎn)品型號,假設(shè)該類產(chǎn)品的總銷售額為M,總庫存數(shù)量為N,則定義A 類產(chǎn)品的平均銷售額C作為A類產(chǎn)品的中心為
(3)
定義φ為評價(jià)函數(shù)為
(4)
式(4)中:Q(i)為i型號產(chǎn)品的銷售額。
在K-means算法中,選取合適的評價(jià)函數(shù)非常重要,因此在本文所構(gòu)建的模型中將評價(jià)函數(shù)的選取與ABC分類法相關(guān)聯(lián),通過設(shè)置合適的評價(jià)函數(shù)來衡量庫存產(chǎn)品i的銷售額與本類產(chǎn)品銷售額的聚類中心間的距離。規(guī)定若φ<0.8,則表示該產(chǎn)品的銷售額與聚類中心距離過遠(yuǎn),并將該產(chǎn)品進(jìn)行次一級分類評價(jià);反之則將該產(chǎn)品歸入當(dāng)前類別。
將K-means算法中的評價(jià)函數(shù)引入分類算法,解決了ABC分類法對于分類邊界判斷模棱兩可的問題。假設(shè)A類產(chǎn)品的銷售額占比為80%,若倉庫中存在m產(chǎn)品,庫存占比為65%,則m產(chǎn)品庫存占比與銷售額占比之和未達(dá)到 80%,根據(jù)ABC分類法的理論,m產(chǎn)品屬于 A 類。但假定m產(chǎn)品的銷售額很少,那么將m產(chǎn)品歸入 A 類是不合理的。因?yàn)樵谀P椭幸朐u價(jià)函數(shù),顯然會使φ的值變小,從而m產(chǎn)品不應(yīng)該歸入 A 類。這種改進(jìn)方法避免了傳統(tǒng)方法的邊界分類不準(zhǔn)確性,使得分類邊界更加清晰,加強(qiáng)了對庫存產(chǎn)品分類的靈活性和準(zhǔn)確性。
基于K-means算法的ABC分類法的步驟如下。
(1)根據(jù)各型號環(huán)網(wǎng)柜比例和基于ABC分類法得出的分類,計(jì)算各類庫存環(huán)網(wǎng)柜的聚類中心Ci。
(2)對于每種商品x。
(4)如果φ>R(R為當(dāng)前類別環(huán)網(wǎng)柜評分比例),則將x歸入當(dāng)前類別。
(5)在當(dāng)前品類產(chǎn)品銷量比例的基礎(chǔ)上,增加環(huán)網(wǎng)柜x占總銷量的比例。
(6)否則轉(zhuǎn)換為ABC中的下一類別,循環(huán)步驟(4)~步驟(6)。
(7)結(jié)束判斷。
(8)結(jié)束循環(huán)。
(9)計(jì)算新的聚類中心Ci。
(10)循環(huán)步驟(2)~(9),直至聚類中心Ci保持不變。
通過在計(jì)算機(jī)中運(yùn)行上述算法,可以獲得環(huán)網(wǎng)柜分類信息表,在表中可以直觀的觀察到各類別庫存環(huán)網(wǎng)柜的銷售額在總銷售額中占多大比例。根據(jù)嵌套聚類算法后的環(huán)網(wǎng)柜分類結(jié)果,庫存中心可以針對不同類別的庫存環(huán)網(wǎng)柜產(chǎn)品采取不同的庫存管理策略。比如對于A類環(huán)網(wǎng)柜,采購需求量較為巨大,必須保證這些型號的環(huán)網(wǎng)柜在多個(gè)倉庫中的儲存量,不允許出現(xiàn)缺貨的情況;對于B類環(huán)網(wǎng)柜,可以采取適當(dāng)控制的策略,應(yīng)該在可能的范疇內(nèi)盡量減少庫存;對于C類中的各型號環(huán)網(wǎng)柜產(chǎn)品,只需采用經(jīng)濟(jì)批量即可。
某電力制造業(yè)企業(yè)庫存中心每天要處理大量各種型號的環(huán)網(wǎng)柜,對于這些不同型號、具有不同經(jīng)濟(jì)價(jià)值的環(huán)網(wǎng)柜產(chǎn)品,考慮到客戶對環(huán)網(wǎng)柜產(chǎn)品的多樣化需求以及中心倉庫較為有限的庫存容量,企業(yè)庫存中心必須根據(jù)各型號環(huán)網(wǎng)柜的月度銷量,對不同型號的環(huán)網(wǎng)柜產(chǎn)品采取不同的庫存策略(比如計(jì)劃庫存量、經(jīng)濟(jì)訂貨量),從而提高產(chǎn)品出入庫的工作效率、刺激環(huán)網(wǎng)柜產(chǎn)品的銷售并盡可能的減少庫存。在算例中需要解決的問題是:對于該企業(yè)的環(huán)網(wǎng)柜庫存中心而言,通過數(shù)據(jù)挖掘算法挖掘出哪些型號的環(huán)網(wǎng)柜是占據(jù)庫存空間較小,但是最有經(jīng)濟(jì)價(jià)值的,則應(yīng)該對這些型號的環(huán)網(wǎng)柜產(chǎn)品進(jìn)行重點(diǎn)管理。因此,可以依據(jù)該算法,利用計(jì)算機(jī)得出各環(huán)網(wǎng)柜型號的從屬分類,企業(yè)的庫存中心可以依據(jù)分類結(jié)果對不同型號的環(huán)網(wǎng)柜采取不同的管理策略,以實(shí)現(xiàn)最佳的庫存管理效果。
本文中數(shù)據(jù)來源于某電力制造業(yè)企業(yè)的后臺ERP數(shù)據(jù)庫中的歷史環(huán)網(wǎng)柜產(chǎn)品銷售表。根據(jù)算法輸入的要求,本次建模需要的數(shù)據(jù)包括環(huán)網(wǎng)柜的型號(即庫存品名稱),環(huán)網(wǎng)柜的月度銷售量,環(huán)網(wǎng)柜的月度銷售額。因此從ERP系統(tǒng)中導(dǎo)出的環(huán)網(wǎng)柜銷售記錄表如表1所示。
表1 環(huán)網(wǎng)柜銷售記錄表(部分)Table 1 Ring network cabinet sales record sheet(part of the table)
從ERP管理系統(tǒng)的數(shù)據(jù)庫中導(dǎo)出的原始數(shù)據(jù)存在著很多空缺和不一致的質(zhì)量不高的數(shù)據(jù),在建模分析時(shí)這些數(shù)據(jù)會對分析結(jié)果造成不良影響,因此在建模計(jì)算前必須對數(shù)據(jù)進(jìn)行加工處理,一般的處理步驟大致包括數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)變換和數(shù)據(jù)歸約[15]。因?yàn)樵诒疚牡膶?shí)證研究中以月為時(shí)間跨度,需要根據(jù)產(chǎn)品的月度銷售額數(shù)據(jù)來對產(chǎn)品數(shù)據(jù)進(jìn)行聚類,但從數(shù)據(jù)庫中導(dǎo)出的數(shù)據(jù)表只有每批次銷售額這一屬性,因此需要對環(huán)網(wǎng)柜銷售記錄表中的庫存數(shù)據(jù)進(jìn)行處理。首先將原始數(shù)據(jù)中的空缺值等低質(zhì)量數(shù)據(jù)去掉,然后根據(jù)環(huán)網(wǎng)柜銷售記錄表的庫存品名稱、每批次銷售量和每批次銷售額數(shù)據(jù),通過運(yùn)行代碼計(jì)算得到月銷售額數(shù)據(jù),然后根據(jù)分類算法通過計(jì)算機(jī)計(jì)算得到相應(yīng)的分類。
利用傳統(tǒng)的ABC分類法對原始庫存數(shù)據(jù)表進(jìn)行數(shù)據(jù)分類的結(jié)果如表2所示,劃分的庫存環(huán)網(wǎng)柜累計(jì)金額占比趨勢變化如圖1所示。
圖1 ABC分類法下的累計(jì)占比庫存金額變化趨勢圖Fig.1 Change trend chart of cumulative proportion of inventory amount under ABC classification
表2 數(shù)據(jù)分類表Table 2 Data classification table
根據(jù)累計(jì)金額占比趨勢圖可知,17類不同型號的環(huán)網(wǎng)柜中,有3類產(chǎn)品被分為A類,4類產(chǎn)品被分為B類,10類產(chǎn)品被分為C類。然后將傳統(tǒng)方法分類后的數(shù)據(jù)代入改進(jìn)的基于聚類算法的 ABC 分類模型。在利用K-means算法進(jìn)行聚類時(shí),聚類中心的變化如表3所示。
表3 聚類中心變化表Table 3 Cluster center change table
在A、B、C三類的聚類中心不再改變后,利用K-means聚類算法進(jìn)行二次分類的結(jié)果如表4所示,累計(jì)金額占比變化趨勢如圖2所示。
表4 二次數(shù)據(jù)分類表Table 4 Secondary data classification table
圖2 基于聚類分類算法的累計(jì)占比庫存金額變化趨勢圖Fig.2 The trend chart of the cumulative inventory amount based on the cluster classification algorithm
結(jié)果表明,AC10 kV、2 630 A和QLG-12/630這兩類型號的環(huán)網(wǎng)柜屬于A類產(chǎn)品,銷售額占比約76%,WKXGN15-12CCVVVV和QLG-12/630-5L型號的環(huán)網(wǎng)柜屬于B類產(chǎn)品,銷售額占比8%,其余產(chǎn)品屬于C類,銷售額占比16%。故應(yīng)該對AC10 kV、2 630 A和QLG-12/630型號的環(huán)網(wǎng)柜進(jìn)行重點(diǎn)控制,應(yīng)該嚴(yán)格控制其計(jì)劃與采購、庫存儲備量、訂貨量和訂貨時(shí)間;對WKXGN15-12CCVVVV和QLG-12/630-5L型號的環(huán)網(wǎng)柜進(jìn)行適當(dāng)控制,在需求范圍內(nèi)適當(dāng)減少庫存;對于其余的C類產(chǎn)品可以放寬控制,采用經(jīng)濟(jì)批量。
采用K-means聚類算法和ABC分類法建立了庫存分類模型,并對某電力制造業(yè)企業(yè)生產(chǎn)的多種型號環(huán)網(wǎng)柜進(jìn)行了產(chǎn)品庫存分類,得到以下結(jié)論。
(1)在ABC分類法中引入評價(jià)函數(shù)較好的解決了傳統(tǒng)分類的弊端,這種改進(jìn)方法避免了傳統(tǒng)方法在邊界分類中的不準(zhǔn)確性,通過定義合適的評判標(biāo)準(zhǔn)使得評價(jià)函數(shù)可以對各型號的庫存環(huán)網(wǎng)柜產(chǎn)品與各聚類中心的距離進(jìn)行定量的判斷,也加強(qiáng)了各類環(huán)網(wǎng)柜劃分的靈活性,增強(qiáng)了算法的準(zhǔn)確性。
(2)根據(jù)數(shù)據(jù)挖掘聚類算法與經(jīng)典庫存分類方法建模計(jì)算得出的分類結(jié)果來指導(dǎo)企業(yè)庫存決策,對于企業(yè)庫存管理有著較強(qiáng)的指導(dǎo)意義。數(shù)據(jù)挖掘技術(shù)與ERP信息系統(tǒng)的緊密結(jié)合大大增強(qiáng)了ERP的分析和決策功能,充分滿足了用戶的需求,利用挖掘得到的ERP數(shù)據(jù)除了可以進(jìn)行產(chǎn)品庫存分類、股利分配決策、企業(yè)價(jià)值評估和財(cái)務(wù)預(yù)警外,還能為許多其他的企業(yè)決策提供支持。