崔文華,孫楚凡,王介生,陳媛媛
(遼寧科技大學 電子與信息工程學院,遼寧 鞍山 114044)
隨著我國國民經(jīng)濟進入高速發(fā)展階段,商業(yè)活動十分頻繁,貨幣發(fā)行量逐年增加,現(xiàn)金特別是紙幣的流通量也隨之與日俱增,人們對流通貨幣的質量要求相應有所提高.因此,紙幣清分自動化對于金融業(yè)來說變得愈發(fā)重要.在20世紀90年代中后期出現(xiàn)的紙幣清分機是銀行系統(tǒng)對于回籠現(xiàn)金貨幣進行自動清分處理的重要金融機具[1].紙幣清分機通過對不同版別、面向、面值和新舊程度的紙幣進行快速清分,實現(xiàn)了對流通幣、高仿幣、變造幣、拼湊幣的動態(tài)鑒偽、自動計數(shù)、分類分揀等功能,達到了以智能化機械工具代替?zhèn)鹘y(tǒng)手工對紙幣進行清分、整理的目的,引領銀行柜臺智能處理終端設備小型化、智能化、模塊化、網(wǎng)絡化技術發(fā)展方向,促進行業(yè)科技進步,對維護金融安全具有重大意義.
然而,紙幣清分機市場競爭的不斷加劇,要求生產(chǎn)企業(yè)提供產(chǎn)品快速配置功能,為不同的客戶定制出個性化產(chǎn)品.這就需要利用數(shù)據(jù)挖掘技術對客戶的需求進行分析和處理.事實上,在客戶表達需求時,通常使用不確定或不精確的語言,如“速度較快”“體積較小”[2],這就與數(shù)字化的機器語言產(chǎn)生矛盾.所以采用建立粗糙集知識模型的方法以適應客戶的不確定需求.在數(shù)據(jù)挖掘技術中,粗糙集理論之所以能受到廣泛的關注,是因為它可以有效處理數(shù)據(jù)的模糊性.國內外學者在利用粗糙集處理復雜系統(tǒng)中的數(shù)據(jù)和信息領域取得了許多成果.文獻[3]基于粗糙集理論對信息系統(tǒng)建立決策表,從中獲取逆逼近并進行規(guī)則提??;文獻[4]提出了一種利用粗糙集評價決策成效的方法;文獻[5]應用變精度粗糙集方法,采用增量式更新方法對新增決策表進行規(guī)則提??;文獻[6]提出了一種基于粗糙集理論和支持向量算法的故障診斷方法.
總而言之,解決紙幣清分機配置管理的首要問題,是全面、有效地建立和定義產(chǎn)品結構之間的條件屬性及決策屬性.因此,本文提出采用建立粗糙集知識模型的方法來充分適應客戶對紙幣清分機的不確定需求.實現(xiàn)上述功能需要建立與產(chǎn)品結構相關聯(lián)的決策表,利用Skowron差別矩陣進行屬性約簡及核的提取,建立一種形式化定義配置規(guī)則的方法,實現(xiàn)紙幣清分機的配置設計.最后,通過實例的配置結果驗證所提方法的有效性.
目前,國外企業(yè)在清分技術上已經(jīng)非常成熟,在大、中型紙幣清分機核心技術開發(fā)上處于領先地位,對于紙幣面向、面值的識別率已經(jīng)接近100%.這使得在大、中型紙幣清分機領域,實力雄厚的國外公司占據(jù)世界80%以上的市場份額.
近年來,我國逐漸實現(xiàn)紙幣清分機的國產(chǎn)化,清分機的自主研發(fā)工作取得了突破性進展,在成本控制上具有獨特的專利和技術,目前在國內中、小型紙幣清分機市場,已經(jīng)代替進口產(chǎn)品,并且成功走向國際市場.
一個完整的紙幣清分機系統(tǒng)主要包括機械導鈔系統(tǒng)、傳感器系統(tǒng)、控制與顯示系統(tǒng)等,如圖1所示.紙幣清分機清分鈔票的流程如下:成疊的被檢測紙幣由入鈔口進入,被摩擦式分鈔機構分成單張,通過機械系統(tǒng)傳送,完成紙幣圖像數(shù)據(jù)的采集;圖像處理部分接收到采集數(shù)據(jù),進行一系列的算法處理.主控部分按照清分功能對紙幣進行辨別,從而實現(xiàn)對紙幣的鑒偽.除了常規(guī)的熒光、紅外、磁性等檢測防偽手段以外,有些清分機還具有先進的厚度檢測及CIS圖像識別功能,可以有效地實現(xiàn)對鈔票成色、面向、面額大小、殘損度、真?zhèn)渭白冊鞄诺臋z測和識別,從而實現(xiàn)各種清分功能.
圖1 紙幣清分機結構示意圖Fig.1 Configuration skeleton of currency sorter
粗糙集(rough set,RS)理論是由波蘭數(shù)學家Pawlak于1982年提出的一種關于數(shù)據(jù)分析和推理的理論[7].該理論善于從不確定或不精確的數(shù)據(jù)中獲取知識并進行推理,在知識獲取、規(guī)則生成、智能控制和決策分析等領域應用廣泛,特別是在數(shù)據(jù)挖掘領域,獲得了巨大成功.文獻[8]對RS理論的基本概念和算法做了比較詳盡的闡述.
(1)決策表DT(decision table).稱四元組DT={U,C∪D,V,f}是一個決策表,其中
U:U={x1,x2,…,xn},稱為論域;
C∪D:C=稱為條件屬性集,每個αj∈C(1≤j≤m)稱為C的一個屬性;D=稱為決策屬性集,且C∩D=,C
V:V=∪Va(a∈C∪D),是信息函數(shù)f的值域,其中Va表示值域;
f:f={fa:U→Va,a∈C∪D},是決策表的信息函數(shù),其中fa是屬性α的信息函數(shù).
(2)不可分辨關系.給定一個論域U和U上的一簇等價關系S,若P,且P≠,則∩P依然是論域U上的一個等價關系,稱為P上的不可分辨關系,記為IND(P),常簡記為P.即
(3)集合的下近似和上近似.設U為論域,S是論域U上的等價關系簇,則X和論域U上的一個等價關系R∈IND(K),定義子集X關于知識R的下近似和上近似分別為
(4)知識的約簡.設論域上的一簇等價關系PS,對任意的G,若G滿足是獨立的,且IND(G)=IND(P),則稱G是P的一個約簡,記為G∈RED(P),其中RED(P)表示P的全體約簡組成的集合.
(5)知識的核.設論域上的一簇等價關系PS,對任意的R,若滿足IND(P-{R})≠IND(P),則稱R為P中必要的,P中所有必要的知識組成的集合稱為P的核,記為CORE(P).
(6)決策表的差別矩陣.設DT={U,C∪D,V,f}是一個決策表,其中論域是對象的一個非空有限集合U:U={x1,x2,…,xn},,則定義
為決策表的差別矩陣,其中i,j=1,2,…,n.
當fD(xi)≠fD(xj)時,
在紙幣清分機設計制造的生命周期中,涉及結構、性能等影響因素多種多樣.為了滿足客戶對產(chǎn)品的不同需求,生產(chǎn)企業(yè)總是希望能夠使客戶了解更全面的產(chǎn)品情況,以便提供更加完整的產(chǎn)品配置.但是,企業(yè)忽略了客戶不是設計者,他們一般不關心“細枝末節(jié)”;何況從安全角度考慮,生產(chǎn)企業(yè)也不應該將所有設計信息提供給客戶.因此,企業(yè)可以利用粗糙集理論,獲取產(chǎn)品的配置規(guī)則,使該規(guī)則能適應本企業(yè)所掌握的相關產(chǎn)品開發(fā)知識,分析開發(fā)過程中的各種影響因素,提取關鍵要素,并總結相關配置,確定適合用戶的配置規(guī)則,只提供關鍵要素讓用戶選擇,滿足不同客戶的個性化需求[9].
對客戶的不同需求加以分析,將其分解為相應的知識模型,設定變量和條件;基于產(chǎn)品結構和性能進行個性化配置,形成粗糙集決策表;再進行屬性的約簡,產(chǎn)生產(chǎn)品的配置結果.紙幣清分機的配置設計過程如圖2所示.
圖2 產(chǎn)品配置設計過程模型Fig.2 Design process model of product configuration
基于粗糙集理論的產(chǎn)品配置的核心思想是通過計算各屬性重要度并進行排序,在保證條件屬性和決策屬性之間相同的依賴關系的前提下找出相關屬性的最小集合,用以代替整個屬性集合,實現(xiàn)屬性信息約簡,產(chǎn)生更簡潔、更有意義的配置規(guī)則.
針對紙幣清分機配置規(guī)則獲取的基本步驟可以概括如下:
步驟1 基于粗糙集理論對紙幣清分機進行研究,發(fā)現(xiàn)知識模型,分析設計制造過程中影響紙幣清分機開發(fā)的相關屬性,確定在各屬性綜合影響下紙幣清分機的設計結果.
步驟2 將分析得出的相關屬性作為原始數(shù)據(jù),設定相應的條件屬性集合和決策屬性集合,選擇各屬性的值域,并按照規(guī)則轉換原始數(shù)據(jù)中相應的數(shù)值,建立一個滿足粗糙集理論定義的決策表,記為DT={U,C∪D,V,f}.
步驟3 利用Skowron 差別矩陣對決策表進行屬性約簡及核的提取,寫出結果為真的決策規(guī)則.
步驟4 刪除及合并重復的屬性及實例,提取相應的最優(yōu)配置規(guī)則.
以某品牌的紙幣清分機產(chǎn)品為研究對象,就上述配置規(guī)則的基本步驟對該產(chǎn)品進行分析和計算.通過實際調查發(fā)現(xiàn),在該品牌紙幣清分機產(chǎn)品的生產(chǎn)過程中,用戶較為關注的、與產(chǎn)品規(guī)則配置相關的關鍵影響因素主要有尺寸、入鈔口容量、出鈔口容量、清點速度等.
表1為3 種不同系列的紙幣清分機(JL302系列、JL303 系列、JL305 系列)按不同的配置條件得到的實例,決策表中的條件屬性(C)包括尺寸(α1)、入鈔口容量(α2)、出鈔口容量(α3)、清點速度(α4)4項配置要求.決策屬性(D)為配置方案,共3個方案.為了體現(xiàn)普遍意義,只使用“大小”“快慢”加以區(qū)分,這樣使配置結果更加簡單、明了,即便客戶不具備相關的專業(yè)知識,也容易接受.
表1 紙幣清分機配置規(guī)則Tab.1 Configuration rules of currency sorter
基于粗糙集理論發(fā)現(xiàn)紙幣清分機的知識模型,將配置決策表抽象化表示,對原配置表進行簡化處理,用具體的數(shù)字表示其含義[10],結果如表2、3所示.
表2 基于粗糙集的紙幣清分機知識模型(1)Tab.2 Knowledge model of currency sorter based on RS(1)
表3 基于粗糙集的紙幣清分機知識模型(2)Tab.3 Knowledge model of currency sorter based on RS(2)
1991年Skowron首次提出利用差別矩陣來表示知識,這種算法對于知識表達系統(tǒng)中核、約簡,以及其他概念的表示和計算具有很多優(yōu)點.下面采用Skowron差別矩陣來獲取該決策表的所有屬性約簡及核的提取.該決策表的Skowron差別矩陣為
相應的布爾函數(shù)的合取范式:
合取范式L∧(∨)轉換為析取范式L∨(∧),可得
因此,得到?jīng)Q策表的兩個約簡為{α1,α3},{α3,α4},核為{α3}.
計算約簡后的每一條決策規(guī)則的核值,可得簡化配置規(guī)則表,如表4所示.
簡化后的結果對應的決策邏輯為
轉化為紙幣清分機的配置規(guī)則為
If(尺寸=一般)or(尺寸=小)then 實例=JL305系列
If(出鈔口容量=大)then 實例=JL302系列
If(尺寸=大)and(出鈔口容量=一般)then實例=JL303系列
表4 簡化配置規(guī)則表Tab.4 Reduction of configuration rules
本文基于粗糙集配置規(guī)則提取算法容易在計算機上實現(xiàn),只涉及較少的影響因素,但該算法可以全面地從實例庫中不斷吸收相關知識.在實際應用過程中,客戶需求貫徹整個工作過程.在產(chǎn)品配置乃至整個產(chǎn)品開發(fā)過程中,支持隨時反饋增加或修改,以滿足客戶的需求.
紙幣清分機作為一種集真?zhèn)巫R別、面額辨別、各種清分功能于一身的現(xiàn)代金融機具,可提高金融行業(yè)的分選效率,被多家銀行所使用,反饋效果良好.本文在對紙幣清分機生產(chǎn)設計過程和歷史銷售數(shù)據(jù)分析的基礎上,總結出紙幣清分機配置規(guī)則的獲取方法,實現(xiàn)了屬性的約簡,信息內容得到簡化,產(chǎn)生更易于被客戶接受的配置規(guī)則,具有重要意義.
[1] 何佳兵,李習倫,劉松波,等.紙幣清分機系統(tǒng)的研究與開發(fā)[J].機電工程技術,2007,36(8):29-31.HE Jia-bing,LI Xi-lun,LIU Song-bo,etal.Research and development on currency sorter system [J].Mechanical & Electrical Engineering Technology,2007,36(8):29-31.(in Chinese)
[2] 車阿大,林志航.產(chǎn)品設計中的獲取用戶需求的研究及軟件系統(tǒng)的開發(fā)[J].機械設計,1999(1):20-22.CHE A-da,LIN Zhi-h(huán)ang.Study and development of software system for-obtaining consumers requirements in product design [J].Machine Design,1999(1):20-22.(in Chinese)
[3] QIAN Yong-h(huán)ua,LIANG Ji-ye,DANG Chuangyin.Converse approximation and rule extraction from decision tables in rough set theory [J].Computers & Mathematics with Applications,2008,55(8):1754-1765.
[4] QIAN Yu-h(huán)ua,LIANG Ji-ye,LI De-yu,etal.Measures for evaluating the decision performance of a decision table in rough set theory[J].Information Sciences,2008,178(1):181-202.
[5] 耿秀麗,張在房,褚學寧.基于變精度粗糙集的產(chǎn)品配置規(guī)則提取及增量式更新[J].上海交通大學學報,2010,44(7):876-882.GENG Xiu-li,ZHANG Zai-fang,CHU Xue-ning.Research on product configuration rules extraction based on variable precision rough set and incremental updating [J].Journal of Shanghai Jiaotong University,2010,44(7):876-882.(in Chinese)
[6] 舒服華.基于粗糙集與支持向量機的推土機故障診斷[J].筑路機械與施工機械化,2007(1):56-59.SHU Fu-h(huán)ua.Bulldozer fault diagnosis based on rough set and support vector machine[J].Road Machinery &Construction Mechanization,2007(1):56-59.(in Chinese)
[7] 張文修,吳偉志,梁吉業(yè),等.粗糙集理論與方法[M].北京:科學出版社,2001.ZHANG Wen-xiu,WU Wei-zhi,LIANG Ji-ye,et al.Theory and Method of Rough Set[M].Beijing:Science Press,2001.(in Chinese)
[8] 苗奪謙,李道國.粗糙集理論、算法與應用[M].北京:清華大學出版社,2008.MIAO Duo-qian,LI Dao-guo.Rough Sets Theory,Algorithms and Applications[M].Beijing:Tsinghua University Press,2008.(in Chinese)
[9] 孫國梓,郁鼎文,吳志軍.個性化配置器的粗糙集方法研究[J].計算機集成制造系統(tǒng),2005,11(2):168-172.SUN Guo-zi,YU Ding-wen,WU Zhi-jun.Research on individual configurator based on rough set[J].Computer Integrated Manufacturing Systems,2005,11(2):168-172.(in Chinese)
[10] 高天一,孫 偉,馬沁怡.基于粗集理論的產(chǎn)品配置規(guī)則獲取方法研究[J].計算機工程與應用,2007,43(16):20-21.GAO Tian-yi,SUN Wei,MA Qin-yi.Research on product configuration rules acquirement method based on rough set theory [J].Computer Engineering and Applications,2007,43(16):20-21.(in Chinese)