樂亮
(工業(yè)和信息化部電子第五研究所,廣州510610)
隨著信息技術的發(fā)展和制造業(yè)領域專業(yè)分工越來越細,產品要由不同的設計人員、制造商和零部件供應商合作完成。在這一過程中,必然涉及到不同的CAD之間、CAD與其他系統(tǒng)之間共享信息,交換數據的問題。同時還要求企業(yè)部門之間、企業(yè)之間,在交換CAD數據時對數據信息的組織和質量水平達成共同的理解和協定。同時,在數據的采集、輸入、加工、轉換的過程中,由于普遍存在的不確定性因素,造成數據對現實世界的描述不準確,產生數據誤差或錯誤,因而無法達到數據使用的要求,或者不能完全滿足數據應用的需求,這些都是CAD軟件產品的數據質量問題。
因此,如何高效地檢測出CAD軟件產品數據質量問題并對其做出客觀的評價,是關系到數據應用及決策的科學性和有效性的關鍵因素。為滿足CAD軟件產品數據質量測評的工程需求,本文基于GB/T 25000.12-2017標準,同時考慮CAD軟件產品數據質量的基本內容及影響因素,對標準提出的15個數據質量特性進行分析、總結、歸納出一套適合的CAD軟件產品數據質量測評指標,結合CAD軟件產品實際應用,分析各指標對應的度量元及其權重,然后進一步對數據質量的檢測方法和評價方法進行研究,從而提出一個基于GB/T 25000.12-2017的包含測評指標、檢測方法和評價方法的CAD軟件產品數據質量測評體系框架。
數據質量被定義為指在特定條件下使用時,數據的特性滿足明確的和隱含的要求的程度[1],圖1給出了數據質量概念提供的框架。
圖1 數據質量概念框架
因此,數據質量信息能反映生產的數據集和現實世界中論域(即完全符合要求的數據集)之間的差異。從數據生產者的角度而言,數據質量指數據集符合產品規(guī)范的程度,即數據集與某一論域的接近程度;從數據使用者的角度而言,數據質量指數據集“適合使用的程度”,即產品和用戶需求或期望之間的一致性水平。CAD軟件產品數據質量也可以構建類似的框架。CAD軟件產品數據質量可以理解為CAD軟件產品數據或服務符合產品規(guī)范、滿足及適應不同用戶需求的能力。
基于用戶對CAD軟件產品數據的實際應用需求,CAD軟件產品的數據質量內容[2]主要包括產品的描述與可靠性、模型復雜性、工程更改、幾何明晰性、結構等,具體如表1所示。
表1 CAD軟件產品的數據質量內容
針對上述數據質量的基本內容,影響CAD軟件產品數據質量的因素包括:CAD設計方法、用戶培訓和用戶知識、CAD系統(tǒng)程序、檢查程序、數據交換和數據修復等。
本文根據CAD軟件產品特征及其數據質量相關內容,結合GB/T 25000.12-2017標準中提出的15個質量特性,提出一個可供參考的CAD軟件產品數據質量測評體系框架[3-5],該框架包括數據質量測評指標、數據質量檢測方法和數據質量評價方法,具體如圖2所示。
圖2 CAD軟件產品數據質量測評體系框架
首先,按照CAD軟件產品的特征,基于GB/T 25000.12-2017提出的15個數據質量特性,通過分析,得出每個質量特性對CAD軟件產品最終質量結果的影響程度和量化難易程度,如,基于用戶對CAD產品數據功能、性能效率、易用、接口等較為關注,所以準確性、完備性、精度(涉及功能),效率(涉及性能)、一致性(涉及接口),可用性、可訪問性(涉及易用性)的影響程度都為高,同時考慮到相關質量特性在數據質量模型中的度量元與產品質量模型中的度量元較為類似,測度數據較為容易獲取,所以其量化程度為可量化;相反的,CAD產品作為桌面設計工具軟件,用戶對確實性、現實性、依從性、保密性、可跟蹤性、可理解性、可移植性、可恢復性的關注程度相對較低,所以其影響程度定為低,同時,在度量元測度數據的獲取上,較為困難,所以其量化程度為難量化,具體如表2所示。
如表2所示,各質量特性對最終數據結果的影響程度不同,量化的難易程度也不同。結合第2節(jié)CAD軟件產品數據質量基本內容,進行指標的綜合對比、篩選、歸納。具體辦法如下:一是直接選取準確度、完備性、一致性、效率、精度這五個對質量結果影響程度較高、相關標準中出現頻率也較高且易量化的維度。二是由于保密性、可跟蹤性、可理解性與可訪問性聯系較為緊密,將其歸入可訪問性指標;確實性、現時性、依從性、可移植性、可恢復性是針對特定需求的,將其歸入可用性。于是,選定準確性、完備性、一致性、效率、精度、可用性和可訪問性等7個數據質量指標。同時,參考GB/T 25000.23-2019產品質量模型提出的度量元,結合CAD軟件產品的實際,進一步提出上述指標的度量元及其權重(見表3)。
表2 數據質量特性對CAD軟件產品數據質量的影響和量化表
參考GB/T 18784-2002對CAD軟件產品數據質量的分類,CAD軟件產品數據質量主要可分為幾何數據質量(包括曲線,曲面,有界曲面,組合曲面、曲面組及拓撲組合,邊界表達實體和圖樣元素)和數據結構質量(包括模型名稱、模型結構、工程圖樣、實體、精度、數據量、工藝信息),通過分析其組成、特征以及結構層次,給出不同檢查對象、不同結構層次上的數據檢測方法,具體如表4所示。
表3 數據質量指標及度量元
在取得數據質量檢測結果后,可依據實用性、科學性、全面性、易操作性和系統(tǒng)性等原則[6],按照3.1小節(jié)提出的測評指標對數據質量分別進行度量,其度量結果通常有以下幾種方式表示:
(1)布爾變量,即包含兩種邏輯狀態(tài)的變量,其值域范圍為{真,假}。對于某單項測評,將待檢數據集與標準數據集進行比較,若二者在某個測評指標上結果一致,則在該項指標上質量結果為真,否則為假。
表4 CAD軟件產品的數據質量檢查內容及方法
(2)數量,即事物的多少,其值域范圍為[0,+∞)。存在兩種計數方式:一種是統(tǒng)計正確數據的個數,另一種是統(tǒng)計錯誤(缺陷)數據的個數。
(3)比值或百分數,比值的值域范圍為[0,1]。百分數是一種特殊的比值,其值域范圍為[0,100]。
在對測評指標進行度量后,可對度量結果進行數據質量評價,常見評價方法包括缺陷扣分法、加權平均法等。
缺陷扣分法是依據某個評分標準,通過給產品打分的方式來評價單個產品的數據質量。首先,根據產品缺陷的嚴重程度制定一個分級的評分標準,每個缺陷級別給定一個扣分值。然后,統(tǒng)計符合每個缺陷級別的缺陷數量,再與其對應的扣分值相乘即得到產品的扣分。最后,用滿分減去扣分值得到產品的質量得分,作為最終質量評價結果。
設某CAD軟件產品數據的缺陷分級標準為:嚴重缺陷扣α分,重度缺陷扣β分,一般缺陷扣γ分,則根據缺陷扣分法得出的產品質量得分為:
其中,X、Y、Z分別為產品中嚴重缺陷、重度缺陷、一般缺陷的個數,Q為產品質量得分。
加權平均法的思路是通過統(tǒng)計數據集各評價項在抽樣檢驗中的正確率與為其分配的權重進行加權平均,來得到最終的質量結果。其優(yōu)勢在于考慮到了不同類型評價對象對最終質量結果的影響程度不同,于是給評價項賦權,權重越大說明該評價項越重要。但是,賦權的過程仍然沒有詳細說明,可能帶有較強的主觀性。其公式如下:
式中,Ci、Pi分別為第i個評價項的數據的度量值及其對應的權重,且Ci∈(0.0,1.0);Pi∈(0.0,1.0);R為數據質量結果,R∈(0.0,1.0);n為評價項數。
本文在前人研究的基礎上,基于GB/T 25000.12-2017標準提出的15個數據質量特性,結合CAD軟件產品數據內容及其特征,構建了一個相對全面,包含數據質量測評指標、數據質量檢測方法和數據質量評價方法的CAD軟件產品數據質量測評體系框架,基于該框架,后續(xù)可針對CAD軟件產品設計開發(fā)數據質量測評系統(tǒng)。
在針對具體CAD軟件產品實施軟件數據質量測評時,要衡量一個軟件產品數據質量的好壞,其質量指標及度量元的合格與否要給出準繩,并給出其權重。這樣的數據需要通過長期積累、總結獲得,同時也需要經過專家的評估確定。因此,在使用基于本文提出的測評體系框架進行軟件數據質量度量還需要做大量的實踐研究工作,深入鉆研。