羅年猛,黃如金,朱 林
(華中科技大學(xué)國家CAD支撐軟件工程技術(shù)研究中心,湖北 武漢430074)
隨著企業(yè)信息化應(yīng)用的不斷深入,人們需要在文字工程數(shù)據(jù)中增加圖形符號。這些工程數(shù)據(jù)有以下特點:(1)文字和圖形混排形成一個整體,不能分開存儲,如圖1中工序內(nèi)容里的粗糙度符號;(2)工程數(shù)據(jù)可能含有多個屬性值,如圖1中工序內(nèi)容含有藍色和紅色的文字。(3)多段文字組合表達工程語義,如圖1中工序內(nèi)容里的尺寸公差。
Figure 1 Content of process圖1 工序內(nèi)容
目前,在圖形和文字混合的工程數(shù)據(jù)中,圖形主要通過圖片或轉(zhuǎn)義字符轉(zhuǎn)換成文本數(shù)據(jù)兩種方式來存儲與表達。圖片的存儲表達方式,不便于修改圖形及相關(guān)屬性。通過轉(zhuǎn)義字符轉(zhuǎn)換成文本數(shù)據(jù)的存儲表達形式,也存在以下不足:(1)當(dāng)圖形類型增多時,轉(zhuǎn)義字符增多,不便于表達管理;(2)復(fù)雜的自定義圖形很難用轉(zhuǎn)義符來表達;(3)因轉(zhuǎn)義被隱藏的圖形很難修改其屬性;(4)圖形通過轉(zhuǎn)義字符表達,缺少必要的工程語義信息,不利于工程數(shù)據(jù)的快速提取。例如,AutoCAD中尺寸公差用“^”、“/”等轉(zhuǎn)義符將上下偏差堆疊在一起;而形位公差卻采用“%%v”等轉(zhuǎn)義符分開形位符號和基準(zhǔn)等[1]。
因此,為解決以上問題,本文針對含有圖形和文字的工程數(shù)據(jù)特點,提出了一種基于XML的工程語義表達模型,并給出了表達模型的實現(xiàn)框架。它既不僅能表達各種自定義的圖形,還能與其他文本信息統(tǒng)一集成,給工程數(shù)據(jù)的顯示以及工程語義的提取帶來了方便,為基于工程語義搜索[2]創(chuàng)造了條件。
我們先來分析圖1中的工程數(shù)據(jù),它包含圖形工程數(shù)據(jù),而且也包含文本信息。首先將其根據(jù)工程語義進行拆分,然后根據(jù)文字和圖形各自的屬性進行拆分,拆分后如圖2所示。
Figure 2 Analysis of engineering data圖2 工程數(shù)據(jù)分析
工程數(shù)據(jù)根據(jù)其表達最終可由文字、直線、圓和曲線等基本元素構(gòu)成。這些基本元素好比語言學(xué)的漢字或者單詞,若干文字、直線、圓和曲線等基本元素組合在一起,在一定的工程背景下能共同表達有意義的語義。為實現(xiàn)工程數(shù)據(jù)(特別是圖形和文字混合的工程數(shù)據(jù))能基于獨立的工程語義表達模型存儲,為下一步研究基于工程語義的檢索技術(shù)[3],實現(xiàn)知識推理打下基礎(chǔ),在此,引入語義元、工程語義和最小工程語義等概念來表達工程數(shù)據(jù)。相關(guān)概念的定義和介紹如下。
定義1 語義元SE(Semantic Entity)指用于表達工程數(shù)據(jù)的最基本的元素,如文字、直線、圓、弧、B樣條曲線和坐標(biāo)等。
語義元可分為文字和圖形等。每類語義元都有屬于自己的屬性。比如,文字語義元有字體名稱、字體大小、粗體、斜體、字符集和文字顏色等屬性,圖形類語義元,如直線,有線型名稱、線型寬度和線型顏色等屬性。每類語義元的屬性部分是該類特有的,部分屬性是相同的,比如語義元的顏色。
語義元只有在一定的工程背景下才能表達有意義的語義。如圖2中的“13.5”、“0”和“-0.1”按照一定格式組合在一起才能表達尺寸公差,否則只是基本文字元素。
定義2 工程語義ES(Engineering Semantics)指在一定工程背景下,若干語義元所表達的有意義的語義。
工程語義還可拆分成若干更小的工程語義和其它若干語義元組成,而更小的工程語義具有表達相互獨立、語義間具有上下文聯(lián)系的特點。好比文章的句子可以由很多詞組和剩下的字組成。
如圖2中“工序內(nèi)容”這一工程語義由“尺寸公差”、“粗糙度”和若干文字語義元共同表達。
定義3 最小工程語義MES(Minimum Engineering Semantics)指那些表達格式標(biāo)準(zhǔn)固定,不能拆分成更小的工程語義,只能拆分成語義元的工程語義,好比語言學(xué)的詞組或者短語。
如圖2中的尺寸公差、粗糙度等都是最小工程語義,因再對其拆分,只能得到文字語義元或直線語義元。
所以根據(jù)工程數(shù)據(jù)的表達,工程數(shù)據(jù)由若干表達相互獨立且具有上下文聯(lián)系的有意義的工程語義組成,如圖3所示。
為了滿足企業(yè)信息化的應(yīng)用需求,以便表達和提取文字和圖形混合的工程數(shù)據(jù),工程數(shù)據(jù)應(yīng)包含管理屬性數(shù)據(jù)、文字屬性數(shù)據(jù)、圖形屬性數(shù)據(jù)、拓展屬性數(shù)據(jù)和工程數(shù)據(jù)內(nèi)容等。為了方便分析,我們首先對最小工程語義(MES)進行建模[4,5]。
最小工程語義的模型定義為:MES=〈MDS,PDS,CDS〉,其中,
(1)MDS(Management Data Set)是 MES的管理屬性的數(shù)據(jù)集合,包含工程語義的名稱、唯一標(biāo)識符、上級工程語義的名稱、上級工程語義的唯一標(biāo)識符、文件的全路徑和版本號等管理屬性。
(2)PDS(Property Data Set)是確定 MES外觀的數(shù)據(jù)集合,PDS=〈SDS,TDS,GDS,EDS〉。
Figure 3 Classification of engineering data圖3 工程數(shù)據(jù)分類
①SDS(Space Data Set)是確定 MES的空間位置的屬性數(shù)據(jù)集合,包含空間區(qū)域中左下角坐標(biāo)、空間區(qū)域的右上角坐標(biāo)、空間分布的對齊方式、首行縮進、左縮進、右縮進和對正方式、欄寬度、行間距和段落間距等屬性數(shù)據(jù)。坐標(biāo)可以是絕對坐標(biāo)系或者相對坐標(biāo)系的值。若為絕對坐標(biāo)系的值,則空間位置不變,若為相對坐標(biāo)系的值,空間位置由工程語義確定。
②TDS(Text Data Set)是確定MES的文字外觀的屬性集合,包含字體名稱、字體高度、字體顏色、粗體、斜體、上劃線、下劃線、字符集、追蹤、寬度因子等跟文字有關(guān)的屬性。
③GDS(Graphic Data Set)是確定 MES的圖形外觀的屬性集合,含有線型、線寬、顏色和圖層等跟圖形有關(guān)的屬性。
④EDS(Expand Data Set)是 MES的拓展屬性數(shù)據(jù)集合,含有環(huán)境、光亮度、加亮、反射和透明度等跟渲染有關(guān)的屬性和工程材料、質(zhì)量、質(zhì)量單位、慣性、慣性單位、體積、體積單位、表面積和表面積單位等跟力學(xué)分析有關(guān)的屬性等等。
(3)CDS(Content Data Set)是確定 MES內(nèi)容的語義元數(shù)據(jù)集合,含有文字、直線、圓、弧和B樣條曲線等語義元。語義元都是參數(shù)化表達,由語義元名稱、定義外觀的PDS和定義形狀的基本參數(shù)序列表達。
①語義元的PDS與工程語義的PDS具有繼承性。比如語義有一顏色屬性為“紅色”,那么語義元的默認顏色為“紅色”,若語義元想顯示為“綠色”,只需將語義元的PDS顏色屬性定為“綠色”。這樣可保證個別語義元PDS屬性的差異性。
②基本參數(shù)序列間采用“;”隔開。比如文字只需“左下角坐標(biāo)”和“文字內(nèi)容”兩個參數(shù),則可只定義其位置和形狀,兩個參數(shù)用分號隔開為“左下角坐標(biāo);文字內(nèi)容”。
由于MES是表現(xiàn)格式,是標(biāo)準(zhǔn)的,所以為了能夠進一步簡化數(shù)據(jù)量,MES內(nèi)容的確定也可由一系列的參數(shù)確定。比如表面粗糙度,可以由粗糙度類型及相關(guān)標(biāo)準(zhǔn)參數(shù)等參數(shù)序列確定。
在定義了MES表達模型之后,我們很容易得到工程數(shù)據(jù)中工程語義表達模型。
工程語義模型定義:ES=〈MESDS〉,其中,
(1)ES(Engineering Semantics)是工程語義;
(2)MESDS(Minimum Engineering Semantics Data Set)是最小工程語義組合而成的具有工程語義的數(shù)據(jù)集合,MESDS= {MES1,MES2,…,MESn};
因此,工程數(shù)據(jù)的分類可如圖3所示。
XML作為數(shù)據(jù)描述工具,不僅能夠完整清晰地表達產(chǎn)品結(jié)構(gòu)和信息內(nèi)容,還具有開放性、擴展性、自描述性和異構(gòu)性等特點,能實現(xiàn)網(wǎng)絡(luò)環(huán)境下的工程數(shù)據(jù)的集成和共享。所以,工程語義的表達模型通過XML語言來表達實現(xiàn),建立模型到XML的映射關(guān)系[6,7]。
為了更好地利用瀏覽器、產(chǎn)品生命周期管理PLM(Product Lifecycle Management)軟件等對XML工程數(shù)據(jù)提供支持,需要建立XML的文檔結(jié)構(gòu)規(guī)范。XML Schema采用XML語法,比DTD(Document Type Definition)具有更強的描述能力、擴展能力和處理維護能力。所以,采用XML Schema語言分別對數(shù)據(jù)類型、工程語義的屬性、語義元和工程語義內(nèi)容數(shù)據(jù)集合等建立XML Schema庫。
數(shù)據(jù)類型、工程語義的屬性和語義元采用XML Schema的simple Type和complex Type元素進行定義,這樣可用Type屬性重復(fù)引用這些類型[8]。下面以工程語義內(nèi)容數(shù)據(jù)集合的XML Schema規(guī)范為例說明,如圖4所示。
Figure 4 XML schema specification of engineering semantics圖4 工程語義XML Schema規(guī)范
工程語義表達模型的實現(xiàn)框架包括文字數(shù)據(jù)和圖形數(shù)據(jù)的輸入/修改/查詢界面、工程數(shù)據(jù)顯示界面、編譯器(XML接口組件和XML Schema規(guī)范)和數(shù)據(jù)庫四部分,如圖5所示。
Figure 5 Model framework圖5 模型實現(xiàn)框架
輸入/修改/查詢界面方便用戶按照模型的格式輸入、修改和查詢相關(guān)的工程數(shù)據(jù),同時能根據(jù)事件響應(yīng)XML接口組件;顯示界面接收XML接口組件傳送過來的數(shù)據(jù),直觀顯示工程數(shù)據(jù);編譯器主要由XML接口組件和XML Schema庫組成,XML接口組件包括工程數(shù)據(jù)接收、判斷、修改、排版計算、查詢、存儲和輸出等接口,XML Schema庫為工程數(shù)據(jù)格式的判斷標(biāo)準(zhǔn);數(shù)據(jù)庫存儲的工程數(shù)據(jù)是基于表達模型建立的,有利于PLM的集成和共享。中,并取得了很好的效果。下面以天喻CAPP工藝卡片的應(yīng)用為例進行說明。要在CAPP工藝卡片中顯示如圖1所示的工程數(shù)據(jù),需要打開如圖6所示的二維表文字輸入界面,此界面是一個所見即所得的界面,可以直接輸入文字和特殊圖形,可以直接修改輸入的文字的屬性,如字型、大小和顏色等。而想輸入特殊圖形需要打開相應(yīng)的圖形輸入界面,如圖7的尺寸公差輸入界面和圖8的粗糙度輸入界面。保存文字和圖形混合的工程數(shù)據(jù)時,還需要經(jīng)過編譯器按照表達模型規(guī)則編譯后,才能夠保存到數(shù)據(jù)庫中。圖9為工程數(shù)據(jù)內(nèi)容經(jīng)編譯器解析后的XML數(shù)據(jù),它將被存儲到數(shù)據(jù)庫中,以便PLM集成管理。
Figure 6 Text input interface of two-dimensional table圖6 二維表文字輸入界面
該表達模型已應(yīng)用到天喻CAD和天喻CAPP
Figure 7 Input interface of dimensional tolerances圖7 尺寸公差輸入界面
Figure 8 Input interface of roughness symbol圖8 粗糙度符號輸入界面
Figure 9 XML data圖9 XML數(shù)據(jù)
本文在分析含有圖形和文字的工程數(shù)據(jù)的特點后,提出了一種基于XML的工程語義表達模型,并給出了表達模型的實現(xiàn)框架,它不僅能表達各種自定義的圖形工程數(shù)據(jù),而且還能與其他文本信息統(tǒng)一集成表達。該表達模型應(yīng)用在CAD和CAPP等軟件中,取得了很好的效果,為進一步研究解析后的XML工程數(shù)據(jù)的查詢檢索方法,實現(xiàn)知識推理做好了鋪墊。
[1] Cheng Jing.AutoCAD engineering drawings and secondary development of technology[M].1st edition.Beijing:National Defense Industry Press,2008.(in Chinese)
[2] Przybylinski S.CAD and analysis:Who’s on first?[C]∥Proc of PLM Market &Industry Forum,2012:1.
[3] Gong Jiao-teng.The status,bottlenecks and trends analysis of network information retrieval technology[J].Journal of Information,2004,23(5):75-77.(in Chinese)
[4] Dong Min-qin,Zhu Lin.CAPP card modeling in graphic environment[J].Mechanical Engineer,2006(10):49-51.(in Chinese)
[5] Chen Lei,Pan Xiang,Ye Xiu-zi,et al.Ontology-based product knowledge representation and retrieval[J].Journal of Zhejiang University(Engineering Science),2008,42(12):2037-2042.(in Chinese)
[6] Pan Shun,Jin Yuan-ping,Ouyang Ye.Semantic mapping from structured data to XML data[J].Journal of Southeast University(Natural Science Edition),2002,32(3):1-4.(in Chi-nese)
[7] Chen Wan-ling,Chen Zhuo-ning,Bin Hong-zan,et al.The expression of process planning information and its application based on XML[J].Journal of Huazhong University of Science and Technology(Nature Science Edition),2006,34(3):46-49.(in Chinese)
[8] Hunter D,Rafter J,F(xiàn)awcett J,et al.Beginning XML[M].4th edition.Wu Wen-guo,translation.Beijing:Tsinghua U-niversity Press,2009.(in Chinese)
附中文參考文獻:
[1] 程靜.AutoCAD工程繪圖及二次開發(fā)技術(shù)[M].第1版.北京:國防工業(yè)出版社,2008.
[3] 龔蛟騰.網(wǎng)絡(luò)信息檢索技術(shù)現(xiàn)狀、瓶頸及趨勢分析[J].情報雜志,2004,23(5):75-77.
[4] 董敏欽,朱林.基于圖形環(huán)境的工藝卡片建模研究[J].機械工程師,2006(10):49-51.
[5] 陳磊,潘翔,葉修梓,等.基于本體的產(chǎn)品知識表達和檢索技術(shù)研究[J].浙江大學(xué)學(xué)報(工學(xué)版),2008,42(12):2037-2042.
[6] 潘順,金遠平,歐陽曄.結(jié)構(gòu)化數(shù)據(jù)到XML數(shù)據(jù)的語義映射[J].東南大學(xué)學(xué)報(自然科學(xué)版),2002,32(3):1-4.
[7] 陳萬領(lǐng),陳卓寧,賓鴻贊,等.基于XML的工藝信息表達方法研究與實踐[J].華中科技大學(xué)學(xué)報(自然科學(xué)版),2006,34(3):46-49.
[8] 亨特,拉夫特,福思特,等.XML入門經(jīng)典[M].第4版.吳文國譯.北京:清華大學(xué)出版社,2009.