涂建偉,李 彥,李文強(qiáng),熊 艷
(四川大學(xué) 制造科學(xué)與工程學(xué)院,四川 成都 610065)
知識(shí)經(jīng)濟(jì)時(shí)代,創(chuàng)新已經(jīng)成為了企業(yè)生存與發(fā)展的生命線,企業(yè)也在產(chǎn)品創(chuàng)新設(shè)計(jì)方面逐漸增加資源投入。而產(chǎn)品創(chuàng)新設(shè)計(jì)的基礎(chǔ)很大程度上取決于其知識(shí)的擁有量以及對(duì)知識(shí)的利用程度。如何從企業(yè)積累的眾多知識(shí)資源中檢索相關(guān)知識(shí)以支持產(chǎn)品設(shè)計(jì)過(guò)程,成為知識(shí)管理系統(tǒng)和輔助創(chuàng)新設(shè)計(jì)系統(tǒng)迫切需要解決的問(wèn)題。
充足的知識(shí)資源是進(jìn)行產(chǎn)品創(chuàng)新設(shè)計(jì)的重要基礎(chǔ)[1]。獲取大量有效的設(shè)計(jì)知識(shí)是激勵(lì)創(chuàng)新設(shè)計(jì)過(guò)程、實(shí)現(xiàn)問(wèn)題求解的關(guān)鍵。然而,輔助創(chuàng)新設(shè)計(jì)過(guò)程不是簡(jiǎn)單的知識(shí)獲取和數(shù)據(jù)查詢,在已有的基礎(chǔ)上進(jìn)行知識(shí)重用和參數(shù)確定,更重要的是獲取原理效應(yīng)和設(shè)計(jì)方法上的激勵(lì),以利于創(chuàng)新方案的產(chǎn)生。這種要求使得面向創(chuàng)新設(shè)計(jì)的知識(shí)的組織與檢索不能像文獻(xiàn)檢索、數(shù)據(jù)類知識(shí)檢索一樣,單純地使用關(guān)鍵詞檢索、全文檢索等知識(shí)檢索方法,而表現(xiàn)出一些獨(dú)有的特征:
(1)輔助創(chuàng)新設(shè)計(jì)的知識(shí),檢索的對(duì)象不僅僅是知識(shí)條目本身,多數(shù)情況下是檢索與設(shè)計(jì)問(wèn)題具有相關(guān)或相似功能原理屬性的設(shè)計(jì)知識(shí)來(lái)激勵(lì)創(chuàng)新設(shè)計(jì)的產(chǎn)生,知識(shí)檢索術(shù)語(yǔ)甚至都不會(huì)出現(xiàn)在輔助創(chuàng)新設(shè)計(jì)知識(shí)條目中,因此目前計(jì)算機(jī)輔助創(chuàng)新(Computer Aided Innovation,CAI)軟件多數(shù)也是構(gòu)建檢索本體(功能本體、發(fā)明問(wèn)題解決理論(Theory of Invention Problem Solving,TRIZ)等)輔助進(jìn)行知識(shí)檢索,而不是簡(jiǎn)單地應(yīng)用關(guān)鍵詞匹配。
(2)用于組織與檢索輔助創(chuàng)新設(shè)計(jì)知識(shí)的檢索本體具有高度的抽象性與概括性,設(shè)計(jì)者如果像一般設(shè)計(jì)過(guò)程一樣,采用關(guān)鍵字或者自然語(yǔ)言的形式描述檢索意圖,則很難直接匹配到檢索本體進(jìn)行知識(shí)檢索,從而使得問(wèn)題描述和設(shè)計(jì)求解之間顯得相對(duì)脫節(jié),需要采取相應(yīng)的措施輔助設(shè)計(jì)者進(jìn)行檢索需求表達(dá)與計(jì)算機(jī)語(yǔ)義理解的過(guò)渡。
(3)由于難以對(duì)各領(lǐng)域設(shè)計(jì)知識(shí)進(jìn)行統(tǒng)一表達(dá),面向創(chuàng)新設(shè)計(jì)的知識(shí)檢索是關(guān)鍵詞檢索、功能基檢索、設(shè)計(jì)案例檢索等檢索方式的綜合結(jié)果,且檢索過(guò)程具有一定的連貫性與發(fā)散性,面向不同設(shè)計(jì)階段、不同層次設(shè)計(jì)經(jīng)驗(yàn)的設(shè)計(jì)人員,以及對(duì)輔助創(chuàng)新系統(tǒng)熟悉程度不同的設(shè)計(jì)人員,需要考慮相應(yīng)的計(jì)算機(jī)程序進(jìn)行輔助。
為合理地利用已有知識(shí)資源進(jìn)行創(chuàng)新設(shè)計(jì),國(guó)內(nèi)外專家學(xué)者對(duì)產(chǎn)品創(chuàng)新設(shè)計(jì)過(guò)程中的知識(shí)檢索進(jìn)行了大量研究,主要集中在基于功能本體的知識(shí)組織與檢索[2]、基于TRIZ理論的知識(shí)組織與檢索[3]、基于實(shí)例推理(Case-Based Reasoning,CBR)技術(shù)的知識(shí)組織與檢索[4]以及在線設(shè)計(jì)資源檢索[5]等幾個(gè)方面。其中基于功能本體和基于TRIZ理論的知識(shí)組織與檢索方式結(jié)構(gòu)清晰,計(jì)算機(jī)實(shí)現(xiàn)較為容易,成為了CAI系統(tǒng)的主流知識(shí)組織與檢索方式,但是設(shè)計(jì)知識(shí)的組織與表達(dá)以及功能本體的構(gòu)建較為困難;基于CBR技術(shù)的知識(shí)組織與檢索方式需要較為龐大的知識(shí)庫(kù)體系與知識(shí)推理機(jī)制;在線設(shè)計(jì)資源檢索主要是在線專利抽取技術(shù),是目前正在研究的熱點(diǎn)之一。并且借助計(jì)算機(jī)強(qiáng)大的運(yùn)算和存儲(chǔ)能力,國(guó)內(nèi)外研究者開(kāi)發(fā)了一系列的CAI系統(tǒng)。其中大部分基于TRIZ理論,如IMC公司開(kāi)發(fā)的Goldfire[6]、CREAX NV-Mlk公司開(kāi)發(fā)的 CREAX Innovator Suite[7],以及億維訊公司開(kāi)發(fā)的 Pro/Innovator[8]等。Goldfire和CREAX都是全英文的CAI軟件,Goldfire支持英文關(guān)鍵字檢索與功能檢索,基本不支持語(yǔ)義擴(kuò)展查詢,CREAX支持英文關(guān)鍵詞檢索和功能檢索,有英文自然語(yǔ)義檢索相關(guān)設(shè)計(jì),但功能很弱,在專利在線檢索與分析、案例檢索上有自己的特色;Pro/Innovator是中文界面、英文內(nèi)核的CAI軟件,支持中文、英文關(guān)鍵詞檢索、功能檢索與中英文自然語(yǔ)言擴(kuò)展查詢,但中文擴(kuò)展查詢能力很弱,很多情況下使用英文進(jìn)行檢索時(shí)可以通過(guò)擴(kuò)展查詢得到所要的設(shè)計(jì)知識(shí),如果使用相同意思的中文進(jìn)行擴(kuò)展查詢則往往收效甚微。如表1所示。
表1 常用CAI軟件的知識(shí)檢索方式及其特性
這些CAI軟件在知識(shí)檢索方面都存在一個(gè)共同的較為突出的不足——自然語(yǔ)言擴(kuò)展查詢能力較弱,使得設(shè)計(jì)者不能通過(guò)自由描述功能需求查找設(shè)計(jì)知識(shí)進(jìn)行創(chuàng)新激勵(lì),必須先根據(jù)問(wèn)題分析和自身經(jīng)驗(yàn)分析得到設(shè)計(jì)問(wèn)題的功能原理屬性,才能檢索調(diào)用設(shè)計(jì)知識(shí),從而造成了輔助創(chuàng)新設(shè)計(jì)系統(tǒng)問(wèn)題分析與知識(shí)檢索在設(shè)計(jì)流程上的相對(duì)脫節(jié)。這是因?yàn)閯?chuàng)新設(shè)計(jì)過(guò)程是在產(chǎn)品功能原理結(jié)構(gòu)層次上的創(chuàng)新,輔助創(chuàng)新系統(tǒng)中設(shè)計(jì)知識(shí)大都通過(guò)功能基或者TRIZ原理進(jìn)行組織管理,而工程參數(shù)、發(fā)明原理等TRIZ原理由于數(shù)量有限,可以采用下拉菜單選擇的方式進(jìn)行知識(shí)檢索,功能基則一般數(shù)量較多且相當(dāng)抽象,自然語(yǔ)言所描述的功能原理屬性難以被計(jì)算機(jī)所理解,往往造成檢索失效的情況。特別是采用中文組織與表達(dá)設(shè)計(jì)知識(shí)的輔助創(chuàng)新設(shè)計(jì)系統(tǒng),由于漢語(yǔ)在檢索過(guò)程中表現(xiàn)的多義性與歧義性[9],使得中文輔助創(chuàng)新設(shè)計(jì)系統(tǒng)的知識(shí)檢索更加復(fù)雜。
本文主要針對(duì)CAI在中文知識(shí)檢索方面的不足進(jìn)行探討,提出了一種基于共指關(guān)系擴(kuò)展的面對(duì)面的知識(shí)檢索方法,實(shí)現(xiàn)“問(wèn)題分析模塊”到“知識(shí)檢索模塊”的無(wú)縫過(guò)渡。采用“共指關(guān)系索引—檢索本體—設(shè)計(jì)知識(shí)”三層映射結(jié)構(gòu)表達(dá)設(shè)計(jì)知識(shí),通過(guò)解析設(shè)計(jì)者采用“如何+動(dòng)詞+名詞”規(guī)范化描述的“自然語(yǔ)言”檢索意圖,得到檢索動(dòng)名詞詞對(duì),利用互信息技術(shù)計(jì)算概念術(shù)語(yǔ)間的關(guān)聯(lián)權(quán)重,最終匹配到與需求描述相符的可能的目標(biāo)功能基,再調(diào)用已構(gòu)建好的功能原理索引[10]進(jìn)行知識(shí)查詢。同時(shí),將得到的問(wèn)題需求描述與目標(biāo)功能基之間的映射關(guān)系建立案例關(guān)聯(lián),并更新共指關(guān)系索引,在下次遇到相同或者類似問(wèn)題時(shí),可以輔助設(shè)計(jì)者表達(dá)檢索意圖并主動(dòng)推薦可能的目標(biāo)功能基,在一定程度上使得設(shè)計(jì)經(jīng)驗(yàn)得以傳承。
在產(chǎn)品設(shè)計(jì)中,設(shè)計(jì)知識(shí)是能用于產(chǎn)品設(shè)計(jì)與決策的各種信息與經(jīng)驗(yàn)的總和。根據(jù)其對(duì)產(chǎn)品創(chuàng)新設(shè)計(jì)過(guò)程的不同作用以及不同的知識(shí)來(lái)源,可將其分為原理類知識(shí)、綜合類知識(shí)和領(lǐng)域類知識(shí)三類[11],如圖1所示。原理類知識(shí)是對(duì)設(shè)計(jì)過(guò)程高度抽象的知識(shí),是用戶功能需求的實(shí)現(xiàn)原理,主要目的是為設(shè)計(jì)功能的實(shí)現(xiàn)提供創(chuàng)新規(guī)律知識(shí),包含設(shè)計(jì)原理、創(chuàng)造發(fā)明原理和產(chǎn)品進(jìn)化原理等;綜合類知識(shí)是存在于多個(gè)學(xué)科中的學(xué)科原理知識(shí),以及通過(guò)對(duì)這些原理進(jìn)行處理得到的反映其聯(lián)系的知識(shí),主要目的是為設(shè)計(jì)原理的實(shí)現(xiàn)提供策略知識(shí),如專利知識(shí),科學(xué)效應(yīng)知識(shí)和多學(xué)科優(yōu)化原理知識(shí)等;領(lǐng)域類知識(shí)是根據(jù)設(shè)計(jì)需要,通過(guò)歸納整理得到的不同領(lǐng)域的具體設(shè)計(jì)知識(shí),主要目的是為設(shè)計(jì)策略的實(shí)施提供專業(yè)知識(shí)支撐,包括專題知識(shí)、實(shí)例知識(shí)、設(shè)計(jì)文檔和設(shè)計(jì)圖紙等。
目前常用的知識(shí)檢索模式是“設(shè)計(jì)目錄—設(shè)計(jì)知識(shí)”的點(diǎn)對(duì)面的關(guān)鍵詞檢索,這種檢索模式結(jié)構(gòu)簡(jiǎn)單,計(jì)算機(jī)實(shí)現(xiàn)比較容易,但是由于用于組織設(shè)計(jì)知識(shí)的“設(shè)計(jì)目錄”一般都較為抽象,在創(chuàng)新設(shè)計(jì)過(guò)程中,設(shè)計(jì)者往往由于難以提取抽象的設(shè)計(jì)目錄而導(dǎo)致檢索失效,不利于產(chǎn)生創(chuàng)新設(shè)計(jì)方案。本文根據(jù)上述面向創(chuàng)新設(shè)計(jì)知識(shí)在知識(shí)檢索方面的特征,提出了一種“共指關(guān)系索引—功能本體—設(shè)計(jì)知識(shí)”三層映射關(guān)系的面對(duì)面的知識(shí)檢索模式。如圖2所示。其基本思想為:①按照設(shè)計(jì)流程中知識(shí)的使用情況將知識(shí)歸類,使知識(shí)的檢索與調(diào)用更有針對(duì)性;②整理輔助創(chuàng)新設(shè)計(jì)領(lǐng)域內(nèi)的領(lǐng)域術(shù)語(yǔ)(功能基、TRIZ原理等)構(gòu)建檢索本體,作為設(shè)計(jì)知識(shí)的檢索載體;③對(duì)檢索本體的概念詞匯進(jìn)行關(guān)聯(lián)擴(kuò)展,獲取與每個(gè)概念詞匯具有語(yǔ)義關(guān)聯(lián)或者設(shè)計(jì)案例關(guān)聯(lián)的擴(kuò)展概念詞匯及其關(guān)聯(lián)權(quán)重,構(gòu)建檢索本體共指關(guān)系索引庫(kù);④利用共指關(guān)系索引或者共指關(guān)系在線匹配算法,對(duì)設(shè)計(jì)問(wèn)題需求描述進(jìn)行初步檢索,匹配到可能的功能本體,通過(guò)設(shè)計(jì)者確認(rèn)捕捉到設(shè)計(jì)者的檢索意圖后,調(diào)用功能本體檢索模塊檢索相應(yīng)的設(shè)計(jì)知識(shí);⑤將建立的問(wèn)題描述與設(shè)計(jì)問(wèn)題的功能本體之間的映射關(guān)系存入并更新共指關(guān)系庫(kù),便于下次檢索類似問(wèn)題,并對(duì)同一設(shè)計(jì)問(wèn)題所對(duì)應(yīng)的可能的多個(gè)功能基進(jìn)行排序,從而在一定程度上實(shí)現(xiàn)設(shè)計(jì)經(jīng)驗(yàn)的傳承。
由圖2可知,本文提出的語(yǔ)義檢索模型的關(guān)鍵技術(shù)在于:①基于功能本體的設(shè)計(jì)知識(shí)的組織與表達(dá),根據(jù)設(shè)計(jì)過(guò)程對(duì)輔助創(chuàng)新設(shè)計(jì)知識(shí)資源的需求進(jìn)行知識(shí)的組織與構(gòu)庫(kù),形成本體網(wǎng)絡(luò)知識(shí)體系作為知識(shí)檢索模塊的檢索本體;②基于語(yǔ)義關(guān)聯(lián)和設(shè)計(jì)案例關(guān)聯(lián)對(duì)檢索本體進(jìn)行關(guān)聯(lián)分析與處理,確定設(shè)計(jì)需求描述與檢索本體概念詞匯間的關(guān)聯(lián)算法及其關(guān)聯(lián)權(quán)重,構(gòu)建檢索本體共指關(guān)系索引。
創(chuàng)新設(shè)計(jì)過(guò)程中的設(shè)計(jì)知識(shí)通過(guò)檢索本體層、知識(shí)索引層、設(shè)計(jì)知識(shí)層三層映射結(jié)構(gòu)的知識(shí)表達(dá)體系來(lái)描述。
(1)檢索本體層 檢索本體是產(chǎn)品創(chuàng)新設(shè)計(jì)領(lǐng)域內(nèi)的概念以及這些概念間的關(guān)系的形式化表達(dá),用于規(guī)范化、標(biāo)準(zhǔn)化地表示設(shè)計(jì)知識(shí)。包括用于組織設(shè)計(jì)知識(shí)的功能本體、TRIZ原理,以及設(shè)計(jì)知識(shí)的領(lǐng)域概念屬性等。
(2)知識(shí)索引層 知識(shí)索引層是借助檢索本體中的概念,對(duì)設(shè)計(jì)知識(shí)庫(kù)中的每條設(shè)計(jì)知識(shí)資源進(jìn)行知識(shí)標(biāo)注形成的具有統(tǒng)一語(yǔ)義信息的知識(shí)庫(kù),提供對(duì)設(shè)計(jì)知識(shí)資源的知識(shí)屬性與內(nèi)容的管理。
(3)設(shè)計(jì)知識(shí)層 指用于產(chǎn)品設(shè)計(jì)過(guò)程的原理效應(yīng)知識(shí)、設(shè)計(jì)方法知識(shí)、產(chǎn)品結(jié)構(gòu)知識(shí)、設(shè)計(jì)文檔和產(chǎn)品模型等,如2.1節(jié)所述。本文所處理的設(shè)計(jì)知識(shí)資源是設(shè)計(jì)人員歸納整理的支撐產(chǎn)品創(chuàng)新設(shè)計(jì)過(guò)程的各種設(shè)計(jì)文檔和設(shè)計(jì)模型。
需要特別說(shuō)明的是,本文的知識(shí)索引層有兩層:①設(shè)計(jì)知識(shí)的知識(shí)索引層,主要實(shí)現(xiàn)對(duì)設(shè)計(jì)知識(shí)的標(biāo)引與抽??;②檢索本體的共指關(guān)系索引層,主要為輔助設(shè)計(jì)人員表達(dá)檢索意圖,實(shí)現(xiàn)對(duì)檢索本體的標(biāo)引和抽取。共指關(guān)系索引層、檢索本體層和設(shè)計(jì)知識(shí)索引層具有統(tǒng)一的術(shù)語(yǔ)和概念表達(dá)體系。設(shè)計(jì)者的設(shè)計(jì)問(wèn)題描述通過(guò)共指關(guān)系索引匹配轉(zhuǎn)換成對(duì)應(yīng)的本體概念集,然后在本體概念的映射下,從設(shè)計(jì)知識(shí)索引庫(kù)中匹配到符合條件的設(shè)計(jì)知識(shí),進(jìn)而獲取包含該索引知識(shí)的知識(shí)資源。
檢索本體是CAI設(shè)計(jì)系統(tǒng)用于知識(shí)組織與檢索的關(guān)鍵屬性,也是功能基檢索、發(fā)明原理檢索,以及自然語(yǔ)言檢索及其語(yǔ)義擴(kuò)展的基礎(chǔ)。結(jié)合CAI設(shè)計(jì)過(guò)程以及輔助創(chuàng)新設(shè)計(jì)知識(shí)庫(kù)的構(gòu)建,本文將CAI設(shè) 計(jì) 系 統(tǒng) (CAIP(computer aided innovation platform)系統(tǒng))的檢索本體定義為一個(gè)四元組RO={ontC,ontF,ontP,ontR},其中 RO(Retrieval Ontology)表示檢索本體,ontC表示設(shè)計(jì)知識(shí)所屬的領(lǐng)域概念,ontF表示設(shè)計(jì)知識(shí)所具有的功能屬性,ontP表示設(shè)計(jì)知識(shí)所具有的TRIZ原理,ontR表示設(shè)計(jì)知識(shí)中各種概念之間關(guān)系的集合。如圖3所示。
ontC表示設(shè)計(jì)知識(shí)所屬的領(lǐng)域概念實(shí)體的集合,標(biāo)志知識(shí)條目所屬的背景信息、方案信息、領(lǐng)域?qū)傩缘然拘畔ⅲ约霸O(shè)計(jì)知識(shí)所描述的領(lǐng)域功能的基礎(chǔ)詞匯(如凸輪、絲杠等),即設(shè)計(jì)知識(shí)的領(lǐng)域詞典,主要體現(xiàn)在領(lǐng)域知識(shí)庫(kù)和專題知識(shí)庫(kù)中,可用于領(lǐng)域結(jié)構(gòu)確定、專題設(shè)計(jì)等過(guò)程進(jìn)行領(lǐng)域關(guān)鍵詞檢索。
ontF表示設(shè)計(jì)知識(shí)所屬的功能本體的集合,是對(duì)設(shè)計(jì)知識(shí)條目組織的一種結(jié)構(gòu)化描述。功能本體是人工收集的用于CAI的概念和創(chuàng)新功能原理等的集合。通過(guò)將設(shè)計(jì)知識(shí)所描述的知識(shí)在功能原理層進(jìn)行抽象,得到其所含的功能本體,就可以在一定程度上實(shí)現(xiàn)設(shè)計(jì)知識(shí)的遷移與重用,而不受設(shè)計(jì)領(lǐng)域的限制,從而在較大程度上開(kāi)拓設(shè)計(jì)者的思路,形成多學(xué)科融合的設(shè)計(jì)方案。在CAI系統(tǒng)中,功能本體的構(gòu)建與使用已經(jīng)是比較成熟的技術(shù),一般采用“功能動(dòng)詞+流名詞”的形式來(lái)表示,因此功能本體一般也包含操作屬性與流屬性兩個(gè)部分,“操作屬性”描述功能的作用方式,“流屬性”描述操作的對(duì)象。在CAIP系統(tǒng)中,作為操作屬性的功能動(dòng)詞分為分離、穩(wěn)定、產(chǎn)生、移動(dòng)、改變、吸收、檢測(cè)、積累和結(jié)合9個(gè)基本子類,這些動(dòng)詞根據(jù)需要進(jìn)一步細(xì)化為二級(jí)功能屬性與三級(jí)功能屬性;作為流屬性的名詞分為物質(zhì)流、能量流、信息流三個(gè)基本子類,并且同樣根據(jù)需要做了進(jìn)一步的細(xì)化。如圖4所示。
ontP表示設(shè)計(jì)知識(shí)所具有的TRIZ原理的集合。根據(jù)TRIZ理論,原理本體可以分為40條發(fā)明原理、76個(gè)標(biāo)準(zhǔn)解、11條進(jìn)化法則、分離原理等子類,并按照TRIZ理論中的結(jié)構(gòu)體系關(guān)系建立這些子類之間的關(guān)系。例如使用沖突解決矩陣可以建立技術(shù)沖突與發(fā)明原理間的對(duì)應(yīng)關(guān)系。
ont R表示設(shè)計(jì)知識(shí)各種概念之間關(guān)系的集合。主要描述設(shè)計(jì)知識(shí)實(shí)體所包含的基本概念術(shù)語(yǔ)、領(lǐng)域?qū)傩缘戎g的相互關(guān)系,以及設(shè)計(jì)知識(shí)實(shí)體與功能本體或原理本體中的各種概念之間一對(duì)一、一對(duì)多、或者多對(duì)多的映射關(guān)系的集合。如表2所示。
表2 概念間的語(yǔ)義關(guān)系表
3.3.1 共指關(guān)系索引庫(kù)
共指關(guān)系索引庫(kù)是由與檢索本體概念詞匯關(guān)聯(lián)度為W0的概念詞匯組成的檢索本體關(guān)聯(lián)擴(kuò)展詞庫(kù)。W0表示擴(kuò)展的概念詞匯與檢索本體概念詞匯間的關(guān)聯(lián)R(Ci,Cj)的關(guān)聯(lián)權(quán)重,其值越大,則Ci和Cj的關(guān)聯(lián)程度越高。
共指關(guān)系索引作為問(wèn)題描述與檢索功能基之間的橋梁,使得問(wèn)題分析與知識(shí)檢索間采用自然語(yǔ)言無(wú)縫連接成為可能。主要采用語(yǔ)義關(guān)聯(lián)與設(shè)計(jì)案例關(guān)聯(lián)兩種方法構(gòu)建,其基本思想為:以檢索本體RO為中心,建立檢索本體概念詞匯的同義關(guān)系詞、同類關(guān)系詞、上下位關(guān)系詞、結(jié)構(gòu)關(guān)系詞、特征關(guān)系詞和功能關(guān)系詞等的語(yǔ)義共指關(guān)系網(wǎng),并通過(guò)學(xué)習(xí)設(shè)計(jì)案例問(wèn)題描述與設(shè)計(jì)者選擇確定的目標(biāo)功能基之間的案例關(guān)聯(lián)建立映射關(guān)系,形成“概念詞匯—目標(biāo)功能基”的共指關(guān)系映射網(wǎng),構(gòu)建檢索本體共指關(guān)系索引庫(kù)。如圖5所示。
3.3.2 語(yǔ)義擴(kuò)展算法
在語(yǔ)義擴(kuò)展中,擴(kuò)展的概念詞匯S與檢索本體之間采用點(diǎn)互信息 算法[12](Pointwise Mutual In-formation,PMI)計(jì)算檢索候選詞與目標(biāo)功能基詞匯之間的相似度,并根據(jù)相似度進(jìn)行從大到小的排序,對(duì)功能基詞匯進(jìn)行擴(kuò)展,預(yù)先形成檢索本體語(yǔ)義擴(kuò)展詞庫(kù)。檢索候選詞(candidateWord)與目標(biāo)功能基詞匯(function Word)的PMI計(jì)算公式如下:
其中:p(candidateWord,function Word)表示候選詞(candidateWord)與目標(biāo)功能基詞匯(function-Word)的共現(xiàn)概率,p(candidate Word)表示候選詞出現(xiàn)的概率,p(function Word)表示目標(biāo)功能詞匯出現(xiàn)的概率。系統(tǒng)借助百度搜索引擎來(lái)計(jì)算這三個(gè)概率值,如p(word)=count(word)/N,count(word)表示詞word通過(guò)百度搜索得到的文檔數(shù),N表示文檔總數(shù),由于N是固定的,在計(jì)算時(shí)將其忽略。式(1)變化為式(2):
N表示文檔總數(shù),對(duì)于每一對(duì)(candidate Word,function Word)來(lái)說(shuō)都是固定的,而對(duì)擴(kuò)展工作來(lái)說(shuō)具體的值并不十分重要,重要的是值的大小關(guān)系,因而在具體計(jì)算的過(guò)程中N值被忽略。
擴(kuò)展的候選詞有兩個(gè)來(lái)源,對(duì)于一個(gè)功能基詞匯而言,其候選集一部分來(lái)源于同義詞詞林中與它處在同一個(gè)同義詞集中的那些詞,另一部分則來(lái)源于該詞的百度名片信息,將名片信息分詞,提取出其中與其具有相同詞性的詞作為候選詞。然后,對(duì)于每一個(gè)功能基詞匯,計(jì)算它與候選集中每一個(gè)詞的相似度,按照從大到小的順序進(jìn)行排列,從而形成功能本體語(yǔ)義擴(kuò)展詞庫(kù)。具體語(yǔ)義擴(kuò)展算法如下:
Algorithm UnHisQuery(String VN)
Input:用戶選擇的動(dòng)名詞詞對(duì)VN
Output:該動(dòng)名詞詞對(duì)對(duì)應(yīng)的可能的功能基列表list
1) 動(dòng)名詞詞對(duì)VN分解為動(dòng)詞V和名詞N
2) If V不為功能動(dòng)詞then
3) If V在索引中then
4) 從索引中獲取V的候選功能詞集合Vset,并且記錄對(duì)應(yīng)的權(quán)值;
5) Else計(jì)算V與功能動(dòng)詞集合FGVSet中的每一個(gè)詞的相似度;
6) 選擇相似度從大到小的前k個(gè)詞匯作為詞匯V的候選功能詞集合Vset,
7) 更新索引文件;
8) Endif
9) Else候選功能詞集合Vset中僅含有動(dòng)詞V一個(gè)元素
10) Endif
11) For each v Vset do
12) 獲取可以和v組合成功能的名詞詞匯集合Nset;
13) If N在索引中then
14) 獲取N的候選功能詞集合Nset1,
15) If Nset Nset1!=null then
16) 將交集中每個(gè)名詞和v搭配的功能基及其權(quán)值加入功能基列表list.
17) Else計(jì)算N與功能名詞集合FGNSet中詞匯的相似度,
18) 選取相似度最大的前k個(gè)詞作為該名詞的候選功能詞匯集合Nset1;
19) 更新索引文件;
20) 將Nset1與Nset交集中各名詞和v搭配的功能基及其權(quán)值加入列表list.
21) Endif
22) Else計(jì)算N與功能名詞集合FGNSet中詞匯的相似度,
23) 選取相似度最大的前k個(gè)詞作為該名詞的候選功能詞匯集合Nset1;
24) 更新索引文件;
25) 將Nset1與Nset交集中各名詞和v搭配的功能基及其權(quán)值加入列表list.
26) Endif
27) Endfor
28) 根據(jù)權(quán)值從小到大對(duì)list進(jìn)行排序;
29) 將權(quán)值小于閾值e的功能基移出list;
30) Return list;
3.3.3 共指關(guān)系匹配流程
檢索功能基的共指關(guān)系匹配包括四個(gè)過(guò)程,如圖6所示。其中:
(1)當(dāng)設(shè)計(jì)者輸入查詢請(qǐng)求后,通過(guò)計(jì)算機(jī)語(yǔ)義理解及設(shè)計(jì)者的確認(rèn)得到檢索動(dòng)名詞對(duì),檢索系統(tǒng)首先檢查共指關(guān)系庫(kù)索引,若已經(jīng)存在該動(dòng)名詞詞對(duì)的共指關(guān)系索引,則調(diào)用使用日志對(duì)功能基進(jìn)行排序后直接返回給設(shè)計(jì)者。
(2)若共指關(guān)系庫(kù)中不存在該檢索索引,則調(diào)用共指關(guān)系匹配算法,對(duì)檢索動(dòng)名詞進(jìn)行擴(kuò)展匹配。其過(guò)程為首先檢查查詢動(dòng)名詞檢索歷史文件,若歷史存在對(duì)該動(dòng)詞或者名稱的擴(kuò)展歷史,則直接調(diào)用其擴(kuò)展詞匯及其對(duì)應(yīng)的PMI值,若不存在則聯(lián)網(wǎng)基于百度百科進(jìn)行在線擴(kuò)展,并將擴(kuò)展結(jié)果存入動(dòng)名詞擴(kuò)展查詢歷史記錄數(shù)據(jù)庫(kù)。然后將動(dòng)名詞詞對(duì)及其擴(kuò)展詞匯與系統(tǒng)功能基進(jìn)行配對(duì),將可能的系統(tǒng)功能基返回給設(shè)計(jì)者,再經(jīng)過(guò)設(shè)計(jì)確認(rèn)得到檢索功能基。
(3)在上述兩種方式均匹配無(wú)效的少數(shù)情況下,則根據(jù)檢索動(dòng)名詞詞對(duì)與所有功能基概念詞匯之間的PMI值對(duì)功能基進(jìn)行排序,返回給設(shè)計(jì)者所有的功能基,由設(shè)計(jì)者自行根據(jù)設(shè)計(jì)問(wèn)題分析確認(rèn)該問(wèn)題的功能基,或者通過(guò)設(shè)計(jì)者更加深入地分析重新描述檢索需求,再次調(diào)用檢索系統(tǒng)進(jìn)行共指關(guān)系匹配。
(4)無(wú)論根據(jù)上述哪種方式匹配得到檢索功能基,由檢索模塊自學(xué)習(xí)機(jī)制根據(jù)用戶選擇,建立檢索動(dòng)名詞對(duì)與檢索功能基間的共指關(guān)系索引對(duì)共指關(guān)系索引庫(kù)進(jìn)行更新,并將用戶選擇寫(xiě)入日志文件,供下次功能基排序時(shí)使用。
基于Java平臺(tái)在Java eclipse開(kāi)發(fā)環(huán)境下,以Microsoft Access2000作為設(shè)計(jì)知識(shí)的存儲(chǔ)與管理數(shù)據(jù)庫(kù),采用本文所述方法開(kāi)發(fā)了知識(shí)檢索原型系統(tǒng),應(yīng)用于課題組開(kāi)發(fā)的CAIP系統(tǒng)中。圖7所示編號(hào)①~④的圖片為面向創(chuàng)新設(shè)計(jì)的自然語(yǔ)言檢索模塊一次從問(wèn)題分析到設(shè)計(jì)知識(shí)自然語(yǔ)言檢索示例的界面。
圖7中①為自然語(yǔ)言表示的檢索需求的輸入,在問(wèn)題分析過(guò)程中,用戶可以根據(jù)功能需求,在相應(yīng)節(jié)點(diǎn)采用自然語(yǔ)言描述檢索意圖,圖中設(shè)計(jì)者采用根源分析方法解決“冬天涼衣服衣架容易折斷”這一問(wèn)題,在分析過(guò)程中提出了“如何洗衣服”這一功能需求;系統(tǒng)經(jīng)過(guò)語(yǔ)義理解后得到功能動(dòng)名詞詞對(duì)“洗衣服”,如圖7中②所示。在設(shè)計(jì)者確定“洗衣服”這一功能需求后,系統(tǒng)在共指關(guān)系索引庫(kù)中沒(méi)有找到已有的共指關(guān)系索引;在后臺(tái)調(diào)用3.3節(jié)所述的共指關(guān)系匹配算法進(jìn)行聯(lián)網(wǎng)在線匹配,其中功能動(dòng)詞“洗”擴(kuò)展得到“分離、洗滌、清洗、滌蕩、溶解、保潔、剝離、脫脂、采用、清除”等動(dòng)詞,流名詞“衣服”擴(kuò)展得到“物質(zhì)、固體、液體、氣體、成分、微粒、混合物、體積、形態(tài)、流體”等名詞,經(jīng)過(guò)與系統(tǒng)功能基關(guān)聯(lián)配對(duì)得到“清洗固體”、“清洗液體”、“清洗氣體”三個(gè)最可能的功能基,這三個(gè)功能基都是功能屬性“分離物質(zhì)”下面的二級(jí)功能基,符合“洗衣服”這一功能需求描述,如圖7中③所示。在設(shè)計(jì)者確認(rèn)“清洗固體”這一最可能的系統(tǒng)功能基的情況下,調(diào)用功能基檢索模塊,檢索得到專利知識(shí)庫(kù)和領(lǐng)域知識(shí)庫(kù)中具有“清洗固體”這一功能屬性的設(shè)計(jì)知識(shí),設(shè)計(jì)者可以根據(jù)需要查詢相關(guān)設(shè)計(jì)知識(shí)進(jìn)行創(chuàng)新求解,如圖7中④所示。
通過(guò)實(shí)驗(yàn)測(cè)試,能夠檢索得到設(shè)計(jì)者比較滿意的結(jié)果的概率為61%。
本文針對(duì)CAI設(shè)計(jì)過(guò)程中設(shè)計(jì)知識(shí)在知識(shí)檢索方面的不足,歸納總結(jié)了面向創(chuàng)新設(shè)計(jì)知識(shí)的特征,研究了基于共指關(guān)系擴(kuò)展的面向創(chuàng)新設(shè)計(jì)的知識(shí)檢索模型與實(shí)現(xiàn),在課題組已有的研究基礎(chǔ)上構(gòu)建檢索本體,應(yīng)用于設(shè)計(jì)知識(shí)的組織與檢索;采用語(yǔ)義關(guān)聯(lián)與設(shè)計(jì)案例關(guān)聯(lián)兩種關(guān)聯(lián)形式,基于點(diǎn)互信息技術(shù)構(gòu)建檢索本體共指關(guān)系索引庫(kù),作為問(wèn)題描述到檢索本體的過(guò)渡橋梁,更好地輔助設(shè)計(jì)者找到設(shè)計(jì)問(wèn)題的功能本體,使設(shè)計(jì)者查找所需要的而非查找所知道的;同時(shí)通過(guò)計(jì)算機(jī)學(xué)習(xí)將問(wèn)題描述與功能本體之間的映射關(guān)系建立案例關(guān)聯(lián)并更新共指關(guān)系庫(kù),使得根據(jù)設(shè)計(jì)問(wèn)題描述主動(dòng)推薦相應(yīng)功能基以及計(jì)算機(jī)輔助傳承設(shè)計(jì)經(jīng)驗(yàn),在一定程度上成為可能。本文提出的基于共指關(guān)系擴(kuò)展的面向創(chuàng)新設(shè)計(jì)的知識(shí)檢索模式是一種新的應(yīng)用思路,同時(shí),如何更好地構(gòu)建與組織劃分檢索本體,構(gòu)建檢索本體共指關(guān)系庫(kù),將是筆者以后研究的重點(diǎn)。
[1] LI Yan,WANG Jie,LI Xianglong,et al.Creative thinking and computer aided product innovation[J].Computer Integrated Manufacturing Systems,2003,9(12):1092-1096(in Chinese).[李 彥,王 杰,李翔龍,等.創(chuàng)造性思維及計(jì)算機(jī)輔助產(chǎn)品創(chuàng)新設(shè)計(jì)研究 [J].計(jì)算機(jī)集 成 制 造系統(tǒng),2003,9(12):1092-1096.]
[2] STONE 段 ,WOOD W O.Development of a functional basis for design[J].Journal of Mechanical Design,2002,122(4):359-370.
[3] ALTSHULLER 段 .The inventor algorithm,TRIZ,systematic innovation and technical creativity[M]. Worcester,Mass.,USA:Technical Innovation Center,1999.
[4] TUNG 段 ,TSENG T E,WENG W N,et al.A rule-based CBR approach for expert finding and problem diagnosis[J].Expert Systems with Applications,2010,37(3):2427-2438.
[5] WANG Zhaoxia,QIU Qingying,F(xiàn)ENG Pei'en,et al.Information extraction method of technical solution from mechanical product patent[J].Journal of Mechanical Engeering,2009,45(10):198-206(in Chinese).[王朝霞,邱清盈,馮培恩,等.機(jī)械產(chǎn)品專利技術(shù)方案信息抽取方法[J].機(jī)械工程學(xué)報(bào),2009,45(10):198-206.]
[6] Invention Machine Corporation.Goldfire innovator[EB/OL].(2009-03-01 ) [2010-03-08 ]. http://www. invention machine.com/.
[7] CREAX.CREAX Innovation Suite 3.1[EB/OL].(2007-05-02)[2010-03-08].http://www.creaxinnovationsuite.com.
[8] IWINT Inc.Pro/Innovator[EB/OL].(2009-03-01)[2010-03-08].http://www.iwint.com.cn/.
[9] WANG Canhui,ZHANG Min,MA Shaoping.A survey of natural language processing in information retrieval[J].Journal of Chinese Infornation Processing,2007,21(2):35-45(in Chinese).[王燦輝,張 敏,馬少平.自然語(yǔ)言處理在信息檢索中的應(yīng)用綜述[J].中文信息學(xué)報(bào),2007,21(2):35-45.]
[10] LIU Xiang.Research on constructing technology of patent knowledgebase supporting innovative design[D].Chengdu:Sichuan University,2011(in Chinese).[劉 翔.支持創(chuàng)新設(shè)計(jì)的專利知識(shí)庫(kù)構(gòu)建技術(shù)研究[D].成都:四川大學(xué),2011.]
[11] LI Wenqang,LI Yan,XIONG Yan,et al.Organization and application model of design knowledge based on conception to conception[J].Computer Integrated Manufacturing Systems,2009,15(6):1062-1069(in Chinese).[李文強(qiáng),李 彥,熊艷,等.一種以面對(duì)面的設(shè)計(jì)知識(shí)組織與應(yīng)用模型[J].計(jì)算機(jī)集成制造系統(tǒng),2009,15(6):1062-1069.]
[12] TURNEY 段 ,LITTMAN M.Measuring praise and criticism:inference of semantic orientation from association[J].ACM Transactions on Information Systems,2003,21(4):315-346.