/中國(guó)運(yùn)載火箭技術(shù)研究院研究發(fā)展中心
章雯 /中國(guó)運(yùn)載火箭技術(shù)研究院
當(dāng)代社會(huì)已進(jìn)入知識(shí)經(jīng)濟(jì)時(shí)代,知識(shí)正逐漸成為企業(yè)取得競(jìng)爭(zhēng)優(yōu)勢(shì)的關(guān)鍵因素。越來越多的企業(yè)管理者意識(shí)到知識(shí)挖掘、知識(shí)共享等知識(shí)管理活動(dòng)對(duì)企業(yè)發(fā)展的重大意義。在知識(shí)管理中,根據(jù)描述知識(shí)的難易程度可以將知識(shí)分為顯性知識(shí)和隱性知識(shí),顯性知識(shí)是指可以通過語(yǔ)言和文字進(jìn)行傳播、表達(dá)、確知、編碼輸入計(jì)算機(jī)的知識(shí);隱性知識(shí)是指難以清晰表達(dá)、傳播、共享的知識(shí),如組織成員的技能、經(jīng)驗(yàn)、訣竅、溝通能力等。顯性知識(shí)與隱性知識(shí)的區(qū)分是人類對(duì)知識(shí)的更深層次的理解,對(duì)人腦中內(nèi)隱的知識(shí)進(jìn)行了發(fā)現(xiàn)和定義,知識(shí)管理界常常用冰山的結(jié)構(gòu)來形容顯性知識(shí)和隱性知識(shí),如果將顯性知識(shí)視為冰山露出水面的尖端,那么隱性知識(shí)就是隱藏在水下的大部分。由此可見,隱性知識(shí)比顯性知識(shí)更難發(fā)掘,但它卻是組織財(cái)富的重要源泉。因此,在知識(shí)管理過程中,隱性知識(shí)挖掘是知識(shí)管理的重要組成部分。
航天企業(yè)是典型的知識(shí)型企業(yè),在航天產(chǎn)品的研制過程中應(yīng)用和產(chǎn)生了大量的知識(shí)。其中,顯性知識(shí)可以很好地通過文字、數(shù)據(jù)、模型的方式固化下來,進(jìn)行共享和復(fù)用,而隱性知識(shí)由于其隱蔽性、獨(dú)占性,往往難以挖掘。針對(duì)該問題,筆者首先控討了傳統(tǒng)隱性知識(shí)挖掘手段在航天企業(yè)應(yīng)用中的效果和存在的不足,進(jìn)而對(duì)基于本體的航天企業(yè)隱性知識(shí)挖掘技術(shù)進(jìn)行了研究。
隱性知識(shí)挖掘的目的是通過一系列手段,使內(nèi)隱的、難以表達(dá)和復(fù)用的信息轉(zhuǎn)化為外顯的、有價(jià)值的、可應(yīng)用的知識(shí)。隱性知識(shí)挖掘方法的研究有很多,如基于Web2.0的隱性知識(shí)外化、基于案例的隱性知識(shí)挖掘、專家型隱性知識(shí)地圖的構(gòu)建等,上述文獻(xiàn)對(duì)隱性知識(shí)挖掘提出了不同的方法。隱性知識(shí)是企業(yè)知識(shí)資產(chǎn)的重要組成部分,為挖掘該部分財(cái)富,中國(guó)運(yùn)載火箭技術(shù)研究院開展了相關(guān)工作。具體內(nèi)容如下:
老帶新。在新員工入職時(shí),為每位新員工指定一名經(jīng)驗(yàn)豐富的老員工作為導(dǎo)師,指導(dǎo)其快速掌握業(yè)務(wù)知識(shí)并提升工作技能。在老員工與新員工“一對(duì)一”的幫扶過程中,老員工的隱性知識(shí),如積累的經(jīng)驗(yàn)、技巧、思維模式等,會(huì)潛移默化地影響到新員工,進(jìn)而實(shí)現(xiàn)挖掘、共享和復(fù)用。
專家訪談。研究院具有60多年的歷史,成功研制了大量航天器,也培養(yǎng)了大批的技術(shù)專家。為將這些技術(shù)專家大腦里的隱性知識(shí)固化下來,研究院成立了多個(gè)技術(shù)領(lǐng)域?qū)<以L談小組,對(duì)相應(yīng)領(lǐng)域的專家進(jìn)行面對(duì)面的訪談,了解專家的成長(zhǎng)歷程,主要是在技術(shù)攻關(guān)、科研管理等方面的經(jīng)驗(yàn)和想法,最后整理出訪談?dòng)涗?,在單位?nèi)進(jìn)行共享。
技術(shù)沙龍(交流會(huì))。為便于挖掘普通員工的隱性知識(shí),研究院定期開展各類技術(shù)沙龍,員工可借此機(jī)會(huì)展示自己的研究成果,共享自己的經(jīng)驗(yàn),也可以就遇到的問題和困惑與他人進(jìn)行交流,在無(wú)形中實(shí)現(xiàn)隱性知識(shí)的挖掘與共享。
從文獻(xiàn)中提出的隱性知識(shí)挖掘方法到研究院開展的隱性知識(shí)挖掘?qū)嵺`,其大體上符合圖1所示的步驟。
目標(biāo)決策。目標(biāo)決策階段工作主要內(nèi)容是通過調(diào)研和梳理,確定知識(shí)挖掘目標(biāo),定義隱性知識(shí)挖掘的對(duì)象和范圍,制定知識(shí)提取的規(guī)則和約束。該部分工作是否有人來完成,目標(biāo)決策是否合理,影響隱性知識(shí)挖掘的最終成效。因此,往往需要由學(xué)科領(lǐng)域內(nèi)具有權(quán)威的專家來主導(dǎo)該階段工作。
知識(shí)挖掘。知識(shí)挖掘階段主要工作是依據(jù)專家制定的挖掘規(guī)則和約束,對(duì)目標(biāo)知識(shí)進(jìn)行檢索、判斷、提取和存儲(chǔ)。該部分工作主要依靠機(jī)器完成,如果知識(shí)挖掘結(jié)果不符合預(yù)期,也要專家通過修改目標(biāo)決策來進(jìn)行改進(jìn)。
知識(shí)共享。知識(shí)共享階段主要是將挖掘的結(jié)果提供給需要的人,為用戶提供知識(shí)服務(wù),同時(shí)收集用戶的反饋,據(jù)此來支撐和優(yōu)化隱性知識(shí)挖掘目標(biāo)決策。
上述傳統(tǒng)的隱性知識(shí)挖掘手段雖然具有一定的效果,但由于其主要依賴于人的決策,在知識(shí)共享和傳播方面具有一定的局限性,主要體現(xiàn)在:
容易出現(xiàn)歧義。由于每個(gè)人的文化背景、描述能力或理解能力不同,不同人對(duì)同一概念的理解和描述會(huì)有所差異,導(dǎo)致隱性知識(shí)難以準(zhǔn)確表達(dá),容易出現(xiàn)歧義。
缺乏統(tǒng)一的概念描述。在知識(shí)的應(yīng)用過程中,不同部門可能對(duì)同一領(lǐng)域內(nèi)的知識(shí)描述和定義不同。有些是由相關(guān)領(lǐng)域?qū)<一蛑R(shí)管理人員建立,有些是從權(quán)威性專著中獲得,導(dǎo)致知識(shí)描述體系相對(duì)獨(dú)立,給知識(shí)共享和傳播帶來一定障礙。
圖1 傳統(tǒng)隱性知識(shí)挖掘手段
缺乏統(tǒng)一的知識(shí)資源格式。部門之間各自定義自己構(gòu)建的知識(shí)描述體系,導(dǎo)致各個(gè)知識(shí)描述體系的存儲(chǔ)格式不同,給知識(shí)轉(zhuǎn)移與集成造成很大障礙,不利于知識(shí)的二次傳播。
本體最早是從哲學(xué)領(lǐng)域發(fā)展而來的概念,它的含義是對(duì)客觀事物存在本質(zhì)的客觀描述。近年來,隨著信息科學(xué)的迅速發(fā)展和計(jì)算機(jī)與網(wǎng)絡(luò)的普遍應(yīng)用,本體也逐漸用于人工智能和知識(shí)工程等領(lǐng)域,但是對(duì)于本體的定義尚缺乏一種統(tǒng)一的規(guī)定。R.Studer提出的本體定義包含概念化、顯性化、形式化和共享4層含義。
概念化。本體是客觀世界現(xiàn)象的抽象,獨(dú)立于具體的客觀事物和實(shí)際環(huán)境。
顯性化。本體中概念和概念之間的約束都有明確的定義,并且它們的定義沒有歧義,是確定的、可理解的。
形式化。通過規(guī)范的形式對(duì)領(lǐng)域內(nèi)的概念和概念之間的關(guān)系進(jìn)行表示,使得機(jī)器可理解,并且可以進(jìn)行相應(yīng)的分析處理。
共享。根據(jù)領(lǐng)域內(nèi)規(guī)范的標(biāo)準(zhǔn)對(duì)知識(shí)進(jìn)行表示,而且知識(shí)是使用者共同認(rèn)可的,可以相互共享。
領(lǐng)域本體的構(gòu)建是利用領(lǐng)域?qū)<宜崛〉南嚓P(guān)概念及對(duì)象建立概念或?qū)ο笾g的關(guān)系,從而得到相應(yīng)的概念模型,然后使用形式化的描述語(yǔ)言將概念模型表示成計(jì)算機(jī)可以理解的本體模型,從而實(shí)現(xiàn)知識(shí)的共享。本體從語(yǔ)義和知識(shí)的表示層次上對(duì)知識(shí)的存儲(chǔ)發(fā)生了根本性的變化,將領(lǐng)域內(nèi)復(fù)雜的知識(shí)通過關(guān)系及層次結(jié)構(gòu)組織成了一個(gè)龐大的知識(shí)網(wǎng)。因此,本體所表示的知識(shí)信息更豐富,知識(shí)之間關(guān)聯(lián)程度更高,從而可以更為精確地檢索和獲取知識(shí),并且還可以挖掘出隱性知識(shí)。
本體作為一種共享概念模型的形式化、規(guī)范說明,可以實(shí)現(xiàn)對(duì)領(lǐng)域內(nèi)的知識(shí)進(jìn)行明確的定義,并對(duì)知識(shí)間的關(guān)聯(lián)關(guān)系予以明確的描述。通過構(gòu)建領(lǐng)域本體,可以實(shí)現(xiàn)語(yǔ)義層面的文本分析,使機(jī)器在處理文本過程中具有一定的推理能力。在隱性知識(shí)挖掘中引入本體,將有效地解決傳統(tǒng)隱性知識(shí)挖掘中概念不統(tǒng)一、格式不統(tǒng)一、易產(chǎn)生歧義等問題,提高隱性知識(shí)挖掘結(jié)果的質(zhì)量。
通過對(duì)傳統(tǒng)隱性知識(shí)挖掘手段的控討和實(shí)踐,結(jié)合對(duì)本體的分析,筆者提出了基于本體的隱性知識(shí)挖掘模型,主要包括目標(biāo)決策、約束抽取、知識(shí)挖掘和知識(shí)服務(wù)4個(gè)模塊,如圖2所示。
目標(biāo)決策。目標(biāo)決策主要定義隱性知識(shí)挖掘主題,確定隱性知識(shí)挖掘范圍?;诒倔w的隱性知識(shí)挖掘目標(biāo)的制定不再由領(lǐng)域?qū)<彝瓿桑鞘褂帽倔w對(duì)用戶需求進(jìn)行挖掘,將用戶真正的需求和潛在的需求進(jìn)行顯性化處理,該工作一般由機(jī)器完成。
約束抽取?;诒倔w的隱性知識(shí)挖掘中的約束抽取是依據(jù)挖掘主題,通過提取本體的概念和概念實(shí)例得到挖掘約束,也就是知識(shí)檢索中的關(guān)鍵詞。該過程不再依賴專家,從而避免了由于個(gè)體的主觀性和表達(dá)差異導(dǎo)致的挖掘結(jié)果質(zhì)量低。
知識(shí)挖掘。知識(shí)挖掘是以目標(biāo)決策提出的挖掘主題為目標(biāo),依據(jù)約束抽取所定義的約束規(guī)則進(jìn)行知識(shí)檢索、提煉和存儲(chǔ)的過程?;诒倔w的知識(shí)檢索,是以本體概念及概念實(shí)例為關(guān)鍵詞進(jìn)行的檢索,保證了檢索的準(zhǔn)確率和高覆蓋率?;诒倔w的知識(shí)存儲(chǔ)不是簡(jiǎn)單地將知識(shí)以數(shù)據(jù)的格式存儲(chǔ)于數(shù)據(jù)庫(kù)中,而是依據(jù)明確的規(guī)范和約束對(duì)數(shù)據(jù)進(jìn)行標(biāo)注和分類存儲(chǔ)。
知識(shí)服務(wù)。知識(shí)服務(wù)是指以需求為導(dǎo)向,為用戶提供所需知識(shí),涵蓋用戶需求調(diào)研、知識(shí)共享、知識(shí)交易、用戶反饋等。同時(shí),用戶反饋也是豐富完善領(lǐng)域本體的有效支撐。
將本體引入隱性知識(shí)挖掘中,借助本體對(duì)知識(shí)定義的唯一性及確定性為隱性知識(shí)挖掘賦予了新的特征。
知識(shí)提取準(zhǔn)確。采用本體提取語(yǔ)義概念,通過本體實(shí)例可以實(shí)現(xiàn)對(duì)文本中同一語(yǔ)義不同描述的知識(shí)提取,提高了隱性知識(shí)挖掘過程中知識(shí)提取的可靠性。
知識(shí)檢索覆蓋率提高。通過引入本體,實(shí)現(xiàn)了在語(yǔ)義層面對(duì)文本信息進(jìn)行理解。因此,通過上下文分析能提供給用戶與檢索表達(dá)式高關(guān)聯(lián)度的檢索結(jié)果,檢索結(jié)果的查全率和查準(zhǔn)率都能得到有效提升。
圖2 基于本體的隱性知識(shí)挖掘模型
知識(shí)共享暢通。通過本體提供的概念定義和關(guān)聯(lián)描述,消除人們對(duì)同一語(yǔ)義的知識(shí)表達(dá)差異,增強(qiáng)人們對(duì)知識(shí)的共同理解,可以實(shí)現(xiàn)知識(shí)的無(wú)障礙交流,使知識(shí)共享和傳播更加便利。
關(guān)于領(lǐng)域本體的構(gòu)建方法和實(shí)踐有許多學(xué)者研究,被廣泛認(rèn)可的是T.R.Gruber提出的構(gòu)建本體的5條原則,即明晰完整性、一致性、可擴(kuò)展性、最小本體約束和最小編碼偏好。
敘詞表是特定學(xué)科領(lǐng)域內(nèi)表達(dá)事物概念的詞匯集合,基于敘詞表構(gòu)建領(lǐng)域本體的方法滿足上述5條原則。筆者基于航天科學(xué)技術(shù)敘詞表開發(fā)了航天領(lǐng)域本體自動(dòng)生成系統(tǒng)(見圖3)。該系統(tǒng)由解析模塊、術(shù)語(yǔ)及關(guān)系映射模塊、術(shù)語(yǔ)及關(guān)系重構(gòu)模塊、規(guī)范性自檢模塊、本體文件更新模塊、本體解析模塊、本體推演模塊和術(shù)語(yǔ)圖譜構(gòu)建模塊8個(gè)模塊組成,可實(shí)現(xiàn)由敘詞表到本體文件的自動(dòng)轉(zhuǎn)換。航天敘詞表共收錄25168條敘詞,建有3種參照系統(tǒng),即用代關(guān)系(等同關(guān)系,優(yōu)選關(guān)系)、屬分關(guān)系(屬種關(guān)系,等級(jí)關(guān)系)和相關(guān)關(guān)系(參見關(guān)系)。航天領(lǐng)域本體自動(dòng)生成系統(tǒng)通過航天敘詞間的參照系統(tǒng)將敘詞聯(lián)結(jié)成語(yǔ)義網(wǎng),構(gòu)建了航天領(lǐng)域本體庫(kù),并以術(shù)語(yǔ)地圖的形式進(jìn)行展示,用戶可在術(shù)語(yǔ)地圖中進(jìn)行術(shù)語(yǔ)關(guān)聯(lián)知識(shí)檢索。
圖3 本體自動(dòng)生成系統(tǒng)框架
本體庫(kù)的構(gòu)建很好的支撐了航天領(lǐng)域概念的一致性和規(guī)范化,將本體庫(kù)嵌入知識(shí)管理系統(tǒng)為知識(shí)無(wú)障礙交流與共享打下了良好基礎(chǔ)。
目標(biāo)決策。有了航天領(lǐng)域本體庫(kù)的支撐,隱性知識(shí)挖掘主題不再由領(lǐng)域?qū)<覜Q策。用戶在知識(shí)管理系統(tǒng)中的行為,如瀏覽、點(diǎn)擊、檢索等,會(huì)被系統(tǒng)記錄下來,并將瀏覽、點(diǎn)擊、檢索的內(nèi)容與本體庫(kù)中的術(shù)語(yǔ)進(jìn)行匹配。匹配量越高,說明用戶對(duì)該術(shù)語(yǔ)相關(guān)知識(shí)的需求越強(qiáng)烈,系統(tǒng)會(huì)據(jù)此決策出隱性知識(shí)挖掘主題。
約束抽取。根據(jù)隱性知識(shí)挖掘主題,確定關(guān)鍵術(shù)語(yǔ)作為挖掘約束,為了保證挖掘知識(shí)的準(zhǔn)確性和效率,一般限定挖掘約束為3~5個(gè)關(guān)鍵術(shù)語(yǔ)。
知識(shí)挖掘。根據(jù)確定的隱性知識(shí)挖掘約束,知識(shí)管理系統(tǒng)會(huì)在主頁(yè)生成熱點(diǎn)話題,鼓勵(lì)用戶就該話題進(jìn)行在線討論,激發(fā)用戶表達(dá)出隱性知識(shí)。依據(jù)挖掘約束,系統(tǒng)對(duì)線上討論的內(nèi)容進(jìn)行提煉,并將相關(guān)知識(shí)與航天領(lǐng)域本體術(shù)語(yǔ)進(jìn)行關(guān)聯(lián)和存儲(chǔ),支撐基于本體術(shù)語(yǔ)的關(guān)聯(lián)知識(shí)檢索。
在航天產(chǎn)品設(shè)計(jì)過程中,會(huì)產(chǎn)生大量的中間過程文檔,而大家關(guān)注的焦點(diǎn)一般是最終方案和設(shè)計(jì)結(jié)果,過程文檔作為隱性知識(shí)的重要來源往往被隱藏。在知識(shí)管理系統(tǒng)中,會(huì)根據(jù)隱性知識(shí)挖掘主題對(duì)該類文檔進(jìn)行重點(diǎn)挖掘,提煉和存儲(chǔ)知識(shí)點(diǎn),以支撐后續(xù)相關(guān)產(chǎn)品研制過程中的知識(shí)復(fù)用。
知識(shí)服務(wù)。用戶可根據(jù)需求在知識(shí)地圖中通過檢索本體術(shù)語(yǔ)查看關(guān)聯(lián)知識(shí),也可在系統(tǒng)中進(jìn)行知識(shí)的一站式檢索。系統(tǒng)還可以根據(jù)用戶的行為對(duì)用戶需求進(jìn)行挖掘,進(jìn)而在用戶個(gè)人中心為用戶提供知識(shí)推送服務(wù)。用戶對(duì)系統(tǒng)推送知識(shí)的點(diǎn)擊、瀏覽或下載行為,會(huì)作為判斷推送知識(shí)是否準(zhǔn)確的依據(jù)反饋給系統(tǒng),以便于知識(shí)挖掘主題和約束的改進(jìn)。
筆者控討了隱性知識(shí)挖掘的傳統(tǒng)手段,分析了其存在的問題,結(jié)合本體特征,提出了基于本體的隱性知識(shí)挖掘模型。依托該模型,開展了航天領(lǐng)域本體的構(gòu)建,對(duì)航天企業(yè)的隱性知識(shí)挖掘進(jìn)行了研究。該研究可有效促進(jìn)隱性知識(shí)挖掘效率,對(duì)提升航天企業(yè)快速設(shè)計(jì)能力及創(chuàng)新能力具有重要意義?!?/p>