姚振軍 鄭旭紅
(河南大學,開封,475001/東北財經(jīng)大學,大連,116025;大連外國語學院,大連,116025)
在哲學領域,本體論(ontology)屬于“形而上學”最基礎或是核心的部分,有時兩者混用,號稱“第一哲學”。“本體論”哲學概念內涵和外延自身不斷發(fā)展,學界的研究也不斷延展。在計算機領域的ontology的中文譯名很不一致,有“本體論”、“本體”、“本體科學”、“知識本體”、“概念集”、“本體模型”等,在技術文獻中直接使用ontology的情況則更為常見。全國科技名詞委將人工智能領域的ontology定名為“本體論”,通常定義為構成相關領域詞匯的基本術語和關系,以及由這些術語和關系構成的解釋這些詞匯外延的規(guī)則(鄧志鴻、唐世渭2002;陳小賓2009;姚振軍2010)。
本文將知識工程中的“本體論”作為科學研究的工具,發(fā)揮其在將對象知識的概念和相互間的關系進行較為精確的定義的特點(Guarino 1997),以中文社會科學引文索引(CSSCI)2010-2011年來源期刊所確定的18種外語類來源期刊在2000-2009的10年間所刊載文章的關鍵信息為數(shù)據(jù)來源,利用斯坦福大學開發(fā)的protégé開源本體構造工具,以graph-Viz和Jamalaya為可視化工具,進行中國外語學科領域本體的建模,從而對中國外語學科的研究前沿進行顯性的描述,旨在通過知識工程本體技術的運用,科學地勾勒出外語學科“本體論”研究的輪廓與框架。
本文中的“本體論”具有雙關性和多層次性,我們的基本思路是運用源自古老的哲學“本體論”的新興知識工程“本體論”,來勾勒中國外語學科的“本體論”理論輪廓。
本文運用知識工程“本體論”技術,發(fā)揮其對概念明晰化的作用,科學地闡釋中國外語學科的“本體”,從而勾勒出中國外語學科“本體論”的理論輪廓和框架,以明確中國外語學科研究的基本面貌,還原學科研究之“本”,解釋后現(xiàn)代哲學視角下以“末”為主的時代性研究特點。同時,文章還嘗試揭示學科研究之“體”,明確學科研究的“主體”和“客體”;建構學科研究之“論”,論述學科的“本”與“末”、“源”與“流”,以及“體”與“用”的關系。
知識工程“本體論”技術可以為知識庫的構建提供一個基本的結構,以描述對象的類型而言,有簡單事實及抽象概念,這些可以描述成一個本體的靜態(tài)實體部分,它們主要描述的是事物或概念的各個組成部分以及這些組成部分之間的靜態(tài)聯(lián)系,也可以描述事物或概念的運動和變化(尹亮2005)。知識工程本體建模的首要任務是明確概念的定義和概念之間的語義關系。對中國外語學科研究而言,在本體模型中的最頂層的概念就是學科概念本身的界定。
在本研究中,我們分別參照《中華人民共和國國家標準學科分類與代碼表(GB/T13745-92)》(國家技術監(jiān)督局1992-11-01批準,1993-07-01 實施)和《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010-2020年)》為建立動態(tài)調整機制、優(yōu)化學科結構而最新修訂的學科目錄,對中國外語學科研究的范疇進行界定,最終以CSSCI(2010-2011年)所確定的18種外語類來源期刊在21世紀第一個10年間(2000-2009)所刊載文章的關鍵信息為切入點展開研究。
在眾多標準和參照系中,本文選取具有一定學科代表性的CSSCI所確定的外語類來源期刊為參照點,進行學科研究之“本”的研究。CSSCI收錄期刊是經(jīng)多所重點高校專家和社科管理專家組成的咨詢委員會、全國1000余位學科專家和南京大學中國社會科學評價中心共同評選后確定的。來源期刊確定標準包括期刊的影響因子、被引總次數(shù)等數(shù)量指標與學科專家意見等,最終確定的來源期刊(2010-2011)共527種、擴展版來源期刊(2010-2011年)174種。其中,12種外語類(包括翻譯)期刊入選語言學類來源期刊,6種外國文學類入選外國文學類來源期刊。本文以這18種期刊進行本體類的創(chuàng)建,如圖1所示。
在本研究中,知識工程“本體論”的最大作用在于借助技術手段來明確本學科研究對象的層次與關系。如圖1所示,在protégé本體編輯工具中,它通過“Class”可對概念進行“父類”和“子類”的逐層分解,從而明確概念的上下義和包含關系;而“Object Properties”和“Data Properties”則分別可以明確概念間的動作概念屬性和時空等數(shù)值屬性,如“出版與被出版”的動作關系、出版日期和所屬機構。“individuals”是概念的具體實例或實體,在本研究即指本學科研究的具體的人和事,如期刊的具體作者和論文的關鍵詞。編輯工具中自帶的工具和插件可以提供查詢和可視化展示。圖2為基于作者的查詢界面和關系視圖、圖3為關鍵詞查詢界面和關系視圖。
中國古代“本體”一詞是由“本”和“體”兩個字合成的,這兩個字大概屬于中國最原始的造字之列,它們代表了中國人對世界和人生的最樸素的看法?!氨尽弊謸?jù)許慎《說文解字》:“木下曰本,從木,一在其下”;與之相對的有“末”:“木上曰末,從木,一在其上?!憋@然,“木”是植物,是農(nóng)耕民族賴以為生的“根本”,而木的根本則是在木之下的“本”,末死本存,本在末榮。《論語·學而》云:“君子務本,本立而道生”;《易·系辭》云:“其初難知,其上易知,本末也”??梢娫谥袊说乃枷胫?,“本末之辯”是一對極為重要的范疇。在知識爆炸和學科不斷融合與分化的新世紀,在后現(xiàn)代哲學的視野下,中國外語學科研究也不斷向縱深發(fā)展,明確中國外語學科研究的基本面貌,還原學科研究之“本”的任務也必然極其復雜。本文借助新興的知識工程技術,以數(shù)據(jù)為依據(jù),以為透析中國外語學科研究“本”與“末”之間的辯證關系提供一個相對科學的視角。
統(tǒng)計顯示,18種期刊10年間所載的文章中析出的關鍵詞總數(shù)96,647個,不重復關鍵詞36,977個,只出現(xiàn)1次的關鍵詞共26,017個,占總關鍵詞27.1%,占不重復關鍵詞70.4%,重復出現(xiàn)2次的關鍵詞為4,638個,重復出現(xiàn)3次的關鍵詞為1867個。在處理時,對從各刊所載的會訊和通知中析出的機標關鍵詞進行降噪處理后予以去除,同時,通過與漢語停用詞表和通用詞表進行比較后,進一步去除了“20世紀”、“中國”和“英國”等信息指向性較低的關鍵詞。我們對其余高頻關鍵詞在本文所構建的外語類核心期刊本體模型中進行了歸類,將關鍵詞通過期刊文章“Has Key Word Of”和“Belong To”等屬性特征與《中華人民共和國國家標準學科分類與代碼表(GB/T13745-92)》所對應本體類和子類進行關聯(lián)和添加,結果見圖4。
圖1 本體編輯界面與graphViz視圖
圖2 作者查詢在Jamalaya中的視圖
圖3 關鍵詞查詢在Jamalaya中的視圖
圖4 關鍵詞在本體建模中的歸類處理
通過本體建模與歸類分析,出現(xiàn)頻率前100位的高頻關鍵詞中,信息指向性較強的有效關鍵詞共70個,其中語言學關鍵詞為40個,文學30個。因篇幅所限,本文重點分析語言學的具體數(shù)據(jù)。在語言學關鍵詞中,一級學科關鍵詞3個(語言180次,語言學99次,語言學研究72次),二級學科關鍵詞1個(應用語言學88次),三級學科關鍵詞3個(翻譯學120次、語用學109次、外國語言321次),三級以下33個。其中應用語言學領域:翻譯學及其分支9個(翻譯431次、翻譯研究342次、文學翻譯193次、翻譯理論147次、翻譯教學141次、譯文102次、翻譯家99次、譯者84次、翻譯策略70次),計算語言學1個(語料庫155次),應用語言學其他學科中語言教學12個(語言教學90次、外語教學295次、大學英語186次、英語教學135次、自主學習86次、教學模式82次、英語專業(yè)78次、寫作76次、外語教學與研究75次、英語寫作74次、外語教育69次、大學英語教學95次);應用語言學其他學科中的二語習得1個(二語習得93次);普通語言學的語用學領域5個(語境133次、語篇102次、關聯(lián)理論74次、話語70次、對話66次);外國語言領域2個(英語119次、俄語61次);語言學其他學科中的認知語言學3個(認知語言學236次、認知166次、隱喻165次)。
我們認為,上述40個語言學高頻關鍵詞基本體現(xiàn)了2000-2009年間的現(xiàn)實研究狀況,在很大程度上可以代表中國外語學科研究之“本”的語言學側面。我們所析出的30個文學關鍵詞①則代表著其文學側面,語言學和文學研究的70個關鍵詞構成了中國外語學科的研究之“本”,而26,017個只出現(xiàn)1次的瞬間關鍵詞則是中國外語學科的研究之“末”的體現(xiàn)。本文這一觀點僅出于描述性研究的目的,我們對“本”“末”的定義的觀點是辯證的,在歷時研究中,二者一定是一種動態(tài)的對立轉換關系,而且這種“本”與“末”體現(xiàn)的是一種科學客觀的角度,并不帶有主觀評價色彩。
本文所指的中國外語學科研究之“體”的第一層含義是指對中國外語學科研究“主體”和“客體”的劃分。在本文所構建的基于外語類核心期刊本體模型中,中國外語學科研究“主體”指的是期刊作者,即從事外語研究的人;而“客體”指的是這些作者所寫的文章和研究的關鍵詞。上文已經(jīng)就關鍵詞進行論述,本節(jié)重點關注“主體”。表1為2000-2009年間在18種外語類來源期刊(非外語類期刊發(fā)文不計)發(fā)文排名前100位的作者和發(fā)文量的統(tǒng)計結果。
表1 發(fā)文前100位的作者
(續(xù)表)
如果我們以某個學者,如“王寅”,為檢索詞,在所得到圖形的本體中可清晰地體現(xiàn)王寅教授作為研究“主體”與“客體”中的研究文章和文章中的關鍵詞以及關鍵詞所屬的學科分類。在未來研究中,我們試圖對于中國外語學科之“主體”和“客體”進行深入研究。
中國外語學科研究之“論”主要是對“本”與“末”、“主體”和“客體”以及“體”與“用”關系的論述,本文重點對“體”與“用”的關系進行初步的分析。
“體”與“用”是中國古代哲學的基本范疇?!绑w”,指本體或實體;“用”,指作用、功用或用處。這是它們的本來涵義。在中國哲學的長期發(fā)展過程中,逐漸形成一種有體有用、體用一如的思維模式,體用范疇也被賦予了復雜多樣的涵義。本文主要借用中國近代張之洞等人提出“中學為體,西學為用”(謂體用原指主要與次要、根本的與從屬的兩者的區(qū)別)說法來審視中國外語學科研究的理論與實踐,中國本土理論與西方引進理論的關系。隨著本文所構建的本體模型數(shù)據(jù)的豐富,未來我們將展開關于中國外語學科之“論”的理論深入探索。
正如Poli(2011)指出,經(jīng)歷了漫長的衰落過程后,本體論再次回歸到了哲學和科學技術的前沿。如今本體論的回歸至少體現(xiàn)在兩個方面:傳統(tǒng)的哲學意義下的本體論與嶄新的以計算機應用技術為基礎的知識工程本體的并駕齊驅。他還明確指出,長期以來學者們對這兩個領域中的本體論的誤解:知識工程和哲學的本體論學者在爭辯著這兩個學科中的本體論是完全不同的,一方認為,計算機知識工程本體論與領域建模的具體問題的分析密切相關;而另一方堅稱,哲學本體論是與現(xiàn)實世界中最深奧的、經(jīng)常是極度抽象的各種思考和眾多的純粹的概念的范疇化問題緊密相連的,因此,從事知識工程本體論的科學家不應該關心研究本體論的哲學家的研究,反之亦然。
在本文里,“本體論”既是“實指”也是“喻指”:“實指”是知識工程本體論技術的實際運用,“喻指”是中國外語學科本體論理論的建構。知識工程本體論源自哲學本體論,“本”與“末”、“體”與“用”是中國傳統(tǒng)“本體論”的研究內容;從西方哲學角度,我們試圖回答傳統(tǒng)“本體論”的基本命題:“是之為是”,即“中國外語學科”何其為“中國外語學科”,哪些人做了哪些事。在下一步工作中,我們將以自動抽取的方式進一步擴大本體的規(guī)模,以便于更加深入地對中國外語學科“本體論”展開研究和思索。
附注:
①限于篇幅,本文不提供這一具體數(shù)據(jù)表格,需要的讀者可以向作者索取。