楊勝林 聶 堅 秦 瓊 喬 磊 張建英 張 明 馬鳳麗
(1云南中醫(yī)學院基礎學院,昆明 650200;2云南省中醫(yī)醫(yī)院,昆明 650200)
Excel電子表格軟件是微軟Office套件的一個組件,其處理表格的功能強大,易于使用,是目前辦公軟件中常用的表格軟件之一,但是,Excel軟件同時也是一個具有基本數(shù)據(jù)庫功能的軟件,因此,使用該軟件不僅可以方便地進行各種表格的設計制作,而且利用其數(shù)據(jù)表的功能,還可以進行一些如排序、篩選等基本的數(shù)據(jù)操作。
中醫(yī)古籍整理工作,一是做最基本的文字校注,二是對古籍文獻內(nèi)容進行歸類整理,以便于統(tǒng)計數(shù)據(jù),尋找相關(guān)規(guī)律。Excel軟件在中醫(yī)古籍整理工作中主要可用于第二種情況。通過將古籍文獻內(nèi)容保存入Excel工作表,再利用Excel的數(shù)據(jù)操作功能歸類整理文獻。
筆者在進行中醫(yī)古籍整理研究工作中,發(fā)現(xiàn)充分利用該軟件的數(shù)據(jù)操作功能,可以有效地提高工作效率和工作質(zhì)量,現(xiàn)將具體方法簡介于下。
1.1 Word文檔原文分段 在中醫(yī)古籍文獻整理工作中,通常使用的文檔格式是Word文檔,Word軟件有強大的文字處理和排版功能,但在處理數(shù)據(jù)方面,功能明顯弱于Excel,為使用Excel處理數(shù)據(jù),首先需要將Word文檔轉(zhuǎn)入到Excel工作薄中,這個操作可以用復制粘貼完成。要說明的是,在進行復制粘貼操作之前,需要先將Word文檔內(nèi)容進行調(diào)整,在調(diào)整之前,為保持原文檔內(nèi)容不受影響,可以先另存一個新文檔副本,在副本中進行分段操作。調(diào)整的方法是,逐句閱讀原文,將原文中有獨立意義的單句或一組單句分為一段,方法是在要分段的地方打一個回車即可,將整篇文檔按這個方法重新進行分段。
1.2 將分段內(nèi)容粘貼入Excel數(shù)據(jù)表 分段完成后,全選文檔內(nèi)容并復制,然后打開Excel軟件,新建一個工作薄,在工作表Sheet1中選中E2單元格并粘貼(不是粘貼在A1單元格,留出前面的空行、空列有其他作用)。這樣,剛才在Word文檔中分的段,在Excel工作表中就被分別粘貼在各行中了。Excel中的行,也可以稱為記錄,古籍內(nèi)容被分到各行,也就相當于是輸入了數(shù)據(jù)庫的不同記錄,這樣就便于對其整理歸類。
1.3 調(diào)整規(guī)范Excel數(shù)據(jù)表內(nèi)容 粘貼以后,還要對Excel數(shù)據(jù)表內(nèi)容進行一些調(diào)整規(guī)范,因為Word原文檔的內(nèi)容可能會有標題、空行等內(nèi)容,這些也會隨著粘貼而在Excel工作表中單獨占有一條記錄,這些內(nèi)容一般是統(tǒng)計數(shù)據(jù)時用不到的,并且還可能會對統(tǒng)計過程產(chǎn)生干擾。將標題內(nèi)容分別移到工作表Sheet1中的C列和D列中,一級大標題移到C列,二級標題移到D列,并分別將對應內(nèi)容的空行填充滿。例如,某一級標題下有3個二級標題,共有20行內(nèi)容,3個二級標題分別有7行、6行、7行內(nèi)容,那么就將這20行內(nèi)容對應的C列全填寫上這個一級標題,3個二級標題分別填入其7行、6行、7行內(nèi)容對應的D列中。這樣,每一行內(nèi)容屬于哪個一級標題、二級標題就一目了然,將來就不會因排序而找不到原來所屬的章節(jié),如果古籍原文標題不只兩級,可以在D列和E列之間再插入新的列存放下級標題,筆者在古籍整理工作中只用到了章節(jié)兩級標題。為了更好地找到每個內(nèi)容在原文中的位置,在每條內(nèi)容(每行記錄)對應的B列填入其在Word原文檔中對應的頁碼,以便于結(jié)合上下文辨析其內(nèi)容,然后刪除中間的所有空行,并且在A列從第2行開始填寫,從1開始編號,順序填入每條內(nèi)容(每行記錄)的編號。最后,再為每列命名,在第1行填入每列的名字,A1中填寫“序號”,B1中填寫“頁碼”,C1中填寫“章名”,D1中填寫“節(jié)名”,E1中填寫“內(nèi)容”。這樣,就將原來的Word文檔轉(zhuǎn)換成了一個數(shù)據(jù)表。
2.1 逐條辨析屬性 這個步驟是將做好的數(shù)據(jù)表內(nèi)容進行解析整理的過程,對所分出的每一條內(nèi)容,即每一個數(shù)據(jù)記錄進行分類,例如,這條內(nèi)容是講診斷還是病機,又是屬于什么具體內(nèi)容,如病因的風寒暑濕燥火,病位的肝心脾肺腎,病性的虛實寒熱等。將這些屬性分別填寫在每條記錄旁邊列的對應行中,為防止混淆,這些屬性內(nèi)容從第1列開始填寫,即與原文檔內(nèi)容中間間隔三個空列。由于每條內(nèi)容的這些屬性可能不只一個方面,故可以多設置幾個屬性,筆者在實際應用中,設置了4個屬性列,一般就足夠使用了,在I1、J1、K1、L1單元格中分別填入“第一屬性”、“第二屬性”、“第三屬性”、“第四屬性”,作為這4列的名字。以下就逐條對其屬性進行歸類辨析,分別填在每條記錄旁邊的第I、J、K、L列中,每列填寫一個屬性。有時候,可能還有些內(nèi)容需要提取出來,如所涉及的方劑、藥物,在M1單元格中填入“方藥”,如果某條內(nèi)容涉及方藥,就將方藥名字填入第M列中對應的行里面。
2.2 設置數(shù)據(jù)有效性 在逐條對數(shù)據(jù)屬性進行歸類時,可能會出現(xiàn)一些諸如“疏肝”、“舒肝”之類的同義詞,如果使用了同義詞,那么在排序時,就有可能不能將相同屬性的內(nèi)容排在一起,起不到數(shù)據(jù)表的應有作用。為避免出現(xiàn)這種結(jié)果,可以利用Excel表的數(shù)據(jù)有效性驗證功能,在一系列的同義詞中,只允許輸入某一個名詞,而不允許輸入其他名詞,或者還可以設置一個下拉列表,可以從下拉列表框中選擇某一個屬性作為輸入。這樣的名詞術(shù)語標準化過程,保證了可以將每條內(nèi)容進行正確排序。
2.3 數(shù)據(jù)排序 屬性歸類 做好以上基礎工作后,就可以利用Excel表的排序、篩選功能,將具有某個屬性的數(shù)據(jù)記錄排在一起,以便于進行計數(shù)統(tǒng)計。歸類的實現(xiàn)可以使用Excel的篩選功能,即篩選出在I、J、K、L列中出現(xiàn)過某字某詞的行,例如,出現(xiàn)過“腎”字的行,那么就是篩選出了屬性中有“腎”字的數(shù)據(jù)記錄。歸類的實現(xiàn)也可以使用Excel的排序功能,例如,使用O列作為排序標志,應用IF公式,按照對應的I、J、K、L列是否出現(xiàn)過某字詞確定O列的內(nèi)容。例如,出現(xiàn)過“腎”字,在對應的O列就填入“有”,沒有出現(xiàn)過就填入“無”,然后以O列為關(guān)鍵詞進行排序,就可以得到與篩選相同的歸類結(jié)果。使用排序法歸類,更為靈活,操作也比篩選簡單,還可以進行組合排序,而且只要對單元格中的公式進行簡單的粘貼等操作,即可以對另外的關(guān)鍵詞進行歸類,如排過“腎”字了,那么將P2單元格中的“腎”字改成“脾”就可以歸類與“脾”相關(guān)的數(shù)據(jù)內(nèi)容,或者也可以對“腎”和“陰”,或者“腎”和“脾”同時進行歸類,只要在R列中填入“陰”或者“脾”,在Q列粘貼入相應的公式,然后以O列和Q列為關(guān)鍵詞進行排序即可。還可以通過編寫或錄制,使排序操作更加快捷,甚至實現(xiàn)一鍵排序。排序歸類之后就可以進行計數(shù)統(tǒng)計。其中涉及的方藥等內(nèi)容也可以復制出來,在另一個數(shù)據(jù)表中再進行處理,進行排序計數(shù)。
在整理中醫(yī)古籍的過程中,使用Excel數(shù)據(jù)表可以大大簡化對古籍內(nèi)容歸類的工作,不僅提高了效率,也提高了質(zhì)量。在做好第一個數(shù)據(jù)表之后,相關(guān)的公式操作等,都可以通過復制粘貼方便地完成,可謂是古籍整理的一大利器。但是,Excel數(shù)據(jù)表畢竟還有操作繁瑣、功能局限的不足,如果能以此思路和方法為基礎,開發(fā)出相應的古籍整理助手軟件,則可使古籍整理工作更加快捷高效。