李婷婷
(新疆塔里木河流域干流管理局,新疆 庫爾勒 841000)
在早期的紙媒體時(shí)代,水利基層單位主要通過建立專門檔案工作室的方式,進(jìn)行檔案管理與分類,但由于現(xiàn)代化社會(huì)中,單位內(nèi)部檔案資源以電子文件的方式呈現(xiàn),導(dǎo)致檔案分類工作需要面對(duì)大量待處理數(shù)據(jù)。因此也需要一種全新的技術(shù),并將其用于解決檔案分類在執(zhí)行過程中涉及的采集、調(diào)用、歸類等多維度需求[1]。為了確保在分類后的檔案信息具備完整性與真實(shí)性,部分水利單位提出了建立開放性檔案信息模型,此模型又被稱為OAIS模型。開放性檔案信息模型主要功能在于為企業(yè)內(nèi)部長(zhǎng)期存儲(chǔ)及保管的信息,建立一個(gè)參考性框架,用于保障及維護(hù)企業(yè)內(nèi)部電子信息的長(zhǎng)期安全。針對(duì)此方面的研究,最早由美國信息咨詢委員會(huì)提出,并于2003年引進(jìn)我國,將ISO作為了模型使用標(biāo)準(zhǔn)。該模型在各單位的檔案管理部門中的研究與應(yīng)用,已有相關(guān)研究,并將此方面的研究延伸到了實(shí)際應(yīng)用層面。
信息處理器是對(duì)水利基層單位檔案分類執(zhí)行指令與解釋指令進(jìn)行描述的功能設(shè)備,也是本文系統(tǒng)構(gòu)成的關(guān)鍵設(shè)備。在處理信息過程中,信息處理器以極高的效率及速度反復(fù)重復(fù)信息迭代行為,其最高執(zhí)行效率可達(dá)每秒數(shù)百萬次。單次迭代行為的描述如圖1所示。
圖1 信息處理器單次迭代行為
綜合上述圖1中對(duì)信息處理器功能的描述,結(jié)合本文系統(tǒng)需求,對(duì)信息處理器構(gòu)成進(jìn)行設(shè)計(jì)。如表1所示。
表1 信息處理器構(gòu)成
按照表1中內(nèi)容,完成對(duì)本文系統(tǒng)中信息處理器的設(shè)計(jì)。
轉(zhuǎn)換器接口是實(shí)現(xiàn)對(duì)檔案信息有效傳遞的主要設(shè)備,在本文系統(tǒng)中主要起到通信與連接等作用。通常情況下,轉(zhuǎn)換器接口的連接方式為并聯(lián)與串聯(lián)兩種,兩種連接方式均可以實(shí)現(xiàn)或滿足對(duì)檔案信息的通信需求。綜合本文需求,對(duì)轉(zhuǎn)換器接口連接方式進(jìn)行設(shè)計(jì)。如表2所示。
表2 轉(zhuǎn)換器接口連接方式
結(jié)合本文系統(tǒng)需求,選擇適宜的轉(zhuǎn)換器接口連接方式,確保系統(tǒng)內(nèi)檔案信息可保持良好通信。
為了確保檔案分類系統(tǒng)可執(zhí)行其功能,應(yīng)對(duì)水利基層單位待分類檔案特征信息進(jìn)行探測(cè),以信息處理器功能作為核心,將特征信息劃分為下述三點(diǎn)。如表3所示。
表3 水利基層單位待分類檔案特征信息
按照表3中內(nèi)容,完成對(duì)水利基層單位待分類檔案特征信息類別的劃分。
在明確水利基層單位待分類檔案特征的基礎(chǔ)上,引進(jìn)OAIS模型,對(duì)檔案分類流程進(jìn)行設(shè)計(jì)。具體步驟如下。
第一步:在OAIS模型中輸入水利基層單位待分類檔案信息,將所有信息與OAIS模型中存儲(chǔ)的信息進(jìn)行對(duì)比,并將其定義為兩類,其中一類為正類(與OAIS模型中信息存在雷同),另一類為反類(與OAIS模型信息存在差異)。根據(jù)檔案樣本進(jìn)行訓(xùn)練樣本與分類樣本矩陣的構(gòu)建,常規(guī)情況下,使用1.0與-1.0表示樣本類型。此過程可用如下公式執(zhí)行。
第二步:在上述檔案樣本分類目標(biāo)函數(shù)的支撐下,選擇最優(yōu)分類算法,并對(duì)α進(jìn)行求解處理,假定α中每一個(gè)樣本集合均存在一個(gè)支撐OAIS數(shù)據(jù)的向量機(jī),則每個(gè)分類項(xiàng)均具備一個(gè)≠0的分類空間。
第三步:輸出特征b,利用決策函數(shù),輸出分類結(jié)果。倘若計(jì)算結(jié)果中的實(shí)際值>0,則屬于OAIS模型中的一類信息,反之則屬于二類信息。以此完成對(duì)檔案信息的分類。
提出對(duì)比實(shí)驗(yàn),用于證明本文設(shè)計(jì)的基于OAIS模型的水利基層單位檔案分類系統(tǒng)設(shè)計(jì)方法具備有效性。實(shí)驗(yàn)執(zhí)行前,布設(shè)此次對(duì)比實(shí)驗(yàn)的支撐環(huán)境,如表4所示。
表4 對(duì)比實(shí)驗(yàn)環(huán)境
在完成對(duì)此次對(duì)比實(shí)驗(yàn)環(huán)境布設(shè)的基礎(chǔ)上,設(shè)定A、B、C、D四個(gè)類別的水利基層單位檔案。先設(shè)定每種類別檔案500個(gè),使用本文系統(tǒng)與傳統(tǒng)系統(tǒng)對(duì)打亂后的檔案進(jìn)行分類處理,記錄分類成功率及識(shí)別到分類后每組檔案區(qū)內(nèi)檔案數(shù)量。在此基礎(chǔ)上,增加水利基層單位檔案數(shù)量(A、B、C、D四個(gè)類別的檔案由500.0增加到2000.0),記錄檔案數(shù)量增加后,檔案分類成功率及識(shí)別到分類后每組檔案區(qū)內(nèi)檔案數(shù)量。以此作為評(píng)價(jià)本文系統(tǒng)適用性的依據(jù)。
傳統(tǒng)檔案分類系統(tǒng)在進(jìn)行水利基層單位檔案分類過程中,存在檔案信息丟失的問題,且隨著檔案數(shù)量的提升,檔案丟失量提升。而本文系統(tǒng)在應(yīng)用中并未受到檔案數(shù)量增加的干擾與影響。為此,得出本次對(duì)比實(shí)驗(yàn)結(jié)論:相比傳統(tǒng)的檔案分類系統(tǒng),本文設(shè)計(jì)的基于OAIS模型的水利基層單位檔案分類系統(tǒng),可成功對(duì)不同類型的檔案進(jìn)行精準(zhǔn)分類,分類成功率更高。
在我國信息技術(shù)高速發(fā)展的社會(huì)背景下,市場(chǎng)內(nèi)儲(chǔ)備的信息與資源量,隨著時(shí)間的推移呈現(xiàn)高速遞增狀態(tài)。如何將這些信息與資源進(jìn)行更好的存儲(chǔ)、管理、分類,成為了相關(guān)單位的關(guān)注重點(diǎn)。為此,本文提出OAIS模型,從硬件設(shè)備與軟件功能兩個(gè)方面,對(duì)水利基層單位檔案分類系統(tǒng)展開設(shè)計(jì)。本文系統(tǒng)硬件設(shè)備包括信息處理器與轉(zhuǎn)換器接口,在硬件設(shè)備的支撐下,獲取水利基層單位檔案特征信息,并結(jié)合OAIS模型設(shè)計(jì)檔案分類流程,最后采用設(shè)計(jì)對(duì)比實(shí)驗(yàn)的方式,對(duì)本文系統(tǒng)進(jìn)行功能檢驗(yàn),證明本文設(shè)計(jì)的系統(tǒng)可實(shí)現(xiàn)對(duì)檔案信息進(jìn)行標(biāo)準(zhǔn)化分類,滿足水利基層單位檔案信息分類需求。