摘 要: 為改進(jìn)高校教師傳統(tǒng)的信息收集方式,分析了高校教師在教學(xué)和科研活動(dòng)中對(duì)信息的需求,在研究主動(dòng)信息服務(wù)和多源數(shù)據(jù)收集技術(shù)的基礎(chǔ)上設(shè)計(jì)出一種基于三層體系結(jié)構(gòu)的組件式教師主動(dòng)信息服務(wù)平臺(tái)。實(shí)際應(yīng)用表明,該平臺(tái)不僅能自動(dòng)收集、整理、分析校園網(wǎng)內(nèi)的各類動(dòng)態(tài)信息,還能根據(jù)教師預(yù)先定制的信息需求規(guī)則提供及時(shí)、可靠的主動(dòng)信息服務(wù)。
關(guān)鍵詞: 主動(dòng)信息服務(wù); 校園網(wǎng); 多源數(shù)據(jù); 數(shù)據(jù)收集; 組件
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1006-8228(2012)12-65-02
Design of college teacher active information service platform based on campus network
Hu Hong, Yu Weiyi
(Department of Mathematics and Computer Science, Shangrao Normal College, Shangrao, Jiangxi 334001, China)
Abstract: To improve the traditional methods of information collection, the information requirement of college teachers in teaching and researching work is analyzed. After studying the theory of active information services and multisource data integrating, active information service platform based on three-layer architecture is proposed in this paper. The platform can automatically provide active information service, according to teacher’s customization from campus network multisource. It automatically reminds teachers to view some new information on teaching and science researching. The application result demonstrates that the platform service is efficient and reliable.
Key words: active information service; campus network; multi-source data; data collection; component
0 引言
高校教師在教學(xué)和科研工作中需要手動(dòng)收集并查閱多種信息,這些信息來(lái)自不同信息管理系統(tǒng)和Web服務(wù)系統(tǒng),如學(xué)校OA、學(xué)校網(wǎng)站、教務(wù)管理系統(tǒng)等。這些信息中有相當(dāng)一部分是富有很強(qiáng)的時(shí)效性,如監(jiān)考安排、課題申報(bào)通知等。教師如未及時(shí)收集到這些信息,就會(huì)導(dǎo)致嚴(yán)重的后果,如可能因此錯(cuò)過(guò)了監(jiān)考或課題申報(bào)等。鑒于此,本文提出構(gòu)建一種基于三層體系結(jié)構(gòu)的組件式高校教師主動(dòng)信息服務(wù)平臺(tái)(下文簡(jiǎn)稱為主動(dòng)信息服務(wù)平臺(tái))。該平臺(tái)通過(guò)在學(xué)校網(wǎng)絡(luò)中心配置一臺(tái)信息服務(wù)器,在其上運(yùn)用主動(dòng)信息服務(wù)系統(tǒng)軟件自動(dòng)收集、整理各類來(lái)源不同的動(dòng)態(tài)信息,使之物理存儲(chǔ)在系統(tǒng)數(shù)據(jù)庫(kù)中,并根據(jù)教師預(yù)先定制的信息需求規(guī)則,把對(duì)口信息及時(shí)推送至教師,同時(shí)以短信方式適時(shí)提醒教師登錄Web應(yīng)用系統(tǒng)查看信息或執(zhí)行某項(xiàng)工作。
1 基礎(chǔ)理論
基于校園網(wǎng)的高校教師主動(dòng)信息服務(wù)平臺(tái)的數(shù)據(jù)來(lái)源于校園網(wǎng)內(nèi)的各信息管理系統(tǒng)和Web服務(wù)系統(tǒng)的后臺(tái)數(shù)據(jù)庫(kù)系統(tǒng)、文件系統(tǒng)(如Doc文檔、Excel文檔等信息附件)和靜態(tài)網(wǎng)頁(yè)文檔等。這些源數(shù)據(jù)本質(zhì)上可分為兩類,一類是數(shù)據(jù)庫(kù)型數(shù)據(jù),一類是靜態(tài)網(wǎng)頁(yè)數(shù)據(jù)。它們?cè)诖鎯?chǔ)和組織方式上有很大的不同,而且分布在不同的服務(wù)器上,要提供基于這些數(shù)據(jù)源的統(tǒng)一信息服務(wù),必須先將這些分布的、異構(gòu)的多源數(shù)據(jù)先集成起來(lái)。
1.1 多源數(shù)據(jù)集成
多源數(shù)據(jù)集成包括源數(shù)據(jù)處理(抽取轉(zhuǎn)換)和目的數(shù)據(jù)處理(過(guò)濾加載)兩個(gè)過(guò)程[1]。其中涉及的多為異構(gòu)數(shù)據(jù),可采用的集成方法有物理集成和邏輯集成兩種。前者是先將不同數(shù)據(jù)源的數(shù)據(jù)物理地復(fù)制到信息服務(wù)系統(tǒng)中,而后再對(duì)數(shù)據(jù)進(jìn)行分析、處理和集成,如數(shù)據(jù)倉(cāng)庫(kù)技術(shù);后者則不對(duì)數(shù)據(jù)源數(shù)據(jù)進(jìn)行物理復(fù)制,它常采取一定的技術(shù)手段實(shí)現(xiàn)對(duì)不同數(shù)據(jù)源的一致訪問(wèn),如DB2的聯(lián)邦數(shù)據(jù)庫(kù)技術(shù)和基于Mediator-Wrapper體系結(jié)構(gòu)的中間件技術(shù)[2,3]。然而,由于數(shù)據(jù)倉(cāng)庫(kù)技術(shù)對(duì)動(dòng)態(tài)信息獲取不很靈敏,聯(lián)邦數(shù)據(jù)庫(kù)技術(shù)不對(duì)數(shù)據(jù)進(jìn)行物理復(fù)制[4],所以單純的數(shù)據(jù)倉(cāng)庫(kù)技術(shù)和聯(lián)邦數(shù)據(jù)庫(kù)技術(shù)不能直接應(yīng)用于本研究和設(shè)計(jì)的信息服務(wù)平臺(tái)中。
1.2 主動(dòng)信息服務(wù)
完整的主動(dòng)信息服務(wù)包括幾個(gè)方面:主動(dòng)人機(jī)交互和主動(dòng)適應(yīng)用戶,主動(dòng)采集信息,主動(dòng)處理信息,主動(dòng)預(yù)測(cè),主動(dòng)挖掘知識(shí)和主動(dòng)發(fā)布信息等。由計(jì)算機(jī)應(yīng)用系統(tǒng)負(fù)責(zé)信息的獲取,并根據(jù)用戶的個(gè)性化需求對(duì)采集到的信息進(jìn)行分析、篩選,最終將用戶真正需要的信息主動(dòng)推送于用戶客戶端[5-7]。與傳統(tǒng)的信息服務(wù)方式相比,主動(dòng)信息服務(wù)不僅消除了需要用戶自己搜尋所需信息的弊端,它還能幫助用戶高效率地發(fā)掘目標(biāo)信息,減少信息的過(guò)載,提高用戶獲取信息的及時(shí)性。
2 主動(dòng)信息服務(wù)平臺(tái)的總體設(shè)計(jì)
該平臺(tái)設(shè)計(jì)包括兩個(gè)方面的內(nèi)容,一是功能結(jié)構(gòu)的設(shè)計(jì),二是信息存儲(chǔ)結(jié)構(gòu)的設(shè)計(jì)。為使系統(tǒng)具有良好的適應(yīng)性,本平臺(tái)采用組件式設(shè)計(jì)思想,遵循三層體系結(jié)構(gòu)[8,9],如圖1所示,處于中間層的數(shù)據(jù)收集組件和數(shù)據(jù)集成組件負(fù)責(zé)完成數(shù)據(jù)的自動(dòng)集成,并給應(yīng)用層提供一致的訪問(wèn)接口;處于應(yīng)用層的業(yè)務(wù)邏輯組件負(fù)責(zé)完成對(duì)信息的分析和處理,以獲得符合用戶要求的目標(biāo)信息,短信發(fā)送組件負(fù)責(zé)以短信形式發(fā)送部分提示信息,Web服務(wù)器用于響應(yīng)用戶對(duì)相關(guān)信息的請(qǐng)求與回應(yīng)。
平臺(tái)的數(shù)據(jù)集成采用物理集成的思想,數(shù)據(jù)收集組件負(fù)責(zé)從數(shù)據(jù)源獲取數(shù)據(jù),并將獲取的數(shù)據(jù)物理存儲(chǔ)到系統(tǒng)數(shù)據(jù)庫(kù)中。各數(shù)據(jù)收集組件均提供統(tǒng)一的輸入和輸出接口,其輸入為數(shù)據(jù)源描述,輸出為統(tǒng)一數(shù)據(jù)模式的記錄集。對(duì)于數(shù)據(jù)庫(kù)數(shù)據(jù)源,數(shù)據(jù)收集組件可以直接通過(guò)數(shù)據(jù)庫(kù)的支持獲取數(shù)據(jù),并將數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一數(shù)據(jù)模式的記錄集,存儲(chǔ)在臨時(shí)表中,作為組件的輸出;對(duì)于靜態(tài)網(wǎng)頁(yè)數(shù)據(jù)源,數(shù)據(jù)收集組件找出動(dòng)態(tài)更新的網(wǎng)頁(yè)文件,生成統(tǒng)一數(shù)據(jù)模式記錄集,存儲(chǔ)在臨時(shí)表中,作為組件的輸出。數(shù)據(jù)收集組件的數(shù)目由具體的數(shù)據(jù)源數(shù)目決定。
數(shù)據(jù)集成組件的功能相對(duì)簡(jiǎn)單,它定期將來(lái)自各數(shù)據(jù)收集組件的信息集成,并存儲(chǔ)在系統(tǒng)信息庫(kù)的信息源表中;業(yè)務(wù)邏輯組件負(fù)責(zé)從信息源表中找出教師需要的信息并推送至教師;短信發(fā)送組件負(fù)責(zé)跟蹤一些時(shí)效性強(qiáng)的信息(有信息有效時(shí)間限制的信息),適時(shí)通過(guò)短信網(wǎng)關(guān)發(fā)送信息到教師預(yù)留的手機(jī),以提醒教師及時(shí)通過(guò)Web方式登錄信息服務(wù)系統(tǒng)查看與自己相關(guān)的各類信息或執(zhí)行某項(xiàng)工作。教師收到的這些信息通常包括科研文件或通知、職稱評(píng)聘文件或通知、課表及其他一些教務(wù)信息(如聽(tīng)課安排,監(jiān)考安排)等。系統(tǒng)允許用戶將部分或全部歷史信息導(dǎo)出到本地計(jì)算機(jī),實(shí)現(xiàn)信息備份;允許教師根據(jù)自己的教學(xué)和科研需求定制個(gè)性化的信息服務(wù)。
系統(tǒng)信息存儲(chǔ)結(jié)構(gòu)設(shè)計(jì)包括信息服務(wù)平臺(tái)的系統(tǒng)數(shù)據(jù)庫(kù)設(shè)計(jì)和數(shù)據(jù)字典的設(shè)計(jì)。系統(tǒng)數(shù)據(jù)庫(kù)存儲(chǔ)平臺(tái)收集的各種信息及教師的信息定制信息,具體包含有信息源表、教師信息表、信息定制表、數(shù)據(jù)字典相關(guān)表等。對(duì)于收集到的數(shù)據(jù)庫(kù)記錄信息,需先作簡(jiǎn)單的格式轉(zhuǎn)換,而后再以記錄集的形式存儲(chǔ)在系統(tǒng)數(shù)據(jù)庫(kù)中;對(duì)于收集到的文檔儲(chǔ)格式的信息,則先提取出該文檔的描述信息,而后再將它復(fù)制到信息服務(wù)器上,并根據(jù)文檔存儲(chǔ)路徑構(gòu)造數(shù)據(jù)記錄,存入系統(tǒng)數(shù)據(jù)庫(kù)。系統(tǒng)數(shù)據(jù)字典包括數(shù)據(jù)源的描述信息、統(tǒng)一數(shù)據(jù)模式和系統(tǒng)中各數(shù)據(jù)表的描述。
3 主動(dòng)信息服務(wù)平臺(tái)的關(guān)鍵技術(shù)
3.1 數(shù)據(jù)收集技術(shù)
研究設(shè)計(jì)本平臺(tái),主要考慮對(duì)兩大數(shù)據(jù)源信息的收集:數(shù)據(jù)庫(kù)型數(shù)據(jù)源和靜態(tài)網(wǎng)頁(yè)型數(shù)據(jù)源。
⑴ 數(shù)據(jù)庫(kù)數(shù)據(jù)源的數(shù)據(jù)收集
目前高校中廣泛使用的數(shù)據(jù)庫(kù)主要有Microsoft SQL Server、Oracle、Access和其他文檔型數(shù)據(jù)庫(kù)。對(duì)于Microsoft SQL Server、Oracle,數(shù)據(jù)收集采取定期根據(jù)數(shù)據(jù)庫(kù)日志提取新數(shù)據(jù)和更新數(shù)據(jù)策略[10],該時(shí)間間隔一般以分鐘計(jì)算,以保證系統(tǒng)及時(shí)性;對(duì)于Access數(shù)據(jù)庫(kù),數(shù)據(jù)收集組件會(huì)定期讀取源數(shù)據(jù)庫(kù)特定的數(shù)據(jù)表,判定是否有新數(shù)據(jù),若有新數(shù)據(jù),則將這些數(shù)據(jù)收集,時(shí)間間隔也以分鐘為單位。
數(shù)據(jù)收集組件收集新數(shù)據(jù)和更新數(shù)據(jù)后,還要依靠數(shù)據(jù)字典的支持,將其轉(zhuǎn)換為統(tǒng)一數(shù)據(jù)模式的記錄集存入系統(tǒng)數(shù)據(jù)庫(kù)中的臨時(shí)表中,并以此作為數(shù)據(jù)集成組件的輸入。
⑵ 靜態(tài)網(wǎng)頁(yè)數(shù)據(jù)的收集
教師關(guān)心的信息一般有很多都在學(xué)校和各部門(mén)主頁(yè)的相關(guān)欄目上呈現(xiàn),且大多以超鏈接載體的形式呈現(xiàn)。由此,我們可以把靜態(tài)網(wǎng)頁(yè)集合看作是一種數(shù)據(jù)源。對(duì)該類數(shù)據(jù)源數(shù)據(jù)的收集系統(tǒng)采取的策略是,每隔一定時(shí)間就對(duì)學(xué)校和各部門(mén)主頁(yè)相關(guān)欄目中的鏈接進(jìn)行分析,若發(fā)現(xiàn)有新的信息鏈接條目,則下載該新鏈接所指的網(wǎng)頁(yè)文件,抽取網(wǎng)頁(yè)的標(biāo)題、發(fā)布時(shí)間等信息,如果網(wǎng)頁(yè)正文包含時(shí)效信息,則將這些信息一同收集并存入系統(tǒng)數(shù)據(jù)庫(kù)的臨時(shí)表中,并以此作為數(shù)據(jù)集成組件的輸入。
為方便數(shù)據(jù)集成組件和業(yè)務(wù)邏輯組件的使用,筆者還為統(tǒng)一數(shù)據(jù)模式特別設(shè)計(jì)了一個(gè)時(shí)間戳字段。
3.2 主動(dòng)信息處理技術(shù)
主動(dòng)信息處理體現(xiàn)了主動(dòng)信息服務(wù)系統(tǒng)智能化水平。教師信息需求可通過(guò)系統(tǒng)默認(rèn)定制或用戶自定義定制,存儲(chǔ)在用戶信息定制表中。系統(tǒng)工作時(shí)通過(guò)該表構(gòu)造信息需求矩陣D[i,j]={dij|dij是一個(gè)關(guān)鍵詞或信息來(lái)源標(biāo)志},該矩陣是一個(gè)m*n矩陣,每一行代表一個(gè)教師i的信息需求規(guī)則,由若干個(gè)dij組成。這樣,系統(tǒng)能根據(jù)信息源表和信息需求矩陣D選用數(shù)據(jù)挖掘算法,挖掘出與各位教師相關(guān)的信息數(shù)據(jù),并將其存入教師信息表中。
4 主動(dòng)信息服務(wù)平臺(tái)的原型設(shè)計(jì)
主動(dòng)信息服務(wù)平臺(tái)開(kāi)發(fā)環(huán)境配置:Windows Server2003,Microsoft SQL Server2005,Microsoft IIS 6.0,Microsoft Visual Studio 2005。
該原型系統(tǒng)從三種數(shù)據(jù)源(Microsoft SQL Server數(shù)據(jù)庫(kù)數(shù)據(jù)源、Access數(shù)據(jù)庫(kù)數(shù)據(jù)源和學(xué)校靜態(tài)網(wǎng)頁(yè)數(shù)據(jù)源)收集數(shù)據(jù)。數(shù)據(jù)收集組件定期讀取數(shù)據(jù)庫(kù)日志或數(shù)據(jù)表的時(shí)間間隔為5分鐘,數(shù)據(jù)收集組件分析學(xué)校和各部門(mén)主頁(yè)的時(shí)間間隔也是5分鐘。系統(tǒng)客戶端Web應(yīng)用程序由ASP技術(shù)實(shí)現(xiàn),通過(guò)訪問(wèn)系統(tǒng)后臺(tái)數(shù)據(jù)庫(kù)和附件文件夾獲取相應(yīng)信息,提供用戶權(quán)限管理、信息的定制、信息查看、顯示與導(dǎo)出等的服務(wù)。
5 結(jié)束語(yǔ)
該主動(dòng)信息服務(wù)平臺(tái)已在作者所在學(xué)院試用,實(shí)際應(yīng)用表明,與其他同類系統(tǒng)或平臺(tái)相比具有如下特點(diǎn)或優(yōu)勢(shì)。
⑴ 教師可以根據(jù)自己的教學(xué)和科研情況定制相應(yīng)的信息需求規(guī)則,系統(tǒng)能根據(jù)這些規(guī)則在校園網(wǎng)內(nèi)主動(dòng)收集信息,并將與其切實(shí)相關(guān)的信息推送至教師。
⑵ 能對(duì)收集到的信息作進(jìn)一步的篩選,只將符合某些條件或時(shí)效性強(qiáng)的信息通過(guò)短信提醒用戶,減少了對(duì)用戶的干擾。
⑶ 采用組件式三層體系結(jié)構(gòu)。數(shù)據(jù)源的變化只影響中間層,不會(huì)影響到應(yīng)用層,只需更改數(shù)據(jù)收集組件就可使系統(tǒng)適應(yīng)新的數(shù)據(jù)源環(huán)境,利于推廣應(yīng)用到其他的高校或企事業(yè)單位。
參考文獻(xiàn):
[1] 汪洋,李愛(ài)平,繆嘉嘉等.一種基于發(fā)布/訂閱機(jī)制的數(shù)據(jù)集成方法[J].
計(jì)算機(jī)工程與應(yīng)用,2007.43(9):164-166
[2] 程學(xué)先,蔣慧婷.異構(gòu)數(shù)據(jù)源集成實(shí)現(xiàn)的研究[J].計(jì)算機(jī)工程與科學(xué),
2008.30(8):86-91
[3] 劉高軍,鮑曉琦.基于聯(lián)邦數(shù)據(jù)庫(kù)的數(shù)據(jù)集成平臺(tái)研究與改進(jìn)[J].計(jì)
算機(jī)光盤(pán)軟件與應(yīng)用,2012.2:45-46
[4] 李俊,李勇聯(lián).聯(lián)邦式異構(gòu)數(shù)據(jù)庫(kù)應(yīng)用系統(tǒng)的集成框架和實(shí)現(xiàn)技術(shù)的
研究[J].計(jì)算機(jī)應(yīng)用研究,2001.18(4):19-22
[5] 黃國(guó)忠.基于智能信息推拉技術(shù)的主動(dòng)信息服務(wù)[J].情報(bào)雜志,
2005.10:59-60,63
[6] 曾維宏,陳鐵軍,孟麗等.基于Push技術(shù)的主動(dòng)信息服務(wù)系統(tǒng)設(shè)計(jì)與
實(shí)現(xiàn)[J].計(jì)算機(jī)工程與設(shè)計(jì),2005.26(11):2893-2894
[7] 魏鷹.基于推拉技術(shù)的高校圖書(shū)館服務(wù)模式分析[J].企業(yè)科技與發(fā)
展,2010.6:37-39
[8] 李培峰,朱巧明,錢(qián)培德.基于組件的異構(gòu)數(shù)據(jù)集成平臺(tái)的設(shè)計(jì)與研
究[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2005.22(9):41-43
[9] 裴玉林,龐佑兵.基于中間件的異構(gòu)數(shù)據(jù)集成系統(tǒng)設(shè)計(jì)[J].微電子學(xué),
2010.40(2):260-264,269
[10] 張曉剛,潘久輝.基于日志的數(shù)據(jù)庫(kù)更新通用外部監(jiān)測(cè)方法[J].計(jì)算
機(jī)工程,2006.32(2):79-81