陳 艷
(文華學(xué)院信息學(xué)部實(shí)驗(yàn)中心,武漢 430000)
計算機(jī)輔助技術(shù)是一種新型技術(shù),它是在計算機(jī)的基礎(chǔ)上進(jìn)行的技術(shù),是當(dāng)今計算機(jī)領(lǐng)域的研究重點(diǎn)之一,目的是將制圖技術(shù)CAD與數(shù)據(jù)分析技術(shù)CAE緊密結(jié)合,以適應(yīng)當(dāng)今社會的需要。通常,信息分析是人類利用計算機(jī)進(jìn)行數(shù)據(jù)處理的過程。從分析任務(wù)和過程來看,人類需要有邏輯分析能力,并且通過計算機(jī)進(jìn)行數(shù)據(jù)分析。因此,計算機(jī)輔助技術(shù)在不斷發(fā)展,為了適應(yīng)新形勢的變化。在一定程度上,人和計算機(jī)相互合作、密切分工、緊密聯(lián)系,各自處理各自信息,如人類發(fā)揮主觀能動性,對計算機(jī)整理的信息進(jìn)行分析,完成人要做的工作,而計算機(jī)可以處理大批信息,不僅節(jié)約了時間,同時也提高了工作效率。通過對分析人員和計算機(jī)進(jìn)行合理規(guī)劃,可以充分發(fā)揮人和計算機(jī)的最大效用。
(1)擴(kuò)展分析能力和提高分析效率。例如我國某大型超市通過SAS模組軟件,利用計算機(jī)進(jìn)行數(shù)據(jù)分析,每天處理大批信息,不僅包括大部分經(jīng)營作業(yè)流程,而且有效提高了工作效率,節(jié)約了人力物力。
(2)支持分析過程的可視化和有效控制。例如啟動大型搜索引擎可以搜索處理大批量數(shù)據(jù)信息,微軟亞洲研究院設(shè)計的搜索引擎,可以立即檢索相關(guān)信息和資料,并以一種可視化方式出現(xiàn)在屏幕上,這些數(shù)據(jù)由計算機(jī)高度算法通過分析、存儲獲得,可以支持分析過程中的可視化。
(3)支持各種決策活動和商務(wù)智能。以頭條指數(shù)為例,我們可以通過頭條指數(shù)查詢關(guān)鍵詞,通過搜索關(guān)鍵詞可以查詢其排名,并且可以搜索相關(guān)信息,查詢實(shí)時信息,可以通過搜索排名進(jìn)行相關(guān)數(shù)據(jù)分析。
(4)支持預(yù)測未來以及規(guī)?,F(xiàn)實(shí)。谷歌公司收集、整理、分析了一段時間內(nèi)在網(wǎng)上的健康、疾病問題等相關(guān)信息,通過進(jìn)行數(shù)據(jù)分析、類比整理,在2008年推出“谷流感趨勢”項(xiàng)目,彰顯了信息分析在醫(yī)療衛(wèi)生領(lǐng)域的應(yīng)用,在醫(yī)療健康領(lǐng)域應(yīng)用數(shù)據(jù)信息分析,可以有效預(yù)測,提高準(zhǔn)確性。
(1)數(shù)據(jù)庫和數(shù)據(jù)倉庫是計算機(jī)輔助信息分析的主要技術(shù)框架。數(shù)據(jù)庫的結(jié)構(gòu)可以直接處理計算機(jī)中存儲、整合的直接業(yè)務(wù)數(shù)據(jù),在此基礎(chǔ)上,進(jìn)行分析、整理、分類。數(shù)據(jù)倉庫可以從數(shù)據(jù)庫中將數(shù)據(jù)進(jìn)行分析、整理,將數(shù)據(jù)整理成報表,直接以可視化形勢出現(xiàn),在此基礎(chǔ)上按照類別進(jìn)行分析、處理,實(shí)現(xiàn)商務(wù)智能分析,商務(wù)智能通過收集信息、整理信息、分析信息、對比信息等,將數(shù)據(jù)分門別類進(jìn)行整理,已經(jīng)成功運(yùn)用在信息分析領(lǐng)域。
(2)數(shù)據(jù)庫和數(shù)據(jù)倉庫在計算機(jī)輔助信息分析中起著重要作用,在信息處理中,只有對數(shù)據(jù)進(jìn)行類比、分析,才能進(jìn)行科學(xué)合理的數(shù)據(jù)分析。數(shù)據(jù)庫系統(tǒng)在數(shù)據(jù)庫中起著重要作用,它用于數(shù)據(jù)分析,數(shù)據(jù)倉庫技術(shù)是在數(shù)據(jù)分析中分析處理環(huán)境而出現(xiàn)的技術(shù),它是由早期單一化處理數(shù)據(jù)演變而來,慢慢朝著多樣化轉(zhuǎn)變,在處理數(shù)據(jù)方面發(fā)揮著越來越強(qiáng)大的作用。
(3)隨著數(shù)據(jù)環(huán)境的改變,分布式數(shù)據(jù)庫、并行數(shù)據(jù)庫、Map Reduce 編程模型等得到了快速發(fā)展,在現(xiàn)在的使用中越來越廣泛,廣泛應(yīng)用于各行各業(yè)中,在幫助人們處理各項(xiàng)系統(tǒng)數(shù)據(jù)中起著越來越重要的作用。數(shù)據(jù)挖掘的內(nèi)涵即從大量數(shù)據(jù)中調(diào)查、抽取一些數(shù)據(jù),然后探索其規(guī)律,再從規(guī)律中根據(jù)用戶需求做出相關(guān)處理和數(shù)據(jù)分析。工作人員通過KDD等,不斷修改其信息,從而提升出簡明扼要的知識。
(4)數(shù)據(jù)挖掘目前應(yīng)用于各行各業(yè),是一門綜合性較強(qiáng)的學(xué)科,隨著信息技術(shù)的不斷發(fā)展,數(shù)據(jù)挖掘技術(shù)也不斷進(jìn)步,常用的數(shù)據(jù)挖掘技術(shù)有:一是按照數(shù)據(jù)集分類:關(guān)系型數(shù)據(jù)挖掘、面向?qū)ο髷?shù)據(jù)挖掘、多媒體數(shù)據(jù)。二是按照所采用的技術(shù)和方法分類:交互式數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)類數(shù)據(jù)挖掘、發(fā)現(xiàn)驅(qū)動式數(shù)據(jù)挖掘等。三是按照應(yīng)用領(lǐng)域分類:醫(yī)療領(lǐng)域的數(shù)據(jù)挖掘、互聯(lián)網(wǎng)領(lǐng)域的數(shù)據(jù)挖掘、通信領(lǐng)域的數(shù)據(jù)挖掘等。
計算機(jī)輔助信息技術(shù)也出現(xiàn)了一些新的挑戰(zhàn),隨著大數(shù)據(jù)、云計算等新興技術(shù)的出現(xiàn),計算機(jī)輔助技術(shù)唯有不斷發(fā)展,才能順應(yīng)時代的潮流,才能不被時代所拋棄。
(1)數(shù)據(jù)量帶來的挑戰(zhàn)。計算機(jī)輔助信息技術(shù)剛研究、開發(fā)時,它有一定的弊端,雖然取得了一定的突破,但其應(yīng)用無法實(shí)現(xiàn)大批量的數(shù)據(jù)處理。
(2)數(shù)據(jù)多樣性帶來的挑戰(zhàn)。在應(yīng)用過程中,使用關(guān)系數(shù)據(jù)庫可以大批量處理數(shù)據(jù),但其內(nèi)容遵循“模式優(yōu)先”和“pay-beforeyou-go ”的原則,有時不是很靈活,無法準(zhǔn)確提供其數(shù)據(jù)。
(3)數(shù)據(jù)價值性帶來的挑戰(zhàn)。數(shù)據(jù)倉庫根據(jù)不同類別進(jìn)行分類整理,從而提高了工作效率,解決了數(shù)據(jù)多樣性和數(shù)據(jù)量大的問題,但數(shù)據(jù)庫仍然需要不斷改進(jìn),以適應(yīng)用戶需要。
(4) 數(shù)據(jù)處理速度帶來的挑戰(zhàn)。以O(shè)LAP為例,它可以用來解決復(fù)雜的數(shù)據(jù)操作,解決信息分析問題,但由于處理速度比較慢,所以在使用過程中滿意度較低。
隨著社會不斷的發(fā)展,我國現(xiàn)代化信息技術(shù)水平逐漸提高,而計算機(jī)輔助信息分析技術(shù)是現(xiàn)代化信息技術(shù)中的重要組成部分,對于現(xiàn)代化信息技術(shù)的發(fā)展來說有著非常重要的意義。所以在信息技術(shù)中,應(yīng)該不斷創(chuàng)新以適應(yīng)社會的發(fā)展。