孫 麗
(瀘州職業(yè)技術(shù)學(xué)院 四川·瀘州 646000)
人們對(duì)某個(gè)事項(xiàng)進(jìn)行決策,通?;谙嚓P(guān)的數(shù)據(jù)、情報(bào)等基礎(chǔ)信息。為了讓決策者全面、快速、深入地理解大量的、復(fù)雜的信息,往往需要加工、分析、提煉,并將所得的知識(shí)、觀點(diǎn)或結(jié)論,盡量以直觀、形象的視覺形式進(jìn)行呈現(xiàn),這是數(shù)據(jù)可視化發(fā)展的原動(dòng)力。
隨著信息化建設(shè)的快速發(fā)展,人們對(duì)于可視化的要求越來越高,“數(shù)據(jù)可視化”已快速地取代“數(shù)據(jù)圖表”的概念。Excel能創(chuàng)建專業(yè)的數(shù)據(jù)透視表和一些統(tǒng)計(jì)圖表,但與數(shù)據(jù)庫軟件之間的協(xié)作和集成功能較差,難以直接地使用或?qū)崟r(shí)地響應(yīng)數(shù)據(jù)庫系統(tǒng);在利用互聯(lián)網(wǎng)進(jìn)行協(xié)同開發(fā)和共享發(fā)布方面先天不足,難以滿足網(wǎng)絡(luò)化應(yīng)用需求;對(duì)于目前常見的流向地圖、交互式圖表等表現(xiàn)形式難以支持;在顏色、線條、風(fēng)格等方面比較僵化、呆板,難以呈現(xiàn)“高大上”的視覺效果等。
人們對(duì)“數(shù)據(jù)可視化”的要求,則是要將相對(duì)晦澀的數(shù)據(jù)和抽象的概念,通過豐富多樣的色彩和圖形,進(jìn)行可網(wǎng)絡(luò)化的、交互式的呈現(xiàn),從而能更加形象、直觀地表達(dá)蘊(yùn)含在數(shù)據(jù)中的關(guān)鍵信息、規(guī)律或特征,并充分利用大屏幕、互聯(lián)網(wǎng)等先進(jìn)的硬件和網(wǎng)絡(luò)設(shè)施進(jìn)行更直接的、更廣泛的傳播和交互,以幫助人們更好地探索和利用日益龐雜的數(shù)據(jù)和信息資源。這必然推動(dòng)著數(shù)據(jù)可視化隨著社會(huì)信息化,在各行各業(yè)迅速發(fā)展。
在大數(shù)據(jù)時(shí)代,數(shù)據(jù)分析產(chǎn)生的結(jié)果有可能是非常大量的,且結(jié)果之間的關(guān)聯(lián)關(guān)系復(fù)雜、數(shù)據(jù)維度更多的情況。數(shù)據(jù)分析得到的結(jié)果,需要以直觀、易于理解的方式呈獻(xiàn)給最終用戶。
數(shù)據(jù)可視化通過更加適合人類思維的圖形化方式來展示數(shù)據(jù)分析結(jié)果,已經(jīng)被證明是展示數(shù)據(jù)分析結(jié)果非常有效的方法。
數(shù)據(jù)可視化技術(shù)經(jīng)過多年的發(fā)展,已經(jīng)產(chǎn)生了一大批優(yōu)秀的產(chǎn)品工具,并在工程、計(jì)算、金融、醫(yī)療等領(lǐng)域得到了較為成熟的應(yīng)用。從業(yè)務(wù)儀表板、公共健康可視化到流行文化趨勢(shì)分析,數(shù)據(jù)可視化涵蓋了廣泛多樣的應(yīng)用情景,然而其在教育領(lǐng)域的應(yīng)用尚顯不足,特別是學(xué)生就業(yè)方面的應(yīng)用比較薄弱。
隨著當(dāng)前市場(chǎng)經(jīng)濟(jì)高速發(fā)展、高校不斷擴(kuò)招、就業(yè)制度改革不斷深化和畢業(yè)生數(shù)量逐年增加,社會(huì)整體就業(yè)形勢(shì)日益嚴(yán)峻,大學(xué)生就業(yè)問題已經(jīng)越來越成為大家共同關(guān)心的話題。
目前大多數(shù)高等院校通過第三方協(xié)議或者電話回訪等方式收集和統(tǒng)計(jì)畢業(yè)生就業(yè)情況,以制成Excel表格的形式進(jìn)行存儲(chǔ),沒有統(tǒng)一的數(shù)據(jù)庫管理數(shù)據(jù),而畢業(yè)生數(shù)量眾多,回訪工作流程復(fù)雜,需要很多的財(cái)力、人力和時(shí)間,在收集信息的過程中也難免會(huì)出現(xiàn)各式各樣的弊端和疏忽,這樣的工作形式,導(dǎo)致數(shù)據(jù)匯總效率低下,并且也無法發(fā)揮這些數(shù)據(jù)的價(jià)值,不能滿足當(dāng)今高等院校加強(qiáng)輔導(dǎo)畢業(yè)生就業(yè)的需求。
高校生產(chǎn)和獲取數(shù)據(jù)的能力呈幾何級(jí)增長(zhǎng),如何對(duì)海量數(shù)據(jù)進(jìn)行分析以支持學(xué)生的深度學(xué)習(xí),及應(yīng)用信息技術(shù)更好地為學(xué)生就業(yè)服務(wù),優(yōu)化就業(yè)過程,成為亟待解決的問題。傳統(tǒng)的學(xué)生就業(yè)數(shù)據(jù)呈現(xiàn)形式大多通過報(bào)表類,如Excel中的條形圖、餅狀圖、柱狀圖、散點(diǎn)圖、曲線圖等來呈現(xiàn),顯得比較老舊,缺乏動(dòng)態(tài)和美感。
對(duì)高職院校的就業(yè)數(shù)據(jù)進(jìn)行可視化,讓學(xué)生的就業(yè)數(shù)據(jù)動(dòng)態(tài)呈現(xiàn)。通過有趣、互動(dòng)的數(shù)據(jù)展示,將枯燥乏味的大數(shù)據(jù)和文字轉(zhuǎn)換成美好的閱讀體驗(yàn),并且在內(nèi)容上整合優(yōu)化,便于高職院校及時(shí)了解學(xué)生就業(yè)情況及地區(qū)分布、用人單位地域分布等,探索式挖掘?qū)W生就業(yè)趨勢(shì)、特征和關(guān)聯(lián),提供就業(yè)數(shù)據(jù)后處理平臺(tái),為研究學(xué)生的就業(yè)結(jié)構(gòu)、就業(yè)規(guī)律以及對(duì)學(xué)生就業(yè)管理的決策提供重要的技術(shù)手段。
目前實(shí)現(xiàn)數(shù)據(jù)可視化的方法很多,數(shù)據(jù)可視化工具軟件也非常豐富,又各有特點(diǎn)和優(yōu)勢(shì),可根據(jù)使用場(chǎng)景(用途)來決定應(yīng)用相應(yīng)的軟件,使用場(chǎng)景主要包括大屏幕可視化、數(shù)據(jù)地圖、BI(商業(yè)智能)、可視化報(bào)告,本可視化案例設(shè)計(jì)主要采用Tableau。
Tableau是一款便捷高效的數(shù)據(jù)可視化工具,不需要編程,通過操作即可呈現(xiàn)驚艷的效果。相比Excel,它是實(shí)現(xiàn)數(shù)據(jù)可視化的專業(yè)利器,主要表現(xiàn)在數(shù)據(jù)可視化、交互設(shè)計(jì)、靈活分析、深挖/聚焦等方面有較強(qiáng)的功能。Tableau的版本較多,下面以我校近3年的就業(yè)數(shù)據(jù)為例,用Tableau Public來示范一下數(shù)據(jù)可視化的效果,將就業(yè)數(shù)據(jù)與地圖相結(jié)合,并展示網(wǎng)絡(luò)化交互的情況。
我校目前對(duì)畢業(yè)生采集的就業(yè)信息,除姓名、專業(yè)等基本信息外,主要還有就業(yè)單位名稱、單位所在地區(qū)代碼、就業(yè)職位類別等信息,因此,明確了分析的目標(biāo)。
(1)用熱度球來展現(xiàn)就業(yè)職位的統(tǒng)計(jì)情況,并設(shè)置“畢業(yè)年度”和“專業(yè)名稱”兩個(gè)交互可選項(xiàng)。
(2)用數(shù)據(jù)地圖來展現(xiàn)畢業(yè)生就業(yè)的地域分布情況,也設(shè)置“畢業(yè)年度”和“專業(yè)名稱”兩個(gè)交互可選項(xiàng);因省內(nèi)和省外就業(yè)比例比較懸殊,將省內(nèi)和省外就業(yè)情況分別進(jìn)行數(shù)據(jù)統(tǒng)計(jì)和展示,四川省外的就業(yè)分布情況以各省為單位統(tǒng)計(jì),省內(nèi)的以市州為單位統(tǒng)計(jì)。
我校近3年的就業(yè)數(shù)據(jù)Excel表,其中與地圖位置相關(guān)的信息是“單位所在地區(qū)代碼”。為了獲得能在Tableau內(nèi)使用的地圖位置數(shù)據(jù),需要將該代碼分析為具體的省名,對(duì)四川省內(nèi)進(jìn)一步分析為具體的市州名。采用從網(wǎng)上下載地區(qū)代碼表,在Excel內(nèi)用Vlookup、LEFT等相關(guān)函數(shù)將代碼轉(zhuǎn)換為行政區(qū)劃名,就業(yè)數(shù)據(jù)經(jīng)過簡(jiǎn)單處理后成了包含以下內(nèi)容的一張Excel表,表中列出如:年度:2020;姓名:羅X;專業(yè)名稱:工程造價(jià);單位名稱:瀘州榮嘉建筑勞務(wù)有限公司;工作職位:辦事人員和有關(guān)人員;就業(yè)?。簭V西;就業(yè)市:南寧的一條條記錄。
利用該表的“年度”和“專業(yè)名稱”兩個(gè)字段,設(shè)置交互式的可選項(xiàng);“工作職位”字段,適合用熱度氣球或條形圖來顯示就業(yè)職位的統(tǒng)計(jì)情況;省、市信息字段結(jié)合地圖來顯示就業(yè)分布情況。對(duì)下載的一份地區(qū)代碼表,結(jié)合各省、市的經(jīng)緯度數(shù)據(jù),查詢和修正錯(cuò)誤的數(shù)據(jù)后,得到了全國(guó)各省和四川省內(nèi)各市的流向圖坐標(biāo)數(shù)據(jù)Excel表。如四川?。浩瘘c(diǎn)經(jīng)度:105.44、起點(diǎn)緯度:28.87、終點(diǎn)省經(jīng)度:104.04、終點(diǎn)省緯度:30.4;……;四川省瀘州市:起點(diǎn)經(jīng)度:105.44、起點(diǎn)緯度:28.87、終點(diǎn)省經(jīng)度:105.44、終點(diǎn)省緯度:28.87,……,表中的每一行數(shù)據(jù)就可以表示為Tableau地圖上的一條流向線。
3.3.1 連接數(shù)據(jù)源
打開Tableau后,首先連接擬作分析和展示的數(shù)據(jù)源。Tableau可以連接70多種數(shù)據(jù)源,分為本地連接和服務(wù)器連接。Tableau支持的本地連接包括Excel、txt、csv、json等各類常見的源數(shù)據(jù)格式,還支持多種空間文件,為使用地圖分析提供了條件;Tableau支持的服務(wù)連接包括各類數(shù)據(jù)庫 (如 Mysql、Oracle、MongoDB)、在線數(shù)據(jù)服務(wù) (如google analtics)等,可以根據(jù)使用需要,與目標(biāo)服務(wù)器建立連接關(guān)系;還可以選擇使用“其他數(shù)據(jù)庫(ODBC)”或“Web數(shù)據(jù)連接器”創(chuàng)建自己的連接。
將前面得到的Excel表連接到Tableau,并將其拖入下圖右上側(cè)的關(guān)聯(lián)區(qū),通過“就業(yè)省”和“就業(yè)市”兩個(gè)字段分別進(jìn)行關(guān)聯(lián)。
3.3.2 數(shù)據(jù)屬性梳理
然后創(chuàng)建“工作表”,開始逐“頁”設(shè)計(jì)可視化視圖,修改Tableau默認(rèn)的各個(gè)字段的屬性。“年度”字段默認(rèn)為“數(shù)字(整數(shù))”,可以將其修改為“字符串”屬性,以方便設(shè)置可選項(xiàng)(若不修改,則“數(shù)字”屬性對(duì)應(yīng)的選擇方式將是一個(gè)數(shù)字區(qū)間)。
“所在省”“所在市”兩個(gè)字段均被默認(rèn)為“字符串”,將其分別修改為“州/省/市/自治區(qū)”和“郡縣”屬性后,便使用Tableu的數(shù)據(jù)地圖功能。
3.3.3 視圖設(shè)計(jì)成果
最后通過拖動(dòng)、選擇及設(shè)置參數(shù)即完成視圖設(shè)計(jì)。
(1)流向圖。①利用經(jīng)緯度數(shù)據(jù)創(chuàng)建地圖點(diǎn)。用Makeport函數(shù)創(chuàng)建“計(jì)算字段”來實(shí)現(xiàn)。②將起止地圖點(diǎn)連接為流向線。用Makeline函數(shù)創(chuàng)建“計(jì)算字段”來實(shí)現(xiàn)。
通過上述的操作,即得到省內(nèi)和全國(guó)就業(yè)流向圖。
(2)職位熱度圖。在Tableau中,可交互的職位熱度可用球圖展示如圖1所示,也可用條形圖、方塊圖等形式。
圖1:職位熱度球圖
可選交互項(xiàng)的設(shè)置。將設(shè)為可選項(xiàng)的字段──“年度”“專業(yè)”拖入“篩選器”,并設(shè)置為“可見”即可。
預(yù)覽并修改滿意后,就可以保存和發(fā)布了。
在利用Tableau Public進(jìn)行可視化設(shè)計(jì)前,需要在Tableau網(wǎng)站上注冊(cè)一個(gè)個(gè)人賬號(hào),才能在Tableau的公用服務(wù)器上保存和發(fā)布設(shè)計(jì)成果(企業(yè)購(gòu)買服務(wù)器版本Tableau Server,則可以自建Tableau服務(wù)器)。
發(fā)布到Tableau服務(wù)器后,就可以在網(wǎng)頁上瀏覽相應(yīng)的設(shè)計(jì)成果。網(wǎng)頁上支持將所做的設(shè)計(jì)下載為圖片、PDF或PPT文檔,還可以通過郵件等方式分享所做的設(shè)計(jì)。
高職學(xué)生就業(yè)數(shù)據(jù)可視化的探索與研究將成為高職院校學(xué)生就業(yè)工作指導(dǎo)的重要手段和方式,利用Tableau、FineBI等相關(guān)可視化工具對(duì)學(xué)生就業(yè)數(shù)據(jù)進(jìn)行分析和可視化呈現(xiàn),擺脫了傳統(tǒng)統(tǒng)計(jì)圖的二維限制,可以展示多個(gè)變量之間的交互作用、趨勢(shì)和相關(guān)性,在多維空間、立體層面展示就業(yè)數(shù)據(jù),呈現(xiàn)的內(nèi)容更加豐富、全面,具有更強(qiáng)的表現(xiàn)力,也更快速、輕松地提取數(shù)據(jù)中的含義,勢(shì)必對(duì)傳統(tǒng)就業(yè)指導(dǎo)形式和學(xué)生就業(yè)選擇產(chǎn)生深遠(yuǎn)的影響。
隨著數(shù)據(jù)容量和復(fù)雜性的與日俱增,需要?jiǎng)?chuàng)建更復(fù)雜規(guī)模更大的數(shù)字模型,海量數(shù)據(jù)深度分析的可視化需求越來越大,依靠可視化手段進(jìn)行數(shù)據(jù)分析將會(huì)成為標(biāo)準(zhǔn),利用其進(jìn)行學(xué)生就業(yè)數(shù)據(jù)分析和展示是信息化發(fā)展的潮流。學(xué)生就業(yè)數(shù)據(jù)可視化研究和探索在大數(shù)據(jù)時(shí)代具有良好的發(fā)展前景,將促進(jìn)高職院校學(xué)生就業(yè)工作邁上新的臺(tái)階。