• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于Python的數(shù)據(jù)可視化

    2019-10-21 09:15:38楊凱利山美娟
    現(xiàn)代信息科技 2019年5期
    關(guān)鍵詞:數(shù)據(jù)可視化數(shù)據(jù)分析

    楊凱利 山美娟

    摘 ?要:在大數(shù)據(jù)快速發(fā)展的今天,Python豐富的工具包在科學(xué)計算、文件處理、數(shù)據(jù)可視化等領(lǐng)域越來越凸顯其價值。能夠發(fā)現(xiàn)數(shù)據(jù)、清洗數(shù)據(jù),并使用正確的工具實現(xiàn)數(shù)據(jù)可視化至關(guān)重要。本文敘述了Python軟件第三方庫的安裝和繪圖工具的應(yīng)用,并利用Numpy和Matplotlib庫進(jìn)行數(shù)據(jù)可視化,分析大學(xué)生通識能力情況,通過實踐展示了Python庫的強大功能和使用步驟,為學(xué)習(xí)數(shù)據(jù)可視化的讀者提供參考。

    關(guān)鍵詞:Python;數(shù)據(jù)可視化;數(shù)據(jù)分析;第三方庫

    中圖分類號:TP391.1 ? ? ?文獻(xiàn)標(biāo)識碼:A 文章編號:2096-4706(2019)05-0030-03

    Abstract:With the rapid development of big data,Pythons rich toolkits are becoming more and more valuable in the fields of scientific computing,file processing,data visualization and so on. It is essential to be able to discover,clean and visualize data using the right tools. This paper describes the installation of the third library of Python software and the application of drawing tools,and uses Numpy and Matplotlib libraries for data visualization,analyses the general knowledge ability of college students,and demonstrates the powerful functions and using steps of Python library through practice,which provides a reference for the readers who study data visualization.

    Keywords:Python;data visualization;data analysis;third-party library

    0 ?引 ?言

    Python是目前市面上用于大數(shù)據(jù)分析的優(yōu)先選擇,Python數(shù)據(jù)分析功能強大,對數(shù)據(jù)抽取、收集整理、分析挖掘及展示,都可以實現(xiàn),避免了開發(fā)程序的切換。Python的數(shù)據(jù)挖掘能力和產(chǎn)品構(gòu)建能力兼而有之,是跨平臺且開源的技術(shù),成本較小。

    數(shù)據(jù)時代,通過數(shù)據(jù)分析挖掘數(shù)據(jù)的價值,Python就是很好的選擇,它包含了Numpy、Pandas、Matplotlib、SciPy、iPython等主要數(shù)據(jù)分析庫。數(shù)據(jù)可視化是數(shù)據(jù)探索的主要途徑。數(shù)據(jù)可視化的目標(biāo)是通過所選方法的視覺展示、清晰有效地與用戶交流信息。有效的可視化有助于分析和推理數(shù)據(jù)和證據(jù)。這使得復(fù)雜數(shù)據(jù)更容易接觸、理解和使用。

    1 ?數(shù)據(jù)可視化工具

    俗話說,一圖勝千言。數(shù)據(jù)可視化不僅是一種技能,更是一門藝術(shù)。Python中的可視化工具包括通用的軟件工具和特定軟件組件。通用的軟件工具是集成開發(fā)環(huán)境(IDE),這是一種同一軟件包內(nèi)囊括所有生產(chǎn)工具的應(yīng)用程序。Enthought中的Canopy和Continuum Analytics中的Anaconda都是比較方便的工具。特定的軟件繪圖組件是Python繪圖庫,比如Bokeh、iPython、Matplotlib、NetworkX、Scipy、Numpy、Scikit-learn以及Seaborn。

    Plotly是一種在線分析和數(shù)據(jù)可視化工具。為更好地協(xié)作,Plotly提供了在線畫圖、分析學(xué)和統(tǒng)計工具。這種工具通過將Python與使用JavaScript的用戶界面及和D3.js、HTML和CSS創(chuàng)建的可視化庫一起使用來構(gòu)建。Plotly包括多語言兼容的科學(xué)繪圖庫,比如Arduino、Julia、MATLAB、Python和R。

    最常用的可視化類型包含以下分類:比較和排名、相關(guān)性、分布、位置定位或地理數(shù)據(jù)、局部到整體的關(guān)系、隨時間的變化趨勢等。

    2 ?Python第三方庫的使用

    Python語言有標(biāo)準(zhǔn)庫和第三方庫兩類,標(biāo)準(zhǔn)庫隨Python安裝包一起發(fā)布,用戶可以隨時使用,第三方庫需要安裝后才能使用。強大的標(biāo)準(zhǔn)庫奠定了Python發(fā)展的基石,豐富的第三方庫是Python不斷發(fā)展的保證,隨著Python的發(fā)展,一些穩(wěn)定的第三庫被加入到了標(biāo)準(zhǔn)庫里面。

    2.1 ?Python第三方庫的安裝

    Python第三方庫有三種安裝方式,pip工具安裝、自定義安裝和文件安裝。最常用且最高效的Python第三方庫安裝方式是pip工具安裝,本文只介紹pip工具安裝方法。

    pip是Python內(nèi)置命令,需要通過命令行執(zhí)行。通過pip-h命令將列出pip常用的子命令。安裝一個庫的命令格式為:pip install<擬安裝庫名>,比如安裝Matplotlib庫,就可以用命令pip install Matplotlib,打開Windows命令行程序cmd.exe,進(jìn)入Python安裝目錄所在的文件夾中,并進(jìn)入Scripts文件(pip在Scripts目錄下),輸入命令,pip工具默認(rèn)從網(wǎng)絡(luò)上下載Matplotlib庫安裝文件,自動安裝到系統(tǒng)中。第三方庫安裝好后,可以通過pip list命令列出當(dāng)前系統(tǒng)中已經(jīng)安裝的第三方庫。

    2.2 ?矩陣運算庫Numpy和繪圖庫Matplotlib概述

    Numpy是用于處理含有同種元素的多維數(shù)組運算的第三方庫。Numpy庫還包括三角運算函數(shù)、傅里葉變換、隨機和概率分布、基本數(shù)值統(tǒng)計、位運算、矩陣運算等非常豐富的功能。

    Python有很多繪圖包,而Matplotlib是它們中極其熱門的一個軟件包。Matplotlib是提供數(shù)據(jù)繪圖功能的第三方庫,其pyplot子庫主要用于實現(xiàn)各種數(shù)據(jù)展示圖形的繪制。Matplotlib庫由一系列有組織有隸屬關(guān)系的對象構(gòu)成,這對于基礎(chǔ)繪圖操作來說顯得過于復(fù)雜。而pyplot子模塊將繪圖所需要的對象構(gòu)建過程封裝在函數(shù)中,對用戶提供了更加友好的接口。

    3 ?利用Python第三方庫進(jìn)行數(shù)據(jù)可視化

    雷達(dá)圖是通過多個離散屬性比較對象的最直觀工具,掌握繪制雷達(dá)圖的方法將會為生活和工作帶來樂趣。本例通過問卷調(diào)查,獲取了某大學(xué)本科一年級不同分院學(xué)生在五種核心通識能力方面的數(shù)據(jù),經(jīng)過數(shù)據(jù)整理,使用Python來繪制多級雷達(dá)圖,即在一組同心圓上填充不規(guī)則五邊形,其每個頂點到圓心的距離代表分院學(xué)生的某種能力。

    3.1 ?大學(xué)生通識能力雷達(dá)圖繪制代碼

    import numpy as np

    import matplotlib.pyplot as plt

    import matplotlib

    matplotlib.rcParams['font.family']='SimHei'

    matplotlib.rcParams['font.sans-serif']='SimHei'

    radar_labels=np.array(['表達(dá)與溝通', '團(tuán)隊合作', '分析與綜合信息','創(chuàng)新思維','批判性思維']) #雷達(dá)標(biāo)簽

    nAttr=5

    data=np.array([[5, 6, 8, 6, 7],

    [9, 6, 5, 7, 6],

    [4, 8, 9, 8, 7],

    [7, 8, 6, 7, 8],

    [8, 7, 6, 7, 6]]) ? ? #數(shù)據(jù)值

    data_labels=('金融學(xué)院,'文化傳媒學(xué)院,'信息學(xué)院','管理學(xué)院','人文教育學(xué)院)

    angles=np.linspace(0, 2*np.pi,nAttr,endpoint= False)

    data=np.concatenate((data, [data[0]]))

    angles=np.concatenate((angles, [angles[0]]))

    fig=plt.figure(facecolor="white")

    plt.subplot(111, polar=True)

    plt.plot(angles,data,'o-',linewidth=1.5, alpha= 0.2)

    plt.fill(angles,data, alpha=0.25)

    plt.thetagrids(angles*180/np.pi, radar_labels,1.2)

    plt.figtext(0.52, 0.95,'大學(xué)生通識能力分析', ha=' center', size=20)

    legend=plt.legend(data_labels, loc=(0.94, 0.80), labelspacing=0.1)

    plt.setp(legend.get_texts(), fontsize='large')

    plt.grid(True)

    plt.savefig('tongshi.png')

    plt.show()

    大學(xué)生核心通識能力包含5個屬性,設(shè)置屬性標(biāo)簽lables,并預(yù)設(shè)各分院匯總數(shù)據(jù)。np.concatenate()函數(shù)用于將數(shù)據(jù)和角度的數(shù)組首尾閉合起來,便于調(diào)用plot()。圖形保存格式為Python可支持的PNG類型,最后通過show()函數(shù)顯示圖形,默認(rèn)圖形文件保存路徑與代碼保存路徑相同。

    3.2 ?代碼運行及實驗分析

    在Python3.7 IDLE編輯環(huán)境中輸入代碼并運行,可以得到如圖1所示的內(nèi)容,顯示各分院學(xué)生通識能力五個維度的效果。從圖中可以看出,學(xué)校金融學(xué)院學(xué)生的團(tuán)隊合作能力較高,信息學(xué)院的分析與綜合信息能力較高。學(xué)校在通識課程設(shè)置和能力培養(yǎng)方面可以有所側(cè)重,通過一些工作坊和俱樂部加強學(xué)生薄弱能力的培養(yǎng),旨在培養(yǎng)具有積極心態(tài)、獨立思考和開闊視野的全人。

    4 ?結(jié) ?論

    近二十年的開源運動產(chǎn)生了深植于各信息技術(shù)領(lǐng)域的大量可重用資源,直接且有力地支撐了信息技術(shù)超越其他技術(shù)領(lǐng)域的發(fā)展速度,形成了“計算生態(tài)”。Python語言有大量的第三方庫,形成了龐大的“計算生態(tài)”。從游戲制作、數(shù)據(jù)處理、數(shù)據(jù)可視化分析等方面,這些“計算生態(tài)”Python使用者都提供了更加便捷的操作,以及更加靈活的編程方式,值得我們不斷嘗試與實踐。

    參考文獻(xiàn):

    [1] [美]Wes McKinney.利用Python進(jìn)行數(shù)據(jù)分析 [M].徐敬一,譯.北京:機械工業(yè)出版社,2018.

    [2] [印度]Kirthi Raman.Python數(shù)據(jù)可視化 [M].程毫,譯.北京:機械工業(yè)出版社,2017.

    [3] 高揚.數(shù)據(jù)科學(xué)家養(yǎng)成手冊 [M].北京:電子工業(yè)出版社,2017.

    [4] 嵩天,禮欣,黃天羽.Python語言程序設(shè)計基礎(chǔ) [M].北京:高等教育出版社,2017.

    [5]葉惠仙.Python在學(xué)院招生數(shù)據(jù)分析中的應(yīng)用 [J].計算機時代,2018(11):102-106.

    作者簡介:楊凱利(1978-),男,漢族,陜西戶縣人,本科,工程師,研究方向:自動控制、電路與系統(tǒng);山美娟(1978-),女,漢族,陜西戶縣人,碩士,講師,研究方向:數(shù)據(jù)分析、圖像處理。

    猜你喜歡
    數(shù)據(jù)可視化數(shù)據(jù)分析
    大數(shù)據(jù)時代背景下本科教學(xué)質(zhì)量動態(tài)監(jiān)控系統(tǒng)的構(gòu)建
    可視化:新媒體語境下的數(shù)據(jù)、敘事與設(shè)計研究
    我國數(shù)據(jù)新聞的發(fā)展困境與策略研究
    科技傳播(2016年19期)2016-12-27 14:53:29
    基于R語言的大數(shù)據(jù)審計方法研究
    Excel電子表格在財務(wù)日常工作中的應(yīng)用
    淺析大數(shù)據(jù)時代背景下的市場營銷策略
    新常態(tài)下集團(tuán)公司內(nèi)部審計工作研究
    中國市場(2016年36期)2016-10-19 04:31:23
    淺析大數(shù)據(jù)時代對企業(yè)營銷模式的影響
    沽源县| 嘉定区| 龙海市| 搜索| 东莞市| 孝感市| 都江堰市| 大洼县| 海盐县| 绥芬河市| 苏尼特右旗| 岱山县| 石阡县| 蓬安县| 凤冈县| 崇义县| 武夷山市| 枞阳县| 邮箱| 菏泽市| 射阳县| 探索| 蓝山县| 鸡西市| 宕昌县| 五河县| 抚宁县| 揭阳市| 稷山县| 红原县| 衢州市| 临安市| 仁寿县| 长子县| 北流市| 嘉义市| 周宁县| 三亚市| 伊通| 吴江市| 连州市|