国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

六種數據分析的基本可視化

大數據 數據分析
在本文中,我們將學習如何創建6種基本但常用的數據可視化類型。我還寫了一篇文章,解釋了如何使用Seaborn創建這些可視化。

數據可視化是數據科學中非常重要的一部分。在探索和理解數據時非常有用。在某些情況下,可視化在傳達信息方面比普通數字要好得多。

使用數據可視化技術可以輕松發現變量之間的關系,變量的分布以及數據中的基礎結構。

[[355850]]

在本文中,我們將學習如何創建6種基本但常用的數據可視化類型。我還寫了一篇文章,解釋了如何使用Seaborn創建這些可視化。

我們將在這篇文章中使用Matplotlib。因此,您不僅將了解可視化,而且還將了解Matplotlib和Seaborn語法之間的區別。

我們將使用Kaggle上可用的食品雜貨和直銷數據集來創建可視化。

首先,將數據集讀取為Pandas數據框。

  1. import numpy as np 
  2. import pandas as pd 
  3. grocery = pd.read_csv("/content/Groceries_dataset.csv", parse_dates=['Date']) 
  4. marketing = pd.read_csv("/content/DirectMarketing.csv") 

六種數據分析的基本可視化

> The first 5 rows of the grocery dataframe (image by author)

六種數據分析的基本可視化

> The first 5 rows of the marketing dataframe (image by author)

我們現在可以開始創建可視化并探索數據集。

1. 線圖

線圖可視化兩個變量之間的關系。其中之一通常是時間,以便我們可以看到變量如何隨時間變化。

對于雜貨數據集,我們可以使用線圖來可視化所購買商品的數量隨時間的變化。

首先,我們使用Pandas的groupby函數計算每天購買的商品數量。

  1. items = grocery[['Date','itemDescription']]\ 
  2.   .groupby('Date').count().reset_index() 
  3. items.rename(columns={'itemDescription':'itemCount'}, inplace=True
  4. items.head()  
  5. Date item Count  
  6. 2014-01-01 48 1  
  7. 2014-01-02 62 2  
  8. 2014-01-03 54 3  
  9. 2014-01-04 64 4  
  10. 2014-01-05 44 

這是用于創建折線圖的matplotlib語法。

  1. plt.figure(figsize=(10,6)) 
  2. plt.title("Number of Items Purchased - Daily", fontsize=16
  3. plt.plot('Date', 'itemCount',  
  4.          data=items[items.Date > '2015-08-01']) 
  5. plt.xlabel('Date', fontsize=14
  6. plt.ylabel('Item Count', fontsize=14

六種數據分析的基本可視化

> (image by author)

第一行創建一個Figure對象,第二行添加標題,第三行在Figure對象上繪制數據。最后兩行添加了x軸和y軸的標簽。

該圖包含2015-08-01年之后的數據,以供演示。

注意:默認圖形大小為(6,4)。我們可以為每個圖形分別更改它或更新默認圖形大小。

  1. #to get the default figure size 
  2. plt.rcParams.get('figure.figsize')[6.0, 4.0]  
  3. #to update the default figure size 
  4. plt.rcParams['figure.figsize'] = (10,6) 

2. 散點圖

散點圖通常用于可視化兩個數字變量的值。我們可以觀察它們之間是否存在相關性。因此,它也是一個關系圖。

散點圖可用于檢查營銷數據集中的薪水和支出金額之間是否存在相關性。我們還可以基于分類變量來區分值。

讓我們分別創建已婚和單身人士的工資和花費金額的散點圖。

  1. fig, ax = plt.subplots() 
  2. plt.title("Salary vs Spent Amount", fontsize=16
  3. ax.scatter('Salary', 'AmountSpent',  
  4.            data=marketing[marketing.Married == 'Married']) 
  5. ax.scatter('Salary', 'AmountSpent',  
  6.            data=marketing[marketing.Married == 'Single']) 
  7. ax.legend(labels=['Married','Single'], loc='upper left'fontsize=12

六種數據分析的基本可視化

> (image by author)

我們創建了帶有多個軸對象的Figure對象。每個類別(已婚和單身)的散點圖都繪制在軸對象上。

使用Seaborn分隔類別要容易得多。我們只是將列名傳遞給hue參數。

工資和支出金額之間存在正相關關系,這不足為奇。另一個見解是,已婚人士的收入通常比單身人士高。

注意:您可能已經注意到,第一圖和第二圖的" xticks"和" yticks"大小不同。我已經使用rc方法更新了這些設置,如下所示。

  1. plt.rc('xtick', labelsize=12
  2. plt.rc('ytick', labelsize=12

3. 直方圖

直方圖是一種檢查連續變量分布的方法。它將變量的值范圍劃分為bin,并顯示每個bin中的值數。因此,我們對值的分布方式進行了概述。

我們可以使用直方圖檢查支出金額的分布。

  1. plt.title("Distribution of Spent Amount", fontsize=16
  2. plt.hist('AmountSpent', data=marketingbins=16

六種數據分析的基本可視化

> (image by author)

bins參數用于更改箱數。越多的垃圾桶將導致更詳細的分發概述。

4. 箱形圖

箱形圖概述了變量的分布。它顯示了值如何通過四分位數和離群值分布。

箱形圖可用于檢查營銷數據集中消費量的分布。我們還可以根據" OwnHome"列進行區分。

  1. X1 = marketing[marketing.OwnHome == 'Own']['AmountSpent'] 
  2. X2 = marketing[marketing.OwnHome == 'Rent']['AmountSpent'] 
  3. plt.title("Distribution of Spent Amount", fontsize=16
  4. plt.boxplot((X1,X2), labels=['Own Home', 'Rent']) 

六種數據分析的基本可視化

> (image by author)

我們可以將值數組傳遞給盒圖函數或元組中的多個數組。擁有房屋的人通常會花更多錢。這些值也更加分散。

中間的線代表變量的中位數。

5. 條形圖

條形圖主要用于分類變量。這是一個簡單的圖,但是對于報表或交付結果很有用。

我們可以使用subplots函數創建帶有兩個條形圖的圖形。

  1. fig, (ax1, ax2) = plt.subplots(nrows=1,  
  2.                                ncols=2,  
  3.                                sharey=True
  4.                                figsize=(8,5)) 
  5. ax1.bar(x=location.index, height=location.values, width=0.5) 
  6. ax1.set_title("Location", fontsize=14
  7. ax2.bar(x=age.index, height=age.values, width=0.5) 
  8. ax2.set_title("Age Groups", fontsize=14

六種數據分析的基本可視化

> (image by author)

我們可以看到每個類別中存在多少個值。這些信息可以簡單地通過pandas的value_counts函數獲得。但是,最好使用可視化。

6. 2D直方圖

2D直方圖在網格上組合了2個不同的直方圖(x軸和y軸)。因此,我們能夠可視化重疊或并發的密度。換句話說,我們可視化一對變量的分布。

我們可以使用hist2d函數輕松創建2D直方圖。

  1. plt.figure(figsize=(8, 8)) 
  2. plt.title("Histogram of Spent Amount and Salary", fontsize=16
  3. plt.hist2d("AmountSpent", "Salary",  
  4.            range=[[0, 2000], [0, 80000]], 
  5.            data=marketing,  
  6.            cmap='Blues'

六種數據分析的基本可視化

> (image by author)

為了獲得更多信息,我使用了range參數來限制x軸和y軸上的范圍。否則,由于異常值,大多數值將被壓縮到左下角。

較暗的區域包含更多的數據點。可以說,大多數人都在"支出額"和"工資"列的下部。

結論

我們在這篇文章中介紹的只是Matplotlib功能的一小部分。但是,這些基本圖通常用于探索性數據分析或創建數據報告。

此外,它們對學習Matplotlib的語法有很大幫助。像其他任何學科一樣,掌握Matplotlib的最佳方法是練習。熟悉基本功能后,即可繼續使用更高級的功能。

Matplotlib語法比Seaborn更復雜,但是它在繪圖上提供了更多的控制和靈活性。

 

責任編輯:趙寧寧 來源: 今日頭條
相關推薦

2024-07-01 08:51:19

可視化數據分析漏斗

2017-01-12 17:28:59

數據分析數據可視化可視化

2017-08-15 18:55:57

大數據數據可視化圖表

2021-07-06 14:07:59

數據存儲存儲合規性

2011-03-08 08:59:01

SQL Server數數據移動

2017-03-09 09:54:13

分析數據可視化

2018-12-03 16:50:23

數據可視化數據分析薪水

2023-11-29 20:24:45

數據可視化圖表

2020-05-14 10:19:23

Python可視化分析

2017-09-15 10:23:06

可視化Bug數據分析

2023-09-06 08:00:00

ChatGPT數據分析

2020-08-04 13:40:02

數據可視化熱力圖表格

2020-08-10 06:16:26

seaborn數據分析圖表

2023-11-24 14:02:00

Python數據分析

2018-03-06 11:02:43

數據可視化標配

2017-04-18 11:01:14

數據分析數據可視化

2019-09-02 15:40:25

可視化數據分析

2011-06-23 18:57:10

網站推廣

2019-05-06 09:27:13

數據分析大數據開發數據

2020-12-22 15:33:42

數據分析技術IT
點贊
收藏

51CTO技術棧公眾號

在线观看网站黄不卡| 影音先锋欧美在线| 国产福利电影在线播放| 亚洲风情在线资源站| 91视频免费版污| 久草这里只有精品视频| 欧美另类高清视频在线| 欧美gay男男猛男无套| 欧美激情极品视频| 国产成年精品| 日韩一区二区三区国产| 亚洲成人激情社区| 日韩成人在线电影网| 中文av资源在线| 日韩一区二区三区四区五区六区| 国际av在线| 91久久精品国产91性色tv| 香蕉97视频观看在线观看| 亚洲1区2区3区4区| 一区二区三区视频国产日韩| 天天色综合天天| 天堂网www中文在线| 欧美性jizz18性欧美| 奇米影视888狠狠狠777不卡| 欧美日韩中文字幕在线| 蜜桃成人在线视频| 欧美日韩另类国产亚洲欧美一级| 9色在线视频网站| 日韩一区二区在线播放| 都市激情久久综合| 国产亚洲欧洲在线| 国产一区二区高清在线| 97色在线视频| 围产精品久久久久久久| 精品国产一区二区三| 日韩精品色哟哟| 日本男女交配视频| 久久久久综合网| 国产网红在线| 在线免费观看日本欧美| av资源网在线观看| 欧美成人三级电影在线| 91九色在线播放| 日韩在线中文字幕| 三级小说欧洲区亚洲区| 99re6热在线精品视频播放速度| 亚洲伦伦在线| av中文字幕av| 国产精品国产a级| 青青草在线免费视频| 精品国产欧美一区二区| 国产美女久久| 欧美在线视频在线播放完整版免费观看| 日韩三区视频| 国语精品中文字幕| 成人小视频在线观看| 狠狠操夜夜操| 91精品国产综合久久精品app| www.日韩| 国产精品视频精品| 美腿丝袜亚洲一区| 制服影音先锋| 日韩一级成人av| 国产96在线亚洲| 久久精品国产一区二区三区日韩| 丰满白嫩尤物一区二区| 色琪琪免费视频网站| 日韩女优制服丝袜电影| 国产成人夜色高潮福利影视| 精品久久久久久中文字幕动漫| 国产高清精品在线| 国产对白在线正在播放| 日韩视频免费观看高清完整版在线观看 | av资源一区二区| 国产凹凸在线观看一区二区| 少妇激情av一区二区三区| 亚洲精品一区二区三区在线观看| swag国产精品一区二区| 国产在线观看一区| 国产精品盗摄一区二区三区| 欧美草逼视频| 91产国在线观看动作片喷水| 奇米精品一区二区三区在线观看 | www国产91| 亚洲大片av| 久久综合久久色| 日韩欧美一级二级| 亚洲高清极品| 97碰在线视频| 4438成人网| 欧美精品乱码| 黄www在线观看| 欧美成人三级电影在线| 第一会所亚洲原创| 日韩视频在线免费看| 日韩欧美一级片| 国产精品久久天天影视| 国产男女无遮挡| 日韩一区二区免费在线电影 | 欧美华人在线视频| 国产一区二区三区在线观看免费 | 国产乱码精品一品二品| 亚洲热app| 久久久久久一区二区三区| 免费高清在线视频一区·| 在线影院av| 欧美亚洲激情在线| 久久亚洲欧美国产精品乐播| 瑟瑟视频在线看| 日韩欧美第二区在线观看| 色婷婷亚洲婷婷| 精品视频网站| www.com黄色片| 色噜噜久久综合伊人一本| 香蕉成人久久| 91免费在线| 成人黄色片在线| 亚洲一区二区三区小说| 亚洲一区二区三区中文字幕在线观看| 国产三级中文字幕| 精品av综合导航| 日韩精品1区2区3区| 国产在线激情| 欧美精品一区三区在线观看| 欧美精品三级日韩久久| 99在线精品免费视频九九视| 99免在线观看免费视频高清| 国产精品一区视频网站| 欧美性生活影院| 一区久久精品| 精品麻豆一区二区三区| 久久精品国产综合精品| 欧美精品自拍偷拍| 老牛影视一区二区三区| 成人爽a毛片免费啪啪动漫| 天堂一区二区三区 | 麻豆av电影在线观看| 91在线观看免费观看| 欧美日韩日本国产| 女主播福利一区| 69视频在线| 日韩福利二区| 日韩国产高清视频在线| 国内精品久久久久影院一蜜桃| 亚洲日本天堂| 国产综合免费视频| 欧美有码在线观看视频| 亚洲电影一区二区三区| 午夜国产精品视频| 中文字幕在线三区| 黄色一级大片免费| 欧美激情a在线| 亚洲成精国产精品女| 国产精品草草| 波多野在线观看| 久久精品xxx| 国内偷自视频区视频综合| 一区二区三区蜜桃网| 午夜精彩国产免费不卡不顿大片| 九七久久人人| 青青草成人免费在线视频| 国内精品小视频| 欧美丝袜丝交足nylons| 国产美女一区二区| 开心激情综合| 日韩在线免费电影| www精品久久| 国产精品久久久久久久久久久久| 日本韩国一区二区三区视频| 另类小说视频一区二区| 亚洲精品18| 国产最新视频在线| 欧美美女黄色网| 国产精品91久久久| 欧美一级片在线看| 久久美女高清视频| 国产精品观看| 日韩一区中文| 可以直接在线观看的av| 日韩不卡视频一区二区| 热久久99这里有精品| 欧美一区二区在线观看| 久久久亚洲精品一区二区三区| 91成人免费| 成人自拍视频网| 久香视频在线观看| 欧美网站免费观看| 国产在线欧美日韩| 精品国产欧美一区二区五十路| 午夜亚洲福利老司机| 黑人精品欧美一区二区蜜桃| 精品国产91乱码一区二区三区四区 | 久久777国产线看观看精品| 欧美午夜精品久久久久久浪潮| 日本不卡视频一二三区| 卡一精品卡二卡三网站乱码| 蜜桃成人365av| 好男人社区在线视频| 欧美日韩中文字幕在线播放| 99视频日韩|