為了能學(xué)會(huì)正確使用matplotlib進(jìn)行繪制各種圖形,并對(duì)數(shù)據(jù)可視化有一個(gè)更深的了解,本篇文章給大家?guī)?lái)的就是數(shù)據(jù)分析常見(jiàn)圖形繪制部分.
我們?nèi)匀粡腵函數(shù)功能`、`實(shí)例代碼`、`參數(shù)講解`、`效果演示`四個(gè)層面來(lái)介紹每一種統(tǒng)計(jì)圖,希望能給每個(gè)學(xué)習(xí)數(shù)據(jù)分析的小伙伴帶來(lái)幫助.
#### bar()函數(shù)
##### 1.函數(shù)功能
繪制柱狀圖,主要用來(lái)比較不同類別之間的數(shù)據(jù)情況。
##### 2. 參數(shù)詳解
plt.bar(x,height,width=0.8,bottom=None,*, *align='center'*, *data=None*, **kwargs)
- x:在什么位置顯示柱形圖;
- height:每根柱子的高度;
- width:每根柱子的寬度,可以一樣,也可以各不相同;
- bottom:每根柱子底部位置,可以一樣,也可以各不相同;
- align:柱子的位置與x值的關(guān)系,有center、edge可選;
- color: 柱形的顏色
- edgecolor:柱子邊緣顏色的設(shè)置
- linewidth: 柱形邊緣線的線條寬度
- tick_label:柱形的刻度標(biāo)簽
- hatch:表示刻度陰影類型主要有這些類型:`/`、`*`、`.`、`|`、`-`、`+`、`x`、`o`、`O`
##### 3.演示代碼
import matplotlib as mpl
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['Simhei']
# 中文情況下 負(fù)號(hào)顯示會(huì)有異常 所以還需要設(shè)置負(fù)號(hào)的操作
plt.rcParams['axes.unicode_minus'] = False
x = ['a','b','c','d','e','f','g','h']
y = np.random.randint(1,10,8)
plt.bar(x,y,align='center',color='c',edgecolor='r',hatch='/')
plt.xlabel('編號(hào)')
plt.ylabel('滿意度')
plt.show()
##### 4.效果
**錯(cuò)位柱狀圖**
import numpy as np
import matplotlib.pyplot as plt
# 準(zhǔn)備數(shù)據(jù)
men_means, men_std = (20, 35, 30, 35, 27), (2, 3, 4, 1, 2)
women_means, women_std = (25, 32, 34, 20, 25), (3, 5, 2, 3, 3)
# 計(jì)算數(shù)據(jù)個(gè)數(shù)
ind = np.arange(len(men_means)) # the x locations for the groups
# 定義柱形的寬度
width = 0.35 # the width of the bars
# 繪制兩個(gè)柱狀圖
fig, ax = plt.subplots()
rects1 = ax.bar(ind - width/2, men_means, width, yerr=men_std,
color='SkyBlue', label='Men')
rects2 = ax.bar(ind + width/2, women_means, width, yerr=women_std,
color='IndianRed', label='Women')
# 添加一些文本標(biāo)簽,標(biāo)題,定制x軸的刻度等
ax.set_ylabel('Scores')
ax.set_title('Scores by group and gender')
ax.set_xticks(ind)
ax.set_xticklabels(('G1', 'G2', 'G3', 'G4', 'G5'))
ax.legend()
**堆疊柱狀圖**
import numpy as np
import matplotlib.pyplot as plt
# 準(zhǔn)備數(shù)據(jù)
men_means, men_std = (20, 35, 30, 35, 27), (2, 3, 4, 1, 2)
women_means, women_std = (25, 32, 34, 20, 25), (3, 5, 2, 3, 3)
# 計(jì)算數(shù)據(jù)個(gè)數(shù)
ind = np.arange(len(men_means))
# 定義柱形的寬度
width = 0.35
p1 = plt.bar(ind, menMeans, width, yerr=menStd)
p2 = plt.bar(ind, womenMeans, width,bottom=menMeans, yerr=womenStd)
plt.ylabel('Scores')
plt.title('Scores by group and gender')
plt.xticks(ind, ('G1', 'G2', 'G3', 'G4', 'G5'))
plt.yticks(np.arange(0, 81, 10))
plt.legend((p1[0], p2[0]), ('Men', 'Women'))
plt.show()
現(xiàn)有部分租房數(shù)據(jù),給大家過(guò)濾出兩列,分別是price 和 date,分析每年的租房均值
import pandas as pd
listdf=pd.read_excel('listings.xlsx')
data = listdf[['price','date']].dropna()
data['year'] = data['date'].dt.year
r = data.groupby(by='year').mean()
plt.bar(r.index,r.values.reshape(len(r)),alpha=0.6,width = 0.8, facecolor = 'deeppink', edgecolor = 'green', lw=1, label='租房分析')
plt.legend(loc=2)
plt.show()
效果:
**刻度傾斜**
...
plt.bar(r.index,r.values.reshape(len(r)),alpha=0.6,width = 0.8, facecolor = 'deeppink', edgecolor = 'green', lw=1, label='租房分析')
plt.legend(loc=2)
plt.xticks(rotation=45)
plt.show()
```
效果:
**添加數(shù)據(jù)標(biāo)簽**
y = r.values.reshape(len(r))
b = plt.bar(r.index,y,alpha=0.6,width = 0.8, facecolor = 'deeppink', edgecolor = 'green', lw=1, label='租房分析')
# 添加數(shù)據(jù)標(biāo)簽 就是矩形上面的數(shù)值
def add_labels(rects):
for rect in rects:
height = rect.get_height()
plt.text(rect.get_x() + rect.get_width()/2, height, height, ha='center', va='bottom')
rect.set_edgecolor('white')
add_labels(b)
plt.legend(loc=2)
plt.xticks(rotation=45)
plt.show()
### barh()函數(shù)
##### 1.函數(shù)功能
繪制條形圖
##### 2. 參數(shù)詳解
繪制條形圖`plt.barh(x,y)`
- x:在y軸上顯示的類別
- y:各個(gè)類別的數(shù)量值
##### . 實(shí)例代碼
import matplotlib as mpl
import matplotlib.pyplot as plt
mpl.rcParams['font.sans-serif'] = ['SimHei']
x = [1,2,3,4,5,6,7,8]
y = [2,3,4,9,1,2,6,4]
plt.barh(x,y,tick_label=['a','b','c','d','e','f','g','h'],color='m')
plt.xlabel('評(píng)分')
plt.ylabel('編號(hào)')
plt.show()
##### 4. 效果演示
### hist()函數(shù)
##### 1.函數(shù)功能
繪制直方圖
**2.參數(shù)詳解**
繪制直方圖`plt.hist(x,bins,color,alpha)`
- x:數(shù)據(jù)集,直方圖會(huì)對(duì)該數(shù)據(jù)集的大小按區(qū)間進(jìn)行歸類
- bins:數(shù)據(jù)集的分隔區(qū)間
- color:直方圖的顏色
- alpha:直方圖顏色的透明度
- rwidth: 柱子之間的距離
##### 3. 實(shí)例代碼
import matplotlib as mpl
import matplotlib.pyplot as plt
import numpy as np
mpl.rcParams['font.sans-serif'] = ['SimHei']
x = np.random.randint(0,100,100) # 生成范圍在【0~100】之間100個(gè)數(shù)據(jù)
bins = np.arange(0,101,10) # 生成數(shù)組[0 10 20 ... 100],里面是間隔為10的十個(gè)數(shù)
plt.hist(x,bins,color='m',alpha=0.5,rwidth=0.8)
plt.xlabel('分?jǐn)?shù)段')
plt.ylabel('人數(shù)')
plt.title("各分?jǐn)?shù)段人數(shù)分布")
plt.show()
> 直方圖與柱形圖相似但不同,直方圖表示的是離散型數(shù)值的區(qū)間分布情況;更多關(guān)于直方圖hist的教程請(qǐng)參考官方文檔。
> range與arange的區(qū)別:
> arange函數(shù)返回的是numpy里定義的數(shù)組,數(shù)組每一個(gè)元素的數(shù)據(jù)類型一致。range在Python2與Python3里有著不同的功能。Python2里的range返回的是列表,而Python3里的range返回的是可迭代的對(duì)象,通常使用for循環(huán)將其輸出。
##### 4. 效果演示
### pie()函數(shù)
##### 1.函數(shù)功能
繪制餅圖,顯示不同類別所占百分比。
**2.參數(shù)說(shuō)明:**
繪制餅圖`plt.pie(x,explode,labels,autopct,startangle)`
- x:每一塊的比例,如果sum(x)>1,會(huì)對(duì)sum(x)進(jìn)行歸一化操作。
- explode:每一塊離開(kāi)中心的距離
- labels:每一塊外側(cè)顯示的標(biāo)簽文字
- autopct:控制餅圖百分比設(shè)置,可以使用format字符串表示,`%1.1f%%`小數(shù)點(diǎn)前后各一位(沒(méi)有用空格補(bǔ)齊)
- startangle:起始繪制角度,默認(rèn)從x軸正方向逆時(shí)針畫(huà)起,若設(shè)定90度則從y軸正方向畫(huà)起。
##### 3. 實(shí)例代碼
import matplotlib as mpl
import matplotlib.pyplot as plt
import numpy as np
mpl.rcParams['font.sans-serif'] = ['SimHei']
labels = ['房貸','育兒','飲食','交通','娛樂(lè)','其它']
sizes = [5,1,2,0.5,0.8,1.5]
explode = (0,0.1,0,0,0,0)
plt.pie(x=sizes,explode=explode,labels=labels,autopct='%1.1f%%',startangle=150)
plt.title("餅圖-家庭支出情況")
plt.axis('equal')
# 添加圖例
plt.legend(loc="upper right",fontsize=10,bbox_to_anchor=(1.1,1.05),borderaxespad=0.3)
plt.show()
##### 4. 效果演示
### scatter()函數(shù)
##### 1.函數(shù)功能
用于繪制氣泡圖,二維數(shù)據(jù)借助氣泡大小展示三維數(shù)據(jù)。
##### **2.參數(shù)說(shuō)明:**
繪制氣泡圖:`plt.scatter(a,b,c,s,cmap)`
- a:x軸上的離散數(shù)值,固定長(zhǎng)度的數(shù)組。
- b:y軸上的離散數(shù)值,固定長(zhǎng)度的數(shù)組。
- c:氣泡的顏色,可以是固定顏色也可以是一個(gè)數(shù)組。
- s:氣泡的大小,用于記錄第三維度的函數(shù)關(guān)系。
- cmap:顏色映射表,可以簡(jiǎn)單理解成配色方案。
##### 3. 實(shí)例代碼
import matplotlib as mpl
import matplotlib.pyplot as plt
import numpy as np
mpl.rcParams['font.sans-serif'] = ['SimHei'] # 顯示中文
mpl.rcParams['axes.unicode_minus'] = False # 為了坐標(biāo)軸負(fù)號(hào)正常顯示
a = np.random.randn(100)
b = np.random.randn(100)
plt.style.use('ggplot') # 設(shè)置繪圖風(fēng)格
plt.scatter(a,b,c=np.random.rand(100),cmap='jet',s=100*(a**2+b**2),alpha=0.7)
plt.colorbar()
plt.title('氣泡圖')
plt.show()
> matplotlib默認(rèn)不支持中文,設(shè)置中文字體后,負(fù)號(hào)會(huì)顯示異常。需要手動(dòng)將坐標(biāo)軸負(fù)號(hào)設(shè)為False才能正常顯示負(fù)號(hào)。
##### 4. 效果演示
繪制不同顏色的散點(diǎn)圖
colrs = ['red', 'blue','yellow']
labels = ['red', 'blue','yellow']
d1 = np.random.randn(10,3) # 10行,2列的ndarray,一行代表一個(gè)點(diǎn)
d2 = np.array([0,1,0,1,1,1,0,1,0,0])
# 循環(huán)的目的是區(qū)分,循環(huán)一次就畫(huà)一種類的所有點(diǎn)
# d2==0時(shí),點(diǎn)的顏色是red,圖例是red
# d2==1時(shí),點(diǎn)的顏色是blue,圖例是blue
for i in range(d1.shape[1]): # shape[1]的值是2,即便利兩次
plt.scatter(d1[d2==i,0]
,d1[d2==i,1]
,s=50
,c=colrs[i]
,label = labels[i],alpha=0.4)
plt.legend('散點(diǎn)圖')
plt.show()
### polar()函數(shù)
##### 1.函數(shù)功能
繪制雷達(dá)圖(極線圖)
##### **2.參數(shù)說(shuō)明:**
繪制雷達(dá)圖`plt.polar(theta,r,marker)`
- theta:在極坐標(biāo)系下坐標(biāo)點(diǎn)的角度
- r:在極坐標(biāo)系下坐標(biāo)點(diǎn)與極點(diǎn)的距離
- marker:定義各個(gè)點(diǎn)的樣式
##### 3. 實(shí)例代碼
import matplotlib as mpl
import matplotlib.pyplot as plt
import numpy as np
mpl.rcParams['font.sans-serif'] = ['SimHei']
plt.style.use('ggplot') # 設(shè)置繪圖風(fēng)格
theta = np.array([0.25,0.75,1,1.5,0.25]) # 定義各個(gè)點(diǎn)的極角,注意最后要閉合
r = [20,60,40,60,20] # 定義各個(gè)點(diǎn)極徑的長(zhǎng)度
plt.polar(theta*np.pi,r,'r-',lw=1,marker='o') # 設(shè)置雷達(dá)圖路徑,r-表示紅色實(shí)線
plt.fill(theta*np.pi,r,c='c',alpha=0.4) # 填充雷達(dá)圖,課設(shè)置顏色與透明度
plt.ylim(0,100) # 設(shè)置極坐標(biāo)軸的范圍
plt.title('雷達(dá)圖',fontsize=12)
plt.show()
##### 4. 效果演示
參考示例 1:
labels = np.array(['a','b','c','d','e','f']) # 標(biāo)簽
dataLenth = 6 # 數(shù)據(jù)長(zhǎng)度
data1 = np.random.randint(0,10,6)
data2 = np.random.randint(0,10,6) # 數(shù)據(jù)
angles = np.linspace(0, 2*np.pi, dataLenth, endpoint=False) # 分割圓周長(zhǎng)
data1 = np.concatenate((data1, [data1[0]])) # 閉合
data2 = np.concatenate((data2, [data2[0]])) # 閉合
angles = np.concatenate((angles, [angles[0]])) # 閉合
plt.polar(angles, data1, 'o-', linewidth=1) #做極坐標(biāo)系
plt.fill(angles, data1, alpha=0.25)# 填充
plt.polar(angles, data2, 'o-', linewidth=1) #做極坐標(biāo)系
plt.fill(angles, data2, alpha=0.25)# 填充
plt.thetagrids(angles * 180/np.pi, labels) # 設(shè)置網(wǎng)格、標(biāo)簽
plt.ylim(0,10) # polar的極值設(shè)置為ylim
參考示例 2
import numpy as np
import matplotlib.pyplot as plt
# 開(kāi)始設(shè)定一些數(shù)據(jù)
#標(biāo)簽
labels = np.array(['藝術(shù)A','調(diào)研I','實(shí)際R','常規(guī)C','企業(yè)E','社會(huì)S'])
#數(shù)據(jù)個(gè)數(shù)
dataLenth = 6
#數(shù)據(jù)
data = np.array([1,4,3,6,4,8])
angles = np.linspace(0, 2*np.pi, dataLenth, endpoint=False)
data = np.concatenate((data, [data[0]])) # 閉合
angles = np.concatenate((angles, [angles[0]])) # 閉合
fig = plt.figure()
ax = fig.add_subplot(111, polar=True)# polar參數(shù)!!
ax.plot(angles, data, 'bo-', linewidth=2)# 畫(huà)線
ax.fill(angles, data, facecolor='r', alpha=0.25)# 填充
ax.set_thetagrids(angles * 180/np.pi, labels, fontproperties="SimHei")
ax.set_title("matplotlib雷達(dá)圖", va='bottom', fontproperties="SimHei")
ax.set_rlim(0,10)
ax.grid(True)
plt.show()
### stem()函數(shù)
##### 1.函數(shù)功能
用于繪制棉棒圖
##### 2.參數(shù)說(shuō)明
繪制棉棒圖`plt.stem(x,y,linefmt,markerfmt,basefmt)`
- x:指定x軸的位置
- y:設(shè)置棉棒的長(zhǎng)度
- linefmt:棉棒的樣式
- markerfmt:棉棒末端的樣式
- basefmt:棉棒基線的樣式
##### 3.實(shí)例代碼
import matplotlib as mpl
import matplotlib.pyplot as plt
import numpy as np
mpl.rcParams['font.sans-serif'] = ['SimHei']
mpl.rcParams['axes.unicode_minus'] = False
x = np.linspace(0.5,2*np.pi,20)
y = np.random.randn(20)
plt.stem(x,y,linefmt='-.',markerfmt='o',basefmt='-')
plt.title('棉棒圖')
plt.show()
##### 4.效果演示
### boxplot()函數(shù)
##### 1.函數(shù)功能
用于繪制箱線圖
##### 2.參數(shù)說(shuō)明:
繪制箱線圖`plt.boxplot(x,labels)`
- x:輸入的數(shù)據(jù)
- label:圖例
##### 3.實(shí)例代碼
import matplotlib as mpl
import matplotlib.pyplot as plt
import numpy as np
mpl.rcParams['font.sans-serif'] = ['SimHei']
mpl.rcParams['axes.unicode_minus'] = False
x1 = np.random.randn(100)
x2 = np.random.randn(100)
x3 = np.random.randn(100)
labels = ['第一','第二','第三']
plt.boxplot([x1,x2,x3],labels=labels)
plt.grid(axis='y',ls=':',lw=1,c='g',alpha=0.4)
plt.title('箱線圖')
plt.show()
##### 4.效果演示
### errotbar()函數(shù)
##### 1.函數(shù)功能
用于繪制誤差棒圖
##### 2.參數(shù)說(shuō)明
繪制誤差棒圖`plt.errorbar(x,y,fmt,yerr,xerr,ecolor,mfc,mec,capthick,capsize)`
- x:數(shù)據(jù)點(diǎn)的水平位置
- y:數(shù)據(jù)點(diǎn)的垂直位置
- fmt:數(shù)據(jù)點(diǎn)的標(biāo)記樣式和數(shù)據(jù)點(diǎn)標(biāo)記的連接線樣式
- xerr:x軸方向數(shù)據(jù)點(diǎn)的誤差計(jì)算方法
- yerr:y軸方向數(shù)據(jù)誤差點(diǎn)的計(jì)算方法
- ecolor:誤差棒的顏色
- mfc:數(shù)據(jù)點(diǎn)的標(biāo)記顏色
- mec:數(shù)據(jù)點(diǎn)標(biāo)記邊緣顏色
- capthick:誤差棒邊界橫杠的厚度
- capsize:誤差棒邊界橫杠的大小
##### 3.實(shí)例代碼
import matplotlib as mpl
import matplotlib.pyplot as plt
import numpy as np
mpl.rcParams['font.sans-serif'] = ['SimHei']
mpl.rcParams['axes.unicode_minus'] = False
x = np.linspace(0.1,0.6,6)
y = np.exp(x)
plt.errorbar(x,y,fmt='o:',yerr=0.2,xerr=0.02,ecolor='g',mfc='c',mec='r',capthick=2,capsize=3)
plt.xlim(0,0.7)
plt.title('誤差棒圖')
plt.show()
##### 4.效果演示
更多關(guān)于“Python培訓(xùn)”的問(wèn)題,歡迎咨詢千鋒教育在線名師。千鋒教育多年辦學(xué),課程大綱緊跟企業(yè)需求,更科學(xué)更嚴(yán)謹(jǐn),每年培養(yǎng)泛IT人才近2萬(wàn)人。不論你是零基礎(chǔ)還是想提升,都可以找到適合的班型,千鋒教育隨時(shí)歡迎你來(lái)試聽(tīng)。