import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sb
%matplotlib inline
histogram
구간(bin)을 설정하여, 해당 구간에 포함괴는 데이터가 몇개인지 세는 차트를 히스토그램이라고 한다.
히스토그램은 똑같은 데이터를 가지고 bin을 어떻게 잡느냐에 따라 차트 모양이 달라져서 해석을 다르게 할 수도 있다.
matplotlib.pyplot에 있는 hist() 로 히스토그램을 만들어보자.
df = pd.read_csv('../data/pokemon.csv')
df
plt.hist(data= df, x= 'speed')
plt.show()
# bin의 범위값을 지정하는 경우
my_bins = np.arange(df['speed'].min(), df['speed'].max(), 3)
plt.hist(data= df,
x= 'speed',
rwidth= 0.8, # 막대간 간격
bins= my_bins)
plt.show()
subplot
subplot() 함수는 여러 개의 plot을 하나의 그림에 나타내도록 한다.
plt.subplot(1, 2, 1) # (1행,2열) 중에 첫번째
plt.subplot(1, 2, 2) # (1행,2열) 중에 두번째
plt.show()
plt.figure(figsize= (12, 5)) # 가로,세로의 비율
plt.subplot(1, 2, 1)
plt.title('speed hist. bins10')
plt.xlabel('Speed')
plt.ylabel('# of Characters')
plt.hist(data= df, x= 'speed', rwidth= 0.8)
plt.subplot(1, 2, 2)
plt.title('speed hist. bins30')
plt.xlabel('Speed')
plt.ylabel('# of Characters')
plt.hist(data= df, x= 'speed', rwidth= 0.8, bins= 30)
plt.show()
'Python > Pandas' 카테고리의 다른 글
matplotlib, seaborn 을 활용한 데이터 시각화(4) - 히트맵, 한글처리 (0) | 2022.11.30 |
---|---|
matplotlib, seaborn 을 활용한 데이터 시각화(3) - scatter, regplot, pairplot, 상관계수 (0) | 2022.11.30 |
matplotlib, seaborn 을 활용한 데이터 시각화(1) - plot, countplot, pie (0) | 2022.11.29 |
Python 비트연산자 ~ 의 활용 (0) | 2022.11.29 |
Pandas 활용(10) - 데이터프레임 합치기(concat, merge) (0) | 2022.11.28 |