pandas.read_csv() 콤마( , ) 가 포함된 수치형 컬럼 불러오기

판다스로 csv 파일을 불러오다 보면 숫자 데이터인데 콤마가 포함되어 있어서 object 타입이 된 경우를 많이 볼 수 있다.

그러면 각종 연산이 불가능하기 때문에, 타입을 바꿔줘야 하는데

read_csv() 로 불러오는 과정에서 파라미터로 쉽게 할 수 있다.

import pandas as pd

df = pd.read_csv('../data/age.csv', encoding='cp949')
df.head()

df.describe()

df.info()
>>> <class 'pandas.core.frame.DataFrame'>
    RangeIndex: 3817 entries, 0 to 3816
    Columns: 104 entries, 행정구역 to 2019년07월_계_100세 이상
    dtypes: int64(1), object(103)
    memory usage: 3.0+ MB

숫자 데이터로 이루어진 102개 컬럼이 콤마 때문에 문자열 취급되었다.

해결방법

df2 = pd.read_csv('../data/age.csv', encoding='cp949', thousands=',')
# thousands 파라미터에 천 단위 구분자를 입력하면 제거해준다.

df2

df2.describe()

'Python > Pandas' 카테고리의 다른 글

오픈API Goolglemaps Geocode로 위치정보 받아오기 (0)	2022.12.01
Pandas의 DataFrame.plot() 으로 시각화하기 (0)	2022.12.01
matplotlib, seaborn 을 활용한 데이터 시각화(4) - 히트맵, 한글처리 (0)	2022.11.30
matplotlib, seaborn 을 활용한 데이터 시각화(3) - scatter, regplot, pairplot, 상관계수 (0)	2022.11.30
matplotlib, seaborn 을 활용한 데이터 시각화(2) - hist, subplot (0)	2022.11.30

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

pandas.read_csv() 콤마( , ) 가 포함된 수치형 컬럼 불러오기

'Python > Pandas' 카테고리의 다른 글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역