pd.read_csv() 를 하는 과정에서 에러가 발생했다.
ParserError: Error tokenizing data. C error: Expected 23 fields in line 533719, saw 24
이 에러는 다른 라인들보다 구분자(seperator)의 갯수가 많은 라인이 있을 때 발생한다.
직접 csv 파일을 수정해도 되지만,
위처럼 데이터가 많은 경우는 찾아서 수정하는 것도 일이기 때문에
read_csv의 파라미터로 에러가 발생한 라인만 제거하고 가져올 수 있다.
파라미터에 error_bad_lines= False 를 추가해준다.
chicago_df_1 = pd.read_csv('Chicago_Crimes_2005_to_2007.csv',
error_bad_lines=False,
index_col=0)
참고로 pd.read_csv() 할 때 다른 라인들보다 구분자의 갯수가 적은 라인이 있는 경우는,
에러 없이 부족한 데이터가 NaN으로 채워진다.