반응형

Jupyter Notebook에서 pandas를 통해 csv 파일을 읽어오려고 하니, UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb4 in position 0: invalid start byte 문제가 발생했다. utf-8 코드로 인코딩을 하려고 하니, 잘못된 인코딩 방식으로 에러가 발생한 문제다.


해결 방법

이 문제의 해결 방법은 read_csv 안에 파라미터 중 encoding='CP949'를 넣으면 된다. 물론, CP949 대신에 euc-kr 을 넣어도 되는데, euc-kr의 확장한 것이 CP949라서 그냥 CP949를 넣으면 충분히 해결이 된다.

#라이브러리 import
import pandas as pd

# csv 가져오기
origin_data = pd.read_csv('D:\\OneDrive - HKNC\\브라우저_다운로드\\test.csv', encoding='CP949')

 

반응형
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기