반응형

CSV파일에서는 앞에 0215881588 이런 형식으로 전화번호가 표현이 되는데, 일반적으로 이 csv를 pandas를 이용하여 읽어오니 앞자리 0이 빠지고 215881588로 읽어온다. pandas에서는 이 앞자리 0을 숫자로 인식해서 0을 없애버린 다음, 다음의 숫자를 읽어온다. 그렇기에, 이 숫자를 string형으로 변환하여 불러오면 된다.

 

0까지 읽어오는 방법(모든 Column)

일반적으로 우리는 csv 파일을 pandas를 이용하여 아래와 같이 read_csv를 통해 읽어 온다.

origin_df_csv = pd.read_csv('C:/Users/TEST/Desktop/test.csv')

 

위의 경우, 그냥 읽어오면 앞에 숫자 0을 없애고 읽어온다.

여기서 한 가지 옵션을 주는데 바로 아래와 같이 데이터타입을 문자형(str)로 설정하여 읽어오면 된다.

origin_df_csv = pd.read_csv('C:/Users/TEST/Desktop/test.csv', dtype=str)

 

 

0까지 읽어오는 방법(특정 Column)

특정 컬럼의 데이터를 문자형으로 읽어오는 방법은 list에 담아서 딕셔너리로 만들어 dtype에 정의하면 된다.

columns = ['test01', 'test02']
dict_columns = {x: 'str' for x in columns}

origin_df_csv = pd.read_csv('C:/Users/TEST/Desktop/test.csv', dtype=dict_columns)

 

위와 같이, 딕셔너리를 dtype으로 설정하면 해당 특정 컬럼을 문자형으로 가져올 수 있다.

반응형
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기