반응형
츄르사려고 코딩하는 코집사입니다.
In [50]:
#라이브러리 불러오기
import pandas as pd
import os
In [51]:
#기상 및 AI 최종데이터 Read
기상_최종데이터 = pd.read_csv('C:/Users/User/Desktop/바탕화면/AI data/기상데이터/기상_최종데이터.csv', encoding='CP949')
AI_최종데이터 = pd.read_csv('C:/Users/User/Desktop/바탕화면/AI data/AI_최종데이터.csv', encoding="CP949")
In [52]:
AI_최종데이터
Out[52]:
In [53]:
#NA 제거
기상_최종데이터 = 기상_최종데이터.dropna()
In [54]:
# 지점명에 따라 데이터프레임 추출
전라남도 = 기상_최종데이터['지점명'] == '순천'
전라남도 = 기상_최종데이터[전라남도]
전라북도 = 기상_최종데이터['지점명'] == '전주'
전라북도 = 기상_최종데이터[전라북도]
충청남도 = 기상_최종데이터['지점명'] == '천안'
충청남도 = 기상_최종데이터[충청남도]
충청북도 = 기상_최종데이터['지점명'] == '제천'
충청북도 = 기상_최종데이터[충청북도]
강원도 = 기상_최종데이터['지점명'] == '태백'
강원도 = 기상_최종데이터[강원도]
경기도 = 기상_최종데이터['지점명'] == '이천'
경기도 = 기상_최종데이터[경기도]
경상남도 = 기상_최종데이터['지점명'] == '부산'
경상남도 = 기상_최종데이터[경상남도]
경상북도 = 기상_최종데이터['지점명'] == '경주시'
경상북도 = 기상_최종데이터[경상북도]
제주도 = 기상_최종데이터['지점명'] == '제주'
제주도 = 기상_최종데이터[제주도]
In [55]:
N = int(input())
경기도_샘플링 = 경기도.sample(n= int(N * 0.086))
강원도_샘플링 = 강원도.sample(n= int(N * 0.133))
충청북도_샘플링 = 충청북도.sample(n= int(N * 0.090))
충청남도_샘플링 = 충청남도.sample(n= int(N * 0.108))
전라북도_샘플링 = 전라북도.sample(n= int(N * 0.097))
전라남도_샘플링 = 전라남도.sample(n= int(N * 0.090))
경상남도_샘플링 = 경상남도.sample(n= int(N * 0.131))
경상북도_샘플링 = 경상북도.sample(n= int(N * 0.132))
제주도_샘플링 = 제주도.sample(n= int(N * 0.132))
In [56]:
# 샘플링 데이터 프레임 합치기
샘플링_최종데이터 = pd.concat([전라남도_샘플링, 전라북도_샘플링, 충청남도_샘플링, 충청북도_샘플링, 강원도_샘플링, 경기도_샘플링, 제주도_샘플링, 경상남도_샘플링, 경상북도_샘플링])
In [57]:
# 샘플링 데이터 대체
샘플링_최종데이터 = 샘플링_최종데이터.replace(['순천', '전주', '천안', '제천', '태백', '이천','제주','경주시','부산'], ['전라남도', '전라북도', '충청남도', '충청북도', '강원도', '경기도','제주도','경상북도','경상남도'])
In [58]:
샘플링_최종데이터.to_csv('샘플링_최종데이터.csv', encoding='CP949')
In [ ]:
반응형
'빅데이터 분석 > AI 조류인플루엔자 예측' 카테고리의 다른 글
빅데이터 분석 AI 조류 인플루엔자 데이터 분석 모델링 - (3) SVM (0) | 2020.12.17 |
---|---|
빅데이터 분석 AI 조류 인플루엔자 데이터 분석 모델링 - (2) Random Forest (0) | 2020.12.17 |
빅데이터 분석 AI 조류 인플루엔자 데이터 분석 모델링 - (1) Decision Tree (0) | 2020.12.16 |
빅데이터 분석 AI 조류 인플루엔자 데이터 EDA - (3) (0) | 2020.12.16 |
빅데이터 분석 AI 조류 인플루엔자 데이터 샘플링 - (1) (0) | 2020.12.09 |
빅데이터 분석 AI 조류 인플루엔자 데이터 EDA - (2) (0) | 2020.12.09 |
빅데이터 분석 AI 조류 인플루엔자 데이터 EDA - (1) (0) | 2020.12.02 |
빅데이터 분석 AI 조류 인플루엔자 데이터 전처리(3) (0) | 2020.11.25 |
최근댓글