반응형
츄르사려고 코딩하는 코집사입니다.
In [50]:
#라이브러리 불러오기
import pandas as pd
import os
In [51]:
#기상 및 AI 최종데이터 Read
기상_최종데이터 = pd.read_csv('C:/Users/User/Desktop/AI data/기상데이터/기상_최종데이터.csv', encoding='CP949')
AI_최종데이터 = pd.read_csv('C:/Users/User/Desktop/AI data/AI_최종데이터.csv', encoding="CP949")
In [52]:
AI_최종데이터
Out[52]:
In [54]:
#NA 제거
기상_최종데이터 = 기상_최종데이터.dropna()
In [55]:
# 지점명에 따라 데이터프레임 추출
전라남도 = 기상_최종데이터['지점명'] == '순천'
전라남도 = 기상_최종데이터[전라남도]
전라북도 = 기상_최종데이터['지점명'] == '전주'
전라북도 = 기상_최종데이터[전라북도]
충청남도 = 기상_최종데이터['지점명'] == '천안'
충청남도 = 기상_최종데이터[충청남도]
충청북도 = 기상_최종데이터['지점명'] == '제천'
충청북도 = 기상_최종데이터[충청북도]
강원도 = 기상_최종데이터['지점명'] == '태백'
강원도 = 기상_최종데이터[강원도]
경기도 = 기상_최종데이터['지점명'] == '이천'
경기도 = 기상_최종데이터[경기도]
In [56]:
N = int(input())
전라남도_샘플링 = 전라남도.sample(n= int(N * 0.23))
전라북도_샘플링 = 전라북도.sample(n= int(N * 0.25))
충청남도_샘플링 = 충청남도.sample(n= int(N * 0.17))
충청북도_샘플링 = 충청북도.sample(n= int(N * 0.11))
강원도_샘플링 = 강원도.sample(n= int(N * 0.05))
경기도_샘플링 = 경기도.sample(n= int(N * 0.19))
In [57]:
# 샘플링 데이터 프레임 합치기
샘플링_최종데이터 = pd.concat([전라남도_샘플링, 전라북도_샘플링, 충청남도_샘플링, 충청북도_샘플링, 강원도_샘플링, 경기도_샘플링])
In [58]:
# 샘플링 데이터 대체
샘플링_최종데이터 = 샘플링_최종데이터.replace(['순천', '전주', '천안', '제천', '태백', '이천'], ['전라남도', '전라북도', '충청남도', '충청북도', '강원도', '경기도'])
In [ ]:
반응형
'빅데이터 분석 > AI 조류인플루엔자 예측' 카테고리의 다른 글
빅데이터 분석 AI 조류 인플루엔자 데이터 분석 모델링 - (2) Random Forest (0) | 2020.12.17 |
---|---|
빅데이터 분석 AI 조류 인플루엔자 데이터 분석 모델링 - (1) Decision Tree (0) | 2020.12.16 |
빅데이터 분석 AI 조류 인플루엔자 데이터 EDA - (3) (0) | 2020.12.16 |
빅데이터 분석 AI 조류 인플루엔자 데이터 샘플링 - (2) (2) | 2020.12.14 |
빅데이터 분석 AI 조류 인플루엔자 데이터 EDA - (2) (0) | 2020.12.09 |
빅데이터 분석 AI 조류 인플루엔자 데이터 EDA - (1) (0) | 2020.12.02 |
빅데이터 분석 AI 조류 인플루엔자 데이터 전처리(3) (0) | 2020.11.25 |
빅데이터 분석 AI 조류 인플루엔자 데이터 전처리(2) (0) | 2020.11.25 |
최근댓글