반응형
츄르사려고 코딩하는 코집사입니다.
1. 데이터에 철새도래지 추가하여 EDA 실시
In [2]:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import matplotlib.font_manager as fm
from matplotlib import font_manager, rc
In [3]:
#plot 한글 깨짐
plt.rc('font', family='Malgun Gothic')
#막대그래프 한글 깨짐
font_name = font_manager.FontProperties(fname="c:/Windows/Fonts/malgun.ttf").get_name()
rc('font', family=font_name)
In [4]:
AI_최종데이터 = pd.read_csv('C:/Users/User/Desktop/바탕화면/AI data/AI_철새도래지_최종데이터.csv', encoding='euc-kr')
In [5]:
AI_최종데이터
Out[5]:
In [6]:
도_df = pd.DataFrame(AI_최종데이터['도'].value_counts())
도 = list(도_df.index)
도
Out[6]:
In [7]:
충청북도 = AI_최종데이터['도'] == '충청북도'
충청북도 = AI_최종데이터[충청북도]
plt.title('충청북도 AI 발생여부', size = 20)
sns.countplot(x = '발생여부', data = 충청북도)
Out[7]:
In [8]:
충청남도 = AI_최종데이터['도'] == '충청남도'
충청남도 = AI_최종데이터[충청남도]
plt.title('충청남도 AI 발생여부', size = 20)
sns.countplot(x = '발생여부', data = 충청남도)
Out[8]:
In [9]:
경상북도 = AI_최종데이터['도'] == '경상북도'
경상북도 = AI_최종데이터[경상북도]
plt.title('경상북도 AI 발생여부', size = 20)
sns.countplot(x = '발생여부', data = 경상북도)
Out[9]:
In [10]:
경상남도 = AI_최종데이터['도'] == '경상남도'
경상남도 = AI_최종데이터[경상남도]
plt.title('경상남도 AI 발생여부', size = 20)
sns.countplot(x = '발생여부', data = 경상남도)
Out[10]:
In [11]:
강원도 = AI_최종데이터['도'] == '강원도'
강원도 = AI_최종데이터[강원도]
plt.title('강원도 AI 발생여부', size = 20)
sns.countplot(x = '발생여부', data = 강원도)
Out[11]:
In [12]:
제주도 = AI_최종데이터['도'] == '제주도'
제주도 = AI_최종데이터[제주도]
plt.title('제주도 AI 발생여부', size = 20)
sns.countplot(x = '발생여부', data = 제주도)
Out[12]:
In [13]:
전라남도 = AI_최종데이터['도'] == '전라남도'
전라남도 = AI_최종데이터[전라남도]
plt.title('전라남도 AI 발생여부', size = 20)
sns.countplot(x = '발생여부', data = 전라남도)
Out[13]:
In [14]:
전라북도 = AI_최종데이터['도'] == '전라북도'
전라북도 = AI_최종데이터[전라북도]
plt.title('전라북도 AI 발생여부', size = 20)
sns.countplot(x = '발생여부', data = 전라북도)
Out[14]:
In [15]:
경기도 = AI_최종데이터['도'] == '경기도'
경기도 = AI_최종데이터[경기도]
plt.title('경기도 AI 발생여부', size = 20)
sns.countplot(x = '발생여부', data = 경기도)
Out[15]:
In [16]:
세종특별자치시 = AI_최종데이터['도'] == '세종특별자치시'
세종특별자치시 = AI_최종데이터[세종특별자치시]
plt.title('세종특별자치시 AI 발생여부', size = 20)
sns.countplot(x = '발생여부', data = 세종특별자치시)
Out[16]:
In [17]:
울산광역시 = AI_최종데이터['도'] == '울산광역시'
울산광역시 = AI_최종데이터[울산광역시]
plt.title('울산광역시 AI 발생여부', size = 20)
sns.countplot(x = '발생여부', data = 울산광역시)
Out[17]:
In [18]:
부산광역시 = AI_최종데이터['도'] == '부산광역시'
부산광역시 = AI_최종데이터[부산광역시]
plt.title('부산광역시 AI 발생여부', size = 20)
sns.countplot(x = '발생여부', data = 부산광역시)
Out[18]:
In [19]:
인천광역시 = AI_최종데이터['도'] == '인천광역시'
인천광역시 = AI_최종데이터[인천광역시]
plt.title('인천광역시 AI 발생여부', size = 20)
sns.countplot(x = '발생여부', data = 인천광역시)
Out[19]:
In [20]:
대구광역시 = AI_최종데이터['도'] == '대구광역시'
대구광역시 = AI_최종데이터[대구광역시]
plt.title('대구광역시 AI 발생여부', size = 20)
sns.countplot(x = '발생여부', data = 대구광역시)
Out[20]:
In [21]:
광주광역시 = AI_최종데이터['도'] == '광주광역시'
광주광역시 = AI_최종데이터[광주광역시]
plt.title('광주광역시 AI 발생여부', size = 20)
sns.countplot(x = '발생여부', data = 광주광역시)
Out[21]:
In [22]:
서울특별시 = AI_최종데이터['도'] == '서울특별시'
서울특별시 = AI_최종데이터[서울특별시]
plt.title('서울특별시 AI 발생여부', size = 20)
sns.countplot(x = '발생여부', data = 서울특별시)
Out[22]:
In [23]:
fig = plt.figure(figsize=(25,10))
sns.barplot(x = '도', y = '발생여부', data = AI_최종데이터)
plt.xticks(fontsize = 15)
plt.yticks(fontsize = 15)
plt.xlabel('도', fontsize=20)
plt.ylabel('발생비율', fontsize=20)
plt.title('각 도의 AI 발생 비율', size = 30)
plt.show()
In [25]:
#발생여부에 따른 철새도래지거리 boxplot
sns.boxplot(x = '발생여부', y = '철새도래지거리', data = AI_최종데이터)
Out[25]:
In [ ]:
반응형
'빅데이터 분석 > AI 조류인플루엔자 예측' 카테고리의 다른 글
빅데이터 분석 AI 조류 인플루엔자 데이터 분석 모델링 - (4) KNN (0) | 2020.12.17 |
---|---|
빅데이터 분석 AI 조류 인플루엔자 데이터 분석 모델링 - (3) SVM (0) | 2020.12.17 |
빅데이터 분석 AI 조류 인플루엔자 데이터 분석 모델링 - (2) Random Forest (0) | 2020.12.17 |
빅데이터 분석 AI 조류 인플루엔자 데이터 분석 모델링 - (1) Decision Tree (0) | 2020.12.16 |
빅데이터 분석 AI 조류 인플루엔자 데이터 샘플링 - (2) (2) | 2020.12.14 |
빅데이터 분석 AI 조류 인플루엔자 데이터 샘플링 - (1) (0) | 2020.12.09 |
빅데이터 분석 AI 조류 인플루엔자 데이터 EDA - (2) (0) | 2020.12.09 |
빅데이터 분석 AI 조류 인플루엔자 데이터 EDA - (1) (0) | 2020.12.02 |
최근댓글