츄르사려고 코딩하는 코집사입니다.
1. 주제
- 고병원성 조류인플루엔자 발생 데이터를 활용한 AI 발생 원인 분석
2. 분석개요
- 2020년 12월 13일 기준 조류 인플루엔자(AI) 확진 농장 지속적으로 발생
- 조류 인플루엔자(AI) 확산에 따른 사후 처리 사회적 비용 증가
- 재발방지 및 피해 최소화를 위한 시스템 구축 필요
3. 목적 및 필요성
- 고병원성 조류인플루엔자 발생 데이터를 활용하여 과거 발생 추이와 현황파악
- AI 발생에 영향을 미치는 요소 분석
4. 데이터 수집
- 총 7개의 데이터 수집
5. 데이터 전처리
- 범주형 데이터 : 발생여부, 도, 발생연도, 발생월, 축종
- 수치형 데이터 : 평균기온, 최저기온, 최고기온, 평균풍속, 평균상대습도, 일교차, 철새도래지거리
6. EDA
7. 데이터 분석
1) 로지스틱 회귀분석
- 종속변수 : 발생여부
- 독립변수 : 축종, 평균기온, 최저기온, 최고기온, 평균 풍속, 평균 상대습도, 철새 도래지거리
- 독립변수들 간의 stepwise 방법을 통해 변수 선택
2) 의사결정트리(Decision Tree)
- 분류 정확도 84%
- Decision Tree를 통해 결론 도출
8. 예측 모델
- 총 5개(Random Forest, SVM, KNN, Adaboost, Decision Tree) 모델 분류 결과 앙상블 기법 중 하나인 Random Forest 모델의 정확도가 89%
9. 기대효과
10. 소스코드
1) 데이터 전처리
빅데이터 분석 AI 조류 인플루엔자 데이터 전처리(1) - 기상데이터
츄르사려고 코딩하는 코집사입니다. 1. 기상데이터 - 기존 연도별 데이터에서 필요한 컬럼 변수만 추출하여 새로운 데이터프레임 생성 In [1]: import pandas as pd In [2]: 기상데이터_2003 = pd.read_csv('C:.
yongku.tistory.com
빅데이터 분석 AI 조류 인플루엔자 데이터 전처리(2)
츄르사려고 코딩하는 코집사입니다. In [1]: #라이브러리 불러오기 import pandas as pd import os In [2]: #기상데이터 read 기상데이터_2003 = pd.read_csv('C:/Users/User/Desktop/AI data/기상데이터/2003..
yongku.tistory.com
빅데이터 분석 AI 조류 인플루엔자 데이터 전처리(3)
츄르사려고 코딩하는 코집사입니다. Untitled In [7]: import pandas as pd In [8]: AI데이터 = pd.read_csv('C:/Users/User/Desktop/AI data/AI최종데이터.csv', encoding="CP949") In [9]:..
yongku.tistory.com
2) 데이터 EDA
빅데이터 분석 AI 조류 인플루엔자 데이터 EDA - (1)
츄르사려고 코딩하는 코집사입니다. AI_최종데이터_EDA In [59]: import pandas as pd import seaborn as sns import matplotlib.pyplot as plt import matplotlib.font_manager as fm from mat..
yongku.tistory.com
빅데이터 분석 AI 조류 인플루엔자 데이터 EDA - (2)
츄르사려고 코딩하는 코집사입니다. In [94]: import pandas as pd import seaborn as sns import matplotlib.pyplot as plt import matplotlib.font_manager as fm from matplotlib import font_manager, rc In..
yongku.tistory.com
빅데이터 분석 AI 조류 인플루엔자 데이터 EDA - (3)
츄르사려고 코딩하는 코집사입니다. 1. 데이터에 철새도래지 추가하여 EDA 실시 Untitled100 In [2]: import pandas as pd import seaborn as sns import matplotlib.pyplot as plt import matp..
yongku.tistory.com
3) 데이터 샘플링
빅데이터 분석 AI 조류 인플루엔자 데이터 샘플링 - (1)
츄르사려고 코딩하는 코집사입니다. In [50]: #라이브러리 불러오기 import pandas as pd import os In [51]: #기상 및 AI 최종데이터 Read 기상_최종데이터 = pd.read_csv('C:/Users/User/Desktop/AI data/기..
yongku.tistory.com
빅데이터 분석 AI 조류 인플루엔자 데이터 샘플링 - (2)
츄르사려고 코딩하는 코집사입니다. 샘플링_최종데이터 In [50]: #라이브러리 불러오기 import pandas as pd import os In [51]: #기상 및 AI 최종데이터 Read 기상_최종데이터 = pd.read_csv(..
yongku.tistory.com
4) 데이터 분석 모델링
빅데이터 분석 AI 조류 인플루엔자 데이터 분석 모델링 - (1) Decision Tree
츄르사려고 코딩하는 코집사입니다. Decision Tree In [1]: #라이브러리 불러오기 import pandas as pd import os import numpy as np #랜덤포레스트 라이브러리 from sklearn.tree import Deci..
yongku.tistory.com
빅데이터 분석 AI 조류 인플루엔자 데이터 분석 모델링 - (2) Random Forest
츄르사려고 코딩하는 코집사입니다. Untitled103 In [25]: #라이브러리 불러오기 import pandas as pd import os import numpy as np #랜덤포레스트 라이브러리 from sklearn.tree import Decis..
yongku.tistory.com
빅데이터 분석 AI 조류 인플루엔자 데이터 분석 모델링 - (3) SVM
츄르사려고 코딩하는 코집사입니다. In [20]: import pandas as pd from sklearn.model_selection import train_test_split import matplotlib.pyplot as plt In [25]: from matplotlib import font_manager, r..
yongku.tistory.com
빅데이터 분석 AI 조류 인플루엔자 데이터 분석 모델링 - (4) KNN
츄르사려고 코딩하는 코집사입니다. In [3]: import pandas as pd from sklearn.model_selection import train_test_split import matplotlib.pyplot as plt In [4]: from matplotlib import font_manager, rc..
yongku.tistory.com
빅데이터 분석 AI 조류 인플루엔자 데이터 분석 모델링 - (5) AdaBoost
츄르사려고 코딩하는 코집사입니다. In [3]: import pandas as pd from sklearn.model_selection import train_test_split import matplotlib.pyplot as plt In [4]: from matplotlib import font_manager, rc..
yongku.tistory.com
빅데이터 분석 AI 조류 인플루엔자 데이터 분석 모델링 최종
츄르사려고 코딩하는 코집사입니다. 분석 In [55]: #라이브러리 불러오기 import pandas as pd import os import numpy as np #폰트 깨짐 방지 라이브러리 from matplotlib import font_manager..
yongku.tistory.com
'빅데이터 분석 > AI 조류인플루엔자 예측' 카테고리의 다른 글
빅데이터 분석 AI 조류 인플루엔자 데이터 분석 모델링 최종 (0) | 2020.12.17 |
---|---|
빅데이터 분석 AI 조류 인플루엔자 데이터 분석 모델링 - (5) AdaBoost (0) | 2020.12.17 |
빅데이터 분석 AI 조류 인플루엔자 데이터 분석 모델링 - (4) KNN (0) | 2020.12.17 |
빅데이터 분석 AI 조류 인플루엔자 데이터 분석 모델링 - (3) SVM (0) | 2020.12.17 |
빅데이터 분석 AI 조류 인플루엔자 데이터 분석 모델링 - (2) Random Forest (0) | 2020.12.17 |
빅데이터 분석 AI 조류 인플루엔자 데이터 분석 모델링 - (1) Decision Tree (0) | 2020.12.16 |
빅데이터 분석 AI 조류 인플루엔자 데이터 EDA - (3) (0) | 2020.12.16 |
빅데이터 분석 AI 조류 인플루엔자 데이터 샘플링 - (2) (2) | 2020.12.14 |
최근댓글