반응형

@notepad_jj2

츄르사려고 코딩하는 코집사입니다.


1. 주제

- 고병원성 조류인플루엔자 발생 데이터를 활용한 AI 발생 원인 분석

 

2. 분석개요

- 2020년 12월 13일 기준 조류 인플루엔자(AI) 확진 농장 지속적으로 발생

- 조류 인플루엔자(AI) 확산에 따른 사후 처리 사회적 비용 증가

- 재발방지 및 피해 최소화를 위한 시스템 구축 필요

 

 

3. 목적 및 필요성

- 고병원성 조류인플루엔자 발생 데이터를 활용하여 과거 발생 추이와 현황파악

- AI 발생에 영향을 미치는 요소 분석

 

 

4. 데이터 수집

- 총 7개의 데이터 수집

 

 

5. 데이터 전처리

- 범주형 데이터 : 발생여부, 도, 발생연도, 발생월, 축종

- 수치형 데이터 : 평균기온, 최저기온, 최고기온, 평균풍속, 평균상대습도, 일교차, 철새도래지거리

 

 

6. EDA

 

7. 데이터 분석

1) 로지스틱 회귀분석

- 종속변수 : 발생여부

- 독립변수 : 축종, 평균기온, 최저기온, 최고기온, 평균 풍속, 평균 상대습도, 철새 도래지거리

- 독립변수들 간의 stepwise 방법을 통해 변수 선택

2) 의사결정트리(Decision Tree)

- 분류 정확도 84%

- Decision Tree를 통해 결론 도출

 

8. 예측 모델

- 총 5개(Random Forest, SVM, KNN, Adaboost, Decision Tree) 모델 분류 결과 앙상블 기법 중 하나인 Random Forest 모델의 정확도가 89%

 

9. 기대효과

 

10. 소스코드

1) 데이터 전처리

yongku.tistory.com/entry/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D-AI-%EC%A1%B0%EB%A5%98-%EC%9D%B8%ED%94%8C%EB%A3%A8%EC%97%94%EC%9E%90-%EB%8D%B0%EC%9D%B4%ED%84%B0-%EC%A0%84%EC%B2%98%EB%A6%AC1-%EA%B8%B0%EC%83%81%EB%8D%B0%EC%9D%B4%ED%84%B0

 

빅데이터 분석 AI 조류 인플루엔자 데이터 전처리(1) - 기상데이터

츄르사려고 코딩하는 코집사입니다. 1. 기상데이터 - 기존 연도별 데이터에서 필요한 컬럼 변수만 추출하여 새로운 데이터프레임 생성 In [1]: import pandas as pd In [2]: 기상데이터_2003 = pd.read_csv('C:.

yongku.tistory.com

yongku.tistory.com/entry/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D-AI-%EC%A1%B0%EB%A5%98-%EC%9D%B8%ED%94%8C%EB%A3%A8%EC%97%94%EC%9E%90-%EB%8D%B0%EC%9D%B4%ED%84%B0-%EC%A0%84%EC%B2%98%EB%A6%AC2

 

빅데이터 분석 AI 조류 인플루엔자 데이터 전처리(2)

츄르사려고 코딩하는 코집사입니다. In [1]: #라이브러리 불러오기 import pandas as pd import os In [2]: #기상데이터 read 기상데이터_2003 = pd.read_csv('C:/Users/User/Desktop/AI data/기상데이터/2003..

yongku.tistory.com

yongku.tistory.com/entry/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D-AI-%EC%A1%B0%EB%A5%98-%EC%9D%B8%ED%94%8C%EB%A3%A8%EC%97%94%EC%9E%90-%EB%8D%B0%EC%9D%B4%ED%84%B0-%EC%A0%84%EC%B2%98%EB%A6%AC3

 

빅데이터 분석 AI 조류 인플루엔자 데이터 전처리(3)

츄르사려고 코딩하는 코집사입니다. Untitled In [7]: import pandas as pd In [8]: AI데이터 = pd.read_csv('C:/Users/User/Desktop/AI data/AI최종데이터.csv', encoding="CP949") In [9]:..

yongku.tistory.com

2) 데이터 EDA

yongku.tistory.com/entry/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D-AI-%EC%A1%B0%EB%A5%98-%EC%9D%B8%ED%94%8C%EB%A3%A8%EC%97%94%EC%9E%90-%EB%8D%B0%EC%9D%B4%ED%84%B0-EDA-1

 

빅데이터 분석 AI 조류 인플루엔자 데이터 EDA - (1)

츄르사려고 코딩하는 코집사입니다. AI_최종데이터_EDA In [59]: import pandas as pd import seaborn as sns import matplotlib.pyplot as plt import matplotlib.font_manager as fm from mat..

yongku.tistory.com

 

yongku.tistory.com/entry/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D-AI-%EC%A1%B0%EB%A5%98-%EC%9D%B8%ED%94%8C%EB%A3%A8%EC%97%94%EC%9E%90-%EB%8D%B0%EC%9D%B4%ED%84%B0-EDA-2

 

빅데이터 분석 AI 조류 인플루엔자 데이터 EDA - (2)

츄르사려고 코딩하는 코집사입니다. In [94]: import pandas as pd import seaborn as sns import matplotlib.pyplot as plt import matplotlib.font_manager as fm from matplotlib import font_manager, rc In..

yongku.tistory.com

yongku.tistory.com/entry/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D-AI-%EC%A1%B0%EB%A5%98-%EC%9D%B8%ED%94%8C%EB%A3%A8%EC%97%94%EC%9E%90-%EB%8D%B0%EC%9D%B4%ED%84%B0-EDA-3

 

빅데이터 분석 AI 조류 인플루엔자 데이터 EDA - (3)

츄르사려고 코딩하는 코집사입니다. 1. 데이터에 철새도래지 추가하여 EDA 실시 Untitled100 In [2]: import pandas as pd import seaborn as sns import matplotlib.pyplot as plt import matp..

yongku.tistory.com

3) 데이터 샘플링

yongku.tistory.com/entry/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D-AI-%EC%A1%B0%EB%A5%98-%EC%9D%B8%ED%94%8C%EB%A3%A8%EC%97%94%EC%9E%90-%EB%8D%B0%EC%9D%B4%ED%84%B0-%EC%83%98%ED%94%8C%EB%A7%81-1

 

빅데이터 분석 AI 조류 인플루엔자 데이터 샘플링 - (1)

츄르사려고 코딩하는 코집사입니다. In [50]: #라이브러리 불러오기 import pandas as pd import os In [51]: #기상 및 AI 최종데이터 Read 기상_최종데이터 = pd.read_csv('C:/Users/User/Desktop/AI data/기..

yongku.tistory.com

yongku.tistory.com/entry/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D-AI-%EC%A1%B0%EB%A5%98-%EC%9D%B8%ED%94%8C%EB%A3%A8%EC%97%94%EC%9E%90-%EB%8D%B0%EC%9D%B4%ED%84%B0-%EC%83%98%ED%94%8C%EB%A7%81-2

 

빅데이터 분석 AI 조류 인플루엔자 데이터 샘플링 - (2)

츄르사려고 코딩하는 코집사입니다. 샘플링_최종데이터 In [50]: #라이브러리 불러오기 import pandas as pd import os In [51]: #기상 및 AI 최종데이터 Read 기상_최종데이터 = pd.read_csv(..

yongku.tistory.com

4) 데이터 분석 모델링

yongku.tistory.com/entry/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D-AI-%EC%A1%B0%EB%A5%98-%EC%9D%B8%ED%94%8C%EB%A3%A8%EC%97%94%EC%9E%90-%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D-%EB%AA%A8%EB%8D%B8%EB%A7%81-1-Decision-Tree

 

빅데이터 분석 AI 조류 인플루엔자 데이터 분석 모델링 - (1) Decision Tree

츄르사려고 코딩하는 코집사입니다. Decision Tree In [1]: #라이브러리 불러오기 import pandas as pd import os import numpy as np #랜덤포레스트 라이브러리 from sklearn.tree import Deci..

yongku.tistory.com

yongku.tistory.com/entry/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D-AI-%EC%A1%B0%EB%A5%98-%EC%9D%B8%ED%94%8C%EB%A3%A8%EC%97%94%EC%9E%90-%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D-%EB%AA%A8%EB%8D%B8%EB%A7%81-2-Random-Forest

 

빅데이터 분석 AI 조류 인플루엔자 데이터 분석 모델링 - (2) Random Forest

츄르사려고 코딩하는 코집사입니다. Untitled103 In [25]: #라이브러리 불러오기 import pandas as pd import os import numpy as np #랜덤포레스트 라이브러리 from sklearn.tree import Decis..

yongku.tistory.com

yongku.tistory.com/entry/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D-AI-%EC%A1%B0%EB%A5%98-%EC%9D%B8%ED%94%8C%EB%A3%A8%EC%97%94%EC%9E%90-%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D-%EB%AA%A8%EB%8D%B8%EB%A7%81-3-SVM

 

빅데이터 분석 AI 조류 인플루엔자 데이터 분석 모델링 - (3) SVM

츄르사려고 코딩하는 코집사입니다. In [20]: import pandas as pd from sklearn.model_selection import train_test_split import matplotlib.pyplot as plt In [25]: from matplotlib import font_manager, r..

yongku.tistory.com

yongku.tistory.com/entry/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D-AI-%EC%A1%B0%EB%A5%98-%EC%9D%B8%ED%94%8C%EB%A3%A8%EC%97%94%EC%9E%90-%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D-%EB%AA%A8%EB%8D%B8%EB%A7%81-4-KNN

 

빅데이터 분석 AI 조류 인플루엔자 데이터 분석 모델링 - (4) KNN

츄르사려고 코딩하는 코집사입니다. In [3]: import pandas as pd from sklearn.model_selection import train_test_split import matplotlib.pyplot as plt In [4]: from matplotlib import font_manager, rc..

yongku.tistory.com

yongku.tistory.com/entry/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D-AI-%EC%A1%B0%EB%A5%98-%EC%9D%B8%ED%94%8C%EB%A3%A8%EC%97%94%EC%9E%90-%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D-%EB%AA%A8%EB%8D%B8%EB%A7%81-5-AdaBoost

 

빅데이터 분석 AI 조류 인플루엔자 데이터 분석 모델링 - (5) AdaBoost

츄르사려고 코딩하는 코집사입니다. In [3]: import pandas as pd from sklearn.model_selection import train_test_split import matplotlib.pyplot as plt In [4]: from matplotlib import font_manager, rc..

yongku.tistory.com

yongku.tistory.com/entry/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D-AI-%EC%A1%B0%EB%A5%98-%EC%9D%B8%ED%94%8C%EB%A3%A8%EC%97%94%EC%9E%90-%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D-%EB%AA%A8%EB%8D%B8%EB%A7%81-%EC%B5%9C%EC%A2%85

 

빅데이터 분석 AI 조류 인플루엔자 데이터 분석 모델링 최종

츄르사려고 코딩하는 코집사입니다. 분석 In [55]: #라이브러리 불러오기 import pandas as pd import os import numpy as np #폰트 깨짐 방지 라이브러리 from matplotlib import font_manager..

yongku.tistory.com

 

반응형
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기