반응형
츄르사려고 코딩하는 코집사입니다.
1. 주제
- 고병원성 조류인플루엔자 발생 데이터를 활용한 AI 발생 원인 분석
2. 분석개요
- 2020년 12월 13일 기준 조류 인플루엔자(AI) 확진 농장 지속적으로 발생
- 조류 인플루엔자(AI) 확산에 따른 사후 처리 사회적 비용 증가
- 재발방지 및 피해 최소화를 위한 시스템 구축 필요
3. 목적 및 필요성
- 고병원성 조류인플루엔자 발생 데이터를 활용하여 과거 발생 추이와 현황파악
- AI 발생에 영향을 미치는 요소 분석
4. 데이터 수집
- 총 7개의 데이터 수집
5. 데이터 전처리
- 범주형 데이터 : 발생여부, 도, 발생연도, 발생월, 축종
- 수치형 데이터 : 평균기온, 최저기온, 최고기온, 평균풍속, 평균상대습도, 일교차, 철새도래지거리
6. EDA
7. 데이터 분석
1) 로지스틱 회귀분석
- 종속변수 : 발생여부
- 독립변수 : 축종, 평균기온, 최저기온, 최고기온, 평균 풍속, 평균 상대습도, 철새 도래지거리
- 독립변수들 간의 stepwise 방법을 통해 변수 선택
2) 의사결정트리(Decision Tree)
- 분류 정확도 84%
- Decision Tree를 통해 결론 도출
8. 예측 모델
- 총 5개(Random Forest, SVM, KNN, Adaboost, Decision Tree) 모델 분류 결과 앙상블 기법 중 하나인 Random Forest 모델의 정확도가 89%
9. 기대효과
10. 소스코드
1) 데이터 전처리
2) 데이터 EDA
3) 데이터 샘플링
4) 데이터 분석 모델링
반응형
'빅데이터 분석 > AI 조류인플루엔자 예측' 카테고리의 다른 글
빅데이터 분석 AI 조류 인플루엔자 데이터 분석 모델링 최종 (0) | 2020.12.17 |
---|---|
빅데이터 분석 AI 조류 인플루엔자 데이터 분석 모델링 - (5) AdaBoost (0) | 2020.12.17 |
빅데이터 분석 AI 조류 인플루엔자 데이터 분석 모델링 - (4) KNN (0) | 2020.12.17 |
빅데이터 분석 AI 조류 인플루엔자 데이터 분석 모델링 - (3) SVM (0) | 2020.12.17 |
빅데이터 분석 AI 조류 인플루엔자 데이터 분석 모델링 - (2) Random Forest (0) | 2020.12.17 |
빅데이터 분석 AI 조류 인플루엔자 데이터 분석 모델링 - (1) Decision Tree (0) | 2020.12.16 |
빅데이터 분석 AI 조류 인플루엔자 데이터 EDA - (3) (0) | 2020.12.16 |
빅데이터 분석 AI 조류 인플루엔자 데이터 샘플링 - (2) (2) | 2020.12.14 |
최근댓글