빅데이터 분석/빅데이터 분석 학습
엔트로피(Entropy) 머신러닝 통계 - 의사결정나무(Decision Tree)
츄르사려고 코딩하는 코집사입니다. 1. 엔트로피(Entropy) 머신러닝(Machine Learning)에서 자주 들어보는 단어 중 하나이다. 엔트로피는 불순도를 수치화한 지표 중 하나이며, 확률 변수의 불확실성을 수치로 나타낸 것이다. 또한, 정보량의 기댓값이라고 할 수 있다. 이 불순도를 수치화한 지표는 엔트로피, 지니계수 등이 있다. 우리가 의사결정나무(Decision Tree)를 시각화하면 의사결정나무의 노드에 entropy라는 것을 볼 수 있는데, 이 entropy의 값에 따라 의사결정나무(Decision Tree)의 분류가 일어나는 것을 확인할 수 있다. 아래의 사진을 보면 각 노드에 entropy가 존재하는 것을 볼 수 있다. 이 엔트로피(Entropy) 수치의 의미는 아래와 같다. 1) 엔..
2020. 12. 17.
최근댓글