빅데이터 분석/빅데이터 분석 학습
20190513 빅데이터 이해 및 활용 - (2)
분류분석이란? 주어진 입력변수에 근거하여 범주형 반응변수(0,1,2,3,4 등)를 예측하는 작업이다. 예 : - 신용카드 사용자의 다양한 변수를 사용하여 사용자가 디폴트(default)할 확률을 계산한다. - 투자할 회사의 다양한 속성변수를 사용하여 투자가 성공할 확률을 계산한다. - 웹 방문자 정보, 사이트 정보, 방문시간 등을 사용하여 특정 광고를 클릭할 확률을 계산한다. kNN I kNN (k-Nearest Neighbors) : k개의 근접자료를 이용하여 예측하는 기법 - 알고리즘 적용 1) k를 정한다. 2) k개의 가장 가까운 포인트 값들 중, 다수결로 새로운 데이터 포인트의 예측값을 정한다. 3) 단, 동점이 발생했을 경우, 단독 1등이 생길 때까지 k를 하나씩 줄인다. 동점을 처리하는 방법..
2019. 5. 13.
최근댓글