반응형

 @notepad_jj2

츄르사려고 코딩하는 코집사입니다.


1. 최종 데이터 구조로 가공

1) 데이터마이닝 분류

- 분류값과 입력변수들을 연관시켜 인구통계, 요약변수, 파생변수 등을 산출

 

2) 정형화된 패턴 처리

- 비정형 데이터나 소셜 데이터는 정형화한 패턴으로 처리

- 비정형 데이터 : DBMS에 저장됐다가 텍스트 마이닝을 거쳐 데이터 마트와 통합

- 관계형 데이터 : DBMS에 저장되어 사회 신경망 분석을 거쳐 분석결과 통계값이 마트와 통합되어 활용

 

2. 시각화

- 복잡한 분석보다도 더 효율적

 

3. 탐색적 자료 분석(EDA)

- 특이한 점이나 의미 있는 사실을 도출하고 분석의 최종 목적을 달성해가는 과정

- 데이터의 특징과 내재하는 구조적 관계를 알아내기 위한 기법들의 통칭

 

4. EDA의 4가지 주제

- 저항성의 강조

- 잔차 계산

- 자료변수의 재표현

- 그래프를 통한 현시성

 

5. 통계

- 어떤 현상을 종합적으로 한눈에 알아보기 쉽게 일정한 체계에 따라 숫자와 표, 그림의 형태로 나타내는 것

 

6. 기술통계

- 모집단으로부터 표본을 추출하고 표본이 가지고 있는 정보를 쉽게 파악할 수 있도록 데이터를 정리하거나 요약하기 위해 하나의 숫자 또는 그래프의 형태로 표현하는 절차

 

7. 추측통계(추론통계)

- 모집단으로부터 추출된 표본의 표본통계량으로부터 모집단의 특성인 모수에 관해 통계적으로 추론

 

8. 데이터마이닝

- 대용량의 자료로부터 관계, 패턴, 규칙 등을 탐색하고 유용한 지식을 추출

- 데이터베이스에서의 지식 탐색

- 기계학습 : 인공신경망, 의사결정나무, 클러스터링, 베이지안 분류, SVM 등

- 패턴인식 : 장바구니분석, 연관규칙 등

반응형
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기