츄르사려고 코딩하는 코집사입니다.
1. 최종 데이터 구조로 가공
1) 데이터마이닝 분류
- 분류값과 입력변수들을 연관시켜 인구통계, 요약변수, 파생변수 등을 산출
2) 정형화된 패턴 처리
- 비정형 데이터나 소셜 데이터는 정형화한 패턴으로 처리
- 비정형 데이터 : DBMS에 저장됐다가 텍스트 마이닝을 거쳐 데이터 마트와 통합
- 관계형 데이터 : DBMS에 저장되어 사회 신경망 분석을 거쳐 분석결과 통계값이 마트와 통합되어 활용
2. 시각화
- 복잡한 분석보다도 더 효율적
3. 탐색적 자료 분석(EDA)
- 특이한 점이나 의미 있는 사실을 도출하고 분석의 최종 목적을 달성해가는 과정
- 데이터의 특징과 내재하는 구조적 관계를 알아내기 위한 기법들의 통칭
4. EDA의 4가지 주제
- 저항성의 강조
- 잔차 계산
- 자료변수의 재표현
- 그래프를 통한 현시성
5. 통계
- 어떤 현상을 종합적으로 한눈에 알아보기 쉽게 일정한 체계에 따라 숫자와 표, 그림의 형태로 나타내는 것
6. 기술통계
- 모집단으로부터 표본을 추출하고 표본이 가지고 있는 정보를 쉽게 파악할 수 있도록 데이터를 정리하거나 요약하기 위해 하나의 숫자 또는 그래프의 형태로 표현하는 절차
7. 추측통계(추론통계)
- 모집단으로부터 추출된 표본의 표본통계량으로부터 모집단의 특성인 모수에 관해 통계적으로 추론
8. 데이터마이닝
- 대용량의 자료로부터 관계, 패턴, 규칙 등을 탐색하고 유용한 지식을 추출
- 데이터베이스에서의 지식 탐색
- 기계학습 : 인공신경망, 의사결정나무, 클러스터링, 베이지안 분류, SVM 등
- 패턴인식 : 장바구니분석, 연관규칙 등
'자격증 > ADP' 카테고리의 다른 글
[ADP] 필기 오답 (0) | 2021.05.14 |
---|---|
[ADP] 필기 2과목 데이터 처리 기술의 이해 요약 - 3 (0) | 2021.05.14 |
[ADP] 필기 2과목 데이터 처리 기술의 이해 요약 - 2 (0) | 2021.05.13 |
[ADP] 필기 2과목 데이터 처리 기술의 이해 요약 - 1 (0) | 2021.05.13 |
[ADP] 필기 1과목 데이터의 이해 요약 - 2 (0) | 2021.05.13 |
[ADP] 필기 1과목 데이터의 이해 요약 - 1 (0) | 2021.05.10 |
최근댓글