빅데이터 분석/빅데이터 분석 학습
빅데이터 이해 및 활용 정리 / 가설과 추론 전까지
1. 데이터 과학 로드맵 - 문제 파악 -> 데이터 분석 및 이해 -> 특징값 추출 -> 모델 수립 및 분석 ->결과 정리 및 발표, 코드 배포 - 문제 파악 : 데이터 과학의 첫 단계 어떤 문제가 있는지 찾아내고 그걸 어떻게 통계적인 혹은 공학적인 문제로 바꿔서 풀 수 있을지 정의함. - 데이터 분석 및 이해(기초) : 주어진 데이터를 이해하는 단계 데이터셋 크기가 얼마나 되는지, 주어진 데이터 데이터셋의 전부인지 일부인지 확인 이 데이터가 모집단을 잘 대표하는지, 특이한 이상치나 잡음이 심하지 않은지 원본 데이터가 아니라 임의로 가공한 데이터가 포함되어 있지는 않은지 만일 값이 누락된 데이터 표본이 있다면 얼마나 그리고 왜 누락되었는지 확인 - 데이터 분석 및 이해(전처리) : 데이터 전처리는 원본 ..
2019. 6. 6.
최근댓글