안녕하세요, 츄르 사려고 코딩하는 집사 코집사입니다.
이번 글은 BEPS 데이터를 가지고 R을 이용한 간단한 분석입니다.
1. BEPS를 구성하는 변수에 대한 설명
- BEPS는 1997년부터 2001년까지 영국 선거 관리 위원회로부터 나온 데이터
1) vote
- Party choice(당 선택) : Conservative, Labour, or Liberal Democrat
- Conservative(보수당)
- Labour(노동당)
- Liberal Democrat(자유민주당)
2) age
- 나이
3) economic.cond.national(국가 경제 상황)
- 현재 국가 경제 상황 평가(1부터 5로 평가)
4) economic.cond.household(가정 경제 상황)
- 현재 가정 경제 상황 평가(1부터 5로 평가)
5) Blair
- 노동 지도자의 평가(1부터 5로 평가)
6) Hague
- 보수당 지도자의 평가(1부터 5로 평가)
7) Kennedy
- 자유민주당 지도자의 평가(1부터 5로 평가)
8) Europe
- 유럽 통합에 대한 응답자의 태도를 측정하는 11점 척도
- 높은 점수는 Eurosceptic정서를 나타냄
9) political.knowledge
- 유럽 통합에 관한 당사자들의 입장에 대한 지식(0부터 3으로 평가)
10) gender
- 성별
2. 각 변수의 기술통계량을 구하고 이에 대해 간단히 설명하시오.
1) vote
- 각 투표한 통계량은 Conservative(462표), Labour(720표), Liberal Democrat(343 표)이다.
2) age
- 최소 나이는 24세, 최대 나이는 93세, 평균나이는 54세, 하위 25% 나이 41세, 상위 25% 나이 67세이다.
3) economic.cond.national, economic.cond.household
- 1부터 5까지의 점수표로 최솟값은 1, 최댓값은 5, 중간값은 3이다.
- 각 평균은 3.246, 3.14이다.
4) Blair, Hague, Kennedy
- 각 당에 대한 대표자들의 평가 통계이며 최솟값은 1, 최댓값은 5, 중간값은 3이다.
- 각 평균은 4.000, 2.747, 3.135이다.
5) Europe
- 유럽 통합에 관한 11점 지표로 최솟값은 1, 최댓값은 11, 중간값은 6이다.
- 평균은 6.729이다.
6) Political.knowledge
- 유럽 통합에 관한 당사자들의 입장에 대한 점수로 최솟값은 0, 최댓값은 3, 중간값 은 2이다.
- 평균은 1.542이다.
7) gender
- 남성은 713명, 여성은 812명이다.
3. 수정된 두 변수의 평균에 대한 파생변수를 만들고, econ.condition변수의 히스토그램
4. econ.condition변수의 전체 평균을 구하고, 평균을 초과하면 ‘rich', 그 외에는 'poor'을 부여하는 파생변수를 만들고 이에 해당하는 사람이 얼마인지를 빈도표와 막대그래프를 이용하여 확인하시오.
1) 빈도표 및 평균
2) 막대그래프
5. 7~9까지의 내용데이터 일부를 출력해서 변수명이 바뀌었는지 확인하고 데이터 앞부분
6. 40대 미만, 40대 이상 60대 미만, 60대 이상의 연령대별로 가계경제상태 평균 및 비교
7. 정당별로 가계경제상태 평균을 이용하여 비교 후 결과
8. gender와 political.knowledge를 추출하여 새로운 데이터를 만든 후, 성별에 따른 정치적 지식을 평균을 이용하여 비교 후 결과
9. dplyr패키지를 이용하여 정당별 후보자에 대한 합계점수와 평균을 구해 파생변수를 만든 후 평균점수가 높은 순으로 정렬
10. 정당별로 나이에 대한 기술통계량 결과
'빅데이터 분석 > 빅데이터 분석 학습' 카테고리의 다른 글
빅데이터의 이해 및 활용(빅데이터의 저장) (0) | 2019.06.09 |
---|---|
빅데이터 이해 및 활용 정리 / 가설과 추론 전까지 (0) | 2019.06.06 |
빅데이터 분석 - 추천 시스템 (0) | 2019.05.20 |
20190520 빅데이터의 이해 및 활용 - 군집분석 (0) | 2019.05.20 |
20190513 빅데이터 이해 및 활용 - (2) (0) | 2019.05.13 |
20190513 빅데이터 이해 및 활용 (0) | 2019.05.13 |
20190408 빅데이터 분석 이해 - 통계 기초 (0) | 2019.04.08 |
빅데이터 이해 및 활용 20190401 (0) | 2019.04.01 |
최근댓글