1. 통계학을 공부하는 이유
통계학을 적용한 자료는 신뢰성을 가진다.
통계는 의사결정에 필요한 근거 자료를 제시한다: 수치화 시켜 의사결정에 도움을 주어야한다.
통계는 현상을 분석하여 실증자료를 제시한다: 스마트폰을 소비하는 비용은 무엇인가?
Statistics
수량적인 비교를 기초로 많은 사실을 관찰하고 처리하는 방법 (수치화)
- 기술통계(Descriptive statistics) : 표본에 대한 분석결과를 각종 수치들을 활용하여 집단의 특성을 설명
- 추론통계(inference statistics): 표본을 활용하여 모집단의 특성을 나타내는 것
통계학의 목적
1) 의사결정
2) 불확실성(위험요소)의 해소
3) 요약
4) 연관성 파악
5) 예측(과거의 데이터로 미래를 확인)
2. 통계분석과 그 한계
수집 -> 정제 -> 추정 -> 검정
1) (자료의) 수집: 조사과정에서 자연스럽게 수집, 또는 조사자가 특정 목적에 맞는 자료를 얻기 위해 설계한 수집 도구를 이용
- 1차 자료: 설문지, 관찰 등
- 2차 자료: 조사자가 직접 자료를 접근하여 구하는 것이 아닌, 연구보고서, 정기간행물 등
연구 목적이 아닌, 실제로 얻어진 자료가 연구자가 연구를 하기 위한 자료로 나오는 것이 아니기 떄문에 연구자가 직접 선별해야 한다.
2) (자료의) 정제:
- 분석에 적합한 자료를 선별
- 적합하지 않은 자료는 삭제
3) 추정: 통계분석의 진행: 표본 -> 모수 추정
4) 검정: 통계조사의 목적 -> 주장이나 믿어지는 사실이 실제로 옳은지 아닌지를 확인
통계분석의 한계
- 확률: 틀릴가능성을 내포한다.
어떤 신뢰수준(보통 95%)을 사용할 것인가.
'Data > 데이터 분석·통계' 카테고리의 다른 글
[제대로 시작하는 기초통계학] Chapter3. 데이터와 통계량 (0) | 2018.07.30 |
---|---|
[제대로 시작하는 기초통계학] Chapter2. 모집단과 표본 (0) | 2018.07.28 |
[데이터 분석] python을 활용한 데이터 분석 (2) - ipyhon (0) | 2018.07.08 |
[데이터 분석] python을 활용한 데이터 분석(1) - 패키지 설치 (0) | 2018.07.08 |
[데이터 분석] python을 활용한 데이터 분석 (1) - 패키지 소개 (0) | 2018.07.08 |
댓글