[데이터 분석] python을 활용한 데이터 분석 (1) - 패키지 소개
Python을 활용한 데이터 분석(1) - 패키지 소개 - 데이터분석용 주요 패키지1) numpy: 수치, 통계, 선형대수2) mayplotlib3) scipy4) pandas: array를 이용한 다차원의 data structure .. 1. Numpy수치 데이터 처리 기능을 확장arrayasarrayarangeones, ones_likezeros, zeros_like, empty, empty_likeeye, identity universal functions- 일종의 vectorized wrapper1) abs, fabs2) sqrt3) square4) exp : 자연 지수5) log, log10, log2, log1p6) sign7) ceil8) floor9) rint10) modf... 등등 2...
2018. 7. 8.
[(빅)데이터 교육] 데이터 분석의 기초 - 분포에 관한 추론
모평균에 관한 추론점추정모집단의 확률분포가 정확히 알려진 경우. 일반적인 경우, 표본평균을 이용해 모평균을 추정구간추정모집단의 특성에 따른 표본평균의 분포를 이용하여 신뢰구간 추정 신뢰구간 추정- 모평균의 100(1-)%의 신뢰구간1) 모집단이 분산이 알려진 정규분포를 따른 경우- 표본 분포이용 , 2) 모집단의 분산이 알려져있으나 정규분포를 따르지 않는경우- 중심극한정리를 이용(n이 충분히 클 때) , 3) 모집단이 분산이 알려져있지 않고 정규분포를 따를 경우-T분포 이용 , 예시모집단이 정규분포를 따르며, n=64로 표본을 추출 하였을 때, = 27.750, s = 5.083일때, 모집단의 99% 신뢰구간은? 분판이 알려져있지 않음 -> T 분포 이용 이므로, (27.750 - 1.688, 27.75..
2018. 6. 25.