본문 바로가기
  • 紹睿: 자유롭고 더불어 사는 가치있는 삶
[제대로 시작하는 기초통계학] Chapter3. 데이터와 통계량 1. 데이터의 수집변수: 어떠한 대응관계(함수관계)로 변화하는 수변수의 특성을 파악하는 것이 중요하다.데이터: 조사목적에 맞는 변수를 기반으로 표본으로 부터 수집된 자료 척도- 범주형 척도: 명목척도: 이름(수치화는 상관이없음) ex) 남/여서열척도(순서척도): ex) 1등 2등 3등, (관계 간격은 일정하지 않을 수 있다)- 연속형 척도: 구간안에서 연결되어있는 자료 등간척도: 간격이 동일 비율척도: 2. 데이터의 표현방법표: 도수분포표(Frequency distribution table)그래프: 그림으로 직관적으로 볼수 있게 끔 3. 기초통계량"그래 이맛이야!"한수저만 떠먹고 "그래 이맛이야!" 했을때, 맛본 부분만 맛 있을까? 아니면 전체가 맛 있을까? 중심경향도(measure of central .. 2018. 7. 30.
[제대로 시작하는 기초통계학] Chapter2. 모집단과 표본 1. 모집단과 표본모집단(Population): 관심대상의 전체 집합모수(parameter): 모집단을 분석하여 걷어지는 결과 수치- 모평균, 모분산, 모표준편차, 모비율 표본(Sample): 과학절차를 적용하여 모집단을 대표할 수 있는 일부를 추출하여 직접적인 조사 대상이 된 모집단의 일부(모집단을 설명하는 기준)통계량(statistic): 표본을 분석하여 얻어지는 결과 수치- 표본평균, 표본분산, 표본표준편차, 표본비율 표본추출확률적 표본추출 방법(Probability Sampling method): 표본이 될 확률이 동일한것- 단순 무작위 표본추출: random- 체계적 표본추출- 비례 층화 표본추출- 다단계 층화 표본추출- 군집 표본추출비확률적 표본추출 방법(non-probability Sampl.. 2018. 7. 28.
[제대로 시작하는 기초통계학] Chapter1. 통계학의 이해 1. 통계학을 공부하는 이유통계학을 적용한 자료는 신뢰성을 가진다.통계는 의사결정에 필요한 근거 자료를 제시한다: 수치화 시켜 의사결정에 도움을 주어야한다.통계는 현상을 분석하여 실증자료를 제시한다: 스마트폰을 소비하는 비용은 무엇인가? Statistics 수량적인 비교를 기초로 많은 사실을 관찰하고 처리하는 방법 (수치화)- 기술통계(Descriptive statistics) : 표본에 대한 분석결과를 각종 수치들을 활용하여 집단의 특성을 설명- 추론통계(inference statistics): 표본을 활용하여 모집단의 특성을 나타내는 것 통계학의 목적1) 의사결정2) 불확실성(위험요소)의 해소3) 요약4) 연관성 파악5) 예측(과거의 데이터로 미래를 확인) 2. 통계분석과 그 한계수집 -> 정제 ->.. 2018. 7. 28.
[last day on earth] 모바일 게임 해야할일 정리 1. 오토바이 마무리: enchantress기지 - 잡다한건 다훔쳐감 ㅎ볼트 9개엔진부품 20개오토바이바퀴 2개조철 17개가방 4개 2. 탱크: player 기지 - 잡다한건 다훔쳐감 ㅋ엔진부품 200-75전선 120-42ATV바퀴 16-3볼트 320-45볼베어링 100-34원단 250-132 2018. 7. 25.
[주식 - NC SOFT] 주식 데이터 예측하기 NC SOFT 주식 데이터를 이용하여 2년간 주식을 예측해보았다 주식데이터 분석하기¶ 시: 시작가 고: 고가 저: 최저가 종: 종가(해당시점) / 수정종가 In [2]: from pandas_datareader import data import datetime 야후 fianace이용 :https://finance.yahoo.com/¶ In [1]: import fix_yahoo_finance as yf yf.pdr_override() In [4]: start_date = '2008-01-01' name = '036570.KS' nc = data.get_data_yahoo(name, start_date) [*********************100%***********************] 1 of.. 2018. 7. 18.
[시계열 데이터 분석] numpy를 이용한 시계열 데이터 분석 numpy를 이용한 시계열 데이터 분석¶ In [5]: import warnings warnings.filterwarnings('ignore') import pandas as pd import numpy as np import matplotlib.pyplot as plt %matplotlib inline from pandas_datareader import data from fbprophet import Prophet from datetime import datetime 폰트 설정¶ In [6]: from matplotlib import font_manager, rc rc('font', family='AppleGothic') plt.rcParams['axes.unicode_minus'] = False.. 2018. 7. 18.
[Seoul Store] 내맘대로 하는 서울상가 데이터 탐색기 (2) [Seoul Store] 내맘대로 하는 서울상가 데이터 탐색기 (1): (http://can-do.tistory.com/108?category=778902) Store data in Seoul 2 - 시각화¶서울에 있는 상가 데이터 시각화 해보자 1. folium으로 한번 지도에 그려보자¶ 데이터: store data in seoul 1에 사용했던 데이터를 그대로 사용 할 것이다! In [48]: geo_str = json.load(open('./books/data/02. skorea_municipalities_geo_simple.json', encoding='utf-8')) map = folium.Map(location=[37.5502, 126.982], zoom_start=11) map.choro.. 2018. 7. 16.
[19대 선거] 후보 간의 득표 수 시각화 하기 19대 선거결과 시각화¶ In [1]: import pandas as pd import numpy as np import matplotlib.pyplot as plt %matplotlib inline In [22]: election_result = pd.read_csv('./data/05. election_result.csv', index_col=0) election_result.head(3) Out[22]: 광역시도 시군 pop moon ahn hong 0 서울특별시 종로구 102566.0 42512.0 22313.0 22325.0 1 서울특별시 중구 82852.0 34062.0 19372.0 17901.0 2 서울특별시 용산구 148157.0 58081.0 32109.0 35230.0 1. 광역시도.. 2018. 7. 16.
[19대 선거] Selenium을 이용한 19대 선거 데이터 크롤링 Selenium을 이용한 선거구 데이터 크롤링¶ (사실 그냥 다운로드하면 편하다) In [1]: import pandas as pd import numpy as np import platform import matplotlib.pyplot as plt %matplotlib inline 폰트 설정¶ In [2]: from matplotlib import font_manager, rc rc('font', family='AppleGothic') plt.rcParams['axes.unicode_minus'] = False 방법¶ 홈페이지에 접근(http://info.nec.go.kr/) 역대선거 클릭 투개표 클릭 개표현황 클릭 대통령 선거 클릭 정보 가져오기 In [3]: from selenium impo.. 2018. 7. 16.