반응형
numpy를 이용한 시계열 데이터 분석¶
In [5]:
import warnings
warnings.filterwarnings('ignore')
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
from pandas_datareader import data
from fbprophet import Prophet
from datetime import datetime
폰트 설정¶
In [6]:
from matplotlib import font_manager, rc
rc('font', family='AppleGothic')
plt.rcParams['axes.unicode_minus'] = False
In [37]:
pinkwink_web = pd.read_csv('./data/07. PinkWink Web Traffic.csv', encoding='utf-8', thousands=',', names=['date', 'hit'], index_col=0)
pinkwink_web = pinkwink_web[pinkwink_web['hit'].notnull()]
pinkwink_web.head(3)
Out[37]:
In [38]:
pinkwink_web['hit'].plot(figsize=(12, 4), grid=True)
Out[38]:
In [13]:
time = np.arange(0, len(pinkwink_web))
traffic = pinkwink_web['hit'].values
fx = np.linspace(0, time[-1], 1000)
In [19]:
def error(f, x, y):
return np.sqrt(np.mean((f(x)-y)**2))
In [31]:
fp1 = np.polyfit(time, traffic, 1)
f1 = np.poly1d(fp1)
f2p = np.polyfit(time, traffic, 2)
f2 = np.poly1d(f2p)
f3p = np.polyfit(time, traffic, 3)
f3 = np.poly1d(f3p)
f5p = np.polyfit(time, traffic, 5)
f5 = np.poly1d(f5p)
f15p = np.polyfit(time, traffic, 15)
f15 = np.poly1d(f15p)
print(error(f1, time, traffic))
print(error(f2, time, traffic))
print(error(f3, time, traffic))
print(error(f5, time, traffic))
print(error(f15, time, traffic))
In [32]:
plt.figure(figsize=(10, 6))
plt.scatter(time, traffic, s=10)
plt.plot(fx, f1(fx), lw=4, label='f1')
plt.plot(fx, f2(fx), lw=4, label='f2')
plt.plot(fx, f3(fx), lw=4, label='f3')
plt.plot(fx, f5(fx), lw=4, label='f5')
plt.plot(fx, f15(fx), lw=4, label='f15')
plt.grid(True, linestyle='-', color='0.75')
plt.legend(loc=2) # f1, f2 ...위치
plt.show()
Prophet 모듈을 이용한 forecast 예측¶
In [39]:
df = pd.DataFrame({'ds': pinkwink_web.index, 'y': pinkwink_web['hit']})
df.reset_index(inplace=True)
df['ds'] = pd.to_datetime(df['ds'], format="%y. %m. %d.")
del df['date']
df.head(3)
Out[39]:
In [40]:
m = Prophet(yearly_seasonality=True)
m.fit(df)
Out[40]:
In [41]:
future = m.make_future_dataframe(periods=60)
future.tail(3)
Out[41]:
In [43]:
forecast = m.predict(future)
forecast[['ds', 'yhat', 'yhat_lower', 'yhat_upper']].tail(3)
Out[43]:
In [44]:
m.plot(forecast)
Out[44]:
In [46]:
m.plot_components(forecast)
Out[46]:
반응형
'Study > 파이썬으로 데이터 주무르기' 카테고리의 다른 글
[주식 - NC SOFT] 주식 데이터 예측하기 (0) | 2018.07.18 |
---|---|
[19대 선거] 후보 간의 득표 수 시각화 하기 (0) | 2018.07.16 |
[19대 선거] Selenium을 이용한 19대 선거 데이터 크롤링 (2) | 2018.07.16 |
[Folium으로 지도 그리기] folium으로 지도그리기 feat.인구소멸 위기지역 (0) | 2018.07.13 |
[인구 데이터] 우리나라 인구 소멸 위기 지역 분석 (0) | 2018.07.13 |
댓글