統計検定2級の勉強をする話④
前回↓
今回は日本語で。
「時系列データ」の話。
時系列データの扱い
ある時刻 t → t+1 におけるyの変化を見る方法は
- 差を見る(yt+1 - yt )
- 変化率を見る((yt+1 - yt )/yt)
の二種類が基本的である。
指数化
ある時点sを基準点とし、
qt = yt/ys
という指数の推移を見る方法。
西暦末尾0 or 5年の値の平均値を基準とすることが多い。
比で変化を見る方法
前期比は
rt=yt/yt-1
とすることができる。
平均の伸び率を計算する場合は算術平均ではなく幾何平均
\( \sqrt[n]{x_1 \times x_2 \times \ldots \times x_n} \)
を用いる。
変動分解
時系列データの時間的変動は以下の2種類に分けることができる。
- 傾向変動(TC):長期に渡る動きを表す変動
- 季節変動(S):1年を周期として循環を繰り返す変動
- 不規則変動( I ):上記以外の変動
つまりある時点tの時系列データに関して、
yt=TCt+St+It
と分解できる.
TCtの抽出
移動平均法(moving average method)
ある時点tとその前後±kの間の2k+1個の値に対して移動平均は
\[ \hat{TC}_t = \frac{1}{2k+1} \sum_{i=t-k}^{t+k} Y_i \]
で求められ、周期2k+1で循環する成分を除去できる。
*周期が偶数の場合はk+1とk-1時点の値を1/2にして無理やり奇数にして計算する。
Stの計算
傾向変動成分を引いた時系列データWは
Wt = yt - TCt = St+It
で、季節変動と不規則変動を含んでいる。
月毎のWの平均を取り、月別の平均からW全体の平均を引く
自己相関
時刻tの時系列とtからhずらしたt+hの時系列の相関関係を考える。
この時相関係数rhは自己共分散関数(autocovariance function)を用いて計算する。
自己共分散関数 (Autocovariance Function):
\[ \gamma(h) = \frac{1}{n} \sum_{t=1}^{n-h} (X_t - \bar{X})(X_{t+h} - \bar{X}) \]
自己相関係数 (Autocorrelation Function):
\[ \rho(h) = \frac{\gamma(h)}{\gamma(0)} \]
横軸にラグh、rhを縦軸にしたグラフをコレログラムと言い、相関の強い周期を可視化できる。
本日はここまで。
数学の知識が足りなくて辛い。勉強しとけばよかった。