def 小児科医():

かけだし小児科医が仕事の合間にプログラミングを勉強するブログです。

統計検定2級の勉強をする話④

前回↓

 

defpediatric.hatenablog.com

 

今回は日本語で。

「時系列データ」の話。

 

 

 

時系列データの扱い

ある時刻 t → t+1 におけるyの変化を見る方法は

  1. 差を見る(yt+1 - yt )
  2. 変化率を見る((yt+1 - yt )/yt)

の二種類が基本的である。

指数化

ある時点sを基準点とし、

qt = yt/ys

という指数の推移を見る方法。

西暦末尾0 or 5年の値の平均値を基準とすることが多い。

 

比で変化を見る方法

前期比は

rt=yt/yt-1

とすることができる。

平均の伸び率を計算する場合は算術平均ではなく幾何平均

 

\( \sqrt[n]{x_1 \times x_2 \times \ldots \times x_n} \)

を用いる。

 

変動分解

時系列データの時間的変動は以下の2種類に分けることができる。

  • 傾向変動(TC):長期に渡る動きを表す変動
  • 季節変動(S):1年を周期として循環を繰り返す変動
  • 不規則変動( I ):上記以外の変動

つまりある時点tの時系列データに関して、

yt=TCt+St+It

と分解できる.

 

TCtの抽出

移動平均法(moving average method)

ある時点tとその前後±kの間の2k+1個の値に対して移動平均

\[ \hat{TC}_t = \frac{1}{2k+1} \sum_{i=t-k}^{t+k} Y_i \]

で求められ、周期2k+1で循環する成分を除去できる。

*周期が偶数の場合はk+1とk-1時点の値を1/2にして無理やり奇数にして計算する。

 

Stの計算

傾向変動成分を引いた時系列データWは

Wt = yt - TCt = St+It

で、季節変動と不規則変動を含んでいる。

月毎のWの平均を取り、月別の平均からW全体の平均を引く

 

自己相関

時刻tの時系列とtからhずらしたt+hの時系列の相関関係を考える。

この時相関係数rh自己共分散関数(autocovariance function)を用いて計算する。

 

自己共分散関数 (Autocovariance Function):

\[ \gamma(h) = \frac{1}{n} \sum_{t=1}^{n-h} (X_t - \bar{X})(X_{t+h} - \bar{X}) \]

自己相関係数 (Autocorrelation Function):

\[ \rho(h) = \frac{\gamma(h)}{\gamma(0)} \]

 

横軸にラグh、rhを縦軸にしたグラフをコレログラムと言い、相関の強い周期を可視化できる。

 

 

本日はここまで。

数学の知識が足りなくて辛い。勉強しとけばよかった。