予測区間

予測区間(よそくくかん)とは統計学用語で、母集団を仮定した上で、将来観察されるであろう標本値(現在は測定できない)に対して「どの範囲にあると予測されるか」を示すものである。

これに対し、信頼区間とは、母集団の母数(標本から測定できない)に対して 「どの範囲にあると推定できるか」を示すものである。混同しないように注意。

正規分布に従う母集団から標本を抽出したとしよう。母集団の平均標準偏差は不明である(標本から推定できるのみ)。n を標本サイズ、 μと σ を母集団の平均と標準偏差とし、 X1, ...,Xn を現在までの標本として、これから次の観察値Xn+1 を予測したい。現在までの標本の平均および分散を

X ¯ n = ( X 1 + + X n ) / n {\displaystyle {\overline {X}}_{n}=(X_{1}+\cdots +X_{n})/n}
S n 2 = 1 n 1 i = 1 n ( X i X ¯ n ) 2 {\displaystyle S_{n}^{2}={1 \over n-1}\sum _{i=1}^{n}(X_{i}-{\overline {X}}_{n})^{2}}

とする。ここで次の数値:

T n 1 X n + 1 X ¯ n S n 2 + S n 2 / n = X n + 1 X ¯ n S n 1 + 1 / n {\displaystyle {T_{n-1}}\sim {X_{n+1}-{\overline {X}}_{n} \over {\sqrt {S_{n}^{2}+S_{n}^{2}/n}}}={X_{n+1}-{\overline {X}}_{n} \over S_{n}{\sqrt {1+1/n}}}}

を考えると、これはスチューデントのt分布(自由度 n − 1 )に従うことが示される。従って

Pr ( X ¯ n T a S n 1 + ( 1 / n ) X n + 1 X ¯ n + T a S n 1 + ( 1 / n ) ) = p {\displaystyle \Pr \left({\overline {X}}_{n}-T_{a}S_{n}{\sqrt {1+(1/n)}}\leq X_{n+1}\leq {\overline {X}}_{n}+T_{a}S_{n}{\sqrt {1+(1/n)}}\,\right)=p}

とすれば、Ta は自由度 n − 1 のt分布における 100((1 + p)/2)パーセント点である。そして

X ¯ n ± T a S n 1 + ( 1 / n ) {\displaystyle {\overline {X}}_{n}\pm T_{a}{S}_{n}{\sqrt {1+(1/n)}}}

という数値が Xn+1 に対する100p%予測区間の境界を表す。

例えば p = 0.95 とすれば、95%予測区間ということになる。

関連項目

ポータル 数学
ポータル 数学
標本調査
要約統計量
連続確率分布
位置
分散
モーメント
カテゴリデータ
推計統計学
仮説検定
パラメトリック
ノンパラメトリック
その他
区間推定
モデル選択基準
その他
ベイズ統計学
確率
その他
相関
モデル
回帰
線形
非線形
時系列
分類
線形
二次
非線形
その他
教師なし学習
クラスタリング
密度推定(英語版)
その他
統計図表
生存分析
歴史
  • 統計学の創始者
  • 確率論と統計学の歩み
応用
出版物
  • 統計学に関する学術誌一覧
  • 重要な出版物
全般
その他
カテゴリ カテゴリ