事後確率

統計学
ベイズ統計学
理論
技法

事後確率(じごかくりつ、: posterior probability)は、条件付き確率の一種。アポステリオリ確率ともいう[1][2]。 ある証拠(データあるいは情報)を考慮に入れた条件で、ある変数について知られている度合を確率として表現する主観確率の一種である。

対になる用語が事前確率で、これは証拠となるデータがない条件下での不確かな量の条件付確率である。ベイズの定理により、事前確率に尤度関数の出力値を掛けると事後確率が得られる。

なお本項では「変数」という用語を、観測できる確率変数のほかに、観測できない(隠れた)変数、母数あるいは仮説も含めて用いている。たとえば、「土星の質量」を変数xとして、観測結果に基づいた事後確率「xが定数αからβの間にある確率」を求めることができる(主観確率を認めない頻度主義ではこのような言い方は意味がない)。

簡単な例

サイコロを使う例

Aさんがサイコロを2回振って出た目を記録する。その結果を知らないBさんに「どちらかで2の目が出た確率は?」と聞く。答えは(サイコロが完全にランダムとすれば)11/36となる。これが事前確率である。

次にAさんは「出た目の和は6だった」というヒント(新たな情報)を出す。そうすると2の目が出た確率は2/5となる。これが事後確率である。

モンティ・ホール問題

詳しくはモンティ・ホール問題を参照。

3つのカーテンの中に1つの「アタリ」と2つの「ハズレ」が隠されている。まず何も情報がない場合に、3つのうちどれでも1つがアタリとなる確率は(位置に関して完全にランダムとすれば)1/3となる。これが事前確率である。

さて、回答者が3つの中からある1つを選んだあとに、司会者が回答者の選択しなかったハズレのうちの1つ(これがハズレだよという新たな情報)を示す。そうすると最初に選んだ1つがアタリの確率は1/3、残りの1つがアタリの確率は2/3となる 。この1/3および2/3というのが事後確率である。(これは直感的に考えると間違えやすい)

事前確率と事後確率

事前確率と事後確率の関係は相対的なもので、事後確率を事前確率としてさらなる情報を付け足し、新しい事後確率を求めることができる。

事後確率の確率分布事後確率分布: posterior probability distribution)で、事後分布: posterior)と略す。これは事前確率分布に尤度関数をかけ、これを正規化(合計値または積分値を1にする)して得られる。事前確率と事後確率は、古典的な頻度主義統計学では用いられない、ベイズ統計学の用語である。

たとえば

f X Y = y ( x ) = f X ( x ) L X Y = y ( x ) f X ( x ) L X Y = y ( x ) d x {\displaystyle f_{X\mid Y=y}(x)={f_{X}(x)L_{X\mid Y=y}(x) \over {\int _{-\infty }^{\infty }f_{X}(x)L_{X\mid Y=y}(x)\,dx}}}

によって、データ Y=y が与えられた場合の変数 X に対する事後確率の分布密度関数が得られる。ただしここで

  • f X ( x ) {\displaystyle f_{X}(x)} は X の事前確率分布
  • L X Y = y ( x ) = f Y X = x ( y ) {\displaystyle L_{X\mid Y=y}(x)=f_{Y\mid X=x}(y)} x の関数としての尤度関数(データ Y=y が与えられた場合に、 X の値が x であると考えるもっともらしさを表す)
  • f X ( x ) L X Y = y ( x ) d x {\displaystyle \int _{-\infty }^{\infty }f_{X}(x)L_{X\mid Y=y}(x)\,dx} は正規化(積分値を 1 にするための)係数
  • f X Y = y ( x ) {\displaystyle f_{X\mid Y=y}(x)} X の事後確率分布

である。このように、事前確率に証拠となる情報を加味してより確からしい事後確率を求めることをベイズ改訂(またはベイズ更新)といい、この方法を用いる推定をベイズ推定という。

脚注

  1. ^ 確率の哲学的試論, 解説.
  2. ^ 伏見, II章確率論 8節公理系 p.64.

参考文献

関連項目

標本調査
要約統計量
連続確率分布
位置
分散
モーメント
カテゴリデータ
推計統計学
仮説検定
パラメトリック
ノンパラメトリック
その他
区間推定
モデル選択基準
その他
ベイズ統計学
確率
その他
相関
モデル
回帰
線形
非線形
時系列
分類
線形
二次
非線形
その他
教師なし学習
クラスタリング
密度推定(英語版)
その他
統計図表
生存分析
歴史
  • 統計学の創始者
  • 確率論と統計学の歩み
応用
出版物
  • 統計学に関する学術誌一覧
  • 重要な出版物
全般
その他
カテゴリ カテゴリ