G検定

曖昧さ回避 日本ディープラーニング協会が実施するAIに関する資格試験については「JDLA Deep Learning For GENERAL」をご覧ください。

G検定(ジーけんてい)は統計学的検定法で、尤度比検定の一種である。これまでカイ二乗検定が用いられていた場面で広く用いられつつある。

カイ二乗検定は累積分布関数への適合性や分割表における独立性の検定に広く用いられてきたが、実は対数尤度近似に基づくものであり、一方G検定は対数尤度を直接用いる方法である。カイ二乗検定はカール・ピアソンによって計算の容易な方法として導入されたのであるが、コンピュータの普及によってG検定も決して煩雑な方法ではなくなってきた。特に1994年に出版されたソーカルとロルフの教科書(「生物統計学」第3版:参考文献)で推奨され、広く利用されるようになった。

ピアソンのカイ二乗検定統計量は

χ 2 = i ( O i E i ) 2 E i {\displaystyle \chi ^{2}=\sum _{i}{(O_{i}-E_{i})^{2} \over E_{i}}}

ここで Oi は分割表の各マス目における出現頻度、Eは帰無仮説で期待される頻度で、すべてのマス目を合計する。それに対応するG

G = 2 i O i ln ( O i / E i ) {\displaystyle G=2\sum _{i}{O_{i}\cdot \ln(O_{i}/E_{i})}}

観察された頻度が、ある期待される頻度をもつ分布から抽出した無作為標本にもとづくものであるという帰無仮説を立てれば、G の分布はカイ二乗(自由度は同じ)で近似される。

標本サイズが適切であればG検定とカイ二乗検定では同じ結論が得られるが、すべてのマス目に対して |OiEi |> Ei となる場合には、ピアソンのカイ二乗検定でなくG検定を用いるのが望ましい。

サンプルサイズが小さい場合には、カイ二乗検定やG検定でなく、多項検定(適合性)、フィッシャーの正確検定(分割表)、あるいはベイズ式仮説選択が望ましい。

参考文献

  • Sokal, R. R., & Rohlf, F. J. (1994). Biometry: the principles and practice of statistics in biological research., 3rd edition. New York: Freeman. ISBN 0-7167-2411-1.
標本調査
要約統計量
連続確率分布
位置
分散
モーメント
カテゴリデータ
推計統計学
仮説検定
パラメトリック
ノンパラメトリック
その他
区間推定
モデル選択基準
その他
ベイズ統計学
確率
その他
相関
モデル
回帰
線形
非線形
時系列
分類
線形
二次
非線形
その他
教師なし学習
クラスタリング
密度推定(英語版)
その他
統計図表
生存分析
歴史
  • 統計学の創始者
  • 確率論と統計学の歩み
応用
出版物
  • 統計学に関する学術誌一覧
  • 重要な出版物
全般
その他
カテゴリ カテゴリ