G検定

日本ディープラーニング協会が実施するAIに関する資格試験については「JDLA Deep Learning For GENERAL」をご覧ください。

G検定（ジーけんてい）は統計学的検定法で、尤度比検定の一種である。これまでカイ二乗検定が用いられていた場面で広く用いられつつある。

カイ二乗検定は累積分布関数への適合性や分割表における独立性の検定に広く用いられてきたが、実は対数尤度の近似に基づくものであり、一方G検定は対数尤度を直接用いる方法である。カイ二乗検定はカール・ピアソンによって計算の容易な方法として導入されたのであるが、コンピュータの普及によってG検定も決して煩雑な方法ではなくなってきた。特に1994年に出版されたソーカルとロルフの教科書（「生物統計学」第3版：参考文献）で推奨され、広く利用されるようになった。

ピアソンのカイ二乗検定統計量は

\chi ^{2}=\sum _{i}{(O_{i}-E_{i})^{2} \over E_{i}}

ここで O_i は分割表の各マス目における出現頻度、Eは帰無仮説で期待される頻度で、すべてのマス目を合計する。それに対応するG は

G=2\sum _{i}{O_{i}\cdot \ln(O_{i}/E_{i})}

観察された頻度が、ある期待される頻度をもつ分布から抽出した無作為標本にもとづくものであるという帰無仮説を立てれば、G の分布はカイ二乗（自由度は同じ）で近似される。

標本サイズが適切であればG検定とカイ二乗検定では同じ結論が得られるが、すべてのマス目に対して |O_i − E_i |> E_i となる場合には、ピアソンのカイ二乗検定でなくG検定を用いるのが望ましい。

サンプルサイズが小さい場合には、カイ二乗検定やG検定でなく、多項検定（適合性）、フィッシャーの正確検定（分割表）、あるいはベイズ式仮説選択が望ましい。

参考文献

Sokal, R. R., & Rohlf, F. J. (1994). Biometry: the principles and practice of statistics in biological research., 3rd edition. New York: Freeman. ISBN 0-7167-2411-1.

位置	平均算術幾何調和中央値分位数順序統計量最頻値階級値
分散	範囲偏差偏差値標準偏差標準誤差変動係数決定係数相関係数自己相関共分散自己共分散分散共分散行列百分率統計的ばらつき
モーメント	分散歪度尖度

カテゴリデータ

頻度
分割表

推計統計学

仮説検定

パラメトリック	t検定ウェルチのt検定 F検定 Z検定二項検定ジャック-ベラ検定シャピロ–ウィルク検定分散分析共分散分析
ノンパラメトリック	ウィルコクソンの符号順位検定マン・ホイットニーのU検定カイ二乗検定イェイツのカイ二乗検定累積カイ二乗検定フィッシャーの正確確率検定尤度比検定 G検定アンダーソン–ダーリング検定コルモゴロフ–スミルノフ検定カイパー検定マンテル検定コクラン・マンテル・ヘンツェルの統計量
その他	帰無仮説対立仮説有意棄却

区間推定

モデル選択基準

その他

ベイズ統計学

確率	主観確率ベイズ確率事前確率事後確率最大事後確率
その他	ベイズ推定ベイズ因子

相関

モデル

回帰

線形	リッジ回帰ラッソ回帰エラスティックネット
非線形	k近傍法決定木ランダムフォレストニューラルネットワークサポートベクターマシン射影追跡回帰
時系列	自己回帰モデル自己回帰移動平均モデル ARCHモデル対移動平均比率法トレンド定常傾向推定共和分構造変化

分類

線形	線形判別分析ロジスティック回帰 <! -- 名前に回帰とついていますが確率を回帰する分類手法です --> 単純ベイズ分類器単純パーセプトロン線形サポートベクターマシン
二次	二次判別分析
非線形	k近傍法決定木ランダムフォレストニューラルネットワークサポートベクターマシンベイジアンネットワーク隠れマルコフモデル
その他	二項分類多クラス分類第一種過誤と第二種過誤

教師なし学習

クラスタリング	k平均法（k-means++法） DBSCAN
密度推定（英語版）	カーネル密度推定（カーネル）
その他	主成分分析独立成分分析自己組織化写像