カイ二乗検定

カイ二乗検定（カイにじょうけんてい、カイじじょうけんてい、英: Chi-squared test）、または $\chi ^{2}$ 検定とは、帰無仮説が正しければ検定統計量が漸近的にカイ二乗分布に従うような統計的検定法の総称である。次のようなものを含む。

ピアソンのカイ二乗検定：カイ二乗検定として最もよく利用されるものである（本項で述べる）。
一部の尤度比検定：標本サイズが大きい場合には近似的にカイ二乗検定となる場合がある。
イェイツのカイ二乗検定（イェイツの修正）
マンテル・ヘンツェルのカイ二乗検定
累積カイ二乗検定
Linear-by-linear連関カイ二乗検定

これらはいずれも

\chi ^{2}=\sum {\frac {(\mathrm {observed} -\mathrm {expected} )^{2}}{\mathrm {expected} }},

（ここで"expected" という語は期待値そのものではなく観測値から求められる期待値の推定量あるいは理論値を指すことが多い）

という形の検定統計量「カイ二乗（χ²）」を含む。

日本工業規格ではカイ二乗検定を「検定統計量が、帰無仮説の下でχ²分布に従うことを仮定して行う統計的検定」と定義している^[1] 。

ピアソンのカイ二乗検定

ピアソンのカイ二乗検定（Pearson's chi-square test）は、カイ二乗検定のうち最も基本的かつ広く用いられる方法であって、「観察された事象の相対的頻度がある頻度分布に従う」という帰無仮説を検定するものである^[2]。この頻度分布は特定のものに限らない。すなわちこの方法はノンパラメトリック検定である。

標本空間が有限個の互いに排反な事象の和であるとする（例えば「さいころの目」、「ある人が男か女か」など）。カイ二乗検定統計量とは、各事象に関する頻度の観測値と理論値との差の二乗を理論値で割った商の総和

\chi ^{2}=\sum {(O-E)^{2} \over E}

である。ただしここでO = 頻度の観測値，E = 帰無仮説の下における頻度の期待値（理論値）である。

ピアソンのカイ二乗検定は2つのタイプの比較、適合度検定及び独立性検定に用いられる:

適合度検定

観測された度数分布が理論分布と同じかどうかを検定する。例えば簡単な例として、標本として100人の人がいる場合に、「男と女が同数だけいる集団から、ランダムに抽出された100人である」という仮説を検定するには、男女の人数の観測度数と期待度数とを比較すればよい。観測値が男45人、女55人ならば、


i	属性 S_i	観測度数 ν_i	期待確率 p_i	期待度数 np_i	(ν_i − np_i)²/np_i
1	男性	45	1/2	50	25/50
2	女性	55	1/2	50	25/50
計		n = 100	1	100	χ² = 1

\chi ^{2}=\sum _{i}{\frac {(\nu _{i}-np_{i})^{2}}{np_{i}}}={(45-50)^{2} \over 50}+{(55-50)^{2} \over 50}=1

この場合の自由度は1である（2つの観測値と理論値の差は、一方を決めると他方も自動的に決まるから）。そこで自由度1のカイ二乗分布を見ると、男女の人数が等しい場合にこのような差（及び女がさらに多くなるような場合）が見出される確率は、おおよそ0.32である。この確率は普通用いる統計学的有意水準（ α = 0.05, 0.01など）よりも高いから、「男女の人数が等しい」とする帰無仮説を棄却する理由がない。

またカイ二乗分布で十分近似できるのは、実際的な問題として期待度数が条件 np_i ≥ 10 をすべての属性に対して満たすときとされている^[3]。

独立性検定

2つの変数に対する2つの観察（2x2分割表で表される）が互いに独立かどうかを検定する。例えば、「別の地域の人々について、選挙である候補を支持する頻度が違う」かどうかを検定する方法である。

カイ二乗の計算値は、確率分布が二項分布あるいは正規分布に従う集団に関しては正確にカイ二乗分布に従う。

期待値が二項分布：

E=^{d}{\mbox{Bin}}(n,p)

（ただしここで、p = 帰無仮説の下での確率，n = 標本の観測値）に従う場合、カイ二乗は自由度1のカイ二乗分布に従う。なおこの二項分布は標本数が大きい場合には次のような正規分布で近似できる：

{\mbox{Bin}}(n,p)\approx ^{d}{\mbox{N}}(np,np(1-p))

標準正規分布に従う $k$ 個の変数 $Z$ から、各二乗の合計を求めると、自由度 $k$ のカイ二乗分布：

\sum _{i=1}^{k}Z_{i}^{2}=^{d}\chi _{k}^{2}

に従う。

しかし一般の頻度分布でもカイ二乗は「近似的には」カイ二乗分布に従うので、カイ二乗検定が適用可能である。期待値Eが小さい（標本数が小さい、または観測数が少ない）場合は、二項分布を正規分布ではうまく近似できないため、この場合には尤度比検定の1つであるG検定を用いるのがより適切である。全標本数が小さい場合は、二項検定、さらに2x2分割表で表される場合にはフィッシャーの正確確率検定を用いる必要がある。

脚注

^ JIS Z 8101-1 : 1999 統計 − 用語と記号 − 第1部:確率及び一般統計用語 2.60 カイ二乗検定, 日本規格協会, http://kikakurui.com/z8/Z8101-1-1999-01.html
^ 伏見康治「確率論及統計論」第 VII 章確率と統計 65節. χ² - 検定法 p.373
^ Cramér 1999, p. 420.

参考文献

Cramér, Harald (1999) [1946]. Mathematical Methods of Statistics. Princeton Landmarks in Mathematics. Princeton University Press. ISBN 0-691-00547-8. MR1816288. Zbl 0985.62001. https://books.google.com/books?id=CRTKKaJO0DYC
西岡康夫『数学チュートリアルやさしく語る確率統計』オーム社、2013年。ISBN 9784274214073。
伏見康治『確率論及統計論』河出書房、1942年。ISBN 9784874720127。http://ebsa.ism.ac.jp/ebooks/ebook/204。
日本数学会『数学辞典』岩波書店、2007年。ISBN 9784000803090。
JIS Z 8101-1:1999 統計 − 用語と記号 − 第1部:確率及び一般統計用語, 日本規格協会, http://kikakurui.com/z8/Z8101-1-1999-01.html

外部リンク

カイ二乗分布表 — 脇本和昌『身近なデータによる統計解析入門』森北出版、1973年。ISBN 4627090307。http://ebsa.ism.ac.jp/ebooks/ebook/1321。　付表

位置	平均算術幾何調和中央値分位数順序統計量最頻値階級値
分散	範囲偏差偏差値標準偏差標準誤差変動係数決定係数相関係数自己相関共分散自己共分散分散共分散行列百分率統計的ばらつき
モーメント	分散歪度尖度

カテゴリデータ

頻度
分割表

推計統計学

仮説検定

パラメトリック	t検定ウェルチのt検定 F検定 Z検定二項検定ジャック-ベラ検定シャピロ–ウィルク検定分散分析共分散分析
ノンパラメトリック	ウィルコクソンの符号順位検定マン・ホイットニーのU検定カイ二乗検定イェイツのカイ二乗検定累積カイ二乗検定フィッシャーの正確確率検定尤度比検定 G検定アンダーソン–ダーリング検定コルモゴロフ–スミルノフ検定カイパー検定マンテル検定コクラン・マンテル・ヘンツェルの統計量
その他	帰無仮説対立仮説有意棄却

区間推定

モデル選択基準

その他

ベイズ統計学

確率	主観確率ベイズ確率事前確率事後確率最大事後確率
その他	ベイズ推定ベイズ因子

相関

モデル

回帰

線形	リッジ回帰ラッソ回帰エラスティックネット
非線形	k近傍法決定木ランダムフォレストニューラルネットワークサポートベクターマシン射影追跡回帰
時系列	自己回帰モデル自己回帰移動平均モデル ARCHモデル対移動平均比率法トレンド定常傾向推定共和分構造変化

分類

線形	線形判別分析ロジスティック回帰 <! -- 名前に回帰とついていますが確率を回帰する分類手法です --> 単純ベイズ分類器単純パーセプトロン線形サポートベクターマシン
二次	二次判別分析
非線形	k近傍法決定木ランダムフォレストニューラルネットワークサポートベクターマシンベイジアンネットワーク隠れマルコフモデル
その他	二項分類多クラス分類第一種過誤と第二種過誤

教師なし学習

クラスタリング	k平均法（k-means++法） DBSCAN
密度推定（英語版）	カーネル密度推定（カーネル）
その他	主成分分析独立成分分析自己組織化写像