ここでは、カイ二乗検定を用いるもう一つの検定である『 独立性の検定 』について解説しています。
【定理2】総度数 n が十分大きいとき、カテゴリーの個数が k であるならば、標本から得られる 観測度数と 理論式から得られる 期待度数を用いて得られる食い違い度である次式
χ02 = Σ{(観測度数 - 期待度数)2 / (期待度数)}
は近似的に自由度 k - 1 のχ2 分布に従う。
独立性の検定とは
独立性の検定を定義すると以下のように説明できます。
独立性の検定とは、2種類の属性が独立であるかどうかの検定のこと。
使う分布は、適合度検定と同じカイ二乗分布となります。
ここでの『 2種類の属性』とは、『 髪の色 』と『 眼の色 』のようなです。この、2つの属性があった場合
『 髪の色 』には『 金色、茶色、黒色 』などがあって、
『 眼の色 』には『 青色、灰色、茶色 』などがあります。
以下よくある問題で練習してみましょう。
例題
【問題】
サイコロを60回投げて、それぞれの目の出た度数を調べたところ、以下のようになった。
出目 | 1 | 2 | 3 | 4 | 5 | 6 | 合計 |
観測度数 | 8 | 12 | 7 | 10 | 15 | 8 | 60 |
この目の出方は偏りがあると言えるか? 有意水準α = 0.05 で統計学的に検定せよ。必要があれば、以下のカイ二乗分布表を用いよ。
注意
この問題の注意するポイントは、6つの目の出方を一気に考えているところです。1つの目に限定して、『 確率 \(\frac{1}{6}\) で出るかどうか 』を検定するのであれば、母比率の検定になります。以下の記事の問題2と比べてみてください。
【解答】
帰無仮説 H0:各目の出る確率が全て \(\frac{1}{6}\)
対立仮説 H1:各目の出る確率が等しくない。
理論値である期待度数を計算すると、以下の表のようになる。
出目 | 1 | 2 | 3 | 4 | 5 | 6 | 合計 |
観測度数 | 8 | 12 | 7 | 10 | 15 | 8 | 60 |
期待度数 | 10 | 10 | 10 | 10 | 10 | 10 | 60 |
以下の定理より、食い違い度 χ02 を計算すると、
【定理2】総度数 n が十分大きいとき、カテゴリーの個数が k であるならば、標本から得られる 観測度数 と 理論式から得られる 期待度数 を用いて得られる食い違い度である次式 χ02 = Σ{(観測度数 - 期待度数)2 / (期待度数)}
は近似的に自由度 k - 1 のχ2 分布に従う。
χ02 = \(\frac{(8 -10)^2}{10}+ \cdots +\frac{(8 -10)^2}{10}=4.6\) である。
この 食い違い度 χ02 は近似的に自由度 6 - 1 = 5 のχ2 分布に従う。自由度5のχ2 分布の上側 5%点は以下の表より
χ2 (5, 0.05) = 11.07
であるから、
χ02 = 4.6 < 11.1
であり、棄却されない。(食い違い度がこの値になる可能性が、確率5%以下ではない、すなわち有り得る現象)
つまり、偏りがあるとは言えない。
(解答おわり)