【統計学】カイ二乗検定1 適合度検定 ( 解説編 ) 
スポンサーリンク

医学部学士編入生命科学試験では、特にカイ二乗検定を用いる問題が、比較的多くの受験校で出題されています。実際、管理人が受験していた2017年の医学部学士編入試験の入試問題では鹿児島大、旭川医科大と出題されました。

 

カイ二乗検定には主に大きく分けて2種類ある

  1. 適合度検定・・・観測された度数分布が理論分布と同じかどうかを検定
  2. 独立性検定・・・2つ以上の分類のクロス集計表において、その分類の関連性があるかどうかを検定

この2つがあることを覚えておきましょう。この2つのカイ二乗検定について例題を解きながら見ていきますが、カイ二乗分布について説明した後4つの記事に分けて、適合度検定独立性の検定について説明してきます。

 

カイ二乗分布について

カイ二乗分布については、以下のことが知られています。

【定理1】確率変数 Z1, Z2, …, Zが互いに独立であり、かつ標準正規分布 N (0 , 1) に従うとき、各変数の二乗の総和 

 χ2 =  Z1+ Z2+ … + Zk2

は自由度 k のχ2 分布に従う。

グラフの特徴としては、

n = 1 , 2 では単調減少する。

n が 3以上では n が増大するにつれて極大値が右へ移動する。

 

 

加えて、カイ二乗分布に関しては、上記の定義から次の定理も導かれます。

【定理2】総度数 n が十分大きいとき、カテゴリーの個数が k であるならば、標本から得られる 観測度数 と 理論式から得られる 期待度数 を用いて得られる食い違い度である次式

 χ02 = Σ{(観測度数 - 期待度数)/ (期待度数)}

近似的に自由度 k - 1 のχ2 分布に従う。

 

ここで、上記の2つの定理の数学的な議論が気になる人もいると思います。しかし、その議論を始めてしまうと、泥沼にハマってしまう可能性が高い為、あまりオススメしません。気になる人は参考文献を確認してみてください。試験に受かることを第一に考える人は、この事実を認めて、深追いせずに次へ進みましょう。ここではとにかく、上のようなカイ二乗分布というものが存在する、と覚えておきましょう。そして、観測度数期待度数から食い違い度を計算すると、それが近似的にカイ二乗分布に従うということです。

カイ二乗分布に関する棄却域について

このカイ二乗分布を使って検定を行うときは、以下の棄却域に注意することが大切です。

【注意】有意水準 α のとき、この自由度 k - 1 のカイ二乗分布の上側 100α %は、

 χ( k - 1,  α )

と表記され、棄却域は下図のように見かけ上は片側領域となる。

 

要するに、棄却域が片側のようになる、ということです。片側検定のように見えますが、右や左というような指定をしていないので、実質的には両側検定と同じ意味となりますが、グラフの領域としては片側です。次は適合度検定について説明します。

適合度検定とは

適合度検定を定義すると以下のように説明できます。

適合度検定とは、観測された度数が、ある特定の理論分布に適合しているかの検定のこと。

『 観測された度数 とは、標本から得られるデータです。

『 ある特定の理論分布 に適合しているかの検定 』とは、理論分布に基づいて、期待度数 ( 理論値 ) を計算して、観測度数 ( 観測値 ) との食い違い度を評価するということです。

 

それでは、よくある問題で練習してみましょう。

例題

【問題】

サイコロを60回投げて、それぞれの目の出た度数を調べたところ、以下のようになった。

出目 合計
観測度数 12 10 15 60

この目の出方は偏りがあると言えるか? 有意水準α = 0.05 で統計学的に検定せよ。必要があれば、以下のカイ二乗分布表を用いよ。

注意

この問題の注意するポイントは、6つの目の出方を一気に考えているところです。1つの目に限定して、『 確率 \(\frac{1}{6}\) で出るかどうか 』を検定するのであれば、母比率の検定になります。以下の記事の問題2と比べてみてください。

 

【解答】

帰無仮説 H0:各目の出る確率が全て \(\frac{1}{6}\)

対立仮説 H1:各目の出る確率が等しくない。

理論値である期待度数を計算すると、以下の表のようになる。

出目 合計
観測度数 12 10 15 60
期待度数 10 10 10 10 10 10 60

以下の定理より、食い違い度 χ0を計算すると、

【定理2】総度数 n が十分大きいとき、カテゴリーの個数が k であるならば、標本から得られる 観測度数 と 理論式から得られる 期待度数 を用いて得られる食い違い度である次式 χ02 = Σ{(観測度数 - 期待度数)/ (期待度数)}

近似的に自由度 k - 1 のχ2 分布に従う。

 χ0= \(\frac{(8 -10)^2}{10}+ \cdots +\frac{(8 -10)^2}{10}=4.6\) である。

この 食い違い度 χ0は近似的に自由度 6 - 1 = 5 のχ2 分布に従う。自由度5のχ2 分布の上側 5%点は以下の表より

 χ2 (5,  0.05) = 11.07

であるから、

 χ0= 4.6 < 11.1

であり、棄却されない。(食い違い度がこの値になる可能性が、確率5%以下ではない、すなわち有り得る現象)

つまり、偏りがあるとは言えない。

(解答おわり)

まとめ

おすすめの記事