
医学部学士編入生命科学試験では、特にカイ二乗検定を用いる問題が、比較的多くの受験校で出題されています。実際、管理人が受験していた2017年の医学部学士編入試験の入試問題では鹿児島大、旭川医科大と出題されました。
カイ二乗検定には主に大きく分けて2種類ある
- 適合度検定・・・観測された度数分布が理論分布と同じかどうかを検定
- 独立性検定・・・2つ以上の分類のクロス集計表において、その分類の関連性があるかどうかを検定
この2つがあることを覚えておきましょう。この2つのカイ二乗検定について例題を解きながら見ていきますが、カイ二乗分布について説明した後4つの記事に分けて、適合度検定、独立性の検定について説明してきます。
カイ二乗分布について
カイ二乗分布については、以下のことが知られています。
【定理1】確率変数 Z1, Z2, …, Zk が互いに独立であり、かつ標準正規分布 N (0 , 1) に従うとき、各変数の二乗の総和
χ2 = Z12 + Z22 + … + Zk2
は自由度 k のχ2 分布に従う。
グラフの特徴としては、
n = 1 , 2 では単調減少する。
n が 3以上では n が増大するにつれて極大値が右へ移動する。
加えて、カイ二乗分布に関しては、上記の定義から次の定理も導かれます。
【定理2】総度数 n が十分大きいとき、カテゴリーの個数が k であるならば、標本から得られる 観測度数 と 理論式から得られる 期待度数 を用いて得られる食い違い度である次式
χ02 = Σ{(観測度数 - 期待度数)2 / (期待度数)}
は近似的に自由度 k - 1 のχ2 分布に従う。
ここで、上記の2つの定理の数学的な議論が気になる人もいると思います。しかし、その議論を始めてしまうと、泥沼にハマってしまう可能性が高い為、あまりオススメしません。気になる人は参考文献を確認してみてください。試験に受かることを第一に考える人は、この事実を認めて、深追いせずに次へ進みましょう。ここではとにかく、上のようなカイ二乗分布というものが存在する、と覚えておきましょう。そして、観測度数と期待度数から食い違い度を計算すると、それが近似的にカイ二乗分布に従うということです。
カイ二乗分布に関する棄却域について
このカイ二乗分布を使って検定を行うときは、以下の棄却域に注意することが大切です。
【注意】有意水準 α のとき、この自由度 k - 1 のカイ二乗分布の上側 100α %は、
χ2 ( k - 1, α )
と表記され、棄却域は下図のように見かけ上は片側領域となる。
要するに、棄却域が片側のようになる、ということです。片側検定のように見えますが、右や左というような指定をしていないので、実質的には両側検定と同じ意味となりますが、グラフの領域としては片側です。次は適合度検定について説明します。
適合度検定とは
適合度検定を定義すると以下のように説明できます。
適合度検定とは、観測された度数が、ある特定の理論分布に適合しているかの検定のこと。
『 観測された度数 』とは、標本から得られるデータです。
『 ある特定の理論分布 に適合しているかの検定 』とは、理論分布に基づいて、期待度数 ( 理論値 ) を計算して、観測度数 ( 観測値 ) との食い違い度を評価するということです。
それでは、よくある問題で練習してみましょう。
例題
【問題】
サイコロを60回投げて、それぞれの目の出た度数を調べたところ、以下のようになった。
出目 | 1 | 2 | 3 | 4 | 5 | 6 | 合計 |
観測度数 | 8 | 12 | 7 | 10 | 15 | 8 | 60 |
この目の出方は偏りがあると言えるか? 有意水準α = 0.05 で統計学的に検定せよ。必要があれば、以下のカイ二乗分布表を用いよ。
注意
この問題の注意するポイントは、6つの目の出方を一気に考えているところです。1つの目に限定して、『 確率 \(\frac{1}{6}\) で出るかどうか 』を検定するのであれば、母比率の検定になります。以下の記事の問題2と比べてみてください。
【解答】
帰無仮説 H0:各目の出る確率が全て \(\frac{1}{6}\)
対立仮説 H1:各目の出る確率が等しくない。
理論値である期待度数を計算すると、以下の表のようになる。
出目 | 1 | 2 | 3 | 4 | 5 | 6 | 合計 |
観測度数 | 8 | 12 | 7 | 10 | 15 | 8 | 60 |
期待度数 | 10 | 10 | 10 | 10 | 10 | 10 | 60 |
以下の定理より、食い違い度 χ02 を計算すると、
【定理2】総度数 n が十分大きいとき、カテゴリーの個数が k であるならば、標本から得られる 観測度数 と 理論式から得られる 期待度数 を用いて得られる食い違い度である次式 χ02 = Σ{(観測度数 - 期待度数)2 / (期待度数)}
は近似的に自由度 k - 1 のχ2 分布に従う。
χ02 = \(\frac{(8 -10)^2}{10}+ \cdots +\frac{(8 -10)^2}{10}=4.6\) である。
この 食い違い度 χ02 は近似的に自由度 6 - 1 = 5 のχ2 分布に従う。自由度5のχ2 分布の上側 5%点は以下の表より
χ2 (5, 0.05) = 11.07
であるから、
χ02 = 4.6 < 11.1
であり、棄却されない。(食い違い度がこの値になる可能性が、確率5%以下ではない、すなわち有り得る現象)
つまり、偏りがあるとは言えない。
(解答おわり)
まとめ
この分野は生命科学の問題と関連づけて出題されたりしますので、もう少し練習経験を積んでおくと良いと思います。