医学部学士編入生命科学試験では、統計学の分野が比較的出題されます。特にこのχ2検定に関しては、比較的多くの受験校でも出題されています。対策ができていない受験生は全く解けませんので、少し対策しておくだけで非常に有利になると考えています。実際、2017年入試では鹿児島大、旭川医科大と出題されました。このページでは、χ2検定に関する頻出問題を提示してありますので参考にして頂ければ幸いです。
スポンサーリンク
【χ2検定】
χ2検定には主に大きく分けて2種類ある。
- 適合度検定・・・観測された度数分布が理論分布と同じかどうかを検定
- 独立性検定・・・2つ以上の分類のクロス集計表において、その分類の関連性があるかどうかを検定
この2つがあることを覚えておく。例題を解きながら二つの検定を見てゆこう。
【適合度検定】
帰無仮説:H0 = 「サイコロの出目に差はない」(サイコロは歪んでいない)
出目 | O観測度数 | 期待確率 | E期待度数 | O – E | (O – E)2 | (O – E)2/E |
1 | ||||||
2 | ||||||
3 | ||||||
4 | ||||||
5 | ||||||
6 |
出目 | O観測度数 | 期待確率 | E期待度数 | O – E | (O – E)2 | (O – E)2/E |
1 | 25 | 1/6 | 35 (=210/6) | -10 | 100 | 100/35 |
2 | 30 | 1/6 | 35 (=210/6) | -5 | 25 | 25/35 |
3 | 35 | 1/6 | 35 (=210/6) | 0 | 0 | 0/35 |
4 | 40 | 1/6 | 35 (=210/6) | 5 | 25 | 25/35 |
5 | 35 | 1/6 | 35 (=210/6) | 0 | 0 | 0/35 |
6 | 45 | 1/6 | 35 (=210/6) | 10 | 100 | 100/35 |

スポンサーリンク
問題1はサイコロの歪みが無い、という結論になった。(確かに出目も均等っぽいのでそうかも) 次は、出目を少し変えてみて歪んだサイコロであると結論づける問題にしてみる。
問題1と比べて変化した値を赤数字にしてある。
出目 | O観測度数 | 期待確率 | E期待度数 | O – E | (O – E)2 | (O – E)2/E |
1 | 55 | 1/6 | 35 (=210/6) | 20 | 400 | 400/35 |
2 | 10 | 1/6 | 35 (=210/6) | -25 | 625 | 625/35 |
3 | 25 | 1/6 | 35 (=210/6) | -10 | 100 | 100/35 |
4 | 20 | 1/6 | 35 (=210/6) | -15 | 625 | 625/35 |
5 | 35 | 1/6 | 35 (=210/6) | 0 | 0 | 0/35 |
6 | 65 | 1/6 | 35 (=210/6) | 30 | 900 | 900/35 |
χ2値を計算すると、
Σ (O – E)^2/E = (400+625+100+625+0+900)/35 = 2650/35 = 75.714… > 11.0705 (自由度5、有意水準0.05)
この場合、検定量 χ2 値が11.075を上回っており棄却域に存在する。つまり、この仮説が起こる確率は5%より小さいことがわかる。よって、この仮説が起こることはほとんど無くて正しくは無い、と結論付ける。対立仮説 H1が採用され、
対立仮説 :H1 = 「サイコロに歪みは無いとはいえない」
となる。
スポンサーリンク
帰無仮説:H0 = 「標本の男女比に差は無い」
標本 | O観測度数 | 期待確率 | E期待度数 | O – E | (O – E)2 | (O – E)2/E |
男 | 90 | 1/2 | 150 (300/2) | -60 | 360 | 360/150 |
女 | 210 | 1/2 | 150 (300/2) | 60 | 360 | 360/150 |
帰無仮説:H0 = 「標本のABO比と日本人全体のそれに差は無い」
血液型 | O観測度数 | 期待確率 | E期待度数 | O – E | (O – E)2 | (O – E)2/E |
A型 | 90 | 4/10 | 80 (200×4/10) | 10 | 100 | 100/80 |
O型 | 30 | 3/10 | 60 (200×4/10) | -30 | 900 | 900/60 |
B型 | 50 | 2/10 | 40 (200×4/10) | 10 | 100 | 100/40 |
AB型 | 30 | 1/10 | 20 (200×4/10) | 10 | 100 | 100/20 |
スポンサーリンク
正解と不正解の数を問題3の「男女」比のように扱ってゆくと解ける。項目数は2なので自由度は1
帰無仮説:H0 = 「試験前後の学生Aの学力に差は無い」
標本 | O観測度数 | 期待確率 | E期待度数 | O – E | (O – E)2 | (O – E)2/E |
正解 | 85 | 7/10 | 70 (100×7/10) | 15 | 225 | 225/70 |
不正解 | 15 | 3/10 | 30 (100×3/10) | -15 | 225 | 225/30 |
(補足1)
因みに秋田大学の問題では、模擬テストでは3問中2問正解していたが、本番では8問中7問正解したとなっていた。この場合、上と同様の計算を行うと、χ2= 1.5625 < 3.8415 (標準正規分布の有意水準0.05の基準値 1.960を二乗したもの) であるから、帰無仮説は棄却されない。つまり、成績は向上したとはいえない。
(補足2)
加えて、秋田大学の問題では、「次回の模擬テストの問題でも、これと同程度以上の好成績を上げたとしたら成績が向上したと言えるか?」という問題が続いていた。この場合、模擬テストでの正解率2/3はそのままにして、「本番では16問中14問正解した」と考える。そのまま同様の計算を行うと、χ2= 3.125 < 3.8415 であるから、帰無仮説は棄却されない。つまり、成績が向上したとはいえない。
秋田大学の問題では、χ2値の表が与えられておらず、以下のような記載があった。
「判断基準が必要とされる場合には、危険率5%を用いること。また、標準正規分布に従う変量 z については、P(|z|> 2.576) = 0.01、P(|z|> 2.326) = 0.02、P(|z|> 1.960) = 0.05、P(|z|> 1.645) = 0.10、であることがわかっている。」
この場合、χ2検定の基準値は 1.9602 = 3.8415 を用いる。
これができるのは、X が標準正規分布N(0,1)に従う確率変数とすると、Z = X2 の従う分布を自由度1のχ2分布と言うからである。なので、「標準正規分布に従う変量 zの有意水準0.05の基準値は1.960であるので、χ2分布の有意水準0.05の基準値は1.9602 = 3.8415である」と書いて3.8415を用いる。
数学的証明はこちら→コチラ
スポンサーリンク
帰無仮説:H0 = 「養鶏場のニワトリは曜日によって産む卵の数に差は無い」
曜日 | O観測度数 | 期待確率 | E期待度数 | O – E | (O – E)2 | (O – E)2/E |
月 | 22 | 1/7 | 27 (100×7/10) | -5 | 25 | 25/27 |
火 | 30 | 1/7 | 27 (100×7/10) | 3 | 9 | 9/27 |
水 | 25 | 1/7 | 27 (100×7/10) | -2 | 4 | 4/27 |
木 | 29 | 1/7 | 27 (100×7/10) | 2 | 4 | 4/27 |
金 | 32 | 1/7 | 27 (100×7/10) | 5 | 25 | 25/27 |
土 | 33 | 1/7 | 27 (100×7/10) | 6 | 36 | 36/27 |
日 | 18 | 1/7 | 27 (100×7/10) | -9 | 81 | 81/27 |
合計 | 189 | 194 | 194/27 |
スポンサーリンク
【独立性検定】
帰無仮説:H0 = 「X小学校とY小学校の男子の肥満割合は互いに独立である」
O観測度数 | 肥満男子 | 非肥満男子 | 合計 |
X小学校 | 168 | 132 | 300 |
Y小学校 | 132 | 68 | 200 |
合計 | 300 | 200 | 500 |
同様の計算で各期待度数を求め以下の表を埋める。
E期待度数 | 肥満男子 | 非肥満男子 | |
X小学校 | 180 | 120 | |
Y小学校 | 120 | 80 | |
【ポイント】
この独立性検定では、帰無仮説を「◯◯と△△は互いに独立である」と仮定するところからはじまる。この仮定をすることによって事象Aと事象Bが独立であることの定義
が使えることになる。この式が使えると、問題1において、
事象A:X小学校の生徒である生徒数をa、事象B:肥満である生徒数をb、全体の人数をN
とおくと、
$$ P(A \land B) = P(A)P(B) = \frac{a}{N} \times \frac{b}{N} $$
と書けることになり、
よって、
$$期待度数 E = \frac{a \times b}{N}$$
となる。
スポンサーリンク
帰無仮説:H0 = 「銃規制に対する考え方と性別は独立である」(銃規制に対する考え方と性別は無関係である)
観測度数O
(期待度数E) |
銃規制するべき | どちらでも良い | 銃規制するべきでない | 合計 |
男 | 15 (12) | 10 (9) | 5 (9) | 30 |
女 | 5 (8) | 5 (6) | 10 (6) | 20 |
合計 | 20 | 15 | 15 | 50 |
【ポイント】
帰無仮説を「二つの事象は独立である」と仮定することがポイント。検定統計量の計算はこれまでと同じ。自由度に関しては、(項目数 – 1) × (項目数 – 1) であることに注意。
スポンサーリンク
アフリカにはヒトの赤血球に寄生する熱帯熱マラリア原虫が常在している。ウガンダのある部族で5歳以下の子供達290名を対象に鎌状赤血球質とマラリア感染の関係を調査したところ、次のような観測度数が得られた。赤血球の鎌状型とマラリア感染は関係あるといえるか?統計学的に推察せよ。(旭川医科大 改題)
観測度数O (期待度数E) |
マラリア感染 (+) | マラリア感染 (-) | 合計 |
鎌状型赤血球 | 12 | 31 | 43 |
正常型赤血球 | 113 | 134 | 247 |
合計 | 125 | 165 | 290 |
帰無仮説:H0 = 「赤血球が鎌状型であることとマラリアに感染していることは独立である」(関係が無い)
観測度数O
(期待度数E) |
マラリア感染 (+) | マラリア感染 (-) | 合計 |
鎌状型赤血球 | 12 (18.53) | 31 (24.47) | 43 |
正常型赤血球 | 113 (106.47) | 134 (140.53) | 247 |
合計 | 125 | 165 | 290 |
スポンサーリンク
ヒト常染色体上のメンデル遺伝様式を示す遺伝子ABCには、A、T、Gの3つの対立遺伝子が存在する。日本人250名から任意にサンプルを採取し、その遺伝子型を調べたところ、表1の結果を得た。この時、各遺伝子A、T、Gの遺伝子頻度はいくらか?また、これらの観測度数がハーディーワインバーグの法則が成立を仮定した場合の期待度数と適合しているかどうかを統計学的に推察せよ。
遺伝子型 | A | T | G |
A | 57 | 78 | 45 |
T | – | 28 | 30 |
G | – | – | 12 |
まず遺伝子頻度を求める。
遺伝子型 | A | T | G |
A | 57 (56.169) | 78 (77.736) | 45 (46.962) |
T | – | 28 (26.896) | 30 (32.472) |
G | – | – | 12 (9.801) |
【ポイント】
遺伝子頻度の計算は頻出なので必ずできるようにしておくこと。特に、間違えやすいのは遺伝子型がAAの時、遺伝子Aの乗っているアレルは2本あるので、Aの遺伝子頻度は ×2 を忘れないこと。
(補足)
今回の問題は日本人全体からサンプルを抽出したが、これがもし仮にある小さな村5000人をサンプルにした場合、ハーディーワインバーグの法則は成立しなくなる。これは、ハーディーワインバーグ成立条件の一つである「遺伝的浮動が起こらない」という条件を満たしていないからである。母集団の構成数が少ないため、遺伝的浮動の効果が大きくなってしまう。
ハーディーワインバーグの法則についてはコチラ↓
スポンサーリンク