
適合度検定について
適合度検定の基本事項については、以下の記事を参照してください。
問題1
サイコロを 210 回振るとする。出た目がそれぞれ、1 の目 25 回、2 の目 30 回、3 の目 35 回、4 の目 40 回、5 の目 35 回、6 の目 45 回出たとする。このサイコロは歪んでいるといえるか? 必要があれば、下のカイ二乗分布表を用いて良い。
【 カイ二乗分布表 】
帰無仮説:H0 = 「 サイコロの出目に差はない 」( サイコロは歪んでいない )
出目 | O 観測度数 | 期待確率 | E 期待度数 | O - E | ( O - E ) 2 | ( O - E ) 2/E |
1 | 25 | 1/6 | ||||
2 | 30 | 1/6 | ||||
3 | 35 | 1/6 | ||||
4 | 40 | 1/6 | ||||
5 | 35 | 1/6 | ||||
6 | 45 | 1/6 |
出目 | O 観測度数 | 期待確率 | E 期待度数 | O - E | ( O - E ) 2 | ( O - E ) 2/E |
1 | 25 | 1/6 | 35 (=210/6) | -10 | 100 | 100/35 |
2 | 30 | 1/6 | 35 (=210/6) | -5 | 25 | 25/35 |
3 | 35 | 1/6 | 35 (=210/6) | 0 | 0 | 0/35 |
4 | 40 | 1/6 | 35 (=210/6) | 5 | 25 | 25/35 |
5 | 35 | 1/6 | 35 (=210/6) | 0 | 0 | 0/35 |
6 | 45 | 1/6 | 35 (=210/6) | 10 | 100 | 100/35 |
問題2
問題1はサイコロの歪みが無い、という結論になった。( 確かに出目も均等っぽいのでそうかも ) 次は、出目を少し変えてみて歪んだサイコロであると結論付ける問題を解いてみましょう。
問題1で出目を 1 の目 55 回、2 の目 10 回、3 の目 25 回、4 の目 20 回、5 の目 35 回、6 の目 65 回出たとする。このサイコロは歪んでいるといえるか?必要があれば、下のカイ二乗分布表を用いて良い。
【 カイ二乗分布表 】
問題1と比べて変化した値を赤数字にしてある。
出目 | O 観測度数 | 期待確率 | E 期待度数 | O - E | ( O - E ) 2 | ( O - E ) 2/E |
1 | 55 | 1/6 | 35 (=210/6) | 20 | 400 | 400/35 |
2 | 10 | 1/6 | 35 (=210/6) | -25 | 625 | 625/35 |
3 | 25 | 1/6 | 35 (=210/6) | -10 | 100 | 100/35 |
4 | 20 | 1/6 | 35 (=210/6) | -15 | 625 | 625/35 |
5 | 35 | 1/6 | 35 (=210/6) | 0 | 0 | 0/35 |
6 | 65 | 1/6 | 35 (=210/6) | 30 | 900 | 900/35 |
χ02 を計算すると、
Σ (O - E)^2/E = (400+625+100+625+0+900)/35 = 2650/35 = 75.714... >11.07 ( 自由度 5、有意水準 0.05 )
この場合、検定量 χ2 値が 11.07 を上回っており棄却域に存在する。つまり、この仮説が起こる確率は 5 % より小さいことがわかる。よって、この仮説が起こることはほとんど無くて正しくは無い、と結論付ける。対立仮説 H1 が採用され、
対立仮説 :H1 = 「 サイコロに歪みは無いとはいえない 」
となる。
問題3
無作為に 300 人標本を選んだつもりであったが、男女比が 3 : 7 となっていた。これは無作為に標本を選んだといえるか? 必要があれば、下のカイ二乗分布表を用いて良い。
【 カイ二乗分布表 】
( 頻出問題 )
帰無仮説:H0 = 「 標本の男女比に差は無い 」
標本 | O 観測度数 | 期待確率 | E 期待度数 | O - E | ( O - E ) 2 | ( O - E ) 2/E |
男 | 90 | 1/2 | 150 (300/2) | -60 | 360 | 360/150 |
女 | 210 | 1/2 | 150 (300/2) | 60 | 360 | 360/150 |
問題4
日本人の ABO 式血液型の分布は、A 型 40 %,O 型 30 %,B 型 20 %, AB 型 10 %とされている。ある町で 200 人の献血を行ったところA 型 45 %,O 型 15 %,B 型 2 5%,AB 型 15 %データを得た。この町の住人の血液型分布は,日本人全体の血液型分布とほぼ同じと見なしてよいか? 必要があれば、下のカイ二乗分布表を用いて良い。
【 カイ二乗分布表 】
( 頻出問題 )
帰無仮説:H0 = 「 標本のABO比と日本人全体のそれに差は無い 」
血液型 | O 観測度数 | 期待確率 | E 期待度数 | O - E | ( O - E ) 2 | ( O - E ) 2/E |
A 型 | 90 | 4/10 | 80 (200×4/10) | 10 | 100 | 100/80 |
O 型 | 30 | 3/10 | 60 (200×4/10) | -30 | 900 | 900/60 |
B 型 | 50 | 2/10 | 40 (200×4/10) | 10 | 100 | 100/40 |
AB 型 | 30 | 1/10 | 20 (200×4/10) | 10 | 100 | 100/20 |
問題5
学生 A はこれまでの模擬単語テストでは、10 問のうち 7 問程度の正解率であったが、粉骨砕身猛烈な試験勉強の末に、今回の本番の単語テストでは、100 問のうち 85 問の正解率であった。このことから学生 A の実力が上がったと判断して良いか? 必要があれば、下のカイ二乗分布表を用いて良い。
【 カイ二乗分布表 】
( 秋田大 改 )
正解と不正解の数を問題 3 の「男女」比のように扱ってゆくと解ける。項目数は 2 なので自由度は 1
帰無仮説:H0 = 「 試験前後の学生 A の学力に差は無い 」
標本 | O 観測度数 | 期待確率 | E 期待度数 | O - E | ( O - E ) 2 | (O - E) 2/E |
正解 | 85 | 7/10 | 70 (100×7/10) | 15 | 225 | 225/70 |
不正解 | 15 | 3/10 | 30 (100×3/10) | -15 | 225 | 225/30 |
(補足1)
因みに秋田大学の問題では、模擬テストでは 3 問中 2 問正解していたが、本番では 8 問中 7 問正解した となっていた。この場合、上と同様の計算を行うと、χ02 = 1.5625 < 3.8415 ( 標準正規分布の有意水準 0.05 の基準値 1.960 を二乗したもの ) であるから、帰無仮説は棄却されない。つまり、成績は向上したとはいえない。
(補足2)
加えて、秋田大学の問題では、「 次回の模擬テストの問題でも、これと同程度以上の好成績を上げたとしたら成績が向上したと言えるか? 」という問題が続いていました。この場合、前回の模擬テストでの正解率 2/3 はそのままにして、「 本番では 16 問中 14 問正解した 」と考える。そのまま同様の計算を行うと、χ2= 3.125 < 3.8415 であるから、帰無仮説は棄却されない。つまり、成績が向上したとはいえない。
秋田大学の問題では、χ2 値の表が与えられていないため、本来であればカイ二乗検定ではなく、母比率の検定として解答するべきでした。しかし、上記のようにも解くことができます。原文では以下のような記載がありました。
『 判断基準が必要とされる場合には、危険率5%を用いること。また、標準正規分布に従う変量 z については、P(|z|> 2.576) = 0.01、P(|z|> 2.326) = 0.02、P(|z|> 1.960) = 0.05、P(|z|> 1.645) = 0.10、であることがわかっている 』
問題6
ある養鶏場でニワトリが産む卵の数を数えたところ月曜日 22 個、火曜日 30 個、水曜日 25 個、木曜日 29 個、金曜日 32 個、土曜日 33 個、日曜日 19 個であった。この養鶏場のニワトリは曜日によって産む卵の数に違いがあるといえるか?必要があれば、下のカイ二乗分布表を用いて良い。
【 カイ二乗分布表 】
帰無仮説:H0 = 「 養鶏場のニワトリは曜日によって産む卵の数に差は無い 」
曜日 | O 観測度数 | 期待確率 | E 期待度数 | O - E | ( O - E ) 2 | ( O - E ) 2/E |
月 | 22 | 1/7 | 27 (189×1/7) | -5 | 25 | 25/27 |
火 | 30 | 1/7 | 27 (189×1/7) | 3 | 9 | 9/27 |
水 | 25 | 1/7 | 27 (189×1/7) | -2 | 4 | 4/27 |
木 | 29 | 1/7 | 27 (189×1/7) | 2 | 4 | 4/27 |
金 | 32 | 1/7 | 27 (189×1/7) | 5 | 25 | 25/27 |
土 | 33 | 1/7 | 27 (189×1/7) | 6 | 36 | 36/27 |
日 | 18 | 1/7 | 27 (189×1/7) | -9 | 81 | 81/27 |
合計 | 189 | 194 | 194/27 |
問題7
エンドウマメの交配実験を行うと、メンデルの法則により「黄色・丸」「黄色・しわ」「緑色・丸」「緑色・しわ」の4種類の形質のマメが9:3:3:1の割合で現れることが分かっている。エンドウマメの交配実験を行った結果、上記の形質を持ったエンドウマメが 445:133:156:32の割合で出現した。この場合、メンデルの法則が成立しているかどうかについて、有意水準 5 % で検定せよ。必要があれば、下のカイ二乗分布表を用いて良い。
【 カイ二乗分布表 】
( 鹿児島大学 改 )
帰無仮説:H0 = 「 エンドウマメの形質は9:3:3:1である 」
形質 | O 観測度数 | 期待確率 | E 期待度数 | O - E | ( O - E ) 2 | ( O - E ) 2/E |
黄・丸 | 445 | 9/16 | 784×9/16 | 4 | 16 | 25/27 |
黄・しわ | 133 | 3/16 | 784×3/16 | -14 | 196 | 9/27 |
緑・丸 | 156 | 3/16 | 784×3/16 | 9 | 81 | 4/27 |
緑・しわ | 32 | 1/16 | 784×1/16 | -17 | 289 | 4/27 |
合計 | 784 |
問題8
ヒト常染色体上のメンデル遺伝様式を示す遺伝子 ABC には、A、T、G の3つの対立遺伝子が存在する。日本人250名から任意にサンプルを採取し、その遺伝子型を調べたところ、表1の結果を得た。この時、各遺伝子 A、T、G の遺伝子頻度はいくらか?また、これらの観測度数がハーディーワインバーグの法則が成立を仮定した場合の期待度数と適合しているかどうかを統計学的に推察せよ。 必要があれば、下のカイ二乗分布表を用いて良い。
遺伝子型 | A | T | G |
A | 57 | 78 | 45 |
T | - | 28 | 30 |
G | - | - | 12 |
【 カイ二乗分布表 】
( Wikipedia を参考に創作 )
まず遺伝子頻度を求める。
遺伝子型 | A | T | G |
A | 57 (56.169) | 78 (77.736) | 45 (46.962) |
T | - | 28 (26.896) | 30 (32.472) |
G | - | - | 12 (9.801) |
【ポイント】
遺伝子頻度の計算は頻出なので必ずできるようにしておくこと。特に、間違えやすいのは遺伝子型が AA の時、遺伝子 A の乗っているアレルは2本あるので、A の遺伝子頻度は × 2 を忘れないこと。
( 補足 )
今回の問題は日本人全体からサンプルを抽出したが、これがもし仮にある小さな村5000人をサンプルにした場合、ハーディーワインバーグの法則は成立しなくなる。これは、ハーディーワインバーグ成立条件の一つである「 遺伝的浮動が起こらない 」という条件を満たしていないからである。母集団の構成数が少ないため、遺伝的浮動の効果が大きくなってしまう。
ハーディーワインバーグの法則についてはコチラ↓