【統計学】母平均の区間推定 その1 (母分散既知の場合)

医学部学士編入

合格くん
合格くん

こんにちは!合格です〜!!ここでは、母平均の区間推定を学んでいくよ!これまで学んできた、標準化変数や、期待値、分散の計算の知識を総動員することで、ようやく理解できる分野なので、まだ知識があやふやな人は、他の記事を参考にしてみてね!!

かえる
かえる

この分野は何気に医学部学士編入試験で出たりするんだケロな〜。

合格くん
合格くん

そうだね!でも、解き方を知ってさえいれば瞬殺できる分野なので、しっかり学習しておくことをオススメするよ!!

区間推定とは?

合格くん
合格くん

まず区間推定について説明すると、『母数θの値をズバリ一つの値で推定するのではなく、母数θが存在する区間を推定する』ってことなんだ!

 

かえる
かえる

要は、誤差を含めて推定するんだケロな。

合格くん
合格くん

具体的には、

 

母数θが 区間[θ1, θ2に含まれる 確率が 100(1-α)%

 

というように推定するんだ。

かえる
かえる

表現がわかりづらいケロ。

合格くん
合格くん

そうだね笑

ただ、これは慣れるしかしょうがない笑!

 

区間 のことを信頼区間

確率 1-α のことを信頼度 (信頼係数)

 

というんだよ。

かえる
かえる

この α は一体何なんだケロ?

合格くん
合格くん

この α は 有意水準 と呼ばれているんだ。

 

信頼度が 1-α なので、『信頼度 0.99 (99%)』であることは、『有意水準 0.01』であることを意味する。

 

この 有意水準 という言葉は、基本的には統計学の『検定』の分野の言葉であって、『推定』の分野では 1-α の信頼度を使うんだ。ちなみに、『検定』の分野では 1-α のことを 検出力 と言ったりりするので、注意が必要だよ!

かえる
かえる

わかりづらw

合格くん
合格くん

とにかくまとめると、

 

『母数 θ の 95% 信頼区間を推定せよ』

→ 『 1-α = 0.95 であり、有意水準α = 0.05』

 

 

『母数 θ を 99% 信頼区間で推定せよ』

→ 『 1-α = 0.99 であり、有意水準α = 0.01』

 

のように考えるとわかりやすいよ!

 

 

 

 

母集団は正規分布か非正規分布か?

母平均の区間推定に入る前に、注意するべきことがあります。

それは、母集団が正規分布であるのか正規分布ではないのか、ということです。この母集団が正規分布なのか否かによって、解法の進め方が異なってくるため注意が必要です。

 

母集団が正規分布である場合

正規母集団 \(N(μ, σ^2)\) から無作為に得た標本 \( x_1,x_2,…,x_n\) の総和は、正規分布 \(N(nμ, nσ^2)\) に従い、標本平均 \(\overline{x}\) は \(N(μ , \frac{σ^2}{n})\) に従うことが言えます。(後述する正規分布の再生性による)

$$\quad X_1 〜 N(μ , σ^2) $$

$$\quad ・・・$$

$$\quad X_n 〜 N(μ , σ^2) $$

であり、これらの総和は 正規分布の再生性 より(後述)

$$\quad x_1+ \cdots + x_n 〜 N(nμ , nσ^2) $$

となる。そして、この標本平均を考えると、

$$\quad \overline{x} 〜 N(μ , \frac{σ^2}{n}) $$

そして、この標本平均の標準化変数 \(Z = \frac{\overline{x}-μ}{\sqrt{\frac{σ^2}{n}}}\) を考えると、これは標準正規分布 \(N(0,1)\) に従う為、標準正規分布の表を使用することができるのです。

$$\quad  Z = \frac{\overline{x}-μ}{\sqrt{\frac{σ^2}{n}}} 〜 N (0,1)$$

 

※補足

後述しますが、母集団の母分散が既知である場合は、このままで良いのですが、母分散が未知である場合は更に、σ² ではなく母分散の推定量である不偏分散 u² を用いることになります。

不偏分散については以下の記事を参照してください↓

【統計学】母集団の点推定 不偏分散 解説編
ここでは、母集団の点推定の分野を扱います。今回は解説編ですの...

つまり、標準化変数

$$Z = \frac{\overline{x}-μ}{\sqrt{\frac{u^2}{n}}}$$ を考えて t 分布の表を使用することができるのです。母平均の区間推定 (母分散未知) については以下の記事を参考にしてください↓

【統計学】母平均の区間推定 その2 (母分散未知の場合)
合格くん こんにちは!合格...

 

母集団が正規分布ではない場合

母集団が正規分布ではない場合は、正規分布の再生性を用いることができませ正規分布の性質を用いて、標本平均が正規分布に従う、とは言えなくなってしまいます。つまり、

$$\quad \overline{x} 〜 N(μ, \frac{σ^2}{n})$$

が言えないのです。しかし、ここで役に立ってくるのが中心極限定理です。

 

中心極限定理を用いる際の注意点は、各標本について

  • 同一の分布から取ってきた
  • 標本が互いに独立である
  • 標本サイズが十分に大きい

上記の3つ揃うこと

が条件でしたが、それらが全て満たされているとき、

非正規母集団 \(N(μ, σ^2)\) から無作為に得た標本 \( x_1,x_2,…,x_n\) の総和は、n が十分に大きければ、近似的に正規分布 \(N(nμ, nσ^2)\) に従い、標本平均である \(\overline{x}\) は近似的に \(N(μ , \frac{σ^2}{n})\) に従うことが言えます。(中心極限定理による) つまり、

$$\quad X_1 〜 N(μ , σ^2) $$

$$\quad ・・・$$

$$\quad X_n 〜 N(μ , σ^2) $$

であり、これらの総和は n が十分大きいとき、中心極限定理 より

$$\quad x_1+ \cdots + x_n 〜 N(nμ , nσ^2) $$

となる。そして、この標本平均を考えると、

$$\quad \overline{x} 〜 N(μ , \frac{σ^2}{n}) $$

となる。以下にまとめます。

まとめ

以上から、母集団が正規分布であっても、そうでなくても(nが十分に大きいならば)、標本平均を正規分布に従うとして問題を解いていくことができるわけです。

正規分布の再生性について

この『母集団が正規分布であるとき、正規母集団 \(N(μ, σ^2)\) から無作為に得た標本 \( x_1,x_2,…,x_n\) の総和は、正規分布 \(N(nμ, nσ^2)\) に従い、標本平均である\(\overline{x}\) は \(N(μ, \frac{σ^2}{n})\) に従うことが言える』というのは、『正規分布の再生性』と呼ばれており、数学的な証明を要しますが、その証明はここでは割愛します。以下の参考書に詳細な証明がなされています。

 

スバラシク実力がつくと評判の統計学キャンパス・ゼミ―大学の数学がこんなに分かる!単位なんて楽に取れる!

医学部学士編入や統計学検定の受験レベルでは、そこまでの証明は求められません。覚えておくべきことは、

『同一の正規母集団 \(N(μ, σ^2)\) から無作為に得た標本は、互いに独立な標本であり、それら\( x_1,x_2,…,x_n\) の総和は、正規分布 \(N(nμ, nσ^2)\) に従う。そして、それらの標本平均である \(\overline{x}\) は \(N(μ, \frac{σ^2}{n})\) に従う』

と覚えておけば良いでしょう。もちろん、当然ですがこの \(nμ, nσ^2\) などの数値は暗記では無く、毎回必ず計算で求めるようにしてください。不要な暗記はケアレスミスにつながります。計算方法についての復習は以下の記事を参照してください。

【統計学】期待値 分散の公式 〜離散型と連続型における公式をわかりやすく証明〜
合格くん こんにちは!合格...

 

では、以上を踏まえて、母平均の区間推定に関する問題を実際に解いていきましょう。

問題1 正規母集団 母分散既知

【問題1】

母分散 100 (既知)である 正規母集団 から、大きさ n = 25 の標本を抽出し、標本平均 60 を得た。母平均 μ の 95% 信頼区間を求めよ。ただし、z(0.025) = 1.96 であるとする。z(α) は標準正規分布における上側α点を表す。(東京医科歯科大学 改題)

 

【解答】

上側α点について

この問題で出てきた上側α点については、意味を知っていれさえいれば簡単です。

上の図にあるように、『標準正規分布において Z(α) より上側の面積が α になる Z の値』を意味しています。上記の問題では、片端の面積が 0.025 になるような Z の値であるから上側0.025点 であり、その値は Z(0.025) は 1.96 と与えられています。

 

 

問題2 非正規母集団 母分散既知

【問題2】

母分散 100 (既知)である 非正規母集団 から、大きさ n = 25 の標本を抽出し、標本平均 60 を得た。母平均 μ の 95% 信頼区間を求めよ。ただし、z(0.025) = 1.96 であるとする。z(α) は標準正規分布における上側α点を表す。(東京医科歯科大学 改題)

 

【解答】

これ以降の解答は問題 1 と同じであり、答えも同じになります。しかし、注意するべきは、解答途中での議論です。母集団が正規分布ではないため、中心極限定理を用いていることを書かなければ、答えが合っていても 0 点になってしまいます。

 

ちなみに、中心極限定理を用いる際の 3 条件がしっかり満たされていることを確認してください。

『同一の分布から標本を取ってきていること』→ これは OK

『各標本が互いに独立であること』は今回は明記されていないが、無作為に抽出していると判断して、互いに独立であると判断する。

『標本数が十分に大きいこと』→ 25 もあれば OK と判断する。

母平均の区間推定(母分散既知)の解法

ここで、解答を一般化して載せておきます。

 

この流れが頭に入っていれば、確実に得点できると思います。

まとめ

合格くん
合格くん

どうだったかな?

丁寧に説明したつもりだけど、理解できたかな?

かえる
かえる

問題 1 と 2 の違いを理解できたら、完璧だケロ。

合格くん
合格くん

そうだね!!

母集団が正規分布なのか、正規分布ではないのかで、解答の進め方が全く違ったんだね!

中心極限定理が如何に有用かについても、実感できたら嬉しいな!

 

【統計学】中心極限定理 をわかりやすく解説! その1 (解説編)
統計学を学ぶ時、この中心極限定理の理解が一つの大きなポイント...
【統計学】中心極限定理をわかりやすく解説! その2 (実践編)
合格くん こんにちは!合格...

 

 

統計学 参考書

以下に、統計学を学ぶ上で参考になった教材をいくつか挙げておきます。

独習 統計学24講: 医療データの見方・使い方

式での計算過程は少し足りないと思いますが、文章で丁寧に説明されており理解が進みました。

 

スバラシク実力がつくと評判の統計学キャンパス・ゼミ―大学の数学がこんなに分かる!単位なんて楽に取れる!

計算でゴリゴリ証明してくれているので、根底から理解できます。

 

統計学入門 (基礎統計学Ⅰ)

東京医科歯科大学の教養時代はこの教科書を用いて勉強していました。