【統計学】母平均の区間推定 その2 (母分散未知の場合)

医学部学士編入

合格くん
合格くん

こんにちは!合格です〜!!

ここでは、母平均の区間推定について、母分散が未知の場合を学んでいくよ!

別の記事で母分散が既知の場合を学習したけど、それが理解できていれば、もうやることは簡単なんだ!

かえる
かえる

この分野も医学部学士編入試験で出たりするんだケロな〜。

合格くん
合格くん

そうだね!

母分散が既知の場合と合わせて、しっかり練習しておこう!

母平均の区間推定 復習

合格くん
合格くん

母分散が既知の場合の、母平均の区間推定についての復習をしておくね!

かえるくんはポイントが何だったか覚えているかな?

 

かえる
かえる

ポイントは、母集団が正規分布か否かで解答の書き方が異なるということだったケロ。

合格くん
合格くん

そうだったね!

結果的には、標本平均が同じ分布へ従う!と考えるんだけど、元の分布が正規分布か否かで、途中の流れが変わってくるんだったね!!

下にまとめを貼っておくので確認してね!

【統計学】母平均の区間推定 その1 (母分散既知の場合)
合格くん こんにちは!合格...

 

合格くん
合格くん

復習ができていたら、実際に母分散が未知のときを見て行こう!

母分散が未知の場合

ある母集団から標本を取ってくるとき、基本的にはその母集団の分散はわからないはずです。そのため、この母分散未知の場合の区間推定が実用的ですし、毎日の生活の中で使うことができます。

母集団の分散がわからないとき、標本の不偏分散は標本データから計算することができます。

不偏分散の期待値を計算すると母分散に等しくなるため、不偏分散を母分散の近似値 ( 推定量 ) として用いれば良いことになります。すなわち、標本平均 \(\overline{x}\) が \(N(μ , \frac{σ^2}{n})\) に従うとき、標準化変数は \(Z = \frac{\overline{x}-μ}{\sqrt{\frac{σ^2}{n}}}\) としましたが、今はこの σ² が未知であるため、不偏分散 u² を近似値 (推定量) として代入します。すると標準化変数は以下のようになります。

$$\quad  T = \frac{\overline{x}-μ}{\sqrt{\frac{u^2}{n}}} $$

この標準化変数 T は、

  • n が小さい場合           :自由度 n – 1 の t 分布に従う。
  • n が大きい場合 (約 n ≥ 20 ):N( 0, 1 )の標準正規分布に従う。

ということがわかっています。

 

つまり、

標本数が小さい場合は母分散 σ² を不偏分散 u² で近似すると誤差が無視できないため、t 分布を使う必要が出てきてしまうということです。

標本数が大きい場合は標準正規分布と t 分布 のグラフの形はほぼ一致するため、約 20 以上の標本では、自由度 n – 1 の t 分布、もしくは標準正規分布のどちらを用いても良いということです。

 

かえる
かえる

てか t 分布ってなんだケロ?

あと、近似値だかなんだか知らないけど、母分散σ² の代わりに不偏分散 u² を代入しちゃって本当に数学的に正しいんだケロか?

合格くん
合格くん

確かに、単に代入しただけだと怪しいよね笑

でも、不偏分散 u² を代入することで、新しく出てきた標準化変数 T は、数学的な議論によって標準正規分布にではなく、自由度 n – 1 の t 分布に従うことが示されているんだ!

かえる
かえる

その議論が正直気になるケロ。

合格くん
合格くん

この議論を勉強してもいいんだけど、正直複雑でかつ大学レベルの数学の知識が必要なんだ。よって、この議論が医学部学士編入試験に出題されることはなくて、その事実を知っていて使えるということが、統計学の試験では重要なんだ。

かえる
かえる

釈然としないけど、わかったケロ。

まぁ、ここでその勉強をし始めちゃう受験生は合格しないタイプだケロな。

合格くん
合格くん

上記の標準化変数が 自由度 n – 1 の t 分布に従うってことを数学的に勉強したい受験生は、下の参考書をオススメするよ!実際僕もこれで勉強したからね笑

 

スバラシク実力がつくと評判の統計学キャンパス・ゼミ―大学の数学がこんなに分かる!単位なんて楽に取れる!

 

でも、医学部学士編入試験にはほぼ 100 % この議論は出ないので、参考程度に眺めるくらいにした方がいいよ!他に生命科学をやった方がいいね笑

因みに復習ですが、
  • 標本平均 \(\overline{X}\) ( n で割ったもの)     の期待値は母集団の期待値と一致する → 正しい  ○
  • 標本分散 σ² ( nで割ったもの )     の期待値は母集団の分散と一致する     → 間違い ×
  • 不偏分散 u² ( n-1 で割ったもの ) の期待値は母集団の分散と一致する    → 正しい  ○

上記のことが理解できていない人は、以下の記事を参照してください↓

【統計学】母集団の点推定 不偏分散 解説編
ここでは、母集団の点推定の分野を扱います。今回は解説編ですの...
【統計学】標本平均が母平均の不偏推定量、不偏分散が母分散の不偏推定量であることの証明をわかりやすく解説!
不偏推定量に関しての理解は、教科書の文章を読むだけでは恐らく...

 

スチューデント t 分布について

  • 具体的な関数は省略 。(ググれば出てきますが、複雑で覚える必要なし)
  • 確率密度関数の形は、正規分布と似ている。
  • 自由度 n – 1 が増加するにつれて、グラフは標準正規分布 N ( 0, 1 ) に近づく。( n → ∞で完全一致)
  • 自由度は ν( ニュー ) で表され、ν= n – 1 と表記される。
  • 自由度とは、独立なパラメータの個数を表している。
  • 自由度 νの t 分布の上側 100 α % 点は、t ( ν, α ) もしくは t ν(α) で表される。
  • 正規母集団の仮定が必須である ( 標本は正規母集団からとって来なくてはならない! )

 

解法の流れ

実際にやっていることは、母分散既知の場合とほぼ同じなのですが、母分散が未知の場合は、代わりに不偏分散 u² を使用して標準化変数を求めます。次に、標本数 n から自由度 n – 1 を考え、指定された信頼区間から t n-1 (α/2) の値を表から探します。そして、信頼区間に標準化変数が存在する確率として、母平均の信頼区間を求めることができます。

 

合格くん
合格くん

それじゃあ実際の問題を解いてみよう!

演習問題 正規母集団 母分散未知

【問題】

ある正規母集団から 4 つの標本を得たとき、その標本平均は 162、標本分散は 31.5、不偏分散は 42 であった。この母集団は母平均、母分散ともに未知である。このとき母平均 μ の 95 % 信頼区間を求めよ。必要であれば、t 分布表を用いよ。http://igakubugakushi.com/t-distribution

 

 

【解答】

正規母集団かつ、母分散未知の場合は t 分布を用いて母平均の区間推定を行う。

 

t 分布表の見方と上側 %点について

t 分布表の見方と上側 2.5 % 点については、以下の記事を参照してください。

t 分布表と見方
t 分布表 例 例えば、サン...

 

注意

t 分布を使う場合、母集団は正規分布であることを仮定しなくてはなりません。ですので、試験問題に関して、母分散未知の母平均の推定の場合は、『母集団は正規分布』と書いてあります。

 

まとめ

合格くん
合格くん

どうだったかな?

今回も丁寧に説明したつもりだけど、理解できたかな?

かえる
かえる

要はこうゆうことだケロな?

合格くん
合格くん

そうだね!!

しつこいかもしれないけど、使用する分布は、

  • 母分散既知の場合は標準正規分布 N ( 0, 1 )
  • 母分散未知の場合は自由度 n – 1の t 分布

だね!

【統計学】母平均の区間推定 その1 (母分散既知の場合)
合格くん こんにちは!合格...
【統計学】中心極限定理 をわかりやすく解説! その1 (解説編)
統計学を学ぶ時、この中心極限定理の理解が一つの大きなポイント...
【統計学】中心極限定理をわかりやすく解説! その2 (実践編)
合格くん こんにちは!合格...

 

統計学 参考書

以下に、統計学を学ぶ上で参考になった教材をいくつか挙げておきます。

独習 統計学24講: 医療データの見方・使い方

式での計算過程は少し足りないと思いますが、文章で丁寧に説明されており理解が進みました。

 

スバラシク実力がつくと評判の統計学キャンパス・ゼミ―大学の数学がこんなに分かる!単位なんて楽に取れる!

計算でゴリゴリ証明してくれているので、根底から理解できます。

 

統計学入門 (基礎統計学Ⅰ)

東京医科歯科大学の教養時代はこの教科書を用いて勉強していました。