【統計学】母平均の区間推定 その2 (母分散未知の場合)
スポンサーリンク

ここでは、母平均の区間推定について、母分散が未知の場合を学んでいきましょう。

別の記事において、母分散が既知の場合を学習しましたが、それが理解できていれば、もうやることは簡単です。この分野も医学部学士編入試験で出題されますので、母分散が既知の場合と合わせて、しっかり練習しておきましょう。

母平均の区間推定 復習

母分散が既知の場合の、母平均の区間推定についての復習をしておきましょう。ポイントは、母集団が正規分布か否かで解答の書き方が異なるということでした。結果的には、『標本平均が同じ分布へ従う』と考えますが、元の分布が正規分布か否かで、途中の流れが変わってくることを思い出してください。

下にまとめを貼っておきます。

 

母分散が未知の場合

ある母集団から標本を取ってくるとき、基本的にはその母集団の分散はわからないはずです。そのため、この母分散未知の場合の区間推定が実用的ですし、毎日の生活の中で使うことができます。

母集団の分散がわからないとき、標本の不偏分散は標本データから計算することができます。

不偏分散の期待値を計算すると母分散に等しくなるため、不偏分散を母分散の近似値 ( 推定量 ) として用いれば良いことになります。すなわち、標本平均 \(\overline{x}\) が \(N(μ , \frac{σ^2}{n})\) に従うとき、標準化変数は \(Z = \frac{\overline{x}-μ}{\sqrt{\frac{σ^2}{n}}}\) としましたが、今はこの σ² が未知であるため、不偏分散 u² を近似値 (推定量) として代入します。すると標準化変数は以下のようになります。

$$\quad  T = \frac{\overline{x}-μ}{\sqrt{\frac{u^2}{n}}} $$

この標準化変数 T は、

  • n が小さい場合           :自由度 n - 1 の t 分布に従う。
  • n が大きい場合 (約 n ≥ 20 ):N( 0, 1 )の標準正規分布に従う。

ということがわかっています。

 

つまり、

標本数が小さい場合は母分散 σ² を不偏分散 u² で近似すると誤差が無視できないため、t 分布を使う必要が出てきてしまうということです。

標本数が大きい場合は標準正規分布と t 分布 のグラフの形はほぼ一致するため、約 20 以上の標本では、自由度 n - 1 の t 分布、もしくは標準正規分布のどちらを用いても良いということです。

 

 t 分布とは? 不偏分散を母分散の代わりに代入していいの?

 

近似値だかなんだか知らないが、母分散σ² の代わりに不偏分散 u² を代入しちゃって本当に数学的に正しいのか?

 

と考える人も多いと思います。しかし、不偏分散 u² を代入することで、新しく出てきた標準化変数 T は、数学的な議論によって標準正規分布にではなく、自由度 n - 1 の t 分布に従うことがしっかりと証明されています。

そうなってくると、その数学的な議論が気になる人も多いと思います。しかし、この議論は正直なところ複雑であり、かつ大学レベルの数学の知識が必要となってくる為、医学部学士編入試験に出題されることはありません。その事実を知っていて使えるということが、統計学の試験では重要です。

正直なところ釈然としないかも知れませんが、上記の『標準化変数が 自由度 n - 1 の t 分布に従う』ってことをどうしても数学的に勉強したい受験生は、以下の参考書に詳細が書かれていますので確認してみてください。

 

スバラシク実力がつくと評判の統計学キャンパス・ゼミ―大学の数学がこんなに分かる!単位なんて楽に取れる!

 

しかし、何度も言いますが、医学部学士編入試験にはほぼ 100 % この議論は出ないので、参考程度に眺めるくらいにした方が良いです。

因みに復習ですが、
  • 標本平均 \(\overline{X}\) ( n で割ったもの)     の期待値は母集団の期待値と一致する → 正しい  ○
  • 標本分散 σ² ( nで割ったもの )     の期待値は母集団の分散と一致する     → 間違い ×
  • 不偏分散 u² ( n-1 で割ったもの ) の期待値は母集団の分散と一致する    → 正しい  ○

上記のことが理解できていない人は、以下の記事を参照してください↓

 

スチューデント t 分布について

  • 具体的な関数は省略 。(ググれば出てきますが、複雑で覚える必要なし)
  • 確率密度関数の形は、正規分布と似ている。
  • 自由度 n - 1 が増加するにつれて、グラフは標準正規分布 N ( 0, 1 ) に近づく。( n → ∞で完全一致)
  • 自由度は ν( ニュー ) で表され、ν= n - 1 と表記される。
  • 自由度とは、独立なパラメータの個数を表している。
  • 自由度 νの t 分布の上側 100 α % 点は、t ( ν, α ) もしくは t ν(α) で表される。
  • 正規母集団の仮定が必須である ( 標本は正規母集団からとって来なくてはならない! )

 

解法の流れ

実際にやっていることは、母分散既知の場合とほぼ同じなのですが、母分散が未知の場合は、代わりに不偏分散 u² を使用して標準化変数を求めます。次に、標本数 n から自由度 n - 1 を考え、指定された信頼区間から t n-1 (α/2) の値を表から探します。そして、信頼区間に標準化変数が存在する確率として、母平均の信頼区間を求めることができます。

 

演習問題 正規母集団 母分散未知

【問題】

ある正規母集団から 4 つの標本を得たとき、その標本平均は 162、標本分散は 31.5、不偏分散は 42 であった。この母集団は母平均、母分散ともに未知である。このとき母平均 μ の 95 % 信頼区間を求めよ。必要であれば、t 分布表を用いよ。http://igakubugakushi.com/t-distribution

 

 

【解答】

正規母集団かつ、母分散未知の場合は t 分布を用いて母平均の区間推定を行う。

 

t 分布表の見方と上側 %点について

t 分布表の見方と上側 2.5 % 点については、以下の記事を参照してください。

 

注意

t 分布を使う場合、母集団は正規分布であることを仮定しなくてはなりません。ですので、試験問題に関して、母分散未知の母平均の推定の場合は、『母集団は正規分布』と書いてあります。

 

まとめ

まとめると上記のようになります。しつこいかもしれませんが、使用する分布は、

 

  • 母分散既知の場合は標準正規分布 N ( 0, 1 )
  • 母分散未知の場合は自由度 n - 1の t 分布

 

となります。

 

統計学 参考書

以下に、統計学を学ぶ上で参考になった教材をいくつか挙げておきます。

独習 統計学24講: 医療データの見方・使い方

式での計算過程は少し足りないと思いますが、文章で丁寧に説明されており理解が進みました。

 

スバラシク実力がつくと評判の統計学キャンパス・ゼミ―大学の数学がこんなに分かる!単位なんて楽に取れる!

計算でゴリゴリ証明してくれているので、根底から理解できます。

 

統計学入門 (基礎統計学Ⅰ)

東京医科歯科大学の教養時代はこの教科書を用いて勉強していました。

おすすめの記事