【統計学】母平均の検定をわかりやすく解説!!
スポンサーリンク
ここでは『検定』の分野を解説しています。『 検定 』の分野を苦手としている受験生は多いと思いますが、正直この分野は、これまでの区間推定の知識や議論がそのまま使えます。ここまでの理解が怪しい人は、別記事もあわせて参考にしてください。

母平均の検定とは?

統計学における検定とは、まず初めに帰無仮説 H0 というものを立て、この帰無仮説が正しいとして、議論を進めて矛盾を導き出す、という手順を踏みます。この方法を数学的に背理法といいます。簡単に言いますと『矛盾が生じちゃうってことは、仮説が間違いだったね!はい、チャンチャン!』という流れで仮説を否定するときに使います。ポイントを先に言ってしまうと、解法の手順の途中までは、区間推定でやったのと全く同じ手順となります。具体的には標準化変数を出すところまでは一緒です。

 

しかし、検定の場合は『標準化変数』ではなく、『検定統計量』と名前が変わることに注意してください。 この検定統計量を求めた後に、

 

① 帰無仮説 H0 を立てる

② 帰無仮説 H0 の仮定した値を代入して計算する

③ 検定統計量が棄却域の内か外かを調べる

 

要はこの 3 つをさらに実行するだけとなります。

母平均の検定 解法手順 の前に

母平均の区間推定の解放手順を復習しておきましょう。まず母分散既知なのか、母分散未知なのかで、解答の方針が変わるということでした。

【母分散既知の場合】

【母分散未知の場合】

上記の二つの流れが頭に入っていない場合は、検定の分野は理解できません。逆に、完全にこの二つの流れが頭に入っていれば、検定の分野は簡単です。

 

母平均の検定では μ を帰無仮説として仮定する

母平均の検定を行う場合は、区間推定を考えるときには、標準化変数 (検定統計量 ) を求めるところまでは同様の議論で進めていきます。上の場合では、母分散既知の場合は、標準化変数 (検定統計量) Z を求めるところまで、母分散未知の場合は、標準化変数 (検定統計量) T を求めるところまで計算を進めます。

 

そして、ここからが区間推定との違いです。ここで帰無仮説を立てます。

帰無仮説 H0:μ = μ0

すると、対立仮説が立ちます。

対立仮説 H1:μ ≠ μ0 (両側検定の場合)

対立仮説 H1:μ < μ0 (片側検定の場合) または μ > μ0 (片側検定の場合)

この片側検定については後述しますが、原則的には検定は両側検定で行うと覚えておいてください。そして、この帰無仮説を仮定 ( 仮に正しい ) としたので、この値を用いることができ、検定統計量の式の μ に μ0 を代入し計算した値が、棄却域に入っていれば帰無仮説は棄却されます。

 

母平均の検定 解法手順 まとめ

色が付いた領域に検定統計量が入っていることが『 棄却 』を意味します。帰無仮説が正しくないということになり、その仮定が否定されるというわけです。

 

母分散既知であれば ( 左上 )、検定統計量は Z であり、標準正規分布を用いて  Z の値が棄却域に入っているか否かを計算します。

母分散未知であれば ( 右上 )、検定統計量は T であり、自由度 n - 1の t 分布を用いて、 T の値が棄却域に入っているか否かを計算します。

色がついている所に検定統計量が入るとはどういう意味か?

例えば、有意水準 α = 0.05 ( 信頼区間 95 % ) で考えると、両端の面積が確率 5 % となることを意味しているので、片方の右端の面積は 2.5 % になります。検定統計量がこの上側 2.5 % 点以上の大きな値になるということ (もしくは 下側 2.5 % 点以下の小さな値になるということ)は、『それが実現する確率が 2.5 % 以下であること』を意味しています。

起こる確率 (可能性) が 2.5 % 以下であるなら、『 まず起こらない 』と考えて『 棄却 』と考える、ということです。その為、『 棄却域 』と呼ばれています。

 

解法の手順まとめ

【解法の手順】

① 母平均の区間推定と同じ手順で検定統計量 ( 標準化変数 Z か T )  を計算する。

② 帰無仮説 H0 を仮定し、有意水準を定める。

③ 帰無仮説の値を検定統計量に代入計算し、棄却域に入るか否かを調べる。

④ 棄却域に入れば、H0 を棄却して対立仮説 H1 を採用し、棄却域に入らなければ H0 を採用する。

 

ここで一つ注意があります。もし仮に帰無仮説 H0 が棄却できなかったとき、一応 H0 を『採択する』と呼びますが、必ずしもこの『 帰無仮説 H0 が正しい』というわけではないことに注意しましょう。

 

背理法で矛盾を導こうと思ったけど、『今回はダメだった。。』 くらいの感じである為、『 H0 が間違いとはいえない』くらいのニュアンスになります。

問題1

副甲状腺機能低下症の患者における、血清カルシウムの平均値 μ を有意水準 α = 0.05 で検定したい。標本サイズ n = 16 人であり、標本平均は 7.4 mg/dl とする。健常者の場合、平均は 9.8 mg/dl であり、母分散は 0.5 mg/dl (既知)であり、検定対象は正規母集団であるとする。( 東京医科歯科大 改 )

解答

① n ( n = 16 とおく) 番目の副甲状腺機能低下症患者の血清カルシウム値を 確率変数 \(X_n\) のように書くとすると、各確率変数は期待値 μ ( 母平均 )、母分散 σ² ( 標準偏差σ = 0.5 とおく ) の正規分布に従う。

$$X_n \sim  N( μ , σ^2)$$

であり、その確率変数の総和を考えると、正規分布の性質 ( 正規分布の再生性 ) から

$$X_1+\cdots+X_{n} \sim N( nμ, nσ^2)$$

であるから、標本平均は期待値 μ 、分散 \(\frac{σ^2}{n}\) の正規分布に従う。

$$\frac{X_1+\cdots+X_{n}}{n} \sim  N \bigl(μ, \frac{σ^2}{n}\bigr)$$

従って、標準化変数を考えると

$$Z = \frac{\overline{x} - μ}{\sqrt{\frac{σ^2}{n}} } \sim  N(0, 1)$$

となる。

 

② 次に、

帰無仮説 H0: μ = μ0 = 9.8 mg/dl ( 健常者と同じ )

対立仮説 H1: μ ≠ μ0 = 9.8 mg/dl ( 健常者と異なる )

のように仮定し、有意水準 α = 0.05 で両側検定を行うとする。

 

③ 帰無仮説の仮定より、検定統計量を計算すると

④ 検定統計量は、棄却域に含まれるため、( これが実現する確率は、2.5 % 以下であるため ) 帰無仮説は棄却される。対象患者の血清カルシウム値の標本平均は 7.4 であり、健常者の 9.8 とは数値の上ではことなるが、確率的にもこれらの値が等しいとは言えない。( 等しいと言える確率は、2.5 % 以下 )

 

問題2

問題 1 において、標本平均 \(\overline{x}\) を統計検定量としたときの、\(\overline{x}\) の棄却域を求めよ。( 東京医科歯科大 改 )

解答

標本平均 \(\overline{x}\) が与えられていないと考えて、下側 2.5 % 点と 上側 2.5 % 点の間に検定統計量が存在するような、標本平均が存在すると仮定すると、

 

問題 3

問題 1 において、母平均の 95 % 信頼区間を推定せよ ( 母平均 母分散既知の復習問題 )。そして、この信頼区間と問題 2 で得られた区間との関係性について述べよ。( 東京医科歯科大 改 )

 

解答

問題 2 と問題 3 の式変形を見比べてみると、標準誤差の部分である \(z(0.025)\sqrt{\frac{σ^2}{n}}\) の部分は共通しており、両側検定の場合、μ0 が母平均の 95 % 信頼区間に存在することは、標本平均の実現値が採択域に存在することと同値であることがわかる。

 

問題 4

副甲状腺機能低下症の患者における、血清カルシウムの平均値 μ を有意水準 α = 0.05 で検定したい。標本サイズ n = 16 人であり、標本平均は 7.4 mg/dl、母分散未知であり不偏分散は 0.5² であった。健常者の場合、平均は 9.8 mg/dl であり、検定対象は正規母集団であるとする。t 分布表は以下を参照にせよ。( 東京医科歯科大 改 )

解答

ここで注意なのは、母分散未知なので、t 分布を使うことになりますが、この時、正規母集団の仮定は必須となります。もちろん、試験問題には書いてあることがほとんどです。

① n ( n = 16 とおく)番目の副甲状腺機能低下症患者の血清カルシウム値を 確率変数 \(X_n\) のように書くとすると、母分散 σ² は未知であるが、不偏分散 u² ( u² = 0.5² とおく) は与えられており、各確率変数は期待値 μ ( 母平均 ) の正規分布に従う。

$$X_n \sim  N( μ , σ^2)$$

であり、その確率変数の総和を考えると、正規分布の性質 ( 正規分布の再生性 ) から

$$X_1+\cdots+X_{n}\sim N( nμ, nσ^2)$$

であるから、標本平均は期待値 μ 、分散 \(\frac{σ^2}{n}\) の正規分布に従う。

$$\frac{X_1+\cdots+X_{n}}{n} \sim  N \bigl(μ, \frac{σ^2}{n}\bigr)$$

そして、母分散未知である今回は不偏分散 u² を利用し、自由度 n - 1 の t 分布を考え、検定統計量を計算すると、

$$T= \frac{\overline{x} - μ}{\sqrt{\frac{u^2}{n}} } \sim 自由度\,n - 1\,\,t 分布$$

となる。

 

② 次に、

帰無仮説 H0: μ = μ0 = 9.8 mg/dl ( 健常者と同じ )

対立仮説 H1: μ ≠ μ0 = 9.8 mg/dl ( 健常者と異なる )

のように仮定し、有意水準 α = 0.05 で両側検定を行うとする。

 

③ 帰無仮説の仮定より、検定統計量を計算すると

④ 検定統計量は、棄却域に含まれるため、( これが実現する確率は、2.5 % 以下であるため ) 帰無仮説は棄却される。対象患者の血清カルシウム値の標本平均は 7.4 であり、健常者の 9.8 とは数値の上ではことなるが、確率的にもこれらの値が等しいとは言えない。( 等しいと言える確率は、2.5 % 以下 )

 

片側検定について

片側検定を行う場合は注意が必要です。

注意その 1

母数 μ に対して、値が異なっており、確実に大きい場合 ( 右片側検定 ) かもしくは、確実に小さい場合 ( 左片側検定 ) は片側検定を行うことができる。

対立仮説 H1:μ < μ0 ( 片側検定の場合 ) または :μ > μ0 ( 片側検定の場合 )

 

検定を行う場合は、原則的には両側検定である。明確な根拠が示されている場合のみ、片側検定を行うことができるということに注意。

注意その 2

片側検定を有意水準を α = 0.05 で行う場合、右側 ( 上側%点 ) もしくは左側 ( 下側%点 ) の % 点 は z( α ) を用いるため、棄却域が片側に広くなることに注意してください。z ( α/2 ) ではないことに注意!

 

まとめ

いかがだったでしょうか。実際に区間推定の知識があれば、簡単であると思います。実際の試験問題では、数パターンの問題しか出題されないので、しっかり復習して必ず得点できるようにしておきましょう。

 

 

日本統計学会公式認定 統計検定 2級 公式問題集[2016〜2018年]


統計学検定問題集は結構使えます。レベル的には 2 級の問題集が、医学部学士編入試験としてはあっていると思います。

 

統計学がわかる (ファーストブック)

主人公がハンバーガーショップのバイトをしながら、身近な例を用いて統計学を学んで行きます。

 

統計学入門 (基礎統計学Ⅰ)

東京医科歯科大学の教養時代はこの教科書をもちいて勉強していました。

 

 

 

 

おすすめの記事