【統計学】二項分布 期待値と分散を直接計算する!

医学部学士編入

合格くん
合格くん

こんにちは!合格です!!

ここでは、二項分布の期待値と分散を直接計算する方法について解説するね!あ、二項分布についての基本知識は下の記事を参考にしてみてね!

【統計学】二項分布を基本からわかりやすく解説!期待値、分散の計算まで
ここでは、二項分布の知識について学んでいきます。二項分布はベ...
かえる
かえる

この証明は覚えた方が良いケロか?

合格くん
合格くん

二項分布の期待値や分散の証明は、医学部学士編入試験で問われる可能性は少ないけど、一般の医学部の2次試験で問われてもおかしくない内容なんだ!なので、知っておいて損はないよ!!

かえる
かえる

一般試験の医学部2次試験で出うる、と (カキコカキコ…)。

合格くん
合格くん

上の記事では二項分布の期待値や分散を、直接計算しないで証明しているよ!!確率変数を分解し、確率変数の和として計算しているんだ。そうすることによって一瞬にして証明は終わるんだけど、今回は離散型の確率変数の期待値と分散の定義に従って、直接計算して証明してみるね!!

【統計学】離散型確率変数と確率分布〜二項分布との違いについて〜
合格くん こんにちは!合格...
かえる
かえる

上等だケロ。

証明するもの

二項分布 \(B(n,p)\) に従う確率変数を \(X = x_k\,(k=1,2,\cdots,n)\) とおくと、期待値と分散は以下の通り\[
\left\{ \begin{array}{ll}
E[X]=np\\
V[X]=np(1-p)
\end{array} \right.
\]
合格くん
合格くん

証明したいのは、上の2つの公式だよね!離散型確率変数の記事で解説したけど、二項分布は離散型確率分布のうちの1つだったのは覚えているかな?

かえる
かえる

当然だケロ。要は離散型確率分布の期待値と分散の定義はこれだケロ?

 

合格くん
合格くん

その通りだね! そして、さらに二項分布は確率変数が、より具体的な値になっているんだったね!下の表で確認してみよう!

かえる
かえる

それに加えて、確率が

$$P(X=k)={}_n \mathrm{ C }_k\cdot p^k\cdot(1-p)^{n-k} $$

と分かっているケロ。

合格くん
合格くん

そのとおりだね!なので、

期待値 \(μ\)  $$E[X]=\sum_{k=1}^{n} k \cdot {}_n \mathrm{ C }_k\cdot p^k\cdot(1-p)^{n-k}$$
分散 \(σ^2\)  $$V[X]=\sum_{k=1}^{n} (k-μ)^2\cdot {}_n \mathrm{ C }_k\cdot p^k\cdot(1-p)^{n-k}$$
これらからスタートして証明をすればいいんだね!期待値や分散を計算すると k = 0 をもつ項は消えちゃうんだけど、一応 k を 0 以上の整数として証明していくね!!
かえる
かえる

今回はまじめに、手計算でしっかり確認してみるケロ。

二項分布の期待値公式の証明

合格くん
合格くん

それじゃあ、上の定義に従って計算してみるね!!

【二項分布の期待値公式の証明】
期待値の定義より、\[\small
\begin{align}
E[X] &=\sum_{ k = 0 }^{ n } k\cdot {}_n \mathrm{ C }_k\cdot p^k\cdot(1-p)^{n-k}\\
\end{align}
\]であるから、\[\small
\begin{align}
k\cdot {}_n \mathrm{ C }_k &= k\cdot\frac{ n! }{k!\cdot( n – k )! }\\
&=\frac{ n! }{(k-1)!\cdot( n – k )! }\\
&=n\cdot \frac{ (n-1)! }{(k-1)!\cdot \left\{( n-1 )-( k-1)\right\}! }\\
&=n\cdot {}_{n-1} \mathrm{ C }_{k-1}
\end{align}
\]となることに注意し、\(k=0\) では上式は定義されないので、\[\small
\begin{align}
E[X] &=\sum_{ k = 0 }^{ n } k\cdot {}_n \mathrm{ C }_k\cdot p^k\cdot(1-p)^{n-k}\\
&=\sum_{ k = 1 }^{ n } n\cdot {}_{n-1} \mathrm{ C }_{k-1}\cdot p^k\cdot(1-p)^{n-k}\\
&=np\cdot \sum_{ k = 1 }^{ n } {}_{n-1} \mathrm{ C }_{k-1}\cdot p^{k-1}\cdot(1-p)^{(n-1)-(k-1)}\\
&=np\left\{p+(1-p)\right\}^{n-1}\\
&=np
\end{align}
\]

よって示されたね!!

かえる
かえる

余裕だケロな。

$$k\cdot {}_n \mathrm{ C }_k = n\cdot {}_{n-1} \mathrm{ C }_{k-1}$$

の式変形と、二項展開を逆に用いることがポイントだケロな。

合格くん
合格くん

さすがかえる君だね!

それじゃあ、次は二項分布の分散公式について証明をやってみよう!定義式からゴリッゴリに計算してみるね!!

かえる
かえる

ゴリッゴリにいくケロ〜

二項分布の分散公式の証明 その1

合格くん
合格くん

つぎは、分散の公式を証明してみるね!!

【二項分布の分散公式の証明】
分散の定義より、\[\small
\begin{align}
V[X] &=\sum_{ k = 0 }^{ n } (k-μ)^2\cdot {}_n \mathrm{ C }_k\cdot p^k\cdot(1-p)^{n-k}\\
&=\sum_{ k = 0 }^{ n } (k^2-2kμ+μ^2)\cdot {}_n \mathrm{ C }_k\cdot p^k\cdot(1-p)^{n-k}\\
&=\sum_{ k = 0 }^{ n } k^2\cdot {}_n \mathrm{ C }_k\cdot p^k\cdot(1-p)^{n-k} -2μ\sum_{ k = 0 }^{ n } k\cdot {}_n \mathrm{ C }_k\cdot p^k\cdot(1-p)^{n-k}\\
&+μ^2\sum_{ k = 0 }^{ n } {}_n \mathrm{ C }_k\cdot p^k\cdot(1-p)^{n-k}\\
&=(*)
\end{align}
\]である。ここで 2 項目と 3 項目は以下のように変形できる。
$$\sum_{ k = 0 }^{ n } k\cdot {}_n \mathrm{ C }_k\cdot p^k\cdot(1-p)^{n-k}=μ=np$$$$\sum_{ k = 0 }^{ n } {}_n \mathrm{ C }_k\cdot p^k\cdot(1-p)^{n-k}=1^n=1$$であるから、\[\small
\begin{align}
(*) &=\sum_{ k = 0 }^{ n } k^2\cdot {}_n \mathrm{ C }_k\cdot p^k\cdot(1-p)^{n-k} -2μ\sum_{ k = 0 }^{ n } k\cdot {}_n \mathrm{ C }_k\cdot p^k\cdot(1-p)^{n-k}\\
&=\sum_{ k = 0 }^{ n } k^2\cdot {}_n \mathrm{ C }_k\cdot p^k\cdot(1-p)^{n-k} -2μ\cdot μ + μ^2\cdot 1\\
&=\sum_{ k = 0 }^{ n } k^2\cdot {}_n \mathrm{ C }_k\cdot p^k\cdot(1-p)^{n-k} -μ^2\\
&=(**)
\end{align}
\]となる。また、\(k \cdot {}_n \mathrm{ C }_k = n \cdot {}_{n-1} \mathrm{ C }_{k-1}\) が成り立つことと、k = 1 から n までの総和としても差し支えないことから、
\[\small
\begin{align}
(**)&=\sum_{ k = 0 }^{ n } k^2\cdot {}_n \mathrm{ C }_k\cdot p^k\cdot(1-p)^{n-k} -μ^2\\
&=\sum_{ k = 1 }^{ n } k\cdot k\cdot {}_n \mathrm{ C }_k\cdot p^k\cdot(1-p)^{n-k} -μ^2\\
&=\sum_{ k = 1 }^{ n } k\cdot n\cdot {}_{n-1} \mathrm{ C }_{k-1}\cdot p^k\cdot(1-p)^{n-k} -μ^2\\
&=\sum_{ k = 1 }^{ n } \{(k-1)+1\}\cdot n\cdot {}_{n-1} \mathrm{ C }_{k-1}\cdot p^k\cdot(1-p)^{n-k} -μ^2
\end{align}
\]となる。
ここで、\((k-1)+1\) で各項ごとに展開すると、以下のようになる。\[\small
\begin{align}
V[X]&=n \sum_{ k = 1 }^{ n } (k-1) {}_{n-1} \mathrm{ C }_{k-1}\cdot p^k\cdot(1-p)^{n-k}\\
&+n \sum_{ k = 1 }^{ n } {}_{n-1} \mathrm{ C }_{k-1}\cdot p^k\cdot(1-p)^{n-k} -μ^2\\
&=(***)
\end{align}
\]
【第1項目の計算】
\((***)\) の第1項目に関して \(p\) を1つ前へ出して、k = 0 番目からの総和へ変形すると、
\[\small
\begin{align}
n \sum_{ k = 1 }^{ n } (k-1) {}_{n-1} \mathrm{ C }_{k-1}\cdot p^{k-1}\cdot(1-p)^{n-k}&=np \sum_{ k = 0 }^{ n-1 } k\cdot {}_{n-1} \mathrm{ C }_k\cdot p^{k}\cdot(1-p)^{(n-1)-k}\\
\end{align}
\]となる。このΣ以降は、n → n-1 とした場合の二項分布の期待値の定義に他ならないので、以下のように計算できる。\[\small
\begin{align}
np \sum_{ k = 0 }^{ n-1 } k\cdot {}_{n-1} \mathrm{ C }_k\cdot p^{k}\cdot(1-p)^{(n-1)-k}=np\cdot (n-1)p\\
\end{align}
\]
【第2項目の計算】
\((***)\) の第2項目に関しても同様に \(p\) を1つ前へ出して、k = 0 番目からの総和へ変形すると、
\[\small
\begin{align}
n \sum_{ k = 1 }^{ n } {}_{n-1} \mathrm{ C }_{k-1}\cdot p^k\cdot(1-p)^{n-k}&=np \sum_{ k = 0 }^{ n-1 } {}_{n-1} \mathrm{ C }_k\cdot p^k\cdot(1-p)^{(n-1)-k}\\
\end{align}
\]となる。このΣ以降は、n → n-1 とした場合の二項展開の式に他ならないので、以下のように計算できる。\[\small
\begin{align}
np \sum_{ k = 0 }^{ n-1 } {}_{n-1} \mathrm{ C }_k\cdot p^{k}\cdot(1-p)^{(n-1)-k}&=np\cdot \{p + (1-p)\}^{n-1}\\
&=np
\end{align}
\]【まとめ】従って、\((***)\) にそれぞれを代入すると、

\[\small
\begin{align}
(***)&=np\cdot (n-1)p + np – μ^2\\
&=np\cdot (n-1)p + np – (np)^2\\
&=np(1-p)
\end{align}
\]

よって示されたね!!

かえる
かえる

分散の公式の方はさすがに萎えるケロなw

合格くん
合格くん

確かにちょっと大変だけど、定義から計算できたね!!途中、k の番号を 0 からに直して、二項展開の公式を使うところがポイントだね!!

かえる
かえる

日にちを置いてまた計算してみるケロ。

まとめ

合格くん
合格くん

今回は、少し重たい内容だったね!!大変かもしれないけど、しっかりと復習して身につけておこう!

かえる
かえる

めんどいケロ。

【統計学】二項分布を基本からわかりやすく解説!期待値、分散の計算まで
ここでは、二項分布の知識について学んでいきます。二項分布はベ...
【統計学】離散型確率変数と確率分布〜二項分布との違いについて〜
合格くん こんにちは!合格...

 

統計学 参考書

以下に、統計学を学ぶ上で参考になった教材をいくつか挙げておきます。

独習 統計学24講: 医療データの見方・使い方

式での計算過程は少し足りないと思いますが、文章で丁寧に説明されており理解が進みました。

 

スバラシク実力がつくと評判の統計学キャンパス・ゼミ―大学の数学がこんなに分かる!単位なんて楽に取れる!

計算でゴリゴリ証明してくれているので、根底から理解できます。

 

統計学入門 (基礎統計学Ⅰ)

東京医科歯科大学の教養時代はこの教科書を用いて勉強していました。