

こんにちは!合格です!!
ここでは、二項分布の期待値と分散を直接計算する方法について解説するね!あ、二項分布についての基本知識は下の記事を参考にしてみてね!

この証明は覚えた方が良いケロか?

二項分布の期待値や分散の証明は、医学部学士編入試験で問われる可能性は少ないけど、一般の医学部の2次試験で問われてもおかしくない内容なんだ!なので、知っておいて損はないよ!!

一般試験の医学部2次試験で出うる、と (カキコカキコ...)。

上の記事では二項分布の期待値や分散を、直接計算しないで証明しているよ!!確率変数を分解し、確率変数の和として計算しているんだ。そうすることによって一瞬にして証明は終わるんだけど、今回は離散型の確率変数の期待値と分散の定義に従って、直接計算して証明してみるね!!

上等だケロ。
証明するもの
\left\{ \begin{array}{ll}
E[X]=np\\
V[X]=np(1-p)
\end{array} \right.
\]

証明したいのは、上の2つの公式だよね!離散型確率変数の記事で解説したけど、二項分布は離散型確率分布のうちの1つだったのは覚えているかな?

当然だケロ。要は離散型確率分布の期待値と分散の定義はこれだケロ?

その通りだね! そして、さらに二項分布は確率変数が、より具体的な値になっているんだったね!下の表で確認してみよう!

それに加えて、確率が
$$P(X=k)={}_n \mathrm{ C }_k\cdot p^k\cdot(1-p)^{n-k} $$
と分かっているケロ。

そのとおりだね!なので、
分散 \(σ^2\) $$V[X]=\sum_{k=1}^{n} (k-μ)^2\cdot {}_n \mathrm{ C }_k\cdot p^k\cdot(1-p)^{n-k}$$

今回はまじめに、手計算でしっかり確認してみるケロ。
二項分布の期待値公式の証明

それじゃあ、上の定義に従って計算してみるね!!
期待値の定義より、\[\small
\begin{align}
E[X] &=\sum_{ k = 0 }^{ n } k\cdot {}_n \mathrm{ C }_k\cdot p^k\cdot(1-p)^{n-k}\\
\end{align}
\]であるから、\[\small
\begin{align}
k\cdot {}_n \mathrm{ C }_k &= k\cdot\frac{ n! }{k!\cdot( n - k )! }\\
&=\frac{ n! }{(k-1)!\cdot( n - k )! }\\
&=n\cdot \frac{ (n-1)! }{(k-1)!\cdot \left\{( n-1 )-( k-1)\right\}! }\\
&=n\cdot {}_{n-1} \mathrm{ C }_{k-1}
\end{align}
\]となることに注意し、\(k=0\) では上式は定義されないので、\[\small
\begin{align}
E[X] &=\sum_{ k = 0 }^{ n } k\cdot {}_n \mathrm{ C }_k\cdot p^k\cdot(1-p)^{n-k}\\
&=\sum_{ k = 1 }^{ n } n\cdot {}_{n-1} \mathrm{ C }_{k-1}\cdot p^k\cdot(1-p)^{n-k}\\
&=np\cdot \sum_{ k = 1 }^{ n } {}_{n-1} \mathrm{ C }_{k-1}\cdot p^{k-1}\cdot(1-p)^{(n-1)-(k-1)}\\
&=np\left\{p+(1-p)\right\}^{n-1}\\
&=np
\end{align}
\]
よって示されたね!!

余裕だケロな。
$$k\cdot {}_n \mathrm{ C }_k = n\cdot {}_{n-1} \mathrm{ C }_{k-1}$$
の式変形と、二項展開を逆に用いることがポイントだケロな。

さすがかえる君だね!
それじゃあ、次は二項分布の分散公式について証明をやってみよう!定義式からゴリッゴリに計算してみるね!!

ゴリッゴリにいくケロ〜
二項分布の分散公式の証明 その1

つぎは、分散の公式を証明してみるね!!
分散の定義より、\[\small
\begin{align}
V[X] &=\sum_{ k = 0 }^{ n } (k-μ)^2\cdot {}_n \mathrm{ C }_k\cdot p^k\cdot(1-p)^{n-k}\\
&=\sum_{ k = 0 }^{ n } (k^2-2kμ+μ^2)\cdot {}_n \mathrm{ C }_k\cdot p^k\cdot(1-p)^{n-k}\\
&=\sum_{ k = 0 }^{ n } k^2\cdot {}_n \mathrm{ C }_k\cdot p^k\cdot(1-p)^{n-k} -2μ\sum_{ k = 0 }^{ n } k\cdot {}_n \mathrm{ C }_k\cdot p^k\cdot(1-p)^{n-k}\\
&+μ^2\sum_{ k = 0 }^{ n } {}_n \mathrm{ C }_k\cdot p^k\cdot(1-p)^{n-k}\\
&=(*)
\end{align}
\]である。ここで 2 項目と 3 項目は以下のように変形できる。
$$\sum_{ k = 0 }^{ n } k\cdot {}_n \mathrm{ C }_k\cdot p^k\cdot(1-p)^{n-k}=μ=np$$$$\sum_{ k = 0 }^{ n } {}_n \mathrm{ C }_k\cdot p^k\cdot(1-p)^{n-k}=1^n=1$$であるから、\[\small
\begin{align}
(*) &=\sum_{ k = 0 }^{ n } k^2\cdot {}_n \mathrm{ C }_k\cdot p^k\cdot(1-p)^{n-k} -2μ\sum_{ k = 0 }^{ n } k\cdot {}_n \mathrm{ C }_k\cdot p^k\cdot(1-p)^{n-k}\\
&=\sum_{ k = 0 }^{ n } k^2\cdot {}_n \mathrm{ C }_k\cdot p^k\cdot(1-p)^{n-k} -2μ\cdot μ + μ^2\cdot 1\\
&=\sum_{ k = 0 }^{ n } k^2\cdot {}_n \mathrm{ C }_k\cdot p^k\cdot(1-p)^{n-k} -μ^2\\
&=(**)
\end{align}
\]となる。また、\(k \cdot {}_n \mathrm{ C }_k = n \cdot {}_{n-1} \mathrm{ C }_{k-1}\) が成り立つことと、k = 1 から n までの総和としても差し支えないことから、
\[\small
\begin{align}
(**)&=\sum_{ k = 0 }^{ n } k^2\cdot {}_n \mathrm{ C }_k\cdot p^k\cdot(1-p)^{n-k} -μ^2\\
&=\sum_{ k = 1 }^{ n } k\cdot k\cdot {}_n \mathrm{ C }_k\cdot p^k\cdot(1-p)^{n-k} -μ^2\\
&=\sum_{ k = 1 }^{ n } k\cdot n\cdot {}_{n-1} \mathrm{ C }_{k-1}\cdot p^k\cdot(1-p)^{n-k} -μ^2\\
&=\sum_{ k = 1 }^{ n } \{(k-1)+1\}\cdot n\cdot {}_{n-1} \mathrm{ C }_{k-1}\cdot p^k\cdot(1-p)^{n-k} -μ^2
\end{align}
\]となる。
ここで、\((k-1)+1\) で各項ごとに展開すると、以下のようになる。\[\small
\begin{align}
V[X]&=n \sum_{ k = 1 }^{ n } (k-1) {}_{n-1} \mathrm{ C }_{k-1}\cdot p^k\cdot(1-p)^{n-k}\\
&+n \sum_{ k = 1 }^{ n } {}_{n-1} \mathrm{ C }_{k-1}\cdot p^k\cdot(1-p)^{n-k} -μ^2\\
&=(***)
\end{align}
\] 【第1項目の計算】
\((***)\) の第1項目に関して \(p\) を1つ前へ出して、k = 0 番目からの総和へ変形すると、
\[\small
\begin{align}
n \sum_{ k = 1 }^{ n } (k-1) {}_{n-1} \mathrm{ C }_{k-1}\cdot p^{k-1}\cdot(1-p)^{n-k}&=np \sum_{ k = 0 }^{ n-1 } k\cdot {}_{n-1} \mathrm{ C }_k\cdot p^{k}\cdot(1-p)^{(n-1)-k}\\
\end{align}
\]となる。このΣ以降は、n → n-1 とした場合の二項分布の期待値の定義に他ならないので、以下のように計算できる。\[\small
\begin{align}
np \sum_{ k = 0 }^{ n-1 } k\cdot {}_{n-1} \mathrm{ C }_k\cdot p^{k}\cdot(1-p)^{(n-1)-k}=np\cdot (n-1)p\\
\end{align}
\] 【第2項目の計算】
\((***)\) の第2項目に関しても同様に \(p\) を1つ前へ出して、k = 0 番目からの総和へ変形すると、
\[\small
\begin{align}
n \sum_{ k = 1 }^{ n } {}_{n-1} \mathrm{ C }_{k-1}\cdot p^k\cdot(1-p)^{n-k}&=np \sum_{ k = 0 }^{ n-1 } {}_{n-1} \mathrm{ C }_k\cdot p^k\cdot(1-p)^{(n-1)-k}\\
\end{align}
\]となる。このΣ以降は、n → n-1 とした場合の二項展開の式に他ならないので、以下のように計算できる。\[\small
\begin{align}
np \sum_{ k = 0 }^{ n-1 } {}_{n-1} \mathrm{ C }_k\cdot p^{k}\cdot(1-p)^{(n-1)-k}&=np\cdot \{p + (1-p)\}^{n-1}\\
&=np
\end{align}
\]【まとめ】従って、\((***)\) にそれぞれを代入すると、
\[\small
\begin{align}
(***)&=np\cdot (n-1)p + np - μ^2\\
&=np\cdot (n-1)p + np - (np)^2\\
&=np(1-p)
\end{align}
\]
よって示されたね!!

分散の公式の方はさすがに萎えるケロなw

確かにちょっと大変だけど、定義から計算できたね!!途中、k の番号を 0 からに直して、二項展開の公式を使うところがポイントだね!!

日にちを置いてまた計算してみるケロ。
まとめ

今回は、少し重たい内容だったね!!大変かもしれないけど、しっかりと復習して身につけておこう!

めんどいケロ。
統計学 参考書
以下に、統計学を学ぶ上で参考になった教材をいくつか挙げておきます。
独習 統計学24講: 医療データの見方・使い方
式での計算過程は少し足りないと思いますが、文章で丁寧に説明されており理解が進みました。
スバラシク実力がつくと評判の統計学キャンパス・ゼミ―大学の数学がこんなに分かる!単位なんて楽に取れる!
計算でゴリゴリ証明してくれているので、根底から理解できます。
統計学入門 (基礎統計学Ⅰ)
東京医科歯科大学の教養時代はこの教科書を用いて勉強していました。