
ここでは箱ひげ図についての基本的な用語を確認していきたいと思います。箱ひげ図を読み解く際のポイントは、データの数が偶数個か、奇数個かに注意することです。具体的に問題を解いて学んでいきましょう。
問題1 箱ひげ図 データ数が奇数個の場合
生徒 | A | B | C | D | E | F | G | H | I |
点数 | 50 | 65 | 95 | 80 | 25 | 60 | 40 | 55 | 70 |
解答
まず、データを大小の順に並べてみます。
生徒 | E | G | A | H | F | B | I | D | C |
点数 | 25 | 40 | 50 | 55 | 60 | 65 | 70 | 80 | 95 |
最大値は95、最小値は25、平均は60となります。
データの個数が奇数の時は、中央値は真ん中の値である60となり、今回はたまたま平均と一致しています。
ここでポイントは第1四分位数と第3四分位数ですが、下図のように下位データと上位データを中央値の前後で分けた時、下位データの中央値が第1四分位数であり、上位データの中央値が第3四分位数となります。
下位データ、上位データは今回は偶数個なので、下位データの中央値は40と50の平均であり、45が第1四分位数となります。上位データの中央値は70と80の平均であり、75が第3四分位数となります。よって、解答は下図のようになります。
【ポイント】
今回の問題では、データの個数が奇数であり、上位データと下位データの個数が偶数でした。そのため、中央値はそのまま決まりましたが、第1四分位数と第3四分位数は、各々下位データと上位データで中央値の計算をする必要がありました。もし、仮に下位データと上位データの個数が奇数であれば、当然そのような計算をする必要はなく、真ん中の値をそのまま各データの中央値として採用すればよいです。
問題2 箱ひげ図 データ数が偶数個の場合
生徒 | A | B | C | D | E | F | G | H |
点数 | 50 | 65 | 95 | 80 | 25 | 60 | 40 | 57 |
解答
まず、データを大小の順に並べてみます。
生徒 | E | G | A | H | F | B | D | C |
点数 | 25 | 40 | 50 | 57 | 60 | 65 | 80 | 95 |
データ個数が偶数の時は、中央値は真ん中の2つのHとFである、57と60の平均となります。最大値は95、最小値は25、平均は59となります。
ここでポイントは第1四分位数と第3四分位数ですが、下位データと上位データを中央値の前後で分けた時、下位データは25 40 50 57であり、その中央値は40と50の平均の45となることから、この45が第1四分位数となります。
一方で、上位データは60 65 80 95であり、その中央値は65と80の平均の72.5でとなることから、この72.5が第3四分位数となります。よって、解答は下図のようになります。
【ポイント】
今回の問題では、データの個数が偶数であり、上位データと下位データの個数も偶数でした。そのため、中央値は真ん中の2つのデータの平均とします。また、第1四分位数と第3四分位数は、各々下位データと上位データで、真ん中のデータ2つの平均を取る必要がありました。下位データと上位データの個数が奇数であれば、もちろん真ん中の値をそのまま各データの中央値として採用すればよいことになります。
問題3 箱ひげ図 正誤問題1

解答
(1)正しい
(2)誤り 鹿児島市が最大値をとることに注意。
(3)正しい 第3四分位数と第1四分位数の差をみる
(4)正しい
(5)正しい
(6)誤り 南九州市は第3四分位数をとるため、南九州市よりも男性人口の多いのは10市町村である。
今回のデータは総務省のホームページより。この男性人口数が最小値をとる三島村は、薩摩半島南端の長崎鼻から南南西約40kmの位置にある竹島・硫黄島、そして坊ノ岬から南西約50kmの位置にある黒島の三島及び無人の新硫黄島や数個の岩礁から成る村です。
参照 Googlemapより
統計学 参考書
日本統計学会公式認定 統計検定 2級 公式問題集[2016〜2018年]
統計学検定問題集は結構使えます。レベル的には2級の問題集が、医学部学士編入試験としてはあっていると思います。
統計学がわかる (ファーストブック)
主人公がハンバーガーショップのバイトをしながら、身近な例を用いて統計学を学んで行きます。
東京医科歯科大学の教養時代はこの教科書をもちいて勉強していました。