四分位数 – 求め方 | 中央値が何番目からかをデータの大きさの偶奇から

四分位数-表紙

" 四分位数 – 求め方 “について高校1年で学習する内容を解説しています。

中央値という第 2 四分位数の求め方と合わせて下位のデータの真ん中や上位のデータの真ん中を考えます。

データの大きさ(与えられたデータの個数)が奇数個か偶数個によって、手順が異なる部分があるので、どちらについても、着実に中央値を求めることができるようになることが大切になります。

下位のデータの中央値にあたるのが、第 1 四分位数で、上位のデータの中央値にあたるのが第 3 四分位数です。

そのため、はじめに大きさ n のデータが与えられたときに、中央値を求められるようになれば、下位や上位のデータの中央値を求めることができます。

つまり、第 1 四分位数と第 3 四分位数を第 2 四分位数を求めたときと同じ要領で求めることができるようになります。

第 2 四分位数 :中央値の求め方

第 2 四分位数(中央値)を求めるにあたって、まずはじめに、データを小さい値から順に大きな値へとなる「大きさの順」に並べ替えることをします。

問題によっては、大きさの順に並べられているときもありますが、そうでないときは自分で並べ替えてから議論をはじめることになります。

まずは、大きさの順に並べることを具体例を使って練習します。


【大きさ 5 のデータ】

8, 4, 1, 6, 2


データの値を小さい値から順に右側へ向かって並べます。

1, 2, 4, 6, 8 で大きさの順に並べ替えることができました。

データの大きさが偶数個のときと奇数個のときで、中央値の求め方は異なりますが、偶奇のいずれであっても、データを大きさの順に並べられた状態にしてから考えます。

では、ここから簡単な例を使って、第 2 四分位数(中央値)の求め方について説明します。

奇数個のデータのとき

1, 2, 4, 6, 8 という5個についての中央値を説明します。


真ん中の 4 そのものが中央値(第 2 四分位数)です。

あと、用語ですが、奇数個のデータのときは、中央値の値よりも左側にあるデータたちを下位のデータといいます。

この例だと、
「1, 2」 の2個が下位のデータです。

また、中央値よりも右にあるデータたちを上位のデータといいます。

「6, 8」が、この例の上位のデータとなります。

大きさの順に並べられているときに、どこが真ん中を計算で求めることも大切になります。

簡単のために、5個という少ない個数にしましたが、もっと大きさ個数のときでも計算で真ん中が左から何番目の値が中央値かを判断できるようになっておくことが、大学受験では大切になります。

大きさ 5 のデータだと、
(5-1)÷2 = 2 で、
下位のデータの個数が2個、上位のデータの個数が2個と分かります。

そして、下位データと上位データの間が真ん中のデータの値である中央値です。

そのため、
(5-1)÷2+1 = 3 より、
大きさの順に並べられた左から3番目の値が中央値ということになります。

一般に奇数個のデータが与えらえたときの式で述べておきます。

自然数 n を奇数とし、大きさ n のデータが、大きさの順に並べられているとする。

このとき、一番左から
(n-1)÷2 + 1 番目にあるデータが、中央値である。

先ほどの例だと、n = 5 だったので、
(5-1)÷2 + 1 = 3 となり、一番左から3番目の値が中央値となっていました。

それでは、これから偶数個のデータについての中央値について説明します。

偶数個のデータのとき

1, 2, 4, 6, 8, 8 という6個のデータについて中央値を説明します。


大きさの順に並べられているデータの大きさが6個と偶数個のときは、まず下位のデータと上位のデータに大別します。

6÷2 = 3 より、一番左から3番目までの3個が下位のデータの集まりになります。

「1, 2, 4」が、この例だと下位のデータとなります。

そして、6÷2 + 1 = 4 より、一番左から4番目の値が上位データの始まりになります。

6, 8, 8」が上位のデータになります。

ここから、中央値を求めます。

下位のデータの中で一番右端の値と、上位のデータの中で一番左端の値の2個の値の平均値を中央値とします。

つまり、
(4+6)÷2 = 5 が、この大きさ6のデータの例の中央値です。

はじめに与えられた6個について、
6÷2 = 3 より、
一番左から三番目の 4 と一番左から四番目の 6 の2個で平均値を計算すると中央値となるわけです。

データの大きさが偶数個のときについても、文字を使って一般的に押さえておきます。

自然数 n を偶数とし、大きさ n のデータが、次のように大きさの順に並べられているとする。

a1, a2, … , an
(a1≦a2≦ … ≦an)

このとき、
an÷2, an÷2+1 の2個の平均値が中央値である。

つまり、
(an÷2 + an÷2+1)÷2 が中央値である。

先ほどの例では、
6÷2 = 3,
6÷2+1 = 4 だったので、
大きさの順に並べられている左から三番目と四番目の2個の値で平均値をとったわけです。

これで、与えられたデータの大きさ n が奇数であっても偶数であっても中央値を求めることができるようになりました。

そうすると、第 1 四分位数は下位のデータの中央値であり、第 3 四分位数は上位のデータの中央値なので、同じ要領で、これらの値も求められます。

1, 2, 4, 6, 8, 9 という6個を例に見てみます。

「1, 2, 4」という下位のデータの中央値 2第1四分位数です。

「6, 8, 9」という上位のデータの中央値 8第3四分位数です。

ただ、大学受験では、データの大きさが大きく、考察をしながら下位や上位のデータの真ん中を求める問題が出題されます。

そのため、具体的な例を使って、考える練習をしてみます。

第1四分位数と第3四分位数 :求め方

【奇数個のとき】

大きさ 37 のデータが次のように大きさの順に並べられていたとします。

a1, a2, … , a37
(a1≦a2≦ … ≦a37)

このとき、下位のデータの中央値である第1四分位数と第3四分位数を求めます。


まず、中央値を境目にして、下位のデータと上位のデータが、どこからどこまでかを押さえます。

奇数個のデータになるので、
(37-1)÷2+1 = 19 より、
a19が中央値(第2四分位数)です。

【下位のデータ】
a1, a2, … , a18 の18個が下位のデータたちです。

【上位のデータ】
a20, a21, … , a37 の18個が上位のデータたちです。

ここまで大別できると、下位のデータの中央値である第1四分位数を求めることができます。

a1, a2, … , a18 の18個が下位のデータたちを、大きさ 18 のデータについて中央値を求めた要領で計算するわけです。

18 が偶数個なので、
18÷2 = 9(番目),
18÷2+1 = 10(番目)の2個のデータの平均値が求める第1四分位数です。

そのため、
(a9+a10)÷2 が求める第1四分位数の値となります。

今度は、
a20, a21, … , a37 の18個から成る上位のデータの中央値である第3四分位数を求めます。

下位のデータのときと同じく、左から9番目と10番目の2個の値の平均値が求める値となります。

ここで、ズレないように注意です。

a19から右に1つ目の値 a20が上位データの1番目の値となっています。

a19から右に2つ目の値 a21が上位データの2番目の値となっています。

a19から右に3つ目の値 a21が上位データの3番目の値となっています。

この規則で、上位のデータにおいて、左から9番目が、どれかを把握します。

少し調べて分かった規則から、
a19+9 = a28が上位データの左から9番目の値です。

その1つ右隣りa29が左から10番目の値となっています。

よって、これら2個の平均値が求める第3四分位数の値です。

すなわち、
(a28+a29)÷2第3四分位数の値です。

上位データの真ん中が、ズレないように注意するのが大切になります。

練習に偶数個のデータのときも扱います。

上位のデータの真ん中に注意

【偶数個のとき】

大きさ 38 のデータが次のように大きさの順に並べられていたとします。

a1, a2, … , a38
(a1≦a2≦ … ≦a38)

このとき、下位のデータの中央値である第1四分位数と第3四分位数を求めます。


データの大きさが偶数個なので、下位のデータと上位のデータに大別します。

38÷2 = 19 より、19個のデータで下位・上位ともが構成されています。

【下位のデータ】
a1, a2, … , a19 の19個が下位のデータたちです。

【上位のデータ】
a20, a21, … , a38 の19個が上位のデータたちです。

a1, a2, … , a19 の19個の中央値が第1四分位数です。

奇数個なので、
(19-1)÷2+1 = 10 より下位のデータの真ん中の位置が分かります。

a1, … , a9,
 a10,
a11, … , a19 の19個が下位のデータたちです。

真ん中は左から10番目の a10第1四分位数の値です。

上位のデータの真ん中は、落ち着いてズレなく求めます。

a20, a21, … , a38 の19個が上位のデータで、この左から10番目の値が求める第3四分位数の値となっています。

左から1番目がa20です。

左から2番目がa21です。

左から3番目がa22です。

これで規則が分かりました。

左から k 番目がa20+k-1です。

左から10番目を探しているので、
k = 10 とします。

a20+10-1 = a29第3四分位数の値です。

a20, a21, … , a28の9個,
a29が真ん中,
a30, a31, … , a38の9個という構成に上位のデータがなっていたわけです。

ここまで、第1四分位数、第2四分位数(中央値)、第3四分位数の求め方について述べてきました。

最後に箱ひげ図との関係を述べます。

箱ひげ図と四分位範囲

四分位数-箱ひげ図

用語の定義には注意です。

与えられた大きさ n のデータの「範囲」と、「四分位範囲」では定義が異なります。

四分位範囲は、
第3四分位数-第1四分位数と計算します。

箱ひげ図を縦に置いたときの箱の長さに当たります。

例えば、下位のデータの中央値ともいうべき第1四分位数が 5 で、上位のデータから第3四分位数が 13 と分かったとします。

このときに、四分位範囲は、
13-5 = 8 ということになります。

この図で、赤色の線の部分の長さが四分位範囲です。


【関連する記事】

分散
期待値

これらは数Bを受験で使う方に向けた内容になっています。


それではこれで、今回の記事を終了します。

読んで頂き、ありがとうございました。