二項分布 – 例題 | コインをトスして表か裏かで【有理不利の判断について】

二項分布-例題-表紙

" 二項分布 – 例題 “ということで、コインを投げて表と裏が出る確率が、それぞれ 1/2 というシンプルな例を使って、議論を進めています。

数Bの単元の学習を始めたときに、よく出てくる内容について、数学の機械的な側面を説明しています。

その試行を行うという選択が有理か、不利かを判断する数Bについての話です。

今回の内容は、有理・不利の判断などという内容で練習問題などで出てくる内容です。

実際は、人の感情によって実行するかどうかを決めるわけですが、ごく単純に機械的に判断を行います。

「期待値 > 失う値」は有利(得)、
「期待値 < 失う値」は不利(損)という機械的な判断をするだけです。

そのため、問題の意図は期待値を正確に求めるということを言い換えているに過ぎません。

ただし、公式に安易に数字を当てはめるだけだと、足をすくわれることも起こり得るので、その点についての内容にも言及しています。

二項分布 – 例題 :離散的で

確率変数 X が二項分布に従うということの具体例を挙げて、その期待値を計算します。

反復試行の確率について、この二項分布に従うことが単元の学習の始めで述べられています。

そこで、コインを投げ、表と裏が出る確率 1/2 という状況で、議論を進めることにします。

シンプルな例なので、二項分布の内容をじっくりと見ることができるかと思います。

【例題】

1 枚のコインを 3 回投げ、
表が k 回出たときに、
100k ポイントが得られるゲームとします。

ただし、k は 0 以上 3 以下の整数とします。

このゲームを行うには、100 ポイントの消費が必要になるという設定です。

このゲームを行うことが、得か損かを数字で機械的に決めることを考えます。

得(有利)か損(不利)を決める値である期待値を正確に求めることが必要な問題になります。

典型的な二項分布の内容になります。

コインを 3 回投げたときに、表が出た回数を X とします。

これで、確率変数 X を導入することができました。

X が取る値は、0, 1, 2, 3 という離散的な値となっています。

X = k (0 ≦ k ≦ 3) となるときの確率を、それぞれ計算することから始めます。

それぞれの確率

コインを 1 回投げたとき、表が出る確率 p は、1/2 という設定です。

そのため、裏が出る確率は、
1-p = 1-1/2 = 1/2 です。

X = 0 となるときの確率から求めます。

3 回投げて、すべて裏が出たという確率です。

3C0p0(1-p)3
= 1・(1/2)0・(1/2)3
= (1/2)3 = 1/8 となります。

同じ要領で、X = 1 のときの確率を計算します。

3 回中 1 回が表という状況です。

3C1p1(1-p)2
= 3・(1/2)1・(1/2)2
= 3・(1/2)3 = 3 × 1/8 です。

X = 2 のときの確率は、慣れてきたので途中式を省略して端的に結果を述べておきます。

3C2p2(1-p)1
= 3・(1/2)3 = 3 × 1/8 です。

X = 3 のときの確率です。

3C3p3(1-p)0
= (1/2)3 = 1/8 となります。

これら 4 つの確率を使って、期待値を計算します。

二項分布 :その公式は正しい、しかし

【公式】

確率変数 X が、
二項分布 B(n, p) に従うとき、
期待値 E(X) = np である。


今、n = 3 で、p = 1/2 という例題を考えています。

ただし、安易に公式に当てはめ、
3 × 1/2 = 1.5(ポイント)とすると誤りになります。

実は、表が k 回出たときに、
100k ポイントが得られるゲームと、変化をつけておきました。

100k と 100 倍するようにしています。

そのため、期待値が 100 倍されます。

E(100X) = 100・E(X)
= 100・3・1/2
= 150 が求める期待値になります。

このように、日本語を全面に出し、直接に公式が使えないように、巧妙な細工をされて問題が出題されることもあるので注意です。

特にマーク型の誘導では、ミスリードされ、落とし穴が用意されているかもしれないので、十分な練習をしておくと良いかと思います。

今、公式を使いましたが、ミスをしないために、期待値の導出過程をていねいに記述します。

どうして100倍したのか

X = 0 となる確率は、1/8 でした。

ゲームの設定では、
0 × 100 ポイントが得られます。

そのため、
(0×100)・1/8
= 0 という値を計算します。

X = 0 のときは、同じ 0 ですが、0 でないときに違いが鮮明になります。

X = 1 のときの確率は、
3/8 でした。

3 回中 1 回が表だったので、
1 × 100 ポイントが得られます。

そのため、
(1 × 100)・3/8
= 300/8 という値を計算することになります。

同様に、
X = 2 のときは、
(2 × 100)・3/8
= 600/8 です。

最後に、
X = 3 のときは、
(3 × 100)・1/8
= 300/8 です。

そのため、
0+300/8+600/8+300/8 が求める期待値になります。

すなわち、
1200/8 = 150(ポイント)が、求める期待値になります。

単位は同じなのに、100 倍が発生したのは、確率変数の変換を行ったからです。

100cm は 1m というように、単位を変換したことによって、数値が変化するということがあります。

理科などで、1L = 10dL というような単位の変換があります。

しかし、この例題では確率変数の変換が関わっています。

Y = 100X という変換を行っているわけです。

X のままだと、
X = 0, 1, 2, 3 ですから、得られる得点の内容が反映されていません。

表が 1 回出ると、100 ポイントなのに、表が出た回数の数字しか表していないので、誤った数字となってしまったわけです。

その変数だとミス

二項分布-例題

E(X) = 1.5(ポイント)は、確かに公式の通りです。

n = 3, p = 1/2 だから、
3 × 1/2 = 1.5 です。

しかし、求める期待値は、
Y = 100X という確率変数 Y についてです。

上の図では、具体的に計算をしましたが、
E(Y) = E(100X)
= 100×E(X)
= 100×1.5
= 150(ポイント)ということです。

これで、ゲームを行ったときの期待値が 150 ポイントと分かりました。

ゲームを行うためには、100 ポイントを消費するという設定でした。

150 > 100 より、
得(有利)と機械的に結論づけることができます。

【最後に】

期待値 > 失う値」は有利(得)、
「期待値 < 失う値」は不利(損)という機械的な判断。


今回は、こういうことで機械的に数字だけで判断をしました。

しかし、実際には人が判断することになります。

これ以上は、1 ポイントも失いたくないから、ゲームは行わないというような感情による決定をするかもしれません。

逆に、5千ポイントくらい持っていて、圧倒的な状況で、失うものは大してないのでゲームを行って、さらに差を広げようと考えるかもしれません。

どういった状況なのかということは考えず期待値だけを正確に計算するということについて、基礎的な例題を扱いましたので、この辺りは考慮していません。

ただ、確率変数の問題を解くときに、確率変数が取る値は何かということを意識しておくのは、高校の数学で大切なので、この部分は注意です。

今回は、X = 0, 1, 2, 3 と敢えて述べてミスリードを誘発するという仕掛けをしました。

この手の変量の変換に関わる内容は、正解に関わるので、日頃から意識する点になります。

先ほどの例題では、単位は同じポイントのままでしたが、理科のように単位を変えて答えとなる数値を解答することも考えられるので、単位が何かということにも注意です。

ここから、二項分布の E(X) と V(X) について、さらに解説します。

二項分布 : E(X)について

1 回の試行で、事象 A が起こる確率が p だとします。

この試行を繰り返し行う反復試行を n 回行うとします。

1 回の試行について、事象 A が起こらない確率を q とすると、q = 1 - p です。
※ 高校一年で学習した余事象の確率の考え方です。

n 回中、事象 A が r 回起こる場合の総数は、
nCr 通りです。

事象 A が r 回起こるということは、
事象 A が (n - r) 回起こらなかったということになります。

事象 A が起こる回数を X とすると、X は確率変数となります。X の取る値は、0 から n までの整数です。

ここまでの内容から、
X = r となる確率は、
nCrprqn-r (r = 0, 1, … , n)

確率の記号で表すと、
P(X = r)
= nCrprqn-r (r = 0, 1, … , n)

これで n 回中 r 回事象 A が起こり、
事象 A が (n - r) 回起こらない確率が求まりました。

この確率分布を二項分布(ベルヌーイ分布)といい、
B(n, p) という記号で表します。

n 回が試行を行う回数で、1 回の試行で事象が起こる確率が p ということを表しています。

(p + q)n を二項展開したときの一般項は、事象 A が r 回起こる確率となっています。

E(X)とV(X)について

第 i 回目の試行(1 ≦ i ≦ n)で事象 A が起こると 1 を取り、事象 A が起こらないときは 0 を取る確率変数を Xi と表すことにします。

すなわち、
P(Xi = 1) = p, P(Xi = 0) = q です。

二項分布 B(n, p) のときの確率から、このようになります。i 回目に事象 A が起こる確率が p だからです。

q = 1 - p の関係なので、i 回目に事象 A が起こらない、
つまり Xi = 0 であるときの確率は q です。

よって、期待値 E(Xi) は、
1 × p + 0 × q = E(Xi) です。

すなわち、各 i (1 ≦ i ≦ n) に対して、
E(Xi) = p となります。

また、確率変数 Xi2 の取る値は、12, 02 で、それぞれの起こる確率は、それぞれ p, q なので、
E(Xi2) = 12 × p + 02 × q = p

よって、分散の式から、
V(Xi) = E(Xi2) - {E(Xi)}2
= p - p2 = p(1 - p) = pq

q = 1 - p の関係を使いました。

ここで、確率変数 X は、n 回の試行で事象 A が起こる回数を示していたので、
X = X1 + … + Xn となります。

事象 A が r 回起こるとき、X1 から Xn のうち r 個が値 1 で、
残りの (n - r) 個の値が 0 だからです。

そのため、確率変数 X が従う二項分布の期待値は、次のように計算できます。

E(X) = E(X1 + … + Xn) =
E(X1) + … + E(Xn) = p + … + p = np

p を n 個足し合わせたので、np となっています。これが、B(n, p) の確率変数の期待値です。

次に、分散ですが、反復試行なので、n 回の試行は互いに独立です。そのため、X1 から Xn までの確率変数は、互いに独立です。

そのため、確率変数が互いに独立なときの分散の公式が使えます。

V(Xi) = pq だったので、
V(X) = V(X1) + … + V(Xn)
= pq + … + pq = npq

pq を n個足し合わせたので、npq となっています。

これが、B(n, p) の確率変数の分散です。

ちなみに、分散にルートをつけると標準偏差となります。

簡単な例で、期待値や分散を計算してみます。

例題で練習

【例題】

確率変数 X が B(72, 2/3) に従っているとします。

このとき、E(X) と V(X) を求めてください。


n = 72, p = 2/3,
q = 1 - 2/3 = 1/3 となっています。

これらの数字を使って、先ほど求めた期待値と分散の式を使います。

E(X) = 72 × 2/3 = 52 となります。

分散は、
V(X) = 72 × 2/3 × 1/3 = 16

分散にルートをつけると標準偏差なので、
X の標準偏差は 4 ということになります。

関連する記事について

高一のデータの分析に始まり、確率変数までは、長い道のりがあります。

分散(標準偏差)

この記事では、変量を意識して具体的な例を使ってデータの分析の基礎を解説しています。

期待値

今回の記事で述べた内容の背景となる内容になります。

次は、数Bの内容となります。

同時分布

確率変数の独立に関わる内容となります。

ランダム標本(母集団)

数Bの最後の方の内容になります。

これで、今回のタロウ岩井の記事を終了します。

読んで頂き、ありがとうございました。