同時分布 | 分かりやすく例を使いながら二つの確率変数が取る値を考える

同時分布-表紙

" 同時分布 “では、二つの確率変数XとYが取る値を考えます。

分かりやすい例を使いつつ、
X の値が a で、なおかつ Y の値が b である確率 P(X=a, Y=b) に関する同時分布について解説しています。

そして、二つの確率変数の和についても議論を進めます。なお、XとYそれぞれの分布のことを周辺分布といいます。

今回のブログ記事では、確率変数が二つ出てきます。

確率変数 X と Y について、X が値が a であり、かつ Y の値が b というときの確率を表す記号から説明します。

一般的な記号の説明をした後に、具体的な例題で内容を確認します。

同時分布 :確率P(X=a,Y=b)

X, Y を確率変数とします。X の取る値が実数 a で、かつ Y の取る値が実数 b だとします。

このとき、X = a かつ Y = b である確率
P(X = a, Y = b) と表します。

ちなみに、X1, … , Xk と k 個の確率変数があったとき、
X1 = a1, … , Xk = ak である確率を
P(X1=a1, … , Xk=ak) と表します。

このブログ記事では、二つの確率変数 X, Y について、基本的な内容を解説します。

【X の取る値】x1, x2, … , xm

【Y の取る値】y1, y2, … , yn

このとき、P(X = xi, Y = yj) という確率を pij と表すと便利です。

ちょうど、mn 個の値の取り方があるので、座標平面の座標のようなイメージで、X の値が xi で、なおかつ Y の値が yj である確率を考えることができます。

(xi, yj) → pij という対応が得られました。

この対応が、X と Y の同時分布です。もう少し考察を進めます。

X の値が xi であったとき、Y の値は全部で y1 から yn までの可能性があります。

そのため、X の値が xi となる確率は、
P(X = xi) = pi1+pi2+…+pin

同様に、Y = yj となる確率は、
P(Y = yj) = p1j+p2j+…+pmj

X, Y のそれぞれについての分布を周辺分布といいます。どちらも確率変数ですので、値を取るときの確率が存在しています。

X = xi となる確率を pi とすると、
上の内容と合わせて、
pi = pi1+pi2+…+pin です。

Y = yj となる確率を qj とすると、
同様にして、
qj = p1j+p2j+…+pmj となります。

ここまで、一般的な記号の説明をしました。文字が多くなっているので、具体的な例で同時分布について解説をします。

例題で確認

【例題】

赤玉 2 個と黒玉 6 個が入っている袋から、A 君が、先に玉を 1 個取り出します。

そして、その取り出した玉を元に戻さずに、B 君が続けて玉を 1 個取り出すということをします。

このとき、A 君が取り出した黒玉の個数を X 、B 君が取り出した黒玉の個数を Y とします。


確率変数 X と確率変数 Y が登場しています。二つ確率変数があるときに、「かつ」という論理を交えて、X と Y の同時分布を考えることができます。

X の値が実数 a となり、かつ、Y の値が実数 b となる確率は P(X = a, Y = b) でした。

A 君が取り出した黒玉の個数が 1 個で、
B 君が取り出した黒玉の個数が 0 個である確率だと、P(X = 1, Y = 0) です。

この確率を求めてみます。

まず起こり得るすべての場合の総数を求めておきます。

A 君が合計 8 個の玉の中から玉を 1 個取り出し、残りの 7 個の玉の中から B 君が 1 個の玉を取り出します。

組合せを考えると、
8C1 × 7C1 = 8 × 7 = 56 です。

これで、すべての玉の取り出し方である起こり得る場合の総数が 56 通りと分かりました。次に、「A 君が黒玉を 1 個取り出し、B 君が黒玉を取らなかった」という場合が何通りあるのかを求めます。

A 君は黒玉 6 個から 1 個を取り出すので、
6C1 = 6 より、6 通りの取り方ができます。

B 君は黒玉を 0 個取り出すということは、赤玉を 1 個取り出したということになります。

A 君の取り出した玉を元に戻さないということから、「赤玉 2 個と黒玉 5 個」となっています。

ここから B 君が赤玉を 1 個取り出したということなので、2C1 = 2 より、2 通りの取り方があります。

A 君の玉の取り方 1 通りに対して、B 君の 2 通りの分岐が起こります。

よって、X = 1 かつ Y = 0 となる場合の総数は、6 × 2 = 12 より、12 通りです。
 
ゆえに、
P(X = 1, Y = 0) = 12 ÷ 56 = 3/14

これで、「A 君が黒玉を 1 個取り出し、B 君が黒玉を取らなかった」ということが起こる確率が、求められました。

3/14 が求める確率 P(X = 1, Y = 0) です。

高校一年のときに学習した要領で考えることができました。

この内容を確率変数 X が取るデータの値 x1, x2 と、確率変数 Y が取るデータの値 y1, y2 を使って、一般的な形でまとめておきます。

一般的な表し方

A 君が黒玉を取り出す個数は、0 個または 1 個です。

そのため、確率変数 X のとる値は、x1 = 0 と x2 = 1 の 2 個となります。

B 君についても同様に考えると、
y1 = 0, y2 = 1 となります。

先ほど求めた「A 君が黒玉を 1 個取り出し、かつ、B 君が黒玉を取らなかった」という確率は、 P(X = x2, Y = y1) となっています。

P(X = 1, Y = 0) を x2 と y1 を用いて表しました。

この確率 P(X = x2, Y = y1) のことを p21 と表します。

これで、(x2, y1) に対応する確率 p21 が定義できました。他の対応をまとめて、一覧にすると次のようになります。

(x1, y1) → P11
(x1, y2) → P12
(x2, y1) → P21
(x2, y2) → P22

(xi, yj) に対して pij を対応させる対応を確率変数 X と Y の同時分布といいます。

今回は、i = 1, 2 と j = 1, 2 だったので、4 パターンの確率の値が考えられます。

より一般的には、
1 ≦ i ≦ m, 1 ≦ j ≦ n という mn 個の確率のパターンとなります。

ここからは、この例をもとにして、確率変数の和について解説します。

同時分布 :確率変数の和

同時分布-組に対応する確率

X = x1 のときに、発生する確率は p11 または p12 です。

和 p11 + p12 を p1 と置くことにします。

つまり、p1 = p11 + p12 という新しい値を考えます。x1 のときなので、左側の添え字が、どれも 1 になっています。

Y = y2 のときにも、
同様に q2 = p12 + p22 です。

文字が多くなってきましたが、xi や yj は黒玉を取り出した個数という確率変数が取る値のことでした。

そして、pi は X = xi となっているときに発生する確率どおしの和です。

qi は Y = yi となっているときに発生する確率どおしの和です。

さらに、新しい確率変数 Z を次のように定めます。


X = xi, Y = yj のとき、

Z = xi + yj (i, j = 1, 2)


Z の値が xi + yj のとき、
X = xi かつ Y = yj が起きたときです。

したがって、Z = xi + yj となる確率は、pij となっています。
 
この状況から、確率変数 X と Y の和の期待値が定義できます。

Z の期待値が X と Y の和の期待値で、

E(Z) = E(X + Y) です。

E(X+Y)の定義

【確率変数の和の期待値】

期待値 E(Z) =E(X + Y) は、
(x1+y1)p11+(x1+y2)p12
 +(x2+ y1)p21+(x2+y2)p22


次に、E(Z) = E(X + Y) をE(X) と E(Y) を使って表すことを考えます。

E(Z) = E(X + Y) =
x1(p11+p12)+x2(p21+p22)
+y1(p11+p21)+y2(p12+p22) … ★と、E(Z) の式をまず変形します。

ここで、
pi = pi1 + pi2, qi = p1i + p2i ( i = 1, 2 ) と置いていたことが役に立ちます。

「X = xi のときには、Y = y1 または Y = y2」となります。

したがって、X = xi となるときの確率は、
pi1 + pi2 です。

そのため、X = xi となるときの確率は、pi と等しくなります。

Y についても、同様に考えて、Y = yi となるときの確率を qi とすると、
qi = p1i + p2i となります。

よって、これらを★に代入すると、

E(Z) = E(X + Y)
= x1p1+x2p2+y1q1+y2q2

ここで、x1p1 + x2p2 は、確率変数 X の期待値 E(X) です。

そして、y1q1 + y2q2 は確率変数 Y の期待値です。

よって、E(Z) = E(X + Y) は次のようになります。


【X + Y の期待値】

E(X + Y) = E(X) + E(Y)


さらに、変量の変換と合わせて、拡張しておきます。

実数 a を使って、確率変数 aX を考えます。

aX が取る値たちは、それぞれ a 倍されているので、ax1 と ax2 となります。

また、実数 b を使って、確率変数 bY を考えると、取る値たちは同様に by1 と by2 です。

aX + bY のことを Zab と置くと、上で議論したことと同じ要領で、次を得ます。

ax1p1+ax2p2 +by1q1+by2q2
= E(Zab)

ax1p1 + ax2p2 は、
確率変数 aX の期待値 E(aX) です。

そして、by1q1 + by2q2 は確率変数 bY の期待値 E(bY) です。

すなわち、

ax1p1 + ax2p2 =
a(p1 + p2) = a × E(X) です。

同様に、by1q1 + by2q2 = b × E(Y)

したがって、次の公式となります。


【aX + bY の期待値】

E(aX + bY) = aE(X) + bE(Y)


これで、よく使われる期待値の公式が導けました。

数学Bで扱われる確率の内容を述べてきました。

関連する内容として、
確率変数の独立という記事を投稿しています。

高校一年のときに学習する確率については、同様に確からしいという記事で解説をしています。

数Bの離散的な確率変数の例として、
二項分布という記事も投稿しています。

今回のブログ記事は、これで終了します。

読んで頂き、ありがとうございました。