相関係数 r |なぜ-1≦r≦1の範囲となるのかを証明
相関係数 r の値の範囲は-1≦ r ≦ 1になります。
高一の統計分野で学習する事実ですが、有名な不等式を利用して、証明ができます。
標準偏差と共分散を用いて定義される相関係数の範囲を示すことは、証明問題の良い練習になるかと思います。
※散布図とともに扱われる相関係数についての発展内容になります。
有名なシュワルツの不等式を使って、相関係数の値の範囲を導きます。
【シュワルツの不等式】
(∑i piqi)2 ≦ (∑i pi2)(∑i qi2)
(ただし、i は 1 から n まで動き、各 pi, qi は実数)
この不等式の両辺を 1/2 乗すると、
∑i piqi ≦ (∑i pi2)1/2(∑i qi2)1/2 という不等式を得ます。
※ こちらのnote記事で証明を述べることにします。
この不等式を使って、相関係数の値の範囲を求めます。
相関係数 :-1≦r≦1 の範囲を証明
二つの変量 x と y の大きさを、どちらも自然数 n とします。
そして、x と y の偏差をそれぞれ順に次のように置いておきます。
a1, a2, … , an
b1, b2, … , bn
※ 上の方が x の偏差たちで、下の方が y の偏差たちです。
x と y の共分散を Sxy と表します。
また、Sx が x の標準偏差で、Sy が y の標準偏差です。
今回の相関係数の議論の前提として、
Sx ≠ 0, Sy ≠ 0 とします。
相関係数 r の定義は、
r = Sxy / SxSy です。
標準偏差には、全体にルートがついているので、
二乗をした Sx2 と Sy2 を用いて計算を進めます。
そのため、r2 を計算します。
共分散と標準偏差の定義では、1/n がついていますが、
r2 について、分母と分子のどちらにも 1/n2 が出てくるので、それは約分されて 1 となります。
この約分して 1/n2 が書かれていないシンプルな形にしたものが、次の図の (1) です。
よって、x と y についての相関係数 r の 二乗の値は図のようになります。
(1) 式の右辺の値が 1 以下となることを、シュワルツの不等式から導けています。
シュワルツの不等式の右辺が分母にくるように不等式を同値変形しました。
シュワルツの不等式の右辺の値で、シュワルツの不等式の両辺を割ったわけです。
※ Sx ≠ 0, Sy ≠ 0 という前提から、0 でないので割っています。
そうすると、(1) の右辺となります。
そのため、(1) の右辺の値が 1 以下です。
求める範囲へ到達
これで、r2 ≦ 1 ということから、
この二次不等式を解くと、
-1 ≦ r ≦ 1 が得られます。
相関係数 r について、これで値の範囲を示すことを完了です。
この記事で二次関数についての理論を使いました。
新課程になっても、データの分析は、ますます存在感が大きくなっているように思えます。
分散という記事では、高一の統計分野を基礎からシンプルな例を用いて解説しています。
また、距離関数という記事でも、今回の記事で証明したシュワルツの不等式を使います。
読んで頂き、ありがとうございました。
これで、今回のブログ記事を終了します。