ねこすたっと

ねこの気持ちと統計について悩む筆者の備忘録的ページ。

高校生のためのデータ分析入門 (12):期待値を計算しよう

数学が苦手なうちのJKに、将来必要となるかもしれないデータ分析への抵抗感をなくしてもらう目的で記事を書くことにしました。

前回:高校生のためのデータ分析入門 (11):比較の質を落とすもの - ねこすたっと

期待値とは?

期待値とは、一言で言えば平均でのことなので、もう計算できる!と言われそうですね。 これまで平均とか分散について適当な説明でごまかしてきましたが、 この先、相関係数や二項分布の話をする前に、一度「期待値・平均・分散」を整理しておきましょう。

期待値(expectation)をもう少し正確に表現すると、ある確率変数が取る値を、その値が出る確率で重みをつけて平均(加重平均, weighted average)を取ったものです。

普通の平均(算術平均, 相加平均という)は、全ての数値を足して、足し合わせた個数で割るので、それぞれの数値が計算結果に影響する度合いは同じです。全ての観察値を対等に扱っていることになります。例えば、「150cm, 160cm, 170cmの平均は?」と問われたら、 (150+160+170)/3 = 160 と計算しますね。特に条件を与えられていないので、3つの値は対等に扱っています。

これに対し、加重平均は観測値によって、計算結果に影響する度合いは変わります。例えば、身長150cmの人が1人、160cmが1人、170cmの人が3人いたとしましょう。このとき、平均身長を160cmとはしないですよね。170という数字は登場回数が多いので、他の2つよりも結果に影響力があって、平均は160よりも大きい方向に引っ張られるはずです。

せっかくなので、きちんと数式で示しておきましょう。変数xの  i 番目に対して割り当てられている重みを  w_i とすると、xの加重平均  M_{wt} は、

 
\begin{aligned}
M_{wt} &= \frac{\sum_i^n w_i x_i}{\sum_i^n w_i}
\end{aligned}

と定義されます。全ての観測値に等しい重みが割り振られている場合は、 w_i = 1 とすると、普通の平均を求める式になりますね(確認してください)。

前の例のように、登場回数が多いものに重みを置く、というのは自然な考え方ですね。期待値は確率を重みにした加重平均です。

離散変数の期待値

Xが離散変数の場合、その期待値 E[X] は次のようになります。

 
\begin{aligned}
E[X] &= \frac{\sum_i^n P(X = x_i) x_i}{\sum_i^n P(X = x_i)} \\
&= \sum_i^n P(X = x_i) x_i
\end{aligned}

変数Xがいずれかの値を取る確率は合計で1になるはずなので、2行目への変形は理解できると思います。

例として、下のように5と6がめっちゃ出やすいインチキサイコロの目の期待値を考えてみましょう。

サイコロの目とその出現確率をかけて、全て足すと、

 
\begin{aligned}
E[X] &= \frac{1}{12}(1+2+3+4) + \frac{1}{3}(5+6) \\
&= 4.5
\end{aligned}

となります。公平なサイコロの目の期待値  (1+2+3+4+5+6)/6 = 3.5 よりも、大きい値になっているのがわかります。

連続変数の期待値

連続変数の場合は、和を取ることは積分を計算することに相当します。確率密度をf(x)とすると、

 
\begin{aligned}
E[X] &= \frac{\int_{-\infty}^{+\infty} f(x) x dx}{\int_{-\infty}^{+\infty} f(x) dx} \\
&= \int_{-\infty}^{+\infty} f(x) x dx
\end{aligned}

となります。確率密度関数の全体の面積は1になるので、分母=1になりますね。

ちょっと記憶が怪しい場合は、下の記事を復習してください。

necostat.hatenablog.jp

例えば、 N(\mu, \sigma^2)に従う連続変数xの平均は、

 
\begin{aligned}
E[x] &= \frac{1}{\sigma\sqrt{2\pi}} \int_{-\infty}^{+\infty}x \exp\left(-\frac{(x - \mu)^2}{2\sigma^2}\right) dx\\
\end{aligned}

で求められます。一応、高校で習う積分で計算できますが、文系数学だと範囲外かもしれません。式変形ができなくても、「こうやって計算するんだな」ってのが分かればOKです。

おまけ

計算できなくていいとは言っても気になると思いますので、

 
\begin{aligned}
E[x] &= \frac{1}{\sigma\sqrt{2\pi}} \int_{-\infty}^{+\infty}x \exp\left(-\frac{(x - \mu)^2}{2\sigma^2}\right) dx\\
\end{aligned}

を頑張って計算してみます。

 
\begin{aligned}
z &= \frac{x - \mu}{\sigma}
\end{aligned}

とおくと、 x = \mu + \sigma z で、 dx = \sigma dz となります。

 
\begin{aligned}
E[x] &= \frac{1}{\sigma\sqrt{2\pi}} \int_{-\infty}^{+\infty}(\mu + \sigma z) \exp\left(-\frac{z^2}{2}\right) \sigma dz\\
&=  \mu \int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}} \exp\left(-\frac{z^2}{2}\right) dz + 
\frac{\sigma}{\sqrt{2}} \int_{-\infty}^{+\infty} z \exp\left(-\frac{z^2}{2}\right) dz \\
\end{aligned}

前半部分は、標準正規分布の確率密度を全範囲に渡って積分すると1になるから、

 
\begin{aligned}
\int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}} \exp\left(-\frac{z^2}{2}\right) dz = 1
\end{aligned}

後半部分は、奇関数を対称な区間で積分すると0になるから、

 
\begin{aligned}
 \int_{-\infty}^{+\infty} z \exp\left(-\frac{z^2}{2}\right) dz  = 0
\end{aligned}

よって、

 
\begin{aligned}
E[x] &= \mu
\end{aligned}

となります。

おわりに