Python matplotlibを使って学ぶ統計処理 正規分布 新しいページはコチラ
提供: yonewiki
(→アニメーションマーカー) |
(→求めるべき係数の算出の前に〜確率密度関数から考える期待値・平均値と分散値について) |
||
161行: | 161行: | ||
− | + | ここまで来たら疲れたよ。なんだか眠いんだよ状態ですが、本題にもどって、確率密度関数で表す分散値について追求しなおしましょう。 | |
+ | |||
+ | |||
+ | <big><ymath>$$\sigma^{2} = \int (x-\mu)^{2} \cdot f(x) \cdot dx $$ </ymath> </big> | ||
+ | <ymath>$ (a - b)^2 = a^2 -2ab + b^2 $</ymath>のような計算を適用して展開すると | ||
+ | <big><ymath>$$ = \color{red}{\int x^2 \cdot f(x) \cdot dx} - \color{blue}{\int 2\mu x \cdot f(x) \cdot dx} + \color{green}{\int \mu^{2} \cdot f(x) \cdot dx} $$ </ymath> </big> | ||
+ | 上記のように整理できて1項<span style="color:red;"><span>(</span>赤<span>)</span></span>はデータを2乗した平均の形になっており、2項<span style="color:blue;"><span>(</span>青<span>)</span></span>は<ymath>$2\mu \times$</ymath>期待値の形、3項<span style="color:green;"><span>(</span>緑<span>)</span></span>は<ymath>$ \int f(x) \cdot dx = 1 $</ymath>という確率密度関数の定義に従って<ymath>$ \mu^2 \times 1 $</ymath>となります。従って | ||
+ | <big><ymath>$$ = E[\mathrm{X}^2] - 2\mu \times \mu + \mu^2 $$ </ymath> </big> | ||
+ | となって、<ymath>$ 2\mu \ times \mu = 2\mu^2 $</ymath>と整理して | ||
+ | <big><ymath>$$ = E[\mathrm{X}^2] - 2 \mu^2 + \mu^2 $$ </ymath> </big> | ||
+ | で、以下のようになります。さらに<ymath>$ \mu^2 $</ymath>の項同志を整理して | ||
+ | <big><ymath>$$ = E[\mathrm{X}^2] - mu^2 $$ </ymath> </big> | ||
+ | となって、平均値の2乗を期待値の2乗の表記に直すと以下のようになります。 | ||
+ | <big><ymath>$$ = E[\mathrm{X}^2] - E[\mathrm{X}]^2 $$ </ymath> </big> | ||
+ | |||
+ | |||
+ | という具合に分散の確率密度の式は紐解くとデータの2乗の平均と平均値の2乗の差のカタチになっていて、式は正しいです。 | ||
+ | |||
+ | |||
+ | ですが、さらにデータの2乗の平均の部分を確率密度関数を紐解いてみます。 | ||
+ | |||
+ | |||
+ | 要するにデータを2乗したものの平均値と平均値の2乗がわかれば、その差によって分散値が求まるのですから | ||