#10正規分布

中心極限定理をやったところで、しばらく標準正規分布について勉強しましょう。
標準正規分布の確率密度関数は、

\[
f(z) =\frac{1}{\sqrt{2\pi}}\exp\left(-\frac{z^2}{2}\right)
\]

で表されます。これは綺麗な富士山のような形で、もっとも高いところが$z=0$で、ここが平均値となります。
標準偏差は$\sigma=1$で、$z=-\sigma$から$z=\sigma$の間に、約3分の2が入ります。
平均が$\mu$で、標準偏差$\sigma$の正規分布の確率密度関数は、

\[
\frac{1}{\sqrt{2\pi}\sigma}\exp\left(-\frac{(z-\mu)^2}{2\sigma^2}\right)
\]

となります。標準正規分布とどう違うか、よく見比べてみて下さい。
この確率密度関数は、ひじょーに重要なので完璧に暗記しておいて下さい。

というところで、Rでやってみましょう。

  1. 標準正規分布に従う確率変数(正規乱数)を1000個発生させ、d01に代入しなさい。
  2. d01の平均値を求めなさい。
  3. d01の標準偏差を求めなさい。
  4. d01の密度分布を描きなさい。
  5. 平均5、標準偏差2の正規分布に従う確率変数を10000個発生させ、2*d01+5の密度分布と比較しなさい。
  6. 標準正規分布に従う確率変数を、(d01とは別に)10000個発生させ、d02に代入しなさい。
  7. (2*d01+5)+(3*d02-4)はどのような分布となりますか?

R Tips

rnorm関数は正規乱数を発生させます。rnorm(10)で,平均0,標準偏差1の標準正規分布に従う乱数が10個できます。rnorm(10,3,2)で,平均3,標準偏差2の正規分布に従う乱数が10個できます。

統計のはなし

正規分布の和は正規分布です。確率変数$z_1$と$z_2$がそれぞれ独立に標準正規分布$N(0,1)$に従うとき,$c_1,c_2,a,b$を定数とすれば,

\[
(c_1z_1+a)+(c_2z_2+b)\sim N(a+b,c_1^2+c_2^2)
\]

となります。ちなみに$\sim N(m,s^2)$は,「平均$m$,分散$s^2$の正規分布に従う」という意味です。

これは,$x_1\sim N(a,c_1^2)$,$x_2\sim N(b,c_2^2)$のとき,

\[
x_1+x_2\sim N(a+b,c_1^2+c_2^2)
\]

と同じことを言っています。

おすすめ