正規分布を用いるZ検定
|
|
【二項検定の限界】 1回の試行で、事象Aが起こる確率を p、Aが起こらない確率を q = 1 - p とするとき、 独立な試行をn回行ったときに事象Aがr回起こる確率は次のように表されます。 ![]() 二項検定は、この式で表される確率分布である二項分布を用いる検定法でした。 この式を用いれば、いかなる(n、p)の組に対しても、その確率を求めることが理論的には可能なのですが、 実際には、nが大きくなると二項係数 ![]() の値が非常に大きくなるので、それほど簡単な話ではありません。 ちなみに、表計算ソフト「Excel」の計算能力では、n = 1029 までが限界です(309桁になる)。 【正規分布】 大きいnに対しては、二項分布の近似を行います。 この近似において核となるのは「スターリングの公式」です。・・・詳しくは授業にて♪ ![]() 二項分布を近似して得られる確率分布を「正規分布」と言い、上の式で表されます。 ここで、μは母平均で、σは母分散の平方根(標準偏差)です。 フランスの数学者アブラーム・ド・モアブル(1667−1754)が 1733年に、二項分布の極限として導入したのが始まりです。 ド・モアブルは、 高校3年生で学ぶ「数学V」の「複素数平面」で登場する「ド・モアブルの定理」でお馴染みです。 【標準正規分布】 正規分布の中で特別なものを「標準正規分布」と言います。何が“標準”なのでしょうか? 通常の正規分布の場合、母平均や母分散の値が異なれば、グラフの形も変化します。 毎度毎度、異なるグラフを扱わねばならず、かなり厄介です。 扱うグラフが常に同じであれば、これに越したことはありません。 確率変数Xから母平均μを引き、標準偏差σで割る、といった変数変換を行うと、 どんな正規分布であろうと、同じグラフにすることができます。 ![]() この変数変換を「標準化」と言い、この変数変換によってできた正規分布を「標準正規分布」と言います。 ![]() 【Z検定】 正規分布を用いる検定は「Z検定」と呼ばれます。 「Z」の由来は、推測なのですが「ゼロ(zero)」ではないでしょうか。 Z検定は、正しくは“標準正規分布を用いる検定”であり、 標準化をすることで、確率変数が「平均0、分散1」になります。 この「平均0」に因んでいるのではないかと思われます。 |
|
|