「標本平均」という確率変数
|
|
【Z検定の限界】 二項検定でnが大きいときの対処法として考えたZ検定ですが、Z検定にも限界があります。 Z検定には標準正規分布を用いますが、確率変数Xから確率変数Zへの標準化の際、 ![]() で表されるように、母平均μと標準偏差σが必要になり、 これらについて正確な情報が得られないときには、どうしようもありません。 例えば、工場でつくられている製品の検品で、欠陥品の割合が基準値を超えていないかどうかチェックするとき、 生産ラインからランダムに抽出することで値xは得られますが、σの値を得ることができないので、 zに変数変換することができません。 σの値を得るには製品全部をチェックしないといけませんが、 そんなことをしていては、出荷する製品がなくなってしまいます。 【「標本平均」という確率変数】 このような場合、母分散を標本から推定するしかありません。 分散を求めるには、標本値が2つ以上必要です。 というのも、標本値が1つでは分散の計算ができないからです。 標本値が2つ以上になると母分散の推定量を求めることはできます。 この推定量を用いて、いよいよ検定開始だ!・・・と思いたいところですが、ふと迷いが生じます。 複数ある標本値のうち、いったいどれを使えば良いのだろうか? これらの標本値は、母分散だけの散らばりをもった値なので、 採用する標本値によっては全く異なる結果になる恐れがあります。 では、どうしましょう?・・・それらの標本値の平均をとった値を、新たな確率変数とすれば良いのです。 すると、好都合なことに、標本値の数が多くなればなるほどバラつきを抑えることができます。 平均は変わらず、分散を小さく抑えることのできる“新しい確率変数”「標本平均」の誕生です。 |
|
|