アンケート

00000000 ホームごあいさつ授業形式講師紹介時間&料金アクセス御予約&お問い合わせ 00000000


【二項検定】

ある会社の研究会開発部で2種類の商品AとBを試作しました。

どちらが良いかを判断するために、20人のモニターにアンケート調査を行いました。

AとBのどちらにも優劣がなければ、支持者が半分半分に分かれることでしょう。

アンケート調査の結果は、Aの支持者14人、Bの支持者6人でした。

この結果をもって商品Aの採用!・・・と踏み切っても良いのでしょうか?・・・ダメです。

「え〜っ、7割の人が支持しているのに?」「はい、ダメです。」・・・なぜなのでしょうか?

「二項検定」について学びましょう!

確率変数・・・コイントスで表か裏かを迷うのは、確率分布が一様だからなのかも。

期待値と分散・・・それぞれ、確率分布の“位置”と“形状”を示す指標です。

二項分布・・・7割が支持しても、まだ、それを採用できない・・・えっ、マジで!



【Z検定】


上の例では、サンプルサイズが「20」でした。

実際には、調査対象となる規模が、もっと大きくなることがしばしばですし、

実験結果の分析においても、サンプルサイズが何百や何千になることがあります。



二項検定に用いる確率分布「二項分布」は、

サンプルサイズが大きくなると、計算できなくなる可能性が出てきます。

標準的なパソコン用の表計算ソフト「エクセル」では、

サンプルサイズが1000を超えたあたりで、エラー表示になり、計算の限界を迎えます。



大きなサンプルサイズに対処するには、どうしたら良いでしょうか?

二項分布の近似である「正規分布」を用いれば良いです。

1733年、フランスの数学者アブラーム・ド・モアブル(1667−1754)が、

二項分布の極限として、正規分布を導入しました。

正規分布を学ぶのに併せて、「広義積分」も学んでおくと良いです。



正規分布を用いると、サンプルサイズが大きくなっても大丈夫なのですが、

平均や標準偏差の値が異なる度に、確率密度関数のグラフが変化してしまうのが難点です。

その都度、計算し直さないといけませんからね。

これを回避するために、変数変換をします。

元データの確率変数を「X」としたとき、「このXから平均を引いて、標準偏差で割る」ことをします。

このようにして変換(標準化)された新たな変数は、しばしば「Z」で表されます。

「Z検定」の「Z」の由来です。



【t検定】


二項検定」でサンプル数が大きいときの対処法として考えた「Z検定」ですが、Z検定にも限界があります。

変数xから変数zに変換するとき、母平均と母分散の情報が必要なのですが、

これらについて正確な情報が得られないときは、どうしようもありません。



具体的な場面を考えると、工場で作られている製品の検品などがそうです。

欠陥品の割合が基準値を超えていないかどうかチェックするとき、

生産ラインからランダムに抽出することで、値xは得られます。

しかし、母分散の情報が得られないので、zに変数変換することができません。

母分散の情報を得るには、製品全部をチェックしなければなりませんが、

そんなことをしていては、出荷する製品がなくなってしまいます。



このような場合、母分散の推定量を、標本分散から求めるしかないのですが、

この時点で、もはや、標準正規分布に従う確率変数Zとは、異なるものになってしまっています。

したがって、「Z検定」は使えません。

教科書などで「t検定」として紹介されている内容に進むことになります。

χ(カイ)2乗分布・・・「t分布」にむけての準備です。

F分布・・・いよいよ「t分布」にたどり着きました!。



                                        「塾での授業」に戻る


00000000 ホームごあいさつ授業形式講師紹介時間&料金アクセス御予約&お問い合わせ 00000000