科学する数学塾

アンケート

00000000

｜ホーム｜ごあいさつ｜授業形式｜講師紹介｜時間＆料金｜アクセス｜御予約＆お問い合わせ｜

00000000

【二項検定】

ある会社の研究会開発部で２種類の商品ＡとＢを試作しました。

どちらが良いかを判断するために、２０人のモニターにアンケート調査を行いました。

ＡとＢのどちらにも優劣がなければ、支持者が半分半分に分かれることでしょう。

アンケート調査の結果は、Ａの支持者１４人、Ｂの支持者６人でした。

この結果をもって商品Ａの採用！・・・と踏み切っても良いのでしょうか？・・・ダメです。

「え～っ、７割の人が支持しているのに？」「はい、ダメです。」・・・なぜなのでしょうか？

「二項検定」について学びましょう！

●確率変数・・・コイントスで表か裏かを迷うのは、確率分布が一様だからなのかも。

●期待値と分散・・・それぞれ、確率分布の“位置”と“形状”を示す指標です。

●二項分布・・・７割が支持しても、まだ、それを採用できない・・・えっ、マジで！

【Ｚ検定】

上の例では、サンプルサイズが「２０」でした。

実際には、調査対象となる規模が、もっと大きくなることがしばしばですし、

実験結果の分析においても、サンプルサイズが何百や何千になることがあります。

二項検定に用いる確率分布「二項分布」は、

サンプルサイズが大きくなると、計算できなくなる可能性が出てきます。

標準的なパソコン用の表計算ソフト「エクセル」では、

サンプルサイズが１０００を超えたあたりで、エラー表示になり、計算の限界を迎えます。

大きなサンプルサイズに対処するには、どうしたら良いでしょうか？

二項分布の近似である「正規分布」を用いれば良いです。

１７３３年、フランスの数学者アブラーム・ド・モアブル（１６６７－１７５４）が、

二項分布の極限として、正規分布を導入しました。

正規分布を学ぶのに併せて、「広義積分」も学んでおくと良いです。

正規分布を用いると、サンプルサイズが大きくなっても大丈夫なのですが、

平均や標準偏差の値が異なる度に、確率密度関数のグラフが変化してしまうのが難点です。

その都度、計算し直さないといけませんからね。

これを回避するために、変数変換をします。

元データの確率変数を「Ｘ」としたとき、「このＸから平均を引いて、標準偏差で割る」ことをします。

このようにして変換（標準化）された新たな変数は、しばしば「Ｚ」で表されます。

「Ｚ検定」の「Ｚ」の由来です。

【ｔ検定】

「二項検定」でサンプル数が大きいときの対処法として考えた「Ｚ検定」ですが、Ｚ検定にも限界があります。

変数ｘから変数ｚに変換するとき、母平均と母分散の情報が必要なのですが、

これらについて正確な情報が得られないときは、どうしようもありません。

具体的な場面を考えると、工場で作られている製品の検品などがそうです。

欠陥品の割合が基準値を超えていないかどうかチェックするとき、

生産ラインからランダムに抽出することで、値ｘは得られます。

しかし、母分散の情報が得られないので、ｚに変数変換することができません。

母分散の情報を得るには、製品全部をチェックしなければなりませんが、

そんなことをしていては、出荷する製品がなくなってしまいます。

このような場合、母分散の推定量を、標本分散から求めるしかないのですが、

この時点で、もはや、標準正規分布に従う確率変数Ｚとは、異なるものになってしまっています。

したがって、「Ｚ検定」は使えません。

教科書などで「ｔ検定」として紹介されている内容に進むことになります。

●χ（カイ）２乗分布・・・「ｔ分布」にむけての準備です。

●Ｆ分布・・・いよいよ「ｔ分布」にたどり着きました！。

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　「塾での授業」に戻る

00000000

｜ホーム｜ごあいさつ｜授業形式｜講師紹介｜時間＆料金｜アクセス｜御予約＆お問い合わせ｜

00000000