アンケート
|
|
【二項検定】 ある会社の研究会開発部で2種類の商品AとBを試作しました。 どちらが良いかを判断するために、20人のモニターにアンケート調査を行いました。 AとBのどちらにも優劣がなければ、支持者が半分半分に分かれることでしょう。 アンケート調査の結果は、Aの支持者14人、Bの支持者6人でした。 この結果をもって商品Aの採用!・・・と踏み切っても良いのでしょうか?・・・ダメです。 「え〜っ、7割の人が支持しているのに?」「はい、ダメです。」・・・なぜなのでしょうか? 「二項検定」について学びましょう! ●確率変数・・・コイントスで表か裏かを迷うのは、確率分布が一様だからなのかも。 ●期待値と分散・・・それぞれ、確率分布の“位置”と“形状”を示す指標です。 ●二項分布・・・7割が支持しても、まだ、それを採用できない・・・えっ、マジで! 【Z検定】 上の例では、サンプルサイズが「20」でした。 実際には、調査対象となる規模が、もっと大きくなることがしばしばですし、 実験結果の分析においても、サンプルサイズが何百や何千になることがあります。 二項検定に用いる確率分布「二項分布」は、 サンプルサイズが大きくなると、計算できなくなる可能性が出てきます。 標準的なパソコン用の表計算ソフト「エクセル」では、 サンプルサイズが1000を超えたあたりで、エラー表示になり、計算の限界を迎えます。 大きなサンプルサイズに対処するには、どうしたら良いでしょうか? 二項分布の近似である「正規分布」を用いれば良いです。 1733年、フランスの数学者アブラーム・ド・モアブル(1667−1754)が、 二項分布の極限として、正規分布を導入しました。 正規分布を学ぶのに併せて、「広義積分」も学んでおくと良いです。 正規分布を用いると、サンプルサイズが大きくなっても大丈夫なのですが、 平均や標準偏差の値が異なる度に、確率密度関数のグラフが変化してしまうのが難点です。 その都度、計算し直さないといけませんからね。 これを回避するために、変数変換をします。 元データの確率変数を「X」としたとき、「このXから平均を引いて、標準偏差で割る」ことをします。 このようにして変換(標準化)された新たな変数は、しばしば「Z」で表されます。 「Z検定」の「Z」の由来です。 【t検定】 「二項検定」でサンプル数が大きいときの対処法として考えた「Z検定」ですが、Z検定にも限界があります。 変数xから変数zに変換するとき、母平均と母分散の情報が必要なのですが、 これらについて正確な情報が得られないときは、どうしようもありません。 具体的な場面を考えると、工場で作られている製品の検品などがそうです。 欠陥品の割合が基準値を超えていないかどうかチェックするとき、 生産ラインからランダムに抽出することで、値xは得られます。 しかし、母分散の情報が得られないので、zに変数変換することができません。 母分散の情報を得るには、製品全部をチェックしなければなりませんが、 そんなことをしていては、出荷する製品がなくなってしまいます。 このような場合、母分散の推定量を、標本分散から求めるしかないのですが、 この時点で、もはや、標準正規分布に従う確率変数Zとは、異なるものになってしまっています。 したがって、「Z検定」は使えません。 教科書などで「t検定」として紹介されている内容に進むことになります。 ●χ(カイ)2乗分布・・・「t分布」にむけての準備です。 ●F分布・・・いよいよ「t分布」にたどり着きました!。 「塾での授業」に戻る |
|
|