二項分布を用いる二項検定

00000000 ホームごあいさつ授業形式講師紹介時間&料金アクセス御予約&お問い合わせ 00000000


【反復試行の確率】


小学校で「場合の数」を学び、中学校で「確率」を学びます。

高校では、より複雑な確率について学ぶのですが、その1つに「反復試行の確率」というものがあります。



1枚のコインを3回投げるとき、表が1回出る確率は?・・・と問われたらどうしましょう。

表が1回ということは、裏が2回です。

表の出る確率は 1/2 であり、裏の出る確率も 1/2 なので、

(1/2)×(1/2)×(1/2)= 1/8 と答えたいところですが、これでは不完全です。

1回出るという表が3回のうち何回目に出るのか、が考慮されていません。

3回のうち1回というのは「組合せ」で学ぶように「3C1」で表され、計算すると「3」です。

この「3」を掛け合わせて「3/8」とするのが、正しい答えです。・・・詳しくは授業にて♪



【二項分布を用いる二項検定】


この「反復試行の確率」を使って、先の食味試験の例について考えてみましょう!

2種類のサンプルAとBの間に好みの差がなければ、どちらを選ぶかは五分五分です。

パネラーが20人なら、そのうちAを選ぶ人数の可能性として0〜20人までの21通りがあります。

r人がAを選ぶとすると、その確率 Pr は



で表されます。

r = 0, 20 のとき、P0 = P20 = 9.53674×10-7

r = 1, 19 のとき、P1 = P19 = 1.90735×10-5

r = 2, 18 のとき、P2 = P18 = 0.000181198、

r = 3, 17 のとき、P3 = P17 = 0.001087189、

r = 4, 16 のとき、P4 = P16 = 0.004620552、

r = 5, 15 のとき、P5 = P15 = 0.014785767、

r = 6, 14 のとき、P6 = P14 = 0.036964417、

r = 7, 13 のとき、P7 = P13 = 0.073928933、

r = 8, 12 のとき、P8 = P12 = 0.120134354、

r = 9, 11 のとき、P9 = P11 = 0.160179138、

r = 10 のとき、P10 = 0.176197052。



r = 10 のときの確率が最も高くなります。

パネラーが20人なので、その半数である10人がAを選ぶ可能性が最も高い、

と考えることの妥当性を支持しています。

しかし、r = 9 や 11、また、r = 8 や 12 である確率も、ある程度高いです。

AとBに差がなくても、偶然9:11や8:12に分かれる可能性も否定できないのです。



それでは r = 0 や r = 1 の確率が0でないことをもって、

偶然にも0:20や1:19に分かれる可能性を受け入れても良いでしょうか?

r = 0 の確率は P0 = 9.53674×10-7 であり、100万分の1に満たないのです。

もし0:20に分かれてしまったのなら、それはAとBに差があったと考える方が妥当ではないでしょうか?

AとBに差がないとした場合、どこまでを妥当な結果とするのか、その線引きをするのが統計学の考え方です。



この計算結果から、r≦5または15≦rとなる確率は 1 - 0.958610536 = 0.041389464 です。

これは、AとBに差がない場合、5:15以上に偏る確率は5%未満であることを示しています。

この“5%未満”を稀なケース、つまり、AとBに差がなければ、とうてい起こり得ないケースと考え、

5:15以上の偏りになった場合は、AとBに差があったと考えることにします。



以上の考察から、14:6の分かれ方では「差がある」と判断するには時期尚早であることが分かります。

「AとBに差がある。」と判断できるのは、15:5以上の偏りになった場合です。


00000000 ホームごあいさつ授業形式講師紹介時間&料金アクセス御予約&お問い合わせ 00000000