二項分布を用いる二項検定
|
|
【反復試行の確率】 小学校で「場合の数」を学び、中学校で「確率」を学びます。 高校では、より複雑な確率について学ぶのですが、その1つに「反復試行の確率」というものがあります。 1枚のコインを3回投げるとき、表が1回出る確率は?・・・と問われたらどうしましょう。 表が1回ということは、裏が2回です。 表の出る確率は 1/2 であり、裏の出る確率も 1/2 なので、 (1/2)×(1/2)×(1/2)= 1/8 と答えたいところですが、これでは不完全です。 1回出るという表が3回のうち何回目に出るのか、が考慮されていません。 3回のうち1回というのは「組合せ」で学ぶように「3C1」で表され、計算すると「3」です。 この「3」を掛け合わせて「3/8」とするのが、正しい答えです。・・・詳しくは授業にて♪ 【二項分布を用いる二項検定】 この「反復試行の確率」を使って、先の食味試験の例について考えてみましょう! 2種類のサンプルAとBの間に好みの差がなければ、どちらを選ぶかは五分五分です。 パネラーが20人なら、そのうちAを選ぶ人数の可能性として0〜20人までの21通りがあります。 r人がAを選ぶとすると、その確率 Pr は ![]() で表されます。 r = 0, 20 のとき、P0 = P20 = 9.53674×10-7、 r = 1, 19 のとき、P1 = P19 = 1.90735×10-5、 r = 2, 18 のとき、P2 = P18 = 0.000181198、 r = 3, 17 のとき、P3 = P17 = 0.001087189、 r = 4, 16 のとき、P4 = P16 = 0.004620552、 r = 5, 15 のとき、P5 = P15 = 0.014785767、 r = 6, 14 のとき、P6 = P14 = 0.036964417、 r = 7, 13 のとき、P7 = P13 = 0.073928933、 r = 8, 12 のとき、P8 = P12 = 0.120134354、 r = 9, 11 のとき、P9 = P11 = 0.160179138、 r = 10 のとき、P10 = 0.176197052。 r = 10 のときの確率が最も高くなります。 パネラーが20人なので、その半数である10人がAを選ぶ可能性が最も高い、 と考えることの妥当性を支持しています。 しかし、r = 9 や 11、また、r = 8 や 12 である確率も、ある程度高いです。 AとBに差がなくても、偶然9:11や8:12に分かれる可能性も否定できないのです。 それでは r = 0 や r = 1 の確率が0でないことをもって、 偶然にも0:20や1:19に分かれる可能性を受け入れても良いでしょうか? r = 0 の確率は P0 = 9.53674×10-7 であり、100万分の1に満たないのです。 もし0:20に分かれてしまったのなら、それはAとBに差があったと考える方が妥当ではないでしょうか? AとBに差がないとした場合、どこまでを妥当な結果とするのか、その線引きをするのが統計学の考え方です。 ![]() この計算結果から、r≦5または15≦rとなる確率は 1 - 0.958610536 = 0.041389464 です。 これは、AとBに差がない場合、5:15以上に偏る確率は5%未満であることを示しています。 この“5%未満”を稀なケース、つまり、AとBに差がなければ、とうてい起こり得ないケースと考え、 5:15以上の偏りになった場合は、AとBに差があったと考えることにします。 以上の考察から、14:6の分かれ方では「差がある」と判断するには時期尚早であることが分かります。 「AとBに差がある。」と判断できるのは、15:5以上の偏りになった場合です。 |
|
|