1 サンプルサイズの決め方

 

 

: 定量調査を計画するとき、特定の手法を選択したあとは、サンプルサイズを決めなければなりません。そこで、いくらくらいのサンプルサイズがあれば統計的に充分なのかを教えてください。

 

: 標本調査において、統計的観点から必要なサンプルサイズ(n)を決めるには、標本比率の信頼区間を求める式、すなわち、P〜p±z√p(1−p)/nから誤差部をEとおいて、E=z√p(1−p)/nからnについて解くのが最も効率的です。nについて求める式は、n=(z/Ep(1−p)となります。ここで、pは出現比率(予想出現率)(0≦p≦1)、zは信頼度係数で95%信頼度のときz=1.96、99%信頼度のときz=2.58の値をとります。

 例えば、出現比率pを、どのような比率が現れても対応できるように、“安全を見込んで”、Eが最大となる、すなわちp(1−p)が最大となるp=0.5とおき、信頼度95%、すなわちz=1.96とおけば、誤差Eの値を決めさえすれば、信頼度95%のときの必要サンプルサイズ(n)が求められます。

 いま、仮に、誤差をE=0.03(出現比率p=0.5の6%に相当)と決めると、必要サンプルサイズは、n=1,068となります。このときの95%信頼度での信頼区間は、0.5±0.03=0.47〜0.53となります。つまり、調査で得られる比率0.5(50%)の母集団での真の値(母比率)は、0.47(47%)〜0.53(53%)の間にあることが95%の信頼度(確からしさ)で言い得ることとなります。もう少し信頼区間を狭くしたり、信頼度を99%などに高めたい場合は、必要サンプルサイズをさらに増やす必要があります。

 ちなみに、サンプルサイズを上記のn=1,068(p=0.5、z=1.96、E=0.03)としたとき、2つの独立サンプルの比率の差のz検定の検定統計量(T)に従うと、2つの比率の差が0.042、切り上げて0.05の差があれば有意な差と認められます。

従って、もし、上記の0.05よりもっと小さい差で有意差をつけたいのであれば、サンプルサイズをさらに多くする必要があります。p=0.5、z=1.96としたときの、主な誤差Eに対する必要サンプルサイズ、そのときの信頼区間および最小有意差値は、下表のとおりとなりますので参考にしてください。

 

 誤差E   サンプルサイズn     信頼区間     最小有意差値

 0.10        97   0.40〜0.60   0.15

 0.07       196   0.43〜0.57   0.10

 0.05       385   0.45〜0.55   0.08

 0.03      1068   0.47〜0.53   0.05

 0.01      9604   0.49〜0.51   0.02

 

 ちなみに、出現比率pが事前に0.5より小さい(または大きい)と想定される場合は、必要サンプルサイズは少なくて済みます。なお、上記の必要サンプルサイズ(n)は、回収ベースのものなので、割当レベルのサンプルサイズは、回収率を見込んで設定しておかねばなりません。

結局、サンプルサイズは、いくら確保すれば統計的に充分だと一義的に決められるものではありません。サンプルサイズの大きさは、誤差をどれくらいに抑えたいか、換言すれば、信頼区間をいくらくらいに設定したいか、最小有意差値をいくらにしたいかなど、調査データに対する意思決定上の判断に依存します。

しかし、有意性検定の検定方法を選択する立場からすると、比較的検定作業が楽なz検定が使える目安となる100サンプルがマーケティングリサーチを行う上での最低ラインとなるでしょう。従って、例えば、調査対象者の年令を4水準に均等に分けて各年代についてもz検定を行おうとする場合には、合計400サンプルが必要になるというわけです。

 なお、サンプルサイズ(sample sizeまたはsize of sample)のことを、サンプル数と呼ぶ方もおられますが、これは、正しい言い方ではありませんのでご注意ください。また、よく似た言葉として標本の数(number of sample:サンプルの数)という用語がありますが、これは、あるサンプルサイズの調査を何本実施したかの件数を表わしています。