2 標本の代表性

 

 

: 「この調査は標本の代表性が高いので信頼できる」などといった言葉を耳にしますが、どういうことを意味しているか説明してください。

 

: 標本(サンプル)の代表性(sample representativeness)とは、母集団から抽出される標本が元の母集団の特性の縮図になっているかどうかの程度を表わす言葉です。縮図になっている程度が高ければ標本の代表性は高いといえます。

 この標本の代表性の高低は、「標本抽出法」(sampling method)、「標本誤差」(sampling error)、「非標本誤差」(non-sampling error)の3要素に左右されます。

「標本抽出法」に関しては、確率(無作為・ランダム)サンプリングのときは、一般に、非確率サンプリングのときよりデータの偏りが少ないため、標本の代表性は高いといえます。

「標本誤差」は統計の領域に関連しており、標本統計量(標本平均や標本比率)の期待値は母集団値(母平均や母比率)に等しいから、サンプルサイズの増加によって標本誤差は少なくなり、従って標本の代表性は高まります。

「非標本誤差」は、調査の領域に関連しており、カバレッジ誤差(coverage error:対象母集団に対して枠母集団がカバーできない部分)、測定誤差(measurement error:インタビュアバイアス、協力バイアス、社会的受容回答など)、無回答誤差(non-response error:主に調査拒否や不在による無回答)、集計誤差(data processing error:データの入力ミス、ウエイト修正のミスなど)などが主なもので、このような誤差が少ないほど標本の代表性は高いといえます。

これらを集約しますと、母集団に対する標本の代表性の高い調査を行うには、出来る限り確率サンプリングで標本を抽出し、予算・日程の許す限りサンプルサイズを多く設定したうえで、非標本誤差の少ない調査手法を選択し、調査の計画から結果の報告までの全調査プロセスにおいて作業ミスを極力抑えることが肝要であると言えるでしょう。