《か け 離 れ た デ ー タ の 棄 却 に つ い て》
標本の中に特に理由が分らないが、他のデータと比較してかけ離れて大きい値や小さい値が存在した場合に、この飛び離れた値 によって基本統計値が影響を受ける場合がある。そこでこの値を除去すべきかどうかを決める必要が有る。それには以下のよう な方法がある。 ●スミルノフの棄却検定法 大きさNの標本で、xNが最大の(もしくは最小の)問題となった値だとすると、その異常と思われる値xNも含めて、平均 値m、分散Vを求めて次式で計算した値TNが、スミルノフノ棄却検定図の線より上にある場合は、xNを棄却する。 (xN−m)2 TN2=------------------ V なお、スミルノフ棄却検定図は、関連の成書を参照 ●シグマ検定法 正規分布において、標本は平均値mを中心にして±3×標準偏差内に全体のデータの99.7%が含まれていることから、採用 できる標本を次式の範囲とする。 m−3×Std 〜 m+3×Std m :平均値 Std :標準偏差 ●棄却限界法 N個からなる標本群の平均値をm、分散をVとする。 自由度n1=1、n2=N−1に対するF分布表のαの値を読み取り、F(α、1、N−1)とすると、危険率αの棄却限界は次式の 関係式で求められる。 N+1 下限値=m−√(V)×√(-------)×F(α、1、N−1)) N N+1 上限値=m+√(V)×√(-------)×F(α、1、N−1)) N