●変異係数(変動係数) Coefficient of Variation CV 範囲、分散や標準偏差は、絶対的散布度を示している。 それに対して、変異係数は相対的散布度を示している。 絶対的散布度は、平均値の大幅な違いやデータの単位の事なりによって、大きく影響を受ける事になる。 そこで、次の様な場合は、相対的散布度である変異係数を求めて、集団間のバラツキの程度を比較する事になる。 @複数の集団間で、その平均値が大幅に異なる場合 A複数の集団間で、その単位が異なる場合 ☆変異係数の求め方 標準偏差 変異係数CV = -------------------- × 100 (変動係数) 平均値 変異係数は、単位の無い無名数である。 例 成人女子と10歳女子の体重データが次表の通り与えられている。 どちらがバラツキの程度は大きいか、判定しなさい。 表:成人女子と10歳女子の体重比較表 ------------------------------------- 平均値 標準偏差 ------------------------------------- 成人女子 51.1 5.0 ------------------------------------- 10歳女子 26.5 3.7 ------------------------------------- 計算 ---------------------------- 変異係数 ---------------------------- 成人女子 9.785 ← =5.0÷51.1×100 ---------------------------- 10歳女子 13.962 ← =3.7÷26.5×100 ---------------------------- 結論 標準偏差では成人女子の方が10歳女子に比較して大きいが、平均値が大幅に異なるので変異係数を求めて比較 すると 成人女子のCV=9.785<13.962=10歳女子のCV であるので、10歳女子の体重の方が、成人女子よりもバラツキの程度が大きいと判定できる。 ●分布の形 歪度 ・・・・・・・・・・・・・・・・・・ 分布の偏りを示す指標 g1 n Σ(xi−m)3 -------------------- × ------------------- (n−1)×(n−2) s 尖度 ・・・・・・・・・・・・・・・・・・ 分布の鋭さを示す指標 α4 Σ(xi−m)4 -------------------- n × s4 歪度 g1>0の場合 ・・・・・ 左偏向分布 g1=0の場合 ・・・・・ 正規分布 g1<0の場合 ・・・・・ 右偏向分布 尖度 α4>3の場合 ・・・・・ 鋭鋒 α4=3の場合 ・・・・・ 正規分布 α4<3の場合 ・・・・・ 鈍峰 ●基本統計値のまとめ 例 -------------------------------------------------------------------------- データ 基本統計値 計算結果 関数式 --------- -------------------------------------------------------------------------- 1 55.6 標本数 10 =count( ) 2 49 代表値 平均値 56.1 =average( ) 3 51 中央値 56.3 =median( ) 4 60 流行値 度数分布表の作成が必要 5 58 散布度 絶対的 範囲 15 =max( )-min( ) 6 49.5 分散 25.847 =var( ) 7 57 標準偏差 5.84 =stdev( ) or sqrt(var( )) 8 55 相対的 変異係数 9.069 =stdev( )/average( )*100 9 54 ---------------------------------------------------------------------------- 10 61.5 ----------- シグマ検定法による外れ値(飛び離れた値)のチェック 40.8 〜 71.3 average( )-3*stdev( ) average( )+3*stdev( ) 詳細は下図を参照