《一元配置の分散分析について》
●分散分析法 一元配置の分散分析法 複数の学校間の比較や地区間など、3群、4群以上の平均値の同時比較をしたい場合がある。 分散分析では、3群以上の平均値に有意な差が有るかどうかを同時比較ができるパラメトリックな手法である。 その場合、一つだけの要因を考え、その状態をいろいろ変えて比較する方法を「一元配置の分散分析法」という。 表:データ ――――――――――――――――――――――――――――――――― 1 2 3 ・・ j ・・・ p 全体 --------------------------------------------------------------- 1 X11 X21 X31 Xp1 2 X12 X22 X32 Xp2 3 X13 X23 X33 Xp3 X34 i Xij ----------------------------------------------------------------- 繰り返し数 n1 n2 n3 ・・・・・・ np n ----------------------------------------------------------------- 平均値 m1 m2 m3 ・・・・・・ mp m ----------------------------------------------------------------- m1〜mp : 各グループの平均値 n : 全体のデータ数(個数) n1〜np : 各グループのデータ数 m : 全体の平均値 ○分析手順は次の通りです。 @各水準(群、グループ)の平均値を求める。 m1、m2、・・・・・ mp A全体の平均値mを求める。 m1×n1+m2×n2+・・・・+mp×np m = ---------------------------------------------- n B次式により級間変動T1を求める T1 = (m1−m)2×n1+(m2−m)2×n2+・・・・+(mp−m)2×np C次式より誤差変動TEを求める。 誤差変動TE = (各水準の測定値−各水準の平均値)2の総和 =(X11−m1)2+(X12−m1)2+・・・・+(X21−m2)2+(X22−m2)2+・・・ ・・+(X31−m3)2+・・・ 誤差変動TE = 全変動T−T1 ←---- 全変動T=級間変動T1+誤差変動TE なお、全変動Tは 全変動T = (X11−m)2+(X12−m)2+・・・・+(Xij−m)2+・・・・+(Xp1−m)2+・・・ D級間変動および誤差変動の不偏分散V1、VEを次式より求める。 T1 V1 = ---------------- (p−1) TE VE = --------------- (n−p) E検定統計量F1を次式より求める。 V1 F1 = ---------------- VE FF分布表から、有意水準α、自由度df(p−1、n−p)のF値を読取り、Eで求めた検定統計量F1と比較する。 F1≧F(α、p−1、n−p)の場合 有意水準αで有意差あり(対立仮説を採択する) F1<F(α、p−、n−p)の場合 有意水準αで有意差なし(帰無仮説を採択する) 表:分散分析表 ------------------------------------------------------------------ 変動要因 変動 自由度 不偏分散 分散比 F境界値 ------------------------------------------------------------------------- グループ間 級間変動T1 p−1 V1 V1/VE グループ内 誤差変動TE n−p VE (検定統計量) ------------------------------------------------------------------------- 全変動 T n−1 ------------------------------------------------------------------------- 全変動T = 級間変動T1 + 誤差変動TE 誤差変動TE = 全変動T − 級間変動T1 全変動T = Σ(各水準の測定値Xij − 全平均値m)2 例1 投与量を4水準に分けて4つグループで実験を行ったところ、次の様な結果を得た。 投与した量は、実験に影響を及ぼしていると云えるかどうか、有意水準5%で検定しなさい。 表:投与量の違いによる4グループの実験結果 --------------------------------------------------------------- a@ グループ1 グループ2 グループ3 グループ4 --------------------------------------------------------------- 1 33.2 33.8 39.5 38.5 2 33.4 36.7 34.8 39.4 3 30.7 38.2 29.4 38.1 4 32.7 36.4 38.6 40.8 5 28.9 33.1 40.3 33.3 6 28.9 33.1 40.3 33.3 7 32.6 37.3 37.1 36.7 8 31.8 34.6 37.7 34.6 9 35.5 28.7 33.1 37.2 10 32.3 33.5 37.9 39.1 -------------------------------------------------------------- 標本数 10 10 10 10 平均値 32.46 34.38 36.346 37.46 -------------------------------------------------------------- 解 計算 全平均値 = 35.19 35.19 ←----- =average(データ範囲)を利用 級間変動T1 = 148.748 ------------------------------------------------ 74.529 6.561 16.129 51.529 ------------------------------------------------- 誤差変動TE = 251.848 ------------------------------------------------- 0.5476 0.3364 9.2416 1.0816 0.8836 5.3824 2.7556 3.7636 3.0976 14.5924 49.8436 0.4096 0.1296 4.0804 4.5796 11.1556 12.6736 1.6984 14.7456 17.3056 2.6896 5.1984 0.0676 0.3136 0.0196 0.85264 0.4096 0.5776 0.4356 0.0484 1.5376 8.1796 9.2416 39.4384 11.2896 0.0676 0.0256 0.7744 2.0736 2.6896 -------------------------------------------------- 誤差変動TE 251.848 ------------------------ 級間変動T1の不偏分散V1 = 16560.73 誤差変動TEの不偏分散VE = 6.995778 検定統計量F1(=V1÷VE)= 7.08751 F分布表からの読取り = 2.866266 関数 =finv(α、自由度1、自由度2) 自由度1:水準数−1 自由度2:全標本数−水準数 結論 検定統計量F1=7.088>2.866=F(0.05、4−1、40−4)より、有意水準5%で有意な差があることがわかる。 従って、投与量の違いは、実験結果に影響を及ぼしていると統計的に認められる。 ☆分散分析:一元配置 (分析ツールの一元配置の分散分析を利用) 概要 ================================== グループ 標本数 合計 平均 分散 ---------------------------------------------------------------- グループ1 10 324.6 32.46 3.30489 グループ2 10 343.8 34.38 8.89067 グループ3 10 364.6 36.46 10.7271 グループ4 10 374.6 37.46 5.0644 ================================== 分散分析表 ========================================== 変動要因 変動 自由度 分散 観察された分散比 P‐値 F境界値 -------------------------------------------------------------------------------- 級間変動 148.748 3 49.5827 7.08751 0.00073 2.86627 誤差変動 251.848 36 6.99578 (全変動−級間変動) 全変動 400.596 39 ========================================== ↑ ↑ ↑ : 検定統計量F1 F分布表値 : =49.583÷6.996 =148.748÷3 =251.848÷36
詳細は下図を参照 ![]()