《重 回 帰 分 析》
●重回帰分析 重回帰分析は、「因果関係を分析するための統計処理」だと考えられている。 因果関係とは、原因と結果の間の関係を指します。 原因Aが、結果Bに及ぼすと云う事を、次の様に表現するならば A --------------⇒ B 重回帰分析は、幾つかの原因が一つの結果に影響を与えると云う事から、その関係は下図 b1 原因その1 X1 -------------→ b2 原因その2 X2 -------------→ : 結果 Y : : bp 原因そのp Xp ------------→ の通りとなります。 この図をパス図という。 さらに、それぞれの原因が結果に与える影響の大きさをb1、b2、・・・・、bpと係数(回帰係数)で表現され ます。 Y = b1X1+b2X2+・・・・+bpXp + b x1、x2、・・・・、xp : 実測値 Y : 予測値 b1、b2、・・・・、bp : 偏回帰係数 b : 定数項(偏回帰定数) 上式を「重回帰式」と云います。 (なお、標準化されたデータを用いると、定数項は0となります。) また、実測値yと予測値Yの差y−Yを「残差」または「誤差」と云います。 重回帰分析では、 目的変量(=従属変数)、説明変量(独立変数)と云う統計用語を用います。 つまり 目的変量 ・・・・ 結果を表す変量Y (変数) (変数) 説明変量 ・・・・ 原因を表す変量x1、x2、・・・・、xp (変数) (変数) また、重回帰式から求めた予測値Yが、実測値yとどの程度一致しているかどうかを調べるための実測値と予測値 の相関係数を重相関係数Rという。 重相関係数Rの平方R2を決定係数という。 決定係数R2は、1に近い程、データとの当てはまりが良いと云う事になる。 予測値の変動 決定係数R2 = -------------------- 実測値の変動 例1 Yを予測する変数として、x1、x2、x3が与えられている。このデータからx1、x2、x3を説明変数、Yを目的変数 とする重回帰式っを求め、重回帰分析を重相関係数から調べなさい。 表 ------------------------------------------------------------- a@ Y x1 x2 x3 ------------------------------------------------------------- 1 308.9 15.7 30 5.2 2 310.8 16.8 33.1 5 3 303.3 17.5 32.2 4.6 4 307.7 20 33 4.3 5 320.7 18 38.6 6 6 329.4 19.5 38.7 5.8 7 321 19.2 37.7 5.1 8 321.6 16.8 38.9 5.2 9 321.6 19.9 30.8 4.8 10 321 19.2 37.7 5.1 11 414.3 17 30.4 5.5 12 313.3 19.6 33.3 4.4 13 318.7 17 38 5.8 14 324.9 15.3 39.9 6.1 15 308.5 16.6 43.2 4.6 --------------------------------------------------------- 平均値 322.4467 17.84667 35.54667 5.173333 my mx1 mx2 mx3 ---------------------------------------------------------- 解 重回帰分析の手順 @目的変量及び各説明変量の平均値を求める。 A分析ツールを用いて、分散・共分散行列を求める。 「ツール」−「分析ツール」−「共分散」 分散・共分散行列 ----------------------------------------------- y x1 x2 x3 ----------------------------------------------- y x1 x2 x3 ----------------------------------------------- B行(x1〜x3)と列(x1〜x3)の行列の逆行列を求める。 逆行列関数(=minvarse( )を利用 逆行列 0.532246 0.010685 0.555692 0.010685 0.076419 -0.18405 0.555692 -0.18405 4.320427 C3行1列(y、x1〜x3)の行列とBで求めた逆行列の積を求める。 エクセルの関数(=mmult( )を利用 D偏回帰係数から、重回帰式の定数項を説明変量の各平均値を代入して求める。 b1=0.7993718 b2=-2.80807 b3=23.95633 b=my−0.799718×mx1−(−2.80801)×mx2−23.95633×mx3 =284.062 重回帰式 y = 0.799 x1 + (−2.808)x2 + 23.956 x3 + 284.062 E重回帰式を用いて、各説明変量を代入して、目的変量の予測値Yを算出する。 F目的変量の実測値yとEで求めた予測値との相関係数(=重相関係数R)をエクセルの関数を使って求める。 =correl(配列1、配列2) R=0.530566 G重相関係数Rを平方して、決定係数R2を求める。 R2=0.2815 ☆分析ツールを利用 「ツール」−「分析ツール」−「回帰分析」 概要 予測値Y ===================================== ============-- 回帰統計 336.9448 ------------------------------------- 324.328 重相関R 0.530566 317.8322 重決定R2 0.2815 310.3973 補正 R2 0.085546 333.7995 標準誤差 25.28989 329.9265 観測数 15 324.2596 ----------------------------------- 312.8328 328.4732 分散分析表 315.7252 ============================================================================ 344.0476 自由度 変動 分散 観察された分散比 有意F 311.6308 ---------------------------------------------------------------------------- 329.8937 回帰 3 2756.376 918.7919 1.436559 0.284903 330.3864 残差 11 7035.362 639.5783 286.2247 合計 14 9 791.737 --------- --------------------------------------------------------------------------- - Eによる -============================================================================================= 係数 標準誤差 t P-値 下限95% 上限95% ---------------------------------------------------------------------------------------------- 切片 284.062 135.592 2.094976 0.060121 -14.3742 582.4981 x1 0.799372 4.763842 0.1678 0.869786 -9.68578 11.28452 x2 -2.80801 1.805098 -1.5556 0.148087 -6.78101 1.164983 x3 23.9533 13.57265 1.765045 0.105264 -5.91685 53.82954 ----------------------------------------------------------------------------------------------
詳細は下図を参照 ![]()