《基 本 統 計 学 17》
●相関と回帰について ○相関関係について 2つの集団の関連性っを調べる。 いま、各集団からデータを採取したとき、一方の値が増加すればそれに伴って、もう一方の集団の値が増加も しくは減少するような場合、この2つの集団間には「相関関係がある」という。 相関関係 説明変数(独立変数)1個 目的変数(従属変数)1個 回帰直線 説明変数をX軸、目的変数をY軸にとったときの散布図上の分布を代表する直線の方程式 Y = aX + b をいう。 相関関係があるかないかを示す場合、「相関係数」rと云う統計指標を用いる。 その相関係数は、以下の様に評価される。 表 : 相関係数rとその評価 ------------------------------------------------ 相関係数の大きさ 評価 ------------------------------------------------ 0 〜 ±0.2 相関関係なし ±0.2 〜 ±0.4 弱い相関関係あり ±0.4 〜 ±0.7 中程度の相関関係あり ±0.7 〜 ±1 強い相関関係あり ------------------------------------------------ 相関係数rは、必ず以下の範囲の値をとる。 −1 ≦ r ≦ +1 ・負の相関(逆相関) ・正相関(順相関) ・分布は右下り傾向 ・分布は左上り傾向 ・増加すれば減少 ・増加すれば増加 ○回帰(直線)について 相関係数が強い場合、分布の範囲はシャープな分布を示し、この分布を1本の直線で代表させることが出来る。 この直線のことを、「回帰直線」という。 Y = aX + b a : 回帰係数 b : 回帰定数 ☆相関係数rの求め方 2つの測定値を次のようにとる X集団 : x1、x2、・・・・・、xn 説明変数(独立変数) Y集団 : y1、y2、・・・・・、yn 目的変数(従属変数) 計算手順 @ 2つの測定値の平均値を求める mx、my A 2つの測定値の標準偏差を求める Stdx、Stdy B 2つの測定値の各偏差を求める x1−mx、x2−mx、・・・・、xn−mx y1−my、y2−my、・・・・、yn−mx C 各偏差の積の総和を求める (x1−mx)(y1−my)+(x2−mx)(y2−my)+・・・・+(xn−mx)(yn−my) D Cで求めた偏差平方和を標本数−1(=n−1、自由度df)で割る この値を、「共分散」Vxyという E Dで求めた共分散を2つの標準偏差の積で割り、相関係数rを求める Vxy r = ----------------------------------- Stdx × Stdy エクセルの統計関数を利用する場合 =correl(Yのデータ範囲、Xのデータ範囲) ☆回帰直線の求め方 Yの標準偏差Stdy a(回帰係数) = 相関係数r × ------------------------ Xの標準偏差Stdx b(回帰定数) = Yの平均値my − 回帰係数a × Xの平均値mx エクセルの統計関数を利用する場合 a(回帰係数)=slope(Yのデータ範囲、Xのデータ範囲) b(回帰定数)=intercept(Yのデータ範囲、Xのデータ範囲) 詳細は下図を参照