相関係数とはなんぞや?という疑問が出てきた。
回帰直線はy=A+Bx という一次関数で表されるということはわかった。
この式は、予測を立てることが出来る便利な式であることもわかった。予測を立てるためには相関係数と回帰係数がわからなければならないということもわかってきた。
ところで、一次式のBは回帰係数だから、相関係数とは何ぞやということになった。
そこで調べた結果、判ってきたのは以下の通り。
散布図を作り、xに対するyの値が関係があるかどうかを見る。プロットされた点が銀河系のようになって、右肩上がりなら、「正の相関」、右肩下がりなら「負の相関」という。
これを数字で表すとー1≦0≦1となる。これを相関係数という。
例えば計算の結果、相関係数が0.8ならば強い正の相関、0,2ならば弱い正の相関を表す。
つまり、相関係数は、ある式の係数ではなく、xとyの相関関係を表しているということになる。
実務ベースではどうか。
温度と棒鋼の関係で考えると、温度が上がれば棒鋼が伸びるのでは?と考えてデータを取り、散布図にしてみる。相関係数を計算して1に近かければ、かなり関係がある。0に近かければ、関係が無いと判断できる。
回帰係数が相関関係にあるものの予測値を導き出すものとすれば、相関係数は、回帰係数の前段で関係を探るものと言える。
相関係数を求める為には平均や標準偏差を使う。
平均は一般的に言う全体の平均である。全体を個数で割れば求まる。標準偏差は平均からどれくらいかけ離れているのか、つまりばらつきを見るための数字である。
続く・・・
0 件のコメント:
コメントを投稿