2010年9月17日金曜日

正規分布(1)

標準偏差はデータのばらつき具合を見る一つの尺度になる。

その分布をイメージ的に”見える化”するのが正規分布である。

平均値を中心に左右対称に山型の分布を見せるのが正規分布である。

正規分布を学ぶ前に覚えなければならないのが、μ(ミュー)とσ(シグマ)。

μは平均値の記号で、σは標準偏差の記号である。

正規分布は、μを中心に左右にσの倍数ごとの区間に分布が決まっている。

正規分布していれば、μ±σの場合は全データの68%がその範囲に納まる。

μ±2σの範囲には95%。 μ=3σの範囲に99.7%が納まる。

平均と標準偏差がわかれば、状態がわかるようになる。

学校の成績を表すのに偏差値を使うが、点数から、どの範囲を知って、何番から何番の範囲にいるかを知ることが出来るようになる。

続く

2010年9月16日木曜日

最小2乗法 回帰計算

前日、回帰計算をする為の数値が求まったので、予測を立ててみる。

温度    長さの測定値

10℃    1003㎜
15℃    1005㎜
20℃    1010㎜
25℃    1011㎜
30℃    1014㎜

回帰係数は、0.5599

定数項は997.4

回帰式はy=A+Bxだから

y=997.4+0.5599x

例えば、18℃の時の長さは、1007.1㎜

逆に1000㎜の時の温度は、4.64℃

2010年9月15日水曜日

最小ニ乗法とは (5) 回帰係数の求め方(2)

前日のおさらい

回帰曲線の傾き=相関係数×((yの標準偏差)/(xの標準偏差)

温度    長さの測定値

10℃    1003㎜
15℃    1005㎜
20℃    1010㎜
25℃    1011㎜
30℃    1014㎜

標準偏差は7.071  4.029

相関係数は0.9828

回帰係数は、0.5599

定数項(切片)は、

y切片=yの平均ー(傾き×xの平均)

定数項は997.4となる。

続く

2010年9月14日火曜日

最小ニ乗法とは (5) 回帰係数の求め方(1)

相関係数がわかったので、最小2乗法を使って回帰係数を求める。

回帰直線は一次式だから、傾きと定数項(切片)がわかればよい。

もともと、xとyのデータに直線を引くのだから、誤差を調整する必要がある。

そのために最小2乗法を使う。

傾きは、

相関係数×((yの標準偏差)/(xの標準偏差))

で求まる。

切片は、yの平均ー(傾き×xの平均)

で求まる。

全て、相関係数を求める為に算出した数値を使うので、簡単に計算できる。

続く

2010年9月13日月曜日

最小2乗法 相関係数の求め方(3)

下表の標準偏差は、

温度    長さの測定値


10℃    1003㎜
15℃    1005㎜
20℃    1010㎜
25℃    1011㎜
30℃    1014㎜

標準偏差は7.071  4.029
EXCELの関数では、=stdevpを使う。
 
次に偏差積を求める。偏差積は平均から各々のデータを引いた偏差の積。
温度の平均は20、長さの平均は、1008.6.
 
温度の偏差、長さの偏差、偏差積は、
10    5.6      56
5     3.6      18
0     -1.4      0
-5    -2.4    12
-10   -5.4    54
 
求まった偏差積の平均を求め、標準偏差の積で割ると相関係数が求まる。
 
偏差積の平均は、28. 標準偏差の積は28.489
 
偏差積を割ると0.9828となる。 これが相関係数になる。
 
数値的には正の強い相関があると思われる。
 
相関係数が求まったので、回帰直線式を求める。
 
続く

2010年9月11日土曜日

最小ニ乗法とは (4) 相関係数の求め方(2)

平均を求めるのは楽だが、標準偏差を求めるのがわからない。

そこで、勉強してみた。求め方は以下の通り。

まず、平均を求める。次に偏差を求める。

偏差とは、平均からの隔たりである。式的にはxー平均である。平均のことをxの上にバーを付けた形で書く。

偏差が求まったら、各々の偏差の2乗の和を求める。そして、それの平均を求める。

最後にその平均をルートする。

標準偏差とは、偏差を標準化するということだろう。(自己流の解釈)

温度    長さの測定値


10℃    1003㎜
15℃    1005㎜
20℃    1010㎜
25℃    1011㎜
30℃    1014㎜
 
こちらの標準偏差は7.071  4.029

2010年9月10日金曜日

最小ニ乗法とは (4) 相関係数の求め方

相関係数を求めるためには、まず、xとyのデータが要ることが前提。

計算機の取り説に書いてあった例:

棒鋼の温度と長さ

温度    長さの測定値
10℃    1003㎜
15℃    1005㎜
20℃    1010㎜
25℃    1011㎜
30℃    1014㎜

相関係数を求める為には5つの値が必要になる。

xとyの平均
xとyの標準偏差
xとyの偏差(xとyの平均からの差)
偏差積(xとyの偏差の積)
偏差積の平均

そして最後に偏差積の平均をxとyの標準偏差の積で割ると求まる。