標準偏差はデータのばらつき具合を見る一つの尺度になる。
その分布をイメージ的に”見える化”するのが正規分布である。
平均値を中心に左右対称に山型の分布を見せるのが正規分布である。
正規分布を学ぶ前に覚えなければならないのが、μ(ミュー)とσ(シグマ)。
μは平均値の記号で、σは標準偏差の記号である。
正規分布は、μを中心に左右にσの倍数ごとの区間に分布が決まっている。
正規分布していれば、μ±σの場合は全データの68%がその範囲に納まる。
μ±2σの範囲には95%。 μ=3σの範囲に99.7%が納まる。
平均と標準偏差がわかれば、状態がわかるようになる。
学校の成績を表すのに偏差値を使うが、点数から、どの範囲を知って、何番から何番の範囲にいるかを知ることが出来るようになる。
続く
2010年9月17日金曜日
2010年9月16日木曜日
最小2乗法 回帰計算
前日、回帰計算をする為の数値が求まったので、予測を立ててみる。
温度 長さの測定値
10℃ 1003㎜
15℃ 1005㎜
20℃ 1010㎜
25℃ 1011㎜
30℃ 1014㎜
回帰係数は、0.5599
定数項は997.4
回帰式はy=A+Bxだから
y=997.4+0.5599x
例えば、18℃の時の長さは、1007.1㎜
逆に1000㎜の時の温度は、4.64℃
温度 長さの測定値
10℃ 1003㎜
15℃ 1005㎜
20℃ 1010㎜
25℃ 1011㎜
30℃ 1014㎜
回帰係数は、0.5599
定数項は997.4
回帰式はy=A+Bxだから
y=997.4+0.5599x
例えば、18℃の時の長さは、1007.1㎜
逆に1000㎜の時の温度は、4.64℃
2010年9月15日水曜日
最小ニ乗法とは (5) 回帰係数の求め方(2)
前日のおさらい
回帰曲線の傾き=相関係数×((yの標準偏差)/(xの標準偏差)
温度 長さの測定値
10℃ 1003㎜
15℃ 1005㎜
20℃ 1010㎜
25℃ 1011㎜
30℃ 1014㎜
標準偏差は7.071 4.029
相関係数は0.9828
回帰係数は、0.5599
定数項(切片)は、
y切片=yの平均ー(傾き×xの平均)
定数項は997.4となる。
続く
回帰曲線の傾き=相関係数×((yの標準偏差)/(xの標準偏差)
温度 長さの測定値
10℃ 1003㎜
15℃ 1005㎜
20℃ 1010㎜
25℃ 1011㎜
30℃ 1014㎜
標準偏差は7.071 4.029
相関係数は0.9828
回帰係数は、0.5599
定数項(切片)は、
y切片=yの平均ー(傾き×xの平均)
定数項は997.4となる。
続く
2010年9月14日火曜日
最小ニ乗法とは (5) 回帰係数の求め方(1)
相関係数がわかったので、最小2乗法を使って回帰係数を求める。
回帰直線は一次式だから、傾きと定数項(切片)がわかればよい。
もともと、xとyのデータに直線を引くのだから、誤差を調整する必要がある。
そのために最小2乗法を使う。
傾きは、
相関係数×((yの標準偏差)/(xの標準偏差))
で求まる。
切片は、yの平均ー(傾き×xの平均)
で求まる。
全て、相関係数を求める為に算出した数値を使うので、簡単に計算できる。
続く
回帰直線は一次式だから、傾きと定数項(切片)がわかればよい。
もともと、xとyのデータに直線を引くのだから、誤差を調整する必要がある。
そのために最小2乗法を使う。
傾きは、
相関係数×((yの標準偏差)/(xの標準偏差))
で求まる。
切片は、yの平均ー(傾き×xの平均)
で求まる。
全て、相関係数を求める為に算出した数値を使うので、簡単に計算できる。
続く
2010年9月13日月曜日
最小2乗法 相関係数の求め方(3)
下表の標準偏差は、
温度 長さの測定値
10℃ 1003㎜
15℃ 1005㎜
20℃ 1010㎜
25℃ 1011㎜
30℃ 1014㎜
標準偏差は7.071 4.029
EXCELの関数では、=stdevpを使う。
次に偏差積を求める。偏差積は平均から各々のデータを引いた偏差の積。
温度の平均は20、長さの平均は、1008.6.
温度の偏差、長さの偏差、偏差積は、
10 5.6 56
5 3.6 18
0 -1.4 0
-5 -2.4 12
-10 -5.4 54
求まった偏差積の平均を求め、標準偏差の積で割ると相関係数が求まる。
偏差積の平均は、28. 標準偏差の積は28.489
偏差積を割ると0.9828となる。 これが相関係数になる。
数値的には正の強い相関があると思われる。
相関係数が求まったので、回帰直線式を求める。
続く
温度 長さの測定値
10℃ 1003㎜
15℃ 1005㎜
20℃ 1010㎜
25℃ 1011㎜
30℃ 1014㎜
標準偏差は7.071 4.029
EXCELの関数では、=stdevpを使う。
次に偏差積を求める。偏差積は平均から各々のデータを引いた偏差の積。
温度の平均は20、長さの平均は、1008.6.
温度の偏差、長さの偏差、偏差積は、
10 5.6 56
5 3.6 18
0 -1.4 0
-5 -2.4 12
-10 -5.4 54
求まった偏差積の平均を求め、標準偏差の積で割ると相関係数が求まる。
偏差積の平均は、28. 標準偏差の積は28.489
偏差積を割ると0.9828となる。 これが相関係数になる。
数値的には正の強い相関があると思われる。
相関係数が求まったので、回帰直線式を求める。
続く
2010年9月11日土曜日
最小ニ乗法とは (4) 相関係数の求め方(2)
平均を求めるのは楽だが、標準偏差を求めるのがわからない。
そこで、勉強してみた。求め方は以下の通り。
まず、平均を求める。次に偏差を求める。
偏差とは、平均からの隔たりである。式的にはxー平均である。平均のことをxの上にバーを付けた形で書く。
偏差が求まったら、各々の偏差の2乗の和を求める。そして、それの平均を求める。
最後にその平均をルートする。
標準偏差とは、偏差を標準化するということだろう。(自己流の解釈)
温度 長さの測定値
10℃ 1003㎜
15℃ 1005㎜
20℃ 1010㎜
25℃ 1011㎜
30℃ 1014㎜
こちらの標準偏差は7.071 4.029
そこで、勉強してみた。求め方は以下の通り。
まず、平均を求める。次に偏差を求める。
偏差とは、平均からの隔たりである。式的にはxー平均である。平均のことをxの上にバーを付けた形で書く。
偏差が求まったら、各々の偏差の2乗の和を求める。そして、それの平均を求める。
最後にその平均をルートする。
標準偏差とは、偏差を標準化するということだろう。(自己流の解釈)
温度 長さの測定値
10℃ 1003㎜
15℃ 1005㎜
20℃ 1010㎜
25℃ 1011㎜
30℃ 1014㎜
こちらの標準偏差は7.071 4.029
2010年9月10日金曜日
最小ニ乗法とは (4) 相関係数の求め方
相関係数を求めるためには、まず、xとyのデータが要ることが前提。
計算機の取り説に書いてあった例:
棒鋼の温度と長さ
温度 長さの測定値
10℃ 1003㎜
15℃ 1005㎜
20℃ 1010㎜
25℃ 1011㎜
30℃ 1014㎜
相関係数を求める為には5つの値が必要になる。
xとyの平均
xとyの標準偏差
xとyの偏差(xとyの平均からの差)
偏差積(xとyの偏差の積)
偏差積の平均
そして最後に偏差積の平均をxとyの標準偏差の積で割ると求まる。
計算機の取り説に書いてあった例:
棒鋼の温度と長さ
温度 長さの測定値
10℃ 1003㎜
15℃ 1005㎜
20℃ 1010㎜
25℃ 1011㎜
30℃ 1014㎜
相関係数を求める為には5つの値が必要になる。
xとyの平均
xとyの標準偏差
xとyの偏差(xとyの平均からの差)
偏差積(xとyの偏差の積)
偏差積の平均
そして最後に偏差積の平均をxとyの標準偏差の積で割ると求まる。
2010年9月9日木曜日
最小ニ乗法とは (3) 相関係数
相関係数とはなんぞや?という疑問が出てきた。
回帰直線はy=A+Bx という一次関数で表されるということはわかった。
この式は、予測を立てることが出来る便利な式であることもわかった。予測を立てるためには相関係数と回帰係数がわからなければならないということもわかってきた。
ところで、一次式のBは回帰係数だから、相関係数とは何ぞやということになった。
そこで調べた結果、判ってきたのは以下の通り。
散布図を作り、xに対するyの値が関係があるかどうかを見る。プロットされた点が銀河系のようになって、右肩上がりなら、「正の相関」、右肩下がりなら「負の相関」という。
これを数字で表すとー1≦0≦1となる。これを相関係数という。
例えば計算の結果、相関係数が0.8ならば強い正の相関、0,2ならば弱い正の相関を表す。
つまり、相関係数は、ある式の係数ではなく、xとyの相関関係を表しているということになる。
実務ベースではどうか。
温度と棒鋼の関係で考えると、温度が上がれば棒鋼が伸びるのでは?と考えてデータを取り、散布図にしてみる。相関係数を計算して1に近かければ、かなり関係がある。0に近かければ、関係が無いと判断できる。
回帰係数が相関関係にあるものの予測値を導き出すものとすれば、相関係数は、回帰係数の前段で関係を探るものと言える。
相関係数を求める為には平均や標準偏差を使う。
平均は一般的に言う全体の平均である。全体を個数で割れば求まる。標準偏差は平均からどれくらいかけ離れているのか、つまりばらつきを見るための数字である。
続く・・・
回帰直線はy=A+Bx という一次関数で表されるということはわかった。
この式は、予測を立てることが出来る便利な式であることもわかった。予測を立てるためには相関係数と回帰係数がわからなければならないということもわかってきた。
ところで、一次式のBは回帰係数だから、相関係数とは何ぞやということになった。
そこで調べた結果、判ってきたのは以下の通り。
散布図を作り、xに対するyの値が関係があるかどうかを見る。プロットされた点が銀河系のようになって、右肩上がりなら、「正の相関」、右肩下がりなら「負の相関」という。
これを数字で表すとー1≦0≦1となる。これを相関係数という。
例えば計算の結果、相関係数が0.8ならば強い正の相関、0,2ならば弱い正の相関を表す。
つまり、相関係数は、ある式の係数ではなく、xとyの相関関係を表しているということになる。
実務ベースではどうか。
温度と棒鋼の関係で考えると、温度が上がれば棒鋼が伸びるのでは?と考えてデータを取り、散布図にしてみる。相関係数を計算して1に近かければ、かなり関係がある。0に近かければ、関係が無いと判断できる。
回帰係数が相関関係にあるものの予測値を導き出すものとすれば、相関係数は、回帰係数の前段で関係を探るものと言える。
相関係数を求める為には平均や標準偏差を使う。
平均は一般的に言う全体の平均である。全体を個数で割れば求まる。標準偏差は平均からどれくらいかけ離れているのか、つまりばらつきを見るための数字である。
続く・・・
2010年9月8日水曜日
最小ニ乗法とは (2)
xとyの2つの事柄の関係を見るのには散布図が有効だが、プロットされた座標を見て、
何らかの相関関係があると思った時、それを式で表したいと考える。
最も簡単な関数は、一次式である。即ち直線。
一次式はy=A+Bxで表すことが出来る。
これを回帰直線という。
この式が求められれば、あるxに対して関係するyを計算で求めることが出来る。
例えば、温度と棒鋼の伸び。
Aは定数項
Bは回帰係数
実際は、散布図から予測値を求める為には相関係数も求める必要がある。
相関係数はー1≦0≦1の間を取る。
続く・・・
何らかの相関関係があると思った時、それを式で表したいと考える。
最も簡単な関数は、一次式である。即ち直線。
一次式はy=A+Bxで表すことが出来る。
これを回帰直線という。
この式が求められれば、あるxに対して関係するyを計算で求めることが出来る。
例えば、温度と棒鋼の伸び。
Aは定数項
Bは回帰係数
実際は、散布図から予測値を求める為には相関係数も求める必要がある。
相関係数はー1≦0≦1の間を取る。
続く・・・
2010年9月7日火曜日
最小ニ乗法とは
考え方
QCで散布図というのがあって、2つの事柄の関係を求める時に使われる。
一見、2つのの関係の無い事柄のデータをxとy軸に分けて、それが比例するか否かを見るためのもの。
右肩上がりの正比例ならば関係がある。
散布する点が、拡散状態ならば、相関が無いと言える。
相関係数は、-1<0<1の間を取る。相関係数によって、グラフの状態が決定する。
散布図を見て、相関がありそうだったら、乱暴にも、線を引いて、数学的に関係を導き出し、予測を立てるというのが、回帰という考え方である。
そこでは、回帰係数というものを使う。
散布図の点在する点に線を引くというのは、かなり乱暴な話だが、そもそも、データ自体が誤差を持っている。
そこで、データの誤差を補正するのが最小ニ乗法である。
以上のように理解したが、相関係数と回帰係数の違いが良くわかっていない。
続く・・。
QCで散布図というのがあって、2つの事柄の関係を求める時に使われる。
一見、2つのの関係の無い事柄のデータをxとy軸に分けて、それが比例するか否かを見るためのもの。
右肩上がりの正比例ならば関係がある。
散布する点が、拡散状態ならば、相関が無いと言える。
相関係数は、-1<0<1の間を取る。相関係数によって、グラフの状態が決定する。
散布図を見て、相関がありそうだったら、乱暴にも、線を引いて、数学的に関係を導き出し、予測を立てるというのが、回帰という考え方である。
そこでは、回帰係数というものを使う。
散布図の点在する点に線を引くというのは、かなり乱暴な話だが、そもそも、データ自体が誤差を持っている。
そこで、データの誤差を補正するのが最小ニ乗法である。
以上のように理解したが、相関係数と回帰係数の違いが良くわかっていない。
続く・・。
2010年9月6日月曜日
品質検定を受検したけど・・・
品質検定を先日受検した。
QC手法、QCストーリー、品質用語的なものはそれなりに出来たけど、
標準偏差、正規分布など品質特性を計算で求める問題が難しかった。
ほとんど計算できなかった。
ロット単位で機械加工する作業には役に立つと思うけど、一個流し的
というか多種多様生産では、実務上、どうやって使えばいいのかわか
らないということもある。
でも、このスキルを身につけておくと、とっても役立つだろうし、興味を
そそられたので、勉強して行こうと思う。
なかなか日常的に勉強しない。今回、ザーッと問題集を1ヵ月かけて
読んだくらい。牛歩調の勉強だった。全然気合が入っていない。
ということで、棄権しようかと思った。
でも、前日、テレビで「ナイト・ミュージーアム」を観て、その中のセリフ
「生まれつき偉大な人間もいる。しかし、殆どは強いられて偉大になっ
て行く」が頭に残っていて、人間って強いないと成長しないって思い起
こした。
一番勉強したのは、試験前、1時間、車の中で暗記したことだけど、
受検してよかったと思う。
ということで、このブログを勉強机にして、やっていこうと思う。
QC手法、QCストーリー、品質用語的なものはそれなりに出来たけど、
標準偏差、正規分布など品質特性を計算で求める問題が難しかった。
ほとんど計算できなかった。
ロット単位で機械加工する作業には役に立つと思うけど、一個流し的
というか多種多様生産では、実務上、どうやって使えばいいのかわか
らないということもある。
でも、このスキルを身につけておくと、とっても役立つだろうし、興味を
そそられたので、勉強して行こうと思う。
なかなか日常的に勉強しない。今回、ザーッと問題集を1ヵ月かけて
読んだくらい。牛歩調の勉強だった。全然気合が入っていない。
ということで、棄権しようかと思った。
でも、前日、テレビで「ナイト・ミュージーアム」を観て、その中のセリフ
「生まれつき偉大な人間もいる。しかし、殆どは強いられて偉大になっ
て行く」が頭に残っていて、人間って強いないと成長しないって思い起
こした。
一番勉強したのは、試験前、1時間、車の中で暗記したことだけど、
受検してよかったと思う。
ということで、このブログを勉強机にして、やっていこうと思う。
登録:
投稿 (Atom)