2つの事象間に関係があるのかどうか(「相関」があるか)を知る方法。相関があるとき、2つの事象間の関係を表す式を見出すことを回帰分析という。
2つの変量(X軸、Y軸)をプロットした図を散布図という。(左図)視覚的にも図1は図2に比べて相関が強いことが読み取れる。
関連: 標準偏差、正規分布、共分散
x、yに直線的な関係があるとき、その相関の度合いを表す係数を「相関係数」といい次の式で表される。またMicrosoft Exelでは関数CORRELで計算できる。
sxy=xとyの共分散、sx=xの標準偏差、sy=yの標準偏差得られた相関係数が有意(相関が見られる)であるかどうかの検定(test)を行う。検定には右の検定表を使い、0.05より大きい時に「有意」、0.01より大きい時に「高度に有意」と表現する。自由度=標本数-1
図1は標本数14、相関係数rは0.95>0.641(0.01)であり「高度に有意」、図2は標本数14、相関係数は0.42<0.514(0.05)であり「無相関」(相関が見られない、ということができる。
関連: t分布、カイ2乗分布(カイ2乗検定)、適合度
2つの変量の関係を表す直線を回帰直線といい、y=ax+b で表す。
切片b=yの平均-a
視覚的には図上の各点から直線に下ろした直線の長さの和が最小になるような直線と言うことができる。(最小自乗法)また曲線で回帰する方法もある。Microsoft Exel では散布図から線形近似(1次式)、対数近似、多項式近似、累乗近似、指数近似、移動平均が求められる。
[例1]
ある事象間に相関が見られるかどうかを調べることは建築分野においても有用である。ここではa)病床数と延べ床面積、b)病床数と分娩件数 の各々の間に関係があるのか(相関があるのか)調べる。(500床以上、大学病院、がんセンターを除く地域中核的な病院を対象。
a)の散布図は図1、b)は図2である。1.3)から1)は高度に有意、2)は無相関となった。つまり、病床数と延床面積の間には強い相関が見られるが、病床数と分娩件数の間には相関がないと見ることができる。
これは、病院の規模は1床当り病床数(=延床面瀬/病床数)が一つの目安とされていること、また分娩・周産期に関しては周囲の状況や病院の取り組み方によって部門規模が異なることを考えれば、理解しうる結果である。
a)について回帰直線を導けば、y=0.0104x+149.07 である。x=50000㎡を代入すれば669床(1床当り74.7㎡)という数値を知ることができる。