日々のつれづれ

不惑をむかえ戸惑いを隠せない男性の独り言

回帰モデルの係数の分散分析と二元配置分散分析の違い

回帰モデルの係数の分散分析は、二元配置分散分析と計算方法が似ているので、分散分析の知識が役に立ちます。ですが、この 2 つは目的や仮定が違っています。注意が必要です。

目的 説明変数 説明変数間、因子間の関係 差の検定
回帰モデルの係数の分散分析 回帰モデルの精度、有意性を見る 連続値 相関、非線形性を考慮 係数がゼロと異なるかを t 検定
二元配置分散分析 因子が値に与える影響を見る カテゴリー 交互作用を考慮 因子水準間の平均値を F 検定

二元配置分散分析

カテゴリー変数の因子が値に与える影響を見るために、各因子水準間の平均値に差を F 検定で評価する。

平方和 自由度 平均平方 F 値 p 値
因子 A $SS_A = nb \sum{i = 1}^a (\bar{y}{i..} − \bar{y})2$ $a-1$ $MS_A = SS_A/(a-1)$ $F_A = MS_A/MS_E$ $p_A$
因子 B $SS_B = na \sum{j = 1}^b (\bar{y}{.j.} − \bar{y})2$ $b-1$ $MS_B = SS_B/(b-1)$ $F_B = MS_B/MS_E$ $p_B$
交互作用 $SS{AB} = n \sum{i = 1}^a \sum{j = 1}^b (\bar{y}{ij.} − \bar{y}{i..} − \bar{y}{.j.} + \bar{y})2$ $(a-1)(b-1)$ $MS{AB} = SS{AB}/*1$ $F{AB} = MS{AB}/MS_E$ $p_{AB}$
誤差 $SS_E = \sum{i = 1}^a \sum{j = 1}^b \sum{k = 1}^n ( y{ijk} − \bar{y}_{ij.})2$ $ab(n-1)$ $MS_E = SS_E/(ab(n-1))$ - -
総計 $SS_T = SS_A + SS_B + SS{AB} + SS_E = \sum{i = 1}^a \sum{j = 1}^b \sum{k = 1}^n ( y_{i j k} − \bar{y})2$ $abn-1$ - - -
  • $\bar{y}_{i..}$ :因子 A の水準 i の平均値
  • $\bar{y}_{.j.}$ :因子 B の水準 j の平均値
  • $\bar{y}_{ij.}$ :因子 A の水準 i と因子 B の水準 j の平均値
  • $\bar{y}$ :全体の平均値
  • $y_{ijk}$ :因子 A の水準 i、因子 B の水準 j、および実験単位 k の値
  • $a$ :因子 A の水準数
  • $b$ :因子 B の水準数
  • $n$ :各因子水準の組み合わせに対する実験単位の数

回帰モデルの係数の分散分析

回帰モデルの各説明変数が目的変数に与える影響、回帰モデルの精度や有意性を見るために、係数がゼロと異なるかどうかを t 検定で評価する。

変数 平方和 自由度 平均平方 F 値 p 値
説明変数 R1 $SS{R1} = \sum{i = 1}^n (\hat{y}_1 − \bar{y})2$ $ 1 $ $MS{R1} = SS{R1}/1$ $F_1 = MS_{R1}/MS_E$ $p_1$
説明変数 R2 $SS{R2} = \sum{i = 1}^n (\hat{y}2 − \hat{y}1)2$ $ 1 $ $MS{R2} = SS{R2}/1$ $F_2 = MS_{R2}/MS_E$ $p_2$
誤差 $SS_E = \sum{i = 1}^n (y_i − \hat{y}2)2$ $n-2$ $MS_E = SS_E/(n-2)$ - -
総計 $SS_T = SS{R1} + SS{R2} + SS_E = \sum_{i = 1}^n (y_i − \bar{y})2$ $n-1$ - - -

ここで、

  • $\hat{y}_1$ :説明変数 R1 のみを使った回帰モデルで予測された値
  • $\hat{y}_2$ :説明変数 R1 と R2 を使った回帰モデルで予測された値
  • $\bar{y}$ :目的変数の平均値
  • $y_i$ :目的変数の実測値

*1:a-1)(b-1