回帰モデルの係数の分散分析と二元配置分散分析の違い
回帰モデルの係数の分散分析は、二元配置分散分析と計算方法が似ているので、分散分析の知識が役に立ちます。ですが、この 2 つは目的や仮定が違っています。注意が必要です。
目的 | 説明変数 | 説明変数間、因子間の関係 | 差の検定 | |
---|---|---|---|---|
回帰モデルの係数の分散分析 | 回帰モデルの精度、有意性を見る | 連続値 | 相関、非線形性を考慮 | 係数がゼロと異なるかを t 検定 |
二元配置分散分析 | 因子が値に与える影響を見る | カテゴリー | 交互作用を考慮 | 因子水準間の平均値を F 検定 |
二元配置分散分析
カテゴリー変数の因子が値に与える影響を見るために、各因子水準間の平均値に差を F 検定で評価する。
平方和 | 自由度 | 平均平方 | F 値 | p 値 | |
---|---|---|---|---|---|
因子 A | $SS_A = nb \sum{i = 1}^a (\bar{y}{i..} − \bar{y})2$ | $a-1$ | $MS_A = SS_A/(a-1)$ | $F_A = MS_A/MS_E$ | $p_A$ |
因子 B | $SS_B = na \sum{j = 1}^b (\bar{y}{.j.} − \bar{y})2$ | $b-1$ | $MS_B = SS_B/(b-1)$ | $F_B = MS_B/MS_E$ | $p_B$ |
交互作用 | $SS{AB} = n \sum{i = 1}^a \sum{j = 1}^b (\bar{y}{ij.} − \bar{y}{i..} − \bar{y}{.j.} + \bar{y})2$ | $(a-1)(b-1)$ | $MS{AB} = SS{AB}/*1$ | $F{AB} = MS{AB}/MS_E$ | $p_{AB}$ |
誤差 | $SS_E = \sum{i = 1}^a \sum{j = 1}^b \sum{k = 1}^n ( y{ijk} − \bar{y}_{ij.})2$ | $ab(n-1)$ | $MS_E = SS_E/(ab(n-1))$ | - | - |
総計 | $SS_T = SS_A + SS_B + SS{AB} + SS_E = \sum{i = 1}^a \sum{j = 1}^b \sum{k = 1}^n ( y_{i j k} − \bar{y})2$ | $abn-1$ | - | - | - |
- $\bar{y}_{i..}$ :因子 A の水準 i の平均値
- $\bar{y}_{.j.}$ :因子 B の水準 j の平均値
- $\bar{y}_{ij.}$ :因子 A の水準 i と因子 B の水準 j の平均値
- $\bar{y}$ :全体の平均値
- $y_{ijk}$ :因子 A の水準 i、因子 B の水準 j、および実験単位 k の値
- $a$ :因子 A の水準数
- $b$ :因子 B の水準数
- $n$ :各因子水準の組み合わせに対する実験単位の数
回帰モデルの係数の分散分析
回帰モデルの各説明変数が目的変数に与える影響、回帰モデルの精度や有意性を見るために、係数がゼロと異なるかどうかを t 検定で評価する。
変数 | 平方和 | 自由度 | 平均平方 | F 値 | p 値 |
---|---|---|---|---|---|
説明変数 R1 | $SS{R1} = \sum{i = 1}^n (\hat{y}_1 − \bar{y})2$ | $ 1 $ | $MS{R1} = SS{R1}/1$ | $F_1 = MS_{R1}/MS_E$ | $p_1$ |
説明変数 R2 | $SS{R2} = \sum{i = 1}^n (\hat{y}2 − \hat{y}1)2$ | $ 1 $ | $MS{R2} = SS{R2}/1$ | $F_2 = MS_{R2}/MS_E$ | $p_2$ |
誤差 | $SS_E = \sum{i = 1}^n (y_i − \hat{y}2)2$ | $n-2$ | $MS_E = SS_E/(n-2)$ | - | - |
総計 | $SS_T = SS{R1} + SS{R2} + SS_E = \sum_{i = 1}^n (y_i − \bar{y})2$ | $n-1$ | - | - | - |
ここで、
- $\hat{y}_1$ :説明変数 R1 のみを使った回帰モデルで予測された値
- $\hat{y}_2$ :説明変数 R1 と R2 を使った回帰モデルで予測された値
- $\bar{y}$ :目的変数の平均値
- $y_i$ :目的変数の実測値
*1:a-1)(b-1