Bei meinem letzten Post ging es ja um den größten Irrtum der Regressionsrechnung (Linear nicht gleich linear). Heute kam beim Mittagessen mit dem Methoden-Team eine neue Diskussion in Bezug auf die Regression auf. Meine Kolleg/-innen meinten, dass der Standardfehler von standardisierten Regressionskoeffizienten bei einer einzigen Regression immer gleich ist (für verchiedene UVs). Begründung war, dass ja gilt:
\[V(\hat{b}) = \sigma^2/s^2_x\]
Also, dass die Varianz von \(b\) sich aus der Residualvarianz und der Varianz der UV ergibt. Die Residualvarianz bleibt für alle UVs gleich und die Varianz der UV ist nach Standardisierung 1. So weit so logisch, aber die Formel gilt eben nur für unstandardisierte Regressionskoeffizienten. Jedes Verfahren ist an Annahmen gekoppelt, \(b\) kann im Prinzip jeden Wert annehmen, aber nicht \(\beta\). Man könnte es auch mit der Korrelation vergleichen, die ja auch beschränkt ist. Da hängt das Konfidenzintervall von der Größe der Korrelation ab. Wenn die Korrelation 0.9 ist, gibt es nach rechts hin eben kaum Platz.
Wie dem auch sei, hier eine einfache Falsifikation der Behauptung:
|
mpg |
Predictors |
Estimates |
std. Error |
CI |
p |
(Intercept) |
0.00 |
0.07 |
-0.15 – 0.15 |
1.000 |
hp |
-0.23 |
0.14 |
-0.52 – 0.05 |
0.102 |
cyl |
-0.38 |
0.19 |
-0.78 – 0.02 |
0.059 |
disp |
0.24 |
0.24 |
-0.26 – 0.73 |
0.331 |
wt |
-0.63 |
0.16 |
-0.96 – -0.29 |
0.001 |
Observations |
32 |
R2 / R2 adjusted |
0.849 / 0.826 |
Wir sehen ganz klar, dass die Standardfehler der Koeffizienten unterschiedlich sind. Natürlich auch beim normalen Output:
Call:
lm(formula = mpg ~ hp + cyl + disp + wt, data = as.data.frame(scale(mtcars)))
Residuals:
Min 1Q Median 3Q Max
-0.67302 -0.24284 -0.07104 0.21328 0.96681
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 6.662e-17 7.369e-02 0.000 1.000000
hp -2.336e-01 1.382e-01 -1.691 0.102379
cyl -3.832e-01 1.944e-01 -1.972 0.058947 .
disp 2.385e-01 2.412e-01 0.989 0.331386
wt -6.257e-01 1.649e-01 -3.795 0.000759 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.4169 on 27 degrees of freedom
Multiple R-squared: 0.8486, Adjusted R-squared: 0.8262
F-statistic: 37.84 on 4 and 27 DF, p-value: 1.061e-10