|
Wir betrachten wieder die lineare Regression einer Variablen Y auf eine Variable X. Für den umgekehrten Fall gelten analoge Überlegungen. Wir präzisieren die erste Zielsetzung aus den Vorbemerkungen in folgender Weise: Die
Gesamtvarianz Betrachten wir zur weiteren Diskussion dieses Ansatzes Abbildung 1. In dieser Abbildung sind zunächst links die Verteilung der y-Werte (Kurve fy) und rechts die Regressionsgerade Gy/x dargestellt. Außerdem sind als Beispiele die Werte x1 bis x3 gekennzeichnet. Die für diese x-Werte geschätzten Wie lässt sich nun für die erste Komponente die Varianz der geschätzten
Abbildung 1: Zur Erläuterung der Varianz auf der Regressionsgeraden
Betrachten wir nun die zweite Komponente. Bei der Prognose der yi-Werte werden Fehler begangen. Diese Fehler spiegeln sich (s.
Abbildung 1) in den Verteilungen fy/xi. Betrachten wir beispielsweise fy/x1 in
Abbildung 1, die die Verteilung aller zu x1 gehörenden y-Werte wiedergibt. Zu allen diesen Werten wird bei der
Regression der eine festhalten. Für die gesamte Stichprobe mit dem Umfang N erhalten wir: ( c ) wird nun in der Form von ( 2 ) als Varianz für die zweite Komponente definiert.
( 2 ) gibt die Streuung der wirklichen Messwerte yi um die
Regressionsgerade wieder. Deswegen wird In einer zwar algebraisch einfachen, dennoch aber sehr langwierigen Umformung lässt sich nun zeigen, dass sich systematische Varianz und Fehlervarianz zur Gesamtvarianz aufaddieren, dass also ( 3 ) gilt.
Drücken wir die wichtige Beziehung ( 3) noch einmal in Worten aus: Bei der Regression von Y auf X setzt sich die Gesamtvarianz von Y additiv aus der Varianz auf der Regressionsgeraden und der Varianz um die Regressionsgerade zusammen. Der durch ( 3 ) erfasste Sachverhalt ist in Abbildung 2 noch einmal graphisch in Form eines Varianzdiagramms dargestellt.
Abbildung 2: Varianzdiagramm für den additiven Zusammenhang
( 3 ) wird im nachfolgenden Abschnitt zur abschließenden Diskussion der Beziehungen zwischen Korrelation, Regression und Varianz dienen. |